tracking release

liangchunlan · Nov 8, 2021 · 8d7e118 · 8d7e118
1 parent 9d455fd
commit 8d7e118
Show file tree

Hide file tree

Showing 3 changed files with 259 additions and 10 deletions.
diff --git a/det3d/core/bbox/geometry.py b/det3d/core/bbox/geometry.py
@@ -156,3 +156,51 @@ def _points_in_convex_polygon_3d_jit(
                     ret[i, j] = False
                     break
     return ret
+
+@numba.jit
+def points_in_convex_polygon_jit(points, polygon, clockwise=True):
+    """check points is in 2d convex polygons. True when point in polygon
+    Args:
+        points: [num_points, 2] array.
+        polygon: [num_polygon, num_points_of_polygon, 2] array.
+        clockwise: bool. indicate polygon is clockwise.
+    Returns:
+        [num_points, num_polygon] bool array.
+    """
+    # first convert polygon to directed lines
+    num_points_of_polygon = polygon.shape[1]
+    num_points = points.shape[0]
+    num_polygons = polygon.shape[0]
+    if clockwise:
+        vec1 = (
+            polygon
+            - polygon[
+                :,
+                [num_points_of_polygon - 1] + list(range(num_points_of_polygon - 1)),
+                :,
+            ]
+        )
+    else:
+        vec1 = (
+            polygon[
+                :,
+                [num_points_of_polygon - 1] + list(range(num_points_of_polygon - 1)),
+                :,
+            ]
+            - polygon
+        )
+    # vec1: [num_polygon, num_points_of_polygon, 2]
+    ret = np.zeros((num_points, num_polygons), dtype=np.bool_)
+    success = True
+    cross = 0.0
+    for i in range(num_points):
+        for j in range(num_polygons):
+            success = True
+            for k in range(num_points_of_polygon):
+                cross = vec1[j, k, 1] * (polygon[j, k, 0] - points[i, 0])
+                cross -= vec1[j, k, 0] * (polygon[j, k, 1] - points[i, 1])
+                if cross >= 0:
+                    success = False
+                    break
+            ret[i, j] = success
+    return ret
diff --git a/det3d/models/bbox_heads/centerhead.py b/det3d/models/bbox_heads/centerhead.py
@@ -205,7 +205,7 @@ def predict(self, example, preds_dicts, test_cfg, **kwargs):
                 if double_flip:
                     meta_list = meta_list[:4*int(batch_size):4]
 
-            batch_hm = torch.sigmoid(preds_dict['hm'])
+            batch_hm = torch.sigmoid(preds_dict['hm'].clone())
 
             batch_dim = torch.exp(preds_dict['dim'])
 
@@ -322,11 +322,11 @@ def predict_tracking(self, example, preds_dicts, test_cfg, **kwargs):
                 dtype=preds_dicts[0]['hm'].dtype,
                 device=preds_dicts[0]['hm'].device)
 
-        prev_det = kwargs.get('prev_hm', None)
+        prev_track_id = kwargs.get('prev_track_id', None)
 
-        if prev_det is not None:
+        if prev_track_id is not None:
             track_rets = []
-            prev_track_id = kwargs['prev_track_id']
+            prev_hm = kwargs['prev_hm']
 
         for task_id, preds_dict in enumerate(preds_dicts):
             new_obj = [{}]
@@ -375,16 +375,15 @@ def predict_tracking(self, example, preds_dicts, test_cfg, **kwargs):
 
             metas.append(meta_list)
 
-            if prev_det is not None:
-                tracking_batch_hm =  (batch_hm + prev_det[task_id]) / 2.0  
-                assert prev_track_id is not None
-                tracking = self.post_processing_tracking(batch_box_preds.clone(), tracking_batch_hm.clone(), prev_track_id[task_id], test_cfg, post_center_range) 
+            if prev_track_id is not None:
+                tracking_batch_hm =  (batch_hm + prev_hm[task_id]) / 2.0  
+                tracking = self.post_processing_tracking(batch_box_preds, tracking_batch_hm, prev_track_id[task_id], test_cfg, post_center_range) 
 
                 for bit in range(len(tracking)):
                     cond = tracking[bit]['tracking_id'] == -1 # new obj
                     for tk in tracking[0].keys():
                         if tk != 'tracking_id':
-                            new_obj[bit][tk] = tracking[bit][tk][cond].clone()
+                            new_obj[bit][tk] = tracking[bit][tk][cond]
 
                 for bit in range(len(tracking)):
                     cond = tracking[bit]['tracking_id'] != -1
@@ -417,7 +416,7 @@ def predict_tracking(self, example, preds_dicts, test_cfg, **kwargs):
             ret['metadata'] = metas[0][i]
             ret_list.append(ret)
 
-        if prev_det is not None:
+        if prev_track_id is not None:
             track_rets_list = []
             num_tracks = len(track_rets[0])
             for i in range(num_tracks):

diff --git a/tools/val_nusc_tracking.py b/tools/val_nusc_tracking.py
@@ -0,0 +1,202 @@
+import argparse
+import copy
+import os
+import pickle 
+import numpy as np
+
+import torch
+from det3d.datasets import build_dataloader, build_dataset
+from det3d.models import build_detector
+from det3d.torchie import Config
+
+from det3d.torchie.trainer import load_checkpoint
+from det3d.torchie.trainer.trainer import example_to_device
+from det3d.torchie.trainer.utils import all_gather, synchronize
+from det3d.core.utils.center_utils import (draw_gaussian, gaussian_radius)
+from det3d.core.bbox.box_np_ops import center_to_corner_box2d
+from det3d.core.bbox.geometry import points_in_convex_polygon_jit
+
+from nuscenes.nuscenes import NuScenes
+
+
+def parse_args():
+    parser = argparse.ArgumentParser(description="Nuscenes Tracking")
+    parser.add_argument("config", help="train config file path")
+    parser.add_argument("--work_dir", help="the dir to save logs and models")
+    parser.add_argument(
+        "--checkpoint", help="the dir to checkpoint which the model read from"
+    )
+    parser.add_argument("--local_rank", type=int, default=0)
+    parser.add_argument("--eval_det", action='store_true')
+
+    args = parser.parse_args()
+    if "LOCAL_RANK" not in os.environ:
+        os.environ["LOCAL_RANK"] = str(args.local_rank)
+    return args
+
+def tracking():
+    args = parse_args()
+
+    cfg = Config.fromfile(args.config)
+    cfg.local_rank = args.local_rank
+    # update configs according to CLI args
+    if args.work_dir is not None:
+        cfg.work_dir = args.work_dir
+
+    global voxel_size, downsample, voxel_range, num_classes, size_h, size_w
+    voxel_size = np.array(cfg._voxel_size)[:2]
+    downsample= cfg.assigner.out_size_factor
+    voxel_range = np.array(cfg._pc_range)
+    num_classes = sum([t['num_class'] for t in cfg.tasks])
+    size_w, size_h = ((voxel_range[3:5] - voxel_range[:2]) / voxel_size  / downsample).astype(np.int32)
+
+    dataset = build_dataset(cfg.data.val)
+
+    model = build_detector(cfg.model, train_cfg=None, test_cfg=cfg.test_cfg)
+    _ = load_checkpoint(model, args.checkpoint, map_location="cpu")
+    data_loader = build_dataloader(dataset, batch_size=1, workers_per_gpu=24, dist=False,shuffle=False,)
+
+    model = model.cuda()
+    model.eval()
+
+    detections = {}
+    cpu_device = torch.device("cpu")
+
+    prev_detections = {}
+    nusc = NuScenes(version='v1.0-trainval', dataroot='./data/v1.0-trainval/', verbose=True)
+    grids = meshgrid(size_w, size_h)
+
+    start_id = 0
+    with torch.no_grad():
+        for _, data_batch in enumerate(data_loader):
+
+            device = torch.device(args.local_rank)
+            data_batch = example_to_device(data_batch, device, non_blocking=False)
+
+            prev_token = nusc.get('sample', data_batch['metadata'][0]['token'])['prev']
+            track_outputs = None
+            if  prev_token != '': # non-first frame
+                assert prev_token in prev_detections.keys()
+                box3d = prev_detections[prev_token]['box3d_global']
+                box3d = (data_batch['ref_from_car'][0].detach().numpy() @ data_batch['car_from_global'][0].detach().numpy()) @ box3d
+                box3d = box3d.T
+                prev_detections[prev_token]['box3d_lidar'] = np.concatenate((box3d[:, :3], 
+                                                            prev_detections[prev_token]['box3d_lidar'][:, 3:]), axis=1)
+
+                prev_hm_, prev_track_id_ = render_trackmap(prev_detections[prev_token],  grids, cfg)
+                prev_hm_ = prev_hm_.permute(0,2,3,1).view(1, size_h*size_w, num_classes).contiguous().to(device, non_blocking=False)
+                prev_track_id_ = prev_track_id_.permute(0,2,3,1).view(1, size_h*size_w, num_classes).contiguous().to(device, non_blocking=False)
+
+                prev_hm = []
+                prev_track_id = []
+                class_id = 0
+                for task in cfg.tasks:
+                    prev_hm.append(prev_hm_[..., class_id : class_id+task['num_class']])
+                    prev_track_id.append(prev_track_id_[..., class_id : class_id+task['num_class']])
+                    class_id += task['num_class']
+
+                preds = model(data_batch, return_loss=False, return_feature=True)
+                outputs, track_outputs = model.bbox_head.predict_tracking(data_batch, preds, model.test_cfg, prev_hm = prev_hm, prev_track_id=prev_track_id, new_only=False)
+                outputs[0]['tracking_id'] = torch.arange(start_id, start_id+outputs[0]['scores'].size(0)).int()
+                start_id += outputs[0]['scores'].size(0) 
+
+            else: # first frame
+                outputs = model(data_batch, return_loss=False)
+                outputs[0]['tracking_id'] = torch.arange(start_id, start_id+outputs[0]['scores'].size(0)).int()
+                start_id += outputs[0]['scores'].size(0)
+
+            output = copy.deepcopy(outputs[0])
+            token = output["metadata"]["token"]
+            for k, v in output.items():
+                if k not in ["metadata"]:
+                    if track_outputs is not None:
+                        output[k] = torch.cat([v.clone().to(cpu_device), track_outputs[0][k].clone().to(cpu_device)], dim=0)
+                    else:
+                        output[k] = v.clone().to(cpu_device)
+            detections.update({token: output,})
+
+            prev_output = {}
+            box3d_lidar = output['box3d_lidar'].clone().detach().cpu().numpy()
+            box3d = np.concatenate((box3d_lidar[:, :3], np.ones((box3d_lidar.shape[0],1))), axis=1).T
+            box3d = (np.linalg.inv(data_batch['car_from_global'][0]) @ np.linalg.inv(data_batch['ref_from_car'][0])) @ box3d
+            prev_output['box3d_lidar'] = box3d_lidar
+            prev_output['box3d_global'] = box3d
+            prev_output['label_preds'] = output['label_preds'].cpu().numpy()
+            prev_output['scores'] = output['scores'].cpu().numpy()
+            prev_output['tracking_id'] = output['tracking_id'].cpu().numpy()
+            prev_detections[output['metadata']['token']] = prev_output
+
+
+    synchronize()
+
+    all_predictions = all_gather(detections)
+
+    predictions = {}
+    for p in all_predictions:
+        predictions.update(p)
+
+    if not os.path.exists(args.work_dir):
+        os.makedirs(args.work_dir)
+
+    if args.eval_det:
+        result_dict, _ = dataset.evaluation(copy.deepcopy(predictions), output_dir=args.work_dir, testset=False)
+        if result_dict is not None:
+            for k, v in result_dict["results"].items():
+                print(f"Evaluation {k}: {v}")
+
+    # eval tracking
+    dataset.evaluation_tracking(copy.deepcopy(predictions), output_dir=args.work_dir, testset=False)
+
+def render_trackmap(preds_dicts, grids, cfg):
+    prev_hm = np.zeros((1, num_classes, size_h, size_w),dtype=np.float32)
+    prev_tracking_map = np.zeros((1, num_classes, size_h, size_w), dtype=np.int64) - 1
+    label_preds = preds_dicts['label_preds']
+    box3d_lidar = preds_dicts['box3d_lidar']
+    scores = preds_dicts['scores']
+    tracking_ids = preds_dicts['tracking_id']
+
+    box_corners = center_to_corner_box2d(box3d_lidar[:, :2], box3d_lidar[:, 3:5], box3d_lidar[:, -1])
+    box_corners = (box_corners - voxel_range[:2].reshape(1, 1, 2)) / voxel_size[:2].reshape(1, 1, 2) / downsample
+    masks = points_in_convex_polygon_jit(grids, box_corners)
+
+    for obj in range(label_preds.shape[0]):
+        cls_id = label_preds[obj]
+        score = scores[obj]
+        tracking_id = tracking_ids[obj]
+        size_x, size_y = box3d_lidar[obj, 3] / voxel_size[0] / downsample, box3d_lidar[obj, 4] / voxel_size[1] / downsample
+        if size_x > 0 and size_y > 0:
+            radius = gaussian_radius((size_y, size_x), min_overlap=0.1)
+            radius = min(cfg.assigner.min_radius, int(radius))
+
+            coor_x = (box3d_lidar[obj, 0] - voxel_range[0]) / voxel_size[0] / downsample
+            coor_y = (box3d_lidar[obj, 1] - voxel_range[1]) / voxel_size[1] / downsample
+            ct = np.array([coor_x, coor_y], dtype=np.float32)  
+            ct_int = ct.astype(np.int32)
+            # throw out not in range objects to avoid out of array area when creating the heatmap
+            if not (0 <= ct_int[0] < size_w and 0 <= ct_int[1] < size_h):
+                continue 
+            # render center map as in centertrack
+            draw_gaussian(prev_hm[0, cls_id], ct, radius, score)  #
+
+            # tracking ID map
+            mask = masks[:, obj].nonzero()[0]
+            coord_in_box = grids[mask, :]
+            mask1 = prev_tracking_map[0, cls_id][coord_in_box[:, 1], coord_in_box[:, 0]] == -1
+            mask2 = prev_hm[0, cls_id][coord_in_box[:, 1], coord_in_box[:, 0]] < score
+            mask = mask[np.logical_or(mask1, mask2)]
+            coord_in_box = grids[mask, :]
+            prev_tracking_map[0, cls_id][coord_in_box[:, 1], coord_in_box[:, 0]] = tracking_id
+            prev_tracking_map[0, cls_id][ct_int[1], ct_int[0]] = tracking_id
+
+    return torch.from_numpy(prev_hm), torch.from_numpy(prev_tracking_map)
+
+def meshgrid(w, h):
+    ww, hh = np.meshgrid(range(w), range(h))
+    ww = ww.reshape(-1) 
+    hh = hh.reshape(-1)
+
+    return np.stack([ww, hh], axis=1)
+
+
+if __name__ == "__main__":
+    tracking()