English | 简体中文

Robo3D: Towards Robust and Reliable 3D Perception against Corruptions

孔令东^1,2,*   刘有权^1,3,*   李鑫^1,4,*   陈润楠^1,5   张文蔚^1,6
任嘉玮⁶   潘亮⁶   陈恺¹   刘子纬⁶
¹上海人工智能实验室   ²新加坡国立大学   ³不来梅哈芬应用技术大学   ⁴华东师范大学
⁵香港大学   ⁶南洋理工大学S-Lab

项目概览

Robo3D 是一个详实的鲁棒性评测套件，旨在于自动驾驶场景中实现稳健且可靠的3D感知。基于此套件，我们探究了3D检测器和3D分割器在分布外 (OoD) 场景下对于真实环境中发生的数据"损坏"条件下的鲁棒性。具体地，我们共考虑了以下几种可能发生数据"损坏"的情形:

恶劣天气情况, 例如 雾天, 潮湿地面, 以及 雪天;
外界干扰情况, 例如 运动模糊 和激光雷达 射线丢失;
内部传感器损坏, 例如 交扰, 非完整回声, 以及 跨传感器 情形.



干净	雾天	潮湿地面

雪天	运动模糊	射线丢失

交扰	非完整回声	跨传感器

请参阅我们的项目主页以获取更多细节与例子. 🚘

版本更新

[2023.07] - Robo3D 被收录于 ICCV 2023! 🎉
[2023.03] - 我们在 Paper-with-Code 平台搭建了如下 "鲁棒3D感知" 基线: ¹KITTI-C, ²SemanticKITTI-C, ³nuScenes-C, and ⁴WOD-C. 现在就加入鲁棒性评测吧! 🙋
[2023.03] - KITTI-C, SemanticKITTI-C 以及 nuScenes-C 数据集可以在 OpenDataLab 平台上下载. 请参阅这份项目文档以了解更多有关数据准备的细节. 🍻
[2023.01] - Robo3D 基线现已上线. 在这个初步版本中, 我们测试了 12 种3D检测器和 22 种3D分割器在 4 个大规模自动驾驶感知数据集 (KITTI, SemanticKITTI, nuScenes 以及 Waymo Open) 上的 8 种"损坏"条件下的鲁棒性.

大纲

分类
视频演示
安装
数据准备
开始实验
模型库
鲁棒性基线
生成"损坏"数据
更新计划
引用
许可
致谢

分类




雾天	潮湿地面	雪天	运动模糊



射线丢失	交扰	非完整回声	跨传感器

视频演示

Demo 1	Demo 2	Demo 3

链接 ^⤴️	链接 ^⤴️	链接 ^⤴️

安装

For details related to installation, kindly refer to 安装.md.

数据准备

Our datasets are hosted by OpenDataLab.

OpenDataLab is a pioneering open data platform for the large AI model era, making datasets accessible. By using OpenDataLab, researchers can obtain free formatted datasets in various fields.

Kindly refer to 数据准备.md for the details to prepare the ¹KITTI, ²KITTI-C, ³SemanticKITTI, ⁴SemanticKITTI-C, ⁵nuScenes, ⁶nuScenes-C, ⁷WOD, and ⁸WOD-C datasets.

开始实验

To learn more usage about this codebase, kindly refer to 开始实验.md.

模型库

LiDAR语义分割

SqueezeSeg, ICRA 2018. ^[Code]

SqueezeSegV2, ICRA 2019. ^[Code]

MinkowskiNet, CVPR 2019. ^[Code]

RangeNet++, IROS 2019. ^[Code]

KPConv, ICCV 2019. ^[Code]

SalsaNext, ISVC 2020. ^[Code]

RandLA-Net, CVPR 2020. ^[Code]

PolarNet, CVPR 2020. ^[Code]

3D-MiniNet, IROS 2020. ^[Code]

SPVCNN, ECCV 2020. ^[Code]

Cylinder3D, CVPR 2021. ^[Code]

FIDNet, IROS 2021. ^[Code]

RPVNet, ICCV 2021.

CENet, ICME 2022. ^[Code]

CPGNet, ICRA 2022. ^[Code]

2DPASS, ECCV 2022. ^[Code]

GFNet, TMLR 2022. ^[Code]

PCB-RandNet, arXiv 2022. ^[Code]

PIDS, WACV 2023. ^[Code]

SphereFormer, CVPR 2023. ^[Code]

WaffleIron, arXiv 2023. ^[Code]

LiDAR全景分割

DS-Net, CVPR 2021. ^[Code]

Panoptic-PolarNet, CVPR 2021. ^[Code]

3D物体检测

SECOND, Sensors 2018. ^[Code]

PointPillars, CVPR 2019. ^[Code]

PointRCNN, CVPR 2019. ^[Code]

Part-A2, T-PAMI 2020.

PV-RCNN, CVPR 2020. ^[Code]

3DSSD, CVPR 2020. ^[Code]

SA-SSD, CVPR 2020. ^[Code]

CenterPoint, CVPR 2021. ^[Code]

PV-RCNN++, IJCV 2022. ^[Code]

SphereFormer, CVPR 2023. ^[Code]

鲁棒性基线

LiDAR语义分割

The mean Intersection-over-Union (mIoU) is consistently used as the main indicator for evaluating model performance in our LiDAR semantic segmentation benchmark. The following two metrics are adopted to compare between models' robustness:

mCE (the lower the better): The average corruption error (in percentage) of a candidate model compared to the baseline model, which is calculated among all corruption types across three severity levels.
mRR (the higher the better): The average resilience rate (in percentage) of a candidate model compared to its "clean" performance, which is calculated among all corruption types across three severity levels.