【自动驾驶】浅学一下BEV目标检测记录-个人在线分享-虚灵IT资料分享

现在BEV与OCC占用网络非常火，在日常工作中，如果没有接触到，可能会忽略相应的知识储备。本人还未看大量文献，所以只能算浅学下记录，这里主要从互联网上学习到的，还是就是跟专业的同事请教之后，自己总结的。

BEV视觉其实是全局俯视图，更好的得到其他障碍物到自车的横纵向距离。在2D检测的时候，对于深度（其他障碍物离自车的纵向距离）估计不是很准。

我们知道BEV视觉下一般需要输入几个相机的数据，以前2D目标检测标注，直接在图像上标注就可以了，标注一个2D或者3D框，也可以根据点云标注其深度信息（其他障碍物离自车的纵向距离）。对于2D目标检测中，超出图像区域的是可以只标注部分的。

（1）BEV目标检测中，对于出现在两个图像上的数据怎么标注呢？是在图像上标注还是如何标注？

答案是，在lidar上进行标注，然后根据lidar到ego的标定位置转换关系，将其转到ego坐标系下，就可以作为标签了。

（2）纯视觉是输入image？image系怎么与ego标签对应？

我们知道BEV输入的是image，是同一时刻批次的对应的多个相机数据（一般是4个或者5个），但是image系的，怎么与ego的标签进行关联呢，可以将image系转到ego系，然后就能与标签一起训练了。

（3）对于超出其中一个图像上的标签，需要剔除么？

不需要，标签在ego系下，可以通过同一时刻批次的对应的多个相机数据，学习到重叠区域中的信息。

后面需要再多看一下BEV目标检测相关的论文与代码。