EfficientDet

目标检测是计算机视觉的一大研究主题,长期以来热度不减。深度学习大规模应用于视觉领域后,目标检测的研究进展飞快,例如:每年各大CV顶会论文,目标检测的主题占很大比例。随着检测准确率的提升,这方面的研究倾向于关注模型效率,追求更高的检测精度和更快的检测效率,同时往往和神经架构搜索结合,探索不同的模型架构,以适配不同的资源条件。本文介绍的这篇论文,是 Google 提出的目标检测模型 —— EfficientDet,实验表明兼具准确率和效率优势,它实际上是一个系列:共有 D0-D7 八个检测器,从最基本的 EfficientDet D0 出发,运用神经架构搜索和模型缩放技术,扩展出了 D1-D7,每种检测器的检测精度和效率不同,满足不同的资源场景的需求。 [Read More]

Mono3D

这篇博客分享的是 CVPR 2016 的一篇论文,该论文研究自动驾驶场景中物体3D检测问题。从时间上来看该文算是自动驾驶3D物体检测 比较早的研究了,其中的方法在当时来看比较前沿,但是现在看有点老旧——部分模块还在用SVM等机器学习模型,因为这个领域的进展非常快,每年都会涌现大量文章,清一色基于深度学习模型。选择分享这篇文章,是因为它比较经典,引用量达接近400 —— 后续文章在做介绍和对比试验的时候不约而同提到了它。 [Read More]

MonoGRNet

这篇博客分享的是 AAAI 2019 的一篇文章。该文研究利用单目相机采集的图片,对汽车进行3D定位和检测;主要的贡献是在3D定位和检测过程中 引入了 geometric knowledge,并在KITTI数据集进行了测试和消融实验,证明了 geometric knowledge 有助于提升3D定位和检测效果;文章称MonoGRNet在Geforce GTX Titan X处理速度为 0.06 sec/frame。 [Read More]

MoNet3D

这篇博客分享的是 ICML 2020 的一篇文章,这篇文章研究的内容是自动驾驶——ADAS中,汽车的3D检测和定位,主要的贡献是在神经网络中引入了邻近汽车的空间几何关系,相当于增加了限定条件,在KITTI数据集上的实验表明这种方法提高了3D检测和定位的准确率;文章称处理速度可以达到 27.85 FPS。 [Read More]

GPU Utility Settings

对于计算机视觉开发和研究,包括其他深度学习研发,几乎避免不了使用GPU设备。在你已经具备GPU硬件设备并 把它正确插到主机的前提下:本篇博客讲解在一台 Linux 系统上(具体是 Ubuntu 18.04 LTS), 如何让软件把GPU设备使用起来,包括CUDA Toolkit安装、环境变量配置等。 [Read More]