Mono3D

这篇博客分享的是 CVPR 2016 的一篇论文,该论文研究自动驾驶场景中物体3D检测问题。从时间上来看该文算是自动驾驶3D物体检测 比较早的研究了,其中的方法在当时来看比较前沿,但是现在看有点老旧——部分模块还在用SVM等机器学习模型,因为这个领域的进展非常快,每年都会涌现大量文章,清一色基于深度学习模型。选择分享这篇文章,是因为它比较经典,引用量达接近400 —— 后续文章在做介绍和对比试验的时候不约而同提到了它。 [Read More]

MonoGRNet

这篇博客分享的是 AAAI 2019 的一篇文章。该文研究利用单目相机采集的图片,对汽车进行3D定位和检测;主要的贡献是在3D定位和检测过程中 引入了 geometric knowledge,并在KITTI数据集进行了测试和消融实验,证明了 geometric knowledge 有助于提升3D定位和检测效果;文章称MonoGRNet在Geforce GTX Titan X处理速度为 0.06 sec/frame。 [Read More]

MoNet3D

这篇博客分享的是 ICML 2020 的一篇文章,这篇文章研究的内容是自动驾驶——ADAS中,汽车的3D检测和定位,主要的贡献是在神经网络中引入了邻近汽车的空间几何关系,相当于增加了限定条件,在KITTI数据集上的实验表明这种方法提高了3D检测和定位的准确率;文章称处理速度可以达到 27.85 FPS。 [Read More]

GPU Utility Settings

对于计算机视觉开发和研究,包括其他深度学习研发,几乎避免不了使用GPU设备。在你已经具备GPU硬件设备并 把它正确插到主机的前提下:本篇博客讲解在一台 Linux 系统上(具体是 Ubuntu 18.04 LTS), 如何让软件把GPU设备使用起来,包括CUDA Toolkit安装、环境变量配置等。 [Read More]

Lab Server User Tutorials

上一篇post从全局角度讲解了做视觉开发、研究的服务器基础环境配置问题,本文是对上篇文章的深入,讲解实施细节。具体来说,当 Ubuntu 系统装好以后, 如何为新用户创建友好的、易用的Shell —— 用户在Ubuntu服务器上操作,Shell是用户和系统最主要的交互工具 有人可能好奇,Shell都是命令行操作,还有友好、易用之分?根据新用户指南配置完成,你就切身体会到了:原生的Shell只是让你能够使用系统,并不能让你高效方便的使用系统 在多用户使用的情况下,如何共享数据资源 —— 节省时间、提高效率,比如常用的miniconda3安装包,下载一份多人使用即可 服务器数据共享的方式有很多种,我们采用文件夹权限共享的方式 [Read More]