论文名称:Cooperative Holistic Scene Understanding: Unifying 3D Object, Layout, and Camera Pose Estimation
[Read More]
Total3DUnderstanding
这篇论文研究的问题是从单张RGB图片,运用深度学习的方法,同时建模室内布局,物体姿态和Mesh,取得了较好的效果。这篇文章是对其他工作的follow,
之前NeurIPS/ECCV出现过研究同样问题的文章,有必要同时看一下,弄清楚一些来龙去脉。
[Read More]
Survey - 3D Scene Modeling
3D场景建模有着广阔的研究和应用前景,这里的场景既包括室内又包括室外。最近几年大量基于深度学习的方法涌现出来,取得了一些惊艳的效果,促进了该领域的发展。本文关注点是3D场景建模领域的一些重要文献,并把它们整理出来,简要介绍每篇论文的研究背景、研究方法、主要贡献,让读者对3D场景建模的问题、方法有大致了解。在后几期的博客中,会逐一挑选这方面有代表性的论文,详细讲解给大家。
[Read More]
DSAC
RANSAC是提升模型估计鲁棒性一个经典的算法,被用在很多计算机视觉应用。但是目前为止,把RANSAC当作深度学习pipeline一个组成部分的方法还没有,原因是RANSAC选择hypothesis的步骤,
不可求导。这篇论文中,设计了两种方法,让RANSAC选择hypothesis的步骤可导。其中最有前景的方法受到了强化学习的启发,就是把 deterministic hypothesis selection 替换为
probabilistic selection,这样就能求损失函数对模型中的所有可学习参数的导数,进而把RANSAC和深度学习结合起来。这种方法叫作 Differentiable RANSAC(DSAC)。
本文做了一个示例,把DSAC应用于 Camera Localization,实验证明把RANSAC和深度学习结合起来直接估计相机姿态,能够达到更高的准确性。文章同时认为DSAC可嵌入其他深度学习任务。
[Read More]
AlexNet
今天分享的这篇论文发表时间是2012年,算是比较早了,是把深度卷积神经网络成功应用在计算机视觉领域的开山之作,目前被引用量接近 70000,可见影响力非常之大,可以说做视觉的论文十有八九会引用它。网络上对它的讲解非常之多,再拿出来阅读,是因为它很经典,搞清楚深度卷积神经网络一些最基本的东西。
[Read More]