Test EfficientDet

今天要分享的是谷歌发表在 CVPR 2020 上的一篇论文，研究的问题是目标检测，在保证准确率的情况下提高模型效率，这里的效率指模型大小和训练/推理时间，都是越小越好；论文的实验效果很惊艳。

论文作者： Mingxing Tan, Ruoming Pang, Quoc V. Le (both from Google Brain)

EfficientDet效果

对于第一个测试用例
- 用EfficientDet-D0就达到了比较好的效果，视频中的飞鸟应检尽检，也得益于飞鸟很大，背景是天空，没有复杂的场景和物体
- 因为这个视频不是下载下来的，而是我用录屏软件生成，所以开始和结尾会有录屏软件和其他杂乱的东西，对于这部分产生了误检，把录屏软件当成了“book”、“cell-phone”
对于第二个测试用例
- EfficientDet D0 和 D2 都测试了，当人离镜头远的时候 D0 和 D2 都跟丢了；调整镜头焦距离人近的时候，同时能跟踪到；说明对于小物体的检测做的不好，因为训练数据 Imagenet、COCO 没有针对小物体，网络结构也没有针对小物体设计
- D2的检测效果好于D0，体现在D2比D0更早追踪到人，也就是说离镜头远的时候，D2检测到人的时候，D0还未能做到
- D2的推理速度慢于D0，D2用时近一小时，D0十多分钟；CPU确实慢
EfficientDet 这种检测器本质上是一副图片，没有考虑图片间的时序关系，虽然能实现物体跟踪的效果，但是和物体跟踪范式还有所区别