您好、欢迎来到现金彩票网!
当前位置:刘伯温论坛 > 图像分类 >

AI科普:计算视觉中的图像分类与检测的前沿进展

发布时间:2019-06-19 06:24 来源:未知 编辑:admin

  图像分类与图像检测,作为计算机视觉领域中十分重要的两大任务,也是复杂图像处理工作的基础。

  图像分类(Image Classification)主要是基于图像的内容对图像进行标记,通常会有一组固定的标签,而模型必须预测出最适合图像的标签。这个问题对于机器来说相当困难的,因为它看到的只是图像中的一组数字流。

  自从Alex和他的导师Hinton(深度学习鼻祖)在2012年的ImageNet大规模图像识别竞赛(ILSVRC2012)中以超过第二名10个百分点的成绩(83.6%的Top5精度)碾压第二名(74.2%,使用传统的计算机视觉方法)后,深度学习真正开始火热,卷积神经网络(CNN)开始成为家喻户晓的名字。

  Top5精度是指在给出一张图片,模型给出5个最有可能的标签,只要在预测的5个结果中包含正确标签,即为正确。

  ◆ 2015年,在1000类的图像识别中,微软提出的残差网(ResNet)以96.43%的Top5正确率,达到了超过人类的水平(人类的正确率也只有94.9%)。

  伴随着图像分类任务,还有另外一个更加有挑战的任务–图像检测(Image Dection)。图像检测是指在分类图像的同时把物体用矩形框给圈起来。与分类相比,这个问题要稍微复杂一点,必须对图像进行更多的操作和处理。

  现在最著名检测方法叫做Faster-RCNN。RCNN是局部卷积神经网络,它使用一种称为候选区域生成网络(Region Proposal Network,RPN)的技术,实际上是将图像中需要处理和分类的区域局部化。后来RCNN经过调整效率得以调高,被称之为Faster-RCNN,一种用作候选区域生成方法的一部分用以生成局部的卷积神经网络。

  深度学习检测速度也越来越快,从最初的RCNN模型,处理一张图片要用2秒多,到Faster RCNN的198毫秒/张,再到YOLO的155帧/秒(其缺陷是精度较低,只有52.7%),最后出来了精度和速度都较高的SSD,精度75.1%,速度23帧/秒。

  目前的image-net挑战(LSVRC 2017)有一个目标检测的挑战赛的冠军,被一个名为“BDAT”的团队所囊括。返回搜狐,查看更多

http://airgomusic.com/tuxiangfenlei/378.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有