您好、欢迎来到现金彩票网!
当前位置:刘伯温论坛 > 图像分类 >

一种新的深度CNN分类方法 用于着色

发布时间:2019-06-12 04:28 来源:未知 编辑:admin

  斯坦福大学的一组研究人员最近开发了一种CNN分类方法,用于着色灰度图像。他们设计的工具,名为ColorUNet,从U-Net中汲取灵感,U-Net是一个完全卷积的图像分割网络。

  “作为斯坦福大学计算机视觉课程的一部分,我们在这个项目上工作了几个月,”进行这项研究的研究人员之一Vincent Billaut告诉TechXplore。“我们的目标是使用轻量级模型重现最先进的结果,而不是通过增加训练集的大小或计算复杂性来增强现有模型,这是CV问题中非常常见的方法。我们希望我们的结果是易于评估和视觉上的吸引力,因为除了有用和有影响力的应用程序,简历也是很酷的东西。“

  Billaut和他的同事决定从分类角度自动着色灰度图像,使用一组有限的颜色可能性。他们的模型遵循了丢失和预测功能,有利于彩色图像而非现实图像。

  “我们不是试图通过回归任务直接预测颜色,而是将所有颜色分成垃圾箱,并进行分类任务,”参与该研究的另一位研究人员Marc Thibault告诉TechXplore。“通过微调我们如何从网络输出预测颜色,我们可以将问题表述为分类任务,从而更好地控制我们希望输出看起来多么丰富多彩。”

  研究人员在SUN和ImageNet数据集的子集上训练他们的模型,这些数据集包含景观图像。他们开发的神经网络架构允许他们的深度学习算法从每个灰度图像中提取局部和全局信息。

  “然后,算法可以根据自己的方面以及周围环境决定区域的颜色,”Thibault说。“一般而言,人工智能技术在现实生活中的决策制定必须利用本地精确的主题识别和对更广泛背景的理解。”

  该研究的主要目标之一是开发一种可扩展的轻量级架构,同时也执行彩色化任务中最先进的模型。为了实现这一目标,研究人员将任务限制在自然景观的图像上。

  “最重要的是,我们使用U-Net架构来提高性能并降低模型的复杂性,”进行这项研究的研究人员之一Matthieu de Rochemonteix告诉TechXplore。“ColorUnet在选定的子任务上接近最先进的性能。它的架构允许更快,更稳定的训练,而不需要牺牲模型的深度和代表性能力。”

  在对风景图片进行评估时,ColorUNet取得了非常有希望的结果,数据增强显着提高了模型的性能和稳健性。该研究人员也适用于模拟视频着色,提出了一种方法来平滑跨框架颜色的预测,而无需培养一个经常性的网络连续输入。

  “这项技术的主要贡献在于能够通过向整个图像的上下文提供算法来了解局部图像中正在发生的事情,”Thibault说。“虽然我们展示了其在图像着色方面的效率,但我们也在研究其他应用,特别是在医学领域。在斯坦福的Gevaert实验室内,我们已经将此方法应用于基于MRI扫描的胶质瘤(脑癌)患者的肿瘤检测研究正在这个领域蓬勃发展,越来越多的CV技术应用于医学成像。“

http://airgomusic.com/tuxiangfenlei/253.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有