你好,游客 登录
背景:
阅读新闻

利用 DeepLab 在 Tensorflow 中进行语义图像分割

[日期:2018-03-23] 来源:谷歌开发者社区  作者: [字体: ]

发布人:Google Research 软件工程师 Liang-Chieh Chen 和 Yukun Zhu语义图像分割,也就是将“道路”、“天空”、“人”和“狗”等语义标签分配给图像中每一个像素的任务,可以实现大量的新应用,例如 Pixel 2 与 Pixel 2 XL 智能手机人像模式中附带的合成浅景深效果,以及 移动实时视频分割。分配这些语义标签需要标出对象的轮廓,因此,它对定位精度的要求比其他视觉实体识别任务(例如 图像级分类或 边界框级检测)更加严格。

我们高兴地宣布将 Google 最新、性能最好的语义图像分割模型 DeepLab-v3+[1](在 Tensorflow中实现)开源。此次发布包括基于一个强大的 卷积神经网络(CNN) 骨干架构 [2, 3] 构建的 DeepLab-v3+ 模型,这些模型可以获得最准确的结果,预期用于服务器端部署。作为此次发布的一部分,我们还将分享 Tensorflow 模型训练与评估代码,以及已在 Pascal VOC 2012和 Cityscapes基准语义分割任务中预先训练的模型。

自从我们 DeepLab 模型 [4] 的第一个版本在三年前发布以来,优化的 CNN 特征提取器、更好的对象比例建模、对情景信息的仔细同化、改进的训练过程,以及越来越强大的硬件和软件令 DeepLab-v2 [5] 和 DeepLab-v3 [6] 取得了提升。在 DeepLab-v3+ 中,我们在 DeepLab-v3 的基础上添加了一个简单有效的解码器模型以优化分割结果,尤其是对象边界处的结果。我们进一步将 深度可分离卷积应用到孔空间金字塔池化 [5, 6] 和解码器模块,从而形成更快、更强大的语义分割编码器-解码器网络。

得益于方法、硬件和数据集的发展,基于卷积神经网络 (CNN) 构建的现代语义图像分割系统的准确性已经达到五年前难以想象的水平。我们希望与社区公开分享自己的系统可以让学术界和产业界的其他团队更轻松地重现并进一步改进最先进系统,使用新数据集训练模型,以及为此技术构想新的应用。

致谢

我们想要感谢以下人员和团队的大力支持和有价值的讨论:Iasonas Kokkinos、Kevin Murphy、Alan L. Yuille(DeepLab-v1 和 DeepLab-v2 的共同作者)、Mark Sandler、Andrew Howard、Menglong Zhu、Chen Sun、Derek Chow、Andre Araujo、Haozhi Qi、Jifeng Dai 和 Google Mobile Vision 团队。

参考文献

  1. Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation, Liang-Chieh Chen, Yukun Zhu, George Papandreou, Florian Schroff, and Hartwig Adam, arXiv:1802.02611, 2018.

  2. Xception:Deep Learning with Depthwise Separable Convolutions, François Chollet, Proc. of CVPR, 2017.

  3. Deformable Convolutional Networks — COCO Detection and Segmentation Challenge 2017 Entry, Haozhi Qi, Zheng Zhang, Bin Xiao, Han Hu, Bowen Cheng, Yichen Wei, and Jifeng Dai, ICCV COCO Challenge Workshop, 2017.

  4. Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs, Liang-Chieh Chen, George Papandreou, Iasonas Kokkinos, Kevin Murphy, and Alan L. Yuille, Proc. of ICLR, 2015.

  5. Deeplab:Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs, Liang-Chieh Chen, George Papandreou, Iasonas Kokkinos, Kevin Murphy, and Alan L. Yuille, TPAMI, 2017.

  6. Rethinking Atrous Convolution for Semantic Image Segmentation, Liang-Chieh Chen, George Papandreou, Florian Schroff, and Hartwig Adam, arXiv:1706.05587, 2017.

<!—->

Source: 利用 DeepLab 在 Tensorflow 中进行语义图像分割

除非特别声明,此文章内容采用 知识共享署名 3.0许可,代码示例采用 Apache 2.0许可。更多细节请查看我们的 服务条款。

收藏 推荐 打印 | 录入:Cstor | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款