基于特征编码（feature encoder based）的图像分割

来源：数据堂 2019-12-20

基于深度学习的图像分割：特征编码（feature encoder based）

在特征提取领域中VGGnet和ResNet是两个非常有统治力的方法，接下来的一些篇幅会对这两个方法进行简短的介绍

a.VGGNet

由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深度卷积神经网络。它探索了卷积神经网络的深度和其性能之间的关系，通过反复的堆叠33的小型卷积核和22的最大池化层，成功的构建了16~19层深的卷积神经网络。VGGNet获得了ILSVRC 2014年比赛的亚军和定位项目的冠军，在top5上的错误率为7.5%。目前为止，VGGNet依然被用来提取图像的特征。

VGGNet的优缺点

1、由于参数量主要集中在最后的三个FC当中，所以网络加深并不会带来参数爆炸的问题

2、多个小核卷积层的感受野等同于一个大核卷积层（三个3x3等同于一个7x7）但是参数量远少于大核卷积层而且非线性操作也多于后者，使得其学习能力较强

3、VGG由于层数多而且最后的三个全连接层参数众多，导致其占用了更多的内存（140M）

b.ResNet

随着深度学习的应用，各种深度学习模型随之出现，虽然在每年都会出现性能更好的新模型，但是对于前人工作的提升却不是那么明显，其中有重要问题就是深度学习网络在堆叠到一定深度的时候会出现梯度消失的现象，导致误差升高效果变差，后向传播时无法将梯度反馈到前面的网络层，使得前方的网络层的参数难以更新，训练效果变差。这个时候ResNet恰好站出来，成为深度学习发展历程中一个重要的转折点。

ResNet是由微软研究院的Kaiming He等四名华人提出，他们通过自己提出的ResNet Unit成功训练出来152层的神经网络并在ILSVRC2015比赛中斩获冠军。ResNet语义分割领域最受欢迎且最广泛运用的神经网络.ResNet的核心思想就是在网络中引入恒等映射，允许原始输入信息直接传到后面的层中，在学习过程中可以只学习上一个网络输出的残差（F(x)），因此ResNet又叫做残差网络。

使用到ResNet的分割模型：

Efficient Neural Network（ENet）：该网络类似于ResNet的bottleNeck方法；

ResNet-38：该网络在训练or测试阶段增加并移除了一些层，是一种浅层网络，它的结构是ResNet+FCN；

full-resolution residual network(FRRN)：FRRN网络具有和ResNet相同优越的训练特性，它由残差流和池化流两个处理流组成；

AdapNey：根据ResNet-50的网络进行改进，让原本的ResNet网络能够在更短的时间内学习到更多高分辨率的特征；

……

ResNet的优缺点：

1）引入了全新的网络结构（残差学习模块），形成了新的网络结构，可以使网络尽可能地加深；

2）使得前馈/反馈传播算法能够顺利进行，结构更加简单；

3）恒等映射地增加基本上不会降低网络的性能；

4）建设性地解决了网络训练的越深，误差升高，梯度消失越明显的问题；

5）由于ResNet搭建的层数众多，所以需要的训练时间也比平常网络要长。

本文转载自网络：如有侵权请联系删除

专业的人工智能数据服务提供商

销售热线：13051623904

数据堂官方微信

京ICP备11010828号-1 京公网安备 11010802026079号法律声明与隐私权政策

电话
留咨
合规

提交成功！感谢您支持数据堂。

确定

暂无数据

取消

呼叫

安全合规

数据堂符合并遵守数据保护条例对隐私数据保护的要求，并且已通过ISO27001信息安全管理体系、ISO9001质量管理体系认证。

手机格式错误

请填写姓名

请填写手机号码

请填写公司全称

请填写企业邮箱

需求描述格式错误

需求描述不能为空

联系我们

姓名

手机

公司名称

企业邮箱

需求

提交

点击下载

企业邮箱格式错误