U-Net

论文发布日期：2015-05-18

发布会议/期刊：MICCAI 2015（CCF-B）

阅读时，请注意以下观点发布的时间是在2015年

Abstract

目标

如何在仅有少量样本时，能充分利用图片上下文并保持像素定位精度，来对生物医学图像进行精准分割

动机

过去卷积神经网络通常用于为每张图输出分类标签，然而在许多视觉任务例如生物医学图像处理中，所需的输出应该包括定位，即应该为每个像素分配一个类标签
在生物医学任务中，数以千计的训练图像通常是遥不可及的。过去Ciresan等人的工作设置滑动窗口来训练网络，通过提供该像素周围的局部区域(patch)作为输入来预测每个像素的类标签。这种方法有两个缺点：一是非常慢并且有大量冗余。二是定位精度和上下文选择之间需要权衡，因为较大的patch需要更大的最大池化，会降低定位精度，而较小的patch仅仅看到了很少的上下文
最近有方法提出考虑多层特征分类器输出，可以实现同时良好的定位和使用上下文信息

解决方法

U-Net包含一个收缩路径（用于捕捉上下文信息）和一个对称的扩张路径（用于精确定位），并且还有两个路径特征图的skip connection，可以增强前后文信息传递
生物医学图像标注较少，U-Net通过弹性形变进行数据增强，更好地利用了标注样本
Overlap-tile strategy用于任意大图像的无缝分割，即滑动窗口重叠。因为特征图大小不匹配，还用镜像推断用周边镜像数据预测输出