1、 数据增广(Data Augmentation)快速总结:镜像(flip)旋转(rotation)缩放(scale)裁剪(crop)平移(translation)高斯噪声(gaussion noise)图像亮度、饱和度和对比度变化PCA JitteringLable shuffleSDA生成对抗网络(generative adversi network)注:crop、flip、scale是大杀器,color augmentation甚至导致反作用。
2、 数据增广方法2.1 镜像(Flip)您可以水平和垂直翻转(flip)图像。某些框架不提供垂直翻转功能。但是,垂直翻转相当于将图像旋转180度然后执行水平翻转。以下是翻转图像的示例[1]。从左边开始,为原始图像,然后水平翻转图像,然后垂直翻转图像。

4、3 缩放(Scale)图像可以向外缩放(放大)或者向内缩放(缩小)。如向外缩放(scaling outward)时,最终图像尺寸将大于原始图像尺寸,然后大多数图像框架从放大的新图像中剪切出一个部分,其大小等于原始图像。我们将在下一节中处理向内缩放,因为它会缩小图像大小,迫使我们对超出边界的内容做出假设。以下是放大的示例或图像。从左边开始,为原始图像,图像放大10%再裁剪,图像放大20%再裁剪

6、5 平移(Translation)平移(translation)只涉及沿X或Y方向(或两者)移动图像。在下面的示例中,我们假设图像在其边界之外具有黑色背景,并且做适当的平移。这种增广方法非常有用,因为大多数对象几乎可以位于图像的任何位置。这迫使你的卷积神经网络可以无处不在的”look”。从左边开始,原始图像,图像向右平移,图像向上平移。
