caffe详解之池化层


从零开始,一步一步学习caffe的使用,期间贯穿深度学习和调参的相关知识!

池化层参数说明

1
2
3
4
5
6
7
8
9
10
11
12

layer {
name: "pool1"
type: "Pooling"
bottom: "conv1"
top: "pool1"
pooling_param {
pool: MAX #池化方法,默认为MAX。目前可用的方法有MAX, AVE
kernel_size: 3 #池化的核大小
stride: 2 #池化的步长,默认为1。一般我们设置为2,即不重叠。
}
}

caffe池化层对应的参数说明文件,如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

message PoolingParameter {
enum PoolMethod {
MAX = 0;
AVE = 1;
STOCHASTIC = 2;
}
optional PoolMethod pool = 1 [default = MAX]; // The pooling method
// Pad, kernel size, and stride are all given as a single value for equal
// dimensions in height and width or as Y, X pairs.
optional uint32 pad = 4 [default = 0]; // The padding size (equal in Y, X)
optional uint32 pad_h = 9 [default = 0]; // The padding height
optional uint32 pad_w = 10 [default = 0]; // The padding width
optional uint32 kernel_size = 2; // The kernel size (square)
optional uint32 kernel_h = 5; // The kernel height
optional uint32 kernel_w = 6; // The kernel width
optional uint32 stride = 3 [default = 1]; // The stride (equal in Y, X)
optional uint32 stride_h = 7; // The stride height
optional uint32 stride_w = 8; // The stride width
enum Engine {
DEFAULT = 0;
CAFFE = 1;
CUDNN = 2;
}
optional Engine engine = 11 [default = DEFAULT];
// If global_pooling then it will pool over the size of the bottom by doing
// kernel_h = bottom->height and kernel_w = bottom->width
optional bool global_pooling = 12 [default = false];
}

池化层详解

池化图解

  • Max pooling 与 Average pooling

  • Global Average pooling

池化层意义

因为卷积层每次作用在一个窗口,它对位置很敏感。池化层能够很好的缓解这个问题。它跟卷积类似每次看一个小窗口,然后选出窗口里面最大的元素,或者平均元素作为输出。这样做为后续操作减少了运算量,同时能有效避免数据过拟合的现象。
pooling的操作如果采用global的方式进行,也就是对输入数据的一整个面进行pool操作,这种设计方法可以在某种情况下代替全连接层,减少参数的存储和计算量。例如SqueezeNet最后一层,ResNet-50倒数第二层j均采用了globalave-pooling

max-pool的问题

现在的最大池化层大约去掉了 75% 的激活函数

  • 空间信息损失:当去掉 75% 的激活函数时,关于其来源的信息就会丢失。
  • 最大池化层无法使用来自多层激活函数的信息。
  • 反向传播只会提升最大池化的激活函数,即使其他激活函数的值可能出现错误。

sort_pool2d

sort_pool2d的提出旨在尽量多的解决max-pooling上面提到的问题,具体实现方式如下:
设池化之前的层的输出为张量 T,大小为 [B, H, W, C]。定义一个超参数 pool_range,它可以是 [1,2,3,4] 中的任意一个。pool_range 指定激活函数(按照排列顺序保存)的数量。假设要被池化的张量 T 有 4 个激活函数,我首先按照 [a1, a2, a3, a4] 的顺序排列它们,其中 a1 ≥ a2 ≥ a3 ≥ a4。接着保留其中的第一个 pool_range,我称之为激活向量。

pool_range 的权重向量定义为 [w{1},…. w{pool_range}]。这里需要注意的是,如果这些权重中的任何一个是负值,则激活向量按强度排序且采用加权平均的假设将不成立。因此,没有直接使用权重,而是在权重向量上取一个 softmax,并将结果乘以激活向量。
其实sort_pool2dmax-pooling的一个扩展,假设pool_range=1对应的便是max-pooling。具体代码参考:
sort_pool2d 代码:https://github.com/singlasahil14/sortpool2d/blob/master/sortpool2d_test.py
sort_pool2d 实现:https://github.com/singlasahil14/sortpool2d/blob/master/sort_pool2d.py

参考

花式池化
https://antkillerfarm.github.io/dl/2017/08/28/Deep_Learning_13.html
新型池化层sort_pool2d实现更快更好的收敛:表现优于最大池化层
http://mp.weixin.qq.com/s/XzOri12hwyOCdI1TgGQV3w

-------------本文结束 感谢您的阅读-------------
0%