1.6 EfficientNetV2建模

参照EfficientNetV2论文公布的源码,本节完成EfficientNetV2-S/M/L三个模型的编程。官方程序用列表描述模型的参数结构,以EfficientNetV2-S模型为例,其结构描述如下。

    v2_s_block = [
        'r2_k3_s1_e1_i24_o24_c1'
        'r4_k3_s2_e4_i24_o48_c1'
        'r4_k3_s2_e4_i48_o64_c1'
        'r6_k3_s2_e4_i64_o128_se0 25'
        'r9_k3_s1_e6_i128_o160_se0 25'
        'r15_k3_s2_e6_i160_o256_se0 25'
    ]

参照表1.9对EfficientNetV2-S模型的定义,v2_s_block中的参数符号解读如下。

r:当前Stage中Operator重复的次数repeats。

k:卷积核尺寸kernel_size。

s:步长stride。

e:升维倍率因子expansion ratio。

i:当前Stage的输入通道数input channels。

o:当前Stage的输出通道数output channels。

c:卷积类型,0表示Fused-MBConv,1表示MBConv。

se:表示SE模块第一个全连接层的通道压缩因子se_ratio。

打开PyCharm,新建项目TensorFlow_to_Android,按照本节视频教程提示,配置项目虚拟环境,安装TensorFlow和相关库。新建文件夹EfficientNetV2,在其中创建model.py程序,完成程序源码P1.1的编程与测试工作。

程序model.py编码有些长,其中包含了EfficientNetV2-S/M/L三种模型的实现逻辑,该逻辑极其容易扩展到其他模型,包括EfficientNetV1的系列模型。

程序model.py编码优雅,面向对象的结构化设计,层层递进,值得学习和模仿。

程序设计细节、运行测试结果及详细解析参见本节微课视频。