津南数字制造算法挑战赛复盘(一)—— 对决赛答辩队伍的观摩学习



  • 在这里对比赛做一个详细的系列复盘,一个人的心智模型会决定一个人未来可能拥有的景观,作为一个学习者,我一直都在路上。
    注:津南数字制造算法挑战赛链接 决赛答辩录像链接

    队伍一

    使用unet网络

    • 算法整体框架
      0_1558100051238_1557987250291.png
    • 输入大小影响得分
      0_1558100106223_1557987278394.png
    • 重点改进
      • 原始unet使用U型结构、运用跳级连接,结合了高层和低层语义信息,可以很精细地回归图像边缘,在医疗图像中应用广泛。但本次比赛图像数据比较复杂,对复杂场景的前端特征提取能力较差。故优化特征提取模块,SE-ResNetXt-50,量化评估输入特征图。
      • 传统语义分割每个像素点只对应一个标签,但比赛中重叠部分的像素点,会对应多标签。将交叉熵损失和softmax的回归方式,替换成dce loss,做成多个二分类的问题,回归五个mask,每个mask代表当前类/非当前类,并加入前景类/非前景类,对五个mask结果修正
      • 2016商汤psp-net,不同大小的卷积核卷积同一个特征图,concat输出,可理解为对特征图进行多尺度操作,GlobalAvgPooling可接受多尺度操作,替换全连接层,以减少网络参数。
      • loss
        0_1558100339020_1557988321036.png
        注:dice为xi输出与yi真实标签的交集;bce为多个二分类
        0_1558100502929_1557988571795.png
        黄色区域占全图比重很小,乘3以平衡正负样本。未计算第三幅图中空隙带来的loss,实践表明这样可以使网络拟合更好。
    • 数据增强
      翻转+旋转+拼接(拼接idea很重要)
    • 扩展想法
      0_1558100650015_1557989475134.png

    队伍二

    采用了可形变的空间金字塔感受野组合,基于Mask RCNN-FPN做出了改进。

    • 由于限制品以不规则的形状出现,利用形变卷积有着更强的针对性;增加Mask分支的输入尺度同时直接增加感受野,可以提升分割精度;跨尺度多感受野级联,并通过DCN解决空洞卷积带来的不连续问题。

    0_1558106773486_1557989695002.png
    0_1558106781261_1557989757338.png
    0_1558106787046_1557989867443.png
    0_1558106793299_1557989937444.png
    0_1558106807987_1557990024695.png
    0_1558106872440_1557990060465.png

    • 考虑到是否包含限制品的二分类准确度很高,加入Context Roi将全局特征叠加到每一个建议框,即把全图当成一个box;加入cascade rcnn提高bbox精度。
      0_1558107431314_d15f3a11-da9e-4f36-a0a2-47509eb9c969-image.png
    • 训练增强,对正负样本的处理,贴图+将二值mask处理为连续mask(高斯滤波)
      0_1558107852148_583f6511-d838-4bdc-b8e6-f53812d76d9b-image.png
    • 处理样本不均衡
      0_1558108045105_3b3ab399-a956-4f28-8d68-422b47e1087a-image.png
    • 待优化
      0_1558108416908_515c67a2-a9d2-4b51-82dc-e4570b1860f0-image.png

    队伍三(hhh太搞笑了这个讲解者,接地气)

    • 对数据增强处理地非常细致,第一步骤,扩增8倍数据,特别地加入45度旋转;
      0_1558108890818_90e90a96-d250-472f-864b-aa3a9a5b07d5-image.png
      第二部分,根据x光的频率分布(!!),频率扩展,将频率峰值移到中间再拉伸;
      0_1558108876551_8a63c5e7-44f9-4b41-be99-359bbf4ff016-image.png
      第三部分,给正常图片加标签
      0_1558109304181_c2d44f38-d3e4-4f54-bda3-0c3fd3017e82-image.png
    • RoiAlign 、FPN ,FPN是处理小物体的必杀器,低层位置精度很高,信息不多,高层相反,用resnet增强底层信息。
      0_1558109640607_2748bb59-6701-4a69-a446-3767fb270afb-image.png
    • 三个检测器阈值
      0_1558109848842_09573def-7328-46c4-9a9a-db460d767e12-image.png
    • 多尺度检测

    队伍四(挖坑要填队hhh )

    • 贴图,输入尺寸统一化的参数确定,HTC(最新模型)+cascade mask rcnn。
      0_1558111002297_86edc76c-700e-44e2-9005-9494d995f48e-image.png

    队伍五(就一个人,许元博士DAI-labor,成员简介把电脑写进去了噗)

    • 对模型选取整体分析
      unet相比mask rcnn,可直接实现分辨率1:1输出,端到端的训练输出。
      0_1558111270815_68f5d559-3c94-4c9e-888c-8850903deeb6-image.png
    • high lever clone,拼成高层信息输出,而且!输出mask二值图以及边缘信息
      0_1558111476416_f42b2f40-3d63-4f64-8e4e-998badcaf275-image.png
    • 数据增强 x光应具有透视性
      0_1558111948367_08f91be6-8575-45a0-95e5-4ffbf62a6fb5-image.png
    • 128128 切换到 256256到512*512微调技巧
      0_1558112028305_470b1063-08e3-4730-aeaf-a66fb5d4757e-image.png
    • 如何选取最优?比起调整学习率的大小的繁琐性,其根据不同评估指标选取出几个最优模型。
    • 半监督学习,利用预测出的结果加入训练
      0_1558112453295_01c43486-ac69-41a9-9bc3-40ade84befb4-image.png

    队伍六

    • 数据分析
      0_1558112744831_7ab2684a-a360-4551-9079-ee48cde59d35-image.png
    • attention module
      0_1558112812098_448d54a8-8e36-4b7c-8882-6223d984f231-image.png

    队伍七

    • 学习率调节,之前人脸识别分享会涛涛的learning rate scheduler
      0_1558113066552_c156a372-03b8-4476-9704-6e036ef5e060-image.png
    • 投票机制
      0_1558113191778_f3f08c8e-8c31-46ae-bfad-ffa07d545808-image.png

 

Copyright © 2018 bbs.dian.org.cn All rights reserved.

与 Dian 的连接断开,我们正在尝试重连,请耐心等待