ICLR2020|华为诺亚:巧妙思想,NAS与「对抗」结合,速率提高11倍
原标题:ICLR 2020 | 华为诺亚:巧妙思想,NAS与「对抗」结合,速率提高11倍
作者丨dwilimeth
编辑丨Camel
本文转载自知乎专栏:AutoML随笔
今天介绍一篇 ICLR 2020 的工作 Adversarial AutoAugment。作者是来自华为的 Xinyu Zhang, Qiang Wang, Jian Zhang, Zhao Zhong。
之前的那些 NAS 做数据增强的工作,例如 AutoAugment,算法流程大致是这样的:用强化学习训练一个 policy generator ,从样本空间中采样,产生大量的 policy 。每一个 policy 会对应一个做分类任务的子网络,子网络使用这个 policy 来做数据增强,在数据集上随机初始化训练完后,测一下验证集上的准确率作为强化学习的 reward 更新 policy generator。
本文作者指出,这样做存在的不足之处:
计算开销大,policy generator 要从样本空间中产生大量的 policy,每一个 policy 都对应一个从头开始训练的子网络,更新 policy generator 还必要要等到整个网络训练完。为了给 AutoAugment 加速,有一些方法会提出一些 proxy tasks,比如说用小模型在数据集的一个小的子集上面搜。但是这样做存在一个 proxy tasks 和原始的任务之间的 gap,在 proxy tasks 上面最优不能保证在原始任务上也是最优的;
在分类子网络训练的过程中,policy 是静态、一成不变的。这样做可能也不是最优的。
针对这些不足,本文就提出了一种新的方法,policy generator 和分类网络能同时并行训练;此外,在分类网络的训练过程中,还能动态调整 policy 。这种方法和 AutoAugment 相比,在 ImageNet 数据集上的计算开销减少了12倍,训练时间缩短了11倍。
怎么做到的呢?作者引入了 GAN 里面的“对抗”思想,引入了 adversarial loss。整个网络可以看做两部分:一个是 policy generator,优化目标是生成那些让分类器的分类 loss 最大的数据增强 policy;一个是分类器,优化目标是在给定 policy 之后对应的分类 loss 最小。
具体的网络结构如下图所示,就是一个分类网络 target network,和一个生成 policy 的 policy network。
在训练的过程中,policy network 会生成 M 个不同的 policy,并把这 M 个 policy 作用于相同的数据上,得到 M 个分类 loss,并更新分类网络 target network 的权重。而这 M 个分类 loss 也会收集起来,根据 Williams的REINFORCE算法拿来更新 policy network 的权重,目的是最大化分类 loss。如此迭代进行。
加入 adversarial loss 的好处可以看做是两方面:一方面是大大减少了训练所需的时间;另一方面,可以认为policy generator 在不断产生难样本,从而能帮助分类器学到 robust features,从而学的更好。
作者也可视化了学到的 policy ,如下图。可以看出随着 epoch 数量的增加,policy generator 会倾向于产生更难的数据增强 policy,如 TranslateX, ShearY and Rotate 这些几何转换会被更多使用。
作者的这种方法需要比较大的 batch size,一般来说大的 batch size + BN 能涨点,因此直接和 AutoAugment 比较似乎不太公平。针对这一点,如 table 4 所示,作者做了大 batch size + 随机搜索的对照实验,证明自己的搜索策略的有效性。
此外,作者也证明了搜到的 policy 具有很好的迁移性能。如下表所示,用 ResNet 50 在 ImageNet 上搜到的 policy,换到其他模型、其他数据集上也能有不错的结果。
个人感觉 NAS 和 adversarial loss 结合的这个 idea 是很巧妙的,在其他任务中也能借鉴。比如说搜 loss function 的时候用 adversarial loss 或许也能有不错的结果。
更多ICLR 2020信息,将在「ICLR 2020 交流群」中进行,加群方式:添加AI研习社顶会小助手(AIyanxishe2),备注「ICLR」,邀请入群。
ICLR 2020 论文解读系列:
相关文章
-
深度资讯|电子烟迅速开启下半场,集体涌入线下渠道抢夺生路
-
怎么策划裂变活动?直接赠送几套裂变活动成案!(下)
-
60万旅客及410万联系人数据被卖?12306回应:未泄露
-
三大输入法遭全网下架!股价闪崩、负责人降级处分
-
信息爆炸时代,内容产品的进化之路
-
焦点分析|扎克伯格转向,Facebook将变得越来越像微信
-
一个招聘引发的“风暴”:天猫精灵真的要做方言保护了!
-
巴菲特减持苹果,会引发连锁反应吗?
-
红米Note7赢得开门红,但卢伟冰、王川只能开心一阵
-
开源项目的所有者去世了怎么办?
-
Facebook在深圳设立体验中心,让中国广告商了解平台上的广告运作
-
携程投入10亿的旅游复兴V计划有必要吗?
-
photoshop2022mac中文版下载教程ps2022v23.2acr14.2支持M1
-
成人美术在线教育品牌「艺伙」,新中产女性消费升级的出口
-
京东健康启动赴港IPO,计划募资20亿美金左右
-
时间管理的终极方法,是给自己搭建一个“高效系统”
-
CorelDraw2022最高版本V24.0.0301
-
iPhone13新包装被华强北破解一套封条只卖4块钱
-
亚马逊一周内两次上调员工工资:加班将获双倍报酬
-
SAPLicense:关于MRP产生的采购申请检查、与采购部的衔接处理
-
青桔单车与国网什马合作,将共同运营共享电单车业务
-
【虎嗅晚报】小米之家回应取消员工销售提成:报道失实;朋友圈新增“一月可见”
-
江浙沪+皖,长三角9城市地铁实现“一卡通”
-
如果将小米手机印度被抢拍成广告会成为小米的"代表作"吗?
-
优化平台零售价的方法(wayfair运营难题QA连载53)
-
阿里巴巴这项技术,一年省下1.5个西湖的水
-
数据也会说谎:隐藏在统计数据中的那些小把戏
-
被蔡徐坤状告背后:B站的流量与盈利之殇
-
京张铁路通车,罗永浩回应被解约,人人重返社交市场|其他大新闻