刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习-慧聪商情网

本篇文章2834字，读完约7分钟

雷锋。(公开号码:雷锋。微软亚洲研究院(msra)的刘铁燕团队最近在arxiv上上传了一篇题为“双重监督学习”的论文。据了解，这份文件已被将于今年8月举行的国际海事协商会议接受。研究表明，双监督学习的机器学习范式可以在机器双语翻译、图像分类与生成、情感分析与分析三个任务上显著改进原模型。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

另一方面，去年，微软亚洲研究院发表了一篇名为《机器翻译的双重学习》的论文，作者是雷锋。com还邀请了该论文的作者之一秦涛博士详细分享(微软亚洲研究院秦涛:对称美的双重学习，秦涛博士也是今年新论文的作者之一)。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

秦涛博士拜访了雷锋。创建一个开放类。那么，今年nips2016论文的“双重学习”和icml2017论文的“双重监督学习”有什么相同点和不同点？对于没有接触过双重学习的读者来说，双重学习是一种什么样的范式？在这篇文章中，雷科技评论将首先介绍和回顾双重监督学习，然后解释双重监督学习的新特点。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

nips2016论文“双重学习”中引入的新范式

在人工智能开发面临的数据、时间、解释和协作等诸多挑战中，双重学习主要是为了解决依赖大量数据的问题。与利用数据相似性的标签传播、多任务学习和迁移学习相比，双重学习利用了人工智能任务中自然出现的对称性。例如:

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

机器翻译具有英汉翻译和汉英翻译的对称性；

语音处理需要语音到文本(语音识别)和文本转换到语音(语音合成)；

图像理解、图像字幕和图像生成是一个对称的过程。

对话任务、问题回答和问题生成；

搜索引擎、查询-文档匹配和查询/关键词建议服务

如上所述，这些任务在过去已经被独立训练过，并且它们只能通过使用大量的标记数据来训练。然后，如果一个英语句子被翻译成英语，然后从汉语翻译成英语，这是非常相似的原始句子，可以认为两个译者“英汉”和“汉英”表现良好；所用的句子也可以是无标记的。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

nips2016双重学习论文的模型图显示为双重学习的模型图。主任务F将无标记英语句子X翻译成汉语Y，双任务G将汉语Y翻译回汉语X。该模型从过程中得到两个反馈，其中一部分来自理解汉语的中介，并评估汉语Y的翻译质量；另一个反馈来自说英语的代理。比较X和X以获得反馈。这样，在一个过程完成后，模型可以得到完整的反馈。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

通过对nips2016双重学习论文的策略梯度图的反馈，强化学习的一些方法可以直接用于训练和更新模型F和G。本文使用的方法是策略梯度，它可以找到主任务F和双重任务G之间的梯度，增加良好行为的概率，减少不良行为的概率。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

另一方面，它是一种无监督的学习方法，因为只有一个输入，并且两个代理生成它们自己的反馈，所以不需要将翻译结果与对应于输入的标签进行比较。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

双重学习的效果是什么？在使用1200万个双语标注句子的英法翻译实验中，与2016年效果最好的基于深层神经网络的神经机器翻译算法相比，双重学习只需要10%的双语数据，就可以用所有数据达到nmt训练的准确率。训练所需的数据量可以减少90%，达到了预期的效果。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

根据秦涛博士的观点，双重学习的问题在于很难冷启动，也就是说，在能够使用双重学习进行联合反馈训练之前，主任务和双重任务的两个代理应该首先被训练，否则，模型将非常缓慢地收敛。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

Icml2017新论文——双重监督学习

既然上述无监督的双重学习有这么好的结果，它应该如何应用于监督学习？

以翻译为例，在监督学习中，当你知道主任务F应该被正确翻译为Y时，你可以用最大似然准则更新F，这样Y的概率越大越好。

对于双重监督学习，主任务F和双重任务G都必须有正确的翻译Y和X，这样才有联合概率p( x，Y)。如果F和G的更新是同步的，则F和G可以分别计算联合概率，但是如果F和G根据监督学习分别训练，则分别计算的联合概率不能保证相同。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

为了解决这个问题，在双重监督学习中加入了正则化项。

icml2017双监督学习试卷模型示意图。这个正则化项的意义是最小化f得到正确结果，y和g得到正确结果的两个概率之间的差异，从而通过结构的对称性加强监督学习过程，让两个对称任务一起学习。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

在学习过程中优化了三个损失函数:

1)通过主任务f从标记的输入x获得y的对数似然性

2)通过双重任务g从双重输入y中获得x的对数似然性

3)上述两个对数似然之间的区别是正则化项。

这与支持向量机的正则项不同，支持向量机的正则项与模型有关，与数据无关。然而，双监督学习中讨论的正则化图像也与数据相关。有了这样的正则化项，每个训练数据都可以参与正则化项，主任务和双任务两种模型可以相互影响。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

根据优化过程的特点，本文还指出了双监督学习的适用条件:

1)它们之间有两个对称的任务

2)主任务和双重任务都是可训练的

3)可以得到模型理想结果的经验概率

如本文开头所述，许多与图像、文本和声音相关的任务都满足这些条件。

双重监督学习的效果本文测试了双重监督学习在机器翻译、图像分类和情感分析三个任务中的效果，证明了双重监督学习可以带来显著的改进。

机器翻译

本文首先分别训练主任务和双重任务模型，然后采用双重监督学习方法进行联合训练。与目前翻译效果最好的nmt和mrt神经网络机器翻译相比，bleu评分有了进一步的提高。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

图像分类

与机器翻译不同，图像分类和图像生成过程中存在信息损失。这导致目前图像生成效果不理想，难以改善。根据双监督学习能够减小两个任务之间的概率差异的特点，我们可以期望双监督学习能够更好地从标签中恢复图像。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

性能比较中使用的基准模型是pixelcnn++版。不足为奇的是，基于cifar-10的bpd分数从2.94提高到2.93，即使只有0.01提高，也是非常罕见的。实际生成的图像对如下:

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

每个水平图像都是由同一类别标签生成的结果；左边五个来自基准模型，右边五个来自双重监督学习模型。图像质量有明显改善，尤其是第3、4和6行中的鸟、猫和狗。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

经过双监督学习训练后，不同复杂度的resnet-32和resnet-110的生成和识别效果都得到了提高。

情感分析

分析句子的积极/消极情绪，或者根据给定的积极/消极情绪逆向生成句子，这个过程中的信息损失非常严重，只留下1比特的信息。本文认为句子情感分析的结果略有改善，这是原因之一。Lstm被选为基准模型。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

然而，在逆向句子生成方面，双监督学习模式表现出很强的表现力，简单短句的使用变少，所选单词、短语和句型表达的情感更强、更具体。

在后续研究目标论文的最后，以上例子已经可以说明双重监督学习的促进作用，后续将尝试更多的任务(如文本/语音转换)。同时，如何将无标记双重学习与双重监督学习相结合，利用无标记数据继续提高模型性能，并尝试将双重监督学习与双重推理相结合，利用结构对称性增强训练和推理过程，也是刘铁燕团队未来的研究方向。

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

论文题目:arxiv/abs/1707.00415，作者:雷

秦涛微软亚洲研究院:双重学习的对称美|公开课总结

标题：刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

地址：http://www.hcsbodzyz.com/hcxw/9924.html

刘铁岩团队ICML论文提出机器学习的新范式：对偶监督学习

慧聪商情网推荐资讯

前找钢网CTO朱文迪：B2B的市场我很看好

关注睡眠健康，脉脉联合丁香医生推出职人睡眠大调查

百度技术委员会主席吴华：小度机器人背后的技术

坚果智能影院实体布局再下一城肇庆旗舰店火热开业

一部手机畅行全国！华为上线京津冀互联互通卡，0元开卡

8.24电商晚报：饿了么正式宣布收购百度外卖

手机变身奢侈品 国产手机首推私人定制服务

米家车载空气净化器升级版发布：增加USB车充

前置2000万像素为自拍而生海信H10即将发布

胎儿和婴儿期微量元素摄入异常会增加自闭症风险

慧聪商情网热文榜

徐州品圣砂石分离机为混凝土行业环保化转型注入活力

【时讯】家长发现孩子看“黄书”“黄碟”如何办？

【时讯】高考各地考点地图查询

【时讯】北京大学医学部2019年各地高考录取分数线

【时讯】北京化工大学2019年自主招生简章

【时讯】浙江教育厅发文要求加强毕业论文过程监管

【时讯】睡在我对面的兄弟：胡先煦自曝与易烊千玺成舍友

【时讯】2018艺术升对于艺考生的重要性

【时讯】学霸为“女生不适合理科”正名不要自设障碍

【时讯】海淀区发布2019年幼儿园名录其中民办园为55所

慧聪商情网最新发布

慧聪商情网介绍