本篇文章1075字,读完约3分钟

7月9日,由ccf主办、雷锋主持的第二届ccf-GAIR全球人工智能与机器人峰会。com和香港中文大学进入第三天。在CCTV+特别会议的开幕式上,微软亚洲研究院的高级研究员梅涛带来了一个名为“视频内容3C:创造、监管、消费”的分享,即视频的创造、加工和消费。

微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

你为什么要谈论视频的内容?他提到了以下几点。

首先,视频比图像更深入,视频是一件容易的事情,但是研究视频是一个巨大的挑战,也是一个巨大的荣誉;其次,我们已经看到了在视觉领域的进步,比如人脸和安全,而视频领域是相对较新的。第三,他十年前做过视频研究。每个人都说视频是下一个出口。今天看来,这种说法也是正确的。

微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

解决视觉问题基本上有三个步骤:

首先,理解一些东西,比如识别一个表,并理解这里的一些行;第二,人为设计一些特征来描述;第三,设计一些分类器。

目前,深度学习的错误率正在下降,图像分类已经从最早的8层发展到20层,现在可以达到152层。

视频创作、处理和消费:

创造

这里有一个基本概念。视频的生成是将视频一个接一个地切割成镜头,这些镜头可以被看作是一个接一个的断码,然后每一个镜头都被编译成一个故事,这个故事可以用几种语言写成一个故事。每个镜头都可以分成子镜头,然后有一个数据。

微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

固化

有视频后要做的事情是给视频加标签。到目前为止,可以标记1000个静态标签,这些静态标签可以设置到内容中。

此外,我们可以分析动作并给你一个视频。我们能造一个句子来描述这个视频吗?我们以前说这个视频是一种舞蹈,但是现在我们可以告诉你它是一种什么样的舞蹈。信件可以实时生成并自动评估。例如,微软萧冰,当你上传一个视频到萧冰,它会称赞你。萧冰也能写诗。

微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

您也可以编辑视频,添加滤镜,或转换风格,使自然视频非常卡通。视频中的角色可以被分割并放到另一个虚拟场景中。你可以想象,当两个人在不同的地方相爱时,我们可以给他一个可以聊天的房间。

微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

此外,你还可以提供服务,使图像和视频更好,这是机器的效果。通过人工处理,视频可以变得更加时尚。

消费

梅涛提到,视频广告有两个问题需要解决:第一个问题是广告在视频中的位置;第二个问题是选择什么样的广告,以及这个广告是否与你的插入点的信息相关,这使得用户的接受度更高。

微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

他们的解决方案分解视频,并采取一系列行动来满足广告商或不同用户的需求。

最后,梅涛总结说,在研究人员看来,人工智能、深度学习和登陆还有很长的路要走,我们应该脚踏实地地一个一个地实施。

具体发言请参见雷锋的后续报道。雷锋网(公开号码:雷锋网)原件。

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

标题:微软亚洲研究院资深研究员梅涛:原来视频可以这么玩了! | CCF-GAIR 2017

地址:http://www.hcsbodzyz.com/hcxw/9967.html