多媒体内容形貌天外行艺

2019.07.10

投稿:杨秀丽部分:通讯与信息工程学院浏览次数:

活动信息

时间: 2019年07月11日 09:30

所在: 校本部东区12号楼B525聚会室

行健讲坛学术讲座

第403期

时间:     2019年7月11日(周四)上午9:30               

所在:     校本部东区12号楼B525聚会室

讲座:   多媒体内容形貌天外行艺(Learning to Caption Multimedia)

演讲者: 姚霆

演讲者简介:姚霆,,博士,,京东AI研究院算法科学家,,认真向导视觉与多媒体实验室的视觉内容剖析团队,,聚焦该领域的基础研究和手艺立异。。加入京东之前,,姚霆博士任职微软亚洲研究院研究员,,主要研究领域为大规模多媒体剖析与检索和盘算机视觉,,在包括如下的这些CVPR/ICCV/SIGIR/ACM MM/TIP/TMM等顶级聚会/期刊上已揭晓论文60余篇。。因在大规模多媒体剖析、搜索和明确领域的突出孝顺,,姚博士在2015年被授予SIGMM优异博士论文奖(SIGMM OUTSTANDING PH.D. THESIS AWARD)。。他是P3D RESNET,,LSTM-E,,LSTM-A的作者和MSR-VTT数据集的首创人,,曾向导团队获得ACTIVITYNET大规模视频内容明确竞赛视频行动识别使命冠军(2019)和视频事务形貌使命冠军(2017),,VISDA视觉领域自顺应竞赛跨域图像识别使命冠军(2018),,跨域图像检测使命冠军(2018)和跨域图像语义支解使命冠军(2017),,COCO图像形貌自动天生竞赛冠军(2017)。。

讲座摘要:自动天生多媒体内容(图像和视频)的自然语言形貌是盘算机视觉领域中一项非 ;;;;;;镜氖姑。。然而,,鉴于真实场景下图像和视频的重大性,,该使命具有很强的挑战性。。现在一个较量通用的研究思绪是探寻怎样使用卷积神经网络(CNN)的编码器来对多媒体内容举行深条理明确,,再基于递归神经网络(RNN)的解码器天生相对应的自然语言形貌。。本次分享则主要先容这一手艺蹊径的最新希望和对应的机缘和挑战,,并简介其中较为立异的要领。。别的,,我们还将讨论多媒体内容形貌领域的生长偏向以及在未来可能带来重大希望的突破点。。

约请者:8188cc威尼斯通讯与信息工程学院 曾丹教授!

接待宽大西席和学生加入!


【网站地图】【sitemap】