基于深度学习的单通道音频疏散系统研究希望

2018.06.07

投稿:杨秀丽部分:通讯与信息工程学院浏览次数:

活动信息

时间: 2018年06月08日 09:30

所在: 校本部东区翔英大楼T516室

行健讲坛学术讲座

332

时间:   2018年6月8日(周五)上午9:30

所在:   校本部东区翔英大楼T516室

讲座:   基于深度学习的单通道音频疏散系统研究希望

演讲者: 罗艺 博士 哥伦比亚大学

演讲者简介:

罗艺现为哥伦比亚大学的博士生。。。。。。他的研究重点是音粕习端处置惩罚中的机械学习以及深度学习系统,,,主要从事的事情有音频疏散,,,语音增强,,,语音去混响等,,,同时还致力于构建BMIs(Brain-Machine Interfaces)以建设机械与生物系统之间的联系。。。。。。

讲座摘要:

Single-channel audio separation has been an active research area for decades. Recently, deep learning-based systems have greatly advanced the state of this problem. In most of the deep learning systems, the separation is performed in time-frequency (T-F) domain where a T-F mask is estimated for each of the target source. However, the use of T-F masks upper-bounds the system’s performance and introduces difficulties in end-to-end separation. In this talk, I will first make an overview of several deep learning approaches in T-F domain, address their main disadvantages, and introduce the recently proposed Time-domain Audio Separation Network (TasNet) which separates the mixture directly in time-domain.

约请人:通讯与信息工程学院  朱梦尧副教授

 接待宽大西席和学生加入!

【网站地图】【sitemap】