omniture

浪潮AI加速中国顶尖语言声学研究 | 美通社

2020-09-03 11:58

浪潮AI服务器AGX-5

在中国科学院语言声学与内容理解重点实验室,浪潮AGX-5支撑着数十项以音频为核心的人工智能重大项目研究。相比原AI集群方案,AGX-5以强大的单机训练性能,将人工智能模型的整体训练速度提升了2-3倍。

该实验室是我国语言声学领域最大的国立研究机构。经过近20年发展,实验室从最初的6人发展成为包含51名固定人员、总人数200余人的科研力量,被誉为“中国智能语音人才的摇篮”。

实验室布局于音频听感知、语音识别和面向声学应用的大数据分析等研究方向,全方位覆盖了以音频为核心的媒体内容理解研究内容。目前,实验室承担着多项国家级和国际合作研究项目,如中科院战略性先导专项“面向感知中国的新一代信息技术”媒体内容项目、中日韩前瞻计划A3项目“面向下一代互联网的超临场感声通信应用研究”、自然科学基金杰青项目“面向语音处理的言语声学数字化建模”、基金重大研究计划重点支持项目“多人多方对话中的语音分离、内容分析与理解”、声学所率先行动计划项目“以音频驱动的媒体深度理解关键技术研究“等等,科研任务十分繁重。

目前,实验室的部分研究成果已在多个领域得到应用:在智能终端领域,推出了智能电视交互系统;在互联网领域,先后跟百度、腾讯和阿里巴巴进行了卓有成效的合作,推出了语音输入、语音和音乐检索、语音客服等应用;在广电领域,实验室的连续语音识别引擎成为该行业主流企业的标配,被索贝、大洋集成到各自的媒资管理系统和多媒体信息检索系统,同时也被天脉聚源在其为电视台提供新闻素材整理服务的云平台中采用。

(美通社,2020年9月2日北京)