科大讯飞获国家科学技术进步奖一等奖-新华网
新华网 > 安徽 > 正文
2024 06/24 20:47:58
来源:新华网

科大讯飞获国家科学技术进步奖一等奖

字体:

  在6月24日召开的国家科学技术奖励大会上,科大讯飞联合中国科大、清华大学、华为公司等研发的“多语种智能语音关键技术及产业化项目”获得2023年度国家科学技术进步奖一等奖。

  语音识别研究中最具挑战的是远场、噪声、多人语音混叠等现象导致的“鸡尾酒会”效应典型难题。科大讯飞提出了多通道语音信号时空分离建模方法和多维度语音属性解耦表征方法,实现语音信号中内容、噪声等高度耦合的多维属性特征解耦,使得复杂场景下语音识别准确率得到重大突破。

  科大讯飞设计了全新的多语种通用音素体系和基本语言单元,实现多语种统一音素韵律体系的构建,又通过基于元学习的多语种预训练和基于语族分组的多语种共享建模——通俗地说,就是将不同的小语种进行分类,找到同类语种的共同规律,进行分析建模和训练,显著提升了小语种语音系统性能。

  针对复杂应用场景下语音交互、语音翻译面临着深层次语义理解困难、专业性不足等问题,科大讯飞提出语音语义互增强的鲁棒口语理解技术,有效提升语音交互、语音翻译等复杂场景的语义理解准确率;提出多源知识增强的可信文本生成技术,提升专有词汇及领域知识引用的准确率。

  科大讯飞提出硬件亲和的变长输入算子融合和联合统一量化感知训练技术,通过软硬件协同优化的动态张量算子自动融合方法,实现对语音等变长输入的训练性能,优化达到国际主流芯片同等水平;通过多硬件联合的量化计算模拟,达到模型单次训练后可在不同硬件平台上一键部署。

  据了解,2017年开始承建的智能语音国家新一代人工智能开放创新平台,已聚集平台开发者数700.7万,终端设备数40.5亿;构建全球多语种技术生态,目前平台聚集海外开发者数超过40万。

  通用人工智能时代,科大讯飞多语种智能语音关键技术中的创新和大模型技术相互补充、相互促进。语音属性解耦、语音信号时空分离等技术突破,可以将语音信号经过编码后输入到大语言模型,显著提升语音大模型的效果。今年1月30日,科大讯飞基于上述技术融合路线发布了星火语音大模型。4月26日,科大讯飞又首发多情感超拟人合成和一句话声音复刻能力,使机器具备更加丰富的超拟人情绪感知和表达。6月27日,讯飞星火V4.0也将正式发布,语音大模型迎来全新升级。

  十年磨一剑,科大讯飞创业25年来第三次获得国家科技进步奖,对于科大讯飞而言,这是一个新的开始。未来,在科大讯飞国际领先的智能语音技术基础之上,讯飞星火将进一步向着“解放生产力、释放想象力,为每个企业和每个人打造专属AI助手”的更大愿景,持续攀登、持续进步,用人工智能建设美好世界。(叶礼凡)

【纠错】 【责任编辑:李东标】