您的位置:首页 >> 科技前沿

科技前沿

首个支持30种方言混说语音大模型亮相
来源:科技日报    发布时间:2024-06-25 10:18:29         [关闭本页]

 记者616日获悉,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。它打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持方言种类最多的语音识别大模型。

  基于几亿用户和丰富应用场景优势,中国电信人工智能研究院构建了超30种、超30万小时的高质量方言数据库,推出星辰超多方言语音识别大模型。研发团队通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别,是国内支持方言种类最多、覆盖人口最多的语音大模型。

  团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练。星辰超多方言语音识别大模型也是业内首个开源的基于离散语音表征的语音识别大模型,将推理时语音传输比特率降低数十倍。

  据悉,星辰超多方言语音识别大模型已在福建、江西、广西等地的智能客服试点应用。接入大模型后,智能客服能秒懂30种方言,日均处理约200万通电话。星辰超多方言语音识别大模型还落地多地市12345平台,为客服人员赋能,提升沟通效率,助力政务工作智能化升级。

科技日报讯 (记者崔爽)

设为首页 | 加入收藏 | 领导信箱 | 监督举报 | 咨询留言 | 征集调查 |
Copyright ©2001-2025 濮阳市科学技术局主办 濮阳市科技创新综合服务中心承办
备案编号: 豫ICP备2021001807号       政府网站标识码:4109000036
Tel:0393-6661626 科技局办公室电话:0393-6666200 传真:0393-6666200

本网原创内容可免费转载,转载时请注明“来源:濮阳市科学技术局”。转载或引用本网内容必须是目的合理、善意引用,
不得对本网内容原意进行曲解、修改,并自负版权等法律责任。对于不当转载或引用本网内容而引起的民事纷争、行政处理或其他损失,
本网不承担责任,并有追究转载方法律责任的权利。