当前位置: 主页 > 新闻资讯 > 其他新闻

打破方言壁垒,赋能老年群体智能生活

发布时间:2025-05-28 16:52   浏览次数:次   作者:小编

中国电信“星辰超多方言语音识别大模型”:打破方言壁垒,赋能老年群体智能生活

中国电信人工智能研究院(TeleAI)近期发布的星辰超多方言语音识别大模型,是国内首个支持30种方言自由混说交互的语音识别技术。这一技术的落地不仅填补了方言语音交互的行业空白,更通过降低老年人使用智能设备的门槛,助力消除数字鸿沟。

一、技术突破:多方言混说交互的底层创新

覆盖广度与精度提升

模型支持识别包括粤语、上海话、四川话、温州话等30种方言(后续升级至40种,新增英语支持),通过超30万小时高质量方言数据库训练,实现单一模型对混合方言的精准解析。用户无需切换普通话,自然表达即可被准确识别。

核心技术创新

“蒸馏+膨胀”联合训练算法:解决超大规模数据集(如多场景方言语音)下的预训练坍缩问题,确保1B参数、80层模型的稳定训练。

离散语音表征建模:首创“语音→token→文本”范式,将推理时的语音传输比特率降低数十倍,提升交互效率。

性能验证

在KeSpeech多方言数据集任务中,模型以92.97%字准确率刷新纪录,并在国际赛事INTERSPEECH2024中斩获语音识别赛道冠军。

二、消除老年群体智能设备使用障碍

解决方言沟通痛点

全国约20%的人口仍以方言为主要交流工具,尤其是老年群体。传统智能客服因无法识别方言导致服务低效,而星辰大模型通过“秒懂”方言,日均处理200万通电话,极大提升服务触达率。

应用场景拓展

智能客服:已在福建、江西、内蒙古等地的中国电信万号客服试点,实现自然流畅的方言交互。

政务服务:多地12345平台接入模型,赋能客服高效理解市民需求。

数字人交互:在贵州数博会等场景中,支持数字人实现中英文切换及方言主持。

普惠性设计

通过开源代码与训练框架,降低开发门槛,推动更多适老化应用诞生。

三、社会价值:文化保护与数字包容

方言文化传承

模型构建的方言数据库为语言学研究提供资源,AI技术助力系统化记录濒危方言。

弥合数字鸿沟

针对“老少边穷”地区及老年用户,模型通过降低技术使用门槛,确保其享受智能化服务。

四、未来规划:迈向全国方言全覆盖

中国电信计划将模型扩展至333个地市方言及少数民族语言,并持续优化算法以提升低资源方言识别能力。这一目标将推动方言交互技术从“可用”向“普适”进化。