打破方言壁垒,赋能老年群体智能生活
中国电信“星辰超多方言语音识别大模型”:打破方言壁垒,赋能老年群体智能生活
中国电信人工智能研究院(TeleAI)近期发布的星辰超多方言语音识别大模型,是国内首个支持30种方言自由混说交互的语音识别技术。这一技术的落地不仅填补了方言语音交互的行业空白,更通过降低老年人使用智能设备的门槛,助力消除数字鸿沟。
一、技术突破:多方言混说交互的底层创新
覆盖广度与精度提升
模型支持识别包括粤语、上海话、四川话、温州话等30种方言(后续升级至40种,新增英语支持),通过超30万小时高质量方言数据库训练,实现单一模型对混合方言的精准解析。用户无需切换普通话,自然表达即可被准确识别。
核心技术创新
“蒸馏+膨胀”联合训练算法:解决超大规模数据集(如多场景方言语音)下的预训练坍缩问题,确保1B参数、80层模型的稳定训练。
离散语音表征建模:首创“语音→token→文本”范式,将推理时的语音传输比特率降低数十倍,提升交互效率。
性能验证
在KeSpeech多方言数据集任务中,模型以92.97%字准确率刷新纪录,并在国际赛事INTERSPEECH2024中斩获语音识别赛道冠军。
二、消除老年群体智能设备使用障碍
解决方言沟通痛点
全国约20%的人口仍以方言为主要交流工具,尤其是老年群体。传统智能客服因无法识别方言导致服务低效,而星辰大模型通过“秒懂”方言,日均处理200万通电话,极大提升服务触达率。
应用场景拓展
智能客服:已在福建、江西、内蒙古等地的中国电信万号客服试点,实现自然流畅的方言交互。
政务服务:多地12345平台接入模型,赋能客服高效理解市民需求。
数字人交互:在贵州数博会等场景中,支持数字人实现中英文切换及方言主持。
普惠性设计
通过开源代码与训练框架,降低开发门槛,推动更多适老化应用诞生。
三、社会价值:文化保护与数字包容
方言文化传承
模型构建的方言数据库为语言学研究提供资源,AI技术助力系统化记录濒危方言。
弥合数字鸿沟
针对“老少边穷”地区及老年用户,模型通过降低技术使用门槛,确保其享受智能化服务。
四、未来规划:迈向全国方言全覆盖
中国电信计划将模型扩展至333个地市方言及少数民族语言,并持续优化算法以提升低资源方言识别能力。这一目标将推动方言交互技术从“可用”向“普适”进化。