日前,OpenASR国际低资源多语种语音识别挑战赛落下帷幕,科大讯飞-中科大语音及语言信息处理国家工程实验室联合团队参加了所有15个语种受限赛道和7个语种非受限赛道,全部取得第一。
继前不久荣获多语言理解评测XTREME冠军之后,科大讯飞在多语种领域再次取得突破,在探索人机交互更自然、人人沟通无障碍的征程中又迈出了坚实的一步。
近年来,随着深度学习技术的进步,汉语、英语等大语种语音识别技术日趋成熟,并获得广泛的应用。相比之下,小语种语音识别因其语音数据资源难以获取、难以标注、难以评估、语言专家稀缺等原因,已经成为世界性的研究难题,距离实用门槛仍有较大差距。
OpenASR挑战赛更加关注小语种语音技术,探索如何使用少量的数据达到较好的效果,同时考察低资源语音识别基础算法在多个语种上的推广性。本次比赛共包含15个语种,涵盖受限赛道、受限附加赛道和非受限赛道。科大讯飞-中科大联合团队在比赛中提出了基于语音和文本统一空间表达的半监督语音识别框架(Unified Spatial Representation Semi-supervised ASR,USRS-ASR),获此佳绩也验证了该算法良好的推广性。
对于低资源语种而言,除了语音数据量较小外,其发音词典大小、语料丰富性、标注准确度都远不及常规水平。科大讯飞-中科大联合团队创新运用Flow-TTS语音合成进行训练数据扩增,并使用语音属性解耦技术保证合成语音的多样性。结果显示,使用上述无监督数据扩增方案,能够稳定、显著地提升低资源语音识别任务的效果。
为了在端到端统一框架下,充分使用少量语音数据和海量文本数据,科大讯飞-中科大联合团队提出了基于语音和文本统一空间表达的半监督语音识别框架USRS-ASR。对于海量文本数据的使用,创新设计了文本掩码语言模型任务、合成数据语音识别两个目标,两个任务联合训练以充分利用海量无监督文本;同时设计了共享语言解码模块,实现了语音和文本隐层表达空间的统一,大大缓解了低资源语种的数据稀疏问题。
不久前,工信部正式批复同意成立国家智能语音创新中心、国家高端智能化家用电器创新中心,值得注意的是,在这两家国家级创新中心依托公司的股东名单中,“科大讯飞”均在列。
据介绍,经过多年的技术积累,除了中英以外,科大讯飞还具备了 69种语言的语音识别能力,并已在新加坡、俄罗斯、印度、日本等国家部署了海外站点,为各地开发者提供语音识别、语音合成、机器翻译、图文识别等语音语言服务,所有服务均在科大讯飞开放平台开放。
科大讯飞表示,下一步将继续坚持源头核心技术创新,联合国内众多研究机构与企业,构建多语言技术的系统性创新研发生态,共同推动我国多语言技术进步与应用落地。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
- 中了,2600万!鸿雁成功拿下成都轨交30号线一期配电箱项目
- 五一植发热潮将至,中德植发专家提醒植发需谨慎
- 广州众城【上叶蓝莓叶做新生代健康茶饮料】
- 方太携手国家航天院所,以航天同源科技高能气泡洗引领厨房创新
- 望古唐网络科技BOOS联盟进军短视频带货平台
- 思之敢响,声之敢为|“敢响”2022成都时尚消费影响力盛典现场直击
- 发力蛋制品 劲仔食品小蛋圆圆鹌鹑蛋入围iSEE全球创新品牌百强榜
- 新捷途X70S颜值与实力全面升级,将于4月29日发布预售
- 奶茶行业品牌多、竞争大 冰雪时光靠什么赢得掌声?
- 千千惠生活全国上线“随心退”功能,消费者可无条件随时退款
- 杭州临平区:创建市场疫情防控“三色”预警分类管理机制 动态防控监测预警
- 海南开展防止一次性不可降解塑料制品入岛联合执法行动 对当事人立案调查
- 河北保定市场监管局创新应用信用分级分类监管 提升监管效能助力营商环境优化
- 原料新鲜 用料扎实 冰雪时光稳扎茶饮下沉市场
- 陕西省市场监管局连续三年荣获平安陕西建设先进集体 充分发挥市场监管职能优势
- 浙江杭州:西湖食品安全风险综合治理中心挂牌成立 健全机制规范运行为
- 湖北恩施州鹤峰县市场监管局开展进口水果排查专项行动 加强宣传引导
- 宁夏青铜峡市场监管局:拧紧节日食药“安全阀” 确保节日期间市场安全稳定
- 北京东城对辖区旅游客运企业开展专项联合检 营造和谐市场环境
- 安徽开展专项执法查处滥用行政权力行为 共同营造公平竞争良好社会环境
