中安在线、中安***客户端讯在教室,老师通过遥控器和智能黑板直接对话;在家里,空调、电视机等家电早已实现语音掌握;驾车行驶在路上,一句指令就能操控汽车;会议室里,多人发言都能急速被清晰录音并转写成笔墨、天生会议纪要……近年来,智能语音正润物细无声地改变着人们的生活,也创造了巨大的市场代价。

打造“多语种”咭片 科大年夜讯飞实现智能语音自立立异生态_语音_科年夜 智能问答

据国际数据公司IDC剖析,估量到2030年,环球智能语音做事市场规模将达约731.6亿美元,复合增长率27%。
如此弘大的市场、如此关键的技能,中国如何不被“卡脖子”?以科大讯飞为代表的中国科技企业给出答案:自主创新。

中国的语音技能要节制在中国人自己手里

作为新一代信息技能和人工智能家当的主要组成部分,智能语音不断实现关键技能打破,精度、速率与智能化水平正在逐年提升。
在实际运用环境的匹配度方面,干系技能产品已经可以知足“稠浊语种”“繁芜环境”“多人交互”等更为高真个任务需求。
而在20世纪90年代,中国的智能语音技能和语音家当还是外国人的天下,微软、谷歌、英特尔等企业纷纭在中国设研究院。
如今的人工智能龙头企业科大讯飞正是在这种情形下出身。

据理解,科大讯飞创始人刘庆峰当时还是中国科学技能大学的学生,在导师王仁华的支持下,他和几位同学立志“中文语音技能要由中国人做到天下最好,中文语音家当要节制在中国人自己手上”,于是创立了科大讯飞。

经由多年研究和实践,科大讯飞不仅将中文语音技能做到最好,也将多语种技能做到环球领先。
语音识别的准确率达到98%,多人会议场景的说话人分离和识别的准确率达到95%。
2021年,科大讯飞在美国国家标准与技能研究院NIST发起的国际低资源多语种语音识别竞赛OpenASR中,得到全部受限赛道的15个语种冠军及7个语种非受限赛道冠军。

科大讯飞的多语种技能爆发,是在2019年。
当年10月8日,美国商务部溘然宣告把科大讯飞、海康威视等8家中国人工智能企业列入实体名单。
当时,科大讯飞已储备了11种语音的多语种技能。
被列入实体清单之后,科大讯飞启动紧急预案,迅速攻关,进行40多种语种的研发。
当时,华为也在被制裁,没有多语种技能,华为手机等设备在超过75个国家/地区的发卖都受到极大影响。
华为终端部门从环球66个供应商中经由细致甄选,终极选择科大讯飞作为多语种供应商,担保了2020年3月的外洋产品发布。

如今,在中国智能语音市场,科大讯飞的市场霸占率多年保持第一。
以大热的智能汽车行业为例,2023年,中国汽车出口量超过日本,跃居环球第一,而出海十强企业中,有8家都在和科大讯飞互助。
科大讯飞多语种技能已经可以覆盖环球60多个语种,讯飞智能车载语音系统覆盖23个紧张语种,搭载车型已销往亚洲、欧洲、南美等地的60多个国家和地区。

语音大模型,要建立在自主可控的国产平台上

2006—2019年,连续十四年荣获国际语音合成大赛冠军;2016—2023年,连续4届得到国际多通道语音分离和识别比赛CHiME冠军;2021—2023年,连续三年得到国际语音翻译比赛IWSLT冠军……

作为中国人工智能“国家队”,科大讯飞代表中国取得了多项主要标志性成果,逐渐构建起独立的语音自主知识产权技能体系。

如今,大模型的涌现发展给语音技能带来了新的提高动力,结合大措辞模型更精准的语义理解和更风雅的描述能力,语音合成表现力、永劫的语音识别等语音各种任务也能快速打破效果的上限。

今年1月30日,科大讯飞发布基于首个全国产算力演习的讯飞星火V3.5,正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3。
4月26日,讯飞星火大模型V3.5再次更新,发布业界首个支持长文本、长图文以及长语音的大模型产品。

其长语音功能,可以实现会议录音、学习***等的一键研读,实现音***场景的高效知识获取。
新版大模型将科大讯飞国际领先的语音识别和翻译技能结合起来,让英文资料也能像纯笔墨内容一样进行快速获取和学习。

如今,一个自主可控的多语种智能语音技能及环球家当生态正在构建。
科大讯飞的技能算法全部自研,目前,已建成5个国产化集群,语音合成、识别、翻译、交互等国产化能力日做事8.73亿次。
2023年,讯飞与华为联合攻关大模型国产化算力底座核心难题,培植首个全国产算力平台“飞星一号”,补充了国产超大模型演习平台空缺。

科大讯飞董事长刘庆峰表示:“我们应正视差距,聚焦自主创新的底座大模型‘主沙场’,从国家层面聚焦资源加快追赶,同时系统性构建通用人工智能生态和运用,打造综合上风。
”( 张毅璞)

本文来自【中安在线】,仅代表作者不雅观点。
全国党媒信息公共平台供应信息发布传播做事。

ID:jrtt