大皖新闻讯 几天前,科大讯飞牵头完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖一等奖。而在6月27日下午的“讯飞星火大模型V4.0发布会”上,科大讯飞展现了星火语音大模型的新突破,即实现74个语种方言“自由对话”,破解强干扰场景下的语音识别难题。
74个语种方言“自由对话”
一会是合肥话,一会是上海话,一会是粤语,一会是英语,一会是法语……现场,工作人员演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。当天,星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。
一个人在安静的环境中说话,容易被语音识别,好几个人一起在嘈杂的氛围中对话,就很难被机器“听清”,这是全球智能语音领域面对的共同难题。针对强干扰场景下的语音识别难题,科大讯飞也突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景,也能实现86%的语音识别准确率。
现场,三位讯飞研究院的研究员现场实测了在噪音场景下,同时混叠着说话。此时,正常人耳已难以听清,但讯飞星火的多模态能力不但实现了三人重叠语音的角色分离,还能实时转写出每个人说的话。“未来基于多模态的声音识别技术,将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。”科大讯飞董事长刘庆峰说。
在刘庆峰看来,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此,万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。
目前,智能语音技术也用于智能网联汽车中,为安徽首位产业贡献力量。“在大模型加持下,星火汽车智能座舱全新升级,不但具备了多语种多方言的‘自由交互’,还具备多情感多模态的超拟人交互,让人车交互更有温度。”刘庆峰说,目前讯飞语音交互产品国内市占率稳居第一,星火大模型为一汽、奇瑞、广汽、江淮、长城等车企的众多车型,赋予了高度智能的交互体验,同时广泛出口到世界各地。
8个国际主流测试集测评第一
智能语音的新成果,得益于星火大模型的再次突破。
当天,科大讯飞发布了讯飞星火大模型V4.0及相关落地应用。基于全国首个国产万卡算力集群“飞星一号”,讯飞星火V4.0七大核心能力全面提升,全面对标GPT-4 Turbo,并实现在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面的整体超越。
刘庆峰说,讯飞星火V4.0在图文识别能力上进一步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。此外,星火长文本能力也全新升级,并针对长文档知识问答的幻觉问题,业界首发溯源功能。
外部权威测试集也体现出讯飞星火V4.0的领先性。在国内外12项大模型主流测试集中,讯飞星火在8个测试集中排名第一,超越GPT-4 Turbo等国际大模型,国内大模型全面领先。
现场,刘庆峰展示了讯飞星火V4.0在复杂指令、复杂逻辑推理、空间推理、高中数学等方面的效果,星火“智商”再度进化。以空间推理为例,“Bob在客厅里。他拿着一个杯子走到厨房。他把球放进杯子里,然后拿着杯子走到卧室。他把杯子倒过来,然后走到花园。他把杯子放在花园里,然后走到车库。问题:球在什么地方?”讯飞星火可以基于空间和常识推断出球在卧室的地面上,这些能力的进步对于以后的具身智能、家庭机器人都具有意义。
讯飞星火APP还发布“个人空间”,用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。科大讯飞研究院院长刘聪现场演示“个人空间”效果,当他上传了女儿写的小作文并选取符合女儿风格的AI人设标签后,星火生成了一篇活泼、可爱更个性化的文章;当他上传了讯飞翻译机的产品海报、用户短视频、相关录音,星火也可以根据这些多模态信息生成产品培训文档,还可以对生成的信息进行多模态溯源。
羚羊能源大模型发布
当天,羚羊工业互联网平台是安徽省打造的工业互联网综合服务平台。当前,能源革命新浪潮涌起,大模型如何助力清洁能源发展?当天,在通用大模型的底座能力的助力下,羚羊能源大模型也正式发布。
据了解,羚羊能源大模型拥有设备运检、电力问数、电力营销客服、辅助电力交易、新能源功率预测、安全生产等6大“大模型+能源”场景应用。其中,“设备运检”系统是电力场站的“数字化运营大脑”,可用于光伏等领域,“不仅具备精准事故研判能力,还具备智能决策生成能力。”
比如,供电公司台区经理在处理上门问题前,需要登录不同的系统获取商户相关的信息,“电力问数”利用羚羊能源大模型,接入不同业务系统数据后,可以让台区经理通过自然语言的问答,随时随地获数据,预计数据获取时间可以节约60%。
据了解,目前羚羊已经和国家能源集团、中国石油等展开相关合作,通过共建能源大模型,推动AI与能源的双向赋能,助力中国能源行业高质量发展。
大皖新闻记者 项磊 实习生 唐雪玲
编辑 张思平