讯飞星火V3.5在合肥正式发布采用“全国产算力”平台训练_大皖新闻

大皖新闻讯 1月30日，基于首个全国产算力平台“飞星一号”训练的讯飞星火V3.5在合肥正式发布，七大核心能力全面提升，数学、语言理解、语音交互能力超GPT-4 Turbo。同时，星火语音大模型也正式发布，首批37个主流语种效果超过OpenAI Whisper V3，推动万物互联时代下客服、汽车、机器人等场景人机交互变革。

几十秒自行制作出20多页PPT

2023年10月24日，科大讯飞携手华为，宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里，基于“飞星一号”，讯飞星火启动了对标GPT-4的更大参数规模的大模型训练，带来了1月30日这场讯飞星火V3.5升级发布。

首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo，代码达到GPT-4 Turbo 96%，多模态理解达到GPT-4V 91%。

科大讯飞董事长刘庆峰、研究院院长刘聪向现场观众展示讯飞星火V3.5的能力提升。比如，搭载讯飞星火V3.5的“讯飞智文”，拥有了文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、多种模板选择、提供演讲备注功能等。刘聪现场演示了如何根据一篇word文档，使用讯飞智文制作“合肥市2024年春节旅游推广策略”PPT。在短短几十秒内，超20页内容丰富的PPT一气呵成，不仅内容合乎逻辑，生动详实，而且还自行生成了大量图片和图表。

星火语音大模型正式发布

智能语音起家的科大讯飞，语音能力一直持续走在世界前列。“大模型带来了语音技术发展的全新机会。”刘庆峰表示，让机器具备学习、推理和决策的能力，就是认知大模型要干的主要工作。“简单来说，借助大模型，我们让一段语音具备更加丰富的属性，有语种、有内容、有韵律、有音色，还有情绪。”

他介绍，星火语音大模型效果国际领先，中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3，而在多语种语音合成方面，星火语音大模型的首批40个语种拟人度超83%。“通过星火语音大模型的评测效果，科大讯飞继续保持了全球领先的水平。”

刘庆峰也介绍了搭载语音大模型的讯飞翻译机，即将上线多语种自动识别和增强式翻译两个重要功能，分别于今年1月底和3月中旬完成升级。另外，星火语音大模型还能“百搭”更多场景，“汽车、客服、家庭、陪伴机器人等场景中，带来人机交互变革。”

星火开源-13B正式发布深度适配国产算力

共享源代码、开发出更好的软件，是广大开发者、高校、企业自主研发热衷于开源的关键原因，也是共建第一开发者生态的重要途径。会上，首个基于全国产化算力平台”飞星一号”的开源大模型——星火开源-13B正式发布。

本次开源拥有130亿稠密参数（13B），包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat，开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可以基于全栈自主可控的星火优化套件，更便利地训练自己的专用大模型。

刘庆峰透露，星火开源大模型在技术上形成了差异化优势。星火开源-13B在多项知名公开评测任务中名列前茅，在文本生成、语言理解、文本改写、行业问答、机器翻译等企业典型场景中，通过对学习辅助、语言理解等领域的深入研究和优化，实用性大幅提升，在处理复杂的自然语言任务时更加得心应手。

2024年星火有三大“燃点”

展望2024年讯飞星火大模型发展，刘庆峰重点提到三个方面。

首先，一定要在通用大模型的底层能力上持续对标国际最先进水平，从算法研究包括更小的算力上做出相对更优效果。“我们要清醒理智看到差距，当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距，讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。”

另外，刘庆峰表示，2024年要真正让大模型量质齐飞，不仅是行业应用，还要在很多关键技术创新上联动大模型，中国企业界、科学界有信心实现超越。

最后，高楼大厦要建立在安全可控的平台之上，“我们要实现自主可控平台上的生态繁荣。”刘庆峰表示，自己有信心，能够实现从算法、数据、应用场景到算力，构建一个完全自主可控的繁荣的人工智能生态。

大皖新闻记者项磊

编辑许大鹏