超拟人数字人的声音自然度达到4.2分,刘庆峰称,最好的播音员可以达到5.0分左右,真人水平一般为4.0分左右。
此外,在远场高噪场景,今年9月,科大讯飞在语音识别领域的赛事CHiME-8夺冠,并拿下连续五连冠。当下,科大讯飞的语音识别也首次实现全国地级市方言全覆盖,包括288个地市202种方言。
二、首发八个语种多语言大模型,1.3B汽车端侧大模型
基于全新发布的星火4.0 Turbo,科大讯飞首发了星火多语言大模型、汽车端侧星火大模型。
星火多语言大模型首批可以支持中文、英语之外的八个语种,其能力整体达到GPT-4o 96%的水平,多行业任务场景效果超过GPT-4o。
与此同时,多语言的交互也为汽车的智能交互提供了工具。
基于大模型能力,用户与汽车的交互已经从导航、命令控制等基础应用交互,提升到包括用车助手、旅行家等应用层面,使得活跃用户的日均交互从7次提升到了18次。
为了让大模型直接在汽车部署,科大讯飞发布了参数规模为1.3B的汽车端侧星火大模型,相比于参数规模更大的模型,其效果损失≤1%,端侧首响40ms,端云融合交互低至1.3s。
2025年第四季度,该模型将会在奇瑞、广汽、长城将有多款车型陆续上市开售。
在交互之外,科大讯飞正在与开发伙伴一起为车企构建丰富智能体生态,包括汽车内的支付、影视等。
三、深入教育、医疗、法律场景,用AI过滤作业、诊断医疗影像
讯飞星火大模型的软硬件已经在教育、医疗等场景实现了深入应用。
1、教育:高中数学教师助手,用AI过滤作业必答题、选做题
在教育领域,科大讯飞首发了基于“问题链”的高中数学智能教师助手,并邀请12个区域的50多位数学教研员、400多位教师人员共创。这一教师助手可以帮助老师定位孩子薄弱环节,进行启发式讲解。明天,科大讯飞还将发布带有智能教师助手的星火智慧黑板2.0。
面向家庭学习,科大讯飞发布了搭载到学习机上的AI作业过滤器,能够帮助学生对作业、考题筛选,基于其对学生的知识习得能力等进行判断,选出学生的分为必答题、选做题和可不做题。这一功能预计在11月中旬上线。
2、医疗:医疗大模型六大核心场景升级,发布医学影像大模型
讯飞星火医疗大模型此前发布的功能包括智医助理、智慧医院、讯飞晓医等。
其中智医助理已经在611个区县,完成了8.6亿辅助诊断次数,8100万不合理处方提示;智慧医院完成了5000万次AI患者服务,完成6亿次疾病随访;讯飞晓医的下载量达到1500万次,完成了1.1亿次AI咨询。
在此基础上,讯飞星火医疗大模型2.0实现了六大核心场景能力升级,包括医疗海量知识问答、医疗复杂语言理解、医疗诊断治疗推荐、医疗专业文书生成、医疗多轮交互、医疗多模态交互。
在细分的医学影像方面,目前围绕医学影像的诊断治疗,存在影像科医生数量相对不足、拍片质量参差不齐、重复影像检查发生率达到41.82%的问题。
在此背景下,安徽省实现了全国应用规模最大的影像云平台,实现了一次检查全省互通互认。
科大讯飞发布讯飞星火医学影像大模型,能完成智能智控、智能诊断、智能读片。影像助手可以帮助医师进行解释溯源,找到对应的判断标准,还能对比患者之前的影像CT。
3、法律、企业、科研:用户工作效率翻倍提升,政务场景审核时间缩短80%
星火大模型赋能法律和政务,法律大模型的场景应用包括AI书记员、AI文书助理、AI法律检索助手;政务场景的星火智办一体机,使得用户递交材料的审核时间缩短80%,登记效率提升5倍,
面向企业,科大讯飞为企业大模型构建提供顶层规划到执行落地的全套解决方案,包括数据工具请洗脸、SFT数据工具链、场景优化工具链、多模态知识零采编系统,提升“理数据、训模型”的效率。
在科研方面,星火科研助手2.0已经中国科学院下属116个院所使用,同时,科大讯飞已经联合团队开展了AI+生物科技、AI+科学装置的科研攻关。
结语:大模型生态繁荣,AI正改变科研范式
讯飞星火大模型从发布至今,都在强调基座模型升级与行业应用的紧密结合,目前其已经发布20多个行业大模型,打造了300多个智能体应用,这些形成了可以相互借鉴和复用的规模化效应。
如今,以大模型为代表的通用人工智能发展迅猛,今年诺贝尔奖、物理学奖、化学奖都与AI强相关,AI改变科研范式已经成为科技界的共识。以科大讯飞为代表的国内大模型厂商,正在其中扮演着愈加重要的角色。