11态决策与闭环执行,实现从被动响应指令到主动解决复杂问题的跨越。与此同时,各类AI硬件迎来新一轮迭代升级,从轻量化AI眼镜到便携AI录音卡片,硬件设备在便携性与场景适配性方面不断突破。“多模态模型”进一步打破技术边界,实现语言理解、视觉识别、音频处理等核心能力的深度融合。“世界模型”扮演更为重要的角色,基于内在模拟理解现实世界的物理与因果结2中国信通院人工智能研究所副总工程师—王蕴韬中国信通院人工智能研究所副总工程师—王蕴韬明略科技副总裁兼研发团队负责人—李梦林31.1.AI演进路径与产业概况2.迈向AGI的关键领域3.智能体技术与应用进展4.智能硬件与典型AI应用5.全球AI企业最新布局6.AGI未来发展路径探究41.1.AI演进路径与产业概况人工智能演进路径何为通用人工智能人工智能全景图谱人工智能发展路线图5超级人工智能超级人工智能在特定领域具有感知能力的智能在特定领域具有感知能力的智能在跨领域达到人类认知能力的智能任务专用任务专用深蓝计算机:世界模型:实现AGI的关键路径之一,世界模型融合物理理解、推理、规划与持久记忆能力。具身智能:世界模型:实现AGI的关键路径之一,世界模型融合物理理解、推理、规划与持久记忆能力。具身智能:围棋世界冠军、职业九段棋手李世石进行围棋围棋世界冠军、职业九段棋手李世石进行围棋人机大战,最终击败李世石。在全领域拥有超越人类能力的智能):基于量子力学原理设计的新型计算模型,将传统神经网络架构与量子计算技术相结合。核心机制通过引入量子门避免量子比特的过早坍缩,提升计算效率。):通过逆向工程复制生物大脑的认知功能。包含神经符号系统融合和意识连续性测试等技术体系。递归自我改进(RSI):在无人工干预下,自主增强自身能力。包含元学习控制器、代码自主修改和目标函数进化等技术路径。资料来源:至顶智库结合公开资料整理绘制。6©2025.9ZDInsights6多领域日益复杂问题的系统。.Meta界、具备推理规划能力、拥有持久记忆并服从目标导向的智能形式。体但可以控制与其连接的任何机器人,训练资源可以重新部提出,真正的AGI需要证明“该系统能做到历史上最优秀的人类用相同大脑架构做到的事情。资料来源:至顶智库结合公开资料整理绘制。7©2025.9ZDInsights7.-.资料来源:至顶智库结合公开资料整理绘制。8©2025.9ZDInsights89©2025.9ZDInsights92025年全球人工智能全景图谱包含应用硬件层、模型层以及详实的参考信息。66876779798注:数字代表图谱所涉及的企业、产品应用或模型数量。资料来源:至顶智库整理绘制。©2025.9ZDInsights工业智能体编程智能体工业智能体编程智能体金融智能体营销智能体医疗智能体wn.dsiE赛意制造业人事智能助理通用智能体通用智能体办公智能体办公智能体BBxayer 客服智能体 客服智能体资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsights国外国外Bricklayer⃞oppooppo国内阿里云百炼腾讯元器腾讯云智能体应用开发平台开发平台“百宝箱”智能体讯飞星辰智能体平台国外Metaosiri国内国内讯飞星火超级小爱资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsightsAI录音设备AI录音设备智能汽车 西联想nuwvea 具身智能nDianDiaQMiku""VERSE与it""VERSE讯飞智文讯飞智文资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsightsrr讯飞写作Effie写作Effie写作picsarpicsar像素蛋糕像素蛋糕ZB腾讯智影资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsights资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsightsG视频模型视频模型GrunwayGrunway豆包·视频生成模型混元视频生成模型可灵2.0视频生成模型语音模型语音模型GG豆包·实时语音模型资料来源:主要体现2024年10月以来推出的各类模型,至顶智库结合公开资料整理绘制。©2025.9ZDInsights讯飞星火X1阶跃AI资料来源:主要体现2024年10月以来推出的各类模型,至顶智库结合公开资料整理绘制。©2025.9ZDInsights envnaAIAI计算集群资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsights端到端语音(开源)端到端语音(开源)GG01-Live图视频生成模型 视频生成模型 G豆包·音乐模型豆包·音乐模型视觉理解模型基础语言大模型视觉多模态大模型基础语言大模型视觉多模态大模型视觉语言模型G视频生成模型机器人基础模型(开源)(开源)视频生成模型资料来源:至顶智库结合公开资料整理绘制。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights视觉语言模型视觉语言模型G 豆包·视觉理解模型(开源)联想法律智能体(开源)联想法律智能体视频生成模型视频生成模型G天禧个人超级智能体乐享企业超级智能体城市超级智能体视频生成模型视频生成模型G代码嵌入模型代码嵌入模型代码生成模型代码生成模型豆包·视频生成模型豆包·实时语音模型豆包·视频生成模型豆包·实时语音模型(开源)视频生成模型视觉深度推理模型端到端语音通话模型语音表征模型资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsightsGGG(开源)豆包·同声传译模型 G豆包·图像编辑豆包·图像编辑腾讯地图旅游规划腾讯地图旅游规划语音生成模型视频生成模型语音生成模型视频生成模型视频生成模型视频生成模型(开源)视觉智能体(开源)视觉智能体文GG文GG豆包·图像创作模型资料来源:至顶智库结合公开资料整理绘制。强化学习开源生态强化学习开源生态推理模型算力基建©2025.9ZDInsights美元构建AI基础设施,为大规模AI模型训练和推理提供算力基础。四是开源生态的广泛构建与繁荣共享。AI计算集群AI计算集群AI服务器资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights情境记忆形成动态调整机制,并借助自一致性校验确保逻辑一致性。在训练层面,采用监督微调(SFT)与基思维树思维链提示推理与行动策略优化情景记忆代理情景记忆代理©2025.9ZDInsights动态聚合与信息重组,为更复杂的非线性推理问题提供更优的解决思未评分正向评分负向评分聚合投票机制聚合投票机制自我精炼输出©2025.9ZDInsights25):并降低计算资源开销。该机制实现在保持模型性能的同时,优化推理效率,适用于大规模参数部署。近年来,©2025.9ZDInsights模型蒸馏是指大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的技术,其核心目标是在保持模型性能的同时,显著降低模型的计算复杂度和存储需求,使模型更适合在资源受限的环境中部署。教师模型规模庞大,性能较高,但在计算和存储资源上存在较大压力;学生模型结构较为简单,通过模仿教师模型输出的软标签(概率分布)学习其知识和表示能力,软标签包含类别间相似性和内在关系的更多信息,蒸馏技术,用以在保持性能的同时提升效率,推动轻量化模型的发展和普及。模型蒸馏的原理与机制教师模型资料来源:至顶智库结合公开资料整理绘制。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights当前,主流大模型利用强化学习技术进一步提效。强化学习作为机器学习领域的核心技术之过执行动作来影响环境,并根据环境反馈的奖励智能体智能体初始状态行动策略初始状态行动策略下一状态下一状态奖励环境奖励环境模型模型企业强化学习方法deepseekAliOMeta©2025.9ZDInsights2.5传统与简化强化学习成为大模型提效“双涡轮”主流大模型在后训练阶段采用的强化学习方法主要包含两类。一类是传统强化学习方法如人类反馈强化学习大模型可突破单一预设答案的局限,动态适配不同偏好,生成结构合理、契合上下文且更具创造性与高质量奖励模型训练在微调之前,训练一个奖励模型(或奖励函数)在微调之前,训练一个奖励模型(或奖励函数)近似人类偏好并评估不同的LLM输出。偏好微调在每次微调迭代期间,LLM会为给定指令生成多个响应,每个响应都使用训练完成的奖励模型进行评分。策略优化使用RL优化技术,根据偏好分数更新模型的权重,从而改进在每次微调迭代期间,LLM会为给定指令生成多个响应,每个响应都使用训练完成的奖励模型进行评分。策略优化使用RL优化技术,根据偏好分数更新模型的权重,从而改进响应生成。•让人类标注员对LLM的多个响应排序,用排序结果训练奖励模型,再基于奖励模型用RL优化LLM,核心是“直接对齐人类主观偏好”。•用能力较强的AI模型替代人类标注员生成反馈,训练奖励模型并优化目标LLM,解决“人类标注成本高、效率低”的问题。•在DPO基础上加入“奖励机制”,既能保留无奖励模型的简洁性,又能通过感知潜在奖励信号进一步提升LLM输出的质量与一致性,兼顾稳定与性能。•无需训练独立奖励模型,直接用人类或AI的偏好数据构建损失函数,通过梯度下降直接优化LLM策略,流程简化且计算成本低。•核心目标是让模型输出符合人类偏好。©2025.9ZDInsights术直接决定模型迭代更新速度。当前,国际主流芯片厂商正围绕高性能计算、低精度格式和系统级优化展开•适用于大规模推理AI场具有2080亿个晶体管,GPU实现新突破,支持GB300系统计算能力是能大幅提升,推动实现收益最大化。倍,密集FP4浮点运算•算力上每个单独的芯片耗效率上实现2倍提升,•Google迄今为止性能最强、可扩展性最高的定制AI加速器,首款专为推理设计的加速器。端口更少。每瓦性能最多可提升50将成本延迟大幅降低;规模部署复杂模型。•专为以高性能训练大参数基础模型和大语言模型构建。成式人工智能构建,于训练部署数千亿至数万亿参数的模型。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights理和轻量化训练场景中率先实现规模化落地。与国外追求绝对算力峰值不同,国内企业更注重架构自主与性能优化,并通过软硬件垂直整合和性价比优势抢占市场。总体而言,国内AI芯片尽管受到外部环境制约,但目前已取得显著进展。长远来看,先进制程、软件生态、硬件稳定性以及基础架构原创性仍将是未来需要持•显存规格优于同类主流更加友好,率先支持8bit推理,单机8卡即可运行671B模型;可较好支撑•采用完全由昆仑芯自研的训练和推理任务的快速适起同类产品以更低成本实现更高良率、更快的量产矩阵级的资源供给模式转大模型打造的训推一体通•可实现多卡互联及千卡集群部署,为千亿参数大模型的训练、微调和推理提供强劲算力支撑,兼具先•基于沐曦自主知识产权核计、制造到封装测试的全流程国产供应链闭环,集成大容量存储与多精度混•满足下一代生成式AI的训内首创原生FP8低精度算资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights近年来,国内外主要云厂商的资本开支呈现出持续攀升态势。放眼海外,美国头部云厂商投资支出持续增加,国内头部云厂商投资持续加码,投资目标已从传统数据中心转向智算中心。阿里巴巴、腾讯、百度20数据来源:各企业财报,WSJ,2025年资本开支为中金预测,至顶智库整理绘制。数据来源:各企业财报,WSJ,至顶智库整理绘制。©2025.9ZDInsights通过大规模投资和技术创新,不断巩固其在全球人工智能领域的领先地位。此外,美国算力领域的投资参与动“Stargate”AI基建项目。该项目位于得克萨斯州,迄今累计投入已达1000亿美元,以实现AI分布式训练的目标。资90亿美元,用于俄克拉何马州的云和人工智能基础设施。服务于新数据中心园区建设与现有设施扩建。步扩展Meta的AI基础设施,支持更复杂的模型训练和推理任务。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights超节点是一种通过单节点内增加芯片数量,具备超高互联带宽、纵向扩展与集成化等优势的方案,在性能、成本、组网、运维等方面表现突出。超节点能够提供超高互联带宽与超低通信时延,有效支撑并行计算任务,实现单机内运行超万亿参数大模型,并支持领先大模型机内同时运行及多智能体实时协作与按需调用;昆仑芯发布的超节点方案通过硬件创新提升全互联通信带宽,支持IB/ROE跨域低延迟传输,助力万卡级智算集群超节点特征超节点案例昆仑芯超节点超节点特征超节点案例昆仑芯超节点 超高带宽互联,极致低通从数千服务器集群到若干超高带宽互联,极致低通从数千服务器集群到若干•该产品基于超节点架构,跨节点•通过系统工程优化,实现资源高效调度,更好满足模型训练和推理对低时延、大带宽、长稳可靠节点服务器,采用创新的多主机低延迟内存语义通信架映射技术,突破多主机统一优化提升提供全栈解决方案;•通过硬件架构创新,该产品高带宽、低延迟数据传输,支持万卡以上规模的智算集资料来源:华为、浪潮信息、昆仑芯、至顶智库结合公开资料整理绘制。©2025.9ZDInsights产业真正实现普惠共享。构建生态飞轮形成良性循环推动技术普惠分享智能红利企业通过开放源代码,吸引开发者优构建生态飞轮形成良性循环推动技术普惠分享智能红利企业通过开放源代码,吸引开发者优化贡献,从而使得技术迭代加速,吸引更多参与者,最终使生态逐步完善。模型开源降低研发门槛,促进Al技术民主化,利于打破应用壁垒,使中小企业共享智能红利,以更低成本参与AGI研发,从而加速技术更迭。挑战闭源霸权重构全球生态打破算力垄断助力产业升级模型开源能够帮助企业应对算力封锁、技术垄断等挑战,通过模型、权重、推理逻辑的全面开放,企业得以加速实现产业转型,提升生态竞争力。中国开源模式挑战美国闭源霸权,避免AGI技术垄断,使各国基于各自优势的差异化竞争,形成互补共生的全球格局。G资料来源:至顶智库结合公开资料整理绘制。3.智能体技术及应用进展3.智能体技术及应用进展智能体技术架构智能体技术架构行业智能体智能体特征智能体特征通用智能体企业智能体©2025.9ZDInsights对环境的实时感知,并通过自主规划与调用工具完成复杂目标。智能体具备记忆、自主规划、工具调用与自记忆、工具使用等方面均实现突破,凭借其特有的自主感知与规划执行能力,实现从智能助理被动调用单一短期记忆长记忆工具规划代码解释器工具规划…执行智能体自主感知、规划并达成长期目标智能体自主感知、规划并达成长期目标多模态感知+连续行动+环境交互开放、复杂、跨系统任务链高度自主、可主动规划、反思、纠错跨对话、跨任务长期记忆任意工具组合(浏览器、数据库、物理设备)个人/企业/政府主要目标交互方式主要目标交互方式任务范围记忆能力工具使用用户群体多轮对话+轻量级工具调用相对封闭、短期任务有限自主,需用户确认用户长期记忆(偏好、历史)调用API与本地应用个人资料来源:至顶智库结合公开资料整理绘制。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights智能体的技术架构主要由感知、认知与执行三大模块组成。其中,感知模块负责处理环境感知,接收用户输入、外部数据以及动态反馈等一系列信息并进行解析;认知模块分为情感、奖励、记忆、目标与世界模型五个部分,作为智能体的认知基础,与执行模块协同运转,使智能体能够完成“感知—规划—工具调用—行结构化推理过程结构化推理过程输出输入观察输入环境感知输出输入观察输入环境感知心理状态空间输入输出用户/智能体心理状态空间输入输出用户/智能体环境状态空间与状态转换函数智能体世界反馈传递物理世界环境状态空间与状态转换函数智能体世界反馈传递物理世界世界保留过程检索过程执行行动原始数据结构化数据执行输出世界保留过程检索过程执行行动原始数据结构化数据执行输出©2025.9ZDInsights索子智能体及任务完成模块协同完成研究工作。主导智能体可调用搜索子智能体执行多方向检索,并调度引证子智能体插入文献引用,以增强信息可信度。记忆模块在整个研究过程中持续存储并更新状态,保持上下文的连贯性与一致性。用户请求在系统内部分配,经由多个子智能体并行探索与引用增强后,生成最终报告主导智能体记忆模块引证子智能体记忆模块块+运行子智能体+任务完成模块搜索子智能体搜索子智能体搜索子智能体©2025.9ZDInsights课程设计课程设计学习建议知识专家通用智能体已广泛覆盖生产生活的多个场景。既涵盖数据分析、教育、研究、编程、生产力等多元任务板块,提升日常办公效率;又渗透攻略计划制定、内容创作、生活助手等个性化场景,为用户提供精准决策建议,投资分析市场分析数据可视化深度研究行业分析文献综述深度研究行业分析文献综述旅游安排团建策划教育攻略计划攻略计划数据分析Q文件处理文章排版数据分析Q文件处理文章排版会议纪要生产力创作研究智能播客绘画大师脚本生成写作助手应用设计游戏开发编程生活应用设计游戏开发商品对比健康助手财务管家装修指南最后以一份报告的形式,将预约的时间、地点等结果呈现供用户了解用户需求,在旧金山找一家评分高的寿司选择一个空闲的晚上预户偏好方面的评价与信进行用餐预约,并将预约事项添加到用户的资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights当前,行业智能体应用领域持续拓宽,场景创新不断深化。智能体凭借“环境感知—自主决策—动态执行”新服务模式。在金融领域,智能体根据金融机构的独特需求和长尾业务进行深度定制,具有高度的针对性和专业性;在工业领域,智能体成为支持行业发展的“数字大脑”,推动新型工业化的核心引擎;在教育领域,政务领域,中国移动旗下移动云发布的政务智能体集通用问答政务领域,中国移动旗下移动云发布的政务智能体集通用问答、事项指引、个性定制、热点报告四大功能于一体。可对用户提问“秒回”并提供可视化指引,推动基层政务平台减负。教育领域,科大讯飞发布的星火教师助手具备对话、教学设计等多个模块,推动教师教学创新、提高思维能力。教师仅需语音下达指令,系统便能迅速结合班级数据诊断班级学情。法律领域,联想联合图灵法思共同发布的联想法思AI律师助手包含争议解决、法务咨询等八大功能,提高法务处理效率。用户将案件材料上传后,助手会自动梳理案情、整理要素。诊断性但耗时的任务,包括预约准备、术前术后电话沟通等。其也可根据用户需求提供入院、服务设施等信息。工业领域,西门子发布计、规划、工程等五大功能,可独立执行完整工业工作流程。设计工程师可借助其处理复杂任务。政务教政务教育电信电信工业工业Miner智能体包含智能规划、数据连接、预置知识、报告生成等核心功能,助力企业即时获取、整理、分析、洞察数据,提升工作效率,推动数据向精准决策转化。金融领域,容联云容犀Copilot&Agent,其七个业务智能体覆盖智能质检、知识管理、坐席辅助与业务分析等核心场景,实现营销-销售-客服-运营全链路提质增效。法律营销金融医疗资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights企业智能体具备任务处理能力,作为具备自主决策能力的“数字员工”,为企业级用户提供多样化解决方案。一方面,不同行业先后涌现出适配自身工作流的智能体解决方案。在制造业中,企业智能体助力优化生产流程;在互联网行业中,企业智能体可被用于前期产品研发并协助销售服务。另一方面,企业内部办公场景中,智能体可作为企业后台支持部门的智能助手,协助处理日常行政、人力资源、财务管理等工作,帮助企业降本增效。企业智能体展现出广泛应用价值,正成为推动企业数字化转型战略决策数据分析智能体制造流程采购供应链智能体物流运输采购供应链智能体物流运输供应链智能体设备智能体制造智能体设备智能体制造智能体品控智能体前期规划产品研发研发智能体前期规划产品研发研发智能体销售智能体行业洞察智能体客服智能体实施部署交付验收非制造流程邮件管理智能体员工培训智能体邮件管理智能体员工培训智能体会议纪要智能体文档生成智能体差旅管理智能体后台支持法务智能体资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights序的开发和集成变得更加简单,使得开发者能够以一致的方式将各种数据源、工具和功能链接到AI模型,为特定API接口特定API接口特定API接口本地文件网页服务数据库本地文件网页服务三个核心组件协同运作,实现AI应用与外部工具和数据特定API接口特定API接口网页服务数据库本地文件资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights协议可在无需框架或供应商的情况下实现智能体在不同生态系统间的协作,由此推动智能体在更广泛场景中资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights负责提供命令行交互体验。上下文管理负责提供命令行交互体验。上下文管理“记忆”,负责收集和组织代码相关信息。由项目结构、代码内容,版本控制和配置信息实现。工具系统“手脚”,使之实现与外部环境交互。系统内有文件工具、执行工具,分析工具和元工具。核心引擎核心引擎“大脑”,负责协调各组件工作,由消息系统、查询引擎、工具调度器构成。输出渲染器负责格式化并展示AI响应和工具执行结果。输入处理器负责解析用户指令,支持多种输入模式(自然语言、命令、代码等)。码库,智能搜索可实现无需手动选择文本亦能理解项目结构与上下文关系。阅读问题、编写代码、运行测试到提交PR的完整工库与上下文关系的深度理解高效执行真正可用的多资料来源:Anthropic,至顶智库结合公开资料©2025.9ZDInsights明略科技作为数据智能应用软件提供商,为企业用户提供以数据分析为核心的产品服务。以明略大模型秒针系统、金数据、微伴助手,以及明智会话、明奇科技、明胜品智在内的全栈智能化产品及解决方案。基智能规划、数据连接、预置知识和报告生成等多种功能。明略科技相关产品协同发力,旨在推动全球企业加速智能化转型进程。数据转变为结构化文件提出研究任务获取数据数据转变为结构化文件提出研究任务获取数据明智会话爱投明奇科技形成报告数据可视化分析数据明奇科技秒针系统金数据明胜品智微伴助手资料来源:明略科技,至顶智库整理绘制。4.智能硬件及4.智能硬件及AI应用进展AIPC©2025.9ZDInsights重优势:硬件层面,夸克AI眼镜进行系统重构,采用双芯双系统设计;AI能力音指令到自然对话系统的跨越;生态整合层面,夸克AI眼镜深度融合阿里及支付宝生态,为用户带来更智能、品牌及产品品牌及产品AI功能计算平台续航能力小米AI眼镜夸克AI眼镜AI助手、拍摄、音乐播放、免提通信、翻译AI助手、拍摄、语音通话、支付AI助手、拍摄、音乐播放、语音通话、出行提醒、导航、支付、购物、翻译、提词AI助手、拍摄、音乐播放、导航、翻译AI助手、拍摄、音乐播放、导航、翻译、提词AI助手、拍摄、导航、翻译、购物、社交耗处理芯片功耗协处理器紫光展锐穿戴式芯片典型续航4h3h音乐播放4h连续蓝牙电话典型续航3h资料来源:至顶智库结合公开资料整理绘制。AIAI眼镜功能AI眼镜功能时环境获取一系列建议和解时环境获取一系列建议和解拍摄:按下捕获按钮或说摄超高质量的照片和视频。音乐:内置蓝牙扬声器与麦克风提供音频播放与捕捉服免提通信:通过AI眼镜实现文本发送、语音及视频通话翻译:提供法语、意大利语、西班牙语和英语的实时翻译AI助手:基于夸克多模态大模型,实现百亿级图片检索与专增强模式优化夜景拍摄效果,AI算法实现超帧边分,高性能导航:通过导航软件随时随地定制近眼显示导航系统。支付:通过眼镜扫码与声纹识别实现安全支付。出行提醒:夸克眼镜联合飞猪旅行等应用,绑定用户行程,时刻提醒出行计划。购物:夸克眼镜联合拍立淘,实现海量商品搜索与比价。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights信息反馈;小米的自动导航通过提取消息的地理位置并自动发送至地图实现导航。超级小爱超级小爱识图问答屏幕圈搜识图问答):文档问答文档问答动画、插画和涂鸦等风格。可长按相机按钮拍摄物体图片并提升自然语言处理能力,具备上下文理解能力及更自然的对话体资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights场景中的智能体验。同时,端侧大模型+个人云的时,保障用户的数据隐私。联想现已形成覆盖笔记本、台式机、工作站与服务器的全方位产品矩阵,不断丰供个性化智能服务,实现多模态自然语言交互、个人大模型部署以及本地知识库搭建等一系列操作。针对法律行业痛点,联想打造联想法律智能体,该法律智能体共包含“争议解决、法务咨询、合规管理、合同管理、知识产权、公司治理、资源管AIPC在个人与公有两方面与大模型深度融合,形成AIPC在个人与公有两方面与大模型深度融合,形成助端侧大模型部署+个人云方案成功化解“高性能、低成本、安全可靠”难以兼得的困境。端云协同AIPC在端侧设备上实现大模型的部署与运行,用户可基于端侧模型完成文档的总结、撰写等一系列任务,充分保障数据隐私与离线可用性。资料来源:至顶智库结合公开资料整理绘制。产品类型产品型号产品功能同时,天禧智能体全面血版大模型,在响应速度、复杂指令执行与跨端任务执行等方面性能得到显著优化。为开发者测试、微调或推理最新一代推理型服务器训练、大规模建模等场服务器资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights端到端自动驾驶为高级别自动驾驶发展提供全新的技术路径。基于统一的神经网络从传感器数据输入直接到控制指令输出的连续学习与决策过程。核心技术主要体现在数据采集标注、训练算法、模型设计训练、模型压缩等方面。端到端自动驾驶模型依赖数据闭环实现算法性能持续提升;训练算法旨在通过数据闭环建立原始传感器输入到驾驶规划控制指令的映射,提高自动驾驶系统性能和安全性;模型设计训练分为“分模块模型”和“单模型架构”两种;模型压缩主要包括模型剪枝、模型量化和编译优化,旨在降低网络计算需求,提升车载计算平台的运行速度。数据采集标注模型设计训练融合多模态大模型的数据采集标注模型设计训练融合多模态大模型的端到端自动驾驶分模块“端到端”模型单模型“端到端”架构单模型“端到端”架构感感知预预测控控制模型压缩技术典型训练算法保留参数被剪枝参数强化学习强化学习不依赖于带有驾驶操作标签的驾驶数据,通过车辆与环境的交互优化和探索试错,逐步提升驾驶性能。监督学习监督学习是对人类驾驶员示范数据的模仿,依托模型输出和驾驶员决策控制量的差值对驾驶模型进行迭代更新。模型剪枝模型量化模型压缩技术典型训练算法保留参数被剪枝参数强化学习强化学习不依赖于带有驾驶操作标签的驾驶数据,通过车辆与环境的交互优化和探索试错,逐步提升驾驶性能。监督学习监督学习是对人类驾驶员示范数据的模仿,依托模型输出和驾驶员决策控制量的差值对驾驶模型进行迭代更新。模型剪枝模型量化编译优化校检数据校检数据资料来源:李升波,江昆等:汽车智能驾驶技术发展与趋势展望,前瞻科技,至顶智库结合公开资料整理绘制。©2025.9ZDInsights接映射到控制输出的完整闭环能力,不仅关注环境感知,也关注规划与控制问题©2025.9ZDInsights局限,实现从信息搜集到深度洞察的跃迁。深度研究由任务拆解、信息搜索、分析推理,交叉验证和结果输出五个核心步骤构成,可实现输出结果的专业严谨。该功能正逐步成为现代知识工作者(如研究人员、分析师、驱动复杂问题解决与知识创新的关键应用。1来源,权衡可1来源,权衡可靠性,保证结论严谨可信。任务拆解任务拆解 信息搜索分析推理交叉验证系统在相关平台定位检索高价值信息,基于时效性系统在相关平台定位检索高价值信息,基于时效性、可信度等多维标准过滤出高质根据用户需求生成格式规范的报告、论文、结论提供引用来源,确保成果专业可靠。运用逻辑推理与知识图谱技术,对已收集信息进行深度分析和推导,并根据新信息继续完善补充。 结果输出5资料来源:至顶智库结合公开资料整理绘制。1122细化拆解用户指令在用户发出生成描述汽车行业过去五年变化的报告并附带表格的指令后,GPT-5进一步细化拆分目标任务要求并向用户发出信息确认请求。5生成标准化行业报告5在完成推理与验最终返回给用户一份格式规范、详实且兼具专业度的关于全球汽车行业过去五年变化的行业报告。威性等多重标准在国际能源署、爱立信、麦肯锡、益博睿等官方网站平台搜集信息,整理编搜集整理高质量信息©2025.9ZDInsights的解决方案。从全球格局来看,AI编程已进入规模化应用阶段,国外以基础模型创新和自主智能体开发为主导,重视通用性与开发者体验;而国内重视工程化工具链整合,强调行业落地与本土化适配,形成差异化竞争格局。从编程环节来看,基于大规模预训练模型的代码生成系统能够准确理解开发者意图,完成从自然语言描述到可执行代码的转换,同时支持多编程语言和复杂算法实现,可针对特定代码库提供优化建议,实现代码补全、错误识别到代码优化的闭环。按部署方式划分国外国内独立IDE/平台型按部署方式划分国外国内独立IDE/平台型国外国内插件/辅助集成型你通义灵码按功能划分代码补全国国外国国内代码生成国国外国国内资料来源:至顶智库结合公开资料整理绘制。5.全球5.全球AI企业最新布局©2025.9ZDInsights搭统B300作为AI基础设施平台,为数据中心提供高效的生成式AI和AI推理功能。超级芯片,搭载36构GPU具有2080亿晶体管。采用台积电4NP工艺。代AI芯片代AI芯片Rubin亮相,密集FP4计算能力,相比B300提升超过3密集FP4浮点运算性NVIDIABlackwell架构适用于大规模推理AI场景,HopperGPU高出30倍,并支持实时性能下的高吞吐量。通过优化BlackwellUltraGPU并行化策略(专家/张量/流水线)和跨GPU管理,基于BlackwellUltra的GB300系统推理效能相比3TensorCoreGPU具有800亿晶体管,适用范围广泛,涵盖从小型企业到百亿亿级高性能计算,再到万亿参数的人工智第四代张量核心与A100相比,芯片间速度最高可达6倍,包括每个流式多处理器(SM)的加速、额外SM数量以及更高的时钟频率。全新Transformer引擎结合软件和专门设计的Hopper张量核心技术,专门用于加速Transformer模型的训练和推理。©2025.9ZDInsightsNVIDIACUDA-XNVIDIACUDA-X基于CUDA®构建,包含用于构建应用的多种微服务、库、工具和技术,CUDA-X可为人工智能、高性能计算(HPC)等应用领域带来性能的提升。CUDA-X库基于CUDA构建,凭借400多个库,开发者可以使用CUDA平台构建、优化、部署和扩展各类应用。AI应用开发涉及数据处理、特征工程、机器学习、验证和部署等环节,每个环节要处理CUDA-XAI包括:cuDNN(深度Retriever(企业级检索增强生成工具)等工具,支持从数据预处理到模型部署的全流©2025.9ZDInsightsNeMoGuardrailsNeMoGuardrails是可扩展的护栏编排平台,用于确保LLM交互的安全性、精度和主题相关性。NeMoCurator通过大规模处理文本、图像和视频数据进行训练和定制,提高生成式AI模型的精度。并具有较高的准确性和更NeMoCustomizer作为可扩展的高性能微服务,可针对特定领域用例简化LLM的微调和对齐。台通过学术和自定义基准测试对生成式AI模型和工作流进行评估。√√©2025.9ZDInsights景扩展为数十亿的有效里程,大幅增加实现安全和先进自动驾驶功能所需的数据集规模。机器人场景中,1)操作人员使用AppleVisionPro进入数字孪生系统;2)操作人员通过少量远程操作演示捕捉动作轨迹;3)通过IsaacGR00T运动合成系统将少量运动轨迹扩展为更大规模的数据集;4)利用IssacSim和Cosmos所构建的GROOT-Gen进行3D图像放大;5)在软件系统中进行测试验证,最终部署到物理机器人。©2025.9ZDInsights硬件层硬件产品芯片硬件产品©2025.9ZDInsights有大幅改进,不仅可以对人物和宠物进行精准编辑,保持特征一致,还能实现多图合成、多轮次修改与风格迁移等复杂操作,并融入现实世界知识。术,尺寸更小的混合推理架构模时兼顾,在推理、多模态、术,尺寸更小的混合推理架构模时兼顾,在推理、多模态、代码和长上下文的关键基准上性能表现得到了改进,同时效率更高,是2.5系模型中速度最快、性价比思考模型,在推理方面一系列基准测试中达到SOTA水平;编程方序和代理代码应用程序,以及代型能够在做出反应之前考虑多种角色角色一致性支持将同一角色置于不同场景、展示产品在多角度与多环境下的效果,或生成统一精准图像精准图像编辑支持通过自然语言进行精准的局部编辑与目标性转换。可实现背景模糊、删除照片中的人物、调整主体姿势,等多样化操作。世界知识突破语义理解的局限,开辟全新应用场景。多图像多图像像。通过单一提示将物体置入新场景、为房间重新设计配色或纹理,或生成逼真的多图融合图像。©2025.9ZDInsights
2025通向AGI之路全球人工智能展望报告
11态决策与闭环执行,实现从被动响应指令到主动解决复杂问题的跨越。与此同时,各类AI硬件迎来新一轮迭代升级,从轻量化AI眼镜到便携AI录音卡片,硬件设备在便携性与场景适配性方面不断突破。“多模态模型”进一步打破技术边界,实现语言理解、视觉识别、音频处理等核心能力的深度融合。“世界模型”扮演更为重要的角色,基于内在模拟理解现实世界的物理与因果结2中国信通院人工智能研究所副总工程师—王蕴韬中国信通院人工智能研究所副总工程师—王蕴韬明略科技副总裁兼研发团队负责人—李梦林31.1.AI演进路径与产业概况2.迈向AGI的关键领域3.智能体技术与应用进展4.智能硬件与典型AI应用5.全球AI企业最新布局6.AGI未来发展路径探究41.1.AI演进路径与产业概况人工智能演进路径何为通用人工智能人工智能全景图谱人工智能发展路线图5超级人工智能超级人工智能在特定领域具有感知能力的智能在特定领域具有感知能力的智能在跨领域达到人类认知能力的智能任务专用任务专用深蓝计算机:世界模型:实现AGI的关键路径之一,世界模型融合物理理解、推理、规划与持久记忆能力。具身智能:世界模型:实现AGI的关键路径之一,世界模型融合物理理解、推理、规划与持久记忆能力。具身智能:围棋世界冠军、职业九段棋手李世石进行围棋围棋世界冠军、职业九段棋手李世石进行围棋人机大战,最终击败李世石。在全领域拥有超越人类能力的智能):基于量子力学原理设计的新型计算模型,将传统神经网络架构与量子计算技术相结合。核心机制通过引入量子门避免量子比特的过早坍缩,提升计算效率。):通过逆向工程复制生物大脑的认知功能。包含神经符号系统融合和意识连续性测试等技术体系。递归自我改进(RSI):在无人工干预下,自主增强自身能力。包含元学习控制器、代码自主修改和目标函数进化等技术路径。资料来源:至顶智库结合公开资料整理绘制。6©2025.9ZDInsights6多领域日益复杂问题的系统。.Meta界、具备推理规划能力、拥有持久记忆并服从目标导向的智能形式。体但可以控制与其连接的任何机器人,训练资源可以重新部提出,真正的AGI需要证明“该系统能做到历史上最优秀的人类用相同大脑架构做到的事情。资料来源:至顶智库结合公开资料整理绘制。7©2025.9ZDInsights7.-.资料来源:至顶智库结合公开资料整理绘制。8©2025.9ZDInsights89©2025.9ZDInsights92025年全球人工智能全景图谱包含应用硬件层、模型层以及详实的参考信息。66876779798注:数字代表图谱所涉及的企业、产品应用或模型数量。资料来源:至顶智库整理绘制。©2025.9ZDInsights工业智能体编程智能体工业智能体编程智能体金融智能体营销智能体医疗智能体wn.dsiE赛意制造业人事智能助理通用智能体通用智能体办公智能体办公智能体BBxayer 客服智能体 客服智能体资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsights国外国外Bricklayer⃞oppooppo国内阿里云百炼腾讯元器腾讯云智能体应用开发平台开发平台“百宝箱”智能体讯飞星辰智能体平台国外Metaosiri国内国内讯飞星火超级小爱资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsightsAI录音设备AI录音设备智能汽车 西联想nuwvea 具身智能nDianDiaQMiku""VERSE与it""VERSE讯飞智文讯飞智文资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsightsrr讯飞写作Effie写作Effie写作picsarpicsar像素蛋糕像素蛋糕ZB腾讯智影资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsights资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsightsG视频模型视频模型GrunwayGrunway豆包·视频生成模型混元视频生成模型可灵2.0视频生成模型语音模型语音模型GG豆包·实时语音模型资料来源:主要体现2024年10月以来推出的各类模型,至顶智库结合公开资料整理绘制。©2025.9ZDInsights讯飞星火X1阶跃AI资料来源:主要体现2024年10月以来推出的各类模型,至顶智库结合公开资料整理绘制。©2025.9ZDInsights envnaAIAI计算集群资料来源:企业/产品/应用排序不分先后,至顶智库结合公开资料整理绘制。©2025.9ZDInsights端到端语音(开源)端到端语音(开源)GG01-Live图视频生成模型 视频生成模型 G豆包·音乐模型豆包·音乐模型视觉理解模型基础语言大模型视觉多模态大模型基础语言大模型视觉多模态大模型视觉语言模型G视频生成模型机器人基础模型(开源)(开源)视频生成模型资料来源:至顶智库结合公开资料整理绘制。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights视觉语言模型视觉语言模型G 豆包·视觉理解模型(开源)联想法律智能体(开源)联想法律智能体视频生成模型视频生成模型G天禧个人超级智能体乐享企业超级智能体城市超级智能体视频生成模型视频生成模型G代码嵌入模型代码嵌入模型代码生成模型代码生成模型豆包·视频生成模型豆包·实时语音模型豆包·视频生成模型豆包·实时语音模型(开源)视频生成模型视觉深度推理模型端到端语音通话模型语音表征模型资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsightsGGG(开源)豆包·同声传译模型 G豆包·图像编辑豆包·图像编辑腾讯地图旅游规划腾讯地图旅游规划语音生成模型视频生成模型语音生成模型视频生成模型视频生成模型视频生成模型(开源)视觉智能体(开源)视觉智能体文GG文GG豆包·图像创作模型资料来源:至顶智库结合公开资料整理绘制。强化学习开源生态强化学习开源生态推理模型算力基建©2025.9ZDInsights美元构建AI基础设施,为大规模AI模型训练和推理提供算力基础。四是开源生态的广泛构建与繁荣共享。AI计算集群AI计算集群AI服务器资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights情境记忆形成动态调整机制,并借助自一致性校验确保逻辑一致性。在训练层面,采用监督微调(SFT)与基思维树思维链提示推理与行动策略优化情景记忆代理情景记忆代理©2025.9ZDInsights动态聚合与信息重组,为更复杂的非线性推理问题提供更优的解决思未评分正向评分负向评分聚合投票机制聚合投票机制自我精炼输出©2025.9ZDInsights25):并降低计算资源开销。该机制实现在保持模型性能的同时,优化推理效率,适用于大规模参数部署。近年来,©2025.9ZDInsights模型蒸馏是指大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的技术,其核心目标是在保持模型性能的同时,显著降低模型的计算复杂度和存储需求,使模型更适合在资源受限的环境中部署。教师模型规模庞大,性能较高,但在计算和存储资源上存在较大压力;学生模型结构较为简单,通过模仿教师模型输出的软标签(概率分布)学习其知识和表示能力,软标签包含类别间相似性和内在关系的更多信息,蒸馏技术,用以在保持性能的同时提升效率,推动轻量化模型的发展和普及。模型蒸馏的原理与机制教师模型资料来源:至顶智库结合公开资料整理绘制。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights当前,主流大模型利用强化学习技术进一步提效。强化学习作为机器学习领域的核心技术之过执行动作来影响环境,并根据环境反馈的奖励智能体智能体初始状态行动策略初始状态行动策略下一状态下一状态奖励环境奖励环境模型模型企业强化学习方法deepseekAliOMeta©2025.9ZDInsights2.5传统与简化强化学习成为大模型提效“双涡轮”主流大模型在后训练阶段采用的强化学习方法主要包含两类。一类是传统强化学习方法如人类反馈强化学习大模型可突破单一预设答案的局限,动态适配不同偏好,生成结构合理、契合上下文且更具创造性与高质量奖励模型训练在微调之前,训练一个奖励模型(或奖励函数)在微调之前,训练一个奖励模型(或奖励函数)近似人类偏好并评估不同的LLM输出。偏好微调在每次微调迭代期间,LLM会为给定指令生成多个响应,每个响应都使用训练完成的奖励模型进行评分。策略优化使用RL优化技术,根据偏好分数更新模型的权重,从而改进在每次微调迭代期间,LLM会为给定指令生成多个响应,每个响应都使用训练完成的奖励模型进行评分。策略优化使用RL优化技术,根据偏好分数更新模型的权重,从而改进响应生成。•让人类标注员对LLM的多个响应排序,用排序结果训练奖励模型,再基于奖励模型用RL优化LLM,核心是“直接对齐人类主观偏好”。•用能力较强的AI模型替代人类标注员生成反馈,训练奖励模型并优化目标LLM,解决“人类标注成本高、效率低”的问题。•在DPO基础上加入“奖励机制”,既能保留无奖励模型的简洁性,又能通过感知潜在奖励信号进一步提升LLM输出的质量与一致性,兼顾稳定与性能。•无需训练独立奖励模型,直接用人类或AI的偏好数据构建损失函数,通过梯度下降直接优化LLM策略,流程简化且计算成本低。•核心目标是让模型输出符合人类偏好。©2025.9ZDInsights术直接决定模型迭代更新速度。当前,国际主流芯片厂商正围绕高性能计算、低精度格式和系统级优化展开•适用于大规模推理AI场具有2080亿个晶体管,GPU实现新突破,支持GB300系统计算能力是能大幅提升,推动实现收益最大化。倍,密集FP4浮点运算•算力上每个单独的芯片耗效率上实现2倍提升,•Google迄今为止性能最强、可扩展性最高的定制AI加速器,首款专为推理设计的加速器。端口更少。每瓦性能最多可提升50将成本延迟大幅降低;规模部署复杂模型。•专为以高性能训练大参数基础模型和大语言模型构建。成式人工智能构建,于训练部署数千亿至数万亿参数的模型。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights理和轻量化训练场景中率先实现规模化落地。与国外追求绝对算力峰值不同,国内企业更注重架构自主与性能优化,并通过软硬件垂直整合和性价比优势抢占市场。总体而言,国内AI芯片尽管受到外部环境制约,但目前已取得显著进展。长远来看,先进制程、软件生态、硬件稳定性以及基础架构原创性仍将是未来需要持•显存规格优于同类主流更加友好,率先支持8bit推理,单机8卡即可运行671B模型;可较好支撑•采用完全由昆仑芯自研的训练和推理任务的快速适起同类产品以更低成本实现更高良率、更快的量产矩阵级的资源供给模式转大模型打造的训推一体通•可实现多卡互联及千卡集群部署,为千亿参数大模型的训练、微调和推理提供强劲算力支撑,兼具先•基于沐曦自主知识产权核计、制造到封装测试的全流程国产供应链闭环,集成大容量存储与多精度混•满足下一代生成式AI的训内首创原生FP8低精度算资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights近年来,国内外主要云厂商的资本开支呈现出持续攀升态势。放眼海外,美国头部云厂商投资支出持续增加,国内头部云厂商投资持续加码,投资目标已从传统数据中心转向智算中心。阿里巴巴、腾讯、百度20数据来源:各企业财报,WSJ,2025年资本开支为中金预测,至顶智库整理绘制。数据来源:各企业财报,WSJ,至顶智库整理绘制。©2025.9ZDInsights通过大规模投资和技术创新,不断巩固其在全球人工智能领域的领先地位。此外,美国算力领域的投资参与动“Stargate”AI基建项目。该项目位于得克萨斯州,迄今累计投入已达1000亿美元,以实现AI分布式训练的目标。资90亿美元,用于俄克拉何马州的云和人工智能基础设施。服务于新数据中心园区建设与现有设施扩建。步扩展Meta的AI基础设施,支持更复杂的模型训练和推理任务。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights超节点是一种通过单节点内增加芯片数量,具备超高互联带宽、纵向扩展与集成化等优势的方案,在性能、成本、组网、运维等方面表现突出。超节点能够提供超高互联带宽与超低通信时延,有效支撑并行计算任务,实现单机内运行超万亿参数大模型,并支持领先大模型机内同时运行及多智能体实时协作与按需调用;昆仑芯发布的超节点方案通过硬件创新提升全互联通信带宽,支持IB/ROE跨域低延迟传输,助力万卡级智算集群超节点特征超节点案例昆仑芯超节点超节点特征超节点案例昆仑芯超节点 超高带宽互联,极致低通从数千服务器集群到若干超高带宽互联,极致低通从数千服务器集群到若干•该产品基于超节点架构,跨节点•通过系统工程优化,实现资源高效调度,更好满足模型训练和推理对低时延、大带宽、长稳可靠节点服务器,采用创新的多主机低延迟内存语义通信架映射技术,突破多主机统一优化提升提供全栈解决方案;•通过硬件架构创新,该产品高带宽、低延迟数据传输,支持万卡以上规模的智算集资料来源:华为、浪潮信息、昆仑芯、至顶智库结合公开资料整理绘制。©2025.9ZDInsights产业真正实现普惠共享。构建生态飞轮形成良性循环推动技术普惠分享智能红利企业通过开放源代码,吸引开发者优构建生态飞轮形成良性循环推动技术普惠分享智能红利企业通过开放源代码,吸引开发者优化贡献,从而使得技术迭代加速,吸引更多参与者,最终使生态逐步完善。模型开源降低研发门槛,促进Al技术民主化,利于打破应用壁垒,使中小企业共享智能红利,以更低成本参与AGI研发,从而加速技术更迭。挑战闭源霸权重构全球生态打破算力垄断助力产业升级模型开源能够帮助企业应对算力封锁、技术垄断等挑战,通过模型、权重、推理逻辑的全面开放,企业得以加速实现产业转型,提升生态竞争力。中国开源模式挑战美国闭源霸权,避免AGI技术垄断,使各国基于各自优势的差异化竞争,形成互补共生的全球格局。G资料来源:至顶智库结合公开资料整理绘制。3.智能体技术及应用进展3.智能体技术及应用进展智能体技术架构智能体技术架构行业智能体智能体特征智能体特征通用智能体企业智能体©2025.9ZDInsights对环境的实时感知,并通过自主规划与调用工具完成复杂目标。智能体具备记忆、自主规划、工具调用与自记忆、工具使用等方面均实现突破,凭借其特有的自主感知与规划执行能力,实现从智能助理被动调用单一短期记忆长记忆工具规划代码解释器工具规划…执行智能体自主感知、规划并达成长期目标智能体自主感知、规划并达成长期目标多模态感知+连续行动+环境交互开放、复杂、跨系统任务链高度自主、可主动规划、反思、纠错跨对话、跨任务长期记忆任意工具组合(浏览器、数据库、物理设备)个人/企业/政府主要目标交互方式主要目标交互方式任务范围记忆能力工具使用用户群体多轮对话+轻量级工具调用相对封闭、短期任务有限自主,需用户确认用户长期记忆(偏好、历史)调用API与本地应用个人资料来源:至顶智库结合公开资料整理绘制。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights智能体的技术架构主要由感知、认知与执行三大模块组成。其中,感知模块负责处理环境感知,接收用户输入、外部数据以及动态反馈等一系列信息并进行解析;认知模块分为情感、奖励、记忆、目标与世界模型五个部分,作为智能体的认知基础,与执行模块协同运转,使智能体能够完成“感知—规划—工具调用—行结构化推理过程结构化推理过程输出输入观察输入环境感知输出输入观察输入环境感知心理状态空间输入输出用户/智能体心理状态空间输入输出用户/智能体环境状态空间与状态转换函数智能体世界反馈传递物理世界环境状态空间与状态转换函数智能体世界反馈传递物理世界世界保留过程检索过程执行行动原始数据结构化数据执行输出世界保留过程检索过程执行行动原始数据结构化数据执行输出©2025.9ZDInsights索子智能体及任务完成模块协同完成研究工作。主导智能体可调用搜索子智能体执行多方向检索,并调度引证子智能体插入文献引用,以增强信息可信度。记忆模块在整个研究过程中持续存储并更新状态,保持上下文的连贯性与一致性。用户请求在系统内部分配,经由多个子智能体并行探索与引用增强后,生成最终报告主导智能体记忆模块引证子智能体记忆模块块+运行子智能体+任务完成模块搜索子智能体搜索子智能体搜索子智能体©2025.9ZDInsights课程设计课程设计学习建议知识专家通用智能体已广泛覆盖生产生活的多个场景。既涵盖数据分析、教育、研究、编程、生产力等多元任务板块,提升日常办公效率;又渗透攻略计划制定、内容创作、生活助手等个性化场景,为用户提供精准决策建议,投资分析市场分析数据可视化深度研究行业分析文献综述深度研究行业分析文献综述旅游安排团建策划教育攻略计划攻略计划数据分析Q文件处理文章排版数据分析Q文件处理文章排版会议纪要生产力创作研究智能播客绘画大师脚本生成写作助手应用设计游戏开发编程生活应用设计游戏开发商品对比健康助手财务管家装修指南最后以一份报告的形式,将预约的时间、地点等结果呈现供用户了解用户需求,在旧金山找一家评分高的寿司选择一个空闲的晚上预户偏好方面的评价与信进行用餐预约,并将预约事项添加到用户的资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights当前,行业智能体应用领域持续拓宽,场景创新不断深化。智能体凭借“环境感知—自主决策—动态执行”新服务模式。在金融领域,智能体根据金融机构的独特需求和长尾业务进行深度定制,具有高度的针对性和专业性;在工业领域,智能体成为支持行业发展的“数字大脑”,推动新型工业化的核心引擎;在教育领域,政务领域,中国移动旗下移动云发布的政务智能体集通用问答政务领域,中国移动旗下移动云发布的政务智能体集通用问答、事项指引、个性定制、热点报告四大功能于一体。可对用户提问“秒回”并提供可视化指引,推动基层政务平台减负。教育领域,科大讯飞发布的星火教师助手具备对话、教学设计等多个模块,推动教师教学创新、提高思维能力。教师仅需语音下达指令,系统便能迅速结合班级数据诊断班级学情。法律领域,联想联合图灵法思共同发布的联想法思AI律师助手包含争议解决、法务咨询等八大功能,提高法务处理效率。用户将案件材料上传后,助手会自动梳理案情、整理要素。诊断性但耗时的任务,包括预约准备、术前术后电话沟通等。其也可根据用户需求提供入院、服务设施等信息。工业领域,西门子发布计、规划、工程等五大功能,可独立执行完整工业工作流程。设计工程师可借助其处理复杂任务。政务教政务教育电信电信工业工业Miner智能体包含智能规划、数据连接、预置知识、报告生成等核心功能,助力企业即时获取、整理、分析、洞察数据,提升工作效率,推动数据向精准决策转化。金融领域,容联云容犀Copilot&Agent,其七个业务智能体覆盖智能质检、知识管理、坐席辅助与业务分析等核心场景,实现营销-销售-客服-运营全链路提质增效。法律营销金融医疗资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights企业智能体具备任务处理能力,作为具备自主决策能力的“数字员工”,为企业级用户提供多样化解决方案。一方面,不同行业先后涌现出适配自身工作流的智能体解决方案。在制造业中,企业智能体助力优化生产流程;在互联网行业中,企业智能体可被用于前期产品研发并协助销售服务。另一方面,企业内部办公场景中,智能体可作为企业后台支持部门的智能助手,协助处理日常行政、人力资源、财务管理等工作,帮助企业降本增效。企业智能体展现出广泛应用价值,正成为推动企业数字化转型战略决策数据分析智能体制造流程采购供应链智能体物流运输采购供应链智能体物流运输供应链智能体设备智能体制造智能体设备智能体制造智能体品控智能体前期规划产品研发研发智能体前期规划产品研发研发智能体销售智能体行业洞察智能体客服智能体实施部署交付验收非制造流程邮件管理智能体员工培训智能体邮件管理智能体员工培训智能体会议纪要智能体文档生成智能体差旅管理智能体后台支持法务智能体资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights序的开发和集成变得更加简单,使得开发者能够以一致的方式将各种数据源、工具和功能链接到AI模型,为特定API接口特定API接口特定API接口本地文件网页服务数据库本地文件网页服务三个核心组件协同运作,实现AI应用与外部工具和数据特定API接口特定API接口网页服务数据库本地文件资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights协议可在无需框架或供应商的情况下实现智能体在不同生态系统间的协作,由此推动智能体在更广泛场景中资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights负责提供命令行交互体验。上下文管理负责提供命令行交互体验。上下文管理“记忆”,负责收集和组织代码相关信息。由项目结构、代码内容,版本控制和配置信息实现。工具系统“手脚”,使之实现与外部环境交互。系统内有文件工具、执行工具,分析工具和元工具。核心引擎核心引擎“大脑”,负责协调各组件工作,由消息系统、查询引擎、工具调度器构成。输出渲染器负责格式化并展示AI响应和工具执行结果。输入处理器负责解析用户指令,支持多种输入模式(自然语言、命令、代码等)。码库,智能搜索可实现无需手动选择文本亦能理解项目结构与上下文关系。阅读问题、编写代码、运行测试到提交PR的完整工库与上下文关系的深度理解高效执行真正可用的多资料来源:Anthropic,至顶智库结合公开资料©2025.9ZDInsights明略科技作为数据智能应用软件提供商,为企业用户提供以数据分析为核心的产品服务。以明略大模型秒针系统、金数据、微伴助手,以及明智会话、明奇科技、明胜品智在内的全栈智能化产品及解决方案。基智能规划、数据连接、预置知识和报告生成等多种功能。明略科技相关产品协同发力,旨在推动全球企业加速智能化转型进程。数据转变为结构化文件提出研究任务获取数据数据转变为结构化文件提出研究任务获取数据明智会话爱投明奇科技形成报告数据可视化分析数据明奇科技秒针系统金数据明胜品智微伴助手资料来源:明略科技,至顶智库整理绘制。4.智能硬件及4.智能硬件及AI应用进展AIPC©2025.9ZDInsights重优势:硬件层面,夸克AI眼镜进行系统重构,采用双芯双系统设计;AI能力音指令到自然对话系统的跨越;生态整合层面,夸克AI眼镜深度融合阿里及支付宝生态,为用户带来更智能、品牌及产品品牌及产品AI功能计算平台续航能力小米AI眼镜夸克AI眼镜AI助手、拍摄、音乐播放、免提通信、翻译AI助手、拍摄、语音通话、支付AI助手、拍摄、音乐播放、语音通话、出行提醒、导航、支付、购物、翻译、提词AI助手、拍摄、音乐播放、导航、翻译AI助手、拍摄、音乐播放、导航、翻译、提词AI助手、拍摄、导航、翻译、购物、社交耗处理芯片功耗协处理器紫光展锐穿戴式芯片典型续航4h3h音乐播放4h连续蓝牙电话典型续航3h资料来源:至顶智库结合公开资料整理绘制。AIAI眼镜功能AI眼镜功能时环境获取一系列建议和解时环境获取一系列建议和解拍摄:按下捕获按钮或说摄超高质量的照片和视频。音乐:内置蓝牙扬声器与麦克风提供音频播放与捕捉服免提通信:通过AI眼镜实现文本发送、语音及视频通话翻译:提供法语、意大利语、西班牙语和英语的实时翻译AI助手:基于夸克多模态大模型,实现百亿级图片检索与专增强模式优化夜景拍摄效果,AI算法实现超帧边分,高性能导航:通过导航软件随时随地定制近眼显示导航系统。支付:通过眼镜扫码与声纹识别实现安全支付。出行提醒:夸克眼镜联合飞猪旅行等应用,绑定用户行程,时刻提醒出行计划。购物:夸克眼镜联合拍立淘,实现海量商品搜索与比价。资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights信息反馈;小米的自动导航通过提取消息的地理位置并自动发送至地图实现导航。超级小爱超级小爱识图问答屏幕圈搜识图问答):文档问答文档问答动画、插画和涂鸦等风格。可长按相机按钮拍摄物体图片并提升自然语言处理能力,具备上下文理解能力及更自然的对话体资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights场景中的智能体验。同时,端侧大模型+个人云的时,保障用户的数据隐私。联想现已形成覆盖笔记本、台式机、工作站与服务器的全方位产品矩阵,不断丰供个性化智能服务,实现多模态自然语言交互、个人大模型部署以及本地知识库搭建等一系列操作。针对法律行业痛点,联想打造联想法律智能体,该法律智能体共包含“争议解决、法务咨询、合规管理、合同管理、知识产权、公司治理、资源管AIPC在个人与公有两方面与大模型深度融合,形成AIPC在个人与公有两方面与大模型深度融合,形成助端侧大模型部署+个人云方案成功化解“高性能、低成本、安全可靠”难以兼得的困境。端云协同AIPC在端侧设备上实现大模型的部署与运行,用户可基于端侧模型完成文档的总结、撰写等一系列任务,充分保障数据隐私与离线可用性。资料来源:至顶智库结合公开资料整理绘制。产品类型产品型号产品功能同时,天禧智能体全面血版大模型,在响应速度、复杂指令执行与跨端任务执行等方面性能得到显著优化。为开发者测试、微调或推理最新一代推理型服务器训练、大规模建模等场服务器资料来源:至顶智库结合公开资料整理绘制。©2025.9ZDInsights端到端自动驾驶为高级别自动驾驶发展提供全新的技术路径。基于统一的神经网络从传感器数据输入直接到控制指令输出的连续学习与决策过程。核心技术主要体现在数据采集标注、训练算法、模型设计训练、模型压缩等方面。端到端自动驾驶模型依赖数据闭环实现算法性能持续提升;训练算法旨在通过数据闭环建立原始传感器输入到驾驶规划控制指令的映射,提高自动驾驶系统性能和安全性;模型设计训练分为“分模块模型”和“单模型架构”两种;模型压缩主要包括模型剪枝、模型量化和编译优化,旨在降低网络计算需求,提升车载计算平台的运行速度。数据采集标注模型设计训练融合多模态大模型的数据采集标注模型设计训练融合多模态大模型的端到端自动驾驶分模块“端到端”模型单模型“端到端”架构单模型“端到端”架构感感知预预测控控制模型压缩技术典型训练算法保留参数被剪枝参数强化学习强化学习不依赖于带有驾驶操作标签的驾驶数据,通过车辆与环境的交互优化和探索试错,逐步提升驾驶性能。监督学习监督学习是对人类驾驶员示范数据的模仿,依托模型输出和驾驶员决策控制量的差值对驾驶模型进行迭代更新。模型剪枝模型量化模型压缩技术典型训练算法保留参数被剪枝参数强化学习强化学习不依赖于带有驾驶操作标签的驾驶数据,通过车辆与环境的交互优化和探索试错,逐步提升驾驶性能。监督学习监督学习是对人类驾驶员示范数据的模仿,依托模型输出和驾驶员决策控制量的差值对驾驶模型进行迭代更新。模型剪枝模型量化编译优化校检数据校检数据资料来源:李升波,江昆等:汽车智能驾驶技术发展与趋势展望,前瞻科技,至顶智库结合公开资料整理绘制。©2025.9ZDInsights接映射到控制输出的完整闭环能力,不仅关注环境感知,也关注规划与控制问题©2025.9ZDInsights局限,实现从信息搜集到深度洞察的跃迁。深度研究由任务拆解、信息搜索、分析推理,交叉验证和结果输出五个核心步骤构成,可实现输出结果的专业严谨。该功能正逐步成为现代知识工作者(如研究人员、分析师、驱动复杂问题解决与知识创新的关键应用。1来源,权衡可1来源,权衡可靠性,保证结论严谨可信。任务拆解任务拆解 信息搜索分析推理交叉验证系统在相关平台定位检索高价值信息,基于时效性系统在相关平台定位检索高价值信息,基于时效性、可信度等多维标准过滤出高质根据用户需求生成格式规范的报告、论文、结论提供引用来源,确保成果专业可靠。运用逻辑推理与知识图谱技术,对已收集信息进行深度分析和推导,并根据新信息继续完善补充。 结果输出5资料来源:至顶智库结合公开资料整理绘制。1122细化拆解用户指令在用户发出生成描述汽车行业过去五年变化的报告并附带表格的指令后,GPT-5进一步细化拆分目标任务要求并向用户发出信息确认请求。5生成标准化行业报告5在完成推理与验最终返回给用户一份格式规范、详实且兼具专业度的关于全球汽车行业过去五年变化的行业报告。威性等多重标准在国际能源署、爱立信、麦肯锡、益博睿等官方网站平台搜集信息,整理编搜集整理高质量信息©2025.9ZDInsights的解决方案。从全球格局来看,AI编程已进入规模化应用阶段,国外以基础模型创新和自主智能体开发为主导,重视通用性与开发者体验;而国内重视工程化工具链整合,强调行业落地与本土化适配,形成差异化竞争格局。从编程环节来看,基于大规模预训练模型的代码生成系统能够准确理解开发者意图,完成从自然语言描述到可执行代码的转换,同时支持多编程语言和复杂算法实现,可针对特定代码库提供优化建议,实现代码补全、错误识别到代码优化的闭环。按部署方式划分国外国内独立IDE/平台型按部署方式划分国外国内独立IDE/平台型国外国内插件/辅助集成型你通义灵码按功能划分代码补全国国外国国内代码生成国国外国国内资料来源:至顶智库结合公开资料整理绘制。5.全球5.全球AI企业最新布局©2025.9ZDInsights搭统B300作为AI基础设施平台,为数据中心提供高效的生成式AI和AI推理功能。超级芯片,搭载36构GPU具有2080亿晶体管。采用台积电4NP工艺。代AI芯片代AI芯片Rubin亮相,密集FP4计算能力,相比B300提升超过3密集FP4浮点运算性NVIDIABlackwell架构适用于大规模推理AI场景,HopperGPU高出30倍,并支持实时性能下的高吞吐量。通过优化BlackwellUltraGPU并行化策略(专家/张量/流水线)和跨GPU管理,基于BlackwellUltra的GB300系统推理效能相比3TensorCoreGPU具有800亿晶体管,适用范围广泛,涵盖从小型企业到百亿亿级高性能计算,再到万亿参数的人工智第四代张量核心与A100相比,芯片间速度最高可达6倍,包括每个流式多处理器(SM)的加速、额外SM数量以及更高的时钟频率。全新Transformer引擎结合软件和专门设计的Hopper张量核心技术,专门用于加速Transformer模型的训练和推理。©2025.9ZDInsightsNVIDIACUDA-XNVIDIACUDA-X基于CUDA®构建,包含用于构建应用的多种微服务、库、工具和技术,CUDA-X可为人工智能、高性能计算(HPC)等应用领域带来性能的提升。CUDA-X库基于CUDA构建,凭借400多个库,开发者可以使用CUDA平台构建、优化、部署和扩展各类应用。AI应用开发涉及数据处理、特征工程、机器学习、验证和部署等环节,每个环节要处理CUDA-XAI包括:cuDNN(深度Retriever(企业级检索增强生成工具)等工具,支持从数据预处理到模型部署的全流©2025.9ZDInsightsNeMoGuardrailsNeMoGuardrails是可扩展的护栏编排平台,用于确保LLM交互的安全性、精度和主题相关性。NeMoCurator通过大规模处理文本、图像和视频数据进行训练和定制,提高生成式AI模型的精度。并具有较高的准确性和更NeMoCustomizer作为可扩展的高性能微服务,可针对特定领域用例简化LLM的微调和对齐。台通过学术和自定义基准测试对生成式AI模型和工作流进行评估。√√©2025.9ZDInsights景扩展为数十亿的有效里程,大幅增加实现安全和先进自动驾驶功能所需的数据集规模。机器人场景中,1)操作人员使用AppleVisionPro进入数字孪生系统;2)操作人员通过少量远程操作演示捕捉动作轨迹;3)通过IsaacGR00T运动合成系统将少量运动轨迹扩展为更大规模的数据集;4)利用IssacSim和Cosmos所构建的GROOT-Gen进行3D图像放大;5)在软件系统中进行测试验证,最终部署到物理机器人。©2025.9ZDInsights硬件层硬件产品芯片硬件产品©2025.9ZDInsights有大幅改进,不仅可以对人物和宠物进行精准编辑,保持特征一致,还能实现多图合成、多轮次修改与风格迁移等复杂操作,并融入现实世界知识。术,尺寸更小的混合推理架构模时兼顾,在推理、多模态、术,尺寸更小的混合推理架构模时兼顾,在推理、多模态、代码和长上下文的关键基准上性能表现得到了改进,同时效率更高,是2.5系模型中速度最快、性价比思考模型,在推理方面一系列基准测试中达到SOTA水平;编程方序和代理代码应用程序,以及代型能够在做出反应之前考虑多种角色角色一致性支持将同一角色置于不同场景、展示产品在多角度与多环境下的效果,或生成统一精准图像精准图像编辑支持通过自然语言进行精准的局部编辑与目标性转换。可实现背景模糊、删除照片中的人物、调整主体姿势,等多样化操作。世界知识突破语义理解的局限,开辟全新应用场景。多图像多图像像。通过单一提示将物体置入新场景、为房间重新设计配色或纹理,或生成逼真的多图融合图像。©2025.9ZDInsights
最新资讯
相关资讯
-
这手机的“AI抠图”相当于小半个Photoshop,会用吗?
-
2025年雅思软件排行榜大揭秘!这8款免费神器深度评测,这款脱颖而出成备考首选!
-
剪映 for Mac(抖音视频编辑工具) v9.8.0 官方免费专业版
-
ai 绘画app 软件,指尖绘梦,AI绘画APP助你创作无限可能——全方位软件评测攻略
-
这脑洞神了!两AI「互喷」,竟治好祖传科研软件95%老毛病?
-
AI工具推荐!10个免费好用的ChatGPT平替工具
-
新浪AI热点小时报丨2026年01月15日07时
-
【六学AI加盟】六学AI加盟条件
-
什么是 AGI?— 通用人工智能详解 — AWS 和另外 10 个页面
-
BabolAI app下载安装
