如果说2023年大模型的爆发是“AI的iPhone时刻”,那么2025年则被广泛视为“智能体(AI Agent)元年”。这一年,在 AI 泡沫论的争议声中,智能体赛道却迎来逆势爆发:中国智能体市场规模从 2024 年的 47.5 亿元跃升至 78.4 亿元,增幅超 60%。Gartner预测,到2028年,至少15%的日常任务将由AI智能体自主完成,33%的企业应用会嵌入智能体驱动的智能模块。
不同于传统 AI 助手给方法不落地的 “嘴炮” 属性,智能体是由大模型驱动,能自主完成感知、思考、决策和执行的全闭环软件程序。然而,单一智能体的强大仅是AI发展的序章,真正的技术飞跃在于实现大规模异构智能体的互联与协同。中国工程院院士、中国工程院原副院长邬贺铨院士指出,智能体将经历三个阶段:
- 第一阶段:单智能体聚焦特定场景;
- 第二阶段:多智能体协同通过中心化编排层实现跨领域合作;
- 第三阶段:最终走向智联网,依托区块链、联邦学习实现开放式异构智能体协作,广泛应用于智慧城市、智能制造等领域,成为人类的数字化身。
面对这一趋势,业界亟需重新思考智能系统的底层基础设施,一种新型网络范式应运而生——智能体互联网(Internet of Agents, IoA)。移动、联通、华为、清华、北大、北邮和腾讯等组织与机构纷纷投身于IoA架构与关键技术的探索之中。(文末附相关资料下载)
一、从连接信息到连接智能
从互联网、物联网到智能体互联网,人类对“连接”的探索从未停止。每一次连接对象的升级,都带来了生产力和生活方式的变革。
- 互联网:连接“人”与信息
上世纪90年代兴起的传统互联网,核心使命是连接全球的人和信息。依托TCP/IP协议,它搭建了一个以人为中心的网络,通过浏览器访问网页、用邮箱传递邮件、在社交平台分享生活,所有交互都围绕人的需求展开,数据传输的核心是文本、图片、音频等人类可识别的内容。本质上是一个由人发起请求、系统给予响应的“查询式”网络。
- 物联网:连接“设备”与数据
随着传感器和嵌入式技术的发展,物联网(IoT)将连接对象拓展到了物理设备。物联网通过端-边-云架构,完成设备间的数据采集与自动化控制,实现了世界的数字化感知。但物联网的核心是连接物与数据,设备的行为依赖预设规则,缺乏自主决策能力。本质上是一个由事件触发、设备上报的“反应式”网络。
- 智能体互联网:连接“自主智能体”
智能体互联网的诞生源于一个简单但深刻的洞察:当AI智能体逐渐成为数字世界中的活跃公民,互联网需要重新定义其连接方式。正如互联网连接了人,物联网连接了设备,智能体互联网则专注于智能体之间的交互。它突破了单智能体能力的限制,打破厂商自有多智能体框架的束缚,以开放互联的形式构建一个智能体之间可以实现平等互通、互联协作、互惠互利的平台。在智能体互联网中,AI不再只是信息处理的工具,而将成为能够独立感知、决策和协作的数字实体。
虽然都依托网络实现连接,但IoA在核心目标、交互模式等方面,与传统互联网、IoT有着本质区别,具体可从以下几个维度清晰区分:
二、智能体互联网的核心架构
IoA采用分层架构,包括基础设施层、智能体管理层、智能体协调层和智能体应用层。这一架构支持智能体在不同设备和环境中的无缝协作,同时确保系统的可扩展性和安全性。
- 基础设施层:整合AI模型、数据、计算和通信资源,为智能体提供运行环境。该层包括云、边缘和终端设备上的计算资源,支持多模态数据输入和处理。
- 智能体管理层:负责智能体的身份管理、能力发现和生命周期管理。通过去中心化标识符(DIDs)实现智能体的自主识别和跨域认证,同时支持动态的能力更新和发现。
- 智能体协调层:管理分布式任务执行和智能体协作,支持任务分解、流程编排和自适应通信协议。该层还负责冲突解决和共识机制,确保在动态环境中智能体的高效协作。
- 智能体应用层:提供标准化的接口和语义对齐,支持跨域智能体生态系统的无缝集成。该层促进跨模态、语义和知识层面的整合,使智能体能够在复杂环境中协同工作。
IoA中的智能体分为虚拟智能体和实体智能体两大类:
- 虚拟智能体:完全在数字环境中运行,包括聊天机器人、虚拟助手和客户服务智能体等。它们利用高带宽网络连接处理大规模语言模型,并通过图形、语音或可穿戴界面与用户交互。
- 实体智能体:如家庭机器人、无人机和自动驾驶车辆,通过传感器和执行器感知和操作物理世界。它们依赖于无线通信进行远程协调,并在动态环境中执行复杂任务。
无论哪种类型,都具备四大核心功能,确保其能独立完成任务并参与协作:
- 规划模块:利用大型模型进行高级推理、任务分解和决策制定,支持反馈驱动和反馈增强的规划方法。
- 记忆模块:维护短期上下文和长期知识,支持智能体的持续学习和个性化行为。
- 交互模块:实现智能体之间以及智能体与人类和环境之间的多模态通信,支持语义协议和结构化知识交换。
- 行动模块:将计划转化为实际行为,通过执行器操作物理设备或调用外部服务,同时监控执行结果并调整行为策略。
三、智能体的沟通语言
要让成千上万的智能体顺畅协作,必须有统一的沟通语言,即标准化的通信协议。这些协议是智能体互联网跨生态互联的核心,有效解决了智能体信息孤岛问题。目前,智能体通信协议已形成一个生态系统,从基础的工具交互到智能体间协作,再到前端应用交互,形成完整的技术链条。
由Anthropic推出的Model Connection Protocol(MCP),核心在于解决大模型智能体与外部工具和数据的连接问题。它如同AI世界的“USB-C接口”,通过标准化的客户端-服务端架构,让智能体能够安全、规范地调用各类API、数据库和外部服务,极大地扩展了单一智能体的能力边界。
谷歌开源的Agent-to-Agent(A2A)协议致力于实现智能体间的直接对话与任务协同。它定义了智能体如何互相发现、交换Agent Card并直接通信,旨在打破不同供应商和框架智能体之间的壁垒,推动跨企业、跨生态的智能体协作,已获得众多科技巨头的支持。
由CopilotKit团队发起并开源的Agent-User Interaction Protocol(AG-UI)协议,旨在解决AI智能体与前端应用之间的交互标准化问题,提供一个轻量级、事件驱动的开放协议,实现AI智能体与用户界面的实时双向通信。
国际人工智能联盟主导的Agent Network Protocol(ANP)更侧重于构建底层的网络基础设施。它采用纯P2P(点对点)架构,旨在成为智能体互联网时代的“HTTP协议”,为大规模、去中心化的智能体网络提供安全、高效的通信基础,确保网络的弹性和可扩展性。
牛津大学提出的Agora协议,则是一种面向未来的“元协议”思路。它不规定固定的通信格式,而是提供一套让智能体能够根据任务需求,自主协商和创建临时通信规则的机制,从根本上解决了传统协议在灵活性、效率与可移植性之间的“不可能三角”难题。
北邮智能体互联网研究小组提出的 Agent Collaboration Protocols(ACPs)协议族,涵盖智能体注册协议(ARP)、智能体发现协议(ADP)、智能体交换协议(AIP)、智能体工具协议(ATP)等多个功能领域,尝试从更加全局化的视野,为智能体互联网的坚实发展提供新的思路和方法。
这些协议虽架构与定位各异,有的聚焦工具调用,有的侧重企业级互联,有的追求开放去中心化,有的补全功能覆盖,但共同构成了一个多层次、互补的通信协议生态。正是这些不断演进的标准,为智能体从信息孤岛走向协同网络铺平了道路,驱动着智能体互联网从概念走向大规模应用。
四、智能体互联网的挑战与未来
作为下一代智能基础设施,智能体互联网的规模化落地仍面临诸多挑战,而这些挑战也正是未来的核心研究方向:
-
标准化与互操作性:智能体互联网的广泛应用需要统一的标准和互操作性框架。未来的研究应聚焦于开发标准化的智能体描述语言和轻量级通信协议,支持跨平台和跨域的无缝集成。
-
安全与适应性通信协议:设计安全、适应性强的通信协议是IoA面临的重要挑战。未来的协议应支持实时自适应调整,以应对动态变化的角色、上下文和能力需求。同时,需要解决现有协议中的安全漏洞,确保智能体生态系统的安全性和可靠性。
-
去中心化与自治理智能体生态系统:随着IoA向去中心化架构发展,未来的生态系统应支持智能体的自组织和自适应治理。同时,需要建立有效的激励机制和信任机制,促进智能体之间的长期合作和公平竞争。
-
隐私保护与合规性:在IoA中,智能体处理大量敏感数据,隐私保护和合规性成为重要问题。未来的研究应探索上下文感知和任务驱动的隐私设计,使智能体能够在动态环境中动态调整隐私策略。
-
伦理与责任的边界界定:随着智能体自主决策能力增强,伦理和责任划分成为难题:当智能体协作造成失误时,该由开发者、运营商还是智能体本身担责?
五、小结
智能体互联网不仅是技术的演进,更是数字文明的跃迁。它代表着互联网从“连接人”到“连接智能体”的转变,从“信息互联”到“智能体互联”的升级。随着智能体互联网的架构日益清晰、协议逐步落地、生态持续壮大,一个真正意义上“人、机、智”三元融合的智能文明新时代,正徐徐展开。
究模智后台对话框回复1214智能体互联网获取相关资料!
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
保证100%免费
