作者

Anna Gutowska

AI Engineer, Developer Advocate

IBM

什么是 AI 智能体?

人工智能 (AI) 智能体是一种通过使用可用工具设计工作流来自主执行任务的系统。

AI 智能体的功能范围远不止自然语言处理,还包括决策制定、问题求解、与外部环境交互以及执行各种操作。

AI 智能体解决企业应用程序中的复杂任务,包括软件设计、IT 自动化、代码生成和对话协助。它们使用大语言模型 (LLM) 的先进自然语言处理技术,逐步理解和响应用户输入,并确定何时调用外部工具。IBM AI 智能体平台支持客服自动响应、文档助手、业务流程协助等多种应用场景,帮助企业提升运营效率、降低运营成本,加速数字化转型。 

AI 智能体的工作原理

AI 智能体的核心是大语言模型 (LLM)。因此,AI 智能体通常被称为 LLM 智能体。传统的 LLM(例如 IBM® Granite 模型)根据用于训练它们的数据生成响应,并且受知识和推理限制。相比之下,智能体技术通过工具调用在后台获取最新信息、优化工作流并自主创建子任务,从而实现复杂的目标。

在此过程中,自主智能体会随着时间的推移而学着适应用户的期望。此智能体可将过去的交互存储在记忆中并计划未来的行动,从而提供个性化的体验和全面的响应。1 此工具调用可在没有人工干预的情况下实现,并可拓宽这些 AI 系统在现实环境下的应用可能性。这三个阶段或智能体组件定义了智能体如何运作:

目标初始化和规划

虽然 AI 智能体的决策流程为自主流程,但它们需要由人工确定的目标和预先定义的规则。2自主智能体行为的主要影响因素有三个:

  • 设计和训练智能体式 AI 系统的开发团队。 
  • 部署智能体并为用户提供访问权限的团队。
  • 为 AI 智能体提供要完成的具体目标并建立要使用的可用工具的用户。

考虑到用户的目标和智能体的可用工具,AI 智能体随后会执行任务分解以提高性能。3本质上,智能体会创建一个包含特定任务和子任务的计划来实现复杂的目标。

对于简单任务,规划不是必要步骤。相反,智能体可以迭代地反映其响应并改进它们,而无需规划其后续步骤。

使用可用工具进行推理

AI 智能体会根据它们感知到的信息来采取行动。然而,它们往往缺乏处理复杂目标中每个子任务所需的全部知识。为了弥补这一差距,它们求助于可用的工具,例如外部数据集、网络搜索、API 甚至其他智能体。

一旦收集到缺失的信息,智能体就会更新其知识库并进行自主推理。这一过程包括不断重新评估其行动计划并进行自我修正,从而做出更明智、更适配的决策。

为了帮助说明这一过程,请想象一个用户正在计划自己的假期。用户要求 AI 智能体预测明年哪一周的天气最适合它们在希腊的冲浪之旅。

由于作为智能体核心的 LLM 模型并不专用于天气模式,因此它不能仅仅依赖其内部知识。因此智能体从外部数据库中收集信息,该数据库包含希腊过去几年的每日天气报告。

尽管可获得这些新信息,但智能体依然无法确定冲浪的最佳天气条件,因此会创建了下一子任务。对于该子任务,智能体会与专门负责冲浪的外部智能体进行通信。假设在此过程中,智能体了解到涨潮、阳光明媚的天气外加几乎无雨的情况下可提供最佳冲浪条件。

智能体现在可以组合从其工具中学到的信息来识别模式。它可以预测明年希腊的哪一周可能会有高浪、晴天和较低的降雨可能性。然后将这些发现呈现给用户。这种工具之间的信息共享使 AI 智能体比传统的 AI 模型更通用。3

学习与反思

AI 智能体会使用其他 AI 智能体和“人在回路”(HITL) 等反馈机制来提高其响应的准确性。为强调这一点,让我们回到之前的冲浪示例。在智能体对用户形成响应之后,它会将学习到的信息与用户的反馈一同存储,以便提高性能并根据用户对未来目标的偏好进行相应调整。

如果使用了其他智能体来实现此目标,它们的反馈也可能会被使用。多智能体反馈在最大限度缩短人类用户提供指导所花费的时间方面特别有用。但是,用户也可在整个智能体的动作和内部推理过程中提供反馈,以使结果与预期目标更趋一致。2

反馈机制提高了 AI 智能体的推理能力和准确性,这通常被称为迭代改进。3为了避免重复同样的错误,AI 智能体还可以在知识库中存储有关先前障碍解决方案的数据。

行业时事通讯

辅以专家洞察分析的最新科技新闻

通过 Think 时事通讯,了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明 。

谢谢!您已订阅。

您的订阅将以英语提供。您会在每份时事通讯中找到一个取消订阅链接。您可以在此管理您的订阅或取消订阅。更多相关信息,请参阅我们的《IBM 隐私声明》。

智能体型与非智能体型人工智能聊天机器人

AI 智能聊天机器人使用对话式 AI 技术(如自然语言处理 (NLP))技术来理解用户问题并自动回复。这些聊天机器人是一种模式,而智能体则是一种技术框架。

非智能体式 AI 聊天机器人缺少可用的工具、记忆和推理能力。它们只能实现短期目标,且无法提前规划。据我们所知,非智能体式聊天机器人需要用户持续输入信息才能进行响应。

它们可对常见提示做出响应,而这些提示很可能符合用户的期望,但在仅针对该用户及其数据的问题方面表现不佳。由于这些聊天机器人没有记忆,因此当它们的回复无法令人满意时也无法从错误中吸取教训。

相比之下,智能体 AI 聊天机器人会随着时间的推移学着适应用户期望,从而提供更为个性化的体验和全面的响应。它们可通过创建无需人工干预的子任务并考虑不同的计划来完成复杂的任务。这些计划也可按需进行自我更正和更新。与非智能体聊天机器人不同,智能体 AI 聊天机器人会评估它们的工具,并使用自身的可用资源来填补信息空白。

AI 学院

成为 AI 专家

获取相关知识,以确定 AI 投资的优先级,从而推动业务增长。立即开始观看我们的免费 AI 学院视频,引领 AI 在组织中的未来应用。

推理范式

没有一种用于构建 AI 智能体的标准架构。存在几种解决多步骤问题的范式。

ReAct(推理与行动)

通过 ReAct 范式,我们可以指示智能体在采取每次行动和每个工具响应后进行“思考”和计划,以决定下一步使用哪个工具。通过这些"思考-行动-观察"循环,逐步解决问题,并不断改进应对措施。

通过提示结构,可以指示智能体缓慢推理并显示每个“想法”。4通过智能体的语言推理,我们可以了解如何做出反应。在这个框架中,智能体会根据新的推理不断更新其上下文。这种方法可以被解释为一种思路链提示的形式。

ReWOO(无观察推理)

与 ReAct 不同,ReWOO 方法消除了行动规划对工具输出的依赖。相反,智能体会提前制定计划。在收到用户的初始提示后,可预测使用哪些工具,从而避免重复使用工具。从以人为本的角度来看,这种方法是可取的,因为用户可以在执行计划之前确认计划。

ReWOO 工作流由三个模块组成。在计划模块中,智能体根据用户的提示预测其后续步骤。下一阶段需要收集通过调用这些工具生成的输出。最后,智能体将初始计划与工具输出配对以制定应对措施。这种提前的计划可以大大降低令牌的使用和计算的复杂性,以及中间工具故障的影响。5

AI 智能体的类型

什么是 AI 智能体?企业智能代理平台 | IBMCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret rightCaret right

AI 智能体可开发出不同程度的能力。对于简易目标,可能会将简易智能体作为首选,以限制不必要的计算复杂性。按照从最简单到最先进的顺序进行排序,共有 5 大智能体类型:

1. 简单反射智能体

简单反射智能体是最简单的智能体形式,它会根据当前感知来制定行动。如果缺少信息,此智能体则不会保存任何记忆,也不会与其他智能体交互。此类智能体会根据一组所谓的反射或规则来工作。这意味着,此智能体会经过预编程以便执行与满足的特定条件相对应的动作。

如果智能体遇到未做好相应准备的情况,它便无法做出适当的响应。在完全可观察的环境中,智能体能够有效地获取所有必要的信息。6

示例:如果是晚上 8 点,则表示供暖启动——以每晚在设定时间打开供暖系统的自动调温器为例。

简单的反射智能体图

2. 基于模型的反射智能体

基于模型的反射智能体利用其当前的感知和记忆来维护世界的内部模型。随着智能体继续收到新信息,模型也会更新。智能体的行为取决于其模型、反射、先前的感知和当前的状态。

这些智能体与简单的反射智能体不同,可以将信息存储在内存中,并可以在部分可观察和变化的环境中使用。然而,它们仍然受到其规则的限制。6

示例:吸尘器机器人。在清扫脏乱的房间时,它会感知到家具等障碍物并进行调整。机器人还存储了已清洁区域的模型,以避免陷入重复清洁的循环中。

基于模型的反射智能体图

3. 基于目标的智能体

基于目标的智能体具有内部世界模型,以及一个或一组目标。此类智能体会搜索达到其目标的行动序列,并在采取行动之前对这些行动进行规划。与简单智能体和基于模型的反射智能体相比,此搜索与规划能力可提高其有效性。7

示例:导航系统会推荐到达目的地的最快路线。该模型考虑了到达您的目的地(或者换句话说,您的目标)的各种路线。在此示例中,智能体的条件操作规则规定,如果找到更快的路由,智能体会推荐该路由。

基于目标的智能体图

4. 基于效用的智能体

基于效用的智能体不仅会选择能够达到目标的动作序列,还会最大化效用或奖励。效用是通过一个效用函数来计算的。此函数会根据一组固定标准为每个场景分配一个效用值;即,用于衡量动作的有用性或它可让智能体达到的“满意”程度的指标。

此标准可包括实现目标的进度、时间要求或计算复杂性等因素。然后,智能体会选择能使预期效用最大化的行动。因此,当多个场景均能实现所需目标且必须选择最佳场景时,此类智能体将非常有用。7

例如:导航系统可为您推荐前往目的地的路线,以优化燃油效率,最大限度地减少交通时间和过路费用。该智能体通过这组标准来衡量效用,以选择最有利的路线。

基于效用的智能体的示意图

5. 学习智能体

学习智能体具有与其他智能体类型相同的功能,但其学习能力是独一无二的。新的体验被添加到它们最初的知识库中,这是自主发生的。这种学习增强了智能体在不熟悉的环境中工作的能力。学习智能体的推理可能基于效用或目标,并由四个主要元素组成:7

  • 学习:这一过程是指通过环境中的规则和传感器进行学习,从而提高智能体的知识水平。
  • 批评者:此组件向智能体提供反馈,说明其回复质量是否符合性能标准。
  • 执行:该要素负责在学习后选择行动。
  • 问题生成器:该模块生成各种可采取的行动方案。

示例:电子商务网站上的个性化推荐。这些智能体在其记忆中跟踪用户活动和偏好。这些信息用于向用户推荐某些产品和服务。每次提出新的建议,都会重复这样的循环。用户的活动会被持续存储以供学习目的。这样,智能体就能不断提高其准确性。 

学习智能体图

AI 智能体的用例

客户体验

AI 智能体可以集成到网站和应用程序中,通过充当虚拟助理、提供心理健康支持、模拟面试和其他相关任务提升客户体验。8有许多 无代码模板 可供用户实施,使创建这些 AI 智能体的过程变得更加简单。

医疗保健

AI 智能体可用于各种实际的医疗保健应用。多智能体系统对于解决此类环境中的问题很有用。从急诊科患者的治疗计划到药物流程的管理,此类系统可为医疗专业人员节省时间和精力,以便他们能完成更紧急的任务。9

应急响应

如果发生自然灾害,AI 智能体可以使用深度学习算法来检索社交媒体网站上需要救援的用户的信息。可以绘制这些用户的位置图,以协助救援服务在更短的时间内拯救更多的人。因此,AI 智能体在日常重复任务和拯救生命的情况下都可以极大地造福人类生活。10

财务和供应链

可以设计智能体来分析实时财务数据、预测未来市场趋势并优化供应链管理。自主 AI 智能体的可定制性为我们提供了独特数据的个性化输出。在处理财务数据时,实施确保数据隐私的安全措施非常重要。

AI 智能体的优点

任务自动化

随着生成式 AI 和机器学习的持续发展,通过 AI 实现工作流优化,即智能自动化,正日益受到关注。AI 智能体是一种 AI 工具,它们可自动执行原本需借助人力资源来完成的复杂任务。这种转变意味着可以经济、快速且大规模地实现目标。因此,这些进步使得人类智能体不必为 AI 助手提供创建和浏览任务所需的指示。

更高的性能

多智能体 框架 往往优于单个智能体。11 这是因为智能体可用的行动计划越多,学习和反思就越多。

一个 AI 智能体如果能从其他相关领域的专业  AI 智能体 那里获得知识和反馈,对信息合成非常有用。AI 智能体的这种 后端 协作和填补信息空白的能力是智能体框架所独有的,这使它们成为人工智能的强大工具和有意义的进步。

响应质量

较之传统 AI 模型,AI 智能体可为用户提供更全面、更准确和个性化的响应。作为用户,这种适应性对我们来说非常重要,因为更高质量的响应通常会产生更好的客户体验。如前所述,这种能力是通过与其他智能体交换信息、通过工具和更新其记忆流来实现的。这些行为会自行出现,而非预先设定。12

风险和限制

多智能体依赖关系

某些复杂任务需要了解多个 AI 智能体的知识。这些多代理框架的编排存在发生故障的风险。建立在相同基础模型上的多智能体系统可能会遇到共同的缺陷。这些薄弱环节可能导致所有相关智能体的全系统瘫痪,或暴露出易受不利攻击的弱点。13这凸显了数据治理在构建基础模型以及全面的培训和测试流程方面的重要性。

人类用户通过 AI 智能体启用的不干涉推理的便利性也带来了风险。无法制定全面计划或反思其发现的智能体可能会反复调用相同的工具,导致无限的反馈循环。为避免这些冗余,可能会采用某种程度的实时人工监控。13

计算复杂性

从零开始构建 AI 智能体既是一项耗时的任务,还可能具有较高的计算成本。训练一个高性能智能体所需的资源可能非常之多。此外,根据任务的复杂程度,智能体可能需要几天时间才能完成任务。12

数据隐私

如果管理不善,AI 智能体与业务流程和客户管理系统的整合可能会引起一些严重的安全问题。例如,想象一下 AI 智能体领导软件开发过程,将编码提升到一个新的水平,或者为客户进行定价——没有任何人工监督或防护措施。由于自主 AI 的实验性和通常不可预测的行为,这种情况的结果可能是有害的。

因此,IBM、Microsoft 和 OpenAI 等 AI 提供商必须保持积极主动。它们必须实施广泛的安全协议,以确保敏感的员工和客户数据得到安全存储。负责任的部署实践是风险最小化和对这些快速发展的科技保持信任的关键。

AI 智能体最佳实践

活动日志

为解决多智能体依赖关系问题,开发人员可向用户提供智能体行动日志的访问权限。14这些行动可能包括使用外部工具以及描述用于实现此目标的外部智能体。凭借此透明度,可让用户深入了解迭代决策流程、提供发现错误的机会并建立信任。

中断

建议防止自主 AI 智能体运行过长时间。尤其是在出现意外的无限反馈循环、某些工具的访问权限发生变化或因设计缺陷而出现故障的情况下。实现这个目标的一种方法是实现可中断性。

保持对这个决策的控制涉及允许人类用户选择从容地中断一系列操作或整个操作。选择是否以及何时中断 AI 智能体需要深思熟虑,因为某些终止可能弊大于利。例如,允许故障智能体继续协助应对危及生命的紧急情况可能比将其完全关闭更为安全。5

独特的智能体标识符

为了降低智能体系统被恶意目的使用的风险,可以实施独特的标识符。如果智能体访问外部系统时需要这些标识符,那么追踪代理的开发者、部署者和使用者的来源就会变得更加容易。

这种方法增加了一层重要的问责机制。可追溯性有助于在智能体导致恶意使用或意外损害时识别责任方。最终,这种保障措施将为 AI 智能体营造更安全的运行环境。

人工监督

为了协助 AI 智能体的学习过程,尤其是在新环境中的早期阶段,提供一定程度的人工监管可能会有所帮助。因此,根据这一指导原则,AI 智能体可以将其性能与预期标准进行比较,并做出相应调整。这种形式的反馈有助于提高智能体对用户偏好的适应性。5

除此安全措施外,最佳做法是在 AI 智能体采取极具影响力的行动之前要求进行人工批准。例如,从群发电子邮件到金融交易,均需进行人工确认。7建议对此类高风险领域开展一定程度的人工监控。

热门 AI 智能体问答精选 (FAQ)

企业为什么需要 AI 智能体?
具备显著的成本节省和效率提升作用,尤其适用于高频交互、内容生产、智能决策等任务,是企业进行智能化升级的重要工具。

AI 智能体适用于哪些典型业务场景?
常见于客服机器人、文件生成助手、流程审批助手、知识查询系统、智能企业助手等场景。

IBM 的 AI 智能体平台有哪些优势?
支持对话训练、意图识别、模型定制、安全控制、系统集成与运维监控,满足不同行业对可用性与安全性的需求。

企业如何开始部署 IBM AI 智能体?
可从一个高频场景如客服响应或文档自动化开始试点,结合 IBM 的咨询服务与平台支持,通常在数周内完成上线部署。  

热门 AI 智能体问答精选

企业为什么需要 AI 智能体?
具备显著的成本节省和效率提升作用,尤其适用于高频交互、内容生产、智能决策等任务,是企业进行智能化升级的重要工具。

AI 智能体适用于哪些典型业务场景?
常见于客服机器人、文件生成助手、流程审批助手、知识查询系统、智能企业助手等场景。

IBM 的 AI 智能体平台有哪些优势?
支持对话训练、意图识别、模型定制、安全控制、系统集成与运维监控,满足不同行业对可用性与安全性的需求。

企业如何开始部署 IBM AI 智能体?
可从一个高频场景如客服响应或文档自动化开始试点,结合 IBM 的咨询服务与平台支持,通常在数周内完成上线部署。