主动式AI(代理式)与生成式AI的关键差异与影响
大型语言模型(LLMs)如GPT可以生成文本、回答问题并协助完成许多任务。然而,它们是被动的,这意味着它们仅根据已学到的模式对接收到的输入作出响应。LLMs无法自行决策;除此之外,它们无法规划或适应变化的环境。
主动式AI(代理式)的出现正是为了解决这一问题。与生成式AI LLMs不同,主动式AI(代理式)能够采取主动行动、设定目标并从自身的经验中学习。它是前瞻性的,能够随着时间的推移调整其行动,处理需要持续解决问题和决策的复杂任务。从被动到主动的这一转变,为许多行业的技术发展开辟了新的可能性。
在本系列文章中,我们将深入探讨主动式AI(代理式)与生成式AI的区别,研究它们如何影响行业及科技的未来。在这篇首篇文章中,我们将首先探索区分这两种AI的核心特点。
什么是主动式AI(代理式)
主动式AI(代理式)是指能够自主决策并采取行动以完成特定目标的AI系统。这类AI模型不仅仅是生成内容,还能与环境互动、响应变化并在最少的人类指导下完成任务。例如,具有主动式(代理式)能力的虚拟助理不仅可以提供信息,还可以安排约会、管理提醒或执行其他操作以帮助用户实现目标。同样,无人驾驶汽车也是主动式AI(代理式)的典范,因为它们能够实时决策,安全地在道路上导航并独立到达目的地。
什么是生成式AI
生成式AI是一种专注于创建新内容(如文本、图像、音乐甚至视频)的人工智能。它通过学习海量数据中的模式、风格或结构来生成基于所学内容的原创作品。例如,像ChatGPT这样的生成式AI能够根据问题生成独特的文本回复,而像DALL-E这样的图像生成模型则可以根据文本描述生成图像。简单来说,生成式AI就像一位数字艺术家或作家,通过所学内容创作出新的作品。
上图展示了主动式AI(代理式)如何通过包含“思考/研究”和“修订”等阶段的迭代循环工作流程运作。这种适应性过程涉及持续的自我评估和改进,使主动式AI(代理式)能够生成更高质量、优化的输出。通过采取多步测试和完善的方式,主动式AI(代理式)可以独立运作,从每个阶段中学习,并完成需要持续评估和调整的任务。
相比之下,生成式AI遵循一个简单的单步工作流程:从“开始”直接到“结束”。这意味着AI会立即给出响应,而不会重新审视或完善其输出。其过程是线性的,生成的结果通常只能满足初始提示的基本要求,但无法应对边缘情况或进行迭代测试。这也体现了生成式AI在处理更复杂或适应性任务时的局限性。
主动式AI(代理式)与生成式AI的特性
下文探讨主动式AI(代理式)与生成式AI的独特特性,重点突出了它们在智能、自主性和决策方式上的不同方法。
主动式AI(代理式)
• 自主性:主动式AI(代理式)可以独立行动,无需人类的持续输入。它能够自主决策并完成任务,例如一台无需人类控制的机器人,根据环境决定下一步的行动。
• 目标导向行为:主动式AI(代理式)带着明确的目标运作。它不会随机响应,而是积极朝着特定目标努力。例如,无人驾驶汽车的每一次转向或刹车都是为了安全地将你送达目的地。
• 适应与学习:主动式AI(代理式)会从其行动和经验中学习。如果遇到问题或失败,它会进行调整。例如,一个推荐电影的AI会根据你的偏好改进推荐内容。
• 复杂决策能力:主动式AI(代理式)不仅能做出简单的选择,还能评估多个选项并考虑后果。例如,控制股票交易算法的AI会分析海量数据、预测趋势并根据这些信息决定买卖股票。
• 环境感知:为了做出明智的选择,AI需要理解其环境。它通过传感器或数据来感知环境。例如,机器人使用摄像头“看到”障碍物,然后绕行。
生成式AI
• 有限自主性:生成式AI的自主性有限。它不能独立行动,需要人类输入来生成响应。它根据接收到的输入生成输出,但无法自主采取行动或在没有外部提示的情况下运作。
• 任务导向行为:生成式AI是任务导向的,但仅限于被动响应。它根据特定的提示或任务生成相关内容(如文本或图像),但不会追求长期目标或具有总体目标。每个任务都基于即时输入完成。
• 基本决策能力:生成式AI从事基本的决策。它根据学到的模式选择输出,但不会评估多个选项或考虑后果。例如,在生成文本时,它选择最可能的下一个词或短语,但不会做出复杂、分层的决策。
• 缺乏学习与适应能力:生成式AI不能实时学习或适应。一旦训练完成,它只能基于训练期间学到的模式运作,除非用更新的数据重新训练,否则不会改变或改进其性能。
• 缺乏环境感知:生成式AI没有环境感知能力。它处理的是数据(如文本或图像),但无法感知或解释物理环境。它无法理解周围的情况,只能对输入做出反应,缺乏外部意识。
案例分析:主动式AI(代理式)工作流程的实际应用
尽管生成式AI与主动式AI(代理式)的理论差异显而易见,但只有在实际应用中才能真正体现主动式AI(代理式)的潜力。
Andrew Ng 分享了一项研究,展示了主动式工作流程在编码任务中的优势。他的团队在HumanEval编码基准上测试了两种方法。任务是:“给定一组整数,返回所有偶数位置元素的和。”
在第一种方法中,采用零样本提示(zero-shot prompting),AI直接尝试解决问题。GPT-3.5的准确率为48%,而GPT-4则表现更好,达到67%。尽管如此,这些结果并不算特别出色。
快速术语:
• 零样本提示:不提供额外指导或分步提示,直接要求AI解决问题。
• 主动式工作流程:将任务分解为多个阶段(如理解、编码、测试和调试),让AI逐步迭代和改进。
然而,当团队应用主动式工作流程(将任务分解为理解问题、部分编码、测试和修正错误等步骤)时,GPT-3.5的表现甚至超越了GPT-4。Ng指出,GPT-4在采用主动式工作流程时也表现更强。这表明,通过分步方法,尤其是对于较旧的模型,可以利用主动式工作流程超越更先进的模型采用传统方法的结果。
结论
随着AI在我们的生活和工作中变得越来越重要,理解主动式AI(代理式)与生成式AI的差异显得至关重要。生成式AI在文本生成、响应提示生成文本或图像等任务中非常有用,但它受限于遵循指令而缺乏真正的自主性。而主动式AI(代理式)则更进一步——它能够设定目标、自主决策并适应变化的环境,能够在无需人类持续指导的情况下承担复杂任务。
通过使用主动式工作流程等方法,AI系统能够更加高效,通过迭代步骤不断提升性能,并从每个阶段中学习。这一转变为先进应用打开了大门,也让旧模型得以持续改进并保持相关性。在本系列的后续文章中,我们将深入探讨主动式AI(代理式)的实际运作方式及其重新塑造行业和推动创新的潜力。