Skip to content

模块 1: Agentic 工作流简介

约 868 个字 预计阅读时间 3 分钟

欢迎

Agentic 工作流的应用场景:

  • 客户支持代理
  • 深度研究
  • 撰写具有深刻见解的研究报告
  • 处理复杂的法律文件
  • 分析患者输入并给出或建议可能的医学诊断

真正掌握如何构建 Agentic 工作流的一个关键点:具备推动规范化开发流程的能力,特别是专注于评估与错误分析的流程。

什么是 Agentic AI

  • 非 Agentic 工作流,零样本 (zero-shot):线性流程,整体完成任务
  • Agentic 工作流:将任务分解为多个步骤,并迭代进行思考/研究与修订(耗时更长,但成果更优)

Agentic AI 工作流是指基于大型语言模型(LLM)的应用通过执行多个步骤来完成任务的过程。

一项关键技能:学会将复杂任务分解为简单步骤,并构建高效执行每一步的组件。

自主性程度

Agentic 系统可以具备不同程度的自主性 (autonomy)。自主性较低的 agent,其各步骤相对确定且线性。自主性较高的 agent 能够在某些步骤中独立做出决策,即能够自行决定应采用何种方法来完成子任务。

自主性较低:

  • 所有步骤预先设定
  • 所有工具使用硬编码
  • 自主性仅体现在文本生成

半自主:

  • 代理可以做出部分决策,选择工具
  • 所有工具预先定义

高度自主:

  • 代理可自主做出多项决策
  • 能够动态创建新工具

Agentic AI 的优势

  • 能够高效完成许多以往无法实现的任务(最大优势)
  • 能够并行处理,从而快速完成某些操作
  • 模块化设计,结合不同组件的优势

Agentic 工作流对 LLM 在具体任务上的表现的提升和 LLM 本身性能的提升一样显著,在一些情况下,模型代际的提升不如对上一代模型实现 agentic 工作流带来的提升。

并行化 agentic 工作流带来的效率提升可以弥补工作流本身更复杂的流程而延长的时间。

Agentic AI 应用

  • 企业发票处理
  • 回复客户邮件
  • 客户服务助理
  • 基于视觉使用电脑

较容易的任务:

  • 明确分布流程的任务
  • 由标准化流程
  • 只使用纯文本数据

较困难的任务

  • 任务步骤事先不明确
  • 边执行边规划或解决问题
  • 需要多模态数据(声音、视觉)

任务分解:识别工作流的步骤

从人类完成任务的角度出发分出步骤。但额外需要注意的一点是,需要尽量让每个子任务可以由 LLM 通过简单的代码或调用工具函数简单完成。

当一个流程被确定且得到结果后,要根据结果的情况进一步调整或细化流程。

构建流程可使用的模块:

类型 模块 使用场景
模型 LLMs 文本生成、工具调用、信息提取
模型 其它 AI 模型 文件格式转换、图像分析、音频内容提取
工具 API 网页搜索、获得实时数据、发送信息
工具 信息检索 数据库、检索增强生成 (retrieval augmented generation, RAG)
工具 代码执行器 编写代码、编译运行