驾驭超级 Agent 的编排框架
多步任务常卡在「做到一半就断、难以续跑」,一大原因是闲聊式界面缺乏总控与状态;同时工具与长提示一把塞进上下文,Token 消耗和费用会快速上去。EvoFlow 面向需要多日推进、跨系统协作的智能体长任务:由超级总控智能体(Supervisor)把规划、依赖与监督串成可恢复的闭环,并以分阶段协作加上「工具渐进暴露」(首轮不摊开大清单、按需挂载扩展)把上下文压在必要范围内。本站介绍产品能力与演进路线。
产品概览
核心差异化 · 五条支柱
优先解决「任务跑不完、易中断」与「上下文膨胀、Token 消耗大」;下面五条为应对思路,再向下可见总控拆解与能力矩阵。
长任务与可恢复编排
针对多步任务易中断、难闭环:跨系统与跨会话仍可监督、排队与重试,必要时局部重编排,尽量把事情跑到验收,而不是停在半截对话里。
多智能体与超级总控智能体(Supervisor)协作
由超级总控智能体(Supervisor)统筹目标与节奏,子智能体分工执行;「谁规划、谁执行、何时汇合」在编排层可复述、可对外讲解。
场景与工作阶段
按任务类型(对话、规划、改文件、检索等)进入不同工作形态,并与「先规划、再确认、后执行」等阶段配合:规划阶段侧重对齐目标与约束,确认后再放开实施类操作,降低误触风险。
工具渐进暴露与技能 / MCP 市场
工具侧强调渐进暴露:冷启动只挂核心与检索类能力,扩展工具按需挂载,减轻上下文与 Token。技能执行沿用「先读说明、再按步骤落地」等既有模式;在此基础上新增技能市场、MCP 市场,可从市场安装并统一管理已接入的技能与 MCP。
核心问题与子问题状态
抓住当前核心目标;仅在你明确多线事项时列出带子问题的进度,并把验收与边界写进快照回注后续回合。目标含糊或你转向时会再对齐,减少跑偏。
产品架构
编排与执行
编排运行时
超级总控与子智能体、中间件与工具装配;长任务执行中仍可在对话里继续编排,并流式查看子任务产出。
沙箱执行
隔离执行环境:承载命令、文件与解析等高风险动作。
状态与工具
记忆与任务状态
长期记忆、会话与任务状态、主线意图快照;记忆注入可按策略开关,并与线程工作空间数据面配套。
技能与 MCP
技能包与 MCP 扩展业务工具;提供技能市场、MCP 市场以浏览安装并统一管理已装技能与 MCP;治理面可为智能体配置启用范围,并与工具组合策略相配合。
渠道与终端
IM 渠道
飞书、Slack、Telegram 等与同一运行时对接,统一线程与投递。
EvoPanel 桌面端
装在开发者电脑上的客户端:技能包与 MCP 与部署环境对齐,便于本地调试工具调用、跟进任务进度与执行轨迹。
研发协同(Claude Code · Trae)
与 Claude Code 协同并可治理;Trae 本机通道;子任务可委派至部署侧可配置的外部编码助手。
治理与运维
护栏与自动化
工具调用策略、执行轨迹与观测;定时/持续类任务可托管,并可与飞书等渠道做结果投递。
任务中心与观测
任务可重跑;支持查询进度、状态与结果,便于排障与验收对齐。
治理与工作空间
按任务/线程隔离的工作空间;可管控智能体提示词、工具与技能,及与之关联的定时与自动化策略。
能力矩阵
从编排到交付的完整闭环
阅读顺序:控制面与 Plan 模式、五步闭环;随后为编排与执行两项主说明;下方「运行能力说明」分条介绍 EvoPanel、编码委派、工作场景、工具渐进暴露与技能/MCP 市场、记忆、工作目录、定时任务、智能体进化等;仅 EvoPanel 条目提供站内文档入口,其余以正文为主。
控制面
超级总控智能体(Supervisor)
面向长周期任务的单一总控路径:经多轮澄清对齐意图与边界,形成可执行 Plan,并展开为具依赖关系的子任务直至闭环交付。
- 澄清
在订立 Plan 前明确目标范围、非目标与验收口径。
- 分解
将 Plan 落实为有向子任务图(DAG),管理先后、分支、汇合及上下文传递。
- 监督
持续掌握全局与子任务状态,支持纠错、重试与局部重编排。
对齐优先,再分解执行
- 在工具调用与执行细化之前,将目标与验收条件固化于 Plan,以降低返工成本。
- 当目标或边界发生变更时,由 Supervisor 触发再对齐,并同步更新后续子任务结构。
上述机制驱动下方五步闭环;第一步对应规划对齐(Plan 入口)。
闭环流程
Plan 入口
规划对齐
明确谁规划、核心目标、边界与验收标准。
分解执行
谁执行子任务、依赖先后、异步与汇合。
受控落地
子任务实际调用工具与外部接口;护栏与策略收敛权限,轨迹可解释。
状态与集成
记忆与任务状态沉淀;技能与渠道把外部系统接进编排。
观测与交付
进度可视、人工纠错与收口;定时与推送汇总结果。
编排
Plan、任务依赖与运行观测
与上文「澄清—分解—监督」一致:Plan 审定后展开为显式依赖的子任务;步骤间以结构化上下文与工件传递;异步分支于同步闸口汇合。适用于工单链路、运维处置、研发流水线及跨日项目。
Plan 闸口
子任务拆解前固化验收口径与边界
DAG
上游完成后解锁下游;共享上下文承载中间结果
异步与同步闸口
在风险可控范围内并行;业务要求对齐处设置同步汇合
监督
全局与子任务状态可视;支持纠错、重试与局部重编排
主线快照
核心目标及子问题(按需)回注;发生方向变更时触发再对齐
执行
子任务执行与策略约束
子任务在目标环境中执行工具调用、脚本与外部 API,须符合既定策略边界;执行结果回写至共享上下文并纳入遥测。访问控制决策应具备可解释性与可审计性。针对高风险操作,可按部署启用隔离执行(例如沙箱)以收敛影响半径;该能力定位为可选加固,而非默认产品主张。
执行路径
由子任务驱动工具与系统集成调用,产出结构化结果供下游消费与观测。
策略与鉴权
基于租户、环境与资源维度收敛权限;允许或拒绝决策须可追溯、可复盘。
风险加固
对特定操作按需启用隔离执行(如沙箱),以限制影响范围;按部署配置启用。
运行能力说明
EvoPanel
EvoPanel 是 EvoFlow 的核心桌面客户端:与网关直连,承载你与智能体的实时对话、线程与任务操作、协作阶段与场景切换,以及自动化、观测等高频入口。多数日常编排、追问与验收都在此完成;服务端负责执行策略与编排语义,桌面端负责呈现、交互与控制台视图(含委派给外部编码助手时的输出流)。
主工作台:对话、工具调用与流式回复与后端一致,适合作为值班与业务侧的主要操作面。
与编排协同:总控在服务端推进子任务与依赖时,可在桌面侧并行查看进度、切换工作场景、对照轨迹。
可扩展入口:任务中心、定时规则、联调与排障相关能力集中可达,减少在多个工具间来回切换。
Claude Code 编排
Claude Code 以「外部子代理」方式接入:总控可把具体编码、改库、排错等任务委派给它,由本机或你惯用的 Claude Code 环境执行;编排侧负责下达与收口。同一外部会话内支持多轮往返对话,不必为每一句追问重建会话。Claude Code 的产出会流式回传,在桌面版控制台中可近实时看到过程与结果,便于与主线编排对照验收。
定位:相对总控的独立编码执行面,通过受控会话桥接,适合把「写、改、跑、看日志」交给 Claude Code,总控保留拆分、追问与汇总。
委派与会话:可按子任务派发;需要时在同一会话里连续多轮下达与纠偏,也可显式开启新会话隔离上下文。
可观测性:桌面端控制台展示 Claude Code 侧输出流,长步骤不必盲等对话窗,排障与对齐验收更直观。
场景切换
产品提供多种工作场景(如默认对话、规划与执行、文件与命令、联网检索、治理与自动化、特定运行时、能力自进化等)。可在对话中按需启用或退出;多种场景同时生效时,可调用的工具为其合并结果,避免无关工具长期占用上下文。进入规划类场景时,可与前台协作状态联动,便于先对齐再拆分任务。
规划侧重:在不动生产文件的前提下做方案与子任务编排,必要时可委派子代理做只读摸底
文件侧重:在明确需要本地读写或命令执行时启用,与仅规划不写盘区分开
联网侧重:以外部检索与网页信息为主时使用
治理侧重:智能体进化(含智能体管理与技能管理)、定时自动化等;列出或修改定时规则应走自动化相关能力,勿与纯粹的规划对话场景混淆
多轮回到闲聊时可自动淡化已过期的场景挂载,避免工具面无谓膨胀
工具渐进暴露与市场化管理技能 / MCP
工具侧由 EvoFlow 做渐进暴露:首轮不挂上全部可选工具说明,核心与检索类能力先行,扩展工具在确认需要时再检索挂载,压缩提示长度与首响延迟;可与场景合并后的工具白名单一起裁剪误触面。技能与 MCP 的执行范式(先读说明再步骤化落地等)沿用运行时既有能力;在此基础上提供技能市场、MCP 市场,用于从市场安装、启用、卸载或统一管理已接入的技能包与 MCP,与治理面的智能体配置衔接。
工具:按需挂载扩展能力,避免首轮摊开大清单(与子会话独立工具面、场景合并裁剪相配合)
技能市场 / MCP 市场:安装与已装项治理集中在市场与管理面,不必只靠手工拷目录
技能执行仍遵循先读技能说明、再按步骤调用,不把整套说明一次性塞进上下文
智能体侧继续用工具分组、白名单与扩展声明收敛可调用的 MCP / 技能范围
长期记忆与上下文治理
提供写入记忆与回忆能力,把需要在多轮之间保留的要点写入本机知识库文件,按会话隔离并支持全局条目,检索方式为关键词匹配,不依赖向量模型。本站在线助手中使用的资料检索与向量索引属于另一套能力,与运行时记忆互补,请勿混用。
可记录标题、摘要与类别,便于后续按词召回
数据落在本机指定目录,便于备份迁移与排障
在侧重能力演进的场景下,可与治理类能力一并挂载,便于统一维护
与任务协作、线程状态等机制搭配使用,各负其责
工作空间
定时自动化与本地执行均支持为单次运行指定工作目录;桌面或网关侧也可绑定本机根路径,让文件类与命令类能力在可控范围内操作。是否允许写盘与执行系统命令,由部署环境与安全策略决定。
自动化与本地执行可为单次运行指定工作目录,并在界面或配置里限制最长运行时间等(以你部署的版本为准)
文件与命令在约定根路径下执行,便于配合只读或沙箱策略
不同任务可配置不同工作目录,互不影响
定时任务
网关在后台按固定周期扫描自动化任务目录中的任务描述文件,到达约定时间即触发执行;可配置周期规则、提示词内容,以及是否在触发时调用编排运行时、是否向飞书推送摘要等。每次触发是独立的自动化运行,与当前聊天窗里的人工编排任务不同;如需要,也可配置是否在多次触发之间复用同一会话。
在侧栏「定时任务」里创建与管理规则;支持按周期或重复方式触发(以界面为准)
可选在触发时走编排运行时,并可设置超时等保护
若部署方提供诊断入口,可确认后台调度是否在正常运行
智能体进化
「智能体进化」把对智能体的配置治理与对技能包的生命周期管理放在同一能力面:在治理类工作场景下,既可维护「谁在用哪个模型、能调哪些工具、是否接入外部扩展、要不要向模型注入某套技能说明」,也可维护「技能包是否启用、说明与脚本如何更新」;网关启动时按配置装配,技能执行前仍遵循先读说明、再按步骤操作,避免一次性塞满上下文。
智能体管理:创建、更新与列出智能体;配置工具分组与工具白名单;声明允许的外部扩展连接;技能说明可选注入,不填则减少提示噪声。
技能管理:技能以说明与目录资源形式存在;可控制启用与停用;配置变更后运行侧可重新读取;总控对话里出现的技能名与当前启用及允许范围一致。
二者协同:在同一治理语境下迭代「智能体定义」与「技能包」,使运行时表现与运维脚本、界面配置同步。
典型场景
编排怎么落在日常里
六种常见搭法示意;需自行对接系统与配置,不是开箱即用的行业方案。
01
长任务:Plan 与多子代理编码
- 要解决的事
- 从方案到联调跨度长、参与面多:既要先把目标、依赖和验收口径钉住(典型是长任务里的 Plan),又要在落地阶段让多条工作线并行推进,而不是所有人堵在同一条对话里。
- 可以怎么做
- 前半程用规划类场景 + Plan:总控把里程碑、依赖、风险与验收写进子任务图,长链路有「闸口」再往下走。进入实现后,总控可同时派发多个子代理分工并行,例如一轨写业务代码、一轨补单测与契约、一轨同步文档或脚手架;需要深改或专用编码环境时再挂外部编码子代理(如 Claude Code),多轨输出在桌面端对照,最后在总控处汇合与收口。大范围写盘或高危命令再显式切场景或收窄权限。
- 能稳住什么
- Plan 管住长任务口径与先后,减少半路改向成本
- 多子代理并行缩短墙钟时间,开发与测试等可同步推进
- 轨迹上能看清各轨产出与合并点,便于评审、回滚与责任划分
02
定时任务与飞书汇报
- 要解决的事
- 巡检、日报、指标汇总等希望按固定节奏自动跑,跑完要把结果摘要推到飞书群或相关负责人,而不是靠人肉盯窗口。
- 可以怎么做
- 在自动化任务目录编写任务文件:写清周期或重复规则、提示词与可选的编排触发;打开飞书推送相关配置并指定会话或群。由网关调度器到期触发;每次运行独立留痕,需要时可再调编排运行时生成结构化结论再推送。失败重试与告警可与你方运维通道衔接。
- 能稳住什么
- 定时与日常对话解耦,避免聊天窗里「忘了跑」
- 飞书侧收到可读的执行摘要,便于值班与留档
- 任务文件与网关诊断方式统一,运营与研发对齐同一套约定
03
专员智能体与技能进化
- 要解决的事
- 不同用户、不同业务线希望有「对口」的智能体:工具面、模型与提示各不相同;技能包也会随业务迭代需要修文档、修脚本、持续优化。
- 可以怎么做
- 在治理类场景下,根据意图创建或更新专用智能体配置(模型、工具分组与白名单、可接扩展等),相当于为场景配好专员。技能侧可启停、修订说明与附属资源,把修复与演进纳入同一套「智能体进化」能力面;变更可被运行侧重新读取,总控对话里出现的技能名与启用范围一致。
- 能稳住什么
- 专员化配置把能力面收敛到业务所需,减少一锅端
- 技能可迭代、可治理,与智能体定义同步演进
- 详细配置与治理步骤见仓库内文档说明
04
记忆与内部助手
- 要解决的事
- 内部问答要贴文档与接口口径,长对话里用户已确认的约束还不能丢;工具面又不能无限膨胀。
- 可以怎么做
- 内部助手侧:收紧智能体的工具分组与白名单,按需开联网或治理类场景,用澄清补齐缺失条件。记忆侧:把「已说死」的口径、偏好与工单锚点用写入记忆与回忆在多轮间固定。本站在线助手的资料索引与运行时记忆是两套通路,勿混用;外部资料可走扩展或联网检索。
- 能稳住什么
- 助手回答是否贴谱,取决于检索、扩展与提示策略
- 记忆与资料各负其责,减少上下文里自相矛盾
- 桌面端便于对照网关行为与协作状态
05
跨系统办事
- 要解决的事
- 监控、工单、代码仓各管一摊;你想把「查状态—写备注—跑脚本」拆成可重试的小步,并且事后能看清当时走了哪些能力。
- 可以怎么做
- 先切到规划类场景,由总控列子任务;对外只走你已接好的扩展工具或自建接口。排查尽量只读;真要改文件再切文件类场景。工单号、结论等可写入记忆,下一轮用回忆拉回。
- 能稳住什么
- 每一步留在网关轨迹里,复盘有据
- 写库、改生产仍绑在你方凭证与沙箱上
- 接哪一家厂商,只由配置决定,产品不内置绑定
06
运维并行处置
- 要解决的事
- 日志、指标、远程命令多头并进;你想先分段消化,再在主线汇合,高危动作还要收得住。
- 可以怎么做
- 子代理分段拉日志、跑只读命令,总控负责汇总;是否开放命令类子代理,看沙箱与注册子代理。并行上限由运行参数卡住。
- 能稳住什么
- 长输出沉在子会话,主线只留结论
- 失败可以按子任务重试,不必整段对话重来
- 和告警、值班台的衔接仍走你方扩展或接口
路线图
EvoFlow 演进节点
基线
承接 DeerFlow 2.0:多包工程与编排核
编排
长任务可恢复编排与 Supervisor 多智能体协作
形态
场景与工作阶段;工具渐进暴露与技能 / MCP 市场
状态
任务状态、记忆与快照回注
协同
Claude Code · Trae 研发协同
交付
EvoPanel 桌面端
感谢支持,感谢观看。