离谱! 现在的Agent都卷成100个成团了? 3分钟并行干完5个复杂任务
西风 发自 凹非寺
100+AI专家Agent天团同时开工,分分钟并行拿下5、6个复杂任务。
“AI智囊团”现在都进化到这种程度了?
就拿一场活动策划来说,从核心方案到开场致辞,从主题海报到抽奖工具,再到细致的预算明细,整套流程涉及的大小环节,换作以前得协调好几个人分头忙活大半天。
现在,AI却能让所有环节自动衔接推进,全套成果转眼就ready了。
任务进行过程中想改需求?随时打断它补充资料,调整完立马接着推进,丝滑得很:
嚯,啥工具啊?
不卖关子,这是百度文库、百度网盘联合发布的全球首个全端通用Agent——GenFlow2.0。
目前,市面上的Agent产品虽多,真抗打的却屈指可数,有的交付的东西车轱辘话连篇不落地,有的理解跑偏对不上需求。
而文库GenFlow2.0的推出似乎是想把这个局给破了:
一是,依托于百度文库、百度学术自身的十几亿专业、权威文档和学术资料,再加上打通了授权后的个人网盘内的私域素材,这直接实现了生产资料与生产工具的无缝衔接,让Agent干活时“有料可依”,交付的成果自然更能直接可用。
二是,任务执行全程都可以及时干预、纠正、叫停、补充,可控性大幅提升,交付物质量得到保证。
三是,GenFlow2.0还能多任务并行,支持同时进行5~6个全模态复杂任务的并行执行。
目前,GenFlow2.0已上线百度文库Web端/APP等,是个无需邀请码的现货。
既然如此,话不多说,直接上实操~
100+Agent并行交付,全程可干预
一口气塞5个复杂任务,3分钟交付全套方案
不管是学习还是工作,人们的生产力刚需是什么?
职场人熬夜改方案、做PPT,学生赶ddl交活动策划,老师备整套教学方案……这些场景看似不同,但大都需要专业内容、视觉表达和高效交付同时到位。
想靠AI救场?但大伙儿真正想要的哪是个能“单独做个PPT”或“写个文案”的AI这么简单,AI要能精准get需求,还要能贴合每个人的具体场景把私有内容自然融入创作,最好能一次性交付完整解决方案。
还别说,文库GenFlow2.0恰恰戳中了这些痛点,其背后有100+个各司其职的Agent协同作战,能一口气并行搞定五、六个任务,做PPT、研报、海报、图表,写HTML、代码教具、小游戏、搭网站,样样精通。
就拿老师备课来说,涵盖了写教案、制作PPT、做课堂演示动画多个任务,现在不用来回切换不同AI工具了,直接把一连套任务派给它:
我是初中物理老师,下周要上“浮力原理”公开课,需要你帮忙准备一套教学材料,具体如下:
1、结合人教版物理八年级下册教材知识点,写一份40分钟教案,包含浮力的概念、产生、大小、方向、实验演示等;2、将教案整理转化成PPT,内容需直观呈现知识点;3、生成一个动态SVG动画,用来演示物体在不同液体、不同浸入深度时的浮力变化;4、写一段5分钟的趣味导入话术,可结合生活中的浮力现象提问;5、再生成含5分钟、10分钟档位的简易课堂倒计时小程序。
5个任务输入后,文库GenFlow2.0开始思考理解用户需求,自主规划任务。
只见它把任务拆分好后,分别派发给“文库管理员”“PPT大师”等Agent,然后按部就班执行。
注意看,下面重点来了:
它在执行任务过程中会基于百度文库、全网等进行深度搜索,搜索出来的参考资料都支持删减修改。
不仅于此,百度网盘、学术、地图等百度生态都被打通,在获得用户授权后,GenFlow2.0可以直接检索调用用户在百度网盘中存储的指定资料;学术研究类任务,可以直接调用百度学术超6.8亿篇文献库。
旁边还会弹出“补充文件或链接”板块,用户可上传资料或贴网址,精准给它塞独家素材包参考,不怕它生成的内容不贴合实际场景。
更绝的是,在执行任务过程中,用户还能够随时能打断暂停,想加需求、改内容直接在输入框说,点继续就接着跑。
以前Agent类产品生成速度普遍慢得让人抓狂不说,最烦的是有的Agent效果不尽如人意,压根不对路。
而GenFlow2.0不一样,可控性拉满,包括生成的PPT大纲是可以在任务执行过程中就能进行修改的。
速度方面更是离谱,平均3分钟交付,比主流Agent快10倍。
最终GenFlow2.0交付的就是一个全套的方案:
PPT生成叠满百度文库多年积累,模板和排版精致度业内能打。
教案直接联动文库资源库,教学目标、实验设计、课堂小结,每个环节都给得明明白白。
SVG动画、倒计时器这类小玩具,点开就能用。
原本可能要自己耗上数小时从头干的活儿,现在这么一眨眼间就有了眉目,效率直接翻N倍往上冲。
无论PPT还是Word,生成后均可直接下载或是在百度文库中进行二次编辑。
好消息是,GenFlow2.0在文库APP也上线了。
App端也能用,Agent分工与进度可视化
App端和Web端不同的是,页面顶部设有进度条,用户能更清楚地看到GenFlow2.0的任务完成进度。
工作学习累了不如出去旅游吧~让它生成一份去西安旅游的深度攻略,最终get到的是一份思维导图式的超详细规划,三天行程、出行准备、注意事项全列清。
竟然还有在百度地图上标记的路线图,所有规划真实有效。
GenFlow2.0不光会自动调Agent,还会根据任务复杂度智能切换模式。
像前面的复杂需求,就会启动深度思考模式;要是你问个特简单的问题,它就直接给答案,不绕弯子。
除此之外,GenFlow2.0还构建了用户“记忆库”,可以记住并运用用户在文库网盘沟通的历史记录、上传下载文件,分析用户偏好,越用越懂你。
自研Multi-Agent基础架构
从技术层面来讲,GenFlow2.0是靠什么把这些能力焊死的?
答案藏在它“操作系统级”的技术架构里——
沧舟OS提供内容操作系统底座;GenFlow核心调度中枢负责把“需求→意图理解→调度→执行→汇聚→交付”跑通。
早在今年4月,百度文库与网盘就推出了内容领域首个操作系统——沧舟OS,拥有对用户海量公私域内容、记忆库的全场景、全链路处理能力,通过中枢系统实现Agent之间的数据互通和智能调度。
而GenFlow2.0正是基于这个底座的“智能中枢”。如果把沧舟OS比作“高速公路网”,GenFlow2.0就是“交通调度中心”,它能把用户需求拆解成一条完整链条,确保每个Agent走对“车道”且“不堵车”。
正如百度文库事业部、网盘事业部负责人王颖所说:
沧舟OS系统是一个特别复杂的生产线,有特别多的工具在里面。但是它怎么启动工作,用哪些工具一起工作,来满足你的需求,是靠GenFlow的调度系统。
而GenFlow2.0,在核心技术栈上,依托底层MoE(混合专家模型)架构、可以基于不同任务、步骤来调用不同模型。
具体来说,文库网盘自研了Multi-Agent基础架构,这是一套能打配合的系统。
一方面,动态混合推理技术让不同模型能像积木一样灵活组合,谁更适合就谁上场;另一方面,多模式智能化调度借助状态流引擎、智能监听框架等,让系统在处理不同任务时能够具体任务具体分析,选择简单/通用/并行等多种调度模式。
在这个过程中,公私域知识增强和全模态渲染编辑等技术为它提供了充足的素材和表达手段,而临短长记忆中枢与多级风控体系又保证了两个关键:它能记住你的偏好和历史上下文,越用越懂你;同时所有数据调用都在合规、安全的框架内完成。
正是这套“动态适配模型能力、智能调度任务流程、全链路支撑体验与安全”的技术逻辑,让GenFlow2.0不仅能协同,更能高效、可控、实用地落地,最终实现复杂任务一站式交付。
不仅如此,GenFlow2.0还兼容MCP协议,能灵活对接第三方的服务生态,由此它可以不断吸纳新能力。
从国民级产品变革,到开放生态重构
GenFlow2.0的推出,从定位上来说,远不止做个好用的工具这么简单。百度文库、网盘通过开放生态,正在重新定义通用AI Agent的边界。
总的来说就是,“想做的AI,就是无所不能、无所不在”。
“无所不在”是说,不管ToC还是ToB,不管用手机、平板还是IoT设备,用户随时都能用。
“无所不能”则是说,除了自己构造能力,百度还愿意和第三方共建,通过MCP Server接入,联合GenFlow2.0和沧舟OS输出给用户。
据透露,目前GenFlow2.0已经有了首批落地验证的实例,比如百度和荣耀合作,实现“AI Agent+硬件”的系统级原生调度。
作为首批接入MCP生态的硬件厂商,荣耀把GenFlow2.0原生植入了智能助理YOYO。现在荣耀MagicOS用户可一键获取个人网盘知识库与文库专业文档,获得网盘检索、内容分享、联网搜索、图片理解、文件总结与问答、文库PPT生成等体验。
这一实践背后,体现了行业正在发生的深刻转向:过去大家用AI更多是“单兵作战”,让它帮你写篇文案、做个PPT;未来的趋势是把AI作为真正的“合作者”,和你并肩完成一个完整项目。
百度文库、网盘在其中的组合优势特别关键,通过深度融合、能力共建,构建了“用户覆盖+场景验证+生态开放”这一难以复制的护城河。
一边是大模型重构下,文库16亿专业内容资源和9700万AI月活用户的场景沉淀;另一边是网盘10亿用户、1000亿GB存储的私域数据优势,两者打通后,形成“创编存管-找看用享”的全流程能力闭环。
未来,以GenFlow2.0为智能中枢,百度文库、网盘有望进一步打通场景边界,通过MCP协议不断拓宽生态开放维度,最终让GenFlow2.0成长为串联起海量知识、多元工具与全场景服务的超级连接枢纽。
这种无缝衔接,让AI生产力不再是孤立的功能,而是渗透到学习、工作、生活的每个角落。
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态