GenFlow 打通了百度的「后花园」

AITNT
正文
资源拓展
GenFlow 打通了百度的「后花园」
2025-08-22 17:02

All in One 一站式 AI Agent


GenFlow 打通了百度的「后花园」


8月18日,百度文库上线了一款名为 GenFlow2.0 的 Agent 产品。


在 Agent 层出不穷的 2025 年,市场的第一反应很可能是:「又一个而已」。


这个判断忽视了最关键的一点:GenFlow 能够调动数百个专家 Agent,还打通了百度网盘、百度地图、百度文库和百度学术。其中三个内容平台沉淀了超过十年的海量文档、学术资料和个人数据。


因此,GenFlow 不是一个从 0 开始的工具,而是一个被植入到庞大 Agent 和存量数据生态系统中的「激活器」。


它真正的价值,在于通过多 Agent 协作实现的「一站式任务交付」。这种意义,正如 App Store 出现后推动了移动端体验的整体升级一样。而对于百度而言,关键则在于能否借此高效盘活那片沉睡已久的数据「后花园」。


我们的评测将只围绕这个核心问题展开:


在百度生态的加持下,GenFlow 能够将多 Agent 协作、完成复杂任务的体验推到什么程度?


接下来是「十字路口」团队对 GenFlow 的全面评测。


GenFlow —— 激活百度生态的多 Agent 协同体出现了


说句实话,2025 Agent 元年中,我们已经看到了如此多优秀的 Agent。它们在各自的领域都展现出了让人「眼花缭乱」的能力。


在这种背景下,作为互联网时代 BAT 三家之一的百度,现在才推出 GenFlow Agent,或许会让人感觉来得有点晚。


不过话说回来,好饭也确实不怕晚。


为什么这么说呢? 百度这些年来搭建的整个数字生态,里面的资源被 Genflow 以数百个专家 Agent 蜂群调动了起来,把数据沉淀转化为了生产力。


GenFlow 打通了百度的「后花园」


接下来,让我们来看看具体的测试结果。


100个 Agent+百度网盘知识库 = ?


假设,我要为接下来 9 月份的「十字路口 AI 内容创作分享会」这个场景,「一站式地」生成 PPT、思维导图、海报等活动物料。


恰好我百度网盘里存了几篇「十字路口」的过往文章,于是,我可以要求 Genflow 直接调动我存储在网盘中的资料。


毕竟,这个 13 年前推出的老云存储产品已经存下了我们大量的知识和数据,如果能够一键提取总结,将很节省时间。


同时,这个任务本身,是一个跨领域、跨工种、跨模态的任务:


十字路口 Crossing 要举办⼀场 AI 内容创作的分享会, 分享最近公众号写作中 AI 产品的特点, 内容创作的心得以及对未来通用 Agent 市场动向的预测, 需要制作⼀个介绍分析过往作品及其 AI 产品的 PPT, 还有⼀个具有专业设计感的竖版海报,需包含图⽚、⽂字说明等元素, 且整体⻛格要与公司品牌形象相符。


目前,GenFlow 可选择网盘内容的量还是比较大的,最多可以选 100 篇:


GenFlow 打通了百度的「后花园」


当知识库内容选定好后,GenFlow 就开始一站式地调集多个 Agent 并行处理任务。这也是与目前传统 Agent 的串联工作方式不同的地方。


比如说,在 GenFlow 的任务规划里,「解析附件」与「搜索 AI 内容创作内容」被认为是没有依赖关系的,所以它就调用多 Agent 并行操作:


GenFlow 打通了百度的「后花园」


这种多 Agent 协作带来的最直观的感受就是:GenFlow 完成任务的速度很快。它大概只需要 7 分钟左右,GenFlow 就调动对应 Agent 完成了包括任务规划、文章解析、全网搜索、PPT 、海报、思维导图生成的全部工作。


速度不错,那么我们再来看看质量。


在它首次生成的 PPT 内容中,GenFlow 一共设计了 6 个模块,还算是比较完整地覆盖了 AI 内容创作全流程。但是,我们觉得淡紫色的 PPT 并不太适配「十字路口」的风格,而且六个大标题也有点太多了。不过,海报的呈现效果明显更好,排版也非常协调。


这是它首次生成的 PPT 和海报:


GenFlow 打通了百度的「后花园」


思维导图:


GenFlow 打通了百度的「后花园」


GenFlow 打通了百度的「后花园」


以上所有任务都可以放在一句提示词里,让 GenFlow 一站式执行。


整个工作流我录制了 2 个 GIF,左侧为 GenFlow 的「任务执行」,右侧则是它的「输出结果」。你能直观感受到 GenFlow 在多模态、多格式任务上的并行处理能力:


GenFlow 打通了百度的「后花园」


GenFlow 打通了百度的「后花园」


GenFlow 对这些生成的物料的每一个细节都提供了修改工具,我们可以在内容生成后实现自由编辑,在内容创作上灵活度更高。


比如我既可以随意修改大纲,让 GenFlow 再生成一版内容;也可以根据审美,自行更换 PPT 模版。


比如:初次生成的 PPT 的颜色和风格我不太喜欢,而且内容太庞杂了,我就在大纲中删掉了「03 AI 在创作流程中的应用」,把它融进了前两章中,再把模版换成了黑白色系。


这种可替换性,确实让整个流程方便了许多。我录制了一个视频,你可以看下操作流程:


GenFlow 打通了百度的「后花园」

下面就是最后的 PPT 成品。


整体排版形式协调,而且我发现它很擅长运用各种小图标,每一页 PPT 的版面布局都比较清晰,可以更好地传递内容。


GenFlow 打通了百度的「后花园」


而文字部分的生成完全是基于用户满意(因为我已经修改过了)的框架,又有「百度网盘」内部提供的知识库,所以交付效率很高,内容也兼顾了个性化与专业化。


GenFlow 打通了百度的「后花园」


初版生成时,我其实对它生成的那张海报已经比较满意了,它提供了一个不错的模版,风格元素也都很成熟。


不过,距离直接投入使用只差把「体验价」删掉(毕竟十字路口的开放麦并不收取费用)、地址修改好。用户也能直接在手机上,对海报进行自行调整,不论是图片位置还是文字内容。


GenFlow 打通了百度的「后花园」

在此之后,我又让它生成了几张不同风格的海报,它的速度确实都很快。下面这几种风格,GenFlow 的把握都还可以。


GenFlow 打通了百度的「后花园」


而且,我在 GenFlow 的交付报告里发现,它生成的海报似乎一开始就为了能够实用去的,比如它会有意识地为海报底部预留 15% 的空白区域,方便线下活动时加盖合作方 LOGO:


GenFlow 打通了百度的「后花园」


GenFlow 利用了「百度文库、百度学术」的专业性


在专业领域(像是学术)的使用过程中,我一般会先给出一个比较简单的提示词:


请给我一份深度市场分析报告,主题是青少年教育类 AI,告诉我现在市场的痛点和缺口在哪里,主要的竞争对手又有谁。


我发现,它这时会调动更强的搜索能力,4 条线并行收集信息,而且搜集范围除了整个互联网外,还涵盖「百度文库」与「百度学术」,也就是它还有海量的「独家」专业资料,为信息的搜集提高了深度和广度。


GenFlow 打通了百度的「后花园」


在这里,你会发现 GenFlow 可以同时「启动市场信息收集、痛点分析、蓝海机遇分析和竞争对手分析」四个任务,全部并行处理。


当我获得了一定的信息增量后,会根据这些 GenFlow 已经展现出的信息,再去细化提示词。如果放在平常,基本就只能等它跑完,但 GenFlow 最下方有个暂停的窗口。


当我利用这个功能重新补充提示词,让它制定规划,短暂的思索(不到 30 秒)后,GenFlow 开始了新一轮的「重新规划」-「任务执行」-「输出成果」。


GenFlow 打通了百度的「后花园」


GenFlow 打通了百度的「后花园」


对比前一轮,在收集资料时,GenFlow 的速度提升了很多,证明它并没有一切从头开始,而是在原有基础上及时调整。从效果来看,这个 Agent 确实做到了「干预、暂停、追问」的整合。


在输出最后的研究报告之前,GenFlow 也同样会让用户先对大纲进行调整和确认。比如在这里我就删除了我认为不太重要的「青少年教育 AI 技术发展驱动因素」。


GenFlow 打通了百度的「后花园」


最后,就是这份报告的详细程度了,这确实让我有点「一惊」。


因为,往往我们使用 OpenAI、Gemini 2.5、Kimi 之类的 DeepResearch 功能时,其报告的深度,如果单看字数的话基本上很难超过 1.5 万字。


而这回的 GenFlow 直接生成了一个 2.7 万字的超长深度调研报告。


同样,它的「人机协同特色」也坚持到了最后一步—— 在对最后报告进行修改时,GenFlow 仍会辅助我去编辑,还推荐了百度文库内类似的文章。


GenFlow 打通了百度的「后花园」


这是最后生成的报告。


「全面且扎实」是我最大的感受,整个报告 63 页,2.7 万字,有 23 张图片、37 个表格,以及 51 条信源。


GenFlow 打通了百度的「后花园」

从结构上来讲,报告完整且清晰。


封面、摘要、目录、参考资料及其链接、AI 使用声明,甚至每一张图表的出处也标注得清清楚楚。整个分析报告里的包括「目录」「参考信息」「附录」在内的格式基本都采用了论文标注方式:


GenFlow 打通了百度的「后花园」


当然,只看报告字数,意义不大。


如果我们仔细看内容,会发现图表和文字的搭配比较合理,做到了每一句话有出处、有意义。比如这里的内容是数据保护法规的整理,段落内部 GenFlow 就明确列出了法条的出处,段落末尾也按照正确格式引用了参考文章。


在文字表述完后,还将内容可视化为一个条理清晰的表格,辅助理解。


GenFlow 打通了百度的「后花园」


在分析竞品部分,GenFlow 的深度确实令我感觉不错!


不仅列举出了头部的公司及其主打产品,还详细说明了技术护城河、公司财务状况和发展历程。最主要的是,它在研究报告中的制表格式很规范。


有做学术的朋友看了说,是可以直接发刊的程度:


GenFlow 打通了百度的「后花园」


打通了 PC 端和手机端


最后,我发现 GenFlow 这回是一个「全端」通用 Agent。它同时支持 2 个使用入口:PC 端和手机端。


GenFlow 打通了百度的「后花园」


我先说一个在手机端用的时候,让我觉得有一点「亮眼」的是:它可以直接在手机上进行云编程,比如让它为我们 2 周前的一个「上海AI活动:十字路口开放麦 · AI + 北美出海专场」可视化一下:


GenFlow 打通了百度的「后花园」


GenFlow 打通了百度的「后花园」


我个人觉得 GenFlow 这回产品的理念大概就是让「用户以最快的速度在手机上搞定往常需要很复杂流程才能做到的事情」。


说得更直白点:能够快速「交差」。


当然了,更复杂的一些事情,也可以搬去 PC 端做,比如制作一个「图片公开板」:


GenFlow 打通了百度的「后花园」


或者是集成「百度地图」完成一个日常旅行安排场景:


GenFlow 打通了百度的「后花园」


GenFlow 打通了百度的「后花园」


GenFlow 生成多模态内容时,无论速度还是多线程并行、随时暂停的能力,都令人印象深刻。但它的差异化点仍然是在于执行效率和生成结果的结合。


这种高质结果源于对百度网盘、文库、学术三大「数据池」的独占性访问。一份存储在网盘里 3 年前的 PDF,一篇收藏在文库里 5 年前的行业报告,都能被灵活调度,生成高度个性化、可信、专业的输出。


这揭示了一个深刻的行业趋势:当大模型能力趋于同质化,真正的竞争在于谁能依托独家、高质量数据,提供可靠、精准、懂你的生成结果。


所以,GenFlow 不仅仅是百度的一款新产品。它是百度利用自身历史资产,在 Agent 时代打响的一场非对称战争。


GenFlow 打通了百度的「后花园」


文章来自于微信公众号“十字路口Crossing”,作者是“小居,镜山”。


1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

添加客服微信openai178,进AITNT官方交流群
IOS下载
安卓下载
微信群