Jupyter AI

这个智能体能吞下整本PDF书,直接导出6000多字Word、PPT总结,确实可以封神了!

📅发表日期: 2025-05-21

🏷️分类: AI消息

👁️阅读次数: 0

上传了一本几百页的电子书,问DeepSeek,但是显示只能处理前30%这个问题是大家普遍遇到的,如下图所示:

天工超级智能体 Skywork super Agent

在两周前我给大家介绍过一种解决方案,此方法需要大家手动配置MCP智能体,还需要Python环境本地搭建,相对有些繁琐。

就在这几天我发现了一个更好的解决方法,无需手动配置智能体,无需配置Python环境,只要在界面上点点就能搞定,而且支持多模态,第一时间分享出来,感兴趣的可以看看。

使用本文方法,能吞下整本书(我测试书籍页数424),直接导出全书总结的Word、PPT、Excel等。

1 效果展示

这是我制作的超级吞书智能体,左侧是导入书的面板,中间是对话和总结分析并导出Word、PPT、Excel等,右侧是整本书的预览:

天工超级智能体 Skywork super Agent

它能实现直接导入下面整本书,一共424页:

天工超级智能体 Skywork super Agent

然后按照文中步骤,直接输出7页Word、PDF文档总结,并且能做到图表和文字结合的多模态总结,这个是很多朋友普遍的一个需求,今天我告诉你怎么做到:

天工超级智能体 Skywork super Agent

另外,输入一句话,直接生成下面这样的20页PPT,从大纲内容、排版再到图表、代码、PPT细节等全都有了,并且未经任何修改一次就能生成这样的效果。限于帧数限制,下面GIF展示前面几页:

天工超级智能体 Skywork super Agent

这是中间两页GIF展示效果:

天工超级智能体 Skywork super Agent

以上PPT全部一次生成,未经任何修改,文字、图片、代码、样式排版结合融洽,这是在我使用这么多AI PPT生成工具里,见过生成效果最好的了,如何做到的,我会在第三节详细介绍。

这个方法一句话总结,使用天工超级智能体(Skywork Super Agents,下面简称Skywork或天工),全部界面操作,我研究了下它家的智能体,有些功能Manus都没做到。下面我来介绍下这个吞书超级智能体,生成图文代码结合的PPT等。

2 吞书超级智能体

第一步,访问下面地址,这里提醒下大家,根据自己位置访问不同地址,加载速度会更快,

国内访问这里:https://tiangong.cn

国外访问这里:https://skywork.ai/

进入网站后,点击新建项目:

天工超级智能体 Skywork super Agent

第二步,弹出下面图,选择文档模式智能体:

点击上传,也支持拖动上传文件,

天工超级智能体 Skywork super Agent

选择这本424页的PDF书,如下所示正在上传中:

天工超级智能体 Skywork super Agent

上传完成后,点击PDF书,自动显示下面的三栏界面,在中间这一栏,能和它对话分析了:

天工超级智能体 Skywork super Agent

对完整这本书,做一个深度分析(deep research),可以输入下面提示词,按下回车后,开始生成分析:

总结我上传的书籍,每章核心内容总结

天工超级智能体 Skywork super Agent

它识别出刚才上传的书籍《神经网络与深度学习》这本书,然后进入到与此智能体的交互中,确认后,它会再次输出任务编排列表,如下所示:

天工超级智能体 Skywork super Agent

它会把刚才咱们输入的任务,自动拆分为更加细致的推理步骤(Chain of Thought-CoT),1)书籍内容分析与提取,2)撰写每章核心内容总结,大概3分钟,它会输出下面7页的word总结:

天工超级智能体 Skywork super Agent

以上总结一共7页,此智能体Deep Research生成内容够细致:

天工超级智能体 Skywork super Agent

Wait 等下!根据首页介绍,它家的智能体能生成图文并茂的总结,包括使用各种图表,比如使用条形图、饼状图、折线图、散点图、雷达图,填入后一回此智能体会自动跟我们确认信息,如下所示:

天工超级智能体 Skywork super Agent

确认完成后开始自动生成,生成的部分总结,饼状图如文章一开头所示。模型性能对比条形图:

天工超级智能体 Skywork super Agent

模型特性雷达图:

天工超级智能体 Skywork super Agent

还有其他图表,限于篇幅不再展示。之前使用过比如OpenAI的deep research,生成报告比较严谨,但报告中图表能力偏弱,不过天工超级智能体强化了deep research的图表表达能力,应该是首家做到这个能力的,感兴趣的快去体验,现在登录后就有2500积分,能用很长一段时间了。

3 PPT超级智能体

除了第二节介绍的超级吞书智能体,它家还有PPT智能体,使用步骤如下所示,首先选择PPT模式:

天工超级智能体 Skywork super Agent

第二步,按照如下输入,回车后开始生成:

天工超级智能体 Skywork super Agent

PPT生成过程中会先展示出PPT大纲,如下所示:

天工超级智能体 Skywork super Agent

然后调用MCP工具,如写入文件,生成PPT工具,如下所示:

天工超级智能体 Skywork super Agent

生成过程大概有5-10分钟,耐心等待的结果就是,一次生成20页PPT,大家先看下效果:

天工超级智能体 Skywork super Agent

天工超级智能体 Skywork super Agent

天工超级智能体 Skywork super Agent

以上PPT没有经过任何修改,全部AI一次生成,限于篇幅,只展示以上四页。

大家有没有被惊艳到?这是到目前为止,我见过AI生成PPT最棒的了,不管是大纲、内容,布局,多元素(文、图、代码、icon),再到PPT细节,我花3个小时都未必能做到这种程度。不仅是省时间,而且让我告别PPT排版的痛苦,妥妥的又一个AI办公效率工具。

除此以外,还有表格模式,这个就是Excel超级智能体:

天工超级智能体 Skywork super Agent

能对含有合并单元格,嵌套表头等复杂的Excel表格分析,输出图表和文字,使用方法和上面两节相似,限于篇幅,后面我再做教程,感兴趣的也可以自己先去试试。

最后总结

传统AI受限于大模型的输入窗口,通常只能分析文档的前30%,天工超级智能体实现整本书的内容全面理解和逐章深度总结,并且能输出高质量的图表(雷达图、条形图、饼图等)。

生成高质量图表的deep research,是目前我了解范围内首家具备此能力的智能体,并且下面的Benchmark得分也印证了此点,level1,2,3超越了Manus,OpenAI的deep research:

天工超级智能体 Skywork super Agent

天工PPT智能体生成的PPT质量出色,图、文、icon、代码、排版、样式,一应俱全,一次生成的PPT效果确实令人惊艳。

除此以外,它家还提供了其他更多直接可用的智能体,比如表格、网页、博客和通用模式的智能体:

天工超级智能体 Skywork super Agent

感兴趣的朋友,可以根据本文步骤,去实践下。

💬 评论

暂无评论

🧠AI 最新技术 (滚动鼠标查看)