独立开发者 / 小团队
适合: 要把 AI 功能接进真实产品、内部工具或原型项目的人。
帮你决定: 先确定编程助手形态,再估算 API 成本,最后决定模型与 Agent 技术栈。
AI TOOL WORKBENCH
这不是简单的工具链接目录,而是一个 AI 工具决策台。你可以按写代码、做 Agent、查资料、知识库、本地部署、生成图片/PPT 等场景筛选,再进入百科、替代品对比或计算器。
工具百科/替代品
可用决策小工具
核心使用场景
Practical Stacks
先从你真正要完成的任务开始,再把百科、替代品对比、模型榜和计算器串起来。
适合: 要把 AI 功能接进真实产品、内部工具或原型项目的人。
帮你决定: 先确定编程助手形态,再估算 API 成本,最后决定模型与 Agent 技术栈。
适合: 需要找来源、做竞品扫描、整理资料和输出报告的读者。
帮你决定: 把搜索、来源核验、Agent 执行和提示词生成拆清楚,减少幻觉和重复劳动。
适合: 要处理内部文档、私有数据、本地部署和 RAG 问答的团队。
帮你决定: 先判断文档切分与上下文,再核算本地硬件和部署成本。
适合: 要做文章、课程、PPT、封面图、短视频脚本和图文内容的人。
帮你决定: 把资料搜索、初稿生成、PPT 和图片工具串成稳定生产流程。
适合: 要在 ChatGPT、Claude、Gemini、开源模型之间做取舍的产品和工程团队。
帮你决定: 用加权榜缩小候选,再按场景、速度、成本和部署约束做最后判断。
当前最佳入口
根据你的筛选和关键词实时变化: 每天在 IDE 写代码就优先 Cursor;需要终端、测试和多文件长任务时,看 Claude Code、Codex CLI、Continue。
任务对比
如果你不知道该搜什么,先从任务开始。下面每一行都给出最先打开的页面、判断原因和风险提醒。
| 任务 | 先看 | 为什么 | 注意 | 打开 |
|---|---|---|---|---|
写代码、修 bug、改项目 代码开发Agent 自动化 | Cursor 替代品 + Claude Code 教程 | 先判断你需要 IDE 补全、仓库级 Agent,还是能跑测试的终端协作。 | 公司代码、私有仓库和自动提交必须看数据策略和 review 流程。 | 比较代码助手 |
调研、找来源、写报告 搜索研究Agent 自动化 | Perplexity 和 ChatGPT 区别 | 搜索来源和深度写作是两类任务,混在一起会降低可复查性。 | 重要结论要保留来源链接,不要只复制模型总结。 | 选择搜索工具 |
私有文档问答 / RAG 知识库 | RAG chunk size 计算器 | 知识库效果经常卡在切分、重叠、召回数量,而不是模型本身。 | 先测一小批真实文档,再决定向量库和模型。 | 计算 chunk |
本地部署或私有化 本地部署成本预算 | GPU 本地部署兼容性计算器 | 先判断显存和量化可行性,再下载模型和搭服务。 | 本地不等于免费,硬件、延迟、维护和权限都要算。 | 检查显存 |
PPT、图片、文章和课程内容 内容创作搜索研究 | 最好的 AI PPT 工具 | 内容生产要分成资料、结构、视觉和导出,不要只看生成效果。 | 商用前检查图片版权、字体、品牌规范和导出质量。 | 选择内容工具 |
上线 AI 产品功能 成本预算搜索研究 | AI API 成本计算器 + 综合模型榜 | 上线前要同时看能力、价格、延迟、上下文、失败恢复和数据策略。 | 不要用榜单第一直接上线,必须按真实流量估算月费。 | 估算成本 |
在多个大模型之间做选择 搜索研究本地部署 | 综合模型榜 | 先用加权榜缩小范围,再按写作、代码、RAG、本地部署分场景判断。 | 单一榜单不能代表你的任务,必须看价格和实际约束。 | 打开榜单 |
Workflow Recipes
把工具页串成可执行路径:先判断,再比较,最后用计算器落地。
实用价值: 减少盲买工具和反复切换,适合真实工程团队。
实用价值: 直接补上知识库最常见的失败点:切分、召回、成本和私有化。
实用价值: 适合产品、内容工具、客服 Bot、企业内部助手上线前决策。
当前结果
把 Cursor 放到真实开发流程里比较:代码补全、仓库理解、终端修改、价格和团队协作。
每天在 IDE 写代码就优先 Cursor;需要终端、测试和多文件长任务时,看 Claude Code、Codex CLI、Continue。
比较 Manus 类通用 Agent 的真实用途:调研、整理资料、跑网页任务、生成报告和自动执行流程。
开放任务可以用通用 Agent,但稳定交付一定要拆成调研、执行、检查三段。
面向工程师的 Claude Code 入门:适合什么任务,怎么写需求,如何让它改文件、跑测试和复盘。
适合会看 diff、会跑测试、能给清楚边界的开发者,不适合把模糊需求一次性全丢进去。
用命令行处理长文档、代码库和批量文本任务时,Gemini CLI 适合放在哪一步。
资料很多、文件很多、需要在终端里批量处理时,比网页聊天更顺手。
不是谁更强,而是哪一个更适合你的任务:找来源、写方案、做总结、问复杂问题。
找来源先用 Perplexity;深加工、写作、推理和改文档用 ChatGPT。
围绕知识整理场景比较 Notion AI、飞书、Obsidian、Tana、Mem 和本地知识库方案。
先看资料本来在哪里,再看 AI 功能;迁移成本常常比功能差距更重要。
AI PPT 工具不要只看一键生成,还要看结构、审美、可编辑性、中文字体和导出质量。
AI PPT 适合出骨架和初稿,正式交付前必须人工改逻辑、数据和版式。
免费 AI 图片工具要看额度、版权、中文理解、风格稳定性和是否适合商用。
免费工具适合试风格和日常配图,商用前一定看授权、稳定性和导出限制。
估算一次产品调用、一天调用量和一个月预算,适合做上线前的粗算。
任何高频调用的 AI 功能上线前都应该先粗算成本。
把 token、中文字符、英文单词和页数换算到一个容易理解的尺度。
先判断材料能不能塞进上下文,再决定模型和 RAG 方案。
按写作、代码、知识库、本地部署、图片和视频场景给出选型建议。
不知道选 ChatGPT、Claude、Gemini、DeepSeek 还是本地模型时,从这里开始。
根据显存、模型参数和量化方式粗略判断能不能跑。
下载模型前先判断显存,不然很容易下载完才发现跑不动。
把目标、材料、口吻和输出格式整理成一段能直接使用的提示词。
想要稳定输出时,不要每次临场写提示词,用模板化结构。
根据任务是否固定、是否需要工具、是否给团队用,推荐更合适的 Agent 方案。
先判断任务是否固定、是否需要工具、是否给团队用,再选 Agent 技术栈。
按文档类型和模型上下文,给出 chunk 大小、重叠和召回数量建议。
知识库效果差不一定是模型问题,chunk、召回和重叠要先调。
Decision Matrix
先看任务,再决定用百科、替代品对比还是计算器。
先看 Cursor 替代品,再看 Claude Code 教程。
先看 Perplexity 和 ChatGPT 区别,再用 Agent 类工具处理资料。
先看 RAG chunk 计算器,再看 Dify 和知识库相关路径。
先用 GPU 本地部署兼容性计算器,再看上下文窗口对比器。
先看 AI PPT 工具和免费图片生成工具,再检查版权和导出。
先用 API 成本计算器,再用模型选择器缩小候选模型。