Ai coding 分享

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

独立开发者节点

愿每一位独立开发者都能保持初心,获得一个好的结果.

组内要做 Ai 工具的分享，在网上搜索了很多博客整理了下面的内容，各位 V 友能给点建议吗，看是否有需要修改调整的地方

Ai 模型选择
SWE-bench
个人感受：
● 除了 Claude code 和 codex ，其他工具的模型或多或少受一些限制
● claude 编程能力综合最强
● codex 中的 gpt5.2 codex high 感觉是除了 claude code 中的 opus4.5 最强的，思考时间长（但是有点太长了），找 Bug 能力不错，CodeReview 也仔细，并且也非常遵循 rules 。
● Gemini3 Pro 前端能力比较强
● GLM4.6 体验过，当时效果感觉一般。

Ai 工具选择
● claudecode: 官网的基本用不了，中转的费用也在 200 多左右。但是 Opus4.5 在 claudecode 效果确实好，并且有 skills 、subagent 、插件、斜杠命令等工具
● Codex：
○ gpt5.2codex high 模型效果不错和 Opus4.5 差距不大，并且价格便宜，无论是官网还是说中转都比 ClaudeCode 便宜，中转只要 60 元每月。思考时间长（但是有点太长了），找 Bug 能力不错，CodeReview 也仔细，一个对话窗口还挺大也能自动压缩。并且也非常遵循 rules 、skills ，也会去找相关的代码。
○ 有插件和 cli ，但是插件最新的模型好像不支持，还是主要使用 cli ，指明代码上下文没那么方便，看代码变更也没那么方便
● Cursor：
○ 需要稍微干净的魔法不然用不了 Claude 等模型（还需要考虑魔法的价格），价格也不便宜，每月 20 美刀起步套餐，有 Team 套餐，但是好像 40 美刀起步
○ 第一次 Ai 编程首选，上手快，独一档的 Tab 。各种功能完善，使用了 cursor 后使用其他的软件感觉都没有那么舒服。迭代更新速度快。
○ 咸鱼也有按量卖的，但是规模不大，不能开票
● Augment Code：
○ 官网用不了，现在要用只能使用咸鱼按量卖的，不能开票，并且价格也不便宜
○ 插件形式效果最好的工具，独一档的上下文搜索工具：ACE
● Antigravity：
○ 需要非常纯净的美国 ip （魔法的价格就不便宜），现在 claude 的额度在减少，在网上也能经常看到吐槽
○ 有免费额度，谷歌年度 pro 也能使用信用卡白嫖，然后讲 Antigravity 的额度逆向到 claudecode 使用
● windsurf：
○ 之前使用好像不需要使用魔法，价格 15 美刀起步
○ 经常把代码块改坏然后又修复，按次收费
● Trae：
○ 不用魔法，价格便宜
○ 按次收费
● Kiro：
○ 现在 0.88 就能用 500 额度，但是使用效果一般，主要用来帮助理解代码
○ spec 模式
○ 各种小功能都非常难用：代码变更都没有做好，上下文的窗口小的离谱，压缩上下文的操作也很难受，会话不能重命名，不能渲染 mermind 图，不能排队任务
● Qoder：
○ 不用魔法，价格也好像不便宜
○ 阿里闭源模型，没用来写过需求不做评价
● OpenCode：
○ 开源的 claudecode （可以这么理解），只能使用 api ，相当于只能使用国内的 GLM4.7 。主要配合 OMO 插件使用，主要的思路还是使用多个 subagents 去执行任务，并且不同的 subagents 可以指定不同的模型。
○ 主要的优势是不用去折腾 subagents 、skills ，但是具体效果网上褒贬不一，让子弹再飞一会。

能力特性：

skills

好用的 skills
现有：doc 、excel 、pdf 、ppt 、画图、前端样式描述
可以把工作上的流程（主要还是需要重复和 Ai 说的）封装成一个个 skills ，然后让 ai 再不同的阶段去获取 skills：代码 review 、Bug 处理等

Bug 处理
当你被要求修复一个 Bug 时，请遵循以下步骤：
1. **理解问题 (Understand):** 仔细阅读 Bug 描述和相关代码，复述你对问题的理解。
2. **分析原因 (Analyze):** 提出至少两种可能的根本原因。
3. **制定计划 (Plan):** 描述你打算如何验证这些原因，并给出修复方案。
5. **执行修复 (Execute):** 实施修复。
6. **审查 (Review):** 查看自己的修改有没有问题。
7. **解释说明 (Explain):** 解释你做了哪些修改以及为什么。
8. 预防措施：如何避免再次发生

如何创建 skills
可以直接手动创建文件夹，文档、脚本、参考文件就行。或者直接让 Ai 帮忙生成，自己描述 skills 内容就行

Mcp
● Context7 MCP 、ACE 、Chrome DevTools MCP 、tapd 、apifox
Subagents （智能体，角色）
● 有点类似直接开了一个新的对话窗口，然后和主 agent 一样可以调用不同的工具然后加上一些提示词。
● 可以用来去查询信息，比如说查询业务信息，查询最新的文档，也可以去让 subagent 去使用 skills 和 MCP ，然后把处理的信息精炼后返回给主 agent ，然后去搜索的过程就不会占用主 agent 的上下文
● 主要是可以把自己经常要和 Ai 做的操作去做成 subagents （代码 review ）

斜杠命令
● 其实就是把经常要输入给 Ai 的提示词来生成命令，然后 Ai 就能获取信息

插件
SuperPowers：主要利用了 skills 和 subagents
https://github.com/obra/superpowers
https://github.com/anthropics/claude-code/blob/main/plugins/feature-dev/commands/feature-dev.md
ohmyopencode：

Cursor 的一些功能介绍
● 自定义模型：可以使用 GLM4.7
● worktree：
● 同时运行多个模型：计划或者复杂的情况
● 浏览器：内置的浏览器可以打开前端页面，然后进行调整，并且修改代码。
● 命令

编程技巧：

开发前置配置：
● 项目 rules：直接使用 init 初始化的 AGENTS.md/claude.md （项目介绍、技术栈等等），将项目一些经常需要修改的代码规范也可以写在这个文件中
● 全局 rules:
● 给项目代码加上索引
使用计划模式（ spec ，或者说平时的沟通）
切换计划模式（ Plan Mode ）。Agent 不会立即写代码，而是：
1. 研究你的代码库，找到相关文件
2. 询问澄清性问题，明确需求
3. 创建详细的实现计划，包含文件路径和代码引用
4. 等待你确认后再开始构建

计划模式实战：
理解需求，阅读需求有关的代码，整理开发思路与 Ai 沟通思路的可行性，输出给 Ai：Agent 会询问澄清性问题，创建可审阅的计划。
计划会以 Markdown 文件形式打开，你可以直接编辑——删除不必要的步骤、调整方案，或补充 Agent 遗漏的上下文，以及后续对话新加的内容也需要加到文件里面。
生成的任务也不要一次性都完成，一个任务一个任务的完成，并且再补充一些上下文信息，再进行代码 review ，功能自测。
代码开发完后还能让 Ai 生成单元测试，以及让 Ai Review 代码业务逻辑、性能、安全等方面。

当然并非每个任务都需要详细计划。快速修改或你已经做过很多次的任务，直接用 Agent 就好。
有时 Agent 构建的东西与你期望的不符。与其通过追加提示词来修补，不如回到计划阶段。撤销更改，细化计划使其更具体，然后重新运行。这通常比修正进行中的 Agent 更快，结果也更干净。

管理上下文
引用现有的信息
● 代码、数据库表、业务信息、类似的逻辑代码
● 之前的 spec 文档
● cursor 还支持引用之前的对话
● 现有的业务文档
何时开始新对话
最常见的问题之一：继续当前对话还是开始新的？
开始新对话的情况：
● 转向不同的任务或功能
● Agent 看起来很困惑或反复犯同样的错误
● 完成了一个逻辑工作单元
● 上下文内容过多
继续当前对话的情况：
● 在同一个功能上迭代
● Agent 需要之前讨论的上下文
● 正在调试它刚构建的东西
长对话会让 Agent 失去焦点。经过多轮对话和摘要后，上下文会累积噪音，Agent 可能会分心或转向不相关的任务。如果你发现 Agent 效率在下降，就该开始新对话了。

拓展 agent
● rules
● skills
● 自定义命令
● 插件
● subagents

Ai 的一些其他用法
● 需求梳理：
○ 指明具体的代码后，先让 ai 把代码解释一下，并且画图帮助自己理解。然后自己去看具体的代码，如果有不懂让 ai 继续解释不懂的代码并且画图，然后自己再去梳理业务。梳理的业务文档还可以再给 Ai 看一下，看是否有业务遗漏，后续的对话再在该文档上进行补充。
○ 有时候也可以让 Ai 给一些具体的数据来帮助理解代码
● 业务图：
○ 业务的一些流程图、表关系也可以借助 ai 生成 mermind 格式的代码，然后导入到 draw.io ，再自己进行调整细节。一些 markdown 格式也能支持 mermind 格式的渲染。现在 obsidian 开源了一个 skills ，生成图的颜色，可读性更高了

Ai 时代的一些思考
● 需要注重自己的独立思考能力提升
● 加强对复杂业务的理解
● 使用 Ai 协助开发而不是完全交给 Ai 开发
● 需要注重技术基础和架构能力
● 需要知道 Ai 擅长与不擅长的点，充分利用 Ai 提效，积极拥抱 Ai

第 1 条附言 · 9 天前

大家可以到我主页另外一个帖子看一下，我重新整理了一下格式

Coding

tools

26 条回复 • 2026-01-22 08:51:27 +08:00

leblos

11 天前

第一次发帖，不知道为什么语雀上的 markdown 格式变成这样了，大家凑合着看吧

hhxsky

11 天前 via Android

claude code 与 cline 插件之类有什么区别？我 claude code 安装好以后，baseURL 换成 kimi 和 key ，也可以接其他中转的，这感觉操作和 cline 一样

BenjaminReed

11 天前

楼主您好，请问下 kiro-cli 里面想调用 codex 对修改的代码进行 review 要怎么配置呢。

追着 AI 问了好久，返回了这个信息。

### 技术细节
1. Codex MCP 服务器工作正常，返回了完整响应
2. Codex 发送大量 codex/event 通知消息（流式输出）
3. Kiro CLI 在读取 STDIO 时被阻塞，无法读取到最终的 result 响应
4. 这是一个**缓冲区死锁**或**流处理不当**的问题

### 建议
1. 向 Kiro CLI 团队报告此 bug ，包含：
- Codex MCP 服务器会发送大量通知消息
- Kiro CLI 无法处理流式通知并读取最终响应
- 需要异步处理通知消息或增大缓冲区

2. 临时方案：已禁用 codex MCP ，直接使用 codex 命令行工具

3. 等待修复：这需要 Kiro CLI 更新其 MCP 客户端实现

抱歉无法通过配置解决，这确实是 Kiro CLI 的实现问题。

ZztGqk

11 天前 via iPhone

你有试过 codex 中 gpt4.2 xhigh 么，个人感觉比 xodex 前缀的模型好用

cBlank

11 天前

在用 Github Copilot ，一个人做项目的话，从我现在的了解和认知总觉的很流程难串起来。
我觉的应该是我认知不足。

例如我有一个想法，我对项目是有一定预期的。我认为的流程，输出原型，然后生成 UI/UX ，生成代码，部署等。
现在每个环节都非常的割裂或者只能等这 AI 随意发挥。

感觉完全不会利用各种 AI 的能力

ZztGqk

11 天前 via iPhone

@ZztGqk 打错了是 5.2… 另外我觉得 codex 模型前缀的都不太好用

leblos

11 天前

@hhxsky claude code 内置很多工具以及优化，你可以问 Ai 这 2 个有什么区别哈哈

leblos

11 天前

@BenjaminReed 没用过 Kiro 的 cli ，我也不知道怎么处理

leblos

11 天前

@cBlank 可以把需求拆分成多个任务，然后让 Ai 实现，现在 Ai 的上下文没有那么长，最好一个任务一个任务的视线

leblos

11 天前

@ZztGqk 我没用过 5.2xhigh ，但是 codex 结尾的是 openai 为了编程专门优化的不至于比没优化的差吧

left7410

11 天前

大佬能不能补充一下多个模型怎么来换切换使用的教程啊，另外还有 git 开发怎么同时开多个窗口在不同的分支上进行开发呀

qaq13037

11 天前

个人拙见，你这个文档内容没啥问题，文字组织结构不太对，既然是工具分享，就应该从大类开始分。一讲工具形态，例如插件、cli 、ide ，讲清楚工具的区别，分别对应哪些可用的国内外产品，对比其优缺点适配人群；二讲模型分类，国内外模型对比，模型跑分，可以在此部分或单启一章节描述技术风险（梯子成本、模型花费等）；三讲工具扩展，例如 mcp 、skills 、agent 等；最后讲你的个人理解，也就是你文中的扩展用法、实战、技巧等内容。

qaq13037

11 天前

@qaq13037 另外，多用图表来描述各个维度的对比，纯文字作为分享的体验感不好。

qaq13037

11 天前

@left7410 多模型切换扒拉扒拉 github ，v 站也有人分享过自己的开源工具，git 多分支不是有 worktree 命令吗

ZztGqk

11 天前 via iPhone

@leblos 是为了省 token 做的优化，反而不带后缀的更好用，但确实要用掉更多的用量

ougyoukou

11 天前

中转站能开票么

breezeStrak

11 天前

Nice

Keine

10 天前

@qaq13037 我用 Gemini Pro 炒了盘回锅肉你看看是你要的状态不
AI 编程工具指北：从选型到实战的深度复盘
第一部分：工具形态与选型 (Tools)
市面上的 AI 编程工具百花齐放，但本质上主要分为三类：IDE （集成开发环境）、CLI （命令行工具）和 Plugin （插件）。

1. IDE 类 (全接管体验)
这类工具提供最沉浸的体验，适合希望 AI 深度介入开发流程的用户。

Cursor

定位：目前体验独一档的 AI 编辑器，首选推荐。

优点：上手快，Tab 补全体验极其顺滑，功能完善（ Composer 、Review 等）。迭代速度快，生态成熟。

缺点：价格较贵（$20/月起，Team 版 $40/月）；依赖网络环境（需要较纯净的节点，否则 Claude 模型无法使用）。

Windsurf

定位：Codeium 出品，Cursor 的有力竞争者。

特点：之前的版本对网络要求相对较低，$15/月起步。

缺点：稳定性稍差，有把代码块改坏又修复的情况，按次收费模式可能导致成本不可控。

Trae / Qoder

定位：国产化/低成本替代方案。

特点：Trae 不需要魔法，价格便宜； Qoder 集成阿里闭源模型。

适用：网络受限或预算有限的团队，但功能精细度（如上下文管理、代码变更追踪）不如 Cursor 。

2. CLI 类 (极客/无头模式)
通过终端交互，适合喜欢键盘操作、自动化任务处理的开发者。

Claude Code (官方)

定位：Anthropic 官方推出的 CLI 工具。

优点：配合 Opus 4.5 模型效果极佳，原生支持 Skills 、Subagents 、斜杠命令，工程化能力极强。

缺点：极其昂贵（中转费用约 200+/月），官网直连困难。

OpenCode

定位：开源版的 Claude Code 平替。

特点：主要配合 OMO 插件使用，支持国内 GLM4.7 等模型。

优势：通过 Subagents 多智能体协同思路工作，省去了折腾 Skills 的麻烦。

Codex (CLI 版)

定位：性价比之选。

特点：GPT-5.2 Codex High 模型效果接近 Opus 4.5 ，但中转价格低廉（约 60 元/月）。找 Bug 和 Review 能力出色，遵循 Rules 严格。

缺点：思考时间过长，查看代码变更和上下文不如 GUI 直观。

3. Plugin 类 (轻量级辅助)
集成在 VSCode 或 JetBrains 中，不改变原有的开发习惯。

Augment Code

特点：插件形式中效果最好的工具，拥有独一档的上下文搜索工具 (ACE)。

门槛：官网难用，目前多通过闲鱼按量购买（无法开票）。

Kiro

特点：极其便宜（ 0.88 元/500 额度），引入了 Spec 模式。

缺点：小功能体验极差（上下文窗口小、压缩难受、无法重命名会话），主要用来辅助理解代码，不建议主力开发。

第二部分：模型能力与技术风险 (Models & Risks)
工具是外壳，模型是核心。选择合适的模型能事半功倍。

1. 模型红黑榜
Claude 3.5 Sonnet / Opus 4.5 (Claude Code):

评价：编程能力综合最强，是目前的天花板。Opus 4.5 在 Claude Code 中表现惊艳。

GPT-5.2 Codex High (OpenAI):

评价：仅次于 Opus 4.5 。逻辑严密，找 Bug 能力强，CodeReview 极其仔细。缺点是“思考时间”太长（有时过长）。

Gemini 3 Pro (Google):

评价：前端能力比较突出，拥有超大上下文优势。

GLM 4.6/4.7 (智谱):

评价：体验过，效果一般，可作为国内环境的保底方案。

2. 技术与合规风险
在团队落地时，必须考量以下成本：

网络成本（魔法）：Cursor 、Claude Code 、Antigravity 等强依赖纯净的美国 IP 。不稳定的节点会导致封号或功能不可用。

资金成本：

官方订阅（$20/月）成本固定但门槛高。

API 中转（如 Claude Code 中转）费用浮动大，高频使用可能高达 200+ 元/月。

闲鱼/按量购买：便宜但无法开票，且存在跑路风险，不适合企业级大规模采购。

第三部分：工具扩展 (Extensions)
AI 工具不仅仅是聊天框，通过扩展协议，可以让 AI 拥有“手和脚”。

1. MCP (Model Context Protocol)
连接 AI 与外部数据的标准协议。

常用推荐：Context7 MCP 、ACE （搜索）、Chrome DevTools （网页调试）、Tapd/Apifox （打通项目管理与接口文档）。

作用：让 AI 直接读取你的数据库、接口定义或浏览器控制台，无需人工复制粘贴。

2. Skills (技能包)
将重复的工作流程封装成工具，让 AI 自动调用。

实战场景：文档处理（ Excel/PDF ）、前端样式生成、自动化画图。

创建方法：手动创建脚本文件夹，或直接让 AI 根据你的需求生成 Skills 描述文件。

3. Subagents (子智能体)
概念：类似于开了一个“分身”，主 Agent 负责统筹，Subagent 负责脏活累活。

优势：Subagent 去查文档、搜代码的过程不占用主会话的上下文窗口，只返回精炼结果。

应用：专门做一个“Code Review 专家”或“文档查询员”。

第四部分：个人实战与心法 (Best Practices)
工具只是辅助，如何提问（ Prompt ）和如何管理上下文（ Context ）才是核心竞争力。

1. 核心工作流：计划模式 (Plan Mode / Spec)
切忌上来直接让 AI 写代码。推荐采用 Plan Mode：

Understand: 让 Agent 阅读代码库，询问澄清性问题。

Plan: 让 Agent 输出详细的 Markdown 实现计划（包含文件路径、改动逻辑）。

Review: 人工介入，像改文档一样直接修改这个 Plan 。

Execute: 确认无误后，再让 Agent 逐个任务执行。

Refine: 遇到偏差不要打补丁，回滚到 Plan 阶段，修改计划再重新生成。

2. 实战技巧 SOP
前置配置 (Rules):

项目级：在根目录创建 AGENTS.md 或 .cursorrules ，写入技术栈、代码规范、目录结构。

全局级：配置通用的代码偏好（如 Prefer TypeScript, no any ）。

Bug 修复六步法 (写在 Prompt 或 Skill 中):

复述问题 (Understand)

分析根本原因 (至少列出 2 种)

制定验证计划

执行修复

自我审查 (Review)

解释修改原因及防范措施

上下文管理 (Context Hygiene):

何时重启会话？完成一个功能闭环时； AI 开始胡言乱语或反复犯错时；上下文 token 爆炸时。

如何保持连贯？新会话中，引用上一个会话生成的 Spec 文档或核心代码文件。

3. AI 时代的心得
辅助而非替代：使用 AI 协助开发（ Pair Programming ），而不是完全丢给 AI 开发（ Outsourcing ）。

架构为王：代码生成的门槛降低了，但对业务理解、架构设计、技术基础的要求反而更高了。你需要有能力判断 AI 写的代码是否埋雷。

拥抱变化：无论是 CLI 还是 IDE ，工具形态在变，但核心的工程化思维（模块化、规范化）不变。

Aeolusire

10 天前

老哥有推荐的中转吗？

BigShot404

10 天前

什么渠道有 Kiro 0.88 500 点，我看官网都是 20 刀起的。

qaq13037

10 天前

@Keine 还得是 gemini ，理解力拉满，差不多就是这样

greenteaa

10 天前

这周开始使用 opencode ，不用 omo 插件，自己配了四个 Agent：
1. Explore ，使用 gemini-3-flash
2. Plan,使用 gemini3-pro ，护着 claude opus-4.5
3. Build ，使用 codex-5.1-codex-mini ，或者 codex-5.2-codex
4. review ，使用 claude sonnet-4.5

用了这个就回不去 codex cli, gemini cli, antigravity 了

leblos

9 天前

@left7410 我还没有这么试过，我目前感觉多开一个窗口和排队消息的机制够我用了，毕竟还要先自己规划，自己想一下 Ai 应该要生成什么样的代码

leblos

9 天前

@qaq13037 感觉老哥的建议，这几点我都好好再调整一下

fank99

5 天前

@greenteaa 请问是订阅了 zen 吗

greenteaa

4 天前

@fank99 没有订阅 ZEN ，订阅了 ChatGPT Plus & Gemini Pro 。我工作范围，写代码只占 1/3 ，所以不会专门订阅写代码的产品。大部分时候要聊方案，确定思路&架构，benchmark 。chatgpt/nano banana/notebooklm 重度用户