V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录

独立开发者节点

愿每一位独立开发者都能保持初心,获得一个好的结果.

leblos
V2EX  ›  Vibe Coding

Ai coding 分享

  •  1
     
  •   leblos · 11 天前 · 3244 次点击
    组内要做 Ai 工具的分享,在网上搜索了很多博客整理了下面的内容,各位 V 友能给点建议吗,看是否有需要修改调整的地方

    Ai 模型选择
    SWE-bench
    个人感受:
    ● 除了 Claude code 和 codex ,其他工具的模型或多或少受一些限制
    ● claude 编程能力综合最强
    ● codex 中的 gpt5.2 codex high 感觉是除了 claude code 中的 opus4.5 最强的,思考时间长(但是有点太长了),找 Bug 能力不错,CodeReview 也仔细,并且也非常遵循 rules 。
    ● Gemini3 Pro 前端能力比较强
    ● GLM4.6 体验过,当时效果感觉一般。

    Ai 工具选择
    ● claudecode: 官网的基本用不了,中转的费用也在 200 多左右。但是 Opus4.5 在 claudecode 效果确实好,并且有 skills 、subagent 、插件、斜杠命令等工具
    ● Codex:
    ○ gpt5.2codex high 模型效果不错和 Opus4.5 差距不大,并且价格便宜,无论是官网还是说中转都比 ClaudeCode 便宜,中转只要 60 元每月。思考时间长(但是有点太长了),找 Bug 能力不错,CodeReview 也仔细,一个对话窗口还挺大也能自动压缩。并且也非常遵循 rules 、skills ,也会去找相关的代码。
    ○ 有插件和 cli ,但是插件最新的模型好像不支持,还是主要使用 cli ,指明代码上下文没那么方便,看代码变更也没那么方便
    ● Cursor:
    ○ 需要稍微干净的魔法不然用不了 Claude 等模型(还需要考虑魔法的价格),价格也不便宜,每月 20 美刀起步套餐, 有 Team 套餐,但是好像 40 美刀起步
    ○ 第一次 Ai 编程首选,上手快,独一档的 Tab 。各种功能完善,使用了 cursor 后使用其他的软件感觉都没有那么舒服。迭代更新速度快。
    ○ 咸鱼也有按量卖的,但是规模不大,不能开票
    ● Augment Code:
    ○ 官网用不了,现在要用只能使用咸鱼按量卖的,不能开票,并且价格也不便宜
    ○ 插件形式效果最好的工具,独一档的上下文搜索工具:ACE
    ● Antigravity:
    ○ 需要非常纯净的美国 ip (魔法的价格就不便宜),现在 claude 的额度在减少,在网上也能经常看到吐槽
    ○ 有免费额度,谷歌年度 pro 也能使用信用卡白嫖,然后讲 Antigravity 的额度逆向到 claudecode 使用
    ● windsurf:
    ○ 之前使用好像不需要使用魔法,价格 15 美刀起步
    ○ 经常把代码块改坏然后又修复,按次收费
    ● Trae:
    ○ 不用魔法,价格便宜
    ○ 按次收费
    ● Kiro:
    ○ 现在 0.88 就能用 500 额度,但是使用效果一般,主要用来帮助理解代码
    ○ spec 模式
    ○ 各种小功能都非常难用:代码变更都没有做好,上下文的窗口小的离谱,压缩上下文的操作也很难受,会话不能重命名,不能渲染 mermind 图,不能排队任务
    ● Qoder:
    ○ 不用魔法,价格也好像不便宜
    ○ 阿里闭源模型,没用来写过需求不做评价
    ● OpenCode:
    ○ 开源的 claudecode (可以这么理解),只能使用 api ,相当于只能使用国内的 GLM4.7 。主要配合 OMO 插件使用,主要的思路还是使用多个 subagents 去执行任务,并且不同的 subagents 可以指定不同的模型。
    ○ 主要的优势是不用去折腾 subagents 、skills ,但是具体效果网上褒贬不一,让子弹再飞一会。


    能力特性:

    skills

    好用的 skills
    现有:doc 、excel 、pdf 、ppt 、画图、前端样式描述
    可以把工作上的流程(主要还是需要重复和 Ai 说的)封装成一个个 skills ,然后让 ai 再不同的阶段去获取 skills:代码 review 、Bug 处理等

    Bug 处理
    当你被要求修复一个 Bug 时,请遵循以下步骤:
    1. **理解问题 (Understand):** 仔细阅读 Bug 描述和相关代码,复述你对问题的理解。
    2. **分析原因 (Analyze):** 提出至少两种可能的根本原因。
    3. **制定计划 (Plan):** 描述你打算如何验证这些原因,并给出修复方案。
    5. **执行修复 (Execute):** 实施修复。
    6. **审查 (Review):** 查看自己的修改有没有问题。
    7. **解释说明 (Explain):** 解释你做了哪些修改以及为什么。
    8. 预防措施:如何避免再次发生

    如何创建 skills
    可以直接手动创建文件夹,文档、脚本、参考文件就行。或者直接让 Ai 帮忙生成,自己描述 skills 内容就行

    Mcp
    ● Context7 MCP 、ACE 、Chrome DevTools MCP 、tapd 、apifox
    Subagents (智能体,角色)
    ● 有点类似直接开了一个新的对话窗口,然后和主 agent 一样可以调用不同的工具然后加上一些提示词。
    ● 可以用来去查询信息,比如说查询业务信息,查询最新的文档,也可以去让 subagent 去使用 skills 和 MCP ,然后把处理的信息精炼后返回给主 agent ,然后去搜索的过程就不会占用主 agent 的上下文
    ● 主要是可以把自己经常要和 Ai 做的操作去做成 subagents (代码 review )

    斜杠命令
    ● 其实就是把经常要输入给 Ai 的提示词来生成命令,然后 Ai 就能获取信息

    插件
    SuperPowers:主要利用了 skills 和 subagents
    https://github.com/obra/superpowers
    https://github.com/anthropics/claude-code/blob/main/plugins/feature-dev/commands/feature-dev.md
    ohmyopencode:

    Cursor 的一些功能介绍
    ● 自定义模型:可以使用 GLM4.7
    ● worktree:
    ● 同时运行多个模型:计划或者复杂的情况
    ● 浏览器:内置的浏览器可以打开前端页面,然后进行调整,并且修改代码。
    ● 命令

    编程技巧:

    开发前置配置:
    ● 项目 rules:直接使用 init 初始化的 AGENTS.md/claude.md (项目介绍、技术栈等等),将项目一些经常需要修改的代码规范也可以写在这个文件中
    ● 全局 rules:
    ● 给项目代码加上索引
    使用计划模式( spec ,或者说平时的沟通)
    切换计划模式( Plan Mode )。Agent 不会立即写代码,而是:
    1. 研究你的代码库,找到相关文件
    2. 询问澄清性问题,明确需求
    3. 创建详细的实现计划,包含文件路径和代码引用
    4. 等待你确认后再开始构建

    计划模式实战:
    理解需求,阅读需求有关的代码,整理开发思路与 Ai 沟通思路的可行性,输出给 Ai:Agent 会询问澄清性问题,创建可审阅的计划。
    计划会以 Markdown 文件形式打开,你可以直接编辑——删除不必要的步骤、调整方案,或补充 Agent 遗漏的上下文,以及后续对话新加的内容也需要加到文件里面。
    生成的任务也不要一次性都完成,一个任务一个任务的完成,并且再补充一些上下文信息,再进行代码 review ,功能自测。
    代码开发完后还能让 Ai 生成单元测试,以及让 Ai Review 代码 业务逻辑、性能、安全等方面。

    当然并非每个任务都需要详细计划。快速修改或你已经做过很多次的任务,直接用 Agent 就好。
    有时 Agent 构建的东西与你期望的不符。与其通过追加提示词来修补,不如回到计划阶段。撤销更改,细化计划使其更具体,然后重新运行。这通常比修正进行中的 Agent 更快,结果也更干净。

    管理上下文
    引用现有的信息
    ● 代码、数据库表、业务信息、类似的逻辑代码
    ● 之前的 spec 文档
    ● cursor 还支持引用之前的对话
    ● 现有的业务文档
    何时开始新对话
    最常见的问题之一:继续当前对话还是开始新的?
    开始新对话的情况:
    ● 转向不同的任务或功能
    ● Agent 看起来很困惑或反复犯同样的错误
    ● 完成了一个逻辑工作单元
    ● 上下文内容过多
    继续当前对话的情况:
    ● 在同一个功能上迭代
    ● Agent 需要之前讨论的上下文
    ● 正在调试它刚构建的东西
    长对话会让 Agent 失去焦点。经过多轮对话和摘要后,上下文会累积噪音,Agent 可能会分心或转向不相关的任务。如果你发现 Agent 效率在下降,就该开始新对话了。

    拓展 agent
    ● rules
    ● skills
    ● 自定义命令
    ● 插件
    ● subagents

    Ai 的一些其他用法
    ● 需求梳理:
    ○ 指明具体的代码后,先让 ai 把代码解释一下,并且画图帮助自己理解。然后自己去看具体的代码,如果有不懂让 ai 继续解释不懂的代码并且画图,然后自己再去梳理业务。梳理的业务文档还可以再给 Ai 看一下,看是否有业务遗漏,后续的对话再在该文档上进行补充。
    ○ 有时候也可以让 Ai 给一些具体的数据来帮助理解代码
    ● 业务图:
    ○ 业务的一些流程图、表关系也可以借助 ai 生成 mermind 格式的代码,然后导入到 draw.io ,再自己进行调整细节。一些 markdown 格式也能支持 mermind 格式的渲染。现在 obsidian 开源了一个 skills ,生成图的颜色,可读性更高了

    Ai 时代的一些思考
    ● 需要注重自己的独立思考能力提升
    ● 加强对复杂业务的理解
    ● 使用 Ai 协助开发而不是完全交给 Ai 开发
    ● 需要注重技术基础和架构能力
    ● 需要知道 Ai 擅长与不擅长的点,充分利用 Ai 提效,积极拥抱 Ai
    第 1 条附言  ·  9 天前
    大家可以到我主页另外一个帖子看一下,我重新整理了一下格式
    26 条回复    2026-01-22 08:51:27 +08:00
    leblos
        1
    leblos  
    OP
       11 天前
    第一次发帖,不知道为什么语雀上的 markdown 格式变成这样了,大家凑合着看吧
    hhxsky
        2
    hhxsky  
       11 天前 via Android
    claude code 与 cline 插件之类有什么区别?我 claude code 安装好以后,baseURL 换成 kimi 和 key ,也可以接其他中转的,这感觉操作和 cline 一样
    BenjaminReed
        3
    BenjaminReed  
       11 天前
    楼主您好,请问下 kiro-cli 里面想调用 codex 对修改的代码进行 review 要怎么配置呢。

    追着 AI 问了好久,返回了这个信息。

    ### 技术细节
    1. Codex MCP 服务器工作正常,返回了完整响应
    2. Codex 发送大量 codex/event 通知消息(流式输出)
    3. Kiro CLI 在读取 STDIO 时被阻塞,无法读取到最终的 result 响应
    4. 这是一个**缓冲区死锁**或**流处理不当**的问题

    ### 建议
    1. 向 Kiro CLI 团队报告此 bug ,包含:
    - Codex MCP 服务器会发送大量通知消息
    - Kiro CLI 无法处理流式通知并读取最终响应
    - 需要异步处理通知消息或增大缓冲区

    2. 临时方案:已禁用 codex MCP ,直接使用 codex 命令行工具

    3. 等待修复:这需要 Kiro CLI 更新其 MCP 客户端实现

    抱歉无法通过配置解决,这确实是 Kiro CLI 的实现问题。
    ZztGqk
        4
    ZztGqk  
       11 天前 via iPhone
    你有试过 codex 中 gpt4.2 xhigh 么,个人感觉比 xodex 前缀的模型好用
    cBlank
        5
    cBlank  
       11 天前
    在用 Github Copilot ,一个人做项目的话,从我现在的了解和认知总觉的很流程难串起来。
    我觉的应该是我认知不足。

    例如我有一个想法,我对项目是有一定预期的。我认为的流程,输出原型,然后生成 UI/UX ,生成代码,部署等。
    现在每个环节都非常的割裂或者只能等这 AI 随意发挥。

    感觉完全不会利用各种 AI 的能力
    ZztGqk
        6
    ZztGqk  
       11 天前 via iPhone
    @ZztGqk 打错了是 5.2… 另外我觉得 codex 模型前缀的都不太好用
    leblos
        7
    leblos  
    OP
       11 天前
    @hhxsky claude code 内置很多工具以及优化,你可以问 Ai 这 2 个有什么区别哈哈
    leblos
        8
    leblos  
    OP
       11 天前
    @BenjaminReed 没用过 Kiro 的 cli ,我也不知道怎么处理
    leblos
        9
    leblos  
    OP
       11 天前
    @cBlank 可以把需求拆分成多个任务,然后让 Ai 实现,现在 Ai 的上下文没有那么长,最好一个任务一个任务的视线
    leblos
        10
    leblos  
    OP
       11 天前
    @ZztGqk 我没用过 5.2xhigh ,但是 codex 结尾的是 openai 为了编程专门优化的不至于比没优化的差吧
    left7410
        11
    left7410  
       11 天前
    大佬能不能补充一下多个模型怎么来换切换使用的教程啊,另外还有 git 开发怎么同时开多个窗口在不同的分支上进行开发呀
    qaq13037
        12
    qaq13037  
       11 天前
    个人拙见,你这个文档内容没啥问题,文字组织结构不太对,既然是工具分享,就应该从大类开始分。一讲工具形态,例如插件、cli 、ide ,讲清楚工具的区别,分别对应哪些可用的国内外产品,对比其优缺点适配人群;二讲模型分类,国内外模型对比,模型跑分,可以在此部分或单启一章节描述技术风险(梯子成本、模型花费等);三讲工具扩展,例如 mcp 、skills 、agent 等;最后讲你的个人理解,也就是你文中的扩展用法、实战、技巧等内容。
    qaq13037
        13
    qaq13037  
       11 天前
    @qaq13037 另外,多用图表来描述各个维度的对比,纯文字作为分享的体验感不好。
    qaq13037
        14
    qaq13037  
       11 天前
    @left7410 多模型切换扒拉扒拉 github ,v 站也有人分享过自己的开源工具,git 多分支不是有 worktree 命令吗
    ZztGqk
        15
    ZztGqk  
       11 天前 via iPhone
    @leblos 是为了省 token 做的优化,反而不带后缀的更好用,但确实要用掉更多的用量
    ougyoukou
        16
    ougyoukou  
       11 天前
    中转站 能开票么
    breezeStrak
        17
    breezeStrak  
       11 天前
    Nice
    Keine
        18
    Keine  
       10 天前
    @qaq13037 我用 Gemini Pro 炒了盘回锅肉 你看看是你要的状态不
    AI 编程工具指北:从选型到实战的深度复盘
    第一部分:工具形态与选型 (Tools)
    市面上的 AI 编程工具百花齐放,但本质上主要分为三类:IDE (集成开发环境)、CLI (命令行工具) 和 Plugin (插件)。

    1. IDE 类 (全接管体验)
    这类工具提供最沉浸的体验,适合希望 AI 深度介入开发流程的用户。

    Cursor

    定位: 目前体验独一档的 AI 编辑器,首选推荐。

    优点: 上手快,Tab 补全体验极其顺滑,功能完善( Composer 、Review 等)。迭代速度快,生态成熟。

    缺点: 价格较贵($20/月起,Team 版 $40/月);依赖网络环境(需要较纯净的节点,否则 Claude 模型无法使用)。

    Windsurf

    定位:Codeium 出品,Cursor 的有力竞争者。

    特点: 之前的版本对网络要求相对较低,$15/月起步。

    缺点: 稳定性稍差,有把代码块改坏又修复的情况,按次收费模式可能导致成本不可控。

    Trae / Qoder

    定位: 国产化/低成本替代方案。

    特点:Trae 不需要魔法,价格便宜; Qoder 集成阿里闭源模型。

    适用: 网络受限或预算有限的团队,但功能精细度(如上下文管理、代码变更追踪)不如 Cursor 。

    2. CLI 类 (极客/无头模式)
    通过终端交互,适合喜欢键盘操作、自动化任务处理的开发者。

    Claude Code (官方)

    定位:Anthropic 官方推出的 CLI 工具。

    优点: 配合 Opus 4.5 模型效果极佳,原生支持 Skills 、Subagents 、斜杠命令,工程化能力极强。

    缺点: 极其昂贵(中转费用约 200+/月),官网直连困难。

    OpenCode

    定位: 开源版的 Claude Code 平替。

    特点: 主要配合 OMO 插件使用,支持国内 GLM4.7 等模型。

    优势: 通过 Subagents 多智能体协同思路工作,省去了折腾 Skills 的麻烦。

    Codex (CLI 版)

    定位: 性价比之选。

    特点:GPT-5.2 Codex High 模型效果接近 Opus 4.5 ,但中转价格低廉(约 60 元/月)。找 Bug 和 Review 能力出色,遵循 Rules 严格。

    缺点: 思考时间过长,查看代码变更和上下文不如 GUI 直观。

    3. Plugin 类 (轻量级辅助)
    集成在 VSCode 或 JetBrains 中,不改变原有的开发习惯。

    Augment Code

    特点: 插件形式中效果最好的工具,拥有独一档的上下文搜索工具 (ACE)。

    门槛: 官网难用,目前多通过闲鱼按量购买(无法开票)。

    Kiro

    特点: 极其便宜( 0.88 元/500 额度),引入了 Spec 模式。

    缺点: 小功能体验极差(上下文窗口小、压缩难受、无法重命名会话),主要用来辅助理解代码,不建议主力开发。

    第二部分:模型能力与技术风险 (Models & Risks)
    工具是外壳,模型是核心。选择合适的模型能事半功倍。

    1. 模型红黑榜
    Claude 3.5 Sonnet / Opus 4.5 (Claude Code):

    评价: 编程能力综合最强,是目前的天花板。Opus 4.5 在 Claude Code 中表现惊艳。

    GPT-5.2 Codex High (OpenAI):

    评价: 仅次于 Opus 4.5 。逻辑严密,找 Bug 能力强,CodeReview 极其仔细。缺点是“思考时间”太长(有时过长)。

    Gemini 3 Pro (Google):

    评价: 前端能力比较突出,拥有超大上下文优势。

    GLM 4.6/4.7 (智谱):

    评价: 体验过,效果一般,可作为国内环境的保底方案。

    2. 技术与合规风险
    在团队落地时,必须考量以下成本:

    网络成本(魔法):Cursor 、Claude Code 、Antigravity 等强依赖纯净的美国 IP 。不稳定的节点会导致封号或功能不可用。

    资金成本:

    官方订阅($20/月)成本固定但门槛高。

    API 中转(如 Claude Code 中转)费用浮动大,高频使用可能高达 200+ 元/月。

    闲鱼/按量购买:便宜但无法开票,且存在跑路风险,不适合企业级大规模采购。

    第三部分:工具扩展 (Extensions)
    AI 工具不仅仅是聊天框,通过扩展协议,可以让 AI 拥有“手和脚”。

    1. MCP (Model Context Protocol)
    连接 AI 与外部数据的标准协议。

    常用推荐:Context7 MCP 、ACE (搜索)、Chrome DevTools (网页调试)、Tapd/Apifox (打通项目管理与接口文档)。

    作用: 让 AI 直接读取你的数据库、接口定义或浏览器控制台,无需人工复制粘贴。

    2. Skills (技能包)
    将重复的工作流程封装成工具,让 AI 自动调用。

    实战场景: 文档处理( Excel/PDF )、前端样式生成、自动化画图。

    创建方法: 手动创建脚本文件夹,或直接让 AI 根据你的需求生成 Skills 描述文件。

    3. Subagents (子智能体)
    概念: 类似于开了一个“分身”,主 Agent 负责统筹,Subagent 负责脏活累活。

    优势:Subagent 去查文档、搜代码的过程不占用主会话的上下文窗口,只返回精炼结果。

    应用: 专门做一个“Code Review 专家”或“文档查询员”。

    第四部分:个人实战与心法 (Best Practices)
    工具只是辅助,如何提问( Prompt ) 和 如何管理上下文( Context ) 才是核心竞争力。

    1. 核心工作流:计划模式 (Plan Mode / Spec)
    切忌上来直接让 AI 写代码。 推荐采用 Plan Mode:

    Understand: 让 Agent 阅读代码库,询问澄清性问题。

    Plan: 让 Agent 输出详细的 Markdown 实现计划(包含文件路径、改动逻辑)。

    Review: 人工介入,像改文档一样直接修改这个 Plan 。

    Execute: 确认无误后,再让 Agent 逐个任务执行。

    Refine: 遇到偏差不要打补丁,回滚到 Plan 阶段,修改计划再重新生成。

    2. 实战技巧 SOP
    前置配置 (Rules):

    项目级:在根目录创建 AGENTS.md 或 .cursorrules ,写入技术栈、代码规范、目录结构。

    全局级:配置通用的代码偏好(如 Prefer TypeScript, no any )。

    Bug 修复六步法 (写在 Prompt 或 Skill 中):

    复述问题 (Understand)

    分析根本原因 (至少列出 2 种)

    制定验证计划

    执行修复

    自我审查 (Review)

    解释修改原因及防范措施

    上下文管理 (Context Hygiene):

    何时重启会话? 完成一个功能闭环时; AI 开始胡言乱语或反复犯错时;上下文 token 爆炸时。

    如何保持连贯? 新会话中,引用上一个会话生成的 Spec 文档 或核心代码文件。

    3. AI 时代的心得
    辅助而非替代: 使用 AI 协助开发( Pair Programming ),而不是完全丢给 AI 开发( Outsourcing )。

    架构为王: 代码生成的门槛降低了,但对业务理解、架构设计、技术基础的要求反而更高了。你需要有能力判断 AI 写的代码是否埋雷。

    拥抱变化: 无论是 CLI 还是 IDE ,工具形态在变,但核心的工程化思维(模块化、规范化)不变。
    Aeolusire
        19
    Aeolusire  
       10 天前
    老哥有推荐的中转吗?
    BigShot404
        20
    BigShot404  
       10 天前
    什么渠道有 Kiro 0.88 500 点,我看官网都是 20 刀起的。
    qaq13037
        21
    qaq13037  
       10 天前
    @Keine 还得是 gemini ,理解力拉满,差不多就是这样
    greenteaa
        22
    greenteaa  
       10 天前
    这周开始使用 opencode ,不用 omo 插件,自己配了四个 Agent:
    1. Explore ,使用 gemini-3-flash
    2. Plan,使用 gemini3-pro ,护着 claude opus-4.5
    3. Build ,使用 codex-5.1-codex-mini ,或者 codex-5.2-codex
    4. review ,使用 claude sonnet-4.5

    用了这个就回不去 codex cli, gemini cli, antigravity 了
    leblos
        23
    leblos  
    OP
       9 天前
    @left7410 我还没有这么试过,我目前感觉多开一个窗口和排队消息的机制够我用了,毕竟还要先自己规划,自己想一下 Ai 应该要生成什么样的代码
    leblos
        24
    leblos  
    OP
       9 天前
    @qaq13037 感觉老哥的建议,这几点我都好好再调整一下
    fank99
        25
    fank99  
       5 天前
    @greenteaa 请问是订阅了 zen 吗
    greenteaa
        26
    greenteaa  
       4 天前
    @fank99 没有订阅 ZEN ,订阅了 ChatGPT Plus & Gemini Pro 。我工作范围,写代码只占 1/3 ,所以不会专门订阅写代码的产品。大部分时候要聊方案,确定思路&架构,benchmark 。chatgpt/nano banana/notebooklm 重度用户
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5710 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 06:07 · PVG 14:07 · LAX 22:07 · JFK 01:07
    ♥ Do have faith in what you're doing.