经过近 2 年的 AI 编程工具使用,积累了一些使用这些工具的经验和心得,本文分享出来。
以下分类纯属个人偏好,无任何客观依据,全是主观感受,仅供参考。
第一梯队
Claude Code、Cursor、Augement Code、Windsurf、Warp、Gemini CLI
第一梯队里的大家应该很熟悉,都是明星产品,我从接触时间的早晚来分别聊一下。
Cursor

Cursor 算是老朋友了,一直用。早期最令我兴奋的一款 AI 编程工具产品,还专门写了篇文章尬吹了一下,今天翻回去看,我觉得吹的内容用 Cursor 基本上都能实现了。
经过多次版本更新,Cursor 的使用模式稳定在了三种

用过 AI 工具的都知道,工具最核心的是底层使用的模型是什么,模型强不强决定着 “输出” 质量高不高,也就决定着代码质量。这跟开发者的切身利益可是息息相关的。
很多开发者使用 Cursor 最看重的就是它能够使用 Claude 家最能打的模型,过去是 claude-3.5-sonnet 现在是 claude-4-sonnet 以及 claude-4-opus 。这对于非专业开发者可能不够熟悉,大众更熟悉的是 OpenAI 的 4o 或者 Google 家的 gemini,无可厚非,但毋庸置疑的是,上面提到的 claude 家的一系列模型在编程领域就是最强的。不然广大开发者也不会心甘情愿的 “氪金” 来使用它。
越好的模型越受欢迎,自然价格也水涨船高,像下面这两个模型我一般不开,因为(Max Only)除了订阅费以外还要单独收费

除了常规的操作,Cursor 自然也加入了 MCP,你可以添加自定义的 MCP

不过从我的日常开发使用经验上来说,MCP 用的时候不多。Cursor 自己其实也内置了一些 MCP,比如它会读你的本地文件,新建终端并执行 CLI 命令,联网搜索相关问题的答案等。
Cursor 一直在更新,无论是添加新功能,还是改善老功能,总之肉眼可见的在进步,然而还是有一些常见的使用问题,它比较影响用户体验。比如使用 claude-4-sonnet 时经常报网络异常,你跟他开始聊得好好的,有时候就突然开始没法响应了,报网络异常,有些时候是真着急,因为你代码改到一半,消耗了那么多 token 和时间,总不能半途而费吧,可 Cursor 就是不给你响应了,等待让人焦虑和上火。这时候我通常会切换到其他模式试一试比如 gemini。gemini 的最大优点是上下文够长,1M 上下文一般一个 Thread 怎么也够用了。但这也有风险,就像你同时请教 2 位专家,一位说着说着停了,你转头问另一位,但关键是 2 个人就有可能有 2 种不同的思路,这时候修改代码就需要你特别注意了,不要被误导,因为第 2 位可能会完全颠覆第 1 位提供的代码和思路。(我已被坑过了 )
其实这个问题我要反思,用 AI 工具开发,不能真的是 Vibe Coding ,因为我们是专业的开发人员,不能偷懒,否则容易被坑,得不偿失。AI 要像 “领航员”、“辅助驾驶” 、“僚机” ,不能够完全托管给它,因为专业的开发人员写的代码不是玩具,也不是仅仅能 run 起来就行的代码。我们要考虑的问题很多,比如架构、扩展性、易读性、性能、成本、团队情况等等。
如果你抱着谨慎的态度使用 AI编程工具和你一起编程的话,可能使用最多的就是 TAB ,而这一点 Cursor 做的相当不错,可以说是很神,你改了一个函数、参数、方法声明、方法实现,按一下 TAB 它是真的很智能,基本上能够想到你应该做的下一步是什么,这些本来就需要做的,比如重构,让它完美的提醒,这正是使用 Cursor 这种 AI 编程工具的一个非常适合的场景。
而如果你抱着宽容、放纵的态度使用 Cursor 的话就一定会被 AI 的另一面所伤,比如 “幻觉”,当然伤势情况根据你的宽容程度而定。如果你放手让他大刀阔斧的进行重构,它有可能删除很多文件,新建很多文件,理想的情况是完美的完成了,但前提也一定是你给他做好了任务规划,让他一次只完成一个具体的任务,而不是给一个比较笼统的要求,比如重构一下整个项目。
还有一种情况是上下文,虽然像 gemini 这种模型具有长上下文,我们在使用时也要脑子里有这根弦,上下文不能够太长,太长很容易产生幻觉和出一些意想不到的问题。我记得有一次我为了解决一个 bug,一直在一个 Thread 中和模型交互,模型最后的解决方案是把我 bug 相关的代码全部删除了,然后跟我说:“我保证,这次一定不会有问题了” 。 我是真谢了~
所以,我们到底应该抱以什么态度来使用 AI 编程工具是个关键的问题,我认为要具体问题具体分析,如果你真的是为了写一个 demo 而写代码,真的是能 run 就行,那可以采取比较激进和宽容的态度,放手让AI 实现,没什么大不了的,大不了就从头重写。而如果你写的是公司的生产级代码,那么就需要秉承谨慎和适当放手的策略,全程监督,让 AI 辅助你,而不是完全让他 “自动驾驶”。AI 越来越强大,但人类需要学习,哪怕慢一点,边学边干。否则......(此处省略一万字)
Windsurf

在早期,相对 Cursor,我更喜欢 Windsurf ,原因很简单,同样的底层模型,不知道为什么, Windsurf 给的结果就是更好,更实用、可用。其实发展到现在,从功能上讲它跟 Cursor 差别不大,但从我的使用习惯、使用频率、模型以及软件背后母公司的发展等多方面考虑,最后我还是选择使用 Cursor 作为主力 AI 编程工具。
后来的事情大家都知道了:“OpenAI 同意以 30 亿美元的价格收购Windsurf”
后来,Winsurf 发布了自己的新模型 : SWE-1

总之,Winsurf 并不是牛夫人,它是一个很不错的软件,我也表示对它的敬畏和欣赏,Cursor 有的问题它也有,Cursor 没有的问题它不见得没有,只不过是我使用的时间没有那么长而已。
也许有一天我还会转回使用 Winsurf,但现实就是如此,我不可能同时开那么多订阅,花那么多钱在多个 AI 编程工具上面。
Claude Code
就在 Cursor 等一众 AI Coding 工具大杀四方的时候 Claude 低调地推出了它的 Claude Code。起初非常不起眼,我甚至都没有兴趣试用一下,直到后来有很多人用过了以后开始对它大为赞赏这才引起了我的兴趣。
作为一个看起来有点儿 “土” 的工具,它是以终端命令的形式提供给用户使用的,不是 IDE,没有 GUI 界面,只有命令,你需要在终端使用命令和它交互。

其实作为专业的开发人员,对命令行并不陌生,反而会更亲近,这种形式没有 GUI,效率更高,但相对的是它对非专业人士没有 Cursor、VsCode 这种 IDE 友好。对于我来说,这无所谓,我都能接受。因为我看的是效果、结果、代码质量。
但另一个问题就是个很大的门槛了,那就是 Claude 的账户问题。无论使用 Cursor 还是 Claude Code,花钱订阅几乎是必须的,但 Claude 家对账号的管控几近变态,动不动账户就被 ban 了,你需要拥有一个 “稳定” 的干净的账号,然后再订阅,其实说难也不难,但处理起来比较麻烦。当然也有使用 API 中转的方式,相对方便,这里就不多说了。
我在深度体验了 2 天 Claude Code 后明白了为什么大家都想订阅 200
的是不限 token 的,而且服务比较稳定,不像 Cursor 时不时的会抽风。
我大致同意网上对 Claude Code 的赞美,但我也发现了很多无脑吹的,这和我的体验大相径庭,所以我得谈谈我的感受:
- 首先,Claude Code 内置了许多 tools,而且它对任务的规划比较完整,再加上 tools,这样它对任务的执行就比较完整,注意不是完美,而是完整,不会让一个任务 “缺胳膊少腿”,总是差一点儿。
- 完整的任务规划的代价就是烧 token,会用很多的 token,如果你没有订阅 200$ 这种无限量的,那可得省着点儿用。
- 会思考,根据上下文、程序的输出日志、执行情况推断任务是否完成,是否重新执行,是否修改任务重新执行等,你看这么多事儿都是要调用模型的,也是要烧 token 的。
- 无论哪个模型,仍然有幻觉,我们在其他 AI 工具上的经验可以移植,要谨慎,不要轻信它。
- 它看起来很强大,可以思考、规划并自动完成你指定的任务,即便是比较大的任务。但很慢,对于你自己能干的事情,没必要浪费时间让它干,之前我偷懒让它完善一下 .gitignore 文件,它花了好久才搞定,虽然正确,但我干只需要一秒。而它要动用很多工具进行全面的分析,最后得出一个只改一行代码的结论。有点儿坑。
- 对代码的管理依赖 git,虽然无可厚非,但确实不如 Cursor方便,鼠标点一下就能 restore 了。这一点儿我不争论,它是个习惯问题,就像不习惯使用 Vim 的虽然也承认 Vim 高效,但就是用不惯。
- 用最强的模型+最优的 prompt 自然能产生最好的结果,这是人和 AI 配合的结果,我不知道这个优点能不能算到 Claude Code 的头上,因为对于其他 AI Coding 工具也适用。我不知道能不能算的原因还有一个是我不并知道 Cursor 内部做了什么,Claude Code 内部又做了什么,我只能拿结果比较,事实是 Claude Code 略胜一筹,但却让我有一丝担忧,因为它总让我有种快控制不了它的感觉。(指不定什么时候要出事儿)
起初,我对 Claude Code 的热情是高涨的,但由于我的 2 个账号接连被 ban,订阅费又这么贵,合计了一下,还是回到 Cursor 了。这并不是说 Claude Code 不好,只不过对于我,这是个选择问题。
哦,对了,因为不是 IDE,纯命令行,所以如果你用习惯了 TAB ,Claude Code 可没有哈。使用模式要变。
Gemini CLI
Google 是一家任谁都不能忽视的公司,在科技领域遍布它的身影,自然 AI Coding 工具也少不了它的参与。
在我写这篇文章的上午 ,google 参战了,发布了 Gemini CLI,它是开源免费的,你用 Google 账号登录,就能直接使用,每天有 1000 次限额,够用了。
它的产品逻辑和 Claude Code 一样,你可以把它理解成 Claude Code 的平替。它是开源的。

从功能、使用体验、效果等各个角度来看,目前它确实都不如 Claude Code,但它的优势也是那么的明显:免费、gemini 2.5模型上下文够长,量大管饱、大厂背书可信赖、将来生态集成可期...
从我在 Cursor 使用 gemini 模型的经验来看,我对 Google , 不,应该是 gemini 是有强烈好感的,它确实强:比我命还长的上下文(1M),强大的推理和思考能力,不输给任何模型的基础能力,你还要什么自行车呢? 用就好了。
Warp

Warp 最初是作为终端工具进入我的视野的,那时候 我还在用 iTerm2,使用了 Warp 以后,被它良好的用户体验和优美的外观吸引。随着它不同的更新,在最近两年加入了 AI 功能,成为了一个智能开发工具。
由于我经常进行服务器的运维工作,终端工具的使用是非常频繁的,小到执行些基础的运维命令,大于写 shell 、python 脚本 ,进行服务器初始化 、k8s 部署。
其实相比 Claude Code,Warp 新加的 AI 功能带给我的体验是很自然的。因为在命令行环境,我的输入、输出 Warp 都能捕获到,进而给我具体的建议和任务规划,当然,它背后仍然是大模型提供的能力。

在我敲命令时,它可以给我提示,当命令执行完成输出结果时,它可以指导我进行下一步的操作,如果我忘了命令该怎么写,它也可以完成命令,或者给出最合理的建议并自动执行。

当然用模型是要花钱的,它有一些免费的额度,用完了就需要付费了。最近它又加入了 “上下文” ,可以将你的代码工程作为上下文给他分析,同时与你一起结伴编程。

这就和 Claude Code 以及 Gemini CLI 很像了。不过说实话我用 Warp 还是基于命令行的场景,编程一般不会它,还是会用 Cursor。但它确实越来越强了,值得大家的关注。
Augement Code
无论 Cursor、Claude Code 如何优秀,都有令人不满的地方,在体验了这么多产品以后,我发现 Augement Code 比较适合我,虽然我还没有正式订阅,但它是目前为止我最满意的。

Augement Code 目前并不是一个独立的 IDE,而是一个插件,它可以在 IDEA 以及 VsCode 中安装使用。
作为一个 AI Coding 工具,它的基础功能和 Cursor 差不多,就不赘述了。下面说说它的特点:
- 你无法选用模型,从现在知道的资料来看,貌似使用的是 claude-3.5-sonnet ,但我觉得可能不是,很有可能是更强的。虽然无法选模型,但输出质量很高。不比 Cursor 这种可选模型的差。所以如果是 claude-3.5-sonnet 就能输出这样的质量,那 Augement Code 团队可真了不起。
- 会自动进行一系列的任务规划,并清楚地展示给你看具体细节

- 任务规划完成后,对于没有把握或你没有确认过的事项,更倾向于新建文件,而不是修改你原本的代码。这一点我很受用,因为 Cursor 经常在多轮对话中把代码越改越滥,最后迫不得已我点了 restore checkpoint
- 稳定,很少出网络异常
- 不便宜,需要订阅,比 Cursor 贵,每月 50$ 起,而且是限量的(600 次消息)
目前我还在试用中,从现在的使用情况看,后面很有可能会换用 Augement Code,退订 Cursor。不过我还是有点儿犹豫,因为 Cursor 不限量啊。
第二梯队
Cline、Copilot、firebase
从第二梯队开始,我在开发上的使用频率依次递减。
Copilot
应该是也不用过多介绍了。Github ,哦不,微软家的。
最开始是大哥,现在是小老弟了。平时几乎不用,偶尔测试一下,看看效果如何,一点儿都不能打,整体跟 Cursor 那一众差远了,
firebase

也是 Google 家的,但总感觉不是给开发者用的,全 web 的形式,不是 IDE,用起来别扭,但因为模型强大,所以做个前端 demo 什么的效果还不错,真正在开发场景我是不会用的。
Cline

开源免费,插件形式提供。自己通过 API 配置模型,整体效果还可以,但维护的心智成本略高,用了几天弃了,用回了 Cursor。不是人家不好啊,是我的选择问题。用的人还是很多的,整体成本小,对于用量不大的,你随便买个 API 一接就能使了。
第三梯队
Trae、通义灵码、MarsCode、微信开发者工具
Trae
字节家的,对于它,早期乃至现在的噱头都很足,可以在国内网络环境下使用世界最先进的模型。但是,我真的不知道是什么原因,同样的模型,比如 claude-4-sonnet Cursor 整体返回的结果就是 OK 的,Trae 就是稀烂。所以我怀疑不是模型的事儿,但又不知道是哪里出的问题。经过多次的尝试效果始终赶不上 Cursor,甚至还不如 Cline,弃了,以后也不会用。
不过它有它的市场,好好做也许会越来越好吧,谁知道呢?
通义灵码、MarsCode、微信开发者工具
这些产品我都是早期的使用者,开始都很惊艳,因为早期我也是土包子没见过世面,觉得 AI 工具真的很强大。后来被其他工具征服了以后对这些就没兴趣了。嗯,这些是真正的 “牛夫人”。 如果有条件也不推荐别人用了,有更完善和强大的工具,没必要没苦硬吃。
第四梯队
DeepSeek、ChatGPT、Claude、通义千问、腾讯元宝等
理论上这些在我这里都不算 AI 编程工具,它们全部都是 文生文的产品。只不过内置了可以预览和编程的工具。但那都仅仅限于代码片段。写个玩具还行,写项目?别闹。
最近 OpenAI 贼心不死,收了 winsurf 后还要搞编程工具,出了个 codex 集成在 ChatGPT中。说实话 ,玩玩儿还行,有点儿鸡肋。

其他
v0、bolt、Lovable
如何让 AI 编程赋能给普罗大众? 以上这些产品给出了各自不同的答案 。
v0

v0 是我使用最多的产品,一般画个架构图,写个页面 Demo,直接聊天就行了,效果也是越来越好。
bolt
bolt 由 Supabase 集成支持,支持上传图片/文件作为提示生成应用原型,适合快速开发应用。支持从设计稿到应用的一键生成。(是这么宣传的,但越是复杂的项目越不可能)

Lovable
支持通过自然语言生成交互式界面代码,与 v0 类似,但更侧重于低代码与 AI 结合的开发模式,适合非技术人员快速构建应用。尤其偏重于设计师群体。

设计这个领域不止是 Lovable,国人也有产品发布,比如 YouWare。
YouWare 拥有「代码快速转化与分享」「自然语言生成网站」「一键美化作品」「创意流动与共创」「和谐社区环境」「自主控制作品曝光」和「创作激励体系」七大产品亮点。

创始人明超平曾在一加手机担任手机影像产品经理,在字节跳动负责剪映 / Capcut 手机端工具,在月之暗面做过核心产品负责人。
YouWare 这个产品就是 帮助普通用户通过 AI Coding 将创意和灵感迅速转化为作品
最后
我将用一句话总结一下 AI Coding 的未来:帮助用户(专业的和普通的)通过 AI Coding 将想法利用代码作为媒介转化成产品。
- 无论 是什么想法
- 无论 是什么产品
- 无论 是什么用户
AI Coding 未来的想象空间,理论上,是无限的。