从之前的反重力账号不能用了之后，我试用了一个星期的 kimi k2.5，评价是不好用

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 120 days ago, the information mentioned may be changed or developed.

重度使用了一个星期的 kimi 2.5 ，写代码太傻了，做 plan 也太傻了。我有一个简单的需求，搞了一个下午还没有搞定。

受不子之后，刚又去搞了一个反重力的账号，不到半个小时，工作效果大约满意。

难道是我没有用错，提示词是完全一样的

反重力

kimi

24 replies • 2026-02-19 10:45:02 +08:00

qW7bo2FbzbC0

Feb 5

反重力权益的 g3-flash 反代到 openclaw 里面总是一会儿就被限流了，也配了免费的 nvidia kimi2.5 ，真的差距好大

iorilu

Feb 5

本来就不行阿

难道有人认为这个能和 Gemini 模型比了

UserTRI

Feb 5

我在思考你这个受不子是什么场景下打错字的。

xiaowoli

Feb 5

据我使用的观察，目前国内最强的模型是 qwen3 ，和 gemini3 差距大概在半年左右的水平，其他国内模型，呵呵

msn1983aa

Feb 5

@qW7bo2FbzbC0 #1 #1 英伟达的 kimi2.5 限流不？

Rorysky

Feb 5

@xiaowoli 好多吹 kimi 2.5 还有 GLM 的，甚至还有吹豆包的。真的假的

midsolo

Feb 5

挂我是吧，下班别走

qiuxuqin

Feb 5

我也用了一星期的 kimi2.5 了，我也觉得不行，比不过 Gemini 。但是 Gemini 经常限流，重新访问失败，所以我是结合着用。

yjhatfdu2

Feb 5

我都用的 opencode 连接官方的收费 API ，试下来 K2.5 是不如 M2.1 的。K2.5 慢、轴、蠢，反复错误修复不正确，而且关于任务的理解就很不到位。M2.1 虽然也不算出色（和 GPT5.2 、opus 比），但是快、基本可以正确

doctorzry

Feb 5 via Android

牛不牛不知道，牌头是很大。Kimi 2.5 是我见过的国产模型里面，少数的你在官网 web 端去手动对话调用，都能给你降级模型，让你充钱才能用它的 thinking 模型的

yeziahehe

Feb 5

反重力账号是搭车的吗？

cnhongwei

Feb 5

@UserTRI #3 应是使用五笔输入法，一卡就错了。了是 b ，子是 bb 。
这两天使用 codex ，感觉比 antigravity 更爽，输入要求，再 commit 点一下就行了。

cnhongwei

Feb 5

codex 现在是免费账号也可以使用，感觉给的用量还比较大。

nkcfc

Feb 5

意料之中，我也试过了，感觉 kimi 还需要进步，还到不了第一梯队。

badreamm

Feb 5

用 codex 吧

xiaowoli

Feb 6

@Rorysky
chat-GPT ，gemini ，claude 独一当，相当于元婴水平
qwen3----- 差不多结丹后期
deepseek----- 结丹中期
Kimi2.5 ，豆包----- 结丹中期都够不到

laved

Feb 6

歪个楼，看了这么多帖子，我用了一下 opencode 提供的免费模型有一个 minimax 2.1 的模型，怎么站内没有讨论一下 minimax 这家的模型

zhi8023nan

Feb 6

@xiaowoli MiniMax2.1 可以吗？好多人说这个还行,GLM4.7 评价也不好

zhi8023nan

Feb 6

@laved 确实没有 MiniMax2.1 的，不清楚到底好不好

xiaowoli

Feb 6

@zhi8023nan #18 没用过，但是说好用的大概率是广

zeroDev

Feb 6 via iPhone

k2.5 国产调用 playwright 处理网页是最快速不拖拉的

jasonjie2015

Feb 6

国产的大模型推广费可能都不低，每次新版本出来，全网都是夸，都是超越 Claude 主流版本，然后一试用，比 Gemini 差的都远。国产的能用在开发上的我觉得只有 qwen coder 还能用。

cellsyx

Feb 6

国产大模型的推广力度都快赶上手机圈数码宝贝了. 如果说手机这种产品在现阶段还能凑合用, 辅助编程的模型真是差一点都有明显感知. 因为模型输出质量会直接影响工作效率, 低质量输出造成的额外无意义 debug 环节会造成工时成倍的浪费. 因此用惯好的模型是不可能将就的. 目前门槛也就是 Gemini 3 pro/flash, 要是一个功能实现之后有错误, 让他连续两次 debug 都不过就直接回退换 claude opus 4.5. 除非是做大模型评测, 不然没必要给自己找不自在.
当然国产模型也有优点, 比如那些开源的模型用在一些本地执行的轻量级任务就很不错, 国产模型对于中文的识别也会好一点.

yjiefl

Feb 19

国产的差距都很大，qwen 我没试过，其他确实都不行，经常弄错。