重度使用了一个星期的 kimi 2.5 ,写代码太傻了,做 plan 也太傻了。我有一个简单的需求,搞了一个下午还没有搞定。
受不子之后,刚又去搞了一个反重力的账号,不到半个小时,工作效果大约满意。
难道是我没有用错,提示词是完全一样的
1
qW7bo2FbzbC0 1 天前
反重力权益的 g3-flash 反代到 openclaw 里面总是一会儿就被限流了,也配了免费的 nvidia kimi2.5 ,真的差距好大
|
2
iorilu 1 天前
本来就不行阿
难道有人认为这个能和 Gemini 模型比了 |
3
UserTRI 1 天前
我在思考你这个受不子是什么场景下打错字的。
|
4
xiaowoli 1 天前 据我使用的观察,目前国内最强的模型是 qwen3 ,和 gemini3 差距大概在半年左右的水平,其他国内模型,呵呵
|
5
msn1983aa 1 天前
@qW7bo2FbzbC0 #1 #1 英伟达的 kimi2.5 限流不?
|
7
midsolo 1 天前
|
8
qiuxuqin 1 天前
我也用了一星期的 kimi2.5 了,我也觉得不行,比不过 Gemini 。但是 Gemini 经常限流,重新访问失败,所以我是结合着用。
|
9
yjhatfdu2 1 天前
我都用的 opencode 连接官方的收费 API ,试下来 K2.5 是不如 M2.1 的。K2.5 慢、轴、蠢,反复错误修复不正确,而且关于任务的理解就很不到位。M2.1 虽然也不算出色(和 GPT5.2 、opus 比),但是快、基本可以正确
|
10
doctorzry 1 天前 via Android
牛不牛不知道,牌头是很大。Kimi 2.5 是我见过的国产模型里面,少数的你在官网 web 端去手动对话调用,都能给你降级模型,让你充钱才能用它的 thinking 模型的
|
11
yeziahehe 1 天前
反重力账号是搭车的吗?
|
12
cnhongwei 1 天前
@UserTRI #3 应是使用五笔输入法,一卡就错了。 了是 b ,子是 bb 。
这两天使用 codex ,感觉比 antigravity 更爽,输入要求,再 commit 点一下就行了。 |
13
cnhongwei 1 天前
codex 现在是免费账号也可以使用,感觉给的用量还比较大。
|
14
nkcfc 1 天前
意料之中,我也试过了,感觉 kimi 还需要进步,还到不了第一梯队。
|
15
badreamm 1 天前
用 codex 吧
|
16
xiaowoli 16 小时 31 分钟前 @Rorysky
chat-GPT ,gemini ,claude 独一当,相当于元婴水平 qwen3----- 差不多结丹后期 deepseek----- 结丹中期 Kimi2.5 ,豆包----- 结丹中期都够不到 |
17
laved 16 小时 20 分钟前
|
18
zhi8023nan 16 小时 0 分钟前
@xiaowoli MiniMax2.1 可以吗?好多人说这个还行,GLM4.7 评价也不好
|
19
zhi8023nan 15 小时 58 分钟前
@laved 确实没有 MiniMax2.1 的,不清楚到底好不好
|
20
xiaowoli 14 小时 22 分钟前
@zhi8023nan #18 没用过,但是说好用的大概率是广
|
21
zeroDev 13 小时 37 分钟前 via iPhone
k2.5 国产调用 playwright 处理网页是最快速不拖拉的
|
22
jasonjie2015 12 小时 31 分钟前
国产的大模型推广费可能都不低,每次新版本出来,全网都是夸,都是超越 Claude 主流版本,然后一试用,比 Gemini 差的都远。国产的能用在开发上的我觉得只有 qwen coder 还能用。
|
23
cellsyx 6 小时 47 分钟前
国产大模型的推广力度都快赶上手机圈数码宝贝了. 如果说手机这种产品在现阶段还能凑合用, 辅助编程的模型真是差一点都有明显感知. 因为模型输出质量会直接影响工作效率, 低质量输出造成的额外无意义 debug 环节会造成工时成倍的浪费. 因此用惯好的模型是不可能将就的. 目前门槛也就是 Gemini 3 pro/flash, 要是一个功能实现之后有错误, 让他连续两次 debug 都不过就直接回退换 claude opus 4.5. 除非是做大模型评测, 不然没必要给自己找不自在.
当然国产模型也有优点, 比如那些开源的模型用在一些本地执行的轻量级任务就很不错, 国产模型对于中文的识别也会好一点. |