V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
inyfee
V2EX  ›  程序员

从之前的反重力账号不能用了之后,我试用了一个星期的 kimi k2.5,评价是不好用

  •  
  •   inyfee · 1 天前 · 1667 次点击

    重度使用了一个星期的 kimi 2.5 ,写代码太傻了,做 plan 也太傻了。我有一个简单的需求,搞了一个下午还没有搞定。

    受不子之后,刚又去搞了一个反重力的账号,不到半个小时,工作效果大约满意。

    难道是我没有用错,提示词是完全一样的

    23 条回复    2026-02-06 19:21:54 +08:00
    qW7bo2FbzbC0
        1
    qW7bo2FbzbC0  
       1 天前
    反重力权益的 g3-flash 反代到 openclaw 里面总是一会儿就被限流了,也配了免费的 nvidia kimi2.5 ,真的差距好大
    iorilu
        2
    iorilu  
       1 天前
    本来就不行阿

    难道有人认为这个能和 Gemini 模型比了
    UserTRI
        3
    UserTRI  
       1 天前
    我在思考你这个受不子是什么场景下打错字的。
    xiaowoli
        4
    xiaowoli  
       1 天前   ❤️ 1
    据我使用的观察,目前国内最强的模型是 qwen3 ,和 gemini3 差距大概在半年左右的水平,其他国内模型,呵呵
    msn1983aa
        5
    msn1983aa  
       1 天前
    @qW7bo2FbzbC0 #1 #1 英伟达的 kimi2.5 限流不?
    Rorysky
        6
    Rorysky  
       1 天前
    @xiaowoli 好多吹 kimi 2.5 还有 GLM 的,甚至还有吹豆包的。真的假的
    midsolo
        7
    midsolo  
       1 天前
    挂我是吧,下班别走
    qiuxuqin
        8
    qiuxuqin  
       1 天前
    我也用了一星期的 kimi2.5 了,我也觉得不行,比不过 Gemini 。但是 Gemini 经常限流,重新访问失败,所以我是结合着用。
    yjhatfdu2
        9
    yjhatfdu2  
       1 天前
    我都用的 opencode 连接官方的收费 API ,试下来 K2.5 是不如 M2.1 的。K2.5 慢、轴、蠢,反复错误修复不正确,而且关于任务的理解就很不到位。M2.1 虽然也不算出色(和 GPT5.2 、opus 比),但是快、基本可以正确
    doctorzry
        10
    doctorzry  
       1 天前 via Android
    牛不牛不知道,牌头是很大。Kimi 2.5 是我见过的国产模型里面,少数的你在官网 web 端去手动对话调用,都能给你降级模型,让你充钱才能用它的 thinking 模型的
    yeziahehe
        11
    yeziahehe  
       1 天前
    反重力账号是搭车的吗?
    cnhongwei
        12
    cnhongwei  
       1 天前
    @UserTRI #3 应是使用五笔输入法,一卡就错了。 了是 b ,子是 bb 。
    这两天使用 codex ,感觉比 antigravity 更爽,输入要求,再 commit 点一下就行了。
    cnhongwei
        13
    cnhongwei  
       1 天前
    codex 现在是免费账号也可以使用,感觉给的用量还比较大。
    nkcfc
        14
    nkcfc  
       1 天前
    意料之中,我也试过了,感觉 kimi 还需要进步,还到不了第一梯队。
    badreamm
        15
    badreamm  
       1 天前
    用 codex 吧
    xiaowoli
        16
    xiaowoli  
       16 小时 31 分钟前   ❤️ 1
    @Rorysky
    chat-GPT ,gemini ,claude 独一当,相当于元婴水平
    qwen3----- 差不多结丹后期
    deepseek----- 结丹中期
    Kimi2.5 ,豆包----- 结丹中期都够不到
    laved
        17
    laved  
       16 小时 20 分钟前
    歪个楼,看了这么多帖子,我用了一下 opencode 提供的免费模型有一个 minimax 2.1 的模型,怎么站内没有讨论一下 minimax 这家的模型
    zhi8023nan
        18
    zhi8023nan  
       16 小时 0 分钟前
    @xiaowoli MiniMax2.1 可以吗?好多人说这个还行,GLM4.7 评价也不好
    zhi8023nan
        19
    zhi8023nan  
       15 小时 58 分钟前
    @laved 确实没有 MiniMax2.1 的,不清楚到底好不好
    xiaowoli
        20
    xiaowoli  
       14 小时 22 分钟前
    @zhi8023nan #18 没用过,但是说好用的大概率是广
    zeroDev
        21
    zeroDev  
       13 小时 37 分钟前 via iPhone
    k2.5 国产调用 playwright 处理网页是最快速不拖拉的
    jasonjie2015
        22
    jasonjie2015  
       12 小时 31 分钟前
    国产的大模型推广费可能都不低,每次新版本出来,全网都是夸,都是超越 Claude 主流版本,然后一试用,比 Gemini 差的都远。国产的能用在开发上的我觉得只有 qwen coder 还能用。
    cellsyx
        23
    cellsyx  
       6 小时 47 分钟前
    国产大模型的推广力度都快赶上手机圈数码宝贝了. 如果说手机这种产品在现阶段还能凑合用, 辅助编程的模型真是差一点都有明显感知. 因为模型输出质量会直接影响工作效率, 低质量输出造成的额外无意义 debug 环节会造成工时成倍的浪费. 因此用惯好的模型是不可能将就的. 目前门槛也就是 Gemini 3 pro/flash, 要是一个功能实现之后有错误, 让他连续两次 debug 都不过就直接回退换 claude opus 4.5. 除非是做大模型评测, 不然没必要给自己找不自在.
    当然国产模型也有优点, 比如那些开源的模型用在一些本地执行的轻量级任务就很不错, 国产模型对于中文的识别也会好一点.
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1129 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 18:09 · PVG 02:09 · LAX 10:09 · JFK 13:09
    ♥ Do have faith in what you're doing.