刚刚看到 Kimi 发布了 K2.7 Code 。
官方给的数据:
- Kimi Code Bench v2 +21.8%
- Program Bench +11.0%
- MLS Bench Lite +31.5%
- 推理 Token 消耗降低 30%
有没有已经体验过的大佬说说感受?
刚刚看到 Kimi 发布了 K2.7 Code 。
官方给的数据:
有没有已经体验过的大佬说说感受?
1
cuebyte 10h 28m ago
Kimi 的思考一直是一个痛点,会在同一个地方反复思考多次,浪费 tokens ,降低输出质量。
不知道这一版有多大进步。 |
3
feelapi 10h 20m ago
贵
|
7
aohan0905 OP @qian33 至少体感是的, 我没准确看时间, 写了个计划, 开了 goal, 然后看下面 hud active 7m 的时候, 消耗了 20% 左右
|
8
herozzm 10h 3m ago
不要相信国产,试都不用试,这点时间可以干点别的
|
9
aohan0905 OP @qian33 我重新确定了下, 看控制台是这样, 然后 5h 额度花了接近 25%?
``` ● ✓ Goal complete. Worked 1 turn over 11m00s, using 4.4M tokens. ``` |
10
Alwaysonline 9h 56m ago
Kimi 有买 199 元的套餐,唯一的好处就是用来写前端页面,比 Codex 要漂亮些。
|
11
python35 9h 51m ago
我曾经试过写一个在家里 openwrt 上的 captive portal 系统做黑白名单、基于页面的授权码、对接 radius 系统、防火墙放行等功能, 基于 cc 的 glm5.1 和 deepseek v4 pro 都没写成功,最后是 codex 写成功了,可以正常使用, 至此投入 o 家的怀抱,开了 5x pro, 国产的确实还有差距; 如果你们有 openwrt 也可以试试写写看
|
13
ebushicao 9h 2m ago
我打开 kimi 官网,还没看到 kimi-k2.7 ,倒是弹出一个 kimi 信用卡... 就不能先把模型能力搞上去吗...
|
14
JasonYip 8h 47m ago via Android
@python35 国模需要有一个详细的 spec 能够执行的比较好,如果想省钱可以 chatbox 和 gpt 聊清楚然后生成详细的 spec ,让国模去做,其实效果还可以
|
15
Ericcccccccc 8h 28m ago gpt 5.5 的好用我只能说是有目共睹,这种不是跑分啥的可以植入的印象
|
16
wengjin456123 2h 18m ago via iPhone 我感觉挺好用的,199 套餐也够用,比我的 codex plus 量大的多,2.7 code 明显好用一些,工具调用 skill 调用也很积极,思考也没 2.6 那样很久很久
|
17
ilikexff 1h 59m ago
虽然相信国产,但是实力真的是硬伤,每一个过程模型出来的时候,口号都喊的牛逼哄哄的,不是碾压这个就是吊打那个,各种所谓的专业测评成绩粉漂亮,但是当你真实的使用的时候发现,还是依托💩
|
18
billzhuang 1h 58m ago @ilikexff 你这叫啥相信
|
19
Absofknglutely 1h 49m ago
你这叫啥相信
|
21
maolon 1h 29m ago
我更好奇是 composer 2.5 强还是 2.7 code 强,
要是 2.7 code 还比不过 composer 2.5 这个 k2.5 的继续训练版本就搞笑了 |
22
iorilu 1h 20m ago
跑分是跑分, 实际干活另一回事
|
23
XProxyAi 1h 13m ago
除了 SOTA 别的不建议用,浪费钱的同时 还在浪费生命
|