几个国产大模型，用来对接用在 cc 上编程，哪家性价比高？

libasten · 2026-05-15T03:20:22Z

codex 登录要手机号，加上之前的某境外大厂的账号莫名其妙被 ban ，想着用国产的得了，至少登录啥的省事不少。现在国内的哪家好用点？

国产

大模型

编程

42 replies • 2026-05-20 17:22:45 +08:00

1

anghunk

May 15

1

百炼吧，目前我主力是这个

2

yjz1409276

May 15

我用 gpt ，公司订了火山 pro ，只能说一言难尽

3

Chisa

May 15

最强是 GLM5.1 ，性价比的话就是 opencode go 套餐用 DeepSeekV4 pro 。官网直接充钱也行

4

zenfsharp

May 15

@Chisa 大佬你是怎么接的，为什么我用 opencode 家的 DS 接入，一思考就报错。

5

wynemo

May 15

1

@zenfsharp #4 openai 格式再用 cliproxyapi 转成 cc 格式

6

JerningChan

May 15

我怎么觉得，自己在 5090 上部署 qwen3.6 27b 用 cc 对接写代码，也很不错，可能我的项目比较简单？
最早时，接 qwen3.6-35b-a3b 也很不错

7

frantic

May 15

GLM 抢不到的话，我觉得 KIMI 199 档年费订阅最划算，其次是 deepseek 不走订阅，直接用 api, 我高强度用一天大概 20 不到

8

rb6221

May 15

性价比肯定是 DS 啊毫无疑问。。现在阶段还有别的吗

9

ptstone

May 15

我看抖音上的评测，最强编程应该时 kimi2.6

10

ptstone

May 15

@JerningChan 你使用 vllm 吗

11

hutng

May 15

@JerningChan 开不开思考模式？怎么接入的？我也是本地，webui 看速度 40t 左右，我打开思考模式，cc 和 opencode 都感觉特别慢，寸步难行，使用的是 cc-switch 接入的。不知道是哪里出了问题

12

sentinelK

May 15

@hutng 用的是什么硬件？使用 Agent 工具调用本地 LLM 的时候，首次启动的输入 token 少则 5~6K ，多则 10k 起步。prefill 速度比 decode 速度还要重要。5090 的 prefill 速度大概是 3000+t/s 。

如果设备的 prefill 速度不过千，那就相当于每次调用 LLM 都要罚站。

13

hutng

May 15

@sentinelK 2080ti ，那估计就是 prefill 的瓶颈了，算力瓶颈。

14

sentinelK

May 15

@hutng 是的，如果是 llama.cpp 可以用 llamabench 来验证下。pp 是输入速度，tg 是输出速度。

Agent 执行一次任务要无数次交互 LLM(查网址、跑终端、改代码)，每次都要罚站。和 chat 场景完全不同。

15

sharpy

May 15

性价比的话 deepseek v4 flash
pro 没有 coding plan 还是比较贵的

综合下来，opencode go ，首月 5 刀

16

yjxjn

May 15

@Chisa GLM5.1 我看有人说不行，有人说挺好的，能达到 codex5.3 的水平么？

17

hutng

May 15

@sentinelK #14 好的，感谢，显卡不行，27B 不太行，换 35B A3B 了，开启 MTP 刚测小上下文情况，预填充 1500 ，生成 100 勉强可用了。

18

cvooc

May 15

@yjxjn glm 工作使用没什么问题, 最大的问题是现在抢不到, 我同事抢了一个月了

19

mandex

May 15

订阅了 Kimi Code 199 档那个，付了年费。DeepSeek 冲了点钱，感觉也还行。

20

ooooo00000ooooo

May 15

https://www.coding-plan.xyz/
这里有几乎所有国内套餐和网友评价。

21

hiqxy

May 15

cursor 吧省事，auto 效果也比国产的好很多

22

crocoBaby

May 15

vscode 的 trae 插件，免费使用不用排队~

23

wy315700

May 15

论性价比当然是 DeepSeek

24

wsbqdyhm

May 15 via iPhone

@JerningChan #6 这个我也在用，五成 minimax ，三四成 ds4 的样子

25

chaniqure

May 15

@hiqxy auto 的额度怎么样呢？够用不？

26

yazoox

May 15

@frantic 怎么直接用 API ？如何付费/订阅？客户端用啥？ vscode 连接 deepseek api?

27

watzds

May 15

GLM5.1 还行

28

Smileh

May 15

@yjxjn #16 我觉得 5.0 最多了

29

renothing

May 15

别买 kimi code 那种废物,一个会话没结束,就触发限制了.
我现在主要是 DeepSeek pro 干活.配合 GLM 来验收

30

ntdll

May 15

便宜的话，现阶段毫无疑问是 deepseek

31

JerningChan

May 15

@wsbqdyhm 哦？其实我觉得现在用 cc 对接，只要模型不是那种什么 9b 的小模型，其实用起来，协助改改代码的都很不错啊

32

JerningChan

May 15

1

@hutng 开啊
-m /data/qwen3.6/Qwen3.6-35B-A3B-UD-IQ4_NL_XL.gguf \
--mmproj /data/qwen3.6/35b-mmproj-F16.gguf \
--ctx-size 73728 \
-ngl 99 \
--host 0.0.0.0 \
--port 8080 \
--temp 0.6 \
--top-p 0.95 \
--top-k 20 \
--min-p 0.00 \
--flash-attn on \
--cont-batching \
--cache-type-k q4_0 \
--cache-type-v q4_0 \
--threads 15 \
--parallel -1 \
-b 1024 \
-ub 1024 \
--chat-template-kwargs '{"enable_thinking": true, "preserve_thinking": true}' \
--metrics \
--jinja \
--alias Qwen3.6

33

JerningChan

May 15

@hutng 这个是 2080ti 22g 的设置，公司 5090d 就可以调大上下文到 256k ，然后换 27b 模型

34

JerningChan

May 15

@ptstone 无，我纠结了下，还是用 llama.cpp 算了

35

S0lution

May 15

现在国内就 GLM 、DeepSeek 、KIMI 、千问，性价比肯定是 DeepSeek 按量付费，质量最好的还是 GLM 。但是 GLM 是围城，买的人想退，没买的人想买，背刺老用户信誉分不佳

36

shench

May 16

deepseek v4 目前用着感觉很不错。

37

utodea

May 16

开始拿 DeepSeek 当备用了，目前感觉不错。并且写了个 DeepSeek-native CLI: https://github.com/usewhale/whale

38

xuhengjs

May 16

deepseek v4 flash 啊，一天 10 块钱用不完

39

ptstone

May 16

@JerningChan 今天 vllm 更新到 21 版本，但是 qwen3.6 支持 turboquant 还是有 bug

40

JerningChan

May 16

@ptstone 这样吗？我还在使用 llama.cpp

41

frantic

May 18

@yazoox deepseek 只提供 api 接入方式；只有按量付费，无法订阅；客户端用 claude code + cc switch; 不用 vscode

42

hiqxy

May 20

@chaniqure auto 花到了 100 多刀还能用，必须够