需要购买国产显卡本地部署大模型，哪家的比较好

显卡

大模型

部署

115 replies • 2026-06-09 20:36:09 +08:00

1 2

❮

❯

101

viweei

4 days ago

@coolair 我也搞过，当时找运营商借的机器，送来的时候里面用 k3s 部署了个 deepseek 14b ，后面想换个模型怎么都部署不了，完全就是浪费生命。

102

xiaomushen

4 days ago

@coolair 谁会自己找不痛快用 HW 计算卡呢？还不是为了吃饭，甲方信创涉密机房，买了 HW 卡，丙方外协牛马捏着鼻子骂骂咧咧捣鼓

103

Jiajin

4 days ago

@Flagship9945 vllm-ascend+MindIE ，基本上主流开源大模型都覆盖全，都适配了。

104

zzutmebwd

4 days ago

事实上除了 nvidia ，其他生态都是一坨，不是国产的锅，amd 也不行啊。

105

xiaxichen

4 days ago

@zzutmebwd 现在只求这些国产厂商开开窍类 cuda 挺好的别脑子抽了搞 NPU

106

yh7gdiaYW

4 days ago

@cpper 过度延伸了，你如果看过企业版的协议就知道，面向 C 端的 API 都在偷偷炼你的数据，企业版在此之上多一层法律保障但对涉密信息仍不保险。私有部署绝对是有必要的，最多争论下老黄的卡到底能不能买

107

Meteora626

4 days ago

只部署大模型，华为的卡直接用他们提供的镜像就行了，为啥评论区部署 qwen 啥的都能出 bug ，华为微调不行，部署主流大模型是 OK 的。

108

Flagship9945

OP

4 days ago

@Meteora626 #107 请问是类似这种的镜像吗？ https://ai.atomgit.com/SGLangAscend/Qwen3.5-122B-A10B

109

xiaomushen

4 days ago

@xiaxichen NPU 是旧时代的延续，那时候寒武纪大火，静态图的 Tensorflow ，yolo 之类，在 NPU 上跑得很好。大家都觉得 GPGPU 落伍了，纷纷发展 NPU

谁知道之后动态图大行其道，尤其是 LLM ，NPU 架构自然就落伍了呗。

110

LaureatePoet

4 days ago via iPhone

可以用 “沐曦”，不止大模型部署甚至跑实验，微调几乎都没问题。楼上说的也对除了昇腾都是支持 cuda 的只不过不同厂商适配的速度不同体验不同。国内著名的 GPU 就那几家上市的

111

LaureatePoet

4 days ago

关于 Atlas 300I Duo 系列的卡，我当年也测试过，持保留意见。个人建议如果非要采购国产 GPU ，建议选择类 CUDA 路线的，国内目前上市的 GPU 公司都可在考虑范围内。

112

photolife

4 days ago

你来操作吗？？国企？？
能躲最好躲，除非你在利益层，拿大回扣然后给领导上供
出了问题你担责，很麻烦

113

snoopygao

4 days ago

垃圾 atlas ，浪费我 2 个月时间部署 qwen

114

Meteora626

4 days ago

@Flagship9945 对，华为对主流大模型支持很快，但是冷门和微调困难

115

zomco

3 days ago

我是 atlas 的受害者

1 2

❮

❯