wwhc's recent timeline updates
wwhc
ONLINE

wwhc

V2EX member #145809, joined on 2015-11-05 06:54:06 +08:00
Today's activity rank 3795
wwhc's recent replies
4 days ago
Replied to a topic by SilenceLL 硬件 站里没人看老黄的新电脑吗
如果不提供对 Linux 的良好支持 这个体系在 AI 领域并不具备竞争性
RX9070 对标 Nvidia Titan V 的 AI 推理性能
llama.cpp 的优化参数也很多,绝对性能目前可能仍不及 vllm 强,但可用性、易用性、可调性及部署能力都远强于 vllm
7900xtx 在 llama.cpp 下支持良好,推理时的预填充速度可能只比 4060ti 稍强,但 token 生成速度与 3090ti 相差不大
除非你是在为大公司或企业开发 AI 推理系统,建议使用 llama.cpp ,这是目前最好的 AI 推理框架
重度运行本地大模型的 Mac 要选用 M? Ultra ,即使是 M1 Ultra ,也强于任何世代的 Max 型号
@Jiajin
@junwind
不依赖别的工具,本地部署的 Qwen3.6 27B/35B 也能达到 GLM 的水准当使用“帮我生成一个天气查询 H5 应用”这个提示词
楼主的测试有偏差,本地部署的 Qwen3.6 27B/35B 使用楼主的提示词都能生成达到楼主图中 GLM 的水准的代码渲染,本地部署的 gpt-oss 120B 倒真是惨不忍睹,生成的的代码渲染出的页面没法看
差一点就能赶上 Qwen3.5 了
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3153 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 03:34 · PVG 11:34 · LAX 20:34 · JFK 23:34
♥ Do have faith in what you're doing.