wwhc

V2EX member #145809, joined on 2015-11-05 06:54:06 +08:00

Today's activity rank 3795

分享发现 • wwhc • Feb 23 • Lastly replied by 7gugu

音乐 • wwhc • Dec 12, 2019 • Lastly replied by KentY

外包 • wwhc • May 1, 2018 • Lastly replied by bingod

wwhc's recent replies

4 days ago

如果不提供对 Linux 的良好支持这个体系在 AI 领域并不具备竞争性

5 days ago

RX9070 对标 Nvidia Titan V 的 AI 推理性能

May 31

llama.cpp 的优化参数也很多，绝对性能目前可能仍不及 vllm 强，但可用性、易用性、可调性及部署能力都远强于 vllm

May 31

7900xtx 在 llama.cpp 下支持良好，推理时的预填充速度可能只比 4060ti 稍强，但 token 生成速度与 3090ti 相差不大

May 31

除非你是在为大公司或企业开发 AI 推理系统，建议使用 llama.cpp ，这是目前最好的 AI 推理框架

May 20

重度运行本地大模型的 Mac 要选用 M? Ultra ，即使是 M1 Ultra ，也强于任何世代的 Max 型号

Apr 27

@Jiajin
@junwind
不依赖别的工具，本地部署的 Qwen3.6 27B/35B 也能达到 GLM 的水准当使用“帮我生成一个天气查询 H5 应用”这个提示词

Apr 27

楼主的测试有偏差，本地部署的 Qwen3.6 27B/35B 使用楼主的提示词都能生成达到楼主图中 GLM 的水准的代码渲染，本地部署的 gpt-oss 120B 倒真是惨不忍睹，生成的的代码渲染出的页面没法看

Apr 4

差一点就能赶上 Qwen3.5 了