coefu

V2EX member #616381, joined on 2023-02-28 17:15:35 +08:00

Today's activity rank 6905

coefu 提问技术话题好玩工作信息交易信息城市相关

Per coefu's settings, the topics list is hidden

Deals info, including closed deals, is not hidden

coefu's recent replies

13h 21m ago

Replied to a topic by followadc › Local LLM › mac 64g 能部署哪个本地大模型

即便是 ultra ，dense 模型，在 263k 的 context 下，pp 依然会降到 100 一下，比较闹心。

13h 25m ago

Replied to a topic by CatCode › Local LLM › Gemma4 12B 如何跑在 16G 显存上？

这个 12B 昨天刚出，我就测了，16G 太尴尬了，context 完全跑不起来。起码要 32G ，多出来的 20G 跑 context 。

13h 27m ago

Replied to a topic by kakalulin › Local LLM › mac mini 跑本地模型，需要什么配置？

mac mini 的内存带宽，会慢的让你怀疑人生。

2 days ago

Replied to a topic by followadc › Local LLM › mac 64g 能部署哪个本地大模型

是 max pro 还是 ultra ？不一样的。

3 days ago

Replied to a topic by qiuyuerror › 职场话题 › 云计算入行

夕阳西下的黄昏阶段，没什么搞头了。

May 28

Replied to a topic by SteveRogers › Local LLM › 本地大模型最佳 Mac 配置选择

mac studio m4 max 的内存带宽才 410GB/s ，跑 30B 左右的 dense ，虽然可以用 mtp 加速，但是依然鸡肋。

mac studio 只能买 ultra ，m3 ultra 的内存带宽 819GB/s ，nvidia tesla v100 的 hbm2 900GB/s ，可以接近，但是容量超过 128G 就是鸡肋。

mac studio 最大的优势是功耗低，最大持续功耗 480 瓦，也就 2 张 N 卡的功耗。

May 20

Replied to a topic by tootfsg › Local LLM › 关于 5070ti 模型推理的速度和本地部署思考

1 ，开源 70B 以下参数的 moe 逻辑能力比 dense 差太多了。

层宽和层深之间有个甜点位，不同参数量的甜点位又不同。总体来看，那几个大的 moe ，active 的 expert 层数应该都要搞到 40 ～ 60 ，在宽度上做取舍。

gemma4 E4B 有 42 层，比 qwen3.5 9B 的 32 层更深，按理来说，逻辑能力应该更好，但是受限于总参数量导致的宽度窄，表征能力不行，所以更容易在逻辑推理的起始位就跑偏，导致整个推理完全无法收敛。这点，通过中等数学的奥赛题可以验证。就算是 gemma4 E4B 横向增加 experts + router ，把总参数也堆起来，依然也无法解决问题。

2 ，dense 只需要在原始架构上达到了甜点位，横向+experts + router ，依然很能打。如果这种架构做层 plug-in 模式，更有搞头。总体来看，在 linear attention 这条路线上来看 qwen3.6 27B 已经是甜点位了。在纯 transformer 路线上来看 gemma4 31B 似乎也到了甜点位。如果可以搞一个 plug-in 架构，类似 TTT 模式，那真的就是开源福音。

May 18

Replied to a topic by faketemp › Local LLM › 有没有能够兼容 Win7 的离线模型工具

先在 window 7 指定的版本里搞定 docker ，然后在外面把所有依赖都封装进 docker 。

May 18

Replied to a topic by Ericcccccccc › 程序员 › 有了 agent 这种范式之后，语言大模型就不会算错基本的计算题了

以前都说 LLM 是推理下一个字符，所以有可能算错 10+11 这种最基本的计算题。

你说是就是？这个因果是你自己想当然定义的？先定义了一个错的 A ，反推出一个正确的 B 。

May 18

Replied to a topic by SilenceLL › 程序员 › 请教下，我们现在有十来年的各种文档，想要建企业知识库，该如何做

10w ,我可以弄。

» More replies by coefu