sjmcefc2
V2EX  ›  Local LLM

买 macbook pro 笔记本,跑本地模型,怎么配置性价比比较高?

  •  
  •   sjmcefc2 · 16h 23m ago · 1412 views

    macbook pro 跑本地模型,64g 内存够用吗? 64g 可以跑哪些模型呢? 等 9 月新品还是现在呢? 不懂 mac 的商品啊

    24 replies    2026-06-13 09:50:04 +08:00
    NASK
        1
    NASK  
       16h 17m ago
    macbook Pro 跑本地模型没有意义,如果真想本地跑的话,可以用 mac mini 来跑.
    ssack9
        2
    ssack9  
       16h 12m ago
    MacMini 需要什么样的配置来跑本地模型
    wuxilaoshiren
        3
    wuxilaoshiren  
       16h 12m ago
    伪需求
    et5494
        4
    et5494  
       16h 9m ago
    25 年购入了一台 MAC MINI M4 PRO 64G 版
    实际测试下来,跑模型的 token/S 很慢,GPU 全程 102°,完全等不及的那种(我忘记上的多大模型了,反正 64 是低不成高不就)
    这钱直接花在订阅上,这不香吗?
    sjmcefc2
        5
    sjmcefc2  
    OP
       15h 55m ago
    @et5494 多大的配置才能比较顺利的跑呢?
    mbooyn
        6
    mbooyn  
       14h 55m ago
    一般推荐显存几百 G 的才跑本地模型,否则一律走云端 api
    YanSeven
        7
    YanSeven  
       14h 52m ago via Android
    就算能顺利跑了,堆到顶级了。那个智力可能都不如现在有些厂商发善心给你免费用的 API ,都不必花钱。
    sjmcefc2
        8
    sjmcefc2  
    OP
       14h 36m ago
    @YanSeven 那就剩下一个苹果开发了。对吧。只是想着顺带跑跑本地模型,有个高中生水平就可以简单执行任务了。
    ntedshen
        9
    ntedshen  
       14h 34m ago
    9 月不涨价就不错了。。。618 的货还是年初的价
    ysn2233
        10
    ysn2233  
       14h 8m ago
    伪需求,不跑最好
    foxio2
        11
    foxio2  
       14h 7m ago via Android
    这个好办。选内存带宽超过 800G/s 的。
    foxio2
        12
    foxio2  
       14h 6m ago via Android
    4 万以下根本不用看。4 万以上的那种。本地跑的,主要是是为了保护宝贵的私有数据。所以。这点钱也值得。
    409164
        13
    409164  
       13h 53m ago
    你能跑的都是弱智模型
    Mandelo
        14
    Mandelo  
       13h 33m ago
    本地模型要好用,卖 token plan 的早倒闭了
    onetown
        15
    onetown  
       13h 27m ago
    我现在很多代码是用 m5 max + 128g 内存跑的 qwen3.6 35b 的模型跑的。65k 上下文, 模型本身支持 128k , 但是我为了可以并发, 限制到 65k 。
    sjmcefc2
        16
    sjmcefc2  
    OP
       9h 33m ago
    @foxio2 能列一下配置吗
    sjmcefc2
        17
    sjmcefc2  
    OP
       9h 28m ago
    @onetown 也就是 128g 就可以跑目前的新模型了?
    coefu
        18
    coefu  
       9h 27m ago
    mac 系列只有 ultra 能用,别的都不用试了。
    sjmcefc2
        19
    sjmcefc2  
    OP
       9h 26m ago
    @coefu 能具体说说吗?
    coefu
        20
    coefu  
       9h 19m ago   ❤️ 1
    @sjmcefc2

    推理第一要素,gmem/umem 的带宽,越大越好。
    第二要素才是算力本身,prefill 阶段,context 太长,Nvidia 的 cuda 擅长的地方。

    mac 系列只有 ultra 的带宽>= 800GB/s ,这是第一个要素。 至于 apple metal gpu 的 core 数量,讲真,再多一倍也无济于事。算力对于 mac 系列来说,聊胜于无。
    felixcode
        21
    felixcode  
    PRO
       7h 27m ago
    建议拔网线,关网卡,再也不联网,然后再跑本地模型。
    这样就能发挥本地模型保护隐私数据的优势了。
    wsbqdyhm
        22
    wsbqdyhm  
       1h 59m ago via iPhone
    目前 m1max64g ,能跑 qwen3.6-27b ,10 多 token/s 吧,仅供参考。架构 omlx 。没有什么实际意义。
    CakeJu
        23
    CakeJu  
       51 mins ago
    有什么本地模型的需求吗,不如把买笔记本的钱拿来订阅
    decemberpei
        24
    decemberpei  
       19 mins ago
    投入大几万,跑个垃圾模型,在 token 比自来水还便宜的时代,意义在哪里?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3044 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 88ms · UTC 02:09 · PVG 10:09 · LAX 19:09 · JFK 22:09
    ♥ Do have faith in what you're doing.