• 请不要在回答技术问题时复制粘贴 AI 生成的内容
sentinelK
V2EX  ›  程序员

阿里百炼的自建 DeepSeek 限速是 TPM 1.2M,这限速是拍脑袋的吗?

  •  
  •   sentinelK · May 28 · 1275 views
    如题,一个 1M 上下文的模型,限速 1 分钟吞吐 1.2M token ,什么 Agent 工具能做到不限速使用?难道是 chat 场景……
    2 replies    2026-05-28 17:54:51 +08:00
    fcten
        1
    fcten  
       May 28
    因为不觉得有人会用...为什么放着 deepseek 官方的 api 不用用百炼的 api 啊?成本得高几十倍吧...
    百炼的前缀缓存做的稀烂,价格还巨贵。百万上下文的 agent 场景怕是得用破产。
    sentinelK
        2
    sentinelK  
    OP
       May 28
    @fcten 前几天 deepseek 官方 429 了一阵,于是为了应急,买了百炼的 5 折小包(30 抵 60),结果发现坑的不行。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1069 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 23:13 · PVG 07:13 · LAX 16:13 · JFK 19:13
    ♥ Do have faith in what you're doing.