V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  rune15  ›  全部回复第 1 页 / 共 2 页
回复总数  33
1  2  
建议站起来蹬就行了。。。
@KaiWuBOSS 收到,我再试试
D:\AI\models>kaiwu run Qwen3-30B-A3B

██╗ ██╗ █████╗ ██╗██╗ ██╗██╗ ██╗
██║ ██╔╝██╔══██╗██║██║ ██║██║ ██║
█████╔╝ ███████║██║██║ █╗ ██║██║ ██║
██╔═██╗ ██╔══██║██║██║███╗██║██║ ██║
██║ ██╗██║ ██║██║╚███╔███╔╝╚██████╔╝
╚═╝ ╚═╝╚═╝ ╚═╝╚═╝ ╚══╝╚══╝ ╚═════╝
本地大模型部署器 vv0.1.1 · llama.cpp b8864
by llmbbs.ai · 本地 AI 技术社区

[1/6] Probing hardware...
GPU: NVIDIA GeForce RTX 4070 Ti (SM89, 12282 MB VRAM, 0 GB/s)
RAM: 31 GB DDR4
OS: windows amd64

[2/6] Selecting configuration...
Model: Qwen3-30B-A3B (moe, 30B total / 3B active)
Quant: ud-q3-k-xl (14.0 GB)
Mode: moe_offload (experts on CPU)
Accel: Flash Attention + MTP (native)

[3/6] Checking files...
Using bundled iso3 binary: llama-server-cuda.exe
Binary: llama-server-cuda.exe [cached]
Downloading model: Qwen3-30B-A3B-UD-Q3_K_XL.gguf
From: https://hf-mirror.com/unsloth/Qwen3-30B-A3B-GGUF/resolve/main/Qwen3-30B-A3B-UD-Q3_K_XL.gguf
Downloading 100% |████████████████████████████████████████████████████████████████████████████████████████████████████████████████| (14/14 GB, 25 MB/s) [9m10s:0s]
Model: Qwen3-30B-A3B-UD-Q3_K_XL.gguf [cached]

[4/6] Preflight check...
✓ VRAM sufficient

[5/6] Warmup benchmark...
Probe 1: ctx=128K ... OOM
Probe 2: ctx=64K ... OOM
Probe 3: ctx=32K ... OOM
Probe 4: ctx=16K ... OOM
Probe 5: ctx=8K ... OOM
⚠️ Warmup failed: all ctx probes failed (tried down to 4K)
Using default parameters

[6/6] Starting server...
llama-server 不支持 iso3 ,回退到 q8_0/q4_0
Waiting for llama-server to be ready (port 11434)...
⚠️ 显存不足,降低上下文至 4K 重试...
Waiting for llama-server to be ready (port 11434)...
Error: failed to start llama-server: 连续 2 次启动失败,即使最小上下文(4K)也无法运行
建议:选择更小的量化或使用 MoE offload 模型
Usage:
kaiwu run <model> [flags]

Flags:
--bench Run benchmark after starting
--ctx-size int 手动指定上下文大小( 0=自动)
--fast Skip warmup, use cached profile
-h, --help help for run
--reset 清除缓存,重新 warmup 探测最优参数

我的 4070-Ti 也同样加载不了
供应商
3 月 24 日
回复了 gitsuck 创建的主题 电动汽车 极氪 7X / Model Y / MG4 怎么选?
@b1iy 我是 7x 车主,感觉售后并不差。
2 月 24 日
回复了 6581 创建的主题 生活 2026 年,大伙有啥年度计划呢
换个轻松点的工作
2 月 24 日
回复了 jonty 创建的主题 职场话题 开工第一天提了离职
别犹豫,开弓没有回头箭
2 月 23 日
回复了 resten 创建的主题 VPS 请教一下稳定的 VPS 推荐。
我在用 upcloud 这家的 vps ,体验下来还算稳定吧
1 月 25 日
回复了 EmbraceQWQ 创建的主题 电动汽车 决赛圈-理想 i6 和 极氪 7x(南方)
7x 车主路过,提车半年多,目前开了 8 千多公里,感觉还行吧。
公司顺的普通戴尔键盘
准备看看《犯罪现场调查》
站起来蹬 多爱自己
折腾了半天,最后换 IP+浏览器开隐私模式注册成功了,感谢楼主的热心分享!
2025 年 11 月 13 日
回复了 Akay47 创建的主题 汽车 中大型 suv 推荐
极氪 7x
2025 年 10 月 30 日
回复了 AMZsowhat 创建的主题 美酒与美食 有什么好喝的饮料值得推荐?(轻负担最好)
白开水。不觉得喝饮料就是生活,喝水就是生存。
2025 年 10 月 22 日
回复了 vhellov 创建的主题 生活 感觉被骗婚了,怎么办
及时止损
2025 年 9 月 15 日
回复了 dierzhuang 创建的主题 生活 相亲后的结局
建议止损
2025 年 8 月 22 日
回复了 tousol 创建的主题 Solana 每天坚持签到铜币自由
千万富翁,求打赏~
2025 年 8 月 15 日
回复了 IZILE 创建的主题 Solana 随机抽 50 位老哥空投 1k$mb
9raUVuzeWUk53co63M4WXLWPWE4Xc6Lpn7RS9dnkpump
谢谢大佬
2025 年 6 月 4 日
回复了 jokerguo 创建的主题 情感问题 聊彩礼方面,已经聊崩了好几次。能给点介意吗
这婚也不是非结不可
1  2  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1124 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 49ms · UTC 18:09 · PVG 02:09 · LAX 11:09 · JFK 14:09
♥ Do have faith in what you're doing.