好吧,出来吹吹。286 8MHz 640k要多加384K的記憶體,還要一颗一颗自己插到主機板上。DOS + UNIX + FreeBSD。IBM加速显卡价钱可以买到一台新车。TSENG Diamond SpeedStar 出来大家惊为天人。Riva128 后来才出生。
说实在品牌不要看得太重,同一个品牌也有好有坏。个人适合就行了。
AresROC
@AresROC
-
说一下我自己的20年硬件攒机的经验. -
买了2张5060Ti,谁能跑最便宜的Qwen 27B?@terry 好的,我做了RTX 5070 Ti加上RTX 5060 Ti 16GB. PCIe 3.0x4 Bus. Qwen3.6-27b 速度还可以Q4有26.7 Token/s。LmStudio会把大部分记忆体放在5070 T I上。
單卡3090 Q4得到35 Token/s. Power limit 80%让记忆体温度低一点先 不然会升到105度C
我也是50+看到你今天的视频有提到

目前只是搞windows加上LMStudio。日后改进Linux加上vLLM或别的。还会搞ComfyUi。
我找到一个电脑可以塞這两个3090。我會想辦法先測試一下再等NvL ink到货。
-
买了2张5060Ti,谁能跑最便宜的Qwen 27B? -
买了2张5060Ti,谁能跑最便宜的Qwen 27B?RTX3090 更新记忆前后的散热。温度一定要看着点。


-
跟huananzi下单了 3090x2 + nvlink

-
SGLang - 是時候玩TP了嗎? Qwen / RTX3090今天花了一整天時間在 Ubuntu 上安裝 SGLang

目前在 Qwen 9B 上可以正常運作:
python -m sglang.launch_server --model-path ~/AiModel/Qwen3.5-9B --host 0.0.0.0 --port 8000 --mem-fraction-static 0.8 --context-length 16384 --reasoning-parser qwen3 --kv-cache-dtype auto目前大概能达到 40 个Token/s

還需在 Qwen 27B AWQ 進行一些設定。
vllm安装更容易 ~
各位大神有什么秘诀吗?请赐教!