选项A:1张RTX 5090或者选项B:2张AI PRO R9700?
-
RTX 5090 选这个。适配各种折腾。生态稳定。Windows 都能耍的很开心。
-
@iamvirus 谢谢您的解答!
-
@Tony-Wang 嗯,是这样的,所以我前面前置了一个条件,是“我所在的国家和区域”是这个情况。
-
@Tony-Wang 嗯,是5090,没有额外的后缀,不是阉割版的。
-
RTX 5090 选这个。适配各种折腾。生态稳定。Windows 都能耍的很开心。
@williamlouis 感谢您的解答,说得都是关键的点,主要是容易折腾,而且Windows比较友好。
-
一张5090运行qwen3.6-27B的性能decode大概是R9700的2.5倍,prefill大概是3倍。
两张R9700的性能是大概1.4~1.7倍的R9700。
然后再结合多出来的显存,以及没有CUDA的生图、生视频损失,自己演算下性价比。
@王一民 感谢您的回复。数据不会骗人,并且非常直观!我想我看到了大家的回复,我就清楚应该如何选了!
-
我所在的国家和区域,以上这两个选项的价格是差不多的,所以我想问问大家,应该如何选择?
@Liang-Wang 5090的性能情况供参考
Windows 11 Pro (Build 26200)
├── Ryzen 9 9950X3D · 64GB RAM · RTX 5090 32GB
└── WSL2 (Ubuntu 24.04) — vmmemWSL 30.3GB
├── llama.cpp v9294 (CUDA 后端)
│ ├── Qwen3.6-27B-Q5_K_M → :8080 (主模型)
│ └── MiniCPM-V 2.6-Q3 → :8081 (视觉)
├── Hermes Agent v0.14.0 (Python 3.11.15)~/llama.cpp/build/bin/llama-bench
--model ~/models/Qwen3-27B/Qwen3.6-27B-Q5_K_M.gguf
--n-gpu-layers 999
--flash-attn 1
-p 512,4096,32768
-n 128
ggml_cuda_init: found 1 CUDA devices (Total VRAM: 32606 MiB):
Device 0: NVIDIA GeForce RTX 5090, compute capability 12.0, VMM: yes, VRAM: 32606 MiBmodel size params backend ngl fa test t/s qwen35 27B Q5_K - Medium 18.46 GiB 27.32 B CUDA 999 1 pp512 3563.38 ± 231.17 qwen35 27B Q5_K - Medium 18.46 GiB 27.32 B CUDA 999 1 pp4096 3498.68 ± 9.65 qwen35 27B Q5_K - Medium 18.46 GiB 27.32 B CUDA 999 1 pp32768 3340.48 ± 350.69 qwen35 27B Q5_K - Medium 18.46 GiB 27.32 B CUDA 999 1 tg128 62.49 ± 0.99 build: d14ce3dab (9235)
-
@Liang-Wang 5090的性能情况供参考
Windows 11 Pro (Build 26200)
├── Ryzen 9 9950X3D · 64GB RAM · RTX 5090 32GB
└── WSL2 (Ubuntu 24.04) — vmmemWSL 30.3GB
├── llama.cpp v9294 (CUDA 后端)
│ ├── Qwen3.6-27B-Q5_K_M → :8080 (主模型)
│ └── MiniCPM-V 2.6-Q3 → :8081 (视觉)
├── Hermes Agent v0.14.0 (Python 3.11.15)~/llama.cpp/build/bin/llama-bench
--model ~/models/Qwen3-27B/Qwen3.6-27B-Q5_K_M.gguf
--n-gpu-layers 999
--flash-attn 1
-p 512,4096,32768
-n 128
ggml_cuda_init: found 1 CUDA devices (Total VRAM: 32606 MiB):
Device 0: NVIDIA GeForce RTX 5090, compute capability 12.0, VMM: yes, VRAM: 32606 MiBmodel size params backend ngl fa test t/s qwen35 27B Q5_K - Medium 18.46 GiB 27.32 B CUDA 999 1 pp512 3563.38 ± 231.17 qwen35 27B Q5_K - Medium 18.46 GiB 27.32 B CUDA 999 1 pp4096 3498.68 ± 9.65 qwen35 27B Q5_K - Medium 18.46 GiB 27.32 B CUDA 999 1 pp32768 3340.48 ± 350.69 qwen35 27B Q5_K - Medium 18.46 GiB 27.32 B CUDA 999 1 tg128 62.49 ± 0.99 build: d14ce3dab (9235)
@airbrush 感谢您的帮助!