Nvidia DGX spark一些心得
-
@Tony-Wang
ltx2.3大概是這樣:
(DGX Spark, 1280×720)steps seconds frames 冷啟動耗時 12 4 97 ~290 秒 24 4 97 ~480 秒 使用這些模型:
models/checkpoints/ltx-2.3-22b-distilled-1.1.safetensorsmodels/text_encoders/gemma_3_12B_it_fp4_mixed.safetensorsmodels/latent_upscale_models/ltx-2.3-spatial-upscaler-x2-1.1.safetensors
Flux.2
1280x720、20 steps:- bf16 20 steps 約 530 秒,fp8mixed 20 steps 約 155 秒。
- fp8mixed 4 steps smoke test 約 1 分鐘內完成;20 steps 約 2 到 3 分鐘級別
-
@kop-wang
connectX-7 頻寬是200Gb/s , 不過我測起來只有100 Gb/s, 不知道是不是它有兩個connectX-7 port, 但是我只插了一個. 不過看起來100 Gb/s + RDMA, vllm的張量運算也跑的還可以. -
@Tony-Wang
ltx2.3大概是這樣:
(DGX Spark, 1280×720)steps seconds frames 冷啟動耗時 12 4 97 ~290 秒 24 4 97 ~480 秒 使用這些模型:
models/checkpoints/ltx-2.3-22b-distilled-1.1.safetensorsmodels/text_encoders/gemma_3_12B_it_fp4_mixed.safetensorsmodels/latent_upscale_models/ltx-2.3-spatial-upscaler-x2-1.1.safetensors
Flux.2
1280x720、20 steps:- bf16 20 steps 約 530 秒,fp8mixed 20 steps 約 155 秒。
- fp8mixed 4 steps smoke test 約 1 分鐘內完成;20 steps 約 2 到 3 分鐘級別
-
这个LTX 2.3 的蒸馏模型这么快吗? 有点儿不可思议.
-
系统 取消固定了该主题
