关于INTEL 的B70 PRO。
-
只是认识而已,每个技术公司的产品出来都会找一堆我们这种有些关系的公司去测试去调整。和机会啥的没关系。别想多了,很纯洁的合作关系!哇哈哈哈哈。
从大概5.1 拿到之后,comfyui 崩了不下20回了。我都快没信心去玩了。认真的头疼....
-
@terry 因为驱动程序/comfyui版本等问题,所以只能用docker来驱动comfyui。这就有挺恶心的问题:
- 不能升级comfyui版本--除非手动打补丁,而且还不一定可以搞定。
- 更新costum node 各种卡死。这个和我的系统关系比较大。
- 更新系统配套的环境,pip 起来也特别麻烦。
- 因为cuda的原因,所以好多的有cuda的流只可以转到xpa或者CPU上。这就有了更多其它的问题。
现在官方优先适配 wan/ltx 这些在comfyui 官方版本里的官方的流,但那些流都是’基础流‘没有优化的。 我试了锤哥推荐的刘悦的流、B站黑鹤的流、程序员萝卜、流光、原上咩等大佬比较新的流,基本上都没办法完善的运行。所以需要调节的还是很多的,甚至不如锤哥说的AMD的环境,这挺让人费劲。
但vllm 这个可能比较简单。我还在搞N卡的comfyui环境。搞好第一时间来发帖。
-
https://github.com/intel/llm-scaler/tree/main
这是INTEL 官方公开的支持 B50/60/70 系列显卡的 comfyui 的docker 地址。他们还是做了不少适配的。下边有表:
https://github.com/intel/llm-scaler/tree/main#supported-models
Model Name FP16 Dynamic Online FP8 Dynamic Online Int4 MXFP4 Notes
openai/gpt-oss-20b
openai/gpt-oss-120b
deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
deepseek-ai/DeepSeek-R1-Distill-Llama-8B
deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
deepseek-ai/DeepSeek-R1-Distill-Llama-70B
deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
deepseek-ai/DeepSeek-V2-Lite
export VLLM_MLA_DISABLE=1
deepseek-ai/deepseek-coder-33b-instruct
Qwen/Qwen3-8B
Qwen/Qwen3-14B
Qwen/Qwen3-32B
Qwen/Qwen3-30B-A3B
Qwen/Qwen3-235B-A22B
Qwen/Qwen3-Coder-30B-A3B-Instruct
Qwen/Qwen3-Coder-Next
Qwen/Qwen3.5-27B
Qwen/Qwen3.5-35B-A3B
Qwen/Qwen3.5-122B-A10B
Qwen/QwQ-32B
mistralai/Ministral-8B-Instruct-2410
mistralai/Mixtral-8x7B-Instruct-v0.1
meta-llama/Llama-3.1-8B
meta-llama/Llama-3.1-70B
baichuan-inc/Baichuan2-7B-Chat
with chat_template
baichuan-inc/Baichuan2-13B-Chat
with chat_template
THUDM/CodeGeex4-All-9B
with chat_template
zai-org/GLM-4-9B-0414
use bfloat16
zai-org/GLM-4-32B-0414
use bfloat16
zai-org/GLM-4.5-Air
zai-org/GLM-4.7-Flash
ByteDance-Seed/Seed-OSS-36B-Instruct
miromind-ai/MiroThinker-v1.5-30B
tencent/Hunyuan-0.5B-Instruct
follow the guide in here
tencent/Hunyuan-7B-Instruct
follow the guide in here
Qwen/Qwen2-VL-7B-Instruct
Qwen/Qwen2.5-VL-7B-Instruct
Qwen/Qwen2.5-VL-32B-Instruct
Qwen/Qwen2.5-VL-72B-Instruct
Qwen/Qwen3-VL-4B-Instruct
Qwen/Qwen3-VL-8B-Instruct
Qwen/Qwen3-VL-30B-A3B-Instruct
openbmb/MiniCPM-V-2_6
openbmb/MiniCPM-V-4
openbmb/MiniCPM-V-4_5
OpenGVLab/InternVL2-8B
OpenGVLab/InternVL3-8B
OpenGVLab/InternVL3_5-8B
OpenGVLab/InternVL3_5-30B-A3B
rednote-hilab/dots.ocr
ByteDance-Seed/UI-TARS-7B-DPO
google/gemma-3-12b-it
use bfloat16
google/gemma-3-27b-it
use bfloat16
THUDM/GLM-4v-9B
with --hf-overrides and chat_template
zai-org/GLM-4.1V-9B-Base
zai-org/GLM-4.1V-9B-Thinking
zai-org/Glyph
opendatalab/MinerU2.5-2509-1.2B
baidu/ERNIE-4.5-VL-28B-A3B-Thinking
zai-org/GLM-4.6V-Flash
pip install transformers==5.0.0rc0 first
PaddlePaddle/PaddleOCR-VL
follow the guide in here
deepseek-ai/DeepSeek-OCR
deepseek-ai/DeepSeek-OCR-2
There may be accuracy issues when using --quantization fp8
moonshotai/Kimi-VL-A3B-Thinking-2506
Qwen/Qwen2.5-Omni-7B
Qwen/Qwen3-Omni-30B-A3B-Instruct
openai/whisper-medium
openai/whisper-large-v3
Qwen/Qwen3-Embedding-8B
Qwen3-VL-Embedding-2B/8B
follow the guide in here
BAAI/bge-m3
BAAI/bge-large-en-v1.5
Qwen/Qwen3-Reranker-8B
Qwen3-VL-Reranker-2B/8B
follow the guide in here
BAAI/bge-reranker-large
BAAI/bge-reranker-v2-m3

-
https://github.com/intel/llm-scaler/tree/main
这是INTEL 官方公开的支持 B50/60/70 系列显卡的 comfyui 的docker 地址。他们还是做了不少适配的。下边有表:
https://github.com/intel/llm-scaler/tree/main#supported-models
Model Name FP16 Dynamic Online FP8 Dynamic Online Int4 MXFP4 Notes
openai/gpt-oss-20b
openai/gpt-oss-120b
deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
deepseek-ai/DeepSeek-R1-Distill-Llama-8B
deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
deepseek-ai/DeepSeek-R1-Distill-Llama-70B
deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
deepseek-ai/DeepSeek-V2-Lite
export VLLM_MLA_DISABLE=1
deepseek-ai/deepseek-coder-33b-instruct
Qwen/Qwen3-8B
Qwen/Qwen3-14B
Qwen/Qwen3-32B
Qwen/Qwen3-30B-A3B
Qwen/Qwen3-235B-A22B
Qwen/Qwen3-Coder-30B-A3B-Instruct
Qwen/Qwen3-Coder-Next
Qwen/Qwen3.5-27B
Qwen/Qwen3.5-35B-A3B
Qwen/Qwen3.5-122B-A10B
Qwen/QwQ-32B
mistralai/Ministral-8B-Instruct-2410
mistralai/Mixtral-8x7B-Instruct-v0.1
meta-llama/Llama-3.1-8B
meta-llama/Llama-3.1-70B
baichuan-inc/Baichuan2-7B-Chat
with chat_template
baichuan-inc/Baichuan2-13B-Chat
with chat_template
THUDM/CodeGeex4-All-9B
with chat_template
zai-org/GLM-4-9B-0414
use bfloat16
zai-org/GLM-4-32B-0414
use bfloat16
zai-org/GLM-4.5-Air
zai-org/GLM-4.7-Flash
ByteDance-Seed/Seed-OSS-36B-Instruct
miromind-ai/MiroThinker-v1.5-30B
tencent/Hunyuan-0.5B-Instruct
follow the guide in here
tencent/Hunyuan-7B-Instruct
follow the guide in here
Qwen/Qwen2-VL-7B-Instruct
Qwen/Qwen2.5-VL-7B-Instruct
Qwen/Qwen2.5-VL-32B-Instruct
Qwen/Qwen2.5-VL-72B-Instruct
Qwen/Qwen3-VL-4B-Instruct
Qwen/Qwen3-VL-8B-Instruct
Qwen/Qwen3-VL-30B-A3B-Instruct
openbmb/MiniCPM-V-2_6
openbmb/MiniCPM-V-4
openbmb/MiniCPM-V-4_5
OpenGVLab/InternVL2-8B
OpenGVLab/InternVL3-8B
OpenGVLab/InternVL3_5-8B
OpenGVLab/InternVL3_5-30B-A3B
rednote-hilab/dots.ocr
ByteDance-Seed/UI-TARS-7B-DPO
google/gemma-3-12b-it
use bfloat16
google/gemma-3-27b-it
use bfloat16
THUDM/GLM-4v-9B
with --hf-overrides and chat_template
zai-org/GLM-4.1V-9B-Base
zai-org/GLM-4.1V-9B-Thinking
zai-org/Glyph
opendatalab/MinerU2.5-2509-1.2B
baidu/ERNIE-4.5-VL-28B-A3B-Thinking
zai-org/GLM-4.6V-Flash
pip install transformers==5.0.0rc0 first
PaddlePaddle/PaddleOCR-VL
follow the guide in here
deepseek-ai/DeepSeek-OCR
deepseek-ai/DeepSeek-OCR-2
There may be accuracy issues when using --quantization fp8
moonshotai/Kimi-VL-A3B-Thinking-2506
Qwen/Qwen2.5-Omni-7B
Qwen/Qwen3-Omni-30B-A3B-Instruct
openai/whisper-medium
openai/whisper-large-v3
Qwen/Qwen3-Embedding-8B
Qwen3-VL-Embedding-2B/8B
follow the guide in here
BAAI/bge-m3
BAAI/bge-large-en-v1.5
Qwen/Qwen3-Reranker-8B
Qwen3-VL-Reranker-2B/8B
follow the guide in here
BAAI/bge-reranker-large
BAAI/bge-reranker-v2-m3

@sirwang 等你测试反馈
-
@terry 看怎么看了吧。 如果 文生图、文生视频、图生视频、 文生语音、图片反推、视频反推这几个都有相对较好的解决方案。INTEL的卡内存大,省电,最重要的还便宜的话。老大你是否觉得有够买欲望? 比如说32G的这个内存在1W块左右。
O。这个单张卡最高290瓦的电。
-
@sirwang 我1万块为什么不买AI Pro R9700,我不需要研究任何东西,直接弄回来就能跑,说实话,我宁可多花点钱上4080S 32G,其实我也折腾xtx,纯粹是因为想弄点素材,但是没想到这卡是真好用。
-
系统 取消固定了该主题