抡锤者

怪

各位前輩大家好，
我是台灣一個55歲的電腦小白，
雖然接觸電腦快40年了，
但因為我完全看不懂英文，
對硬體還有一點初步了解，軟體就完全不行，
大概兩個月前，我新組了一台電腦，
CPU是Intel285K，192G的記憶體，
麗台RTX PRO 6000 96G顯卡，
目前用hermes本地版跑qwen3.5:122B
無審查的模型，跟用ComfyUI來繪圖，
使用起來的感覺很不錯，
一般的文生圖工作流，第一張圖約15-20秒
第2張圖以後都大概7秒一張，
122b的本地模型使用起來跟ChatGPT的
感覺也差不多，用桌面版的hermes反應有時候還比ChatGPT快一點，用telegram介面的話，就會比較慢，
這兩天我本來打算再買一張RTX PRO 6000 顯卡，用192G的顯存跑235B的模型，
但那張顯卡漲了10幾萬台幣，現在要10幾萬人民幣才買的到，我問AI有什麼替代方案，
他給我介紹了GB10的小主機，用兩台串聯，
可以跑405B的模型，再通過網路跟軟體連接，讓我用windows電腦操作
安裝在GB10的hermes，跑375B的模型，
然後讓hermes運作windows電腦上的ComfyUI來生成圖片或視訊，
雖然我現在用hermes操作ComfyUI的成品，都比手動操作ComfyUI還差一點，但我覺得那可能是我還不太會下指令，以後應該會改善，但是現在台灣的GB 10主機，一台也漲到了5萬多人民幣，所以我還在猶豫，
結果前天看到了6/1的YouTube，輝達説新出了一個N1X晶片，基本上是GB10晶片的改良版，完全支援windows系統，細節我也不是很清楚，只是聽說N1X系列的產品，大概今年秋季會推出，我的hermes告訴我，雖然N1X應該不能兩台串聯，但是到時候GB10的機台應該會降價...
所以我現在不知道應該再買一塊RTX PRO 6000，還是同樣的錢買兩台GB10，或者是聽AI的，等N1X的產品出來再比較看看，但是不知道會不會越等越貴...
我跟版主或各位前輩不一樣，我只是一個外行玩家，平均一天用電腦大概1小時，也就是有空時上C站成人版，找一些模型跟工作流，
然後等可以本地生成時，再用翻譯軟體亂改提示詞，然後叫AI幫我寫Python程式，
讓我上班時用telegram告訴hermes自動生成100-1000張圖片，然後再叫hermes把成品中相似度75-80%的圖片刪掉，剩下的自己下班慢慢看，至於視訊，我還不知道要到哪裡找模型跟工作流...

不太會發文，囉嗦半天，請見諒，
謝謝

怪

@terry
好的，我來試試，謝謝

怪

@terry
好的，是找QWEN3.6:35B-FP8
或是QWEN3.6:70B-FP8的模型嗎?
謝謝

怪

@terry
好的，不好意思，我再研究看看，謝謝

怪

@老茶
我買的時候不知道它的差異，這個max-Q的便宜1萬塊，我就買了
實際使用上感覺很不錯，70~122B的模型都能順跑，ComfyUI生成一張普通圖片只要6~10秒，
而且高效運轉時約75~85度C，電腦後方它的渦輪風扇排出的熱氣比機殼本身14CM的風扇還強，
我就在想，如果是一般版的600W，一定會熱爆。

怪

@terry
我的122B是千問3.5的，它只可以讀文檔跟圖片，
至於千問3.6，這是昨天我按照ChatGPT的只是安裝後他給的答案:

這次錯誤已經很明確：
failed to initialize model: qwen3next:
layer 40 missing attn_qkv/attn_gate projections
結論：你的 Q6、Q8 檔案不是壞掉；是目前 Ollama 無法正確載入這種 Qwen3.6 / Qwen3Next 架構。
你已經用「HF 直接 pull」和「本機 GGUF + Modelfile」兩種方式都測過，Q6、Q8 都同樣失敗，所以不是下載問題。
這個錯誤和 Ollama 對 Qwen3-Next / Qwen3.5 類 MoE / hybrid 架構支援不完整有關。GitHub 上也有人回報同類錯誤，例如 qwen3next: layer 0 missing attn_qkv/attn_gate projections，在不同 Ollama 版本都出現過。
現在該怎麼做
你如果堅持「不用 llama.cpp、只用 Ollama 給 Hermes」，目前這個 Qwen3.6-35B-A3B 暫時不能用。不是你的操作錯，而是 Ollama 後端不支援或有 bug。
先把不能跑的 Q6 / Q8 從 Ollama 清單移除，保留實體 GGUF 檔案在 C 碟：

不過我今天問了hermes，他自己主動幫我下在新的千問3.6模型，並且已經可以使用了，
而且可以自動利用我電腦裡的ComfyUI幫我生成圖片，現在正在測試生成視頻
謝謝

怪

各位前輩大家好:
我是一個看不懂英文的電腦外行人，
看了版主的視頻後，剛從openclaw龍蝦改換到HERMES，
我的電腦是U9 285K CPU，192G DDR5記憶體，
NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition 96G顯示卡
現在安裝了本地版的hermes，用了qwen3-vl:32B跟qwen3.5:122B的模型
但是122B的模型無法讀取視訊，32B的模型雖然能讀取視訊，但回應都很簡略(有點笨)，
我查了ChatGPT等AI然後下載了幾個qwen3.6的模型，但是hermes都不能正常使用，
想請問各位前輩，可以推薦幾個能讀取圖片跟視訊，而且能讓hernes使用的多模態模型，
有70B以上的，體積在80G以內的更好，
謝謝大家

抡锤者

怪物

帖子