跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

怪物怪

怪物

@怪物
取消关注 关注
关于
帖子
9
主题
2
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 關於GB10跟N1X
    怪物怪 怪物

    各位前輩大家好,
    我是台灣一個55歲的電腦小白,
    雖然接觸電腦快40年了,
    但因為我完全看不懂英文,
    對硬體還有一點初步了解,軟體就完全不行,
    大概兩個月前,我新組了一台電腦,
    CPU是Intel285K,192G的記憶體,
    麗台RTX PRO 6000 96G顯卡,
    目前用hermes本地版跑qwen3.5:122B
    無審查的模型,跟用ComfyUI來繪圖,
    使用起來的感覺很不錯,
    一般的文生圖工作流,第一張圖約15-20秒
    第2張圖以後都大概7秒一張,
    122b的本地模型使用起來跟ChatGPT的
    感覺也差不多,用桌面版的hermes反應有時候還比ChatGPT快一點,用telegram介面的話,就會比較慢,
    這兩天我本來打算再買一張RTX PRO 6000 顯卡,用192G的顯存跑235B的模型,
    但那張顯卡漲了10幾萬台幣,現在要10幾萬人民幣才買的到,我問AI有什麼替代方案,
    他給我介紹了GB10的小主機,用兩台串聯,
    可以跑405B的模型,再通過網路跟軟體連接,讓我用windows電腦操作
    安裝在GB10的hermes,跑375B的模型,
    然後讓hermes運作windows電腦上的ComfyUI來生成圖片或視訊,
    雖然我現在用hermes操作ComfyUI的成品,都比手動操作ComfyUI還差一點,但我覺得那可能是我還不太會下指令,以後應該會改善,但是現在台灣的GB 10主機,一台也漲到了5萬多人民幣,所以我還在猶豫,
    結果前天看到了6/1的YouTube,輝達説新出了一個N1X晶片,基本上是GB10晶片的改良版,完全支援windows系統,細節我也不是很清楚,只是聽說N1X系列的產品,大概今年秋季會推出,我的hermes告訴我,雖然N1X應該不能兩台串聯,但是到時候GB10的機台應該會降價...
    所以我現在不知道應該再買一塊RTX PRO 6000,還是同樣的錢買兩台GB10,或者是聽AI的,等N1X的產品出來再比較看看,但是不知道會不會越等越貴...
    我跟版主或各位前輩不一樣,我只是一個外行玩家,平均一天用電腦大概1小時,也就是有空時上C站成人版,找一些模型跟工作流,
    然後等可以本地生成時,再用翻譯軟體亂改提示詞,然後叫AI幫我寫Python程式,
    讓我上班時用telegram告訴hermes自動生成100-1000張圖片,然後再叫hermes把成品中相似度75-80%的圖片刪掉,剩下的自己下班慢慢看,至於視訊,我還不知道要到哪裡找模型跟工作流...

    不太會發文,囉嗦半天,請見諒,
    謝謝

    随便聊聊

  • 關於本地版的模型
    怪物怪 怪物

    @terry
    好的,我來試試,謝謝

    LLM讨论区

  • 關於本地版的模型
    怪物怪 怪物

    @terry
    好的,是找QWEN3.6:35B-FP8
    或是QWEN3.6:70B-FP8的模型嗎?
    謝謝

    LLM讨论区

  • 關於本地版的模型
    怪物怪 怪物

    @terry
    好的,不好意思,我再研究看看,謝謝

    LLM讨论区

  • 關於本地版的模型
    怪物怪 怪物

    @老茶
    我買的時候不知道它的差異,這個max-Q的便宜1萬塊,我就買了
    實際使用上感覺很不錯,70~122B的模型都能順跑,ComfyUI生成一張普通圖片只要6~10秒,
    而且高效運轉時約75~85度C,電腦後方它的渦輪風扇排出的熱氣比機殼本身14CM的風扇還強,
    我就在想,如果是一般版的600W,一定會熱爆。

    LLM讨论区

  • 關於本地版的模型
    怪物怪 怪物

    @terry
    我的122B是千問3.5的,它只可以讀文檔跟圖片,
    至於千問3.6,這是昨天我按照ChatGPT的只是安裝後他給的答案:

    這次錯誤已經很明確:
    failed to initialize model: qwen3next:
    layer 40 missing attn_qkv/attn_gate projections
    結論:你的 Q6、Q8 檔案不是壞掉;是目前 Ollama 無法正確載入這種 Qwen3.6 / Qwen3Next 架構。
    你已經用「HF 直接 pull」和「本機 GGUF + Modelfile」兩種方式都測過,Q6、Q8 都同樣失敗,所以不是下載問題。
    這個錯誤和 Ollama 對 Qwen3-Next / Qwen3.5 類 MoE / hybrid 架構支援不完整有關。GitHub 上也有人回報同類錯誤,例如 qwen3next: layer 0 missing attn_qkv/attn_gate projections,在不同 Ollama 版本都出現過。
    現在該怎麼做
    你如果堅持「不用 llama.cpp、只用 Ollama 給 Hermes」,目前這個 Qwen3.6-35B-A3B 暫時不能用。不是你的操作錯,而是 Ollama 後端不支援或有 bug。
    先把不能跑的 Q6 / Q8 從 Ollama 清單移除,保留實體 GGUF 檔案在 C 碟:

    不過我今天問了hermes,他自己主動幫我下在新的千問3.6模型,並且已經可以使用了,
    而且可以自動利用我電腦裡的ComfyUI幫我生成圖片,現在正在測試生成視頻
    謝謝

    LLM讨论区

  • 關於本地版的模型
    怪物怪 怪物

    各位前輩大家好:
    我是一個看不懂英文的電腦外行人,
    看了版主的視頻後,剛從openclaw龍蝦改換到HERMES,
    我的電腦是U9 285K CPU,192G DDR5記憶體,
    NVIDIA RTX PRO™ 6000 Blackwell Max-Q Workstation Edition 96G顯示卡
    現在安裝了本地版的hermes,用了qwen3-vl:32B跟qwen3.5:122B的模型
    但是122B的模型無法讀取視訊,32B的模型雖然能讀取視訊,但回應都很簡略(有點笨),
    我查了ChatGPT等AI然後下載了幾個qwen3.6的模型,但是hermes都不能正常使用,
    想請問各位前輩,可以推薦幾個能讀取圖片跟視訊,而且能讓hernes使用的多模態模型,
    有70B以上的,體積在80G以內的更好,
    謝謝大家

    LLM讨论区
  • 登录

  • 没有帐号? 注册

  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组