關於GB10跟N1X

terry

1，主机配置没什么问题，不需要升级，RTX Pro6000用来生图做视频都无敌。单张就足够豪华了，再买也是空置。小主机就更不用买了，就用好这一张卡，就是最好的方案。
2，如果没有什么特别机密的，比如反攻大陆的档案，可以使用DeepSeek V4 Flash驱动Hermes，费用很小，体验会好很多。使用电报沟通也很流畅，比GPT更快。它的智能水平我也测试过很多次。Qwen3.5 122B知识面不错，但是它跑Hermes的话很蠢，完全不如3.6 27b。
3，你可以买一个Mac mini或者如果有退役的笔记本，16G内存以上的，专门用来跑Hermes效果会更好。我的M1 16G跑起来的体验不错，32G内存+11800H处理器的笔记本，Ubuntu24.04系统，可以同时跑好几个Hermes，体验流畅，也相当稳定。
4，可以补充一些真实图片，增加吸引力，不然你帖子太长了，一般人看不下去，我看的头疼。

怪物

@williamlouis 因為122b的模型在使用上，只要操作電腦的時候遇到幾個比較複雜的問題，常常會突然罷工，就是跟我說：我接下來要如何如何，但過了幾小時依然沒反應，我也不確定是不是模型的問題，只是想說能升級就升級看看，謝謝

怪物

@terry 好的，謝謝您的建議，那我就不急著買了，等新的硬體出來再評估看看，122b的模型在hermes上面就是常常罷工，所以我才想升級，我的雲端版的hermes用的是kimi2.6，不過平常不太使用雲端版，改天再來試試您說的D...F，謝謝

怪物

@CHIA-AN-YANG 您好，我覺得多一張96G顯卡，應該是目前環境下最順的，可是192G顯存跑不了375b的模型，我也不知道375b有沒有真的比較好，謝謝

566656661

N1X基本上就是DGX Spark拔掉ConnectX-7網卡, 而ConnectX-7也是被很多人詬病說發熱嚴重 (畢竟就是伺服器裏拔出來的)

DGX Spark本身就只是個實驗品, 給大學實驗室或者小團隊決定是否要用DGX H100伺服器, 然而Spark的強悍之處也就是用這個網卡聯接多部DGX Spark做成一個Cluster, 用Token速度換取大統一內存容量

如果質疑自己是否需要DGX Spark的話, 那百份之九十以上是不需要

更大參數的模型基本知識量會更多, 不過現在很多大參數的模型都在用MoE了, Deepseek自己也是Activation 49B

kop wang

通读了全文，很尴尬的一点是，从模型能力的角度考虑，目前并没有150~190GB能够吊打qwen3.6-27B的开源模型。

目前而言，老的大体量模型体现的也只有知识容量的优势。Agent能力、注意力分配以及ToolCall能力在开源领域要么就是新的超大模型，要么就是qwen3.6-27B这类新的小模型。
因为中等体量模型很长时间都没有更新过了。他们的后训练和能力对齐普遍跟不上时代需要。

目前的中体量模型很像一个老教授。有知识，有认知，但是不会用手机，不会打字。

所以如果是我，我就不会推荐楼主去购入新设备。边际收益递减的太过明显。无论是GB10 x2，还是RTX PRO 6000 x2，都没有明显超越PRO 6000 x1的场景出现。

terry

@怪物 395b对于你跑Agent也不会更好，本地模型不会比在线的更好，无论你部署多大的。长期用建议你切换到DeepSeek，你说的这些模型我都用过。你要明白Agent需要的能力是大模型的一个很小的训练区域，但是很重要，在这个领域27b稠密模型有天然的推理效率优势，它只是很耗资源而已。如果你一定要全部本地，那么再买一个Pro6000确实很好，因为它确实很牛逼。

怪物

@566656661 感謝您的分析，我想用更大的模型也不是為了多少能力，只是希望在hermes底下運作時不要常罷工，謝謝

怪物

@kop-wang 感謝您的分析，我沒用過qwen27b的模型，但是我裝過qeen3.5:35b fp16的無審查模型，在hermes底下，分析限制級圖片的結果比122b模型還簡陋很多，也更容易罷工，我是以為35b的應該會比27b的強（是嗎？），但是很多人都推薦千問27b的模型，晚上我再來下載看看，請問您知道27b稠密無審查模型的完整名稱嗎？謝謝

怪物

@terry 好的，謝謝您的建議，我再來試試很多人推薦的27b模型，只是我不懂：稠密模型，是有特別的含義嗎？請問您知道有千問27b稠密無審查的模型嗎？有的話請問他的完整檔名是？我再用AI搜尋下載試試，謝謝

kop wang

@怪物楼主的错误可以理解，很多人人为模型的“体量”=“能力”。但实际上并不是如此。

体量只决定静态知识储备和统计学趋势（类似于一个人没手机，无工具情况下，自己的脑子里的知识总量和思维判断）。

能力就更为复杂一些。举个简单粗暴的例子，一个小学生+google，知识体量也一定赢过大学生自身脑容量，但是实际场景的问题解决，则不见得谁更强。

所以认知模型能力更相对客观的是看benchmark，也就是跑分。
我比较常用参考的跑分网站：https://benchlm.ai/llm-agent-benchmarks

我最推荐的Qwen3.6-27B非拒绝模型是https://huggingface.co/HauhauCS/Qwen3.6-27B-Uncensored-HauhauCS-Aggressive

仅供参考。

566656661

@怪物说:

在hermes底下運作時不要常罷工，謝謝

我因為還沒有在Hermes上面遇到過罷工或者卡住的情況所以沒辦法給太多意見

OpenCode偶爾會卡住, 需要我踢一踢它

@怪物说:

27b稠密無審查模型的完整名稱

我自己是在vLLM上用Huihui-Qwen3.6-27B-abliterated-NVFP4-MTP, llama.cpp找一找帶有abliterated或者heretic字眼的模型就可以, 估計也有很多 (當然Uncensored也可以)

kop wang

@怪物稠密模型是相较于MoE模型来讲的。MoE是一个新技术，大知识总量，但是每次运行的时候只调用一部分参数，从而加快推理速度。

比如楼主说的Qwen3.6-35B-A3B，就是他的模型总知识量是35B参数，但每次运行，只会针对性使用3B参数来参与。

但是对于个人部署来讲，限制瓶颈普遍不在推理性能，而在内存总量，所以巨大的MoE模型对于个人部署价值非常有限。而小MoE模型，因为执行时参与运算的参数又过少，难免影响其注意力和推理能力。

怪物

terry 好的，謝謝

terry

@怪物如果要分析图片，还是大点的模型，122b这样的会更好，越大越好，理论上覆盖面更广，122b足够了。

CHIA AN YANG

@怪物如果兩張pro6000可以跑deepseek v4 flash 體驗應該是很不錯的,另外你把模型改用 qwen3.6 27b看看你會開心很多,我目前7900xtx 24g,單卡就玩的飛起了,讓cc or codex幫你把hermes你平常的工作流跑通寫成skill給hermes會好用很多的!!供你參考

抡锤者

關於GB10跟N1X