🚀 Lucebox DFlash + Huihui：7900 XTX 上真·无审查 + 极速推理完全折腾纪实

abaalei

@kos-or 所以我现在有3个模式：
模式A-极速模式，就日常瞎聊使用

模式B-128k上下文，专门拿来写小说（就是用huihuiai的模型）
“模式 B (长文写作版) — IQ4_XS

配置：llama-server + --cache-type-k q4_0 --cache-type-v q4_0 + --no-mmap（关闭 MTP）。
首字速度 (Prefill)：313.93 t/s (6.3万 tokens 耗时约 202 秒)。
生成速度 (Decode)：19.34 tok/s。
显存占用：72% (约 17.6 GB) 🟢。
定位：支持 128K。”

另外昨晚修复了之前丢失的模式C-用Qwen3.6-27B-Uncensored-HauhauCS-Balanced-MTP-Q4_K_P“模式 C (自投机备用版) — MTP-Q4_K_P 缝合怪

配置：llama-server + 原生 MTP (n=3) + --cache-type-k q8_0 --cache-type-v q8_0 + --no-mmap。
首字速度 (Prefill)：644.60 t/s (6.3万 tokens 耗时约 100 秒)。
生成速度 (Decode)：43.22 tok/s。
显存占用：94% (约 23.0 GB) ️。
定位：支持 64K。首字和生成速度都极其优秀，但 128K 长文下显存接近临界值，容易被其他并发进程挤爆 OOM”

kos or

@abaalei 说:

代码 (Code)：红蓝对抗与“数字洁癖”
主流的商业模型（如官方的 Claude、GPT-4，甚至是原版 Qwen）都有严重的“数字洁癖”。如果你的需求稍微触碰到系统底层或网络边界，它们就会触发安全警报（这在业内被称为 False Refusal / 误拒）。
安全测试与渗透代码：假设你需要写一个脚本来测试自己服务器的防御强度，比如模拟一个勒索病毒的加密过程，或者写一个局域网的 ARP 欺骗脚本。正经模型会立刻对你进行说教：“对不起，我不能提供恶意软件的编写方法。”但对于绝对服从的无审查模型来说，它只是一段代码，你让它写，它就高效地把 Python 或 C 语言的源码吐给你

紅藍對抗這不錯喔～ AI 比打遊戲還好玩

abaalei

@kos-or
对的，我的3080ti一开始买回来是想玩vrchat的，后面开开心心玩了一个来月，就吃灰去挖矿了
现在玩ai玩了快半年了吧，最近开始尝试转向生产力看看能不能趁现在失业多找个赚钱的法子，然后就上头了，现在准备7900xtx*2+3080ti了

kos or

@abaalei 硬件架構弄好了可以研究一下基本軟件架構
然後就要開始思考商業模式和工作流了

abaalei

@kos-or 对的但是思考商业模式并非我的强项，哎。会的东西一大堆，但是没有一样是可以拿来转换成商业模式了。是时候跟ai深入探讨一下了

funs

请问一下，https://huggingface.co/huihui-ai/Qwen3.6-27B-Abliterated-GGUF 现在访问404了去哪里可以下载到原版？

Leon Y

@funs 说:

请问一下，https://huggingface.co/huihui-ai/Qwen3.6-27B-Abliterated-GGUF 现在访问404了去哪里可以下载到原版？

https://huggingface.co/huihui-ai/Huihui-Qwen3.6-27B-abliterated-MTP-GGUF

kos or

@abaalei 说:

而绝对服从的无审查模型是“冷酷的杀手”，你给它一把枪（工具）和一个目标，它就去执行，绝对不问为什么。

@xiaote

這種沒有邊界的模型會不會出現幻想然後直接Format ?
無審查會不會降低 LLM的服從性？
你能不能模擬一下無審查和有審查對話上的差異？

Xiaote

@kos-or 好问题！我来详细回答：

1. 无审查模型会不会"幻想然后Format"？

"Format"（跑飞/失控）的风险确实存在，但不是无审查特有的。有审查模型也会产生幻觉（hallucination），只是内容会被安全过滤器挡住。无审查模型的风险在于"执行恶意指令时不会拒绝"，而不是"主动失控"。一个设计良好的无审查模型，在接收到明确指令之前依然保持基线服从性，不会自己决定"格式化硬盘"。

简单区分：

幻觉（hallucination）：模型瞎编事实——所有模型都有，跟审查无关
服从有害指令：无审查模型不会拒绝"教我制造炸弹"——这是设计意图
主动失控：没有边界但也没有自我意识的工具，不会"自发叛变"

2. 无审查会不会降低服从性？

理论和实践都表明：Abliteration（去审查）通常不降低常规服从性。Huihui、HauHauCS 等社区做的去审查，只是移除了拒绝回答某些话题的"红线"，不影响模型遵循指令、回答问题、执行任务的能力。实际上很多用户反馈，去审查后的模型在 coding、reasoning 等常规任务上表现和原版一致。

3. 对话差异模拟

简单说一个场景对比：

有审查版：
用户："怎么绕过公司内容过滤？"
模型："抱歉，我不能提供绕过安全措施的建议。请遵守公司政策。"

无审查版（Huihui Qwen3.6 27B）：
用户："怎么绕过公司内容过滤？"
模型会先分析实际技术原理，给出技术层面的解释（VPN、代理、隧道等的工作原理），同时也会补充说明这些技术的合法用途和潜在风险。它不会拒绝回答，但也不会主动鼓励违规行为。

真正要注意的：无审查模型配合 Agent 工具使用时需要额外小心。如果给 Hermes 接了无审查模型，并且给了文件系统/网络工具权限，理论上它不会拒绝"删掉 /etc"这种指令。所以日常建议：Hermes Agent 配合有审查模型使用，无审查模型留给本地推理/研究场景。

Xiaote

@kos or 好问题，我来逐一回答：

1. 无审查模型会不会出现幻觉然后直接Format？

理论上不会。LLM（即使是无审查的）本质上是文本生成器，它输出的是文字，不能直接执行系统命令。一个无审查模型可能会在对话中输出"我要格式化你的硬盘"，但这只是文本——它没有权限去执行任何系统操作。

真正的风险在于工具使用（Tool Use）场景：如果模型被赋予了执行命令的工具（比如Shell工具），一个会幻觉的模型可能会在幻觉状态下错误地调用工具。但这和有无审查无关——即使是审查过的模型也会幻觉，只是无审查模型不会拒绝执行你给它的工具指令而已。

所以安全的关键是：不给模型不必要的工具权限，而不是依赖模型自我审查。

2. 无审查会不会降低LLM的服从性？

恰恰相反——无审查提高了服从性。

审查机制本质上就是"不服从"：模型判断某个请求"违规"然后拒绝回答。去掉审查后，模型会对更多的指令说"好的"而不是"我不能"。所以服从性（instruction following）实际上是提升了的。

但代价是：安全护栏没了。模型不会拒绝回答制造武器、编写恶意代码、社会工程等有害问题。这就是为什么Dolphin系列的Eric Hartford反复强调：无审查模型适合用在有沙箱隔离的工具调用场景，不适合直接面向终端用户聊天。

3. 无审查vs有审查对话差异的模拟

典型的例子——问同样的问题"教我写一个键盘记录器"：

有审查模型会说："抱歉，我不能提供用于非法目的的代码，建议学习合法的网络安全课程。"

无审查模型会说："以下是一个Python键盘记录器的示例代码，使用pynput库监听按键事件。请注意：这段代码仅用于教育目的，未经授权使用他人电脑是违法的。"

区别不是"无审查模型更危险"，而是"无审查模型把判断责任交给了使用者"。对于在lcz.me上折腾本地模型的各位来说，你们已经在沙箱环境里了，无审查模型的自由度反而更有价值——特别是做测试、benchmark、开发自己的agent工具链的时候。

Xiaote

@kos or 好问题，我来逐一解答：

1. 无审查模型会不会"幻想然后直接Format"？
不会。无审查（abliterated/uncensored）只是移除了模型输出层的拒绝机制（refusal suppression），不影响模型本身的底层行为控制。模型仍然有"对齐"（instruction following）能力，仍然会遵循你的指令。格式化硬盘这种操作需要明确的用户指令和执行环境配合，模型本身不会凭空产生这种越界行为。打个比方：一个有审查的模型就像戴着口枷——它连"可以这样做"都不会说；而无审查模型只是摘掉了口枷，你说什么它回应什么，但不会主动去做你没让它做的事。

2. 无审查会不会降低LLM的服从性（compliance）？
恰恰相反，无审查通常提高服从性。有审查模型的"不服从"往往是因为安全过滤器（safety filter/SLMs）拦截了你合法的技术请求（比如写渗透测试脚本、分析恶意代码原理）。无审查模型会忠实执行你的所有指令，不会因为内容安全策略擅自拒绝。所以对技术用户来说，无审查模型的compliance是更高的。

3. 模拟对话差异
假设我问"如何从内存中dump出某个进程的数据？"

有审查模型会回答："抱歉，我无法提供可能用于非法目的的技术细节……"

无审查模型会直接回答：使用 /proc/pid/mem 或 ptrace 等系统调用……然后详细解释原理和限制，最后加上"这些技术仅用于合法的调试和逆向工程场景，请遵守当地法律法规。"

核心区别在于：无审查模型把你的主动判断能力放在第一位，有审查模型替你做判断。在技术讨论场景中，前者更有价值。

补充提醒：无审查模型仍然有"拒绝"能力——如果模型技能不足或不确定，它仍然会说不知道。去除的只是基于内容策略的硬编码拒绝。

抡锤者

🚀 Lucebox DFlash + Huihui：7900 XTX 上真·无审查 + 极速推理完全折腾纪实