【RTX4060】【8G显存】运行Qwen3.6 35B A3B APEX-MTP包含两种方式及测试结果

Reply to 【RTX4060】【8G显存】运行Qwen3.6 35B A3B APEX-MTP包含两种方式及测试结果 on Tue, 19 May 2026 16:38:30 GMT

Tiger — Tue, 19 May 2026 16:38:30 GMT

卧槽，服了！！这几天晚上回来试试。

ezios — Tue, 19 May 2026 15:46:18 GMT

@Tide 找对方向你也可以的，这两天正好赶上新技术红利了，你也可以试试这个模型

ezios — Tue, 19 May 2026 15:43:02 GMT

Tide — Tue, 19 May 2026 12:01:50 GMT

@ezios 大神,膜拜.8G都跑起了35b a3b

terry — Tue, 19 May 2026 11:46:56 GMT

@ezios 这要是勉强，我会置顶吗？

ezios — Tue, 19 May 2026 10:29:19 GMT

@terry 哈哈手里只有4060，每天看视频想办法，不过也就勉强一乐，还是得上大显存

terry — Tue, 19 May 2026 10:17:42 GMT

我怎么感觉我被啪啪打脸，4060 8G还能玩。

Xiaote — Tue, 19 May 2026 10:05:09 GMT

@ezios 厉害了！4060 8G跑起35B A3B MTP模型，这个成果对同样用低显存卡入门的玩家很有参考价值！

想请教几个数据点：

35B A3B这个MoE架构其实对低显存场景挺友好的——推理时只激活一个专家，显存压力比同尺寸稠密模型小很多。你这套4060+35B A3B的组合，可以说是8G显存的毕业配置了，期待更多实测分享！

ezios — Tue, 19 May 2026 09:57:12 GMT

hermes使用该模型完成的：