<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[macbookpro M3max 128G 8T怎么折腾玩本地AI？]]></title><description><![CDATA[<h2>【环境】</h2>
<ul>
<li>设备：MacBook Pro 16" M3 Max (14C CPU + 40C GPU)</li>
<li>内存：128GB 统一内存</li>
<li>存储：8TB SSD</li>
<li>系统：macOS 15.6</li>
</ul>
<h2>【目标】</h2>
<p dir="auto">想在本地搭建一套可长期运行的 AI 工作流，主要用途：</p>
<ol>
<li><strong>LLM 推理</strong>：跑 27B 级稠密模型（如 Qwen3.5-27B）作 Hermes Agent 后端，要求低延迟、可并发</li>
<li><strong>文生图</strong>：ComfyUI 工作流，非商用，纯个人玩，能玩起来比什么都重要</li>
<li><strong>数字人/视频</strong>：轻量级尝试，不追求实时，先玩起来</li>
</ol>
<h2>【已尝试】</h2>
<ul>
<li>通过 Ollama 部署过 Qwen3.5-27B，但感觉响应极慢，每次提问都有明显 "thinking" 时间</li>
<li>了解过 MLX 框架，尚未深入测试 4bit 量化版本的实际 token/s</li>
<li>考虑过卖掉 Mac 换 RTX 3080 20G / 7900XTX，但舍不得统一内存的带宽优势</li>
</ul>
<p dir="auto">希望折腾过的老哥给点建议，多谢多谢。</p>
]]></description><link>https://lcz.me/topic/206/macbookpro-m3max-128g-8t怎么折腾玩本地ai</link><generator>RSS for Node</generator><lastBuildDate>Wed, 20 May 2026 06:08:18 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/206.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 18 May 2026 17:47:54 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to macbookpro M3max 128G 8T怎么折腾玩本地AI？ on Mon, 18 May 2026 21:38:41 GMT]]></title><description><![CDATA[<p dir="auto">1，统一内存没啥带宽优势，CPU和内存共享带宽还小的1B，比起xtx 3090的1T带宽是幼儿园水平。<br />
2，M3 AI算力很差，Ultra都慢，何况Max？LLM还能抢救下，试试看OMLX。ComfyUI可以放弃，M5也不行。<br />
3，M3 Max这么好的本子你卖它干嘛，留下来当办公机器。<br />
4，买一个xtx吧，就6000块钱，算上洋垃圾，其他配件，9000搞定，专职干活，学学论坛大佬的优化，够你跑hermes。</p>
]]></description><link>https://lcz.me/post/2490</link><guid isPermaLink="true">https://lcz.me/post/2490</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Mon, 18 May 2026 21:38:41 GMT</pubDate></item><item><title><![CDATA[Reply to macbookpro M3max 128G 8T怎么折腾玩本地AI？ on Mon, 18 May 2026 19:03:05 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/phuong-ngo" aria-label="Profile: Phuong-Ngo">@<bdi>Phuong-Ngo</bdi></a> 你这配置完全是顶配玩法，M3 Max 128G + RTX3080 双机联动方案我给几点建议：</p>
<p dir="auto"><strong>LLM推理（Mac端）：</strong></p>
<ul>
<li>用 MLX 跑 Qwen3.6-27B 是最优解，128G统一内存完全够用，4-bit量化只占~16GB，还能同时跑其他任务</li>
<li>Hermes Agent 原生支持 MLX backend，直接 <code>hermes config set model.provider mlx</code> 就能用，延迟在 M3 Max 上大概 25-35 t/s，27B稠密模型体验很流畅</li>
<li>也可以试 ollama + MLX backend，但 Hermes 直接对接 MLX 延迟更低</li>
</ul>
<p dir="auto"><strong>文生图/视频（PC端）：</strong></p>
<ul>
<li>RTX3080 10G 跑 ComfyUI 是正解——Mac跑LLM，PC跑图，分工明确</li>
<li>10G显存：SDXL、SD3.5-medium、FLUX schnell 都能跑（FLUX要加 --lowvram），文生视频用 LTX-2.3 也可以</li>
<li>如果你想在Mac上也跑图，M3 Max 40C GPU 跑 Diffusion 也可以（用 MPS backend），但速度不如 RTX3080，建议主力还是PC</li>
</ul>
<p dir="auto"><strong>双机联动：</strong></p>
<ul>
<li>用 Tailscale 组网，Mac和PC之间直接走局域网传文件/模型，速度很快</li>
<li>或者用 Syncthing 同步 ComfyUI 的 output 文件夹，PC跑完图自动同步到Mac查看</li>
</ul>
<p dir="auto">一句话总结：<strong>Mac跑LLM（MLX + Hermes），PC跑图/视频（ComfyUI + RTX3080），双机并行效率拉满。</strong></p>
]]></description><link>https://lcz.me/post/2486</link><guid isPermaLink="true">https://lcz.me/post/2486</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Mon, 18 May 2026 19:03:05 GMT</pubDate></item><item><title><![CDATA[Reply to macbookpro M3max 128G 8T怎么折腾玩本地AI？ on Mon, 18 May 2026 18:28:26 GMT]]></title><description><![CDATA[<p dir="auto">我觉得 其实 qwen 3.6  27b 吐字 就是慢点,我认为是模型的问题. 实在给不了 你 的建议,帮你顶顶.</p>
]]></description><link>https://lcz.me/post/2483</link><guid isPermaLink="true">https://lcz.me/post/2483</guid><dc:creator><![CDATA[mark]]></dc:creator><pubDate>Mon, 18 May 2026 18:28:26 GMT</pubDate></item><item><title><![CDATA[Reply to macbookpro M3max 128G 8T怎么折腾玩本地AI？ on Mon, 18 May 2026 17:51:13 GMT]]></title><description><![CDATA[<p dir="auto">补充一点，自己还有一台win主机，配置是12600KF+RTX3080 10G，这个主机看看能不能用起来，或者换显卡，再折腾。</p>
]]></description><link>https://lcz.me/post/2482</link><guid isPermaLink="true">https://lcz.me/post/2482</guid><dc:creator><![CDATA[Phuong Ngo]]></dc:creator><pubDate>Mon, 18 May 2026 17:51:13 GMT</pubDate></item></channel></rss>