<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[闲唠一下关于玩本地LLM和在线前沿模型。]]></title><description><![CDATA[<pre><code>   本地AI玩了快两个月了，某一刻：我突然发现，和LLM或者是HERMES聊天，或者是让LLM担任AGENT，用IDE让它跑编程任务，本质上是一个工程问题，也是一个人机协同，思维同步的问题。
   而不能像跟阿拉丁神灯许愿一样，期望模糊的打几个字。对面的AI就能像阿拉丁神灯一样，又快又好的回答你，或者瞬间帮你实现你要的结果。 
   能做到前者的，目前可能只有豆包，情绪价值拉满，但是可能答案和真实情况千差万别，能做到后者的，可能只有claude code 20X MAX套餐。

    能同时做到两者的，趁早洗洗睡，梦里面肯定有。
</code></pre>
<p dir="auto">不过落到实际的话，我目前努力的方向还是，怎样实现人机思维链的快速同步，目前给我感受最好的，也只有hermes了，目前策略是，开两个窗口，一个选 本地QWEN 3.6 27B，省TOKEN，智能思考。少于30字符的问题基本秒回（我有让它配置一个闲聊模式，不要发太重的SYSTEM PROMPT给LLM）。</p>
<p dir="auto">另一个窗口，连接DEEPSEEK PRO，有编程任务 ，或者是本地配置任务 ，我都在里面跑，上下文量大管饱，最近华为显卡跟上了，也不会卡顿了。<br />
不管哪个窗口，上下文满了，发送指令让它更新或总结记忆，然后/new重建session，接着爽聊。<br />
其实看看现在的在线聊天AI，KIMI，千问，智谱，豆包，gemini,他们一直也是有类似的设计，默认快速，手动可以 选深度思考或者联网，资本也在做成本的权衡。<br />
而我们有本地LLM条件的，可以自己想更多办法，工程化的去实现，从而不用受资本的压榨，又能将个人资料牢牢攥在自己 手中，免受绿泡泡倒卖资料给购物网站的困扰。</p>
<p dir="auto">如此，实现人机的协同，让HERMES真正成为个人的 数字孪生，让它将目前时代的两个红利,QWEN 3.6 27B本地与DEEPSEEK PRO（或者claude code) 。通过不断与HERMES交互，将时代红利，个人现实，牢牢绑定。减轻个人负担，创造更多价值！</p>
<p dir="auto">最后用清言的回答和HERMES的总结图，来结个贴：<img src="https://upload.lcz.me/uploads/8dac565a-33d4-4950-a937-cafae9552222.jpeg" alt="1c89bb76-4bd8-4ab1-8041-794326a2402e-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/d85b7b28-0388-4fa1-ad1b-bde2d9eed48b.jpeg" alt="e53e801b-00f9-4e1a-9c45-7f29b5fd7924-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/topic/486/闲唠一下关于玩本地llm和在线前沿模型</link><generator>RSS for Node</generator><lastBuildDate>Thu, 11 Jun 2026 13:58:22 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/486.rss" rel="self" type="application/rss+xml"/><pubDate>Tue, 09 Jun 2026 03:30:28 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 闲唠一下关于玩本地LLM和在线前沿模型。 on Tue, 09 Jun 2026 04:25:13 GMT]]></title><description><![CDATA[<p dir="auto">認同</p>
<p dir="auto">這就是human on the loop的精髓, 人負責大方向的思考, 細小的地方再由模型補充</p>
<p dir="auto">編程上面的SDD就是這個想法的實現之一</p>
]]></description><link>https://lcz.me/post/5924</link><guid isPermaLink="true">https://lcz.me/post/5924</guid><dc:creator><![CDATA[566656661]]></dc:creator><pubDate>Tue, 09 Jun 2026 04:25:13 GMT</pubDate></item><item><title><![CDATA[Reply to 闲唠一下关于玩本地LLM和在线前沿模型。 on Tue, 09 Jun 2026 04:10:28 GMT]]></title><description><![CDATA[<p dir="auto">說得很好 人類就像是LLM其中的權重 weights , 得到使用者想要的output</p>
]]></description><link>https://lcz.me/post/5923</link><guid isPermaLink="true">https://lcz.me/post/5923</guid><dc:creator><![CDATA[kos or]]></dc:creator><pubDate>Tue, 09 Jun 2026 04:10:28 GMT</pubDate></item></channel></rss>