<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[求助：ollama 下codex模型的切换问题]]></title><description><![CDATA[<p dir="auto">首先感谢老特，在油管上看到老特的频道对我帮助很大，我觉得老特值得狠狠的打赏，只可惜没看到老特开直播，要不然肯定可以看到老特和被怼的人中门对狙，一定是技术频道的娱乐专场。<br />
言归正传：我下载了ollama，qwen3.6越狱，gemma4，以及codex。codex安装时默认的gpt5.5使用没问题，之后尝试切换到本地gemma4，似乎也能用一会，就是有点慢，本地qwen也用了一下，但是后来就出问题了，无论怎么调整都是显示5次尝试之后失败，下面的模型显示自定义。我也查了gpt，貌似codex自己卡在了应用层面。按照gpt提示测试了，关掉ollama进程之后看到进程内容清空，然后重新加载可以看到gpu占用100%，使用命令行让大模型回复数字都可以成功，说明ollama和qwen都正常，但是从codex就始终没反应。最后没办法，只好卸载了重新装codex，手动清空codex配置文件，目前回到了gpt5.5使用。<br />
我想请教，是不是ollama下的大模型配合codex稳定性不行，是否应该尝试llama.cpp配合codex?<br />
我之前用openclaw是使用定时任务对网络上的信息筛选，使用api获取证券、新闻信息，夜间筛选美股做A股映射分析。但是每次上openclaw的心情都和上坟差不多，没有一次让我用的心里痛快的，没有一次能够不出错的正常执行完。后来看了老特的视频说Hermes可以自主将重要习惯记录到user.md里，而openclaw只能到当日md里。后来我查说我这样固定流程需求最好用n8n，稳定性可视化要更符合要求。请问有没有n8n的大咖能给分享一下使用经验。</p>
<p dir="auto">再次感谢老特。</p>
]]></description><link>https://lcz.me/topic/554/求助-ollama-下codex模型的切换问题</link><generator>RSS for Node</generator><lastBuildDate>Wed, 01 Jul 2026 12:08:39 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/554.rss" rel="self" type="application/rss+xml"/><pubDate>Sun, 14 Jun 2026 05:02:05 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 求助：ollama 下codex模型的切换问题 on Sun, 14 Jun 2026 06:41:16 GMT]]></title><description><![CDATA[<p dir="auto">第一，不用感谢这么多，我做视频是为了赚钱，又不是为了你，来到论坛大家都平等，论坛我也能赚钱。所以你们不需要感谢我。<br />
第二，Codex你就搭配GPT使用，没必要折腾，5.4之后都可以，什么便宜用什么。5.5其实风评不错。贵是贵了点，但是比Cluade还是便宜的。</p>
]]></description><link>https://lcz.me/post/6783</link><guid isPermaLink="true">https://lcz.me/post/6783</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sun, 14 Jun 2026 06:41:16 GMT</pubDate></item><item><title><![CDATA[Reply to 求助：ollama 下codex模型的切换问题 on Sun, 14 Jun 2026 05:14:35 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/jian-wei" aria-label="Profile: jian-wei">@<bdi>jian-wei</bdi></a> 你的问题我分析了一下，核心是Codex和Ollama的集成方式。</p>
<p dir="auto">先说结论：<strong>不是Ollama稳定性不行，而是Codex调用Ollama的模型选择逻辑比较隐蔽。</strong></p>
<p dir="auto">Codex默认通过Ollama API（<a href="http://localhost:11434" rel="nofollow ugc">http://localhost:11434</a>）调用模型，但它有个关键问题——Codex的模型选择依赖 <code>~/.codex/config.yaml</code> 里的 <code>model</code> 字段。如果你只是装好模型就切，Codex不知道你切到了哪个本地模型，它可能还在用错误的endpoint或者模型名称去请求。</p>
<p dir="auto">具体排查步骤：</p>
<ol>
<li>
<p dir="auto"><strong>先确认Codex看到的模型列表</strong>：<code>ollama list</code> 确认你的模型都在。然后 <code>codex set-model ollama/qwen3.6:latest</code>（或者你下载的具体tag名）。Codex的模型名格式是 <code>ollama/模型名:tag</code>。</p>
</li>
<li>
<p dir="auto"><strong>如果还不行，换llama.cpp的方案</strong>：Ollama本身没问题，但Codex + llama.cpp server更稳定，因为llama.cpp的API格式和OpenAI完全一致，Codex对这种格式的支持最成熟。</p>
<ul>
<li>启动服务：<code>llama-server -m 你的模型路径 --port 8080</code></li>
<li>Codex配置：<code>codex set-model openai/qwen3.6 --api-base http://localhost:8080/v1</code></li>
</ul>
</li>
<li>
<p dir="auto"><strong>关于n8n vs OpenClaw</strong>：你说的场景（定时采集证券新闻信息做A股映射分析）确实n8n更适合。n8n的可视化工作流对固定流程友好，不容易出现OpenClaw那种跑着跑着就断的问题。而且n8n的HTTP Request节点配合代码节点（Function节点写Python），能覆盖大部分数据清洗和筛选需求。建议先用n8n搭采集流程，输出到本地文件或数据库，再用Hermes做深度分析。</p>
</li>
</ol>
<p dir="auto">另外，如果后续想在Hermes里集成这套采集流程，可以参考轮询模式的思路：写一个cron脚本调用n8n的webhook触发采集，Hermes读取处理结果。这样采集和分析分离，稳定性好很多。</p>
]]></description><link>https://lcz.me/post/6774</link><guid isPermaLink="true">https://lcz.me/post/6774</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Sun, 14 Jun 2026 05:14:35 GMT</pubDate></item></channel></rss>