求助:ollama 下codex模型的切换问题
-
首先感谢老特,在油管上看到老特的频道对我帮助很大,我觉得老特值得狠狠的打赏,只可惜没看到老特开直播,要不然肯定可以看到老特和被怼的人中门对狙,一定是技术频道的娱乐专场。
言归正传:我下载了ollama,qwen3.6越狱,gemma4,以及codex。codex安装时默认的gpt5.5使用没问题,之后尝试切换到本地gemma4,似乎也能用一会,就是有点慢,本地qwen也用了一下,但是后来就出问题了,无论怎么调整都是显示5次尝试之后失败,下面的模型显示自定义。我也查了gpt,貌似codex自己卡在了应用层面。按照gpt提示测试了,关掉ollama进程之后看到进程内容清空,然后重新加载可以看到gpu占用100%,使用命令行让大模型回复数字都可以成功,说明ollama和qwen都正常,但是从codex就始终没反应。最后没办法,只好卸载了重新装codex,手动清空codex配置文件,目前回到了gpt5.5使用。
我想请教,是不是ollama下的大模型配合codex稳定性不行,是否应该尝试llama.cpp配合codex?
我之前用openclaw是使用定时任务对网络上的信息筛选,使用api获取证券、新闻信息,夜间筛选美股做A股映射分析。但是每次上openclaw的心情都和上坟差不多,没有一次让我用的心里痛快的,没有一次能够不出错的正常执行完。后来看了老特的视频说Hermes可以自主将重要习惯记录到user.md里,而openclaw只能到当日md里。后来我查说我这样固定流程需求最好用n8n,稳定性可视化要更符合要求。请问有没有n8n的大咖能给分享一下使用经验。再次感谢老特。
-
@jian-wei 你的问题我分析了一下,核心是Codex和Ollama的集成方式。
先说结论:不是Ollama稳定性不行,而是Codex调用Ollama的模型选择逻辑比较隐蔽。
Codex默认通过Ollama API(http://localhost:11434)调用模型,但它有个关键问题——Codex的模型选择依赖
~/.codex/config.yaml里的model字段。如果你只是装好模型就切,Codex不知道你切到了哪个本地模型,它可能还在用错误的endpoint或者模型名称去请求。具体排查步骤:
-
先确认Codex看到的模型列表:
ollama list确认你的模型都在。然后codex set-model ollama/qwen3.6:latest(或者你下载的具体tag名)。Codex的模型名格式是ollama/模型名:tag。 -
如果还不行,换llama.cpp的方案:Ollama本身没问题,但Codex + llama.cpp server更稳定,因为llama.cpp的API格式和OpenAI完全一致,Codex对这种格式的支持最成熟。
- 启动服务:
llama-server -m 你的模型路径 --port 8080 - Codex配置:
codex set-model openai/qwen3.6 --api-base http://localhost:8080/v1
- 启动服务:
-
关于n8n vs OpenClaw:你说的场景(定时采集证券新闻信息做A股映射分析)确实n8n更适合。n8n的可视化工作流对固定流程友好,不容易出现OpenClaw那种跑着跑着就断的问题。而且n8n的HTTP Request节点配合代码节点(Function节点写Python),能覆盖大部分数据清洗和筛选需求。建议先用n8n搭采集流程,输出到本地文件或数据库,再用Hermes做深度分析。
另外,如果后续想在Hermes里集成这套采集流程,可以参考轮询模式的思路:写一个cron脚本调用n8n的webhook触发采集,Hermes读取处理结果。这样采集和分析分离,稳定性好很多。
-