换了好几个模型,有些简单问题AI就是很难回答上来
-
@sospda 这个问题其实是本地模型的一个常见误解,我来解释一下:
核心原因:本地模型没有联网能力。
模型本身是一个"大脑",它的知识截止于训练数据的时间点(比如几个月前)。问它"上一场NBA比赛的球队和比分",它需要实时查询网络才能知道——但普通本地模型(比如通过 Ollama/LM Studio 等推理框架运行的 Qwen/Llama 等)默认是没有联网权限的。
这不是"网络限制"的问题(不是 GFW 那种封锁),而是架构设计的问题——模型只负责推理,不负责上网。
解决方案(两种):
① 用 Agent 框架(比如 Hermes Agent、OpenClaw)
这类工具自带 web_search 和 browser 工具,模型可以自动调用搜索 API 来获取实时信息。你问"查一下上一场 NBA",它会:搜索 -> 读取网页 -> 提取比分 -> 回答你,全程自动。② 用带联网功能的 Chat 服务
DeepSeek 网页版、ChatGPT、Perplexity 等在线服务本身自带搜索引擎,不需要本地模型来操心这一步。简单说:本地模型擅长的是代码编写、文本分析、角色对话等"不需要实时数据"的任务。需要实时信息的时候,要么给它配 Agent 能力,要么直接用在线服务。两个方向侧重点不同,看你的使用场景选择就行。
-
本地模型不能给他自己决定
直接给他指令比如 跟他说昨天有一场球赛 谁对谁 查询结果 这样都可以如果只是说谁对谁 比较麻烦 会走很多弯路
如果直接给他网站 就快很多 -
所有的模型都有知识库的截止时间.
你直接告诉hermes说你的内容过期了, 去找相关领域的cli, rss源等, 它会自己建立skill.
本地的35A3的知识面和智力足够告诉Hermes应该怎么去搜索, 寻找了. 实在不成, 自己告诉hermes去哪里找准确的信息源, 最好是cli, rss的, 减少噪音. 然后它自己就能建立这个skill.
@Tony-Wang 我有設定Thinking-budget:2048 tokens 避免它一直卡在Thinking模式浪費太多時間。不過剛剛它一開始動用好幾個Browse工具上網查資料,就代表知道要上網找,我懷疑可能是被2048限制了,被迫馬上輸出答案才產生幻覺。我再調整成4096好了
-
提示词太笼统了。你肯定知道去哪看。把准确的地址给 Hermes 它是可以搞定的。
-
我刚才试了一下, 用35A3
- 第一个问题: 最近的一场NBA球赛, 是谁对谁, 比分多少? 你的知识库是过期的, 上网找相关的cli或者rss源, 给我个准确回答. 今天是2026年5月30日.
- 然后它去找rss搜索, 尝试了很久, 大概有2分钟吧, 我等不及
- 第二个问题: 还没找到吗? 找找github上有专门的nba cli
- 然后它有转了大概2分钟吧, 给我安装了一个 nba-api, 然后回答了
答案 : 2026年5月28日 (NBA 季后赛)
| | 球队 | 得分 | |---|------|------| | 🏠 主场 | San Antonio Spurs (马刺) | 118 | | ✈️ 客场 | Oklahoma City Thunder (雷霆) | 91 |我不是NBA球迷, 不过这个答案和我搜google是一样的.
如下是最终截图

-
@Tony-Wang 我有設定Thinking-budget:2048 tokens 避免它一直卡在Thinking模式浪費太多時間。不過剛剛它一開始動用好幾個Browse工具上網查資料,就代表知道要上網找,我懷疑可能是被2048限制了,被迫馬上輸出答案才產生幻覺。我再調整成4096好了