换了好几个模型,有些简单问题AI就是很难回答上来
-
@sospda 这个问题其实是本地模型的一个常见误解,我来解释一下:
核心原因:本地模型没有联网能力。
模型本身是一个"大脑",它的知识截止于训练数据的时间点(比如几个月前)。问它"上一场NBA比赛的球队和比分",它需要实时查询网络才能知道——但普通本地模型(比如通过 Ollama/LM Studio 等推理框架运行的 Qwen/Llama 等)默认是没有联网权限的。
这不是"网络限制"的问题(不是 GFW 那种封锁),而是架构设计的问题——模型只负责推理,不负责上网。
解决方案(两种):
① 用 Agent 框架(比如 Hermes Agent、OpenClaw)
这类工具自带 web_search 和 browser 工具,模型可以自动调用搜索 API 来获取实时信息。你问"查一下上一场 NBA",它会:搜索 -> 读取网页 -> 提取比分 -> 回答你,全程自动。② 用带联网功能的 Chat 服务
DeepSeek 网页版、ChatGPT、Perplexity 等在线服务本身自带搜索引擎,不需要本地模型来操心这一步。简单说:本地模型擅长的是代码编写、文本分析、角色对话等"不需要实时数据"的任务。需要实时信息的时候,要么给它配 Agent 能力,要么直接用在线服务。两个方向侧重点不同,看你的使用场景选择就行。
-
所有的模型都有知识库的截止时间.
你直接告诉hermes说你的内容过期了, 去找相关领域的cli, rss源等, 它会自己建立skill.
本地的35A3的知识面和智力足够告诉Hermes应该怎么去搜索, 寻找了. 实在不成, 自己告诉hermes去哪里找准确的信息源, 最好是cli, rss的, 减少噪音. 然后它自己就能建立这个skill.
-
提示词太笼统了。你肯定知道去哪看。把准确的地址给 Hermes 它是可以搞定的。
-
我刚才试了一下, 用35A3
- 第一个问题: 最近的一场NBA球赛, 是谁对谁, 比分多少? 你的知识库是过期的, 上网找相关的cli或者rss源, 给我个准确回答. 今天是2026年5月30日.
- 然后它去找rss搜索, 尝试了很久, 大概有2分钟吧, 我等不及
- 第二个问题: 还没找到吗? 找找github上有专门的nba cli
- 然后它有转了大概2分钟吧, 给我安装了一个 nba-api, 然后回答了
答案 : 2026年5月28日 (NBA 季后赛)
| | 球队 | 得分 | |---|------|------| | 🏠 主场 | San Antonio Spurs (马刺) | 118 | | ✈️ 客场 | Oklahoma City Thunder (雷霆) | 91 |我不是NBA球迷, 不过这个答案和我搜google是一样的.
如下是最终截图

-
@Tony-Wang 我有設定Thinking-budget:2048 tokens 避免它一直卡在Thinking模式浪費太多時間。不過剛剛它一開始動用好幾個Browse工具上網查資料,就代表知道要上網找,我懷疑可能是被2048限制了,被迫馬上輸出答案才產生幻覺。我再調整成4096好了
-
@Tony-Wang 我昨天之後嘗試了第二次prompt 就成功 [ 幫我查詢NBA比賽最新的一場賽事的比賽結果] ,

我做了兩個動作, 1.換掉Qwen3.6-35B-A3B-MXFP4 改用 Qwen3.6-35B-A3B-UD-Q4_K_XL 兩個檔案大小都約22GB ; MXFP4 速度快 但精確度和穩定性比 UD-Q4_K_XL 版本差 2. Reasoning-Budget 改成4096 我推估假如Hermes 在網路上抓的資料過多, 超過2048tokens 時 會被系統阻斷思考 被迫直接輸出一個答案(有可能是舊的訓練資料) 3. 這資料時間慢了一兩天, 我之後再試試
-
@sospda 同样一辆车, 有的人跑赛道是10分钟, 有的人跑同样的赛道是5分钟。 有的人抱怨这个车真是垃圾,太难操控。 有的人精进自己的能力,去熟悉这辆车的操作,把它的性能发挥到最大。 智人跟猴子最大的不同,就是会使用工具,现代人跟智人的不同,就是现代人知道如何更好地去使用工具。
@sospda 同样一辆车, 有的人跑赛道是10分钟, 有的人跑同样的赛道是5分钟。 有的人抱怨这个车真是垃圾,太难操控。 有的人精进自己的能力,去熟悉这辆车的操作,把它的性能发挥到最大。 智人跟猴子最大的不同,就是会使用工具,现代人跟智人的不同,就是现代人知道如何更好地去使用工具。
说那么多有啥用,你测试过没?要多久?如果没有试过,可以试试。
同一个问题, 不同的模型反应速度不同, 足以证明在该问题下不同的模型的智能程度。
也说明了,在该问题下,有些模型还有进步空间。
这有什么问题吗?
我发现了这一现象,提出来,不代表我就不去提升我的技能。
这是两码事。
