跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 你们的Hermes都是怎么网上冲浪的?

你们的Hermes都是怎么网上冲浪的?

已定时 已固定 已锁定 已移动 AI Agent
17 帖子 11 发布者 355 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 九龙杨生九 离线
    九龙杨生九 离线
    九龙杨生
    技术大牛
    编写于 最后由 编辑
    #5

    需要一个后端API来支持web_extract和web_serch,我是用的EXA的那个免费额度,你可以试试看

    欢迎访问亿量科技官网
    欢迎访问亿量科技油管频道

    1 条回复 最后回复
    1
    • S 离线
      S 离线
      seabass
      编写于 最后由 编辑
      #6

      我用的是Free Brave Search API, 满好的

      1 条回复 最后回复
      0
      • J 离线
        J 离线
        johnnybegood
        德高望重 劳动模范
        编写于 最后由 编辑
        #7

        searxng lalala

        1 条回复 最后回复
        0
        • S 离线
          S 离线
          sarcoma
          编写于 最后由 sarcoma 编辑
          #8

          我用本地searxng服务配置给hermes的web_search用,简单的信息搜索他回复很快,貌似是meta search的关系。
          深度搜索或需要仔细读取网页内容的时候,hermes会调用我的本地firecrawl服务来读取网页内容。这时候其实分两层,一层是firecrawl爬取网页的速度,还有就是对网页内容进行归纳总结的速度(推理模型的速度),这个可以在config.yaml的服务任务(auxiliary)中设置web_extract部分控制,默认是主模型,但是如果主模型不够快(比如本地小模型),你可以指定其他模型,比如云模型api、或本地更快的模型来执行。

          九龙杨生九 1 条回复 最后回复
          1
          • terryT 离线
            terryT 离线
            terry
            超级版主
            编写于 最后由 编辑
            #9

            谷歌搜索嘎了之后,brave search 性价比最高。 能折腾的,当然searxng。

            油管:https://www.youtube.com/@抡锤者

            M 1 条回复 最后回复
            0
            • terryT terry

              谷歌搜索嘎了之后,brave search 性价比最高。 能折腾的,当然searxng。

              M 离线
              M 离线
              mark
              超凡大师
              编写于 最后由 编辑
              #10

              @terry 1000条 5美金,这个不便宜 , 自己做搜索吧.

              1 条回复 最后回复
              0
              • S 离线
                S 离线
                sarcoma
                编写于 最后由 编辑
                #11

                每个月firecrawl在线也是送1000条还是500条来着,也可以切换着用

                本地服务么,还得挂哪个啥,也是成本,🤣

                1 条回复 最后回复
                0
                • S sarcoma

                  我用本地searxng服务配置给hermes的web_search用,简单的信息搜索他回复很快,貌似是meta search的关系。
                  深度搜索或需要仔细读取网页内容的时候,hermes会调用我的本地firecrawl服务来读取网页内容。这时候其实分两层,一层是firecrawl爬取网页的速度,还有就是对网页内容进行归纳总结的速度(推理模型的速度),这个可以在config.yaml的服务任务(auxiliary)中设置web_extract部分控制,默认是主模型,但是如果主模型不够快(比如本地小模型),你可以指定其他模型,比如云模型api、或本地更快的模型来执行。

                  九龙杨生九 离线
                  九龙杨生九 离线
                  九龙杨生
                  技术大牛
                  编写于 最后由 编辑
                  #12

                  @sarcoma 还是只能低频率使用吧,我自己设置了一个根本扛不住大量压力

                  欢迎访问亿量科技官网
                  欢迎访问亿量科技油管频道

                  S 1 条回复 最后回复
                  0
                  • williamlouisW 离线
                    williamlouisW 离线
                    williamlouis
                    超级版主
                    编写于 最后由 编辑
                    #13

                    我一直都是自己写。思路更新在我的帖子里。实测7900XTX 就可以跑起来。但是属于入门级别。太复杂的操作不了。更新后 发现 其他 指纹厂商也都 陆续 跟风。接口持续丰富中。光是冲浪的话应该很简单的。(所以看我的思路就行了,浏览器可以看看其他厂商。)
                    重点是你的本地模型要测试好。一定要足够稳定。上下文测试是重点。新手不如直接用在线 api 搞。跑通生成 skill 再转移到 本地。
                    经验:在线转 本地 需要 在线api 继续修缮。本地 小 显存24G 都会折腾一段。预测 48G是甜点区。

                    个人主页:xlkj.org Telegram https://t.me/xlkjorg

                    S 1 条回复 最后回复
                    0
                    • 九龙杨生九 九龙杨生

                      @sarcoma 还是只能低频率使用吧,我自己设置了一个根本扛不住大量压力

                      S 离线
                      S 离线
                      sarcoma
                      编写于 最后由 编辑
                      #14

                      @九龙杨生 那就只能本地部署或刷卡咯。本地部署得担心爬太多ip被墙了,其他还好。我爬的少,检索咨询为主,问题不大

                      1 条回复 最后回复
                      0
                      • williamlouisW williamlouis

                        我一直都是自己写。思路更新在我的帖子里。实测7900XTX 就可以跑起来。但是属于入门级别。太复杂的操作不了。更新后 发现 其他 指纹厂商也都 陆续 跟风。接口持续丰富中。光是冲浪的话应该很简单的。(所以看我的思路就行了,浏览器可以看看其他厂商。)
                        重点是你的本地模型要测试好。一定要足够稳定。上下文测试是重点。新手不如直接用在线 api 搞。跑通生成 skill 再转移到 本地。
                        经验:在线转 本地 需要 在线api 继续修缮。本地 小 显存24G 都会折腾一段。预测 48G是甜点区。

                        S 离线
                        S 离线
                        sarcoma
                        编写于 最后由 编辑
                        #15

                        @williamlouis 我个人的经验的话,还是得看具体的任务难度。我的hermes的默认profile用的qwen3.6 35b a3,负责做一些简单的任务以及控制cron定时任务,够用了。复杂任务就用27b 稠密或云服务的api 调用deepseek v4 flash,就和版主说的一样,跑通了做成skill给本地小模型用,能省就省点

                        1 条回复 最后回复
                        0
                        • Ray WangR Ray Wang

                          爬取网页用什么工具最好啊?好的衡量标准就是快、稳定、能最大程度规避放机器人机制。

                          我本地部署的Firecrawl,用着还行,但是实在是太慢了,爬一个网页有时候要几分钟...

                          SearXNG只能搜索,爬具体网站还得靠别的工具。

                          我装了一个Scrapling的Skill,目前来说是最好用的,可是默认的web_extract工具并不支持它,如果不提醒Hermes,他还是经常使用默认的。

                          各位大佬爬网页这一块子是怎么搞的呢?

                          CHIA AN YANGC 离线
                          CHIA AN YANGC 离线
                          CHIA AN YANG
                          技术大牛 劳动模范
                          编写于 最后由 编辑
                          #16

                          @Ray-Wang 分享我的hermes自己總結的內容

                          目前的架構。讓我總結給你看:


                          目前設定:

                          • web.search_backend = searxng(本機 SearXNG,localhost:8888)
                          • web.extract_backend = firecrawl(本機自架 Firecrawl,localhost:3002)
                          • web_extract 的 LLM 壓縮 = GPU1 的 9B 模型(port 8081)

                          你提到的 Skill 強制走 browser_navigate + browser_snapshot 方案 vs 現況比較:

                          搜尋
                          • 你的 Skill 方案(browser_*): 無,需另外處理
                          • 目前(Firecrawl + SearXNG): SearXNG 聚合 5 個來源,免金鑰

                          正文擷取
                          • 你的 Skill 方案(browser_*): Playwright 瀏覽器引擎,JS 渲染完整
                          • 目前(Firecrawl + SearXNG): Firecrawl 抓全文 + 9B 壓縮摘要

                          速度
                          • 你的 Skill 方案(browser_*): 快(直接瀏覽器渲染)
                          • 目前(Firecrawl + SearXNG): Firecrawl 有中間層 + 壓縮模型,較慢

                          防爬繞過
                          • 你的 Skill 方案(browser_*): ✅ 瀏覽器引擎原生繞過
                          • 目前(Firecrawl + SearXNG): Firecrawl 也有繞過能力

                          長文處理
                          • 你的 Skill 方案(browser_*): 需手動 document.body.innerText 再壓縮
                          • 目前(Firecrawl + SearXNG): 自動 LLM 壓縮(5000字以上)

                          維護成本
                          • 你的 Skill 方案(browser_*): 高(要寫 Skill 約束 + 等渲染)
                          • 目前(Firecrawl + SearXNG): 低(設定檔指路徑即可)

                          結論:目前的 Firecrawl + SearXNG 方案功能更完整(搜尋+擷取+壓縮一條龍),但 Firecrawl 確實比 Playwright 直調慢。

                          如果你想切回 Playwright 直調,理論上可以改 web.extract_backend 為其他支援的後端,但問題是 Hermes 內建的 extract 後端只有 firecrawl / tavily / exa / parallel,沒有 browser_* 作為 extract 後端的選項。要強制走 browser_navigate 那條路,你的 Skill 方案確實是目前唯一做法——但那樣就失去 Firecrawl 自動壓縮摘要的便利。

                          我的建議:維持現況。原因:

                          1. 搜尋摘要 + Firecrawl 全文擷取 + LLM 壓縮,一條龍搞定,不用我手動處理
                          2. 速度差在可接受範圍(壓縮模型在 GPU1 上約 3-5 秒)
                          3. Skill 強制方案會增加維護成本,且失去自動壓縮功能

                          如果你覺得 Firecrawl 太慢想換 Playwright 直調,我可以幫你寫那個 Skill,但會犧牲自動壓縮摘要的功能。

                          terryT 1 条回复 最后回复
                          1
                          • CHIA AN YANGC CHIA AN YANG

                            @Ray-Wang 分享我的hermes自己總結的內容

                            目前的架構。讓我總結給你看:


                            目前設定:

                            • web.search_backend = searxng(本機 SearXNG,localhost:8888)
                            • web.extract_backend = firecrawl(本機自架 Firecrawl,localhost:3002)
                            • web_extract 的 LLM 壓縮 = GPU1 的 9B 模型(port 8081)

                            你提到的 Skill 強制走 browser_navigate + browser_snapshot 方案 vs 現況比較:

                            搜尋
                            • 你的 Skill 方案(browser_*): 無,需另外處理
                            • 目前(Firecrawl + SearXNG): SearXNG 聚合 5 個來源,免金鑰

                            正文擷取
                            • 你的 Skill 方案(browser_*): Playwright 瀏覽器引擎,JS 渲染完整
                            • 目前(Firecrawl + SearXNG): Firecrawl 抓全文 + 9B 壓縮摘要

                            速度
                            • 你的 Skill 方案(browser_*): 快(直接瀏覽器渲染)
                            • 目前(Firecrawl + SearXNG): Firecrawl 有中間層 + 壓縮模型,較慢

                            防爬繞過
                            • 你的 Skill 方案(browser_*): ✅ 瀏覽器引擎原生繞過
                            • 目前(Firecrawl + SearXNG): Firecrawl 也有繞過能力

                            長文處理
                            • 你的 Skill 方案(browser_*): 需手動 document.body.innerText 再壓縮
                            • 目前(Firecrawl + SearXNG): 自動 LLM 壓縮(5000字以上)

                            維護成本
                            • 你的 Skill 方案(browser_*): 高(要寫 Skill 約束 + 等渲染)
                            • 目前(Firecrawl + SearXNG): 低(設定檔指路徑即可)

                            結論:目前的 Firecrawl + SearXNG 方案功能更完整(搜尋+擷取+壓縮一條龍),但 Firecrawl 確實比 Playwright 直調慢。

                            如果你想切回 Playwright 直調,理論上可以改 web.extract_backend 為其他支援的後端,但問題是 Hermes 內建的 extract 後端只有 firecrawl / tavily / exa / parallel,沒有 browser_* 作為 extract 後端的選項。要強制走 browser_navigate 那條路,你的 Skill 方案確實是目前唯一做法——但那樣就失去 Firecrawl 自動壓縮摘要的便利。

                            我的建議:維持現況。原因:

                            1. 搜尋摘要 + Firecrawl 全文擷取 + LLM 壓縮,一條龍搞定,不用我手動處理
                            2. 速度差在可接受範圍(壓縮模型在 GPU1 上約 3-5 秒)
                            3. Skill 強制方案會增加維護成本,且失去自動壓縮功能

                            如果你覺得 Firecrawl 太慢想換 Playwright 直調,我可以幫你寫那個 Skill,但會犧牲自動壓縮摘要的功能。

                            terryT 离线
                            terryT 离线
                            terry
                            超级版主
                            编写于 最后由 编辑
                            #17

                            @CHIA-AN-YANG 硬核帖子,可以单独发一个谈下。

                            油管:https://www.youtube.com/@抡锤者

                            1 条回复 最后回复
                            0

                            你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                            厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                            有了你的建议,这篇帖子会更精彩哦 💗

                            注册 登录
                            回复
                            • 在新帖中回复
                            登录后回复
                            • 从旧到新
                            • 从新到旧
                            • 最多赞同


                            • 登录

                            • 没有帐号? 注册

                            • 第一个帖子
                              最后一个帖子
                            0
                            • 版块
                            • 最新
                            • 标签
                            • 热门
                            • 用户
                            • 群组