跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. LLM讨论区
  3. 凌晨三点起床,忙乎一天,本地知识库RAG的 chunk+embedding弄完了.

凌晨三点起床,忙乎一天,本地知识库RAG的 chunk+embedding弄完了.

已定时 已固定 已锁定 已移动 LLM讨论区
5 帖子 3 发布者 158 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • M 离线
    M 离线
    mark
    超凡大师
    编写于 最后由 mark 编辑
    #1

    凌晨三点醒了,想想了,前两天发了一个 chunk+embedding的 技术栈,是垃圾.

    做梦都在想,是不是rag的技术栈选错了, 怎么也睡不着了.

    自己放的狠话,自己拉的粑粑,自己含泪也要吃下去.

    https://lcz.me/topic/707/基于rag-wiki-理论-我做了一套本地知识库-用于客服机器人./15#gsc.tab=0

    每一个资深程序员,天生就是偏执狂. 我就是吃技术这碗饭的.

    从零开始做起,之前没接触过chunk+embedding .

    最终embedding 选了: text-embedding-qwen3-embedding-0.6b
    向量数据库: lancedb 0.33.0

    主要是中文支持好.

    放几个截图, 睡觉去了.

    PS:
    我真的觉得, 向量工程师, 你们天天上班再做什么, 我一周都做两个模式, 你们真是再公司骗钱的.

    而且从零架构,到完工, 也就一周.

    剩下的工作 ,基本就是调优, 和优化参数.

    一个向量工程师, 在一线城市, 大概30k-50k 月薪. 在我看来,半个月完事, 剩下就是维护.

    我做一个OPC,这种一人公司, 对外1家公司本地知识库 收费10k, 根本花不了半个月时间.

    我的个人战斗力,自测再 1:20, 正常如果战斗力拉满 ,一天干20小时, 基本1:50人的战斗力.

    截图:

    8575a32e-ff9e-41c7-8dc6-539293a88af2-image.jpeg

    49e798c2-15a2-4fba-a4bf-befd70594e9e-image.jpeg

    56cad466-591e-415e-911c-b34b481cd5e0-image.jpeg

    cecff849-baf2-4091-8438-f8ee94be2b32-image.jpeg

    向量数据库 lancedb

    d5e4b7b2-d0c2-4934-986e-9421f7dabff9-image.jpeg

    1 条回复 最后回复
    1
    • Tony WangT 离线
      Tony WangT 离线
      Tony Wang
      超级版主
      编写于 最后由 编辑
      #2

      劳动模范...

      期待你之后的对比.

      BGE对中文支持也不错的

      1 条回复 最后回复
      1
      • M 离线
        M 离线
        mark
        超凡大师
        编写于 最后由 mark 编辑
        #3

        已经对比完了, 只是 没帖. 还是 index+search的效果好. 目前我的样本是这样的.
        备注 seeker 是 index +search路线, rag 是 chunk+ embedding路线

        以下是 AI总结的:

        f08f9690-5732-4f0e-ab40-a4faebac4699-image.jpeg

        1 条回复 最后回复
        1
        • ,M mark 引用了 此主题
        • M 离线
          M 离线
          mark
          超凡大师
          编写于 最后由 编辑
          #4

          这是 chunk 分块的参数 : 按照 800, 重复120, 每个chunk 是680字符.

          embed:
          enabled: true
          provider: "lm-studio-local"
          model: "text-embedding-qwen3-embedding-0.6b"
          batch_size: 16
          write_back_to_mongodb: false
          chunk_size: 800
          chunk_overlap: 120

          1 条回复 最后回复
          1
          • williamlouisW 在线
            williamlouisW 在线
            williamlouis
            超级版主
            编写于 最后由 编辑
            #5

            默默的留个小脚印。能看懂。看懂是完全超出我的知识面。

            个人主页:xlkj.org Telegram https://t.me/xlkjorg

            1 条回复 最后回复
            0
            • ,terryT terry 固定了此主题
            • ,系统 取消固定了此主题

            你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

            厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

            有了你的建议,这篇帖子会更精彩哦 💗

            注册 登录
            回复
            • 在新帖中回复
            登录后回复
            • 从旧到新
            • 从新到旧
            • 最多赞同


            • 登录

            • 没有帐号? 注册

            • 第一个帖子
              最后一个帖子
            0
            • 版块
            • 最新
            • 标签
            • 热门
            • 用户
            • 群组