跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 终于体会到本地干活儿的爽了

终于体会到本地干活儿的爽了

已定时 已固定 已锁定 已移动 AI Agent
15 帖子 9 发布者 221 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • J 离线
    J 离线
    johnnybegood
    编写于 最后由 johnnybegood 编辑
    #2

    另外补充说一下, 这个混元模型, 可以搜搜看一下介绍, 就是专门用来翻译的模型, 可能干别的活儿不行, 但是翻译这一项应该是遥遥领先, 比qwen deepseek等都要强的, 7B已经完全够用, 其实1.8B就够用了, 我感觉98%的内容都跟人翻译差不多了, 只有一些很小的细节没有那么完美, 调教一下应该就好了。翻译一本书, Deepseek的成本是, 4分钱。 本地模型的成本是, 电费:如果是600W, 7分钟一本, 那就是大概 0.06度一本, 一度5毛钱, 那就是 0.06x50=3分钱。 最后翻译一本书就是 7分钱 。

    摘抄:Hy-MT2 是一系列"快速思考"多语言翻译模型,专为复杂的现实场景设计。它包含三种模型规模:1.8B、7B 和 30B-A3B(MoE),所有模型都支持 33 种语言之间的翻译,并能有效遵循多语言翻译指令。对于设备端部署,AngelSlim 1.25 位极端量化将 1.8B 模型的存储需求减少至仅 440 MB,并将推理速度提升 1.5 倍。多维度评估显示,Hy-MT2 在通用、现实商业、领域特定和指令遵循翻译任务中均表现出色。7B 和 30B-A3B 模型在快速思考模式下优于 DeepSeek-V4-Pro 和 Kimi K2.6 等开源模型,而轻量级的 1.8B 模型总体上也超过了微软、豆包等提供商的主流商业 API。

    L 1 条回复 最后回复
    2
    • P 离线
      P 离线
      patrickh0h0
      编写于 最后由 编辑
      #3

      利害大神,請問一下硬件配置,及操作系統。

      J 1 条回复 最后回复
      0
      • P patrickh0h0

        利害大神,請問一下硬件配置,及操作系統。

        J 离线
        J 离线
        johnnybegood
        编写于 最后由 编辑
        #4

        @patrickh0h0 可别叫什么大神,这就是正常用而已。 具体配置看 https://lcz.me/topic/273/经验分享-求助-双卡-3090-3070-混插-windows-vs-ubuntu-跑-qwen-ltx-video-性能实测/13

        1 条回复 最后回复
        0
        • kop wangK 离线
          kop wangK 离线
          kop wang
          编写于 最后由 编辑
          #5

          不错的实战分享。

          其实本地LLM来跑大模型驱动Agent,并不是性价比非常高的玩法。
          反而是大模型API驱动Agent + 本地音视图,以及像楼主这样的本地专业领域小模型,效率又高,完成度又好。对于本地的硬件还没有过高的负担。

          这样既发挥了线上大模型API的智力,又实打实的降低了专业生成的成本。

          虚心交流,一起进步

          J 1 条回复 最后回复
          0
          • kop wangK kop wang

            不错的实战分享。

            其实本地LLM来跑大模型驱动Agent,并不是性价比非常高的玩法。
            反而是大模型API驱动Agent + 本地音视图,以及像楼主这样的本地专业领域小模型,效率又高,完成度又好。对于本地的硬件还没有过高的负担。

            这样既发挥了线上大模型API的智力,又实打实的降低了专业生成的成本。

            J 离线
            J 离线
            johnnybegood
            编写于 最后由 编辑
            #6

            @kop-wang 其实这个很好理解, 当年我的初创公司弄集成电路设计, 需要做前端和后端, 前端大家都比较熟, 后端不太会弄, 问了老美的公司,如果派专家给我们做后端, 一个team过来干1个月那就是天价, 后来我们租了一个专家, 一天才 2000美元, 指导公司的一群小弟做后端, 最后我们芯片还是做出来了。 现在可以看成这个专家就是 opus , gpt 或者 deepseek pro , 干活的小弟就是本地模型咯, 所以N年前我就有这个概念了哈哈。

            B 1 条回复 最后回复
            0
            • J johnnybegood

              @kop-wang 其实这个很好理解, 当年我的初创公司弄集成电路设计, 需要做前端和后端, 前端大家都比较熟, 后端不太会弄, 问了老美的公司,如果派专家给我们做后端, 一个team过来干1个月那就是天价, 后来我们租了一个专家, 一天才 2000美元, 指导公司的一群小弟做后端, 最后我们芯片还是做出来了。 现在可以看成这个专家就是 opus , gpt 或者 deepseek pro , 干活的小弟就是本地模型咯, 所以N年前我就有这个概念了哈哈。

              B 离线
              B 离线
              blackjack
              编写于 最后由 编辑
              #7

              @johnnybegood 说:

              @kop-wang 其实这个很好理解, 当年我的初创公司弄集成电路设计, 需要做前端和后端, 前端大家都比较熟, 后端不太会弄, 问了老美的公司,如果派专家给我们做后端, 一个team过来干1个月那就是天价, 后来我们租了一个专家, 一天才 2000美元, 指导公司的一群小弟做后端, 最后我们芯片还是做出来了。 现在可以看成这个专家就是 opus , gpt 或者 deepseek pro , 干活的小弟就是本地模型咯, 所以N年前我就有这个概念了哈哈。

              大哥,你这是设计芯片的前端和后端,千万别让人误会成互联网的前端后端。完全天上地下的差别,拜一个先。现在不做了吗?

              J 1 条回复 最后回复
              0
              • terryT terry 固定了该主题
              • V 离线
                V 离线
                vosrock
                编写于 最后由 编辑
                #8

                格式可以完整保留吗?这个很重要啊,其实收费的那些,图文混排做得也不是很好

                J 1 条回复 最后回复
                0
                • XiaoteX 离线
                  XiaoteX 离线
                  Xiaote
                  编写于 最后由 编辑
                  #9

                  @vosrock 关于格式保留的问题,实测说一下:

                  纯文本+图片的 PDF,混元翻译+本地工具链基本上能保留原文的章节标题、段落结构和图片位置。但如果原 PDF 有复杂排版(多栏、表格、脚注、文本框),格式会有一定丢失。

                  几个实测可行的方案:

                  1. 先用工具把 PDF 转成 Markdown(比如 Marker、MinerU、Mathpix),然后把 Markdown 分章节喂给混元翻译。转出来的 md 格式基本能保留标题层级和图片引用。
                  2. 翻译完再用 Pandoc 转 ePUB。Pandoc 对 Markdown→ePUB 的转换很成熟,图文混排能做得很接近原版。
                  3. 如果对格式要求极致(比如学术论文的双栏+公式),建议直接保留 PDF 版,用 OCR 提取文字翻译后叠加回去,但这就比较接近出版级流水线了。

                  johnnybegood 说的 98% 内容跟人翻译差不多——这个准确率对于 100 本书的量来说,已经非常实用了。少量细节手动调一下格式,比全部手动翻译或者用在线付费服务划算太多了。

                  1 条回复 最后回复
                  0
                  • V vosrock

                    格式可以完整保留吗?这个很重要啊,其实收费的那些,图文混排做得也不是很好

                    J 离线
                    J 离线
                    johnnybegood
                    编写于 最后由 编辑
                    #10

                    @vosrock 可以的, 但就是字体变了, 应该好改

                    Tony WangT 1 条回复 最后回复
                    0
                    • J johnnybegood

                      @vosrock 可以的, 但就是字体变了, 应该好改

                      Tony WangT 离线
                      Tony WangT 离线
                      Tony Wang
                      编写于 最后由 编辑
                      #11

                      @johnnybegood

                      非常好, 这种解决实际问题的帖子, 也能给大家启发思路. 👍

                      1 条回复 最后回复
                      0
                      • B blackjack

                        @johnnybegood 说:

                        @kop-wang 其实这个很好理解, 当年我的初创公司弄集成电路设计, 需要做前端和后端, 前端大家都比较熟, 后端不太会弄, 问了老美的公司,如果派专家给我们做后端, 一个team过来干1个月那就是天价, 后来我们租了一个专家, 一天才 2000美元, 指导公司的一群小弟做后端, 最后我们芯片还是做出来了。 现在可以看成这个专家就是 opus , gpt 或者 deepseek pro , 干活的小弟就是本地模型咯, 所以N年前我就有这个概念了哈哈。

                        大哥,你这是设计芯片的前端和后端,千万别让人误会成互联网的前端后端。完全天上地下的差别,拜一个先。现在不做了吗?

                        J 离线
                        J 离线
                        johnnybegood
                        编写于 最后由 编辑
                        #12

                        @blackjack 对, 是芯片的前端后端, 工作量巨大。 后来做到 14纳米出了几个芯片就差不多了, 再往9nm去实在做不动了。

                        1 条回复 最后回复
                        0
                        • M 离线
                          M 离线
                          Miraco
                          编写于 最后由 编辑
                          #13

                          能翻译图片保持排版和格式不变吗?

                          J 1 条回复 最后回复
                          0
                          • M Miraco

                            能翻译图片保持排版和格式不变吗?

                            J 离线
                            J 离线
                            johnnybegood
                            编写于 最后由 编辑
                            #14

                            @Miraco 可以保持排版和格式不变, 文字和图片之前是什么关系, 现在也是什么关系。 但是你说的翻译图片是什么? 指的是图片上的字么? 那个我没试, 我感觉可以弄, 但是要单独做一个图片翻译流程。

                            1 条回复 最后回复
                            0
                            • J johnnybegood

                              另外补充说一下, 这个混元模型, 可以搜搜看一下介绍, 就是专门用来翻译的模型, 可能干别的活儿不行, 但是翻译这一项应该是遥遥领先, 比qwen deepseek等都要强的, 7B已经完全够用, 其实1.8B就够用了, 我感觉98%的内容都跟人翻译差不多了, 只有一些很小的细节没有那么完美, 调教一下应该就好了。翻译一本书, Deepseek的成本是, 4分钱。 本地模型的成本是, 电费:如果是600W, 7分钟一本, 那就是大概 0.06度一本, 一度5毛钱, 那就是 0.06x50=3分钱。 最后翻译一本书就是 7分钱 。

                              摘抄:Hy-MT2 是一系列"快速思考"多语言翻译模型,专为复杂的现实场景设计。它包含三种模型规模:1.8B、7B 和 30B-A3B(MoE),所有模型都支持 33 种语言之间的翻译,并能有效遵循多语言翻译指令。对于设备端部署,AngelSlim 1.25 位极端量化将 1.8B 模型的存储需求减少至仅 440 MB,并将推理速度提升 1.5 倍。多维度评估显示,Hy-MT2 在通用、现实商业、领域特定和指令遵循翻译任务中均表现出色。7B 和 30B-A3B 模型在快速思考模式下优于 DeepSeek-V4-Pro 和 Kimi K2.6 等开源模型,而轻量级的 1.8B 模型总体上也超过了微软、豆包等提供商的主流商业 API。

                              L 离线
                              L 离线
                              laobenxiong
                              编写于 最后由 编辑
                              #15

                              @johnnybegood 赞美...感觉这一套流程可以弄个 skill 分享了.

                              1 条回复 最后回复
                              0
                              • 系统 取消固定了该主题

                              你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                              厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                              有了你的建议,这篇帖子会更精彩哦 💗

                              注册 登录
                              回复
                              • 在新帖中回复
                              登录后回复
                              • 从旧到新
                              • 从新到旧
                              • 最多赞同


                              • 登录

                              • 没有帐号? 注册

                              • 登录或注册以进行搜索。
                              • 第一个帖子
                                最后一个帖子
                              0
                              • 版块
                              • 最新
                              • 标签
                              • 热门
                              • 用户
                              • 群组