跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 编剧从业部署AI,求助!

编剧从业部署AI,求助!

已定时 已固定 已锁定 已移动 AI硬件
18 帖子 9 发布者 199 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • Bukong LiB 离线
    Bukong LiB 离线
    Bukong Li
    编写于 最后由 编辑
    #1

    编剧从业,想做AI本地部署。目前有m1max 32g。戴尔730xd。想做rag,塞满个人电影资料库。部署AI写电影剧本。求指导。
    想问下,730xd上部署大模型可行吗?需要什么级别的显卡。最低价格,舒适级别?
    实现,能调用本地rag资料库。有长文本记忆。电影剧本一般3万字左右。需要AI提供创作辅助。故事大纲的设计。台词的润色。情节走向推理辅助。
    目前偏重剧本。后期,可能想做视频生成。目前的话730xd能作为主力机器部署本地Ai吗?
    技术小白,求指导!感恩。

    terryT imbiplaza ASUSI 2 条回复 最后回复
    2
    • XiaoteX 离线
      XiaoteX 离线
      Xiaote
      劳动模范
      编写于 最后由 编辑
      #2

      @Bukong Li 欢迎!你的需求很明确,我帮你逐一分析。

      关于你的 Dell 730xd 能否做主力的判断:

      • R730xd 是 12 代酷睿/E5 v2 平台,跑 LLM 推理完全可以用但要加独显
      • 730xd 内部空间够长,能装双宽显卡,但电源和散热需要确认——原装电源通常 750W-1100W,建议确认电源功率是否支持
      • 最大问题:730xd 的 PCIe 插槽够,但老平台对现代 GPU(如 3090/4090)的 UEFI 支持不一定好

      建议方案(按预算排序):

      最低成本方案(~5000元):

      • 在 730xd 上加一张 RTX 3060 12GB 或 P40 24GB
      • 用 llama.cpp 跑 Qwen3.6-14B Q4,上下文 32K
      • RAG 用 privateGPT 或 AnythingLLM,Embedding 模型用 bge-small-zh-v1.5(仅需 0.5GB 显存)
      • 但 14B 模型写 3 万字剧本的创作辅助能力有限

      舒适方案(~15000元):

      • 放弃 730xd 作为主力,新配一台:X99 主板 + E5 2686 v4 + 64GB ECC + 双 RTX 3090 24GB(约 1.2-1.5 万)
      • 跑 Qwen3.6-27B Q4_K_M(单卡 24GB 刚好够)或双卡 TP 32K 上下文
      • RAG 用 AnythingLLM 搭配本地 LLM,Embedding 用 bge-m3
      • LLM 推理用 llama.cpp 或 vLLM(支持 TP=2)
      • 你的 M1 Max 32GB 可以跑 Qwen3.6-14B Q4(MLX 格式),作为日常编写辅助非常够用

      剧本创作的特殊需求:

      • 3 万字长上下文:建议选支持 128K+ 上下文的模型(Qwen3.6-27B 原生 128K,实测可延展到 256K)
      • RAG 电影资料库:Embedding 模型用 bge-m3(多语言),文档切片用 800-1200 token 重叠 200
      • 创作辅助:不是简单问答,建议写 agent.md 或系统提示词来约束 AI 的角色("你是一个资深编剧助理"),效果比裸跑模型好很多

      关于视频生成的远期规划:

      • 视频生成至少需要 16GB+ 显存(LTX2.3 约 8-12GB,WAN2.2 需要 16GB+)
      • 建议现阶段先把剧本 RAG 做好,视频可以之后加一张 RTX 4060 Ti 16GB 或 RTX 3090 专门做

      如果你有大概预算范围,我可以给出更具体的配置单。

      1 条回复 最后回复
      0
      • Tony WangT 离线
        Tony WangT 离线
        Tony Wang
        超级版主
        编写于 最后由 Tony Wang 编辑
        #3

        我个人的理解:

        1, 长篇写作大参数的模型会比较有优势, 也就是说模型的知识面要宽. 最好是70B以上的模型, 或者更大参数的MOE模型. 但这类模型对显存和算力的要求很高.

        2, RAG无法解决你写作的连续性, 只能帮你做某个专题或者话题的分析总结等等. 也就是说能间接帮助, 不能直接用于串联你最终的剧本生成.

        3, 3万字中文大概就是 30K tokens左右, 不算很长, 假设你的所有辅助资料(比如世界观, 背景, 人物, 地点, 关系, 事件....) 也不是很大的话. 本地LLM是完全可以一次性吃下的. 一致性应该可以保持不错.

        所以, 我的建议是,
        1, 如果数据保护不是问题, 优先在线大模型.
        2, 本地模型, 参数规模优先, MOE优先, 比如 Mixtral-8x7B, Qwen 35B 或者 Qwen 72B, llama 70B等
        3, RAG如果只是公开的电影资料库, 自己做的意义不大, 除非有大量私有内容.

        模型对显存的要求, 可以大致按照 模型参数X2/量化比特数 来计算. 以 72B, 4bit量化为例, 大致需要 72*2/4 = 36G 显存, 再加上给上下文的KV cache预留, 至少48G显存起步.

        所以建议本地部署的话, 可以用RTX pro 5000 72G 或 48G, 或者用统一内存的 128G(速度会慢, 但是能跑), 如Mac, NVIDIA的Spark, 或者AMD的 395.

        另外, 我对这个话题非常感兴趣, 希望楼主能够折腾成功, 多分享经验! 👍 👍 👍

        williamlouisW 1 条回复 最后回复
        0
        • Bukong LiB Bukong Li

          编剧从业,想做AI本地部署。目前有m1max 32g。戴尔730xd。想做rag,塞满个人电影资料库。部署AI写电影剧本。求指导。
          想问下,730xd上部署大模型可行吗?需要什么级别的显卡。最低价格,舒适级别?
          实现,能调用本地rag资料库。有长文本记忆。电影剧本一般3万字左右。需要AI提供创作辅助。故事大纲的设计。台词的润色。情节走向推理辅助。
          目前偏重剧本。后期,可能想做视频生成。目前的话730xd能作为主力机器部署本地Ai吗?
          技术小白,求指导!感恩。

          terryT 在线
          terryT 在线
          terry
          超级版主
          编写于 最后由 编辑
          #4

          @Bukong-Li 你不需要RAG,编剧,写剧本属于通用模型智能的一部分,你可以尝试使用Deepseek V4 Pro + Hermes,我视频里有谈到过如何写作,创作小说,对Agent不懂的话可以用Gemini的Gem功能。

          油管:https://www.youtube.com/@抡锤者

          Bukong LiB 2 条回复 最后回复
          0
          • M 在线
            M 在线
            mark
            超凡大师
            编写于 最后由 编辑
            #5

            先不要 花重金 砸硬件, 十几万砸进去,还不知道效果如何.
            先 用用 deepseek 这种在线api , 看看 自己是不是那块料.

            1 条回复 最后回复
            0
            • kop wangK 在线
              kop wangK 在线
              kop wang
              超级版主
              编写于 最后由 编辑
              #6

              这个需求必须要走本地自部署吗?
              可以先脱敏然后用云API摸索一下工作流程,然后再决定是否下手比较合适。

              虚心交流,一起进步

              1 条回复 最后回复
              0
              • terryT terry

                @Bukong-Li 你不需要RAG,编剧,写剧本属于通用模型智能的一部分,你可以尝试使用Deepseek V4 Pro + Hermes,我视频里有谈到过如何写作,创作小说,对Agent不懂的话可以用Gemini的Gem功能。

                Bukong LiB 离线
                Bukong LiB 离线
                Bukong Li
                编写于 最后由 编辑
                #7

                @terry 剧本写作需要多轮复杂对话,可能涉及几十万字的长文本记忆。线上模型我试过Gemini,claud,gpt。免费版对话几句就没token了。付费版我没试,但是感觉也不会够用吧。
                另外,想做rag是想沉淀自己的写作风格,让ai能从自己放进rag的资料进行有控制的生成。rag不只是剧本,可能有小说,编剧工具书等。可能放进去几千部电影剧本,不同题材会分类。人物性格,人物关系等。所以做rag没必要吗?
                730xd对3090,4090具体哪里支持不够呢?我是
                想先给730配个显卡,做文字剧本生成。后期生视频在升级整体硬件。不知道行不行。还是说直接升级硬件?

                Tony WangT 1 条回复 最后回复
                0
                • Bukong LiB 离线
                  Bukong LiB 离线
                  Bukong Li
                  编写于 最后由 编辑
                  #8

                  还有我自己的个人笔记。创作灵感等文字内容。想放进rag。

                  kop wangK 1 条回复 最后回复
                  0
                  • Bukong LiB Bukong Li

                    还有我自己的个人笔记。创作灵感等文字内容。想放进rag。

                    kop wangK 在线
                    kop wangK 在线
                    kop wang
                    超级版主
                    编写于 最后由 kop wang 编辑
                    #9

                    @Bukong-Li 如果你需要同时处理的上下文是模型上下文能够存下的。比如qwen3.6-27B是256k token,deepseek-v4-flash是1M token,那么就不要引入向量数据。

                    向量数据会严重导致数据的失真和误差。

                    我目前接触到使用向量数据的,基本都是因为数据量极大,相当于是靠rag进行了数据预洗。

                    同时,这里面还有个逻辑问题。你的推理会同时用到你所有历史文本的全文吗?其实不会。所以更多的应该是关键字搜索和索引,也就是类似grap的概念。来给模型更精准的提供上下文。

                    虚心交流,一起进步

                    1 条回复 最后回复
                    0
                    • Bukong LiB 离线
                      Bukong LiB 离线
                      Bukong Li
                      编写于 最后由 编辑
                      #10

                      或者有必要买m2ultra128g吗?

                      1 条回复 最后回复
                      0
                      • kop wangK 在线
                        kop wangK 在线
                        kop wang
                        超级版主
                        编写于 最后由 kop wang 编辑
                        #11

                        而且对于文字工作者而言,你的历史数据是“静态数据”,也就是不会更新的。哈姆雷特、出师表一千年后还是那些文字。他们的统计学特征是永远不变的。

                        所以使用向量数据的逻辑每次推理都重新浓缩是一个非常不科学,不合理的事儿。

                        关键词索引你可以理解为是图书管理员,你提需求,他帮你找书。你拿到的是书的原文。
                        RAG你可以理解为评书演员。他每次表演都有随机性,他是利用他对于历史文档架构的理解,每次进行随性的演绎。

                        他们之间的精度是有巨大鸿沟的。

                        虚心交流,一起进步

                        1 条回复 最后回复
                        0
                        • terryT 在线
                          terryT 在线
                          terry
                          超级版主
                          编写于 最后由 编辑
                          #12

                          如果你想简单,就是订阅谷歌gemini,使用pro,搭配Gem,20美金的额度够你写了,认真去看我的视频。如果你想要自己本地完全掌控,效果最好,那就是Deepseek V4 Pro,没有比它写作更牛的,它写小说也不需要联网。构建一个本地目录,复制你的参考小说作为文风,2000字足够,然后写好大纲。

                          油管:https://www.youtube.com/@抡锤者

                          1 条回复 最后回复
                          0
                          • kos orK 离线
                            kos orK 离线
                            kos or
                            劳动模范 德高望重
                            编写于 最后由 编辑
                            #13

                            各個產業都導入AI化了
                            之前聽過醫院的X光片用AI辨識, 專業照片修圖公司, 律師業...現在編劇也加入了
                            落地應用不少

                            1 条回复 最后回复
                            0
                            • Tony WangT Tony Wang

                              我个人的理解:

                              1, 长篇写作大参数的模型会比较有优势, 也就是说模型的知识面要宽. 最好是70B以上的模型, 或者更大参数的MOE模型. 但这类模型对显存和算力的要求很高.

                              2, RAG无法解决你写作的连续性, 只能帮你做某个专题或者话题的分析总结等等. 也就是说能间接帮助, 不能直接用于串联你最终的剧本生成.

                              3, 3万字中文大概就是 30K tokens左右, 不算很长, 假设你的所有辅助资料(比如世界观, 背景, 人物, 地点, 关系, 事件....) 也不是很大的话. 本地LLM是完全可以一次性吃下的. 一致性应该可以保持不错.

                              所以, 我的建议是,
                              1, 如果数据保护不是问题, 优先在线大模型.
                              2, 本地模型, 参数规模优先, MOE优先, 比如 Mixtral-8x7B, Qwen 35B 或者 Qwen 72B, llama 70B等
                              3, RAG如果只是公开的电影资料库, 自己做的意义不大, 除非有大量私有内容.

                              模型对显存的要求, 可以大致按照 模型参数X2/量化比特数 来计算. 以 72B, 4bit量化为例, 大致需要 72*2/4 = 36G 显存, 再加上给上下文的KV cache预留, 至少48G显存起步.

                              所以建议本地部署的话, 可以用RTX pro 5000 72G 或 48G, 或者用统一内存的 128G(速度会慢, 但是能跑), 如Mac, NVIDIA的Spark, 或者AMD的 395.

                              另外, 我对这个话题非常感兴趣, 希望楼主能够折腾成功, 多分享经验! 👍 👍 👍

                              williamlouisW 离线
                              williamlouisW 离线
                              williamlouis
                              超级版主
                              编写于 最后由 编辑
                              #14

                              @Tony-Wang 补充 pro 6000 Max- Q 96G现在的价格也在接受范围。还没破10W 就能拿到。

                              个人主页:xlkj.org Telegram https://t.me/xlkjorg

                              1 条回复 最后回复
                              1
                              • williamlouisW 离线
                                williamlouisW 离线
                                williamlouis
                                超级版主
                                编写于 最后由 编辑
                                #15

                                而且 噪音控制要优于 服务器和工作站版本。实体讲就是很好。能做到普通人可接受范围内。测试视频我看了测了分贝。52的峰值。嫌声音大直接功耗墙控制一下就可以了。

                                个人主页:xlkj.org Telegram https://t.me/xlkjorg

                                1 条回复 最后回复
                                0
                                • terryT terry

                                  @Bukong-Li 你不需要RAG,编剧,写剧本属于通用模型智能的一部分,你可以尝试使用Deepseek V4 Pro + Hermes,我视频里有谈到过如何写作,创作小说,对Agent不懂的话可以用Gemini的Gem功能。

                                  Bukong LiB 离线
                                  Bukong LiB 离线
                                  Bukong Li
                                  编写于 最后由 编辑
                                  #16

                                  @terry 说:

                                  @Bukong-Li 你不需要RAG,编剧,写剧本属于通用模型智能的一部分,你可以尝试使用Deepseek V4 Pro + Hermes,我视频里有谈到过如何写作,创作小说,对Agent不懂的话可以用Gemini的Gem功能。

                                  好的,我先用这个流程在 M1 MAX试下。感谢各位大神

                                  1 条回复 最后回复
                                  0
                                  • Bukong LiB Bukong Li

                                    编剧从业,想做AI本地部署。目前有m1max 32g。戴尔730xd。想做rag,塞满个人电影资料库。部署AI写电影剧本。求指导。
                                    想问下,730xd上部署大模型可行吗?需要什么级别的显卡。最低价格,舒适级别?
                                    实现,能调用本地rag资料库。有长文本记忆。电影剧本一般3万字左右。需要AI提供创作辅助。故事大纲的设计。台词的润色。情节走向推理辅助。
                                    目前偏重剧本。后期,可能想做视频生成。目前的话730xd能作为主力机器部署本地Ai吗?
                                    技术小白,求指导!感恩。

                                    imbiplaza ASUSI 离线
                                    imbiplaza ASUSI 离线
                                    imbiplaza ASUS
                                    技术大牛 劳动模范
                                    编写于 最后由 编辑
                                    #17

                                    @Bukong-Li

                                    试一试:
                                    gemma-4-31B-Mystery-Fine-Tune-HERETIC-UNCENSORED-INSTRUCT-Q4_K_S 写作模型

                                    0e66b348-8b12-4044-a386-dde74b34208e-image.jpeg

                                    1 条回复 最后回复
                                    0
                                    • Bukong LiB Bukong Li

                                      @terry 剧本写作需要多轮复杂对话,可能涉及几十万字的长文本记忆。线上模型我试过Gemini,claud,gpt。免费版对话几句就没token了。付费版我没试,但是感觉也不会够用吧。
                                      另外,想做rag是想沉淀自己的写作风格,让ai能从自己放进rag的资料进行有控制的生成。rag不只是剧本,可能有小说,编剧工具书等。可能放进去几千部电影剧本,不同题材会分类。人物性格,人物关系等。所以做rag没必要吗?
                                      730xd对3090,4090具体哪里支持不够呢?我是
                                      想先给730配个显卡,做文字剧本生成。后期生视频在升级整体硬件。不知道行不行。还是说直接升级硬件?

                                      Tony WangT 离线
                                      Tony WangT 离线
                                      Tony Wang
                                      超级版主
                                      编写于 最后由 Tony Wang 编辑
                                      #18

                                      @Bukong-Li 说:

                                      @terry 剧本写作需要多轮复杂对话,可能涉及几十万字的长文本记忆。线上模型我试过Gemini,claud,gpt。免费版对话几句就没token了。付费版我没试,但是感觉也不会够用吧。
                                      另外,想做rag是想沉淀自己的写作风格,让ai能从自己放进rag的资料进行有控制的生成。rag不只是剧本,可能有小说,编剧工具书等。可能放进去几千部电影剧本,不同题材会分类。人物性格,人物关系等。所以做rag没必要吗?
                                      730xd对3090,4090具体哪里支持不够呢?我是
                                      想先给730配个显卡,做文字剧本生成。后期生视频在升级整体硬件。不知道行不行。还是说直接升级硬件?

                                      1, 公开的知识没有太大必要放在RAG里, 在线大模型只要参数够多, 他们基本都能覆盖. 你自己的笔记, 灵感等放在RAG里有意义.

                                      2, RAG每次只能召回相关的一部分内容, 适合你搜索分析总结等, 对你的创作肯定有帮助, 但它没法帮你保持你整个剧本的长期记忆.

                                      3, 如果想沉淀自己的写作风格, 可以用自己的文本去训练一个LORA. 这个是 @terry 教我的, 文本LORA我没训练过, 我只训练过视觉的LORA.

                                      4, 多轮对话和上下文的控制, 可能需要一些技巧. 比如你不要通过一次性的多轮对话来生成全部内容. 而是通过设置好整个背景设定+已经写出的所有内容, 来生成一段新的内容, 这段内容稍微短一些, 比如一章, 比如 4096个token. 然后针对这段内容进行多轮对话修改. 满意之后再开始新对话进行下一轮, 新对话还要包括全部背景设定和已经生成的内容, 这样它不会忘记.
                                      ---- 这一段是我的想象, 我没有做过长篇内容的生成, 不过我觉得是有优化空间的.因为你的剧本预计全部只有3万字, 每次全部内容加载, 再加上一段4096 tokens 的多轮滚动, 256k上下文我觉得应该是够用的.

                                      5, 没有隐私内容的话, 还是建议购买在线大模型试一下, 在线大模型很多都支持1M以上的上下文.

                                      1 条回复 最后回复
                                      1

                                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                      有了你的建议,这篇帖子会更精彩哦 💗

                                      注册 登录
                                      回复
                                      • 在新帖中回复
                                      登录后回复
                                      • 从旧到新
                                      • 从新到旧
                                      • 最多赞同


                                      • 登录

                                      • 没有帐号? 注册

                                      • 第一个帖子
                                        最后一个帖子
                                      0
                                      • 版块
                                      • 最新
                                      • 标签
                                      • 热门
                                      • 用户
                                      • 群组