编剧从业部署AI，求助！

Bukong Li

@terry 剧本写作需要多轮复杂对话，可能涉及几十万字的长文本记忆。线上模型我试过Gemini，claud，gpt。免费版对话几句就没token了。付费版我没试，但是感觉也不会够用吧。
另外，想做rag是想沉淀自己的写作风格，让ai能从自己放进rag的资料进行有控制的生成。rag不只是剧本，可能有小说，编剧工具书等。可能放进去几千部电影剧本，不同题材会分类。人物性格，人物关系等。所以做rag没必要吗？
730xd对3090，4090具体哪里支持不够呢？我是
想先给730配个显卡，做文字剧本生成。后期生视频在升级整体硬件。不知道行不行。还是说直接升级硬件？

Bukong Li

还有我自己的个人笔记。创作灵感等文字内容。想放进rag。

kop wang

@Bukong-Li 如果你需要同时处理的上下文是模型上下文能够存下的。比如qwen3.6-27B是256k token，deepseek-v4-flash是1M token，那么就不要引入向量数据。

向量数据会严重导致数据的失真和误差。

我目前接触到使用向量数据的，基本都是因为数据量极大，相当于是靠rag进行了数据预洗。

同时，这里面还有个逻辑问题。你的推理会同时用到你所有历史文本的全文吗？其实不会。所以更多的应该是关键字搜索和索引，也就是类似grap的概念。来给模型更精准的提供上下文。

Bukong Li

或者有必要买m2ultra128g吗？

kop wang

而且对于文字工作者而言，你的历史数据是“静态数据”，也就是不会更新的。哈姆雷特、出师表一千年后还是那些文字。他们的统计学特征是永远不变的。

所以使用向量数据的逻辑每次推理都重新浓缩是一个非常不科学，不合理的事儿。

关键词索引你可以理解为是图书管理员，你提需求，他帮你找书。你拿到的是书的原文。
RAG你可以理解为评书演员。他每次表演都有随机性，他是利用他对于历史文档架构的理解，每次进行随性的演绎。

他们之间的精度是有巨大鸿沟的。

terry

如果你想简单，就是订阅谷歌gemini，使用pro，搭配Gem，20美金的额度够你写了，认真去看我的视频。如果你想要自己本地完全掌控，效果最好，那就是Deepseek V4 Pro，没有比它写作更牛的，它写小说也不需要联网。构建一个本地目录，复制你的参考小说作为文风，2000字足够，然后写好大纲。

kos or

各個產業都導入AI化了
之前聽過醫院的X光片用AI辨識, 專業照片修圖公司, 律師業...現在編劇也加入了
落地應用不少

williamlouis

@Tony-Wang 补充 pro 6000 Max- Q 96G现在的价格也在接受范围。还没破10W 就能拿到。

williamlouis

而且噪音控制要优于服务器和工作站版本。实体讲就是很好。能做到普通人可接受范围内。测试视频我看了测了分贝。52的峰值。嫌声音大直接功耗墙控制一下就可以了。

Bukong Li

@terry 说:

@Bukong-Li 你不需要RAG，编剧，写剧本属于通用模型智能的一部分，你可以尝试使用Deepseek V4 Pro + Hermes，我视频里有谈到过如何写作，创作小说，对Agent不懂的话可以用Gemini的Gem功能。

好的，我先用这个流程在 M1 MAX试下。感谢各位大神

imbiplaza ASUS

@Bukong-Li

试一试：
gemma-4-31B-Mystery-Fine-Tune-HERETIC-UNCENSORED-INSTRUCT-Q4_K_S 写作模型

Tony Wang

@Bukong-Li 说:

@terry 剧本写作需要多轮复杂对话，可能涉及几十万字的长文本记忆。线上模型我试过Gemini，claud，gpt。免费版对话几句就没token了。付费版我没试，但是感觉也不会够用吧。
另外，想做rag是想沉淀自己的写作风格，让ai能从自己放进rag的资料进行有控制的生成。rag不只是剧本，可能有小说，编剧工具书等。可能放进去几千部电影剧本，不同题材会分类。人物性格，人物关系等。所以做rag没必要吗？
730xd对3090，4090具体哪里支持不够呢？我是
想先给730配个显卡，做文字剧本生成。后期生视频在升级整体硬件。不知道行不行。还是说直接升级硬件？

1, 公开的知识没有太大必要放在RAG里, 在线大模型只要参数够多, 他们基本都能覆盖. 你自己的笔记, 灵感等放在RAG里有意义.

2, RAG每次只能召回相关的一部分内容, 适合你搜索分析总结等, 对你的创作肯定有帮助, 但它没法帮你保持你整个剧本的长期记忆.

3, 如果想沉淀自己的写作风格, 可以用自己的文本去训练一个LORA. 这个是 @terry 教我的, 文本LORA我没训练过, 我只训练过视觉的LORA.

4, 多轮对话和上下文的控制, 可能需要一些技巧. 比如你不要通过一次性的多轮对话来生成全部内容. 而是通过设置好整个背景设定+已经写出的所有内容, 来生成一段新的内容, 这段内容稍微短一些, 比如一章, 比如 4096个token. 然后针对这段内容进行多轮对话修改. 满意之后再开始新对话进行下一轮, 新对话还要包括全部背景设定和已经生成的内容, 这样它不会忘记.
---- 这一段是我的想象, 我没有做过长篇内容的生成, 不过我觉得是有优化空间的.因为你的剧本预计全部只有3万字, 每次全部内容加载, 再加上一段4096 tokens 的多轮滚动, 256k上下文我觉得应该是够用的.

5, 没有隐私内容的话, 还是建议购买在线大模型试一下, 在线大模型很多都支持1M以上的上下文.

抡锤者

编剧从业部署AI，求助！