@Bukong-Li 说:
@terry 剧本写作需要多轮复杂对话,可能涉及几十万字的长文本记忆。线上模型我试过Gemini,claud,gpt。免费版对话几句就没token了。付费版我没试,但是感觉也不会够用吧。
另外,想做rag是想沉淀自己的写作风格,让ai能从自己放进rag的资料进行有控制的生成。rag不只是剧本,可能有小说,编剧工具书等。可能放进去几千部电影剧本,不同题材会分类。人物性格,人物关系等。所以做rag没必要吗?
730xd对3090,4090具体哪里支持不够呢?我是
想先给730配个显卡,做文字剧本生成。后期生视频在升级整体硬件。不知道行不行。还是说直接升级硬件?
1, 公开的知识没有太大必要放在RAG里, 在线大模型只要参数够多, 他们基本都能覆盖. 你自己的笔记, 灵感等放在RAG里有意义.
2, RAG每次只能召回相关的一部分内容, 适合你搜索分析总结等, 对你的创作肯定有帮助, 但它没法帮你保持你整个剧本的长期记忆.
3, 如果想沉淀自己的写作风格, 可以用自己的文本去训练一个LORA. 这个是 @terry 教我的, 文本LORA我没训练过, 我只训练过视觉的LORA.
4, 多轮对话和上下文的控制, 可能需要一些技巧. 比如你不要通过一次性的多轮对话来生成全部内容. 而是通过设置好整个背景设定+已经写出的所有内容, 来生成一段新的内容, 这段内容稍微短一些, 比如一章, 比如 4096个token. 然后针对这段内容进行多轮对话修改. 满意之后再开始新对话进行下一轮, 新对话还要包括全部背景设定和已经生成的内容, 这样它不会忘记.
---- 这一段是我的想象, 我没有做过长篇内容的生成, 不过我觉得是有优化空间的.因为你的剧本预计全部只有3万字, 每次全部内容加载, 再加上一段4096 tokens 的多轮滚动, 256k上下文我觉得应该是够用的.
5, 没有隐私内容的话, 还是建议购买在线大模型试一下, 在线大模型很多都支持1M以上的上下文.