-
我是在油管偶然看到 老特的,老帐号应该是“老特说”才关注到这一块,之前也有了解本地部署,但是性能都弱,同时也关注到“ai 纪元”,“零度解说”等都有提到相关技术,我本身做测试出身的一直关注ai相关技术去年ai还处于chat 的阶段,过完年agent工具出来简直开了加速键。 我就决定要趟这一波“浑水”。
正题:
一,硬件:
主要抄袭老特推荐的配置e5 2666v3 + 7900xtx

注意:
我是两张显卡。一张10年前的老机器的730 主要做本地显示,看了机智罗的视频建议不用主力显卡做显示才这样。
显卡是抖音618 买的蓝宝石电源套装,我发过帖子,某些人看到了也上车了。
关于电源我是不省钱的我怕火灾安全还是第一位。
机箱都不是事情十年前的老机箱,一堆铁而已,该省还是要省钱。

二,系统与软件:
1,windows 11 25H2 :注意这个很关键这个版本对ROcM的支持是比较好的(看了零度解说的视频:新加了鸡血patch的),当然大家推荐Ubuntu 我也是双系统,可是 人家机智罗都搞了整合包在windows下我作为小白先把工作流打通在考虑优化时间比较好,也不知道小白工具箱在ubuntu下的comflyui 能不能用,看到大家发帖貌似也是可以的,我还没尝试,关键刚装好的ubuntu又出问题了,amd驱动问题报错log提示叫我关掉,真的神奇一直用正常一下不用就出问题。

注意提一句:一开始window11 下跑 comfly UI 跑着时候 聊qq都是卡的,我和codex 聊后要求关掉除ai和普通办公办公需求以外的全部系统服务后,意外的流畅,一般来说最卡的时候就是生成视频最后阶段 vae 导出,这个时候鼠标也动不了。优化后生成全阶段后台还开着夸克下载模型、codex、ollama,都在后台,前台还聊着qq一点卡顿感受不到,也许是我适应了。
2,整合包:机智罗v3 : 这个也是在论坛看到有同道发了帖子提到我就去了解了,还有qq群(这一点太好了不会做思想的孤岛,大家可以多交流)人家做了小白工具箱:里面集成了 sage trion加速器,加载分块技术(可能拼写有错误体谅)。我觉得对于我这样的小白太友好了还有视频(主要先把工作流搞通,用起来再谈其他)当天看了他大部分的视频就能生成简单视频了。属实被别的博主种草了!!大大点赞。

三,实测数据:
上点硬货:
wan 2.2 视频动作迁移工作流fp8:

上面这张图片,由下往上,
02视频 ----480x640 15秒
03视频----480x832 15秒
04视频--- 544x960 10秒
心得:其实只要不爆显存,视频越短越快,即使不爆显存越长生成越慢,至于 02比03 应该在 不爆显存的前提下有运气成分?具体还没有考究。
wan2.2 文生视频fp8:

480 x532 5秒 ------231 秒: 太长会爆显存,我打算后期用 无限时间的工作流,每五秒一个分镜提示词和图片也可以减少抽卡机率。四,比较关心问题
1,内存多大合适,128G 跑LTX 2.3 图生视频 一般vae阶段比较费内存,实测不会超过 60G内存占用,别的场景没有试过,我是comflyui 安装盘设置80g-100g的虚拟内存。所以我打算把多的内存退掉还没过7天无理由。
2,9070 能不能跑,甚至跑的比 7900xtx更好? ran4 比ran3 在fp8的支持上更好速度上是1.3倍,但是人家只有16G显存,fp8模型就在16g没法跑阿只能完量化模型,其实我的机械革命4060 8Gb的笔记本也可以跑刘悦的模型 5分钟跑5秒 480视频,不过加入了 i7 1260H的cpu 32g ddr4 。我看到机智罗的交流区有用RX580 魔改16 g 老古董在完的也是厉害生成质量也不错。总结:做这个短视频入坑最大难点并不是硬件,而是愿不愿意投入时间成本和精力,前天晚上通宵搞了一下,很郁闷同样配置群里面的人都跑的不错我用LTX就是不行,请教了老哥后才知道是提示词问题,还有工作流CFG 没法调等等(这个问题被的博主有说 sage节点参数和CFG调节高会产生黑点)cfg是1模型对提示词遵从度不高,后面把机智罗的视频看了一遍怎么搞他提示词等等再才至少高出能看的,
最后放一张 Z-imgae的擦边图结尾:

-
@mei-li 左侧是hermes agent 接到TG上,右侧是我自己先跑一次跑通了再交给agent,让她复制工作流、使用API批量推进视频,并且如果报错了的话,让她自己ssh连进去查看日志并根据实际工作流用到的参数,给出修改意见(直接问gemini之类的我试过了,不太行,因为他们这些工作流都内置了很多参数,直接截图通过web的对话问ai,成效不大
-
@abaalei 我明白了,你是跑通类似工作流后,比如第一段,在这个基础上让他复制这个流程把脚本的第二段之后的全部都跑完,这样确实比脚本智能点。或者说让他在可控范围内自由创作,完成后去检查结果抽卡就好了,反正人工弄也有抽卡概率。
@mei-li
对的,没错
除非是遇到这种流程能跑通,但是人眼看一眼就有问题的成品,才需要让她针对性的debug。不然平时他就看log日志就够了
最关键的是接入了hermes之后,就变成按遥控器,可以体会一把当老板/甲方的瘾了 哈哈哈
看到不对的,改!只要给充足的时间跟token,都能改好不看不知道,一看吓一跳,卧槽,第一天为了跑通hermes当遥控器的功能,竟然花了50元!


哈哈,近30天用了等值1000USD的Token,我的妈呀,我TM是干了些什么大生意出来啊,笑死(还好都是白嫖Gemini的,不用真的花钱)

-
@mei-li
对的,没错
除非是遇到这种流程能跑通,但是人眼看一眼就有问题的成品,才需要让她针对性的debug。不然平时他就看log日志就够了
最关键的是接入了hermes之后,就变成按遥控器,可以体会一把当老板/甲方的瘾了 哈哈哈
看到不对的,改!只要给充足的时间跟token,都能改好不看不知道,一看吓一跳,卧槽,第一天为了跑通hermes当遥控器的功能,竟然花了50元!


哈哈,近30天用了等值1000USD的Token,我的妈呀,我TM是干了些什么大生意出来啊,笑死(还好都是白嫖Gemini的,不用真的花钱)

-
还好都是白嫖Gemini的,这是重点。
必须给个好评。干的漂亮。 -
,
T terry 固定了此主题
-
,
T terry 将此主题从 AI硬件 移至此处
-
@koala 好像论坛某个老哥用它的节点可以跑啊,我还没试,主要小白工具箱能不能直接用。 在ubuntu下不能直接下他的整合包,解压要密码,要去夸克单独下模型和工作流,在导入到ubuntu 的comfly ui。
-
-
@mei-li
对的,没错
除非是遇到这种流程能跑通,但是人眼看一眼就有问题的成品,才需要让她针对性的debug。不然平时他就看log日志就够了
最关键的是接入了hermes之后,就变成按遥控器,可以体会一把当老板/甲方的瘾了 哈哈哈
看到不对的,改!只要给充足的时间跟token,都能改好不看不知道,一看吓一跳,卧槽,第一天为了跑通hermes当遥控器的功能,竟然花了50元!


哈哈,近30天用了等值1000USD的Token,我的妈呀,我TM是干了些什么大生意出来啊,笑死(还好都是白嫖Gemini的,不用真的花钱)

-
,系统 取消固定了此主题
-
@mei-li 左侧是hermes agent 接到TG上,右侧是我自己先跑一次跑通了再交给agent,让她复制工作流、使用API批量推进视频,并且如果报错了的话,让她自己ssh连进去查看日志并根据实际工作流用到的参数,给出修改意见(直接问gemini之类的我试过了,不太行,因为他们这些工作流都内置了很多参数,直接截图通过web的对话问ai,成效不大
-
@abaalei 请教下,Hermes 怎么接 TG 的?你这边任务是同步的吗?
我现在遇到的问题是:Hermes 下达的任务,TG 不知道;TG 下达的任务,Hermes 也不知道。虽然任务都能正常跑,但两边不会同步,每次还得额外说明一下。
这是正常的吗?还是我哪里没配置好?
