性價比要看用途啊 哈 而且要同時折騰軟件和硬件
V100是CUDA 7.0架構的 主流的量化模型除了GGUF其他都用不到 新的技術很多都要CUDA 8.0架構以上才能用 LLM類勉強能用
ComfyUI 16G就不要想T2V/I2V的 顯存不夠用
T2I/I2I的跑Zimage/Flux模型還好 QwenImage系列一張 1024x1024的圖用了蒸餾模型也要好幾分鐘左右才有一張
性價比要看用途啊 哈 而且要同時折騰軟件和硬件
V100是CUDA 7.0架構的 主流的量化模型除了GGUF其他都用不到 新的技術很多都要CUDA 8.0架構以上才能用 LLM類勉強能用
ComfyUI 16G就不要想T2V/I2V的 顯存不夠用
T2I/I2I的跑Zimage/Flux模型還好 QwenImage系列一張 1024x1024的圖用了蒸餾模型也要好幾分鐘左右才有一張
@terry 對啊 我選他主要是可以本地運行廣東話TTS
而且音色不像Elevenlabs 有點機械音的感覺
用幾十分鐘的內容訓練個LoRa就連上面講會走音的問題也秒殺掉
但有些字他總是讀錯 還在研究怎樣解決 哈
@linax777 請問你 Ultimate Clone 一段話時間大概多長?
我用粵語的 沒加載LoRa情況下每句不能超過10秒
10秒開始他就變成一種新的方言了
@terry 2.0 可以抽卡設計音色 但不一定抽到好卡
另外增加了日語、韓語及多種方言支援 (其他方言我不懂,但日、韓、粵語聽起來都是怪怪的)