用於電商搭建自運營的模型選擇qwen3.6 27b 用Q4還是Q8合適
-
Q4量化和Q8量化的差距不是质的差距。所以Q4不够用的话,90%的可能性是Q8也不行。
而且不够聪明其实有很多个维度的解释,楼主可以晒出你的模型启动全参数,这样可以更综合的判断问题 -
看你硬件,q4相比q8有些许差距,幻觉会多一些,q6是甜品级别的,不行就上q5,看你硬件。lm studio和llama.cpp差距较大,用llama.cpp吧,论坛很多帖子。
你要说你的硬件,你的参数
-
看你硬件,q4相比q8有些许差距,幻觉会多一些,q6是甜品级别的,不行就上q5,看你硬件。lm studio和llama.cpp差距较大,用llama.cpp吧,论坛很多帖子。
你要说你的硬件,你的参数
-
@566656661 这个我还真不清楚,我只知道parallel 上下文是互相隔离的啊,应该不会影响吧
