求助:老硬件平台:Z77+E1230+16GDDR3+3090_24G Ubuntu 能跑Qwen3.6 27B吗
-
@yang-tae 成功是正常的。3090很容易跑起来。
-
@David-Zhang 我前陣子因為預算的問題也打算稿p40,但後來想想覺得那個就是大顯存p4就有點打退堂鼓了。
但我真的有點好奇他跑起來感覺如何@陳瑋 p40目前就是鸡肋,不折腾最好
-
@陳瑋 p40目前就是鸡肋,不折腾最好
@David-Zhang 我試過用p4部署,但英偉達驅動已經不讓p4開wddu 了,那時候搞了好久e2b模型吐字才18tps
-
@David-Zhang 我試過用p4部署,但英偉達驅動已經不讓p4開wddu 了,那時候搞了好久e2b模型吐字才18tps
@陳瑋 我试过gemme4 26, p40能跑到 42t/s,
在linux下,能用,但是模型能力一般般,写代码简单的可以,复杂得就算了 -
@陳瑋 我试过gemme4 26, p40能跑到 42t/s,
在linux下,能用,但是模型能力一般般,写代码简单的可以,复杂得就算了@David-Zhang 我也测试了Gemma4,之前视频里我说这个模型不行,很多人不高兴,事实就是做出来的效果不如Qwen3.5,更别说3.6了。
-
@David-Zhang 我也测试了Gemma4,之前视频里我说这个模型不行,很多人不高兴,事实就是做出来的效果不如Qwen3.5,更别说3.6了。
@terry 我觉得 Google 发这个模型的目的主要是为换license,模型能力估计没太重视。目前有 qwen3.6 27b, 35b 就够了。
,大佬指点一下。