跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 求助:老硬件平台:Z77+E1230+16GDDR3+3090_24G Ubuntu 能跑Qwen3.6 27B吗

求助:老硬件平台:Z77+E1230+16GDDR3+3090_24G Ubuntu 能跑Qwen3.6 27B吗

已定时 已固定 已锁定 已移动 AI硬件
19 帖子 10 发布者 317 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • yang taeY 离线
    yang taeY 离线
    yang tae
    编写于 最后由 编辑
    #10

    @terry 能把这个接入hermes 吗

    王一民王 terryT 2 条回复 最后回复
    0
    • yang taeY yang tae

      @terry 能把这个接入hermes 吗

      王一民王 离线
      王一民王 离线
      王一民
      编写于 最后由 编辑
      #11

      @yang-tae 故意输入多一点提示词,比如粘一个文章,跑一下,主要看Prompt速度,如果Prompt速度不能在500以上,连Hermes的体验就会很差了。

      因为hermes会频繁对LLM发起调用,每一次都要走prefill,所以对于输入速度要求比较高。

      hermes有很多系统提示词,冷启动的第一次请求,提示词输入在5k左右这个量级。如果是500t/s的输入速度,就要罚站10秒钟。你可以想象,Hermes每跑一行命令,都要罚站10秒。

      虚心交流,一起进步

      1 条回复 最后回复
      1
      • yang taeY yang tae

        @terry 能把这个接入hermes 吗

        terryT 离线
        terryT 离线
        terry
        编写于 最后由 编辑
        #12

        @yang-tae 老弟,先跑起来,不要有顾虑,有问题再说。

        1 条回复 最后回复
        0
        • P 离线
          P 离线
          Pita
          编写于 最后由 编辑
          #13

          我是一台Intel NUC外接2080Ti魔改22G垃圾卡跑Q4量化版3.6 27b大概20tokens每秒,配置比這個好的朋友們應該都可以跑通的,至於能不能用得爽...那就是另外一件事了....

          1 条回复 最后回复
          0
          • 陳瑋陳 陳瑋

            @David-Zhang 我前陣子因為預算的問題也打算稿p40,但後來想想覺得那個就是大顯存p4就有點打退堂鼓了。
            但我真的有點好奇他跑起來感覺如何

            David ZhangD 离线
            David ZhangD 离线
            David Zhang
            编写于 最后由 编辑
            #14

            @陳瑋 p40目前就是鸡肋,不折腾最好

            陳瑋陳 1 条回复 最后回复
            0
            • A 离线
              A 离线
              ai
              编写于 最后由 编辑
              #15

              X99,3090 llama 256K 45t/s多,vllm64k 8并平均每路38t/s左右

              1 条回复 最后回复
              0
              • David ZhangD David Zhang

                @陳瑋 p40目前就是鸡肋,不折腾最好

                陳瑋陳 离线
                陳瑋陳 离线
                陳瑋
                编写于 最后由 编辑
                #16

                @David-Zhang 我試過用p4部署,但英偉達驅動已經不讓p4開wddu 了,那時候搞了好久e2b模型吐字才18tps

                David ZhangD 1 条回复 最后回复
                0
                • 陳瑋陳 陳瑋

                  @David-Zhang 我試過用p4部署,但英偉達驅動已經不讓p4開wddu 了,那時候搞了好久e2b模型吐字才18tps

                  David ZhangD 离线
                  David ZhangD 离线
                  David Zhang
                  编写于 最后由 编辑
                  #17

                  @陳瑋 我试过gemme4 26, p40能跑到 42t/s,
                  在linux下,能用,但是模型能力一般般,写代码简单的可以,复杂得就算了

                  terryT 1 条回复 最后回复
                  1
                  • David ZhangD David Zhang

                    @陳瑋 我试过gemme4 26, p40能跑到 42t/s,
                    在linux下,能用,但是模型能力一般般,写代码简单的可以,复杂得就算了

                    terryT 离线
                    terryT 离线
                    terry
                    编写于 最后由 编辑
                    #18

                    @David-Zhang 我也测试了Gemma4,之前视频里我说这个模型不行,很多人不高兴,事实就是做出来的效果不如Qwen3.5,更别说3.6了。

                    David ZhangD 1 条回复 最后回复
                    0
                    • terryT terry

                      @David-Zhang 我也测试了Gemma4,之前视频里我说这个模型不行,很多人不高兴,事实就是做出来的效果不如Qwen3.5,更别说3.6了。

                      David ZhangD 离线
                      David ZhangD 离线
                      David Zhang
                      编写于 最后由 编辑
                      #19

                      @terry 我觉得 Google 发这个模型的目的主要是为换license,模型能力估计没太重视。目前有 qwen3.6 27b, 35b 就够了。

                      1 条回复 最后回复
                      1

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 登录或注册以进行搜索。
                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组