跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. LLM讨论区
  3. 为了证明M4 Max真的不行,自己写了案例测试了几个模型

为了证明M4 Max真的不行,自己写了案例测试了几个模型

已定时 置顶直到 2026/6/15 14:07 已锁定 已移动 LLM讨论区
22 帖子 7 发布者 48 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • terryT terry

    @566656661 徽章要显示,这是论坛用户的评价锁定的,不要不带啊,那声望系统就没意义了😓

    5 在线
    5 在线
    566656661
    技术大牛
    编写于 最后由 编辑
    #7

    @terry

    好吧

    這東東讓人不好意思的😂

    terryT 1 条回复 最后回复
    0
    • 5 566656661

      @terry

      好吧

      這東東讓人不好意思的😂

      terryT 在线
      terryT 在线
      terry
      超级版主
      编写于 最后由 编辑
      #8

      566656661 荣誉是别人给的,有什么不好意思的,声望都是别人一个一个点赞出来的。

      油管:https://www.youtube.com/@抡锤者

      1 条回复 最后回复
      2
      • williamlouisW 离线
        williamlouisW 离线
        williamlouis
        超级版主
        编写于 最后由 编辑
        #9

        M4 群众:盖版 32G 改版 24G 丐版 16G 围观下。大家偷乐,你也不比我们强多少哈。哈哈哈哈哈哈。😂

        个人主页:xlkj.org Telegram https://t.me/xlkjorg

        tomcatzhT 1 条回复 最后回复
        2
        • williamlouisW williamlouis

          M4 群众:盖版 32G 改版 24G 丐版 16G 围观下。大家偷乐,你也不比我们强多少哈。哈哈哈哈哈哈。😂

          tomcatzhT 离线
          tomcatzhT 离线
          tomcatzh
          编写于 最后由 编辑
          #10

          @williamlouis 说:

          M4 群众:盖版 32G 改版 24G 丐版 16G 围观下。大家偷乐,你也不比我们强多少哈。哈哈哈哈哈哈。😂

          的确啊,但是我找到那个模型,可能丐版的兄弟们真的可以试一下,32GB应该轻松跑

          1 条回复 最后回复
          0
          • williamlouisW 离线
            williamlouisW 离线
            williamlouis
            超级版主
            编写于 最后由 编辑
            #11

            我局域网让 7900XTX 做本地算力了。

            个人主页:xlkj.org Telegram https://t.me/xlkjorg

            tomcatzhT 1 条回复 最后回复
            0
            • williamlouisW williamlouis

              我局域网让 7900XTX 做本地算力了。

              tomcatzhT 离线
              tomcatzhT 离线
              tomcatzh
              编写于 最后由 编辑
              #12

              @williamlouis 说:

              我局域网让 7900XTX 做本地算力了。

              在2026年的这一刻的确是最优解

              1 条回复 最后回复
              0
              • williamlouisW 离线
                williamlouisW 离线
                williamlouis
                超级版主
                编写于 最后由 编辑
                #13

                嗯。但是暂时 闲置折腾状态。没什么项目给它做。我还是主力用 在线 api 跑。

                个人主页:xlkj.org Telegram https://t.me/xlkjorg

                1 条回复 最后回复
                0
                • tomcatzhT tomcatzh

                  但是呢,有一点稍稍安慰的是,在这个过程中,找到了一个宝藏模型,Libraxis 35B-A3B VMLX MXFP4 (oMLX)

                  他的hugging face原帖可以看这里:
                  https://huggingface.co/LibraxisAI/Huihui-Qwen3.6-35B-A3B-Claude-4.7-Opus-abliterated-vmlx-mxfp4

                  首先这个模型已经abliterated,你懂的,前两天老特的视频也说了,本地模型不拒绝也是创作过程中一个重要的需求。

                  其次呢,他是一个35B-A3B的模型,本来他的智能应该是比较弱的,但是运行速度是比较好的(尤其在我的m4 max上)
                  大家可以看我上贴第一张图,大部分的35B-A3B都在下面。

                  但是呢,这个模型的发布机构使用opus 4.7给他整流校准过,效果极好,至少在我的测试集里,完全达到了27B的性能。当然仅对我的测试集负责,偏向tool call和编程,可能也是因为蒸馏的opus 4.7也是偏向这些方向的。

                  看看图中的智能表现,接近27B的水平:
                  51650405-9d3f-4a9f-93ec-15533454fedf-image.jpeg

                  但他的性能,在我的机器上总算能用了
                  445438a5-a31e-44bd-98e8-a26e4d42e873-image.jpeg

                  结合老特的教程,只要harness环境够好,区分好上下文记忆,这样tool call准确的模型是可以干活的。

                  我现在在我的机器上配给了一个小的hermes,专门处理一些prompts润色啊等内容,他也能比较智能的自己总结经验,生成skill,目前感觉良好。关键是,终于找到一个我的机器能跑,智力还算正常的模型了。

                  推荐各位兄弟使用,尤其是小硬件的,可以试试看。有啥坑也欢迎过来踩我。

                  5 在线
                  5 在线
                  566656661
                  技术大牛
                  编写于 最后由 编辑
                  #14

                  @tomcatzh

                  對了, 個人推薦是盡量避免Claude/GPT/Gemini的蒸餾模型, 因為成效很迷

                  不是說蒸餾這個技術沒用, 是在指家用端的模型思考能力有限發揮不出來優勢

                  而且更有可能會矯枉過正導致原本的模型CoT爆掉, 思考能力反而更差

                  我其實更傾向相信在訓練途中Qwen團隊早已經加入有關這些模型的CoT訓練資料, Gemma 4反而可能沒有

                  tomcatzhT 1 条回复 最后回复
                  0
                  • 5 566656661

                    @tomcatzh

                    對了, 個人推薦是盡量避免Claude/GPT/Gemini的蒸餾模型, 因為成效很迷

                    不是說蒸餾這個技術沒用, 是在指家用端的模型思考能力有限發揮不出來優勢

                    而且更有可能會矯枉過正導致原本的模型CoT爆掉, 思考能力反而更差

                    我其實更傾向相信在訓練途中Qwen團隊早已經加入有關這些模型的CoT訓練資料, Gemma 4反而可能沒有

                    tomcatzhT 离线
                    tomcatzhT 离线
                    tomcatzh
                    编写于 最后由 编辑
                    #15

                    @566656661 说:

                    @tomcatzh

                    對了, 個人推薦是盡量避免Claude/GPT/Gemini的蒸餾模型, 因為成效很迷

                    不是說蒸餾這個技術沒用, 是在指家用端的模型思考能力有限發揮不出來優勢

                    而且更有可能會矯枉過正導致原本的模型CoT爆掉, 思考能力反而更差

                    我其實更傾向相信在訓練途中Qwen團隊早已經加入有關這些模型的CoT訓練資料, Gemma 4反而可能沒有

                    是的,的确,大部分的蒸馏模型都一般。

                    我也是将信将疑的用。但是hugging face很多发布都喜欢越狱同时加蒸馏。

                    当时也是看着热度比较高的这个mxfp4模型,本来纯打算测一把速度的。但没想到智能让我有惊喜。(至少在我的测试集里面有惊喜)

                    Tony WangT 1 条回复 最后回复
                    0
                    • tomcatzhT tomcatzh

                      @566656661 说:

                      @tomcatzh

                      對了, 個人推薦是盡量避免Claude/GPT/Gemini的蒸餾模型, 因為成效很迷

                      不是說蒸餾這個技術沒用, 是在指家用端的模型思考能力有限發揮不出來優勢

                      而且更有可能會矯枉過正導致原本的模型CoT爆掉, 思考能力反而更差

                      我其實更傾向相信在訓練途中Qwen團隊早已經加入有關這些模型的CoT訓練資料, Gemma 4反而可能沒有

                      是的,的确,大部分的蒸馏模型都一般。

                      我也是将信将疑的用。但是hugging face很多发布都喜欢越狱同时加蒸馏。

                      当时也是看着热度比较高的这个mxfp4模型,本来纯打算测一把速度的。但没想到智能让我有惊喜。(至少在我的测试集里面有惊喜)

                      Tony WangT 在线
                      Tony WangT 在线
                      Tony Wang
                      超级版主
                      编写于 最后由 编辑
                      #16

                      @tomcatzh

                      你这个27b decode的速度惊人啊, 可惜就是prefill 太慢.

                      目前的Mac 跑 35A3 或者 26A4, 应该是最好的选择了. 27b普遍都跑不动.

                      M5 max 的实测数据, 我们论坛还没有, 我感觉 M5 max 可能将将可用.

                      tomcatzhT 2 条回复 最后回复
                      0
                      • Tony WangT Tony Wang

                        @tomcatzh

                        你这个27b decode的速度惊人啊, 可惜就是prefill 太慢.

                        目前的Mac 跑 35A3 或者 26A4, 应该是最好的选择了. 27b普遍都跑不动.

                        M5 max 的实测数据, 我们论坛还没有, 我感觉 M5 max 可能将将可用.

                        tomcatzhT 离线
                        tomcatzhT 离线
                        tomcatzh
                        编写于 最后由 编辑
                        #17

                        @Tony-Wang 我还有一个想测的,是DGX Spark,好像可以闲鱼租

                        Tony WangT 1 条回复 最后回复
                        0
                        • Tony WangT Tony Wang

                          @tomcatzh

                          你这个27b decode的速度惊人啊, 可惜就是prefill 太慢.

                          目前的Mac 跑 35A3 或者 26A4, 应该是最好的选择了. 27b普遍都跑不动.

                          M5 max 的实测数据, 我们论坛还没有, 我感觉 M5 max 可能将将可用.

                          tomcatzhT 离线
                          tomcatzhT 离线
                          tomcatzh
                          编写于 最后由 编辑
                          #18

                          @Tony-Wang decode速度高,毕竟是满血的m4 max

                          1 条回复 最后回复
                          0
                          • tomcatzhT tomcatzh

                            @Tony-Wang 我还有一个想测的,是DGX Spark,好像可以闲鱼租

                            Tony WangT 在线
                            Tony WangT 在线
                            Tony Wang
                            超级版主
                            编写于 最后由 编辑
                            #19

                            @tomcatzh

                            DGX 也不便宜, 跑27b肯定比Mac能打, 但是生图之类的肯定也不行. 估计跑 70b的效果也不太好.

                            如果只做AI算力机, 应该比Mac的性价比高.

                            5 1 条回复 最后回复
                            0
                            • Tony WangT Tony Wang

                              @tomcatzh

                              DGX 也不便宜, 跑27b肯定比Mac能打, 但是生图之类的肯定也不行. 估计跑 70b的效果也不太好.

                              如果只做AI算力机, 应该比Mac的性价比高.

                              5 在线
                              5 在线
                              566656661
                              技术大牛
                              编写于 最后由 编辑
                              #20

                              @Tony-Wang

                              圖的話基本上就5070等級吧, 不過功耗跟頻率限制了, 應該會更差

                              1 条回复 最后回复
                              0
                              • soop ladiosS 在线
                                soop ladiosS 在线
                                soop ladios
                                编写于 最后由 编辑
                                #21

                                剛跑了qwen 3.6 27B Q8 單台DGX spark的測試供參考, 手邊沒有Q4的模型可以跑.

                                qwen3_single_spark_dflash.png

                                圖片影片的話.. 論壇上有發一篇了, 可以看看

                                Tony WangT 1 条回复 最后回复
                                0
                                • terryT terry 固定了该主题
                                • soop ladiosS soop ladios

                                  剛跑了qwen 3.6 27B Q8 單台DGX spark的測試供參考, 手邊沒有Q4的模型可以跑.

                                  qwen3_single_spark_dflash.png

                                  圖片影片的話.. 論壇上有發一篇了, 可以看看

                                  Tony WangT 在线
                                  Tony WangT 在线
                                  Tony Wang
                                  超级版主
                                  编写于 最后由 编辑
                                  #22

                                  @soop-ladios

                                  速度还不错, 长上下文 prefill 还是有点儿慢. 换成Q4应该完全可用.

                                  1 条回复 最后回复
                                  0

                                  你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                  厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                  有了你的建议,这篇帖子会更精彩哦 💗

                                  注册 登录
                                  回复
                                  • 在新帖中回复
                                  登录后回复
                                  • 从旧到新
                                  • 从新到旧
                                  • 最多赞同


                                  • 登录

                                  • 没有帐号? 注册

                                  • 登录或注册以进行搜索。
                                  • 第一个帖子
                                    最后一个帖子
                                  0
                                  • 版块
                                  • 最新
                                  • 标签
                                  • 热门
                                  • 用户
                                  • 群组