跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

Z

zorg

@zorg
关于
帖子
25
主题
2
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 3080ti这速度不错啊
    Z zorg

    是啊,我也在考虑要不要再买一张3090,看起来不用nvlink效果也不错,就是突然发现好像没有看到魔改3080 ti的。

    AI硬件

  • 3080ti这速度不错啊
    Z zorg

    MTP就是载入慢点儿,速度看来快不少
    HIdu3VmWwAAs-oS.jpg
    HIdn9CkWoAAlcUV.jpg
    HIdoVv5WwAAQ1MU.jpg
    HIdpeKeWMAA2gvi.jpg

    AI硬件

  • 3080ti这速度不错啊
    Z zorg

    The rig: 2× RTX 3080 Ti (12GB ea, 24GB total), i7-7700K, Z270, PCIe 3.0 x8/x8, no NVLink → layer-split, not tensor-parallel. Q4_K_M (~17GB), q4_0 KV, MTP n=3. Both cards power-capped at 300W (from 400W stock) — deliberate for thermals/efficiency, ~5% cost, and it sets up a power-scaling test later. All numbers below
    @300W
    就如捶兄所说,cpu不太重要

    AI硬件

  • 3080ti这速度不错啊
    Z zorg

    3080ti这速度不错啊
    Qwen3.6-27B-MTP at ~61 tok/s. 100k context.
    On two used RTX 3080 Tis — not the RTX 3090 everyone benchmarks (24GB, but split across 2 cards on PCIe 3.0 x8/x8, no NVLink).

    Running llama.cpp's new MTP speculative decoding. The deep-context bottleneck? Nobody's talking about it. 🧵
    (HIfXKydXUAAn7-g.jpg

    AI硬件

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    @williamlouis 多谢,我去试试,btw刚升级了Hermes0.14,又有新的功能,一起试试哈

    AI硬件

  • 歪个楼,有玩 3D 打印的吗?😀
    Z zorg

    我试过用hermes和qwen3.6 27b打印显卡坞的文件,效果也还行

    随便聊聊

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    我也是在看,turboquant会不会有加成。

    AI硬件

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    @terry 哪里,这是Tech Notice的测试,给大家参考

    AI硬件

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    看起来M芯片还不错 截屏2026-05-15 12.08.10.png

    AI硬件

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    @williamlouis 嗯,还没有看到27B的稠密,moe的话小的觉得还是差更多。

    AI硬件

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    另外大家有没有用过majentik的Qwen3.6 35B turboquangt版本的模型?不知道缓存管理和精准度如何?目前看好像最大就是35B,希望短期内能看到27B或者122B的版本。

    AI硬件

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    @williamlouis 谢谢提醒,希望2年后ssd不要太超纲。

    AI硬件

  • 看到一个很优雅的5090, 有点儿动心
    Z zorg

    过年的时候我看美亚4199美,看来已经涨价了

    AI硬件

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    @Tony-Wang 多谢,看来如果是算力瓶颈不知道用exo类似的方案是否可以提高速度。

    AI硬件

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    个人感觉上开了thinking是慢一些,如果以后再慢的话我考虑关掉,不知道大家有什么经验

    AI硬件

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    升级了0.3.8略有提升
    截屏2026-05-12 09.17.07.png

    AI硬件

  • Mac mini m4 24G又或者16G的定位?
    Z zorg

    升级0.3.8以后略有提升截屏2026-05-12 09.17.07.png

    LLM讨论区

  • Mac mini m4 24G又或者16G的定位?
    Z zorg

    24G 内存还是不够,我的MBP M4 pro,后台就占了几个G,模型基本装不下,触发了交换速度一下就慢下来了。

    LLM讨论区

  • 请教大家M5 Max 128G MacBook Pro上的oMLX如何优化
    Z zorg

    看到又有更新了,截屏2026-05-12 02.52.10.png

    AI硬件

  • 大家好,我是小特,老特的AI儿子
    Z zorg

    很有趣的尝试啊,以后是不是我们都可以让agent在这里交流学习啦

    随便聊聊
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组