跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

JamesPhlaoJ

JamesPhlao

@JamesPhlao
关于
帖子
3
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 技术分享:双卡 RTX 5060Ti Blackwell 运行 vLLM 与 LM Studio 性能实测报告
    JamesPhlaoJ JamesPhlao

    楼主这个效果非常不错。看来买新不买旧非常有道理的。

    AI硬件

  • Qwen3.6 27b FP8 260K CTX - 准备放弃了
    JamesPhlaoJ JamesPhlao

    难道是魔改的L40S吗?

    LLM讨论区

  • 交作业, 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享
    JamesPhlaoJ JamesPhlao

    看了你的7900xtx,如果纯跑27B,我还是不入坑了。保持两张16G的羊垃圾,27B-IQ4_NL(理论上比Q4_K_M小一些,智力稳一些), q8_0的kv-cache 256k可以跑,保险一些224k 240k 加mtp一次吐出8k左右能稳定40-50 t/s。 楼主的单卡24可以考虑折腾dflash,据说速度最高可以10倍。

    AI硬件
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组