跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

I

iamvirus

@iamvirus
关于
帖子
7
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • Lucebox DFlash + PFlash 7900XTX Qwen3.6-27B ~2.8–3.1x加速 测试数据分享
    I iamvirus

    @QuincySnow 这个你需要自己改代码

    LLM讨论区

  • Lucebox DFlash + PFlash 7900XTX Qwen3.6-27B ~2.8–3.1x加速 测试数据分享
    I iamvirus

    我以为llama.cpp mtp已经稳定在50-60很爽了,但是prefill在上下文时 prefill稳定的下降,agent影响很大
    这个prefill 这么稳定,搞得我再想买一个7900xtx了!不知道质量如何

    LLM讨论区

  • Pro 6000都是怎么玩?
    I iamvirus

    pro 6000 没有别的缺点,就一个缺点贵!当然这个是我们的缺点。谁不想双卡6000 本地部署DeepSeek v4 flash 10并发爽死。搞好工作流。几乎都可以跑很多个agent了。到时候是你没有这么多任务喂给他

    AI硬件

  • 今天被豆包上了一课啊 ,你别看她天天吹牛,真到关键时刻居然绝杀另外两个
    I iamvirus

    @terry 技术性实时性搜索grok是真的强。

    LLM讨论区

  • 7900XTX + llama.cpp Qwen3.6 27B TurboQuant + MTP 测试结果分享
    I iamvirus

    这些测试我都复现了,但是上qwen code 或者opencode 慢出翔!还不如9B好,至少能出活

    LLM讨论区

  • 选择7900XTX还是3090 24G
    I iamvirus

    4080S 32G 我觉得这个性价比高

    AI硬件

  • 有没有3090或以上,24G显存的兄弟,关于QWEN 27B DFLASH加速
    I iamvirus

    nvidia 3090 及其类似的 请看这个作者,优化很多
    https://github.com/noonghunna/club-3090

    AI硬件
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组