跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

rock shiR

rock shi

@rock shi
关于
帖子
10
主题
1
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 3080 20G*2的有没有,来交流啊兄弟们
    rock shiR rock shi

    @terry 刚知道vllm还可以开mtp,我再多试试。回头再来反馈

    AI硬件

  • 3080 20G*2的有没有,来交流啊兄弟们
    rock shiR rock shi

    @whjwyc 我去!好消息,回头我也得试试。

    AI硬件

  • 3080 20G*2的有没有,来交流啊兄弟们
    rock shiR rock shi

    @terry 测试完了。vllm不行,18tokens/s左右,应该还是我的主板不行。ollama稳定29tokens/s

    AI硬件

  • 3080 20G*2的有没有,来交流啊兄弟们
    rock shiR rock shi

    @terry 锤子哥!吼吼,之前vllm没搞定,我得再去折腾一波

    AI硬件

  • 3080 20G*2的有没有,来交流啊兄弟们
    rock shiR rock shi

    0a4d1006-5d20-4ae4-bdb0-1bef0e0116d3.png

    AI硬件

  • 3080 20G*2的有没有,来交流啊兄弟们
    rock shiR rock shi

    2月份搞的这两个卡,目前能跑hermes+qwen3.6 27b,有没有志同道合的兄弟一起研究这卡怎么玩

    AI硬件

  • 3080改成20g显存好呢还是卖掉换7900XTX好
    rock shiR rock shi

    @woho96 跑视频模型,单卡至少24g了

    AI硬件

  • 3080改成20g显存好呢还是卖掉换7900XTX好
    rock shiR rock shi

    我是两张3080 20,一共40g,反正hermes已经在帮我测试很多东西了

    AI硬件

  • 请教大佬:Q4相比FP8,运行qwen3.6 27B,质量下降很大么?
    rock shiR rock shi

    q4我开reasoning high完全够啊,几乎不会出错。我用下来是觉得比DeepSeek v4 flash和pro都夯

    LLM讨论区

  • 问完去睡觉,下半个月死磕QWEN 3.6 35B A3B.
    rock shiR rock shi

    @fanwen1974 是的,我测试过好几次了。hermes更新13.0以后我也不死心,就是想用35b,但是他就是moe,moe就是不行,跟27b稠密型根本比不了。其实DeepSeek v4 flash或者pro都不如27b,因为他俩也是moe

    LLM讨论区
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组