跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

刘海彬刘

刘海彬

@刘海彬
关于
帖子
6
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 大佬们你 这3090 这成色能入吗? 5500
    刘海彬刘 刘海彬

    早买早享受把,目前这个卡就是在6000以内。有保修最好!

    AI硬件

  • 有没有3090或以上,24G显存的兄弟,关于QWEN 27B DFLASH加速
    刘海彬刘 刘海彬

    我使用的官版的llama.cpp q8_0 kv缓存 目前tqs在40左右,还没使用dflash、mtp这些。想等成熟一些

    AI硬件

  • 3090还是3090 *2+NVLink
    刘海彬刘 刘海彬

    @terry 好的,谢谢。我试一下

    AI硬件

  • AI本地部署MAXSUN Intel Arc Pro B60 Dual 48G Turbo
    刘海彬刘 刘海彬

    按照这个趋势,后续的模型估计越来越给力,玩本地AI的估计有福了

    AI硬件

  • 3090还是3090 *2+NVLink
    刘海彬刘 刘海彬

    @terry 哥,我的启动参数如下:
    /root/llama.cpp/build/bin/llama-server -m /data/models/gguf/Qwen3.6-27B-UD-Q4_K_XL.gguf --mmproj /data/models/gguf/Qwen3.6-27B-mmproj-F16.gguf --mmproj-offload --alias qwen36-27B-Q4 --jinja -ngl 999 -c 128000 -fa on --cache-ram 16384 --cache-type-k q8_0 --cache-type-v q8_0 -np 1 --sampling-seq k --top-k 1 --host 0.0.0.0 --port 11434 --reasoning on --reasoning-format deepseek --reasoning-budget 512

    AI硬件

  • 3090还是3090 *2+NVLink
    刘海彬刘 刘海彬

    我目前使用rtx3090 跑qwen3.6 27B Q4量化,给hermes用基本可以的,就是有时候偶发工具调用死循环,我已经在hermes的人设内容限制很死了,概率降低了很多,但是偶尔还是会,我感觉是模型问题了。

    AI硬件
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组