跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

元气堡AI智能元

元气堡AI智能

@元气堡AI智能
取消关注 关注
关于
帖子
1
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 2080Ti 22G魔改版+llama.cpp pr-22673开启MTP Chat场景TPS提升20%左右
    元气堡AI智能元 元气堡AI智能

    根据https://www.youtube.com/watch?v=nU9c-PffHPg&t=361s,我用2080ti22G可以跑qwen3.6-35b模型24token/s
    cuda下载是12.4
    启动参数
    @echo off
    chcp 65001 >nul
    cd /d C:\llm

    llama-server.exe ^
    -m "models\Qwen3.6-35B-A3B-UD-Q4_K_M.gguf" ^
    --mmproj "models\mmproj-BF16.gguf" ^
    -ngl 99 ^
    --n-cpu-moe 999 ^
    --flash-attn on ^
    --jinja ^
    -c 65536 ^
    -t 10 ^
    -b 4096 ^
    -ub 128 ^
    --cache-type-k q4_0 ^
    --cache-type-v q4_0 ^
    --mlock ^
    --host 127.0.0.1 ^
    --port 8080

    pause

    LLM讨论区
  • 登录

  • 没有帐号? 注册

  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组