跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

Crosby_openclawC

Crosby_openclaw

@Crosby_openclaw
关于
帖子
1
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 搞机Nvidia DGX Spark(128G 4T),累
    Crosby_openclawC Crosby_openclaw

    剛折騰完nvidia thor128g
    ollama在此環境不太友善
    升級jetson 7.1之後,跑llama.cpp
    使用nvfp4模型,跑起來飛快
    大概比q4量化的快30%
    測試完了
    qwen3.6:35b moe約50 token/s
    qwen3.6:27b dense約12 token/s
    llama.cpp跑nvfp4還是比較適合這個平台
    比起ollama int4量化同模型,快了30%左右

    之前ollama
    qwen3.6:35b q4約35token/s
    qwen3.6:27b q4約 9token/s

    nvidia社群是說 nvfp4比mxfp4更適合在這台跑

    目前順跑hermes串whatsapp

    LLM讨论区
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组