跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

AresROCA

AresROC

@AresROC
关于
帖子
13
主题
2
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • SGLang - 是時候玩TP了嗎? Qwen / RTX3090
    AresROCA AresROC

    X] 自动翻译成代币 - 27b awq 我也想, 9b 已使 20GB VRAM!

    LLM讨论区

  • SGLang - 是時候玩TP了嗎? Qwen / RTX3090
    AresROCA AresROC

    今天花了一整天時間在 Ubuntu 上安裝 SGLang
    7a3e4d2a-fd59-4627-b1d3-ccaf6b680a9c-image.jpeg
    目前在 Qwen 9B 上可以正常運作:
    python -m sglang.launch_server --model-path ~/AiModel/Qwen3.5-9B --host 0.0.0.0 --port 8000 --mem-fraction-static 0.8 --context-length 16384 --reasoning-parser qwen3 --kv-cache-dtype auto

    目前大概能达到 40 个Token/s
    6e9d1cd5-203d-46bc-9c9e-4d6af2f3f1da-image.jpeg

    還需在 Qwen 27B AWQ 進行一些設定。

    vllm安装更容易 ~
    各位大神有什么秘诀吗?请赐教!

    LLM讨论区

  • 选择7900XTX还是3090 24G
    AresROCA AresROC

    3090 真的是火热 我记忆体都跑105度C。 电已经 减少到75% Micron GDDR6x 没事的

    AI硬件

  • 求指导:谁快来把我打醒
    AresROCA AresROC

    等下个月苹果m5 mini出来吧。32G 够用。 反正 Hermes Computer-Use 目前也只支持苹果

    AI硬件

  • 跟huananzi下单了 3090x2 + nvlink
    AresROCA AresROC

    @terry 哎呀,对我傻傻的忘了要用vLLM tensor parallel size 2. SG-Lang还没用过 好像不可以用Q4 KV?就是看到 Windows L M Studio 还以为可以试一下。

    AI硬件

  • 买了2张5060Ti,谁能跑最便宜的Qwen 27B?
    AresROCA AresROC

    @stakira 5060Ti #2 仍未收到. 上面有同仁發的速度可以參考。vLLM 环境我会尽快搞。

    RTX 3090 双卡LlamaCpp相关内容,在另一篇帖子中可查看。

    AI硬件

  • 跟huananzi下单了 3090x2 + nvlink
    AresROCA AresROC

    6b8584a8-2b35-406d-95e9-099491c05dc1-image.jpeg356020a7-ee20-422b-b25f-b03bb934e58c-image.jpeg 4c5923be-53a9-4037-a463-b5001108a6f3-image.jpeg 7ff62979-ee93-4c9f-b0e0-931378523133-image.jpeg

    AI硬件

  • 跟huananzi下单了 3090x2 + nvlink
    AresROCA AresROC

    双卡配置我试过,我速度比单卡还要慢。看来还需要进一步优化。小弟技术烂 ~
    Windows 系统搭配 LM Studio,且受限于 PCI SLI Link。
    至于 NVLink,售价高达 400 到 500 美元,目前没计划入手。

    RTX 3090 单卡运行 Qwen 27B (Q4 量化) 时,速度约为 38 token/s。(Full Power, None Thinking/Reasoning, Voltage Curve GPU +100, Mem +500)

    *** 功率限制 80% *** 内存温度保持低于 100°C *** Thinking/Reasoning
    RTX 3090 双卡运行时,Q4 量化速度为 23~25 token/s;Q6 量化为 23 token/s;Q8 量化则在 22~23 token/s 之间。

    我目前的计划是使用单卡配置,但同时运行两个(Agent),每个Agent加载 Qwen 27B 模型进行对话。

    AI硬件

  • 说一下我自己的20年硬件攒机的经验.
    AresROCA AresROC

    好吧,出来吹吹。286 8MHz 640k要多加384K的記憶體,還要一颗一颗自己插到主機板上。DOS + UNIX + FreeBSD。IBM加速显卡价钱可以买到一台新车。TSENG Diamond SpeedStar 出来大家惊为天人。Riva128 后来才出生。
    说实在品牌不要看得太重,同一个品牌也有好有坏。个人适合就行了。

    AI硬件

  • 买了2张5060Ti,谁能跑最便宜的Qwen 27B?
    AresROCA AresROC

    RTX3090 更新记忆前后的散热。温度一定要看着点。😅
    IMG_2056.jpeg

    AI硬件

  • 买了2张5060Ti,谁能跑最便宜的Qwen 27B?
    AresROCA AresROC

    @terry 好的,我做了RTX 5070 Ti加上RTX 5060 Ti 16GB. PCIe 3.0x4 Bus. Qwen3.6-27b 速度还可以Q4有26.7 Token/s。LmStudio会把大部分记忆体放在5070 T I上。

    單卡3090 Q4得到35 Token/s. Power limit 80%让记忆体温度低一点先 不然会升到105度C

    我也是50+看到你今天的视频有提到😆

    目前只是搞windows加上LMStudio。日后改进Linux加上vLLM或别的。还会搞ComfyUi。

    我找到一个电脑可以塞這两个3090。我會想辦法先測試一下再等NvL ink到货。

    AI硬件

  • 买了2张5060Ti,谁能跑最便宜的Qwen 27B?
    AresROCA AresROC

    @stakira 今天才收到其中一張RTX 5060Ti,另外一張要等個星期。

    明天計劃收購兩個R T X 3090 希望成功到手試試。

    實際測試方法還要研究研究。傷腦筋還要搞個NvLink。。。

    AI硬件

  • 买了2张5060Ti,谁能跑最便宜的Qwen 27B?
    AresROCA AresROC

    如题所示。我之前买了台 Mac Mini M4(24GB内存),结果发现哪怕配合 oMLX,也跑不动任何合适的模型。

    现在我入手了 RTX 5060Ti(16GB显存,448 GB/s显存带宽),单块售价不到500美元;相比那些经过魔改的 RTX 3080 等显卡,它在这卡在耐用性方面应该更有保障。显卡还没到货,所以目前暂无性能实测数据。

    R7900XTX 还没见过低于 1000 美元的价格。

    大家觉得怎么样?

    AI硬件
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组