跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

S

sospda

@sospda
关于
帖子
20
主题
3
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • R9700 ai pro 32G 跑Qwen3.6 27B q6k 速度实测
    S sospda

    Qwen3.6-27B 词元生成速度测试

    | 指标     | 值                     |
    |----------|------------------------|
    | 生成词元 | 559 个(全文自然结束) |
    | 耗 时    | 13.82 秒               |
    | 速 度    | 40.44 tok/s            |
    
    比上次的 31 tok/s 还快了一些,可能是因为长上下文下 MTP 的并行预测效率更高。
    

    用MTP版本,速度更快。

    4489fb00-39c3-4dfd-821e-6edbb42befe4-image.jpeg

    AI硬件

  • R9700 ai pro 32G 跑Qwen3.6 27B q6k 速度实测
    S sospda

    @t5t4t5 说:

    @sospda 这个速度你觉得能用吗?我有点劝退了

    我觉得没问题, 这速度不慢, 当然和花2,3倍钱的相比是慢了

    看你需求吧,32g显存这个速度,这个价格的,没什么其他好选择

    AI硬件

  • 换了好几个模型,有些简单问题AI就是很难回答上来
    S sospda

    包括qwen3.6 27B 和 35B A3B 等模型在这类问题上表现都不好

    人工查看当然快,现在其实就是测试模型的智能程度,

    如果什么都讲清楚了,就没必要这个ai来做推理判断了。

    说明还有改进空间。

    LLM讨论区

  • 换了好几个模型,有些简单问题AI就是很难回答上来
    S sospda

    实际上是能联网的,用的hermes agent ,
    就是反复查询各种网站,给不出结果。
    你们也可以用自己的本地模型试试。

    LLM讨论区

  • 换了好几个模型,有些简单问题AI就是很难回答上来
    S sospda

    问它,查询上一场nba比赛的球队和比分,

    这么一个简单问题,本地模型就是很难回答上来。

    是因为网络限制吗?

    LLM讨论区

  • R9700 ai pro 32G 跑Qwen3.6 27B q6k 速度实测
    S sospda

    系统ubuntu,26.04

    AI硬件

  • R9700 ai pro 32G 跑Qwen3.6 27B q6k 速度实测
    S sospda

    上下文,第1图96k,第3图64k。

    AI硬件

  • R9700 ai pro 32G 跑大模型还是很给力的,速度也不错
    S sospda

    因为有些场景根部不需要特别严密和精准的逻辑推理, 只要能在一定范围内把一件事情定性就可以了。

    有些简单推理场景下,35B A3B 和27B 达到的效果相同,但是速度差别极大。

    有些本地的知识库,35B A3B 计算完只需要17.86s, 完全相同的场景用27B居然要117.06s.

    体感差异巨大,所以在这种简单场景下,肯定就选35B了。

    只能说各有强项,各有所用吧,根据自己的实际需要来确定用哪个模型。

    AI硬件 amd r9700

  • R9700 ai pro 32G 跑Qwen3.6 27B q6k 速度实测
    S sospda

    777.png

    Q4 KM 速度比Q6K稍微快一点

    AI硬件

  • 7900xtx vs r9700 llm速度对比
    S sospda

    2222.jpg

    R9700+ 27B

    AI硬件

  • R9700 ai pro 32G 跑Qwen3.6 27B q6k 速度实测
    S sospda

    65656.png

    vllm也能跑通

    AI硬件

  • R9700 ai pro 32G 跑Qwen3.6 27B q6k 速度实测
    S sospda

    (2222.jpg

    Q6版本, 如果是Q4 速度会更快一些

    投机采样 32.8tokens/s
    正常模式 约20tokens/s, 忘记拍照了,大约21 左右

    AI硬件

  • 交作业:X99 CD3+E5 2666 +128G DDR3 + AMD AI Pro 9700,成功安装ubuntu,等不及跟大家分享。后续再更新
    S sospda

    我给的数字就是AC端功耗。 实际上我用的时候,满载最大功耗480W , 待机最低功耗58W。考虑到E5待机比我现在电脑高10W , E5待机算是70W. 满载算得是550W 。这个数字还是相对靠谱的。 是用功率插座测试得到的实际功耗。r9700的待机功耗非常低。整机加起来才58W。

    AI硬件 amd r9700

  • R9700 ai pro 32G 跑大模型还是很给力的,速度也不错
    S sospda

    其实各种模型都装过的, 不下10种, 这个35B A3B跑下来没什么问题,比较流畅。用起来相对够用,简单数学题也都能跑。暂时留下了,其他模型也都还在试, 看哪个好用就留哪个。

    AI硬件 amd r9700

  • 交作业:X99 CD3+E5 2666 +128G DDR3 + AMD AI Pro 9700,成功安装ubuntu,等不及跟大家分享。后续再更新
    S sospda

    估计550W左右, 满载。 待机功耗70w左右。 估计的,r9700我有, E5我也有,但组合在一起没有跑过。

    AI硬件 amd r9700

  • AMD 5700G 32G 7900XTX windows11 llama.cpp Windows x64 (Vulkan)跑Qwen3.6-35B-A3B-UD-Q4_K_S交作业
    S sospda

    r9700 用Qwen3.6-35B-A3B-UD-Q6_K 没问题,速度还是很快, 96K上下文,速度还是不错。
    不搞严格推理,数学计算啥的,不需要全参数模型, A3B一般也够了。
    不过多尝试一下模型也没问题

    AI硬件 amd 7900xtx

  • R9700 ai pro 32G 跑大模型还是很给力的,速度也不错
    S sospda

    llama下面,vllm配置很麻烦

    AI硬件 amd r9700

  • 关于AMD/INTEL 下一步的显卡发布计划。
    S sospda

    现在intel要靠着NV吃饭,它有胆子抢NV的饭碗?

    AI硬件

  • AMD 5700G 32G 7900XTX windows11 llama.cpp Windows x64 (Vulkan)跑Qwen3.6-35B-A3B-UD-Q4_K_S交作业
    S sospda

    用5700G的核显开16G显存都能跑一些小模型。
    哈哈

    AI硬件 amd 7900xtx

  • R9700 ai pro 32G 跑大模型还是很给力的,速度也不错
    S sospda

    Qwen3.6 35B A3B UD Q6模型

    96K上下文缓存,

    67.28 token/s
    微信图片_20260527213647_19_2.jpg

    AI硬件 amd r9700
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组