跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 京东自营上了5090、6000pro,应该怎么选。

京东自营上了5090、6000pro,应该怎么选。

已定时 已固定 已锁定 已移动 AI硬件
9 帖子 4 发布者 231 浏览 1 关注中
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 王一民王 离线
    王一民王 离线
    王一民
    编写于 最后由 编辑
    #1

    目前的需求是想跑localLLM(也就是qwen3.6-27B)来支持hermes agent。图、音、视频的本地生成是可选项。
    目前京东自营的价格是5090 33331, RTX PRO 6000的工作站版本和MAX-Q版本都是72634。

    想问一下锤哥和大家,这二者从性价比的角度考虑如何选择与解读。网上有种论调是RTX PRO 6000 的96GB显存其实比较鸡肋。稍大的模型跑不了,小模型又overkill。

    我能想到的对于96GB显存最好的使用场景就是localLLM+本地音视频,5090的32GB显存应该是满足不了同时LLM和图片文生图的。

    不知道各位怎么理解。

    虚心交流,一起进步

    terryT 1 条回复 最后回复
    0
    • 王一民王 王一民

      目前的需求是想跑localLLM(也就是qwen3.6-27B)来支持hermes agent。图、音、视频的本地生成是可选项。
      目前京东自营的价格是5090 33331, RTX PRO 6000的工作站版本和MAX-Q版本都是72634。

      想问一下锤哥和大家,这二者从性价比的角度考虑如何选择与解读。网上有种论调是RTX PRO 6000 的96GB显存其实比较鸡肋。稍大的模型跑不了,小模型又overkill。

      我能想到的对于96GB显存最好的使用场景就是localLLM+本地音视频,5090的32GB显存应该是满足不了同时LLM和图片文生图的。

      不知道各位怎么理解。

      terryT 在线
      terryT 在线
      terry
      编写于 最后由 编辑
      #2

      @王一民 4090 48G或者RTX Pro6000,有钱就上6000,一步到位,是有性能过剩的嫌疑,这是事实,但5090确实有显存不够用的时候。你就算买RTX Pro6000,也最好不要同时用它跑模型和生图,因为抢资源你不好控制。也可以卖一个32G的4080S搭配5090或者RTX pro5000.

      王一民王 benton yiB 2 条回复 最后回复
      0
      • terryT terry

        @王一民 4090 48G或者RTX Pro6000,有钱就上6000,一步到位,是有性能过剩的嫌疑,这是事实,但5090确实有显存不够用的时候。你就算买RTX Pro6000,也最好不要同时用它跑模型和生图,因为抢资源你不好控制。也可以卖一个32G的4080S搭配5090或者RTX pro5000.

        王一民王 离线
        王一民王 离线
        王一民
        编写于 最后由 编辑
        #3

        @terry 懂了,感谢锤哥,另外,提个小建议,好像在设置里设置账号昵称在论坛中没什么作用,之前发帖的用户名还是google的ID,直接大名出来了有点社死XD。

        虚心交流,一起进步

        1 条回复 最后回复
        0
        • terryT 在线
          terryT 在线
          terry
          编写于 最后由 编辑
          #4

          可以修改资料名,你自己研究下,我确定可以。

          1 条回复 最后回复
          0
          • D 离线
            D 离线
            Daniel
            编写于 最后由 编辑
            #5

            我买了4090 48G满血版,分了24期压力不大,可惜pro 6000不能分12或24期,要不然我就上pro6000了

            terryT 1 条回复 最后回复
            0
            • D Daniel

              我买了4090 48G满血版,分了24期压力不大,可惜pro 6000不能分12或24期,要不然我就上pro6000了

              terryT 在线
              terryT 在线
              terry
              编写于 最后由 编辑
              #6

              @Daniel 挺好的,买了就不要考虑这样那样,没有完美的硬件,这卡足够你用了。

              D 1 条回复 最后回复
              1
              • terryT terry

                @王一民 4090 48G或者RTX Pro6000,有钱就上6000,一步到位,是有性能过剩的嫌疑,这是事实,但5090确实有显存不够用的时候。你就算买RTX Pro6000,也最好不要同时用它跑模型和生图,因为抢资源你不好控制。也可以卖一个32G的4080S搭配5090或者RTX pro5000.

                benton yiB 离线
                benton yiB 离线
                benton yi
                编写于 最后由 benton yi 编辑
                #7

                @terry 个人认为与其称之为“性能过剩”的说法,不如还是“和需求不匹配”来的恰当。在这里想较个真哈,纯粹是阐述一下剖析底层需求的逻辑方法,如果能帮到硬件选型的朋友也算歪打正着了:
                1,假如像之前想买双DGX Spark的老哥说主要用来跑deepseek-v4-flash辅助写作,那么他需求的吐字速度就是比人眼阅读速度的极限快个2倍就行,因为他是真的要亲自来阅读模型输出的每个字的。他真正迫切的是VRAM要大到能装下聪明(大容量)的脑子,而50tokens/s和400tokens/s对老哥来说其实没有任何差异(心理上更爽带来的提升不算,没有实质命中需求)。
                2,举个自己的例子,我自己跑文生图/图生图是依赖comfyUI工作流(ERNIE或者Qwen-Image)的,通常在草稿阶段需要我根据老婆口述的模糊设计,自己写提示词让工作流生成800x800的样稿,然后给她过目再口述怎么改,我再改提示词如此往复,直到老婆大人满意定稿,我再输出高清图或者作为视频的关键帧再去制作视频。这个改稿的过程少则10几次,多则三四十次,偶尔途中可能还会推翻设计。那么20多秒出图就一定比1分钟出图更有效率,每一秒的提升在我这都是实实在在的。
                3,用来驱动Hermes跑定时任务or处理日杂事务,驱动claude code用来氛围开发或者像我作为操作Linux的中间层(我自己接触Linux起步较晚并不熟练,cc作为一根“Linux拐杖”简直深得我心,非常满意)。这类智能体会根据你布置给它的任务,从它自身的Harness里按范式一步一步尝试解决,虽然是会越来越聪明但那是在至少以周甚至月为尺度的多次复用情况下的。你临时给一个任务平均它就是要尝试10几次甚至二三十次才能搞定的,这种情况下IT(指令遵循)大模型输出的绝大部分内容都不需要你来阅读,纯属Agent<=>ITLLm之间的交互,你就坐等一个成功or失败的结果。这时候不论是prefill(LLM读)还是decode(LLM写),信我的你一定是希望越快越好,你不会希望给claude code说一句“按照上次的方式再重装一次SGLang框架”,1分钟快到了他才刚刚找到之前的memory开始读skills,你一定会Ctrl+C了自己来的。

                情况1就是算力有个保证超过阅读速度的门槛过了就行,往上看VRAM能够到哪个模型就花多少钱,是DGX还是MacStudioUltra256G,甚至10多个收一台512G的跑671B也随你喜欢;
                情况2和3就是Vram有个门槛过了就行,比如只跑qwen3.6-27b-q4_K_M@128kContext,但是速度能跑多快给我跑多快,你就挑大于22G显存(举个例子没具体算)的预算内的最好的gpu就行,能折腾想省钱就amd,不想折腾就nvidia;

                大概率不会跑偏。

                terryT 1 条回复 最后回复
                1
                • terryT terry

                  @Daniel 挺好的,买了就不要考虑这样那样,没有完美的硬件,这卡足够你用了。

                  D 离线
                  D 离线
                  Daniel
                  编写于 最后由 编辑
                  #8
                  此主題已被删除!
                  1 条回复 最后回复
                  0
                  • benton yiB benton yi

                    @terry 个人认为与其称之为“性能过剩”的说法,不如还是“和需求不匹配”来的恰当。在这里想较个真哈,纯粹是阐述一下剖析底层需求的逻辑方法,如果能帮到硬件选型的朋友也算歪打正着了:
                    1,假如像之前想买双DGX Spark的老哥说主要用来跑deepseek-v4-flash辅助写作,那么他需求的吐字速度就是比人眼阅读速度的极限快个2倍就行,因为他是真的要亲自来阅读模型输出的每个字的。他真正迫切的是VRAM要大到能装下聪明(大容量)的脑子,而50tokens/s和400tokens/s对老哥来说其实没有任何差异(心理上更爽带来的提升不算,没有实质命中需求)。
                    2,举个自己的例子,我自己跑文生图/图生图是依赖comfyUI工作流(ERNIE或者Qwen-Image)的,通常在草稿阶段需要我根据老婆口述的模糊设计,自己写提示词让工作流生成800x800的样稿,然后给她过目再口述怎么改,我再改提示词如此往复,直到老婆大人满意定稿,我再输出高清图或者作为视频的关键帧再去制作视频。这个改稿的过程少则10几次,多则三四十次,偶尔途中可能还会推翻设计。那么20多秒出图就一定比1分钟出图更有效率,每一秒的提升在我这都是实实在在的。
                    3,用来驱动Hermes跑定时任务or处理日杂事务,驱动claude code用来氛围开发或者像我作为操作Linux的中间层(我自己接触Linux起步较晚并不熟练,cc作为一根“Linux拐杖”简直深得我心,非常满意)。这类智能体会根据你布置给它的任务,从它自身的Harness里按范式一步一步尝试解决,虽然是会越来越聪明但那是在至少以周甚至月为尺度的多次复用情况下的。你临时给一个任务平均它就是要尝试10几次甚至二三十次才能搞定的,这种情况下IT(指令遵循)大模型输出的绝大部分内容都不需要你来阅读,纯属Agent<=>ITLLm之间的交互,你就坐等一个成功or失败的结果。这时候不论是prefill(LLM读)还是decode(LLM写),信我的你一定是希望越快越好,你不会希望给claude code说一句“按照上次的方式再重装一次SGLang框架”,1分钟快到了他才刚刚找到之前的memory开始读skills,你一定会Ctrl+C了自己来的。

                    情况1就是算力有个保证超过阅读速度的门槛过了就行,往上看VRAM能够到哪个模型就花多少钱,是DGX还是MacStudioUltra256G,甚至10多个收一台512G的跑671B也随你喜欢;
                    情况2和3就是Vram有个门槛过了就行,比如只跑qwen3.6-27b-q4_K_M@128kContext,但是速度能跑多快给我跑多快,你就挑大于22G显存(举个例子没具体算)的预算内的最好的gpu就行,能折腾想省钱就amd,不想折腾就nvidia;

                    大概率不会跑偏。

                    terryT 在线
                    terryT 在线
                    terry
                    编写于 最后由 编辑
                    #9

                    @benton-yi 很好的分享,赞同👍

                    1 条回复 最后回复
                    0

                    你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                    厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                    有了你的建议,这篇帖子会更精彩哦 💗

                    注册 登录
                    回复
                    • 在新帖中回复
                    登录后回复
                    • 从旧到新
                    • 从新到旧
                    • 最多赞同


                    • 登录

                    • 没有帐号? 注册

                    • 登录或注册以进行搜索。
                    • 第一个帖子
                      最后一个帖子
                    0
                    • 版块
                    • 最新
                    • 标签
                    • 热门
                    • 用户
                    • 群组