跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 请教:ASUS Ascent GX10

请教:ASUS Ascent GX10

已定时 已固定 已锁定 已移动 AI硬件
17 帖子 7 发布者 167 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 咫尺天涯咫 咫尺天涯

    我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

    terryT 离线
    terryT 离线
    terry
    编写于 最后由 编辑
    #8

    @咫尺天涯 50多岁AI时代还是小伙子,认真锻炼身体,这代人活120以上不是问题。

    1 条回复 最后回复
    0
    • benton yiB 在线
      benton yiB 在线
      benton yi
      编写于 最后由 benton yi 编辑
      #9

      微信图片_20260506205439_201.jpg

      先说说我的需求:我老婆那边有个成形了的做手作玩具的xhs账号,需要“文/图生图”持续产出可能会有版权纠纷的手作玩具图片,图生视频放到笔记里打造爆款,以及图生建模给到她的上游供应链打印模具。我这边用claude code氛围开发的也有两条线:1是上班时期自己想抽空做的个项目,目前已经出了一版正在迭代;还有一个自制的手游app需求也基本上厘清了也在排队;另外社交网络上也有固定自己设计打造的IP尝试做漫画或动画。所以基本上就是claude code/Trae和ComfyUI是硬需求,另外hermes也在玩票,想看能不能固化一些流程。
      自己原来有一台9950x + 4090 + 192G内存的台式机,运行ComfyUI生图还行,大量生视频确实力不从心。之前也是想过用DGX Spark来搞定ComfyUI和智能体的推理大模型,就在Gemini,GPT和Grok和豆包都问过同样的一组问题。把自己的实际需求和当前已有的设备统统写进提示词,也是很有意思,看各大知名ai在线给我营业:从DGX vs M3Ultra Studio的Studio胜,然后被gemini推荐RTX Pro系列,到又换MacStudio vs RTX Pro5000/6000各大知名ai又给我营业了几轮,大部分是RTX Pro胜。
      然后开始关注这个频道,看完了UP的每期视频和之前老特说的每期视频,下定决心了入的RTX Pro。
      之前在win下面一直用lms试吃,ollama生产(qwen3.6:27b_q8_0上下文256k能到35~38t/s)。系统换到Linux之后ollama确实快了一些。但是在各ai的强烈推荐下,Linux下的生产环境SGLang>vLLM>>llama.cpp>ollama。于是先是尝试docker安装了SGLang,捣鼓了2个晚上装了2次回复都是乱码(后来在论坛发现有人说SGLang框架推理qwen3.6-27b-fp8就是有乱码,要坐等框架更新)。于是开始尝试vLLM,才有了上面的图。运行参数如下:
      vllm serve /home/bentonyi/.cache/modelscope/hub/models/Qwen/Qwen3.6-27B-FP8
      --trust-remote-code
      --quantization fp8
      --max-model-len 262144
      --enable-auto-tool-choice
      --max-num-seqs 32
      --tool-call-parser qwen3_coder
      --reasoning-parser qwen3
      --speculative-config '{"method":"qwen3_next_mtp","num_speculative_tokens":4}'
      --host 0.0.0.0
      --port 8000
      设置猜字的mtp并发为4的时候,有效token速度可以超过400t/s。本地的hermes速度能达到接近之前用minimax2.7新手包套餐的在线速度,终于可用了。
      另:涡轮版本的RTX Pro风扇策略偏静音,不调的情况下工作温度在85~88℃范围。图中的温控工具是LACT,按此设置重度连续工作1小时不会上80℃。

      省流版:用心写一组提示词,把自己的需求现状和担心的点告诉知名ai众,让它们在线给你营业,然后交叉验证各ai的回答,往往能解决90%以上的问题。😁

      terryT 1 条回复 最后回复
      0
      • benton yiB benton yi

        微信图片_20260506205439_201.jpg

        先说说我的需求:我老婆那边有个成形了的做手作玩具的xhs账号,需要“文/图生图”持续产出可能会有版权纠纷的手作玩具图片,图生视频放到笔记里打造爆款,以及图生建模给到她的上游供应链打印模具。我这边用claude code氛围开发的也有两条线:1是上班时期自己想抽空做的个项目,目前已经出了一版正在迭代;还有一个自制的手游app需求也基本上厘清了也在排队;另外社交网络上也有固定自己设计打造的IP尝试做漫画或动画。所以基本上就是claude code/Trae和ComfyUI是硬需求,另外hermes也在玩票,想看能不能固化一些流程。
        自己原来有一台9950x + 4090 + 192G内存的台式机,运行ComfyUI生图还行,大量生视频确实力不从心。之前也是想过用DGX Spark来搞定ComfyUI和智能体的推理大模型,就在Gemini,GPT和Grok和豆包都问过同样的一组问题。把自己的实际需求和当前已有的设备统统写进提示词,也是很有意思,看各大知名ai在线给我营业:从DGX vs M3Ultra Studio的Studio胜,然后被gemini推荐RTX Pro系列,到又换MacStudio vs RTX Pro5000/6000各大知名ai又给我营业了几轮,大部分是RTX Pro胜。
        然后开始关注这个频道,看完了UP的每期视频和之前老特说的每期视频,下定决心了入的RTX Pro。
        之前在win下面一直用lms试吃,ollama生产(qwen3.6:27b_q8_0上下文256k能到35~38t/s)。系统换到Linux之后ollama确实快了一些。但是在各ai的强烈推荐下,Linux下的生产环境SGLang>vLLM>>llama.cpp>ollama。于是先是尝试docker安装了SGLang,捣鼓了2个晚上装了2次回复都是乱码(后来在论坛发现有人说SGLang框架推理qwen3.6-27b-fp8就是有乱码,要坐等框架更新)。于是开始尝试vLLM,才有了上面的图。运行参数如下:
        vllm serve /home/bentonyi/.cache/modelscope/hub/models/Qwen/Qwen3.6-27B-FP8
        --trust-remote-code
        --quantization fp8
        --max-model-len 262144
        --enable-auto-tool-choice
        --max-num-seqs 32
        --tool-call-parser qwen3_coder
        --reasoning-parser qwen3
        --speculative-config '{"method":"qwen3_next_mtp","num_speculative_tokens":4}'
        --host 0.0.0.0
        --port 8000
        设置猜字的mtp并发为4的时候,有效token速度可以超过400t/s。本地的hermes速度能达到接近之前用minimax2.7新手包套餐的在线速度,终于可用了。
        另:涡轮版本的RTX Pro风扇策略偏静音,不调的情况下工作温度在85~88℃范围。图中的温控工具是LACT,按此设置重度连续工作1小时不会上80℃。

        省流版:用心写一组提示词,把自己的需求现状和担心的点告诉知名ai众,让它们在线给你营业,然后交叉验证各ai的回答,往往能解决90%以上的问题。😁

        terryT 离线
        terryT 离线
        terry
        编写于 最后由 编辑
        #10

        @benton-yi 这么好的经验多发发,给我们也都参考下。我没有帮你什么,知识分享我的经验教训,你自己原本就懂这些。你的很多经验我也需要。

        1 条回复 最后回复
        0
        • Kk HhK 离线
          Kk HhK 离线
          Kk Hh
          编写于 最后由 编辑
          #11

          DGX Spark 问题就是热加慢。好处就是没有显存焦虑,没有长文本焦虑,价格相对便宜。DGX Spark 本来就慢两台放一起更慢,你要是觉得一台能跑DGX Spark 你就买,两台不建议,做视频也不用考虑肯定慢。DGX Spark 定位我觉得就是单台小模型长文本。

          1 条回复 最后回复
          0
          • Kk HhK 离线
            Kk HhK 离线
            Kk Hh
            编写于 最后由 Kk Hh 编辑
            #12

            776e0b7f-5b44-4f62-9e7d-ddcb587fcf86-image.jpeg
            一个小模型你不着急速度,全是Q8精度 256KTOEKN 长度,两个并发,跑起来挺好的,反正对的起这个价格。你要是既要又要,那就别买DGX SPARK。

            1 条回复 最后回复
            0
            • Fangbo DaF Fangbo Da

              版主您好:
              1、“抡锤者”每一个视频我都追更、看过,这是目前我最喜爱的AI相关频道,没有之一。
              2、首先声明,我只是个自己瞎琢磨一年多的老人(50+),只用过4060卡玩本地,和API用openrouter,主要是写长篇小说。我不是大款,更不是有钱,但就是喜欢玩,所以今天的提问,请千万不要误会、不要喷,谢谢大家。
              3、我想本地部署 DeepSeek-V4-Flash,如果可以为了学习自己训练和微调那就最好(纯粹是向往,目前不会),这样既有安全性,也不怕资源消耗。
              4、另外就是本地运行Qwen3.6 27b本地跑Hermes,然后就是通过本地部署,做AI音视频画图。

              所以,我想请问:
              1、买 ASUS Ascent GX10 ( NVIDIA DGX Spark)合适么?或者买两台串联?
              2、我知道两台 ASUS Ascent GX10 ,可以放 DeepSeek-V4-Flash ,但不知道视频生成怎么样?
              3、我从你这里知道,视频生成用 5090 (32G)是极好的。因为目前一块5090的价格和一个ASUS Ascent GX10 (NVIDIA DGX Spark)价格差不多,而买5090我要配一台新机,价格大约5W,这个价格不如我花6W买两台ASUS Ascent GX10 ,然后连接我的老机器。

              所以特地请教您,请不要笑话😥

              Kk HhK 离线
              Kk HhK 离线
              Kk Hh
              编写于 最后由 Kk Hh 编辑
              #13

              @Fangbo-Da 我觉得把你真的没有必要折腾,DeepSeek-V4-Flash 这个模型精度就不高。你先买个云端的玩几天你再想想你用什么模型吧,模型决定设备。 这个云端模型我也不知道你用的是什么, 反正我是OLLAMA CLOUD ,全是满血免费大模型,那个顺手用那个。459c0f92-4b22-46fb-af59-10530c9341a1-image.jpeg a5d04717-03c6-49dc-b0ab-cc452a4aa8f3-image.jpeg
              你这个需求OLLAMA CLOUD 一个月20美金 的订阅我觉得就够了,最差你也感受一下到底要用什么模型。你偏要做视频,你就买个5090最好了,直接出视频。
              这里是OLLAMA 的模型列表 https://ollama.com/search
              DGX SPARK 就是做了一个小模型的定位填补,因为这些小模型很少有云端提供服务。

              terryT 1 条回复 最后回复
              0
              • Kk HhK Kk Hh

                @Fangbo-Da 我觉得把你真的没有必要折腾,DeepSeek-V4-Flash 这个模型精度就不高。你先买个云端的玩几天你再想想你用什么模型吧,模型决定设备。 这个云端模型我也不知道你用的是什么, 反正我是OLLAMA CLOUD ,全是满血免费大模型,那个顺手用那个。459c0f92-4b22-46fb-af59-10530c9341a1-image.jpeg a5d04717-03c6-49dc-b0ab-cc452a4aa8f3-image.jpeg
                你这个需求OLLAMA CLOUD 一个月20美金 的订阅我觉得就够了,最差你也感受一下到底要用什么模型。你偏要做视频,你就买个5090最好了,直接出视频。
                这里是OLLAMA 的模型列表 https://ollama.com/search
                DGX SPARK 就是做了一个小模型的定位填补,因为这些小模型很少有云端提供服务。

                terryT 离线
                terryT 离线
                terry
                编写于 最后由 编辑
                #14

                @Kk-Hh 数据很详细,有图有真相。

                1 条回复 最后回复
                0
                • jenaflexJ 离线
                  jenaflexJ 离线
                  jenaflex
                  编写于 最后由 编辑
                  #15

                  我觉得带oculink的AI Max395 128G,加上一个外接4080S 32G,也是一个可行的方案。这样AI Max395 可以跑120b moe(知识库比较广,偏玩具性质),4080S 32G干活。

                  期待下一代,直接出一个AI Max 495,直接带PCIE插槽 就好了。

                  1 条回复 最后回复
                  0
                  • 咫尺天涯咫 咫尺天涯

                    我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

                    Fangbo DaF 离线
                    Fangbo DaF 离线
                    Fangbo Da
                    编写于 最后由 编辑
                    #16

                    咫尺天涯

                    谢谢鼓励。

                    1 条回复 最后回复
                    0
                    • jenaflexJ jenaflex

                      TLDR:新手不要碰DGX Spark(GB10)
                      DGX Spark的芯片SM121最初的设计是一个 游戏APU和AI 两吃产品,并且跳票了超过一年多(出处:https://youtu.be/o8FL3nVDM5M?si=byA9yR5k0U8MTAI5)。因为游戏APU是需要Windows for Arm的适配,而微软那个屎山Bug巨多无比。所以等不及了,只能先开卖DGX Spark。SM121芯片和NV专业芯片设计有很多区别,导致生态和支持一直有问题(被NV论坛诟病很多),这么小众的产品(而且还是和半成品),你不能指望NV会让团队花很多精力去修正生态问题。

                      Fangbo DaF 离线
                      Fangbo DaF 离线
                      Fangbo Da
                      编写于 最后由 编辑
                      #17

                      @jenaflex
                      非常感谢。绝不碰😊

                      1 条回复 最后回复
                      0

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 登录或注册以进行搜索。
                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组