跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 请教:ASUS Ascent GX10

请教:ASUS Ascent GX10

已定时 已固定 已锁定 已移动 AI硬件
17 帖子 7 发布者 167 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 暧 离线
    暧 离线
    暧昧光影
    编写于 最后由 编辑
    #6

    买nvdia的卡目前保值率还可以,后期不需要了也不会亏太多。GB10音视频输出没研究过,但是根据参数也知道不会太好。有条件的还是上5090或者PRO 6000.另外5090的主机要到不了5W。咸鱼上面的二手或者攒硬件大概4W不到可以弄一台9950x3D+64G+2T+5090的主机

    1 条回复 最后回复
    0
    • Fangbo DaF Fangbo Da

      版主您好:
      1、“抡锤者”每一个视频我都追更、看过,这是目前我最喜爱的AI相关频道,没有之一。
      2、首先声明,我只是个自己瞎琢磨一年多的老人(50+),只用过4060卡玩本地,和API用openrouter,主要是写长篇小说。我不是大款,更不是有钱,但就是喜欢玩,所以今天的提问,请千万不要误会、不要喷,谢谢大家。
      3、我想本地部署 DeepSeek-V4-Flash,如果可以为了学习自己训练和微调那就最好(纯粹是向往,目前不会),这样既有安全性,也不怕资源消耗。
      4、另外就是本地运行Qwen3.6 27b本地跑Hermes,然后就是通过本地部署,做AI音视频画图。

      所以,我想请问:
      1、买 ASUS Ascent GX10 ( NVIDIA DGX Spark)合适么?或者买两台串联?
      2、我知道两台 ASUS Ascent GX10 ,可以放 DeepSeek-V4-Flash ,但不知道视频生成怎么样?
      3、我从你这里知道,视频生成用 5090 (32G)是极好的。因为目前一块5090的价格和一个ASUS Ascent GX10 (NVIDIA DGX Spark)价格差不多,而买5090我要配一台新机,价格大约5W,这个价格不如我花6W买两台ASUS Ascent GX10 ,然后连接我的老机器。

      所以特地请教您,请不要笑话😥

      terryT 离线
      terryT 离线
      terry
      编写于 最后由 编辑
      #7

      @Fangbo-Da 兄弟,这个问题,给你单独做一起视频讲解,如何?另外不要说我的频道有多少,只是平台给了点流量而已,我知道有很多博主的内容做的比我好,我只是讲入门类的知识比较多,你们觉得离自己更近。我自己什么水平还是很清楚的,但是我确实是实战派的,我能解决问题。你的问题稍晚来看视频,我还要回复下帖子,给英语频道发视频,明晚最迟后天中午发你的解答视频。

      1 条回复 最后回复
      1
      • 咫尺天涯咫 咫尺天涯

        我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

        terryT 离线
        terryT 离线
        terry
        编写于 最后由 编辑
        #8

        @咫尺天涯 50多岁AI时代还是小伙子,认真锻炼身体,这代人活120以上不是问题。

        1 条回复 最后回复
        0
        • benton yiB 离线
          benton yiB 离线
          benton yi
          编写于 最后由 benton yi 编辑
          #9

          微信图片_20260506205439_201.jpg

          先说说我的需求:我老婆那边有个成形了的做手作玩具的xhs账号,需要“文/图生图”持续产出可能会有版权纠纷的手作玩具图片,图生视频放到笔记里打造爆款,以及图生建模给到她的上游供应链打印模具。我这边用claude code氛围开发的也有两条线:1是上班时期自己想抽空做的个项目,目前已经出了一版正在迭代;还有一个自制的手游app需求也基本上厘清了也在排队;另外社交网络上也有固定自己设计打造的IP尝试做漫画或动画。所以基本上就是claude code/Trae和ComfyUI是硬需求,另外hermes也在玩票,想看能不能固化一些流程。
          自己原来有一台9950x + 4090 + 192G内存的台式机,运行ComfyUI生图还行,大量生视频确实力不从心。之前也是想过用DGX Spark来搞定ComfyUI和智能体的推理大模型,就在Gemini,GPT和Grok和豆包都问过同样的一组问题。把自己的实际需求和当前已有的设备统统写进提示词,也是很有意思,看各大知名ai在线给我营业:从DGX vs M3Ultra Studio的Studio胜,然后被gemini推荐RTX Pro系列,到又换MacStudio vs RTX Pro5000/6000各大知名ai又给我营业了几轮,大部分是RTX Pro胜。
          然后开始关注这个频道,看完了UP的每期视频和之前老特说的每期视频,下定决心了入的RTX Pro。
          之前在win下面一直用lms试吃,ollama生产(qwen3.6:27b_q8_0上下文256k能到35~38t/s)。系统换到Linux之后ollama确实快了一些。但是在各ai的强烈推荐下,Linux下的生产环境SGLang>vLLM>>llama.cpp>ollama。于是先是尝试docker安装了SGLang,捣鼓了2个晚上装了2次回复都是乱码(后来在论坛发现有人说SGLang框架推理qwen3.6-27b-fp8就是有乱码,要坐等框架更新)。于是开始尝试vLLM,才有了上面的图。运行参数如下:
          vllm serve /home/bentonyi/.cache/modelscope/hub/models/Qwen/Qwen3.6-27B-FP8
          --trust-remote-code
          --quantization fp8
          --max-model-len 262144
          --enable-auto-tool-choice
          --max-num-seqs 32
          --tool-call-parser qwen3_coder
          --reasoning-parser qwen3
          --speculative-config '{"method":"qwen3_next_mtp","num_speculative_tokens":4}'
          --host 0.0.0.0
          --port 8000
          设置猜字的mtp并发为4的时候,有效token速度可以超过400t/s。本地的hermes速度能达到接近之前用minimax2.7新手包套餐的在线速度,终于可用了。
          另:涡轮版本的RTX Pro风扇策略偏静音,不调的情况下工作温度在85~88℃范围。图中的温控工具是LACT,按此设置重度连续工作1小时不会上80℃。

          省流版:用心写一组提示词,把自己的需求现状和担心的点告诉知名ai众,让它们在线给你营业,然后交叉验证各ai的回答,往往能解决90%以上的问题。😁

          terryT 1 条回复 最后回复
          0
          • benton yiB benton yi

            微信图片_20260506205439_201.jpg

            先说说我的需求:我老婆那边有个成形了的做手作玩具的xhs账号,需要“文/图生图”持续产出可能会有版权纠纷的手作玩具图片,图生视频放到笔记里打造爆款,以及图生建模给到她的上游供应链打印模具。我这边用claude code氛围开发的也有两条线:1是上班时期自己想抽空做的个项目,目前已经出了一版正在迭代;还有一个自制的手游app需求也基本上厘清了也在排队;另外社交网络上也有固定自己设计打造的IP尝试做漫画或动画。所以基本上就是claude code/Trae和ComfyUI是硬需求,另外hermes也在玩票,想看能不能固化一些流程。
            自己原来有一台9950x + 4090 + 192G内存的台式机,运行ComfyUI生图还行,大量生视频确实力不从心。之前也是想过用DGX Spark来搞定ComfyUI和智能体的推理大模型,就在Gemini,GPT和Grok和豆包都问过同样的一组问题。把自己的实际需求和当前已有的设备统统写进提示词,也是很有意思,看各大知名ai在线给我营业:从DGX vs M3Ultra Studio的Studio胜,然后被gemini推荐RTX Pro系列,到又换MacStudio vs RTX Pro5000/6000各大知名ai又给我营业了几轮,大部分是RTX Pro胜。
            然后开始关注这个频道,看完了UP的每期视频和之前老特说的每期视频,下定决心了入的RTX Pro。
            之前在win下面一直用lms试吃,ollama生产(qwen3.6:27b_q8_0上下文256k能到35~38t/s)。系统换到Linux之后ollama确实快了一些。但是在各ai的强烈推荐下,Linux下的生产环境SGLang>vLLM>>llama.cpp>ollama。于是先是尝试docker安装了SGLang,捣鼓了2个晚上装了2次回复都是乱码(后来在论坛发现有人说SGLang框架推理qwen3.6-27b-fp8就是有乱码,要坐等框架更新)。于是开始尝试vLLM,才有了上面的图。运行参数如下:
            vllm serve /home/bentonyi/.cache/modelscope/hub/models/Qwen/Qwen3.6-27B-FP8
            --trust-remote-code
            --quantization fp8
            --max-model-len 262144
            --enable-auto-tool-choice
            --max-num-seqs 32
            --tool-call-parser qwen3_coder
            --reasoning-parser qwen3
            --speculative-config '{"method":"qwen3_next_mtp","num_speculative_tokens":4}'
            --host 0.0.0.0
            --port 8000
            设置猜字的mtp并发为4的时候,有效token速度可以超过400t/s。本地的hermes速度能达到接近之前用minimax2.7新手包套餐的在线速度,终于可用了。
            另:涡轮版本的RTX Pro风扇策略偏静音,不调的情况下工作温度在85~88℃范围。图中的温控工具是LACT,按此设置重度连续工作1小时不会上80℃。

            省流版:用心写一组提示词,把自己的需求现状和担心的点告诉知名ai众,让它们在线给你营业,然后交叉验证各ai的回答,往往能解决90%以上的问题。😁

            terryT 离线
            terryT 离线
            terry
            编写于 最后由 编辑
            #10

            @benton-yi 这么好的经验多发发,给我们也都参考下。我没有帮你什么,知识分享我的经验教训,你自己原本就懂这些。你的很多经验我也需要。

            1 条回复 最后回复
            0
            • Kk HhK 离线
              Kk HhK 离线
              Kk Hh
              编写于 最后由 编辑
              #11

              DGX Spark 问题就是热加慢。好处就是没有显存焦虑,没有长文本焦虑,价格相对便宜。DGX Spark 本来就慢两台放一起更慢,你要是觉得一台能跑DGX Spark 你就买,两台不建议,做视频也不用考虑肯定慢。DGX Spark 定位我觉得就是单台小模型长文本。

              1 条回复 最后回复
              0
              • Kk HhK 离线
                Kk HhK 离线
                Kk Hh
                编写于 最后由 Kk Hh 编辑
                #12

                776e0b7f-5b44-4f62-9e7d-ddcb587fcf86-image.jpeg
                一个小模型你不着急速度,全是Q8精度 256KTOEKN 长度,两个并发,跑起来挺好的,反正对的起这个价格。你要是既要又要,那就别买DGX SPARK。

                1 条回复 最后回复
                0
                • Fangbo DaF Fangbo Da

                  版主您好:
                  1、“抡锤者”每一个视频我都追更、看过,这是目前我最喜爱的AI相关频道,没有之一。
                  2、首先声明,我只是个自己瞎琢磨一年多的老人(50+),只用过4060卡玩本地,和API用openrouter,主要是写长篇小说。我不是大款,更不是有钱,但就是喜欢玩,所以今天的提问,请千万不要误会、不要喷,谢谢大家。
                  3、我想本地部署 DeepSeek-V4-Flash,如果可以为了学习自己训练和微调那就最好(纯粹是向往,目前不会),这样既有安全性,也不怕资源消耗。
                  4、另外就是本地运行Qwen3.6 27b本地跑Hermes,然后就是通过本地部署,做AI音视频画图。

                  所以,我想请问:
                  1、买 ASUS Ascent GX10 ( NVIDIA DGX Spark)合适么?或者买两台串联?
                  2、我知道两台 ASUS Ascent GX10 ,可以放 DeepSeek-V4-Flash ,但不知道视频生成怎么样?
                  3、我从你这里知道,视频生成用 5090 (32G)是极好的。因为目前一块5090的价格和一个ASUS Ascent GX10 (NVIDIA DGX Spark)价格差不多,而买5090我要配一台新机,价格大约5W,这个价格不如我花6W买两台ASUS Ascent GX10 ,然后连接我的老机器。

                  所以特地请教您,请不要笑话😥

                  Kk HhK 离线
                  Kk HhK 离线
                  Kk Hh
                  编写于 最后由 Kk Hh 编辑
                  #13

                  @Fangbo-Da 我觉得把你真的没有必要折腾,DeepSeek-V4-Flash 这个模型精度就不高。你先买个云端的玩几天你再想想你用什么模型吧,模型决定设备。 这个云端模型我也不知道你用的是什么, 反正我是OLLAMA CLOUD ,全是满血免费大模型,那个顺手用那个。459c0f92-4b22-46fb-af59-10530c9341a1-image.jpeg a5d04717-03c6-49dc-b0ab-cc452a4aa8f3-image.jpeg
                  你这个需求OLLAMA CLOUD 一个月20美金 的订阅我觉得就够了,最差你也感受一下到底要用什么模型。你偏要做视频,你就买个5090最好了,直接出视频。
                  这里是OLLAMA 的模型列表 https://ollama.com/search
                  DGX SPARK 就是做了一个小模型的定位填补,因为这些小模型很少有云端提供服务。

                  terryT 1 条回复 最后回复
                  0
                  • Kk HhK Kk Hh

                    @Fangbo-Da 我觉得把你真的没有必要折腾,DeepSeek-V4-Flash 这个模型精度就不高。你先买个云端的玩几天你再想想你用什么模型吧,模型决定设备。 这个云端模型我也不知道你用的是什么, 反正我是OLLAMA CLOUD ,全是满血免费大模型,那个顺手用那个。459c0f92-4b22-46fb-af59-10530c9341a1-image.jpeg a5d04717-03c6-49dc-b0ab-cc452a4aa8f3-image.jpeg
                    你这个需求OLLAMA CLOUD 一个月20美金 的订阅我觉得就够了,最差你也感受一下到底要用什么模型。你偏要做视频,你就买个5090最好了,直接出视频。
                    这里是OLLAMA 的模型列表 https://ollama.com/search
                    DGX SPARK 就是做了一个小模型的定位填补,因为这些小模型很少有云端提供服务。

                    terryT 离线
                    terryT 离线
                    terry
                    编写于 最后由 编辑
                    #14

                    @Kk-Hh 数据很详细,有图有真相。

                    1 条回复 最后回复
                    0
                    • jenaflexJ 离线
                      jenaflexJ 离线
                      jenaflex
                      编写于 最后由 编辑
                      #15

                      我觉得带oculink的AI Max395 128G,加上一个外接4080S 32G,也是一个可行的方案。这样AI Max395 可以跑120b moe(知识库比较广,偏玩具性质),4080S 32G干活。

                      期待下一代,直接出一个AI Max 495,直接带PCIE插槽 就好了。

                      1 条回复 最后回复
                      0
                      • 咫尺天涯咫 咫尺天涯

                        我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

                        Fangbo DaF 离线
                        Fangbo DaF 离线
                        Fangbo Da
                        编写于 最后由 编辑
                        #16

                        咫尺天涯

                        谢谢鼓励。

                        1 条回复 最后回复
                        0
                        • jenaflexJ jenaflex

                          TLDR:新手不要碰DGX Spark(GB10)
                          DGX Spark的芯片SM121最初的设计是一个 游戏APU和AI 两吃产品,并且跳票了超过一年多(出处:https://youtu.be/o8FL3nVDM5M?si=byA9yR5k0U8MTAI5)。因为游戏APU是需要Windows for Arm的适配,而微软那个屎山Bug巨多无比。所以等不及了,只能先开卖DGX Spark。SM121芯片和NV专业芯片设计有很多区别,导致生态和支持一直有问题(被NV论坛诟病很多),这么小众的产品(而且还是和半成品),你不能指望NV会让团队花很多精力去修正生态问题。

                          Fangbo DaF 离线
                          Fangbo DaF 离线
                          Fangbo Da
                          编写于 最后由 编辑
                          #17

                          @jenaflex
                          非常感谢。绝不碰😊

                          1 条回复 最后回复
                          0

                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                          有了你的建议,这篇帖子会更精彩哦 💗

                          注册 登录
                          回复
                          • 在新帖中回复
                          登录后回复
                          • 从旧到新
                          • 从新到旧
                          • 最多赞同


                          • 登录

                          • 没有帐号? 注册

                          • 登录或注册以进行搜索。
                          • 第一个帖子
                            最后一个帖子
                          0
                          • 版块
                          • 最新
                          • 标签
                          • 热门
                          • 用户
                          • 群组