跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 请教:ASUS Ascent GX10

请教:ASUS Ascent GX10

已定时 已固定 已锁定 已移动 AI硬件
17 帖子 7 发布者 167 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • Fangbo DaF 离线
    Fangbo DaF 离线
    Fangbo Da
    编写于 最后由 编辑
    #2

    或者您给出一个建议,谢谢。

    1 条回复 最后回复
    0
    • Fangbo DaF 离线
      Fangbo DaF 离线
      Fangbo Da
      编写于 最后由 编辑
      #3

      还是用 RTX Pro6000 Max-Q 96G ,配一台新机?
      再次声明,我不是在这里调笑。就是看了您的视频,否决了我买 MAC Studio 256G的念头。

      咫尺天涯咫 1 条回复 最后回复
      0
      • jenaflexJ 离线
        jenaflexJ 离线
        jenaflex
        编写于 最后由 编辑
        #4

        TLDR:新手不要碰DGX Spark(GB10)
        DGX Spark的芯片SM121最初的设计是一个 游戏APU和AI 两吃产品,并且跳票了超过一年多(出处:https://youtu.be/o8FL3nVDM5M?si=byA9yR5k0U8MTAI5)。因为游戏APU是需要Windows for Arm的适配,而微软那个屎山Bug巨多无比。所以等不及了,只能先开卖DGX Spark。SM121芯片和NV专业芯片设计有很多区别,导致生态和支持一直有问题(被NV论坛诟病很多),这么小众的产品(而且还是和半成品),你不能指望NV会让团队花很多精力去修正生态问题。

        Fangbo DaF 1 条回复 最后回复
        0
        • Fangbo DaF Fangbo Da

          还是用 RTX Pro6000 Max-Q 96G ,配一台新机?
          再次声明,我不是在这里调笑。就是看了您的视频,否决了我买 MAC Studio 256G的念头。

          咫尺天涯咫 离线
          咫尺天涯咫 离线
          咫尺天涯
          编写于 最后由 编辑
          #5

          我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

          terryT Fangbo DaF 2 条回复 最后回复
          0
          • 暧 离线
            暧 离线
            暧昧光影
            编写于 最后由 编辑
            #6

            买nvdia的卡目前保值率还可以,后期不需要了也不会亏太多。GB10音视频输出没研究过,但是根据参数也知道不会太好。有条件的还是上5090或者PRO 6000.另外5090的主机要到不了5W。咸鱼上面的二手或者攒硬件大概4W不到可以弄一台9950x3D+64G+2T+5090的主机

            1 条回复 最后回复
            0
            • Fangbo DaF Fangbo Da

              版主您好:
              1、“抡锤者”每一个视频我都追更、看过,这是目前我最喜爱的AI相关频道,没有之一。
              2、首先声明,我只是个自己瞎琢磨一年多的老人(50+),只用过4060卡玩本地,和API用openrouter,主要是写长篇小说。我不是大款,更不是有钱,但就是喜欢玩,所以今天的提问,请千万不要误会、不要喷,谢谢大家。
              3、我想本地部署 DeepSeek-V4-Flash,如果可以为了学习自己训练和微调那就最好(纯粹是向往,目前不会),这样既有安全性,也不怕资源消耗。
              4、另外就是本地运行Qwen3.6 27b本地跑Hermes,然后就是通过本地部署,做AI音视频画图。

              所以,我想请问:
              1、买 ASUS Ascent GX10 ( NVIDIA DGX Spark)合适么?或者买两台串联?
              2、我知道两台 ASUS Ascent GX10 ,可以放 DeepSeek-V4-Flash ,但不知道视频生成怎么样?
              3、我从你这里知道,视频生成用 5090 (32G)是极好的。因为目前一块5090的价格和一个ASUS Ascent GX10 (NVIDIA DGX Spark)价格差不多,而买5090我要配一台新机,价格大约5W,这个价格不如我花6W买两台ASUS Ascent GX10 ,然后连接我的老机器。

              所以特地请教您,请不要笑话😥

              terryT 在线
              terryT 在线
              terry
              编写于 最后由 编辑
              #7

              @Fangbo-Da 兄弟,这个问题,给你单独做一起视频讲解,如何?另外不要说我的频道有多少,只是平台给了点流量而已,我知道有很多博主的内容做的比我好,我只是讲入门类的知识比较多,你们觉得离自己更近。我自己什么水平还是很清楚的,但是我确实是实战派的,我能解决问题。你的问题稍晚来看视频,我还要回复下帖子,给英语频道发视频,明晚最迟后天中午发你的解答视频。

              1 条回复 最后回复
              1
              • 咫尺天涯咫 咫尺天涯

                我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

                terryT 在线
                terryT 在线
                terry
                编写于 最后由 编辑
                #8

                @咫尺天涯 50多岁AI时代还是小伙子,认真锻炼身体,这代人活120以上不是问题。

                1 条回复 最后回复
                0
                • benton yiB 离线
                  benton yiB 离线
                  benton yi
                  编写于 最后由 benton yi 编辑
                  #9

                  微信图片_20260506205439_201.jpg

                  先说说我的需求:我老婆那边有个成形了的做手作玩具的xhs账号,需要“文/图生图”持续产出可能会有版权纠纷的手作玩具图片,图生视频放到笔记里打造爆款,以及图生建模给到她的上游供应链打印模具。我这边用claude code氛围开发的也有两条线:1是上班时期自己想抽空做的个项目,目前已经出了一版正在迭代;还有一个自制的手游app需求也基本上厘清了也在排队;另外社交网络上也有固定自己设计打造的IP尝试做漫画或动画。所以基本上就是claude code/Trae和ComfyUI是硬需求,另外hermes也在玩票,想看能不能固化一些流程。
                  自己原来有一台9950x + 4090 + 192G内存的台式机,运行ComfyUI生图还行,大量生视频确实力不从心。之前也是想过用DGX Spark来搞定ComfyUI和智能体的推理大模型,就在Gemini,GPT和Grok和豆包都问过同样的一组问题。把自己的实际需求和当前已有的设备统统写进提示词,也是很有意思,看各大知名ai在线给我营业:从DGX vs M3Ultra Studio的Studio胜,然后被gemini推荐RTX Pro系列,到又换MacStudio vs RTX Pro5000/6000各大知名ai又给我营业了几轮,大部分是RTX Pro胜。
                  然后开始关注这个频道,看完了UP的每期视频和之前老特说的每期视频,下定决心了入的RTX Pro。
                  之前在win下面一直用lms试吃,ollama生产(qwen3.6:27b_q8_0上下文256k能到35~38t/s)。系统换到Linux之后ollama确实快了一些。但是在各ai的强烈推荐下,Linux下的生产环境SGLang>vLLM>>llama.cpp>ollama。于是先是尝试docker安装了SGLang,捣鼓了2个晚上装了2次回复都是乱码(后来在论坛发现有人说SGLang框架推理qwen3.6-27b-fp8就是有乱码,要坐等框架更新)。于是开始尝试vLLM,才有了上面的图。运行参数如下:
                  vllm serve /home/bentonyi/.cache/modelscope/hub/models/Qwen/Qwen3.6-27B-FP8
                  --trust-remote-code
                  --quantization fp8
                  --max-model-len 262144
                  --enable-auto-tool-choice
                  --max-num-seqs 32
                  --tool-call-parser qwen3_coder
                  --reasoning-parser qwen3
                  --speculative-config '{"method":"qwen3_next_mtp","num_speculative_tokens":4}'
                  --host 0.0.0.0
                  --port 8000
                  设置猜字的mtp并发为4的时候,有效token速度可以超过400t/s。本地的hermes速度能达到接近之前用minimax2.7新手包套餐的在线速度,终于可用了。
                  另:涡轮版本的RTX Pro风扇策略偏静音,不调的情况下工作温度在85~88℃范围。图中的温控工具是LACT,按此设置重度连续工作1小时不会上80℃。

                  省流版:用心写一组提示词,把自己的需求现状和担心的点告诉知名ai众,让它们在线给你营业,然后交叉验证各ai的回答,往往能解决90%以上的问题。😁

                  terryT 1 条回复 最后回复
                  0
                  • benton yiB benton yi

                    微信图片_20260506205439_201.jpg

                    先说说我的需求:我老婆那边有个成形了的做手作玩具的xhs账号,需要“文/图生图”持续产出可能会有版权纠纷的手作玩具图片,图生视频放到笔记里打造爆款,以及图生建模给到她的上游供应链打印模具。我这边用claude code氛围开发的也有两条线:1是上班时期自己想抽空做的个项目,目前已经出了一版正在迭代;还有一个自制的手游app需求也基本上厘清了也在排队;另外社交网络上也有固定自己设计打造的IP尝试做漫画或动画。所以基本上就是claude code/Trae和ComfyUI是硬需求,另外hermes也在玩票,想看能不能固化一些流程。
                    自己原来有一台9950x + 4090 + 192G内存的台式机,运行ComfyUI生图还行,大量生视频确实力不从心。之前也是想过用DGX Spark来搞定ComfyUI和智能体的推理大模型,就在Gemini,GPT和Grok和豆包都问过同样的一组问题。把自己的实际需求和当前已有的设备统统写进提示词,也是很有意思,看各大知名ai在线给我营业:从DGX vs M3Ultra Studio的Studio胜,然后被gemini推荐RTX Pro系列,到又换MacStudio vs RTX Pro5000/6000各大知名ai又给我营业了几轮,大部分是RTX Pro胜。
                    然后开始关注这个频道,看完了UP的每期视频和之前老特说的每期视频,下定决心了入的RTX Pro。
                    之前在win下面一直用lms试吃,ollama生产(qwen3.6:27b_q8_0上下文256k能到35~38t/s)。系统换到Linux之后ollama确实快了一些。但是在各ai的强烈推荐下,Linux下的生产环境SGLang>vLLM>>llama.cpp>ollama。于是先是尝试docker安装了SGLang,捣鼓了2个晚上装了2次回复都是乱码(后来在论坛发现有人说SGLang框架推理qwen3.6-27b-fp8就是有乱码,要坐等框架更新)。于是开始尝试vLLM,才有了上面的图。运行参数如下:
                    vllm serve /home/bentonyi/.cache/modelscope/hub/models/Qwen/Qwen3.6-27B-FP8
                    --trust-remote-code
                    --quantization fp8
                    --max-model-len 262144
                    --enable-auto-tool-choice
                    --max-num-seqs 32
                    --tool-call-parser qwen3_coder
                    --reasoning-parser qwen3
                    --speculative-config '{"method":"qwen3_next_mtp","num_speculative_tokens":4}'
                    --host 0.0.0.0
                    --port 8000
                    设置猜字的mtp并发为4的时候,有效token速度可以超过400t/s。本地的hermes速度能达到接近之前用minimax2.7新手包套餐的在线速度,终于可用了。
                    另:涡轮版本的RTX Pro风扇策略偏静音,不调的情况下工作温度在85~88℃范围。图中的温控工具是LACT,按此设置重度连续工作1小时不会上80℃。

                    省流版:用心写一组提示词,把自己的需求现状和担心的点告诉知名ai众,让它们在线给你营业,然后交叉验证各ai的回答,往往能解决90%以上的问题。😁

                    terryT 在线
                    terryT 在线
                    terry
                    编写于 最后由 编辑
                    #10

                    @benton-yi 这么好的经验多发发,给我们也都参考下。我没有帮你什么,知识分享我的经验教训,你自己原本就懂这些。你的很多经验我也需要。

                    1 条回复 最后回复
                    0
                    • Kk HhK 离线
                      Kk HhK 离线
                      Kk Hh
                      编写于 最后由 编辑
                      #11

                      DGX Spark 问题就是热加慢。好处就是没有显存焦虑,没有长文本焦虑,价格相对便宜。DGX Spark 本来就慢两台放一起更慢,你要是觉得一台能跑DGX Spark 你就买,两台不建议,做视频也不用考虑肯定慢。DGX Spark 定位我觉得就是单台小模型长文本。

                      1 条回复 最后回复
                      0
                      • Kk HhK 离线
                        Kk HhK 离线
                        Kk Hh
                        编写于 最后由 Kk Hh 编辑
                        #12

                        776e0b7f-5b44-4f62-9e7d-ddcb587fcf86-image.jpeg
                        一个小模型你不着急速度,全是Q8精度 256KTOEKN 长度,两个并发,跑起来挺好的,反正对的起这个价格。你要是既要又要,那就别买DGX SPARK。

                        1 条回复 最后回复
                        0
                        • Fangbo DaF Fangbo Da

                          版主您好:
                          1、“抡锤者”每一个视频我都追更、看过,这是目前我最喜爱的AI相关频道,没有之一。
                          2、首先声明,我只是个自己瞎琢磨一年多的老人(50+),只用过4060卡玩本地,和API用openrouter,主要是写长篇小说。我不是大款,更不是有钱,但就是喜欢玩,所以今天的提问,请千万不要误会、不要喷,谢谢大家。
                          3、我想本地部署 DeepSeek-V4-Flash,如果可以为了学习自己训练和微调那就最好(纯粹是向往,目前不会),这样既有安全性,也不怕资源消耗。
                          4、另外就是本地运行Qwen3.6 27b本地跑Hermes,然后就是通过本地部署,做AI音视频画图。

                          所以,我想请问:
                          1、买 ASUS Ascent GX10 ( NVIDIA DGX Spark)合适么?或者买两台串联?
                          2、我知道两台 ASUS Ascent GX10 ,可以放 DeepSeek-V4-Flash ,但不知道视频生成怎么样?
                          3、我从你这里知道,视频生成用 5090 (32G)是极好的。因为目前一块5090的价格和一个ASUS Ascent GX10 (NVIDIA DGX Spark)价格差不多,而买5090我要配一台新机,价格大约5W,这个价格不如我花6W买两台ASUS Ascent GX10 ,然后连接我的老机器。

                          所以特地请教您,请不要笑话😥

                          Kk HhK 离线
                          Kk HhK 离线
                          Kk Hh
                          编写于 最后由 Kk Hh 编辑
                          #13

                          @Fangbo-Da 我觉得把你真的没有必要折腾,DeepSeek-V4-Flash 这个模型精度就不高。你先买个云端的玩几天你再想想你用什么模型吧,模型决定设备。 这个云端模型我也不知道你用的是什么, 反正我是OLLAMA CLOUD ,全是满血免费大模型,那个顺手用那个。459c0f92-4b22-46fb-af59-10530c9341a1-image.jpeg a5d04717-03c6-49dc-b0ab-cc452a4aa8f3-image.jpeg
                          你这个需求OLLAMA CLOUD 一个月20美金 的订阅我觉得就够了,最差你也感受一下到底要用什么模型。你偏要做视频,你就买个5090最好了,直接出视频。
                          这里是OLLAMA 的模型列表 https://ollama.com/search
                          DGX SPARK 就是做了一个小模型的定位填补,因为这些小模型很少有云端提供服务。

                          terryT 1 条回复 最后回复
                          0
                          • Kk HhK Kk Hh

                            @Fangbo-Da 我觉得把你真的没有必要折腾,DeepSeek-V4-Flash 这个模型精度就不高。你先买个云端的玩几天你再想想你用什么模型吧,模型决定设备。 这个云端模型我也不知道你用的是什么, 反正我是OLLAMA CLOUD ,全是满血免费大模型,那个顺手用那个。459c0f92-4b22-46fb-af59-10530c9341a1-image.jpeg a5d04717-03c6-49dc-b0ab-cc452a4aa8f3-image.jpeg
                            你这个需求OLLAMA CLOUD 一个月20美金 的订阅我觉得就够了,最差你也感受一下到底要用什么模型。你偏要做视频,你就买个5090最好了,直接出视频。
                            这里是OLLAMA 的模型列表 https://ollama.com/search
                            DGX SPARK 就是做了一个小模型的定位填补,因为这些小模型很少有云端提供服务。

                            terryT 在线
                            terryT 在线
                            terry
                            编写于 最后由 编辑
                            #14

                            @Kk-Hh 数据很详细,有图有真相。

                            1 条回复 最后回复
                            0
                            • jenaflexJ 离线
                              jenaflexJ 离线
                              jenaflex
                              编写于 最后由 编辑
                              #15

                              我觉得带oculink的AI Max395 128G,加上一个外接4080S 32G,也是一个可行的方案。这样AI Max395 可以跑120b moe(知识库比较广,偏玩具性质),4080S 32G干活。

                              期待下一代,直接出一个AI Max 495,直接带PCIE插槽 就好了。

                              1 条回复 最后回复
                              0
                              • 咫尺天涯咫 咫尺天涯

                                我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

                                Fangbo DaF 离线
                                Fangbo DaF 离线
                                Fangbo Da
                                编写于 最后由 编辑
                                #16

                                咫尺天涯

                                谢谢鼓励。

                                1 条回复 最后回复
                                0
                                • jenaflexJ jenaflex

                                  TLDR:新手不要碰DGX Spark(GB10)
                                  DGX Spark的芯片SM121最初的设计是一个 游戏APU和AI 两吃产品,并且跳票了超过一年多(出处:https://youtu.be/o8FL3nVDM5M?si=byA9yR5k0U8MTAI5)。因为游戏APU是需要Windows for Arm的适配,而微软那个屎山Bug巨多无比。所以等不及了,只能先开卖DGX Spark。SM121芯片和NV专业芯片设计有很多区别,导致生态和支持一直有问题(被NV论坛诟病很多),这么小众的产品(而且还是和半成品),你不能指望NV会让团队花很多精力去修正生态问题。

                                  Fangbo DaF 离线
                                  Fangbo DaF 离线
                                  Fangbo Da
                                  编写于 最后由 编辑
                                  #17

                                  @jenaflex
                                  非常感谢。绝不碰😊

                                  1 条回复 最后回复
                                  0

                                  你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                  厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                  有了你的建议,这篇帖子会更精彩哦 💗

                                  注册 登录
                                  回复
                                  • 在新帖中回复
                                  登录后回复
                                  • 从旧到新
                                  • 从新到旧
                                  • 最多赞同


                                  • 登录

                                  • 没有帐号? 注册

                                  • 登录或注册以进行搜索。
                                  • 第一个帖子
                                    最后一个帖子
                                  0
                                  • 版块
                                  • 最新
                                  • 标签
                                  • 热门
                                  • 用户
                                  • 群组