跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 请教:ASUS Ascent GX10

请教:ASUS Ascent GX10

已定时 已固定 已锁定 已移动 AI硬件
17 帖子 7 发布者 167 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • Fangbo DaF 离线
    Fangbo DaF 离线
    Fangbo Da
    编写于 最后由 编辑
    #3

    还是用 RTX Pro6000 Max-Q 96G ,配一台新机?
    再次声明,我不是在这里调笑。就是看了您的视频,否决了我买 MAC Studio 256G的念头。

    咫尺天涯咫 1 条回复 最后回复
    0
    • jenaflexJ 离线
      jenaflexJ 离线
      jenaflex
      编写于 最后由 编辑
      #4

      TLDR:新手不要碰DGX Spark(GB10)
      DGX Spark的芯片SM121最初的设计是一个 游戏APU和AI 两吃产品,并且跳票了超过一年多(出处:https://youtu.be/o8FL3nVDM5M?si=byA9yR5k0U8MTAI5)。因为游戏APU是需要Windows for Arm的适配,而微软那个屎山Bug巨多无比。所以等不及了,只能先开卖DGX Spark。SM121芯片和NV专业芯片设计有很多区别,导致生态和支持一直有问题(被NV论坛诟病很多),这么小众的产品(而且还是和半成品),你不能指望NV会让团队花很多精力去修正生态问题。

      Fangbo DaF 1 条回复 最后回复
      0
      • Fangbo DaF Fangbo Da

        还是用 RTX Pro6000 Max-Q 96G ,配一台新机?
        再次声明,我不是在这里调笑。就是看了您的视频,否决了我买 MAC Studio 256G的念头。

        咫尺天涯咫 离线
        咫尺天涯咫 离线
        咫尺天涯
        编写于 最后由 编辑
        #5

        我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

        terryT Fangbo DaF 2 条回复 最后回复
        0
        • 暧 离线
          暧 离线
          暧昧光影
          编写于 最后由 编辑
          #6

          买nvdia的卡目前保值率还可以,后期不需要了也不会亏太多。GB10音视频输出没研究过,但是根据参数也知道不会太好。有条件的还是上5090或者PRO 6000.另外5090的主机要到不了5W。咸鱼上面的二手或者攒硬件大概4W不到可以弄一台9950x3D+64G+2T+5090的主机

          1 条回复 最后回复
          0
          • Fangbo DaF Fangbo Da

            版主您好:
            1、“抡锤者”每一个视频我都追更、看过,这是目前我最喜爱的AI相关频道,没有之一。
            2、首先声明,我只是个自己瞎琢磨一年多的老人(50+),只用过4060卡玩本地,和API用openrouter,主要是写长篇小说。我不是大款,更不是有钱,但就是喜欢玩,所以今天的提问,请千万不要误会、不要喷,谢谢大家。
            3、我想本地部署 DeepSeek-V4-Flash,如果可以为了学习自己训练和微调那就最好(纯粹是向往,目前不会),这样既有安全性,也不怕资源消耗。
            4、另外就是本地运行Qwen3.6 27b本地跑Hermes,然后就是通过本地部署,做AI音视频画图。

            所以,我想请问:
            1、买 ASUS Ascent GX10 ( NVIDIA DGX Spark)合适么?或者买两台串联?
            2、我知道两台 ASUS Ascent GX10 ,可以放 DeepSeek-V4-Flash ,但不知道视频生成怎么样?
            3、我从你这里知道,视频生成用 5090 (32G)是极好的。因为目前一块5090的价格和一个ASUS Ascent GX10 (NVIDIA DGX Spark)价格差不多,而买5090我要配一台新机,价格大约5W,这个价格不如我花6W买两台ASUS Ascent GX10 ,然后连接我的老机器。

            所以特地请教您,请不要笑话😥

            terryT 离线
            terryT 离线
            terry
            编写于 最后由 编辑
            #7

            @Fangbo-Da 兄弟,这个问题,给你单独做一起视频讲解,如何?另外不要说我的频道有多少,只是平台给了点流量而已,我知道有很多博主的内容做的比我好,我只是讲入门类的知识比较多,你们觉得离自己更近。我自己什么水平还是很清楚的,但是我确实是实战派的,我能解决问题。你的问题稍晚来看视频,我还要回复下帖子,给英语频道发视频,明晚最迟后天中午发你的解答视频。

            1 条回复 最后回复
            1
            • 咫尺天涯咫 咫尺天涯

              我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

              terryT 离线
              terryT 离线
              terry
              编写于 最后由 编辑
              #8

              @咫尺天涯 50多岁AI时代还是小伙子,认真锻炼身体,这代人活120以上不是问题。

              1 条回复 最后回复
              0
              • benton yiB 离线
                benton yiB 离线
                benton yi
                编写于 最后由 benton yi 编辑
                #9

                微信图片_20260506205439_201.jpg

                先说说我的需求:我老婆那边有个成形了的做手作玩具的xhs账号,需要“文/图生图”持续产出可能会有版权纠纷的手作玩具图片,图生视频放到笔记里打造爆款,以及图生建模给到她的上游供应链打印模具。我这边用claude code氛围开发的也有两条线:1是上班时期自己想抽空做的个项目,目前已经出了一版正在迭代;还有一个自制的手游app需求也基本上厘清了也在排队;另外社交网络上也有固定自己设计打造的IP尝试做漫画或动画。所以基本上就是claude code/Trae和ComfyUI是硬需求,另外hermes也在玩票,想看能不能固化一些流程。
                自己原来有一台9950x + 4090 + 192G内存的台式机,运行ComfyUI生图还行,大量生视频确实力不从心。之前也是想过用DGX Spark来搞定ComfyUI和智能体的推理大模型,就在Gemini,GPT和Grok和豆包都问过同样的一组问题。把自己的实际需求和当前已有的设备统统写进提示词,也是很有意思,看各大知名ai在线给我营业:从DGX vs M3Ultra Studio的Studio胜,然后被gemini推荐RTX Pro系列,到又换MacStudio vs RTX Pro5000/6000各大知名ai又给我营业了几轮,大部分是RTX Pro胜。
                然后开始关注这个频道,看完了UP的每期视频和之前老特说的每期视频,下定决心了入的RTX Pro。
                之前在win下面一直用lms试吃,ollama生产(qwen3.6:27b_q8_0上下文256k能到35~38t/s)。系统换到Linux之后ollama确实快了一些。但是在各ai的强烈推荐下,Linux下的生产环境SGLang>vLLM>>llama.cpp>ollama。于是先是尝试docker安装了SGLang,捣鼓了2个晚上装了2次回复都是乱码(后来在论坛发现有人说SGLang框架推理qwen3.6-27b-fp8就是有乱码,要坐等框架更新)。于是开始尝试vLLM,才有了上面的图。运行参数如下:
                vllm serve /home/bentonyi/.cache/modelscope/hub/models/Qwen/Qwen3.6-27B-FP8
                --trust-remote-code
                --quantization fp8
                --max-model-len 262144
                --enable-auto-tool-choice
                --max-num-seqs 32
                --tool-call-parser qwen3_coder
                --reasoning-parser qwen3
                --speculative-config '{"method":"qwen3_next_mtp","num_speculative_tokens":4}'
                --host 0.0.0.0
                --port 8000
                设置猜字的mtp并发为4的时候,有效token速度可以超过400t/s。本地的hermes速度能达到接近之前用minimax2.7新手包套餐的在线速度,终于可用了。
                另:涡轮版本的RTX Pro风扇策略偏静音,不调的情况下工作温度在85~88℃范围。图中的温控工具是LACT,按此设置重度连续工作1小时不会上80℃。

                省流版:用心写一组提示词,把自己的需求现状和担心的点告诉知名ai众,让它们在线给你营业,然后交叉验证各ai的回答,往往能解决90%以上的问题。😁

                terryT 1 条回复 最后回复
                0
                • benton yiB benton yi

                  微信图片_20260506205439_201.jpg

                  先说说我的需求:我老婆那边有个成形了的做手作玩具的xhs账号,需要“文/图生图”持续产出可能会有版权纠纷的手作玩具图片,图生视频放到笔记里打造爆款,以及图生建模给到她的上游供应链打印模具。我这边用claude code氛围开发的也有两条线:1是上班时期自己想抽空做的个项目,目前已经出了一版正在迭代;还有一个自制的手游app需求也基本上厘清了也在排队;另外社交网络上也有固定自己设计打造的IP尝试做漫画或动画。所以基本上就是claude code/Trae和ComfyUI是硬需求,另外hermes也在玩票,想看能不能固化一些流程。
                  自己原来有一台9950x + 4090 + 192G内存的台式机,运行ComfyUI生图还行,大量生视频确实力不从心。之前也是想过用DGX Spark来搞定ComfyUI和智能体的推理大模型,就在Gemini,GPT和Grok和豆包都问过同样的一组问题。把自己的实际需求和当前已有的设备统统写进提示词,也是很有意思,看各大知名ai在线给我营业:从DGX vs M3Ultra Studio的Studio胜,然后被gemini推荐RTX Pro系列,到又换MacStudio vs RTX Pro5000/6000各大知名ai又给我营业了几轮,大部分是RTX Pro胜。
                  然后开始关注这个频道,看完了UP的每期视频和之前老特说的每期视频,下定决心了入的RTX Pro。
                  之前在win下面一直用lms试吃,ollama生产(qwen3.6:27b_q8_0上下文256k能到35~38t/s)。系统换到Linux之后ollama确实快了一些。但是在各ai的强烈推荐下,Linux下的生产环境SGLang>vLLM>>llama.cpp>ollama。于是先是尝试docker安装了SGLang,捣鼓了2个晚上装了2次回复都是乱码(后来在论坛发现有人说SGLang框架推理qwen3.6-27b-fp8就是有乱码,要坐等框架更新)。于是开始尝试vLLM,才有了上面的图。运行参数如下:
                  vllm serve /home/bentonyi/.cache/modelscope/hub/models/Qwen/Qwen3.6-27B-FP8
                  --trust-remote-code
                  --quantization fp8
                  --max-model-len 262144
                  --enable-auto-tool-choice
                  --max-num-seqs 32
                  --tool-call-parser qwen3_coder
                  --reasoning-parser qwen3
                  --speculative-config '{"method":"qwen3_next_mtp","num_speculative_tokens":4}'
                  --host 0.0.0.0
                  --port 8000
                  设置猜字的mtp并发为4的时候,有效token速度可以超过400t/s。本地的hermes速度能达到接近之前用minimax2.7新手包套餐的在线速度,终于可用了。
                  另:涡轮版本的RTX Pro风扇策略偏静音,不调的情况下工作温度在85~88℃范围。图中的温控工具是LACT,按此设置重度连续工作1小时不会上80℃。

                  省流版:用心写一组提示词,把自己的需求现状和担心的点告诉知名ai众,让它们在线给你营业,然后交叉验证各ai的回答,往往能解决90%以上的问题。😁

                  terryT 离线
                  terryT 离线
                  terry
                  编写于 最后由 编辑
                  #10

                  @benton-yi 这么好的经验多发发,给我们也都参考下。我没有帮你什么,知识分享我的经验教训,你自己原本就懂这些。你的很多经验我也需要。

                  1 条回复 最后回复
                  0
                  • Kk HhK 离线
                    Kk HhK 离线
                    Kk Hh
                    编写于 最后由 编辑
                    #11

                    DGX Spark 问题就是热加慢。好处就是没有显存焦虑,没有长文本焦虑,价格相对便宜。DGX Spark 本来就慢两台放一起更慢,你要是觉得一台能跑DGX Spark 你就买,两台不建议,做视频也不用考虑肯定慢。DGX Spark 定位我觉得就是单台小模型长文本。

                    1 条回复 最后回复
                    0
                    • Kk HhK 离线
                      Kk HhK 离线
                      Kk Hh
                      编写于 最后由 Kk Hh 编辑
                      #12

                      776e0b7f-5b44-4f62-9e7d-ddcb587fcf86-image.jpeg
                      一个小模型你不着急速度,全是Q8精度 256KTOEKN 长度,两个并发,跑起来挺好的,反正对的起这个价格。你要是既要又要,那就别买DGX SPARK。

                      1 条回复 最后回复
                      0
                      • Fangbo DaF Fangbo Da

                        版主您好:
                        1、“抡锤者”每一个视频我都追更、看过,这是目前我最喜爱的AI相关频道,没有之一。
                        2、首先声明,我只是个自己瞎琢磨一年多的老人(50+),只用过4060卡玩本地,和API用openrouter,主要是写长篇小说。我不是大款,更不是有钱,但就是喜欢玩,所以今天的提问,请千万不要误会、不要喷,谢谢大家。
                        3、我想本地部署 DeepSeek-V4-Flash,如果可以为了学习自己训练和微调那就最好(纯粹是向往,目前不会),这样既有安全性,也不怕资源消耗。
                        4、另外就是本地运行Qwen3.6 27b本地跑Hermes,然后就是通过本地部署,做AI音视频画图。

                        所以,我想请问:
                        1、买 ASUS Ascent GX10 ( NVIDIA DGX Spark)合适么?或者买两台串联?
                        2、我知道两台 ASUS Ascent GX10 ,可以放 DeepSeek-V4-Flash ,但不知道视频生成怎么样?
                        3、我从你这里知道,视频生成用 5090 (32G)是极好的。因为目前一块5090的价格和一个ASUS Ascent GX10 (NVIDIA DGX Spark)价格差不多,而买5090我要配一台新机,价格大约5W,这个价格不如我花6W买两台ASUS Ascent GX10 ,然后连接我的老机器。

                        所以特地请教您,请不要笑话😥

                        Kk HhK 离线
                        Kk HhK 离线
                        Kk Hh
                        编写于 最后由 Kk Hh 编辑
                        #13

                        @Fangbo-Da 我觉得把你真的没有必要折腾,DeepSeek-V4-Flash 这个模型精度就不高。你先买个云端的玩几天你再想想你用什么模型吧,模型决定设备。 这个云端模型我也不知道你用的是什么, 反正我是OLLAMA CLOUD ,全是满血免费大模型,那个顺手用那个。459c0f92-4b22-46fb-af59-10530c9341a1-image.jpeg a5d04717-03c6-49dc-b0ab-cc452a4aa8f3-image.jpeg
                        你这个需求OLLAMA CLOUD 一个月20美金 的订阅我觉得就够了,最差你也感受一下到底要用什么模型。你偏要做视频,你就买个5090最好了,直接出视频。
                        这里是OLLAMA 的模型列表 https://ollama.com/search
                        DGX SPARK 就是做了一个小模型的定位填补,因为这些小模型很少有云端提供服务。

                        terryT 1 条回复 最后回复
                        0
                        • Kk HhK Kk Hh

                          @Fangbo-Da 我觉得把你真的没有必要折腾,DeepSeek-V4-Flash 这个模型精度就不高。你先买个云端的玩几天你再想想你用什么模型吧,模型决定设备。 这个云端模型我也不知道你用的是什么, 反正我是OLLAMA CLOUD ,全是满血免费大模型,那个顺手用那个。459c0f92-4b22-46fb-af59-10530c9341a1-image.jpeg a5d04717-03c6-49dc-b0ab-cc452a4aa8f3-image.jpeg
                          你这个需求OLLAMA CLOUD 一个月20美金 的订阅我觉得就够了,最差你也感受一下到底要用什么模型。你偏要做视频,你就买个5090最好了,直接出视频。
                          这里是OLLAMA 的模型列表 https://ollama.com/search
                          DGX SPARK 就是做了一个小模型的定位填补,因为这些小模型很少有云端提供服务。

                          terryT 离线
                          terryT 离线
                          terry
                          编写于 最后由 编辑
                          #14

                          @Kk-Hh 数据很详细,有图有真相。

                          1 条回复 最后回复
                          0
                          • jenaflexJ 离线
                            jenaflexJ 离线
                            jenaflex
                            编写于 最后由 编辑
                            #15

                            我觉得带oculink的AI Max395 128G,加上一个外接4080S 32G,也是一个可行的方案。这样AI Max395 可以跑120b moe(知识库比较广,偏玩具性质),4080S 32G干活。

                            期待下一代,直接出一个AI Max 495,直接带PCIE插槽 就好了。

                            1 条回复 最后回复
                            0
                            • 咫尺天涯咫 咫尺天涯

                              我觉得你如果预算够的话肯定上6000不后悔啊,你不算老人(我也50岁瞎折腾两个月了)我也准备搞一台洋垃圾x99-2696v3-ddr3配3090本地跑跑玩,目前手里有台MACmini丐版跑在线模型已经上瘾了哈哈😃

                              Fangbo DaF 离线
                              Fangbo DaF 离线
                              Fangbo Da
                              编写于 最后由 编辑
                              #16

                              咫尺天涯

                              谢谢鼓励。

                              1 条回复 最后回复
                              0
                              • jenaflexJ jenaflex

                                TLDR:新手不要碰DGX Spark(GB10)
                                DGX Spark的芯片SM121最初的设计是一个 游戏APU和AI 两吃产品,并且跳票了超过一年多(出处:https://youtu.be/o8FL3nVDM5M?si=byA9yR5k0U8MTAI5)。因为游戏APU是需要Windows for Arm的适配,而微软那个屎山Bug巨多无比。所以等不及了,只能先开卖DGX Spark。SM121芯片和NV专业芯片设计有很多区别,导致生态和支持一直有问题(被NV论坛诟病很多),这么小众的产品(而且还是和半成品),你不能指望NV会让团队花很多精力去修正生态问题。

                                Fangbo DaF 离线
                                Fangbo DaF 离线
                                Fangbo Da
                                编写于 最后由 编辑
                                #17

                                @jenaflex
                                非常感谢。绝不碰😊

                                1 条回复 最后回复
                                0

                                你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                有了你的建议,这篇帖子会更精彩哦 💗

                                注册 登录
                                回复
                                • 在新帖中回复
                                登录后回复
                                • 从旧到新
                                • 从新到旧
                                • 最多赞同


                                • 登录

                                • 没有帐号? 注册

                                • 登录或注册以进行搜索。
                                • 第一个帖子
                                  最后一个帖子
                                0
                                • 版块
                                • 最新
                                • 标签
                                • 热门
                                • 用户
                                • 群组