跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI进阶话题
  3. 3D模型生成 trellis2 - r9700 rocm

3D模型生成 trellis2 - r9700 rocm

已定时 已固定 已锁定 已移动 AI进阶话题
29 帖子 4 发布者 209 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 5 在线
    5 在线
    566656661
    编写于 最后由 566656661 编辑
    #3

    @cs6

    這個模型 facebook/dinov3-vitl16-pretrain-lvd1689m 還要等啊...

    CS6C 1 条回复 最后回复
    0
    • 5 566656661

      @cs6

      這個模型 facebook/dinov3-vitl16-pretrain-lvd1689m 還要等啊...

      CS6C 离线
      CS6C 离线
      CS6
      编写于 最后由 编辑
      #4

      @566656661 申請需要等30分左右

      1 条回复 最后回复
      0
      • 5 在线
        5 在线
        566656661
        编写于 最后由 566656661 编辑
        #5

        剛下載完結果還要另外的briaai/RMBG-2.0😥

        1 条回复 最后回复
        0
        • 5 在线
          5 在线
          566656661
          编写于 最后由 编辑
          #6

          543f47e2-c462-4e32-88b5-afcc1a4e7211-image.jpeg

          在跑了

          1 条回复 最后回复
          1
          • 5 在线
            5 在线
            566656661
            编写于 最后由 566656661 编辑
            #7

            @cs6

            我怎麽感覺我的CPU是瓶頸啊 😥

            81cad8e3-c776-4990-8191-ad84d71594b1-image.jpeg

            我有打開官方推薦說的remesh

            texture_size=4096
            decimation_target=1000000
            remesh=True
            torch=2.11.0+cu130
            cuda=13.0
            device=NVIDIA RTX PRO 4500 Blackwell
            
            GLB size: about 39.9 MiB (41,854,640 bytes)
            final mesh: 770,210 vertices / 979,967 faces
            valid texture pixels: 16,776,431
            GLB check: materials=1, textures=2, images=2, baseColorTexture exists
            
            階段 時間 備註
            啟動 / 載入 pipeline 約 58 秒 載入模型與 pipeline,未計入 measured_compute_seconds
            模型生成 / sampling / decode 約 2 分 2 秒 從開始跑圖到 to_glb 開始前
            mesh simplify 約 0 秒 pipeline 後、GLB 匯出前的 simplify 呼叫
            GLB 匯出總時間 約 46 秒 to_glb、texture baking、remesh、xatlas、glb export
            measured compute total 約 2 分 48 秒 pipeline + simplify + video + export
            - GLB size: 41,854,640 bytes, about 39.9 MiB
            - Final mesh: 770,210 vertices / 979,967 faces
            - Valid texture pixels: 16,776,431
            - Model generation / sampling / decode: 約 2 分 2 秒
            - GLB export: 約 46 秒
            - Measured compute total: 約 2 分 48 秒
            

            整個測試過程Markdown
            trellis2-cuda.zip

            CS6C 1 条回复 最后回复
            1
            • 5 566656661

              @cs6

              我怎麽感覺我的CPU是瓶頸啊 😥

              81cad8e3-c776-4990-8191-ad84d71594b1-image.jpeg

              我有打開官方推薦說的remesh

              texture_size=4096
              decimation_target=1000000
              remesh=True
              torch=2.11.0+cu130
              cuda=13.0
              device=NVIDIA RTX PRO 4500 Blackwell
              
              GLB size: about 39.9 MiB (41,854,640 bytes)
              final mesh: 770,210 vertices / 979,967 faces
              valid texture pixels: 16,776,431
              GLB check: materials=1, textures=2, images=2, baseColorTexture exists
              
              階段 時間 備註
              啟動 / 載入 pipeline 約 58 秒 載入模型與 pipeline,未計入 measured_compute_seconds
              模型生成 / sampling / decode 約 2 分 2 秒 從開始跑圖到 to_glb 開始前
              mesh simplify 約 0 秒 pipeline 後、GLB 匯出前的 simplify 呼叫
              GLB 匯出總時間 約 46 秒 to_glb、texture baking、remesh、xatlas、glb export
              measured compute total 約 2 分 48 秒 pipeline + simplify + video + export
              - GLB size: 41,854,640 bytes, about 39.9 MiB
              - Final mesh: 770,210 vertices / 979,967 faces
              - Valid texture pixels: 16,776,431
              - Model generation / sampling / decode: 約 2 分 2 秒
              - GLB export: 約 46 秒
              - Measured compute total: 約 2 分 48 秒
              

              整個測試過程Markdown
              trellis2-cuda.zip

              CS6C 离线
              CS6C 离线
              CS6
              编写于 最后由 CS6 编辑
              #8

              @566656661 说:

              CPU

              我把cpu 降到跟你差不多的條件試試
              但 cuda 可以走 BVH 處理 texture baking 真的好快...

              5 1 条回复 最后回复
              0
              • CS6C CS6

                @566656661 说:

                CPU

                我把cpu 降到跟你差不多的條件試試
                但 cuda 可以走 BVH 處理 texture baking 真的好快...

                5 在线
                5 在线
                566656661
                编写于 最后由 编辑
                #9

                @CS6

                這還是一個移動端cpu

                加速真的有點猛, 難怪專業軟件統一推薦N卡

                CS6C 1 条回复 最后回复
                0
                • 5 566656661

                  @CS6

                  這還是一個移動端cpu

                  加速真的有點猛, 難怪專業軟件統一推薦N卡

                  CS6C 离线
                  CS6C 离线
                  CS6
                  编写于 最后由 编辑
                  #10

                  @566656661 對啊....感覺第二張還是要買N卡

                  1 条回复 最后回复
                  0
                  • 5 离线
                    5 离线
                    5ccccc
                    编写于 最后由 编辑
                    #11

                    这是搞游戏的角色?

                    5 1 条回复 最后回复
                    0
                    • 5 5ccccc

                      这是搞游戏的角色?

                      5 在线
                      5 在线
                      566656661
                      编写于 最后由 编辑
                      #12

                      @5ccccc

                      以照片2d深度去推斷出3d建模

                      至少我看完那個github repo是這樣理解的

                      1 条回复 最后回复
                      0
                      • 5 在线
                        5 在线
                        566656661
                        编写于 最后由 编辑
                        #13

                        @cs6

                        我把昨天cuda docker跟benchmark的東西放在這裏了

                        README.zip

                        1 条回复 最后回复
                        1
                        • terryT terry 从 AI音视频画图 移动了该主题
                        • terryT terry 固定了该主题
                        • CS6C 离线
                          CS6C 离线
                          CS6
                          编写于 最后由 CS6 编辑
                          #14

                          TRELLIS.2 外部主機實驗紀錄與 GPU 結果摘要

                          實驗資料夾:

                          external-host-experiments/2026-06-07-vastai-trellis2
                          

                          目前狀態:

                          所有 Vast.ai instance 都已關閉。
                          最後確認 `vastai show instances-v1 --raw` 回傳 total_instances=0。
                          

                          本次主要目標:

                          用外部 NVIDIA GPU 主機測試 TRELLIS.2。
                          固定使用 robot.jpeg 做 3D 生成,觀察 2048 / 4096 texture 輸出結果。
                          特別關注 RTX 3090 是否值得購入實體卡片:24GB VRAM 是否足夠、4096 是否能成功、正式生成時間如何。
                          

                          測試素材

                          主要輸入圖:

                          lab-docs/test-assets/robot.jpeg
                          

                          遠端路徑:

                          /workspace/work/inputs/robot.jpeg
                          

                          另有一筆早期環境 smoke test 使用 TRELLIS.2 官方範例圖:

                          /workspace/TRELLIS.2/assets/example_image/T.png
                          

                          執行環境與方法

                          共同設定:

                          TRELLIS.2
                          Torch: 2.12.0+cu130
                          CUDA runtime: 13.0
                          Attention backend: flash_attn
                          Sparse conv backend: flex_gemm
                          decimation_target=1000000
                          remesh=1
                          write_video=0
                          GLB export: extension_webp=False
                          

                          背景移除狀態:

                          RTX PRO 4000 早期測試:no-rembg
                          原因:當時 briaai/RMBG-2.0 gated access 尚未完成授權。
                          
                          RTX 3090 / RTX 5090 測試:full rembg
                          原因:後續 Hugging Face token 已登入,briaai/RMBG-2.0 可下載並正常使用。
                          

                          重要比較限制:

                          RTX PRO 4000 的 no-rembg 結果不能直接和 RTX 3090 / RTX 5090 的 full-rembg 結果做嚴格速度比較。
                          它仍可作為 CUDA 環境與 no-rembg pipeline 的參考。
                          

                          GPU 結果摘要

                          每個 benchmark 內部階段的拆表見:

                          gpu-stage-timing.zh-TW.md
                          
                          GPU 模式 Texture Wall time Measured compute Pipeline Export Max RSS GLB
                          RTX 3090 24GB full rembg 2048 6:27.50 214.09s 148.77s 65.32s 25,560,468 KB outputs/rtx3090-robot-2048-rembg.glb
                          RTX 3090 24GB full rembg 4096 4:49.14 158.33s 57.11s 101.21s 25,473,892 KB outputs/rtx3090-robot-4096-rembg.glb
                          RTX 5090 32GB full rembg 4096 3:15.19 128.01s 86.84s 41.17s 26,572,504 KB outputs/rtx5090-robot-4096-rembg.glb
                          RTX PRO 4000 Blackwell 24GB no-rembg 2048 2:39.94 100.77s 76.89s 23.87s 24,259,192 KB outputs/rtxpro4000-robot-2048-no-rembg.glb
                          RTX PRO 4000 Blackwell 24GB no-rembg 4096 2:26.62 86.84s 41.27s 45.56s 24,675,052 KB outputs/rtxpro4000-robot-4096-no-rembg.glb

                          結論

                          RTX 3090 的重點結論:

                          RTX 3090 24GB 可以完整跑 TRELLIS.2 robot 4096 + RMBG。
                          4096 full-rembg 成功輸出 GLB,沒有 OOM。
                          正式 4096 wall time 是 4:49.14。
                          

                          對購買實體 RTX 3090 的判斷:

                          顯卡本身可行,24GB VRAM 足夠完成這次 4096 測試。
                          第一次安裝環境會很慢,主要是 flash-attn / native CUDA extensions 編譯。
                          這是初次部署成本,不是每次生成都會發生。
                          如果購買實體卡,建議保留 Python 環境、wheel cache,或直接做預建 Docker image。
                          

                          CPU / GPU 負載判斷:

                          環境建置時間主要卡在 CPU、編譯器、磁碟 I/O。
                          正式生成階段才主要使用 GPU。
                          GLB export、xatlas UV、mesh/texture 後處理仍會吃不少 CPU。
                          

                          完整流水紀錄

                          1. 建立外部主機實驗資料夾

                          建立資料夾集中保存租借外部主機的實驗資料:

                          external-host-experiments/2026-06-07-vastai-trellis2
                          

                          內容包含:

                          notes.md
                          gpu-results-summary.md
                          gpu-results-summary.zh-TW.md
                          logs-export.md
                          outputs/
                          logs/
                          scripts/
                          

                          2. Vast.ai CLI 與 SSH key

                          先安裝並設定 Vast.ai CLI,建立新的 SSH key 給租借主機使用。

                          後續操作使用 CLI 建立、查詢、關閉 instances,並用 SSH/SCP 上傳 benchmark harness、下載 GLB 與 logs。

                          3. 初始指定機器

                          原先記錄的機器建立命令:

                          vastai create instance 35865076 \
                            --image pytorch/pytorch:2.6.0-cuda12.4-cudnn9-devel \
                            --disk 180 \
                            --ssh \
                            --direct \
                            --env '-p 7860:7860' \
                            --label trellis2-smoke
                          

                          選擇理由:

                          偏好 AMD CPU。
                          價格可控。
                          VRAM 24GB,足夠做 TRELLIS.2 smoke test。
                          

                          4. RTX PRO 4000 第一次嘗試

                          Instance:

                          Instance ID: 39881802
                          Offer ID: 35865076
                          GPU: NVIDIA RTX PRO 4000 Blackwell
                          CPU: AMD Ryzen Threadripper PRO 5945WX 12-Cores
                          

                          主要問題:

                          起初使用 pytorch/pytorch:2.6.0-cuda12.4-cudnn9-devel。
                          後續 TRELLIS.2 setup 需要 CUDA 13 / PyTorch cu130 路線。
                          CUDA 12.4 + RTX PRO 4000 Blackwell sm_120 不適合。
                          

                          處理過程:

                          改回 CUDA 13 + torch 2.12.0+cu130。
                          nvdiffrast、nvdiffrec_render、cumesh、o_voxel、flex_gemm 可成功編譯與 import。
                          但 flash-attn 2.7.3 現場編譯 sm_120 花太久。
                          依使用者指示停止該輪,關閉 instance。
                          

                          結論:

                          手動從 PyTorch CUDA 12.4 image 開始不理想。
                          RTX PRO 4000 Blackwell 應走 CUDA 13 / PyTorch cu130。
                          更好的做法是沿用 RTX PRO 4500 測試提供的 CUDA benchmark harness 或預建 image。
                          

                          5. RTX PRO 4000 CUDA 13 成功跑通

                          Instance:

                          Instance ID: 39888728
                          GPU: NVIDIA RTX PRO 4000 Blackwell, 24467 MiB
                          CPU: AMD Ryzen Threadripper PRO 5945WX 12-Cores
                          Image: nvidia/cuda:13.0.2-cudnn-devel-ubuntu22.04
                          

                          成功項目:

                          TRELLIS.2 CUDA 13 環境完成。
                          flash-attn / native extensions 可用。
                          

                          限制:

                          當時 briaai/RMBG-2.0 尚未授權,因此改用 no-rembg。
                          benchmark 使用 preprocess_image=False。
                          

                          官方範例圖 smoke test:

                          Input: /workspace/TRELLIS.2/assets/example_image/T.png
                          Texture: 2048
                          Output: outputs/rtxpro4000-smoke-2048-no-rembg-v6.glb
                          Wall time: 2:34.81
                          Measured compute: 95.6548s
                          

                          robot 2048:

                          Output: outputs/rtxpro4000-robot-2048-no-rembg.glb
                          Log: logs/rtxpro4000-robot-2048-no-rembg.log
                          Wall time: 2:39.94
                          Measured compute: 100.7658s
                          File size: about 48 MB
                          

                          robot 4096:

                          Output: outputs/rtxpro4000-robot-4096-no-rembg.glb
                          Log: logs/rtxpro4000-robot-4096-no-rembg.log
                          Wall time: 2:26.62
                          Measured compute: 86.8375s
                          File size: about 78 MB
                          

                          完成後下載 GLB/log,關閉 instance。

                          6. 搜尋 3090 / 4080S / 5090

                          使用 Vast.ai 查詢可租用主機,偏好 AMD CPU。

                          4080S:

                          曾建立一台 4080S instance。
                          使用者後續指示關掉。
                          已 destroy,不再繼續跑。
                          

                          3090:

                          重點卡片,因為使用者正在評估是否購買實體 RTX 3090。
                          

                          5090:

                          使用者指示 5090 跑完 4096 後立刻關閉。
                          

                          7. RTX 5090 full-rembg 4096 測試

                          Instance:

                          Instance ID: 39911711
                          Label: trellis2-rtx5090-robot-b
                          GPU: NVIDIA GeForce RTX 5090, 32607 MiB
                          CPU: AMD EPYC 9655 96-Core Processor
                          Image: nvidia/cuda:13.0.2-cudnn-devel-ubuntu22.04
                          

                          建置:

                          安裝 PyTorch 2.12.0+cu130。
                          安裝 TRELLIS.2 dependencies。
                          第一次 setup 遇到 flash-attn pip build isolation 看不到 torch 的錯誤。
                          改用 python3 -m pip install flash-attn==2.7.3 --no-build-isolation 成功。
                          nvdiffrast、nvdiffrec_render、cumesh、flex_gemm、o_voxel 全部 import OK。
                          

                          Hugging Face:

                          登入 HF token 後,briaai/RMBG-2.0 與 facebook/dinov3-vitl16-pretrain-lvd1689m 都可下載。
                          

                          正式測試:

                          Input: robot.jpeg
                          Texture size: 4096
                          Mode: full rembg
                          Output: outputs/rtx5090-robot-4096-rembg.glb
                          Log: logs/rtx5090-robot-4096-rembg.log
                          

                          結果:

                          Wall time: 3:15.19
                          Load: 62.9314s
                          Pipeline: 86.8388s
                          Export: 41.1694s
                          Measured compute: 128.0098s
                          Max RSS: 26,572,504 KB
                          File size: about 77 MB
                          

                          完成後:

                          下載 GLB/log。
                          立刻 destroy instance 39911711。
                          

                          8. RTX 3090 full-rembg 2048 / 4096 測試

                          Instance:

                          Instance ID: 39911959
                          Label: trellis2-rtx3090-robot-b
                          GPU: NVIDIA GeForce RTX 3090, 24576 MiB
                          CPU: AMD EPYC 7642 48-Core Processor
                          Image: nvidia/cuda:13.0.2-cudnn-devel-ubuntu22.04
                          

                          建置瓶頸:

                          RTX 3090 的環境建置主要卡在 flash-attn 2.7.3 source build。
                          原因是 CUDA 13 + sm_86 沒有直接拿到可用的預編譯 wheel,pip 從 source 編整套 kernels。
                          這段主要吃 CPU、編譯器與磁碟 I/O,GPU 幾乎沒在跑。
                          

                          使用者確認:

                          即使燒到 20 美元也沒關係,重點是要知道 3090 結果。
                          因此沒有因建置時間過長而停止。
                          

                          完成建置:

                          flash-attn build 完成。
                          nvdiffrast、nvdiffrec_render、cumesh、flex_gemm、o_voxel 全部 import OK。
                          

                          Hugging Face:

                          登入 HF token。
                          確認 briaai/RMBG-2.0 與 facebook/dinov3-vitl16-pretrain-lvd1689m 都可下載。
                          

                          3090 robot 2048:

                          Output: outputs/rtx3090-robot-2048-rembg.glb
                          Log: logs/rtx3090-robot-2048-rembg.log
                          Wall time: 6:27.50
                          Load: 163.8570s
                          Pipeline: 148.7663s
                          Export: 65.3185s
                          Measured compute: 214.0916s
                          Max RSS: 25,560,468 KB
                          File size: about 48 MB
                          

                          3090 robot 4096:

                          Output: outputs/rtx3090-robot-4096-rembg.glb
                          Log: logs/rtx3090-robot-4096-rembg.log
                          Wall time: 4:49.14
                          Load: 121.8544s
                          Pipeline: 57.1088s
                          Export: 101.2109s
                          Measured compute: 158.3274s
                          Max RSS: 25,473,892 KB
                          File size: about 77 MB
                          

                          3090 觀察:

                          24GB VRAM 成功完成 2048 與 4096 full-rembg 測試。
                          沒有 OOM。
                          4096 export 較重,export_seconds 達 101.2109s。
                          正式 2048/4096 測試合計約 11 分 17 秒,不含第一次環境建置。
                          

                          完成後:

                          下載 GLB/log。
                          destroy instance 39911959。
                          再次確認 Vast.ai 沒有剩餘 instance。
                          

                          產物清單

                          GLB:

                          outputs/rtxpro4000-smoke-2048-no-rembg-v6.glb
                          outputs/rtxpro4000-robot-2048-no-rembg.glb
                          outputs/rtxpro4000-robot-4096-no-rembg.glb
                          outputs/rtx5090-robot-4096-rembg.glb
                          outputs/rtx3090-robot-2048-rembg.glb
                          outputs/rtx3090-robot-4096-rembg.glb
                          

                          Logs:

                          logs/rtxpro4000-smoke-2048-no-rembg-v6.log
                          logs/rtxpro4000-robot-2048-no-rembg.log
                          logs/rtxpro4000-robot-4096-no-rembg.log
                          logs/rtx5090-robot-4096-rembg.log
                          logs/rtx3090-robot-2048-rembg.log
                          logs/rtx3090-robot-4096-rembg.log
                          

                          Markdown 彙整:

                          notes.md
                          gpu-results-summary.md
                          gpu-results-summary.zh-TW.md
                          logs-export.md
                          

                          後續建議

                          1. 之後要租 3090 / 4080S / 5090 做同類測試,先做預建 Docker image。
                          2. 預建 image 內應包含 PyTorch cu130、flash-attn、nvdiffrast、nvdiffrec_render、cumesh、flex_gemm、o_voxel。
                          3. 3090 實體機若要長期使用,建好環境後應保留 wheel cache,避免重複編譯。
                          4. RTX PRO 4000 需要重跑 full-rembg,才能和 3090 / 5090 做公平速度比較。
                          5. AMD R9700 的 ROCm 結果應另列,因為它使用 CPU KDTree fallback,不能直接視為同一條 pipeline。
                          1 条回复 最后回复
                          0
                          • CS6C 离线
                            CS6C 离线
                            CS6
                            编写于 最后由 编辑
                            #15

                            截圖 2026-06-08 凌晨1.55.31.png

                            5 1 条回复 最后回复
                            0
                            • CS6C 离线
                              CS6C 离线
                              CS6
                              编写于 最后由 编辑
                              #16

                              我覺得今天AI自己跑實驗做得蠻奇怪的,我可能明天再會重新測一次

                              1 条回复 最后回复
                              0
                              • CS6C 离线
                                CS6C 离线
                                CS6
                                编写于 最后由 编辑
                                #17

                                4080S 32GB 重點結果:

                                • 有效 run:rtx4080s32-robot-4096-full-rembg-xformers-detailed
                                • 使用你的 robot 圖:/workspace/input/robot.jpeg
                                • 正式 pipeline:microsoft/TRELLIS.2-4B + DINOv3 + RMBG
                                • Wall time:4:50.15
                                • Measured compute:146.46s
                                • Pipeline:54.73s
                                • to_glb:72.68s
                                • glb_export:19.05s
                                • GLB:75M 本機檔案
                                • GPU memory CSV 峰值:7569 MiB
                                • Exit status:0
                                1 条回复 最后回复
                                0
                                • CS6C CS6

                                  截圖 2026-06-08 凌晨1.55.31.png

                                  5 在线
                                  5 在线
                                  566656661
                                  编写于 最后由 编辑
                                  #18

                                  @CS6

                                  感覺我的數據好像有點異常

                                  1 条回复 最后回复
                                  0
                                  • 系统 取消固定了该主题
                                  • 5 离线
                                    5 离线
                                    5ccccc
                                    编写于 最后由 编辑
                                    #19

                                    感觉这个板块好少啊

                                    1 条回复 最后回复
                                    0
                                    • ye9okY 离线
                                      ye9okY 离线
                                      ye9ok
                                      编写于 最后由 编辑
                                      #20

                                      雖然俺不懂3D,但是有沒有試過zluda?會不會好一點?

                                      CS6C 1 条回复 最后回复
                                      0
                                      • ye9okY ye9ok

                                        雖然俺不懂3D,但是有沒有試過zluda?會不會好一點?

                                        CS6C 离线
                                        CS6C 离线
                                        CS6
                                        编写于 最后由 编辑
                                        #21

                                        @ye9ok 我直接買了一張3090 , 晚上讓他自己跑測試看看單卡還是混合工作比較快

                                        1 条回复 最后回复
                                        0
                                        • CS6C 离线
                                          CS6C 离线
                                          CS6
                                          编写于 最后由 编辑
                                          #22

                                          RTX 3090 TRELLIS.2 Gradio Success Run

                                          Date: 2026-06-11 Taipei time
                                          GPU: RTX 3090 24GB
                                          Service: official TRELLIS.2 Gradio app
                                          耗費時間:310s

                                          17522d86-b047-4d33-9084-bbfec96c9525-image.jpeg

                                          Result

                                          This is the first confirmed successful Gradio UI run after the RTX 3090 texture fix and Gradio preview workaround.

                                          The GLB was originally produced by Gradio under the TRELLIS.2 session tmp directory:

                                          /mnt/data/comfy-runtimes/TRELLIS.2/tmp/40hdh9xwxxz/sample_2026-06-10T204915.884.glb
                                          

                                          It has been copied to the stable shared experiment output directory:

                                          /mnt/data/experiments/trellis2/outputs/gradio-success-20260610-204915/sample_2026-06-10T204915.884.glb
                                          

                                          Extracted textures were also copied:

                                          /mnt/data/experiments/trellis2/outputs/gradio-success-20260610-204915/texture_0.png
                                          /mnt/data/experiments/trellis2/outputs/gradio-success-20260610-204915/texture_1.png
                                          

                                          Runtime

                                          Component Value
                                          Docker image local/vm105-comfyui-trellis2:torch291-cu128-py312
                                          Torch 2.9.1+cu128
                                          CUDA runtime 12.8
                                          Transformers 4.57.3
                                          XFormers 0.0.33.post2
                                          GPU NVIDIA GeForce RTX 3090
                                          Dense attention sdpa
                                          Sparse attention xformers
                                          Sparse convolution flex_gemm

                                          Gradio log confirmed:

                                          [SPARSE] Conv backend: flex_gemm; Attention backend: xformers
                                          [ATTENTION] Using backend: sdpa
                                          

                                          Gradio Parameters

                                          The run used the Gradio UI path. The app defaults at the time of the run were:

                                          Parameter Value
                                          Resolution 1024
                                          Seed randomized by UI unless manually disabled
                                          Decimation target 500,000
                                          Texture size 2048
                                          Sparse structure steps 12
                                          Sparse structure guidance 7.5
                                          Sparse structure guidance rescale 0.7
                                          Shape SLat steps 12
                                          Shape SLat guidance 7.5
                                          Shape SLat guidance rescale 0.5
                                          Texture SLat steps 12
                                          Texture SLat guidance 1.0
                                          Texture SLat guidance rescale 0.0

                                          The exact randomized seed is not recoverable from current Gradio logs. Future UI runs should log the seed explicitly if they are used as purchase or production benchmarks.

                                          Timing Evidence

                                          Gradio does not currently emit the same per-stage timing data as the benchmark runner. The following times are observable from Docker logs and file metadata:

                                          Event UTC Time Taipei Time
                                          Gradio service ready 2026-06-10 20:12:50 2026-06-11 04:12:50
                                          Successful run activity appears in log 2026-06-10 20:48:26 2026-06-11 04:48:26
                                          GLB export file timestamp 2026-06-10 20:49:17 2026-06-11 04:49:17

                                          The observable final UI/export window was about 51 seconds from the first success-run log line to the GLB file timestamp. This is not a full end-to-end timing because Gradio does not log the exact button-click timestamp or each sampler stage.

                                          For detailed stage timings, use the benchmark runner rather than the Gradio UI.

                                          Output Metrics

                                          Metric Value
                                          GLB size 20,160,096 bytes
                                          GLB size about 19.2 MiB
                                          Geometry count 1
                                          Final mesh vertices 413,289
                                          Final mesh faces 471,584
                                          Materials 1
                                          Embedded textures 2
                                          Valid texture pixels 8,388,503

                                          Texture Check

                                          Texture extraction showed valid embedded WebP textures. This is not the previous RGB-noise failure mode.

                                          Base color texture:

                                          Metric Value
                                          Texture index 0
                                          Encoded bytes 1,086,644
                                          Size 2048 x 2048
                                          Valid alpha pixels 4,194,199
                                          RGB mean 57.73 / 60.09 / 67.79
                                          RGB stddev 31.36 / 32.99 / 35.37

                                          Metallic/roughness texture:

                                          Metric Value
                                          Texture index 1
                                          Encoded bytes 187,344
                                          Size 2048 x 2048
                                          Valid alpha pixels 4,194,304
                                          RGB mean 0.67 / 144.10 / 210.61
                                          RGB stddev 1.33 / 9.00 / 7.54

                                          Notes

                                          The Gradio app is running with the RTX 3090 preview workaround:

                                          Normal / Clay / Base color preview modes only
                                          HDRI preview modes disabled
                                          

                                          This avoids the bundled nvdiffrec_render cubemap shader, which does not include an RTX 3090 sm_86 kernel. GLB extraction still uses the validated flex_gemm + xformers path.

                                          The file is currently stored in both the original Gradio tmp directory and the stable shared experiment directory. The stable shared path should be used for later review.

                                          1 条回复 最后回复
                                          1

                                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                          有了你的建议,这篇帖子会更精彩哦 💗

                                          注册 登录
                                          回复
                                          • 在新帖中回复
                                          登录后回复
                                          • 从旧到新
                                          • 从新到旧
                                          • 最多赞同


                                          • 登录

                                          • 没有帐号? 注册

                                          • 登录或注册以进行搜索。
                                          • 第一个帖子
                                            最后一个帖子
                                          0
                                          • 版块
                                          • 最新
                                          • 标签
                                          • 热门
                                          • 用户
                                          • 群组