跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI进阶话题
  3. 3D模型生成 trellis2 - r9700 rocm

3D模型生成 trellis2 - r9700 rocm

已定时 已固定 已锁定 已移动 AI进阶话题
29 帖子 4 发布者 209 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 5 在线
    5 在线
    566656661
    编写于 最后由 566656661 编辑
    #7

    @cs6

    我怎麽感覺我的CPU是瓶頸啊 😥

    81cad8e3-c776-4990-8191-ad84d71594b1-image.jpeg

    我有打開官方推薦說的remesh

    texture_size=4096
    decimation_target=1000000
    remesh=True
    torch=2.11.0+cu130
    cuda=13.0
    device=NVIDIA RTX PRO 4500 Blackwell
    
    GLB size: about 39.9 MiB (41,854,640 bytes)
    final mesh: 770,210 vertices / 979,967 faces
    valid texture pixels: 16,776,431
    GLB check: materials=1, textures=2, images=2, baseColorTexture exists
    
    階段 時間 備註
    啟動 / 載入 pipeline 約 58 秒 載入模型與 pipeline,未計入 measured_compute_seconds
    模型生成 / sampling / decode 約 2 分 2 秒 從開始跑圖到 to_glb 開始前
    mesh simplify 約 0 秒 pipeline 後、GLB 匯出前的 simplify 呼叫
    GLB 匯出總時間 約 46 秒 to_glb、texture baking、remesh、xatlas、glb export
    measured compute total 約 2 分 48 秒 pipeline + simplify + video + export
    - GLB size: 41,854,640 bytes, about 39.9 MiB
    - Final mesh: 770,210 vertices / 979,967 faces
    - Valid texture pixels: 16,776,431
    - Model generation / sampling / decode: 約 2 分 2 秒
    - GLB export: 約 46 秒
    - Measured compute total: 約 2 分 48 秒
    

    整個測試過程Markdown
    trellis2-cuda.zip

    CS6C 1 条回复 最后回复
    1
    • 5 566656661

      @cs6

      我怎麽感覺我的CPU是瓶頸啊 😥

      81cad8e3-c776-4990-8191-ad84d71594b1-image.jpeg

      我有打開官方推薦說的remesh

      texture_size=4096
      decimation_target=1000000
      remesh=True
      torch=2.11.0+cu130
      cuda=13.0
      device=NVIDIA RTX PRO 4500 Blackwell
      
      GLB size: about 39.9 MiB (41,854,640 bytes)
      final mesh: 770,210 vertices / 979,967 faces
      valid texture pixels: 16,776,431
      GLB check: materials=1, textures=2, images=2, baseColorTexture exists
      
      階段 時間 備註
      啟動 / 載入 pipeline 約 58 秒 載入模型與 pipeline,未計入 measured_compute_seconds
      模型生成 / sampling / decode 約 2 分 2 秒 從開始跑圖到 to_glb 開始前
      mesh simplify 約 0 秒 pipeline 後、GLB 匯出前的 simplify 呼叫
      GLB 匯出總時間 約 46 秒 to_glb、texture baking、remesh、xatlas、glb export
      measured compute total 約 2 分 48 秒 pipeline + simplify + video + export
      - GLB size: 41,854,640 bytes, about 39.9 MiB
      - Final mesh: 770,210 vertices / 979,967 faces
      - Valid texture pixels: 16,776,431
      - Model generation / sampling / decode: 約 2 分 2 秒
      - GLB export: 約 46 秒
      - Measured compute total: 約 2 分 48 秒
      

      整個測試過程Markdown
      trellis2-cuda.zip

      CS6C 离线
      CS6C 离线
      CS6
      编写于 最后由 CS6 编辑
      #8

      @566656661 说:

      CPU

      我把cpu 降到跟你差不多的條件試試
      但 cuda 可以走 BVH 處理 texture baking 真的好快...

      5 1 条回复 最后回复
      0
      • CS6C CS6

        @566656661 说:

        CPU

        我把cpu 降到跟你差不多的條件試試
        但 cuda 可以走 BVH 處理 texture baking 真的好快...

        5 在线
        5 在线
        566656661
        编写于 最后由 编辑
        #9

        @CS6

        這還是一個移動端cpu

        加速真的有點猛, 難怪專業軟件統一推薦N卡

        CS6C 1 条回复 最后回复
        0
        • 5 566656661

          @CS6

          這還是一個移動端cpu

          加速真的有點猛, 難怪專業軟件統一推薦N卡

          CS6C 离线
          CS6C 离线
          CS6
          编写于 最后由 编辑
          #10

          @566656661 對啊....感覺第二張還是要買N卡

          1 条回复 最后回复
          0
          • 5 离线
            5 离线
            5ccccc
            编写于 最后由 编辑
            #11

            这是搞游戏的角色?

            5 1 条回复 最后回复
            0
            • 5 5ccccc

              这是搞游戏的角色?

              5 在线
              5 在线
              566656661
              编写于 最后由 编辑
              #12

              @5ccccc

              以照片2d深度去推斷出3d建模

              至少我看完那個github repo是這樣理解的

              1 条回复 最后回复
              0
              • 5 在线
                5 在线
                566656661
                编写于 最后由 编辑
                #13

                @cs6

                我把昨天cuda docker跟benchmark的東西放在這裏了

                README.zip

                1 条回复 最后回复
                1
                • terryT terry 从 AI音视频画图 移动了该主题
                • terryT terry 固定了该主题
                • CS6C 离线
                  CS6C 离线
                  CS6
                  编写于 最后由 CS6 编辑
                  #14

                  TRELLIS.2 外部主機實驗紀錄與 GPU 結果摘要

                  實驗資料夾:

                  external-host-experiments/2026-06-07-vastai-trellis2
                  

                  目前狀態:

                  所有 Vast.ai instance 都已關閉。
                  最後確認 `vastai show instances-v1 --raw` 回傳 total_instances=0。
                  

                  本次主要目標:

                  用外部 NVIDIA GPU 主機測試 TRELLIS.2。
                  固定使用 robot.jpeg 做 3D 生成,觀察 2048 / 4096 texture 輸出結果。
                  特別關注 RTX 3090 是否值得購入實體卡片:24GB VRAM 是否足夠、4096 是否能成功、正式生成時間如何。
                  

                  測試素材

                  主要輸入圖:

                  lab-docs/test-assets/robot.jpeg
                  

                  遠端路徑:

                  /workspace/work/inputs/robot.jpeg
                  

                  另有一筆早期環境 smoke test 使用 TRELLIS.2 官方範例圖:

                  /workspace/TRELLIS.2/assets/example_image/T.png
                  

                  執行環境與方法

                  共同設定:

                  TRELLIS.2
                  Torch: 2.12.0+cu130
                  CUDA runtime: 13.0
                  Attention backend: flash_attn
                  Sparse conv backend: flex_gemm
                  decimation_target=1000000
                  remesh=1
                  write_video=0
                  GLB export: extension_webp=False
                  

                  背景移除狀態:

                  RTX PRO 4000 早期測試:no-rembg
                  原因:當時 briaai/RMBG-2.0 gated access 尚未完成授權。
                  
                  RTX 3090 / RTX 5090 測試:full rembg
                  原因:後續 Hugging Face token 已登入,briaai/RMBG-2.0 可下載並正常使用。
                  

                  重要比較限制:

                  RTX PRO 4000 的 no-rembg 結果不能直接和 RTX 3090 / RTX 5090 的 full-rembg 結果做嚴格速度比較。
                  它仍可作為 CUDA 環境與 no-rembg pipeline 的參考。
                  

                  GPU 結果摘要

                  每個 benchmark 內部階段的拆表見:

                  gpu-stage-timing.zh-TW.md
                  
                  GPU 模式 Texture Wall time Measured compute Pipeline Export Max RSS GLB
                  RTX 3090 24GB full rembg 2048 6:27.50 214.09s 148.77s 65.32s 25,560,468 KB outputs/rtx3090-robot-2048-rembg.glb
                  RTX 3090 24GB full rembg 4096 4:49.14 158.33s 57.11s 101.21s 25,473,892 KB outputs/rtx3090-robot-4096-rembg.glb
                  RTX 5090 32GB full rembg 4096 3:15.19 128.01s 86.84s 41.17s 26,572,504 KB outputs/rtx5090-robot-4096-rembg.glb
                  RTX PRO 4000 Blackwell 24GB no-rembg 2048 2:39.94 100.77s 76.89s 23.87s 24,259,192 KB outputs/rtxpro4000-robot-2048-no-rembg.glb
                  RTX PRO 4000 Blackwell 24GB no-rembg 4096 2:26.62 86.84s 41.27s 45.56s 24,675,052 KB outputs/rtxpro4000-robot-4096-no-rembg.glb

                  結論

                  RTX 3090 的重點結論:

                  RTX 3090 24GB 可以完整跑 TRELLIS.2 robot 4096 + RMBG。
                  4096 full-rembg 成功輸出 GLB,沒有 OOM。
                  正式 4096 wall time 是 4:49.14。
                  

                  對購買實體 RTX 3090 的判斷:

                  顯卡本身可行,24GB VRAM 足夠完成這次 4096 測試。
                  第一次安裝環境會很慢,主要是 flash-attn / native CUDA extensions 編譯。
                  這是初次部署成本,不是每次生成都會發生。
                  如果購買實體卡,建議保留 Python 環境、wheel cache,或直接做預建 Docker image。
                  

                  CPU / GPU 負載判斷:

                  環境建置時間主要卡在 CPU、編譯器、磁碟 I/O。
                  正式生成階段才主要使用 GPU。
                  GLB export、xatlas UV、mesh/texture 後處理仍會吃不少 CPU。
                  

                  完整流水紀錄

                  1. 建立外部主機實驗資料夾

                  建立資料夾集中保存租借外部主機的實驗資料:

                  external-host-experiments/2026-06-07-vastai-trellis2
                  

                  內容包含:

                  notes.md
                  gpu-results-summary.md
                  gpu-results-summary.zh-TW.md
                  logs-export.md
                  outputs/
                  logs/
                  scripts/
                  

                  2. Vast.ai CLI 與 SSH key

                  先安裝並設定 Vast.ai CLI,建立新的 SSH key 給租借主機使用。

                  後續操作使用 CLI 建立、查詢、關閉 instances,並用 SSH/SCP 上傳 benchmark harness、下載 GLB 與 logs。

                  3. 初始指定機器

                  原先記錄的機器建立命令:

                  vastai create instance 35865076 \
                    --image pytorch/pytorch:2.6.0-cuda12.4-cudnn9-devel \
                    --disk 180 \
                    --ssh \
                    --direct \
                    --env '-p 7860:7860' \
                    --label trellis2-smoke
                  

                  選擇理由:

                  偏好 AMD CPU。
                  價格可控。
                  VRAM 24GB,足夠做 TRELLIS.2 smoke test。
                  

                  4. RTX PRO 4000 第一次嘗試

                  Instance:

                  Instance ID: 39881802
                  Offer ID: 35865076
                  GPU: NVIDIA RTX PRO 4000 Blackwell
                  CPU: AMD Ryzen Threadripper PRO 5945WX 12-Cores
                  

                  主要問題:

                  起初使用 pytorch/pytorch:2.6.0-cuda12.4-cudnn9-devel。
                  後續 TRELLIS.2 setup 需要 CUDA 13 / PyTorch cu130 路線。
                  CUDA 12.4 + RTX PRO 4000 Blackwell sm_120 不適合。
                  

                  處理過程:

                  改回 CUDA 13 + torch 2.12.0+cu130。
                  nvdiffrast、nvdiffrec_render、cumesh、o_voxel、flex_gemm 可成功編譯與 import。
                  但 flash-attn 2.7.3 現場編譯 sm_120 花太久。
                  依使用者指示停止該輪,關閉 instance。
                  

                  結論:

                  手動從 PyTorch CUDA 12.4 image 開始不理想。
                  RTX PRO 4000 Blackwell 應走 CUDA 13 / PyTorch cu130。
                  更好的做法是沿用 RTX PRO 4500 測試提供的 CUDA benchmark harness 或預建 image。
                  

                  5. RTX PRO 4000 CUDA 13 成功跑通

                  Instance:

                  Instance ID: 39888728
                  GPU: NVIDIA RTX PRO 4000 Blackwell, 24467 MiB
                  CPU: AMD Ryzen Threadripper PRO 5945WX 12-Cores
                  Image: nvidia/cuda:13.0.2-cudnn-devel-ubuntu22.04
                  

                  成功項目:

                  TRELLIS.2 CUDA 13 環境完成。
                  flash-attn / native extensions 可用。
                  

                  限制:

                  當時 briaai/RMBG-2.0 尚未授權,因此改用 no-rembg。
                  benchmark 使用 preprocess_image=False。
                  

                  官方範例圖 smoke test:

                  Input: /workspace/TRELLIS.2/assets/example_image/T.png
                  Texture: 2048
                  Output: outputs/rtxpro4000-smoke-2048-no-rembg-v6.glb
                  Wall time: 2:34.81
                  Measured compute: 95.6548s
                  

                  robot 2048:

                  Output: outputs/rtxpro4000-robot-2048-no-rembg.glb
                  Log: logs/rtxpro4000-robot-2048-no-rembg.log
                  Wall time: 2:39.94
                  Measured compute: 100.7658s
                  File size: about 48 MB
                  

                  robot 4096:

                  Output: outputs/rtxpro4000-robot-4096-no-rembg.glb
                  Log: logs/rtxpro4000-robot-4096-no-rembg.log
                  Wall time: 2:26.62
                  Measured compute: 86.8375s
                  File size: about 78 MB
                  

                  完成後下載 GLB/log,關閉 instance。

                  6. 搜尋 3090 / 4080S / 5090

                  使用 Vast.ai 查詢可租用主機,偏好 AMD CPU。

                  4080S:

                  曾建立一台 4080S instance。
                  使用者後續指示關掉。
                  已 destroy,不再繼續跑。
                  

                  3090:

                  重點卡片,因為使用者正在評估是否購買實體 RTX 3090。
                  

                  5090:

                  使用者指示 5090 跑完 4096 後立刻關閉。
                  

                  7. RTX 5090 full-rembg 4096 測試

                  Instance:

                  Instance ID: 39911711
                  Label: trellis2-rtx5090-robot-b
                  GPU: NVIDIA GeForce RTX 5090, 32607 MiB
                  CPU: AMD EPYC 9655 96-Core Processor
                  Image: nvidia/cuda:13.0.2-cudnn-devel-ubuntu22.04
                  

                  建置:

                  安裝 PyTorch 2.12.0+cu130。
                  安裝 TRELLIS.2 dependencies。
                  第一次 setup 遇到 flash-attn pip build isolation 看不到 torch 的錯誤。
                  改用 python3 -m pip install flash-attn==2.7.3 --no-build-isolation 成功。
                  nvdiffrast、nvdiffrec_render、cumesh、flex_gemm、o_voxel 全部 import OK。
                  

                  Hugging Face:

                  登入 HF token 後,briaai/RMBG-2.0 與 facebook/dinov3-vitl16-pretrain-lvd1689m 都可下載。
                  

                  正式測試:

                  Input: robot.jpeg
                  Texture size: 4096
                  Mode: full rembg
                  Output: outputs/rtx5090-robot-4096-rembg.glb
                  Log: logs/rtx5090-robot-4096-rembg.log
                  

                  結果:

                  Wall time: 3:15.19
                  Load: 62.9314s
                  Pipeline: 86.8388s
                  Export: 41.1694s
                  Measured compute: 128.0098s
                  Max RSS: 26,572,504 KB
                  File size: about 77 MB
                  

                  完成後:

                  下載 GLB/log。
                  立刻 destroy instance 39911711。
                  

                  8. RTX 3090 full-rembg 2048 / 4096 測試

                  Instance:

                  Instance ID: 39911959
                  Label: trellis2-rtx3090-robot-b
                  GPU: NVIDIA GeForce RTX 3090, 24576 MiB
                  CPU: AMD EPYC 7642 48-Core Processor
                  Image: nvidia/cuda:13.0.2-cudnn-devel-ubuntu22.04
                  

                  建置瓶頸:

                  RTX 3090 的環境建置主要卡在 flash-attn 2.7.3 source build。
                  原因是 CUDA 13 + sm_86 沒有直接拿到可用的預編譯 wheel,pip 從 source 編整套 kernels。
                  這段主要吃 CPU、編譯器與磁碟 I/O,GPU 幾乎沒在跑。
                  

                  使用者確認:

                  即使燒到 20 美元也沒關係,重點是要知道 3090 結果。
                  因此沒有因建置時間過長而停止。
                  

                  完成建置:

                  flash-attn build 完成。
                  nvdiffrast、nvdiffrec_render、cumesh、flex_gemm、o_voxel 全部 import OK。
                  

                  Hugging Face:

                  登入 HF token。
                  確認 briaai/RMBG-2.0 與 facebook/dinov3-vitl16-pretrain-lvd1689m 都可下載。
                  

                  3090 robot 2048:

                  Output: outputs/rtx3090-robot-2048-rembg.glb
                  Log: logs/rtx3090-robot-2048-rembg.log
                  Wall time: 6:27.50
                  Load: 163.8570s
                  Pipeline: 148.7663s
                  Export: 65.3185s
                  Measured compute: 214.0916s
                  Max RSS: 25,560,468 KB
                  File size: about 48 MB
                  

                  3090 robot 4096:

                  Output: outputs/rtx3090-robot-4096-rembg.glb
                  Log: logs/rtx3090-robot-4096-rembg.log
                  Wall time: 4:49.14
                  Load: 121.8544s
                  Pipeline: 57.1088s
                  Export: 101.2109s
                  Measured compute: 158.3274s
                  Max RSS: 25,473,892 KB
                  File size: about 77 MB
                  

                  3090 觀察:

                  24GB VRAM 成功完成 2048 與 4096 full-rembg 測試。
                  沒有 OOM。
                  4096 export 較重,export_seconds 達 101.2109s。
                  正式 2048/4096 測試合計約 11 分 17 秒,不含第一次環境建置。
                  

                  完成後:

                  下載 GLB/log。
                  destroy instance 39911959。
                  再次確認 Vast.ai 沒有剩餘 instance。
                  

                  產物清單

                  GLB:

                  outputs/rtxpro4000-smoke-2048-no-rembg-v6.glb
                  outputs/rtxpro4000-robot-2048-no-rembg.glb
                  outputs/rtxpro4000-robot-4096-no-rembg.glb
                  outputs/rtx5090-robot-4096-rembg.glb
                  outputs/rtx3090-robot-2048-rembg.glb
                  outputs/rtx3090-robot-4096-rembg.glb
                  

                  Logs:

                  logs/rtxpro4000-smoke-2048-no-rembg-v6.log
                  logs/rtxpro4000-robot-2048-no-rembg.log
                  logs/rtxpro4000-robot-4096-no-rembg.log
                  logs/rtx5090-robot-4096-rembg.log
                  logs/rtx3090-robot-2048-rembg.log
                  logs/rtx3090-robot-4096-rembg.log
                  

                  Markdown 彙整:

                  notes.md
                  gpu-results-summary.md
                  gpu-results-summary.zh-TW.md
                  logs-export.md
                  

                  後續建議

                  1. 之後要租 3090 / 4080S / 5090 做同類測試,先做預建 Docker image。
                  2. 預建 image 內應包含 PyTorch cu130、flash-attn、nvdiffrast、nvdiffrec_render、cumesh、flex_gemm、o_voxel。
                  3. 3090 實體機若要長期使用,建好環境後應保留 wheel cache,避免重複編譯。
                  4. RTX PRO 4000 需要重跑 full-rembg,才能和 3090 / 5090 做公平速度比較。
                  5. AMD R9700 的 ROCm 結果應另列,因為它使用 CPU KDTree fallback,不能直接視為同一條 pipeline。
                  1 条回复 最后回复
                  0
                  • CS6C 离线
                    CS6C 离线
                    CS6
                    编写于 最后由 编辑
                    #15

                    截圖 2026-06-08 凌晨1.55.31.png

                    5 1 条回复 最后回复
                    0
                    • CS6C 离线
                      CS6C 离线
                      CS6
                      编写于 最后由 编辑
                      #16

                      我覺得今天AI自己跑實驗做得蠻奇怪的,我可能明天再會重新測一次

                      1 条回复 最后回复
                      0
                      • CS6C 离线
                        CS6C 离线
                        CS6
                        编写于 最后由 编辑
                        #17

                        4080S 32GB 重點結果:

                        • 有效 run:rtx4080s32-robot-4096-full-rembg-xformers-detailed
                        • 使用你的 robot 圖:/workspace/input/robot.jpeg
                        • 正式 pipeline:microsoft/TRELLIS.2-4B + DINOv3 + RMBG
                        • Wall time:4:50.15
                        • Measured compute:146.46s
                        • Pipeline:54.73s
                        • to_glb:72.68s
                        • glb_export:19.05s
                        • GLB:75M 本機檔案
                        • GPU memory CSV 峰值:7569 MiB
                        • Exit status:0
                        1 条回复 最后回复
                        0
                        • CS6C CS6

                          截圖 2026-06-08 凌晨1.55.31.png

                          5 在线
                          5 在线
                          566656661
                          编写于 最后由 编辑
                          #18

                          @CS6

                          感覺我的數據好像有點異常

                          1 条回复 最后回复
                          0
                          • 系统 取消固定了该主题
                          • 5 离线
                            5 离线
                            5ccccc
                            编写于 最后由 编辑
                            #19

                            感觉这个板块好少啊

                            1 条回复 最后回复
                            0
                            • ye9okY 离线
                              ye9okY 离线
                              ye9ok
                              编写于 最后由 编辑
                              #20

                              雖然俺不懂3D,但是有沒有試過zluda?會不會好一點?

                              CS6C 1 条回复 最后回复
                              0
                              • ye9okY ye9ok

                                雖然俺不懂3D,但是有沒有試過zluda?會不會好一點?

                                CS6C 离线
                                CS6C 离线
                                CS6
                                编写于 最后由 编辑
                                #21

                                @ye9ok 我直接買了一張3090 , 晚上讓他自己跑測試看看單卡還是混合工作比較快

                                1 条回复 最后回复
                                0
                                • CS6C 离线
                                  CS6C 离线
                                  CS6
                                  编写于 最后由 编辑
                                  #22

                                  RTX 3090 TRELLIS.2 Gradio Success Run

                                  Date: 2026-06-11 Taipei time
                                  GPU: RTX 3090 24GB
                                  Service: official TRELLIS.2 Gradio app
                                  耗費時間:310s

                                  17522d86-b047-4d33-9084-bbfec96c9525-image.jpeg

                                  Result

                                  This is the first confirmed successful Gradio UI run after the RTX 3090 texture fix and Gradio preview workaround.

                                  The GLB was originally produced by Gradio under the TRELLIS.2 session tmp directory:

                                  /mnt/data/comfy-runtimes/TRELLIS.2/tmp/40hdh9xwxxz/sample_2026-06-10T204915.884.glb
                                  

                                  It has been copied to the stable shared experiment output directory:

                                  /mnt/data/experiments/trellis2/outputs/gradio-success-20260610-204915/sample_2026-06-10T204915.884.glb
                                  

                                  Extracted textures were also copied:

                                  /mnt/data/experiments/trellis2/outputs/gradio-success-20260610-204915/texture_0.png
                                  /mnt/data/experiments/trellis2/outputs/gradio-success-20260610-204915/texture_1.png
                                  

                                  Runtime

                                  Component Value
                                  Docker image local/vm105-comfyui-trellis2:torch291-cu128-py312
                                  Torch 2.9.1+cu128
                                  CUDA runtime 12.8
                                  Transformers 4.57.3
                                  XFormers 0.0.33.post2
                                  GPU NVIDIA GeForce RTX 3090
                                  Dense attention sdpa
                                  Sparse attention xformers
                                  Sparse convolution flex_gemm

                                  Gradio log confirmed:

                                  [SPARSE] Conv backend: flex_gemm; Attention backend: xformers
                                  [ATTENTION] Using backend: sdpa
                                  

                                  Gradio Parameters

                                  The run used the Gradio UI path. The app defaults at the time of the run were:

                                  Parameter Value
                                  Resolution 1024
                                  Seed randomized by UI unless manually disabled
                                  Decimation target 500,000
                                  Texture size 2048
                                  Sparse structure steps 12
                                  Sparse structure guidance 7.5
                                  Sparse structure guidance rescale 0.7
                                  Shape SLat steps 12
                                  Shape SLat guidance 7.5
                                  Shape SLat guidance rescale 0.5
                                  Texture SLat steps 12
                                  Texture SLat guidance 1.0
                                  Texture SLat guidance rescale 0.0

                                  The exact randomized seed is not recoverable from current Gradio logs. Future UI runs should log the seed explicitly if they are used as purchase or production benchmarks.

                                  Timing Evidence

                                  Gradio does not currently emit the same per-stage timing data as the benchmark runner. The following times are observable from Docker logs and file metadata:

                                  Event UTC Time Taipei Time
                                  Gradio service ready 2026-06-10 20:12:50 2026-06-11 04:12:50
                                  Successful run activity appears in log 2026-06-10 20:48:26 2026-06-11 04:48:26
                                  GLB export file timestamp 2026-06-10 20:49:17 2026-06-11 04:49:17

                                  The observable final UI/export window was about 51 seconds from the first success-run log line to the GLB file timestamp. This is not a full end-to-end timing because Gradio does not log the exact button-click timestamp or each sampler stage.

                                  For detailed stage timings, use the benchmark runner rather than the Gradio UI.

                                  Output Metrics

                                  Metric Value
                                  GLB size 20,160,096 bytes
                                  GLB size about 19.2 MiB
                                  Geometry count 1
                                  Final mesh vertices 413,289
                                  Final mesh faces 471,584
                                  Materials 1
                                  Embedded textures 2
                                  Valid texture pixels 8,388,503

                                  Texture Check

                                  Texture extraction showed valid embedded WebP textures. This is not the previous RGB-noise failure mode.

                                  Base color texture:

                                  Metric Value
                                  Texture index 0
                                  Encoded bytes 1,086,644
                                  Size 2048 x 2048
                                  Valid alpha pixels 4,194,199
                                  RGB mean 57.73 / 60.09 / 67.79
                                  RGB stddev 31.36 / 32.99 / 35.37

                                  Metallic/roughness texture:

                                  Metric Value
                                  Texture index 1
                                  Encoded bytes 187,344
                                  Size 2048 x 2048
                                  Valid alpha pixels 4,194,304
                                  RGB mean 0.67 / 144.10 / 210.61
                                  RGB stddev 1.33 / 9.00 / 7.54

                                  Notes

                                  The Gradio app is running with the RTX 3090 preview workaround:

                                  Normal / Clay / Base color preview modes only
                                  HDRI preview modes disabled
                                  

                                  This avoids the bundled nvdiffrec_render cubemap shader, which does not include an RTX 3090 sm_86 kernel. GLB extraction still uses the validated flex_gemm + xformers path.

                                  The file is currently stored in both the original Gradio tmp directory and the stable shared experiment directory. The stable shared path should be used for later review.

                                  1 条回复 最后回复
                                  1
                                  • 5 在线
                                    5 在线
                                    566656661
                                    编写于 最后由 编辑
                                    #23

                                    所以還是得要有cuda加速😂

                                    CS6C 1 条回复 最后回复
                                    0
                                    • 5 566656661

                                      所以還是得要有cuda加速😂

                                      CS6C 离线
                                      CS6C 离线
                                      CS6
                                      编写于 最后由 编辑
                                      #24

                                      @566656661 主要是貼圖的流程上面會有需要,但其實有替代的方案可以研究一下,因為我用R9700跑的時候就是用CPU貼圖,我想用A卡貼圖應該也是可以的,只不過要重新做很多東西,但我比較意外的是這一路測試下來所有的卡都沒有人可以跑在2分鐘以內......

                                      1 条回复 最后回复
                                      1
                                      • CS6C 离线
                                        CS6C 离线
                                        CS6
                                        编写于 最后由 编辑
                                        #25

                                        a235c88b-6262-4920-8d59-2b0e949fc887-image.jpeg

                                        1 条回复 最后回复
                                        0
                                        • 5 离线
                                          5 离线
                                          5ccccc
                                          编写于 最后由 编辑
                                          #26

                                          这玩意7900xtx能跑吗?想试试

                                          1 条回复 最后回复
                                          0

                                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                          有了你的建议,这篇帖子会更精彩哦 💗

                                          注册 登录
                                          回复
                                          • 在新帖中回复
                                          登录后回复
                                          • 从旧到新
                                          • 从新到旧
                                          • 最多赞同


                                          • 登录

                                          • 没有帐号? 注册

                                          • 登录或注册以进行搜索。
                                          • 第一个帖子
                                            最后一个帖子
                                          0
                                          • 版块
                                          • 最新
                                          • 标签
                                          • 热门
                                          • 用户
                                          • 群组