律师找到了我了

深圳律师陈扬波

此主題已被删除！

kop wang

此主題已被删除！

Devin Hi

初步沟通：准备部署deepseeek V4 flash 4张 A100 配套的都有啥？有兄弟有实际经验分享没有？

kop wang

@Devin-Hi 如果有更新的信息，可以单独发一帖或者编辑下标题和正文，这样更容易吸引到大佬

mark

此主題已被删除！

mark

此主題已被删除！

九龙杨生

@Devin-Hi 个人认为单张卡就行了，3-4人应该也不会说需要分析特别多的案子，可能刚开始积累的案子都分析了，后面机器利用率其实就比较低了，一个案子估计几十万或者复杂点上百万的卷宗文字对机器来说负荷都比较低的，甚至上千万的数据都不算多。
主要还是追求上下文长度和精确度，就是说要大显存来容纳高精度和上下文，因为大模型的读取速度和思考速度不一样的，我用的RTX6000用QWEN3.6 27B FP8模型字符读取速度最多能到8万字符每秒，但是字符输出速度50-200token/秒平均在90多；输出的都是精炼了的东西。
你这种专业领域比较偏向的，感觉是不是MOE那种专家模型会好一些。

深圳律师陈扬波

此主題已被删除！

深圳律师陈扬波

此主題已被删除！

深圳律师陈扬波

此主題已被删除！

johnnybegood

@Devin-Hi 直接 rtx 6000 pro 双卡

Devin Hi

@九龙杨生如果用QWEN3.6 27B FP8模型字符，感觉的确这个硬件配置不用这么高，6000 应该可以了，但主要是不知道使用效果，这个硬件也不好进行迭代。所以比较慎重。当然也不想花冤枉钱。

kos or

等案子忙完後再麻煩大大分享了想學習實務上的配置和操作感恩！: )

kos or

@johnnybegood 假如預算夠我也會推薦雙卡畢竟 RTX Pro 6000 價格一直漲, 同樣型號的卡做PP and TP 都很方便應付未來3~5年應該夠

Devin Hi

@kos-or

只要这个项目让我操刀，我就会回放的，配置和贴图管够

kos or

謝謝大大, 等你分享！對了, 我剛好手機裡有一些實務案例的照片和規格順便分享一下

案例一：可以參考修改成一張RTX Pro 6000
e68e8b5d-e759-483b-b9dc-7c8a75275f95-telegram-cloud-photo-size-5-6116134516314280701-y.jpg
案例二：低成本版大Memory 烏龜速度 (2 x Mac Mini + 1 x ASUS Ascent GX10 128GB LPDDR5x 頻寬 273GB/s)是利用Codex on Mac Mini來爬取收集網路上2000萬筆的公開資料相關配置可以改成隱私版本, Ascent GX10 負責處下載後的本地資料

ps. 目前性價比最高的好像是Mac Studio M3 Ultra ?

terry

@kos-or 这个可以单独发给帖子详细讲下，另外，你帖子缩进处理下，看起来别扭。

抡锤者

律师找到了我了