<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[京东自营上了5090、6000pro，应该怎么选。]]></title><description><![CDATA[<p dir="auto">目前的需求是想跑localLLM（也就是qwen3.6-27B）来支持hermes agent。图、音、视频的本地生成是可选项。<br />
目前京东自营的价格是5090 33331, RTX PRO 6000的工作站版本和MAX-Q版本都是72634。</p>
<p dir="auto">想问一下锤哥和大家，这二者从性价比的角度考虑如何选择与解读。网上有种论调是RTX PRO 6000 的96GB显存其实比较鸡肋。稍大的模型跑不了，小模型又overkill。</p>
<p dir="auto">我能想到的对于96GB显存最好的使用场景就是localLLM+本地音视频，5090的32GB显存应该是满足不了同时LLM和图片文生图的。</p>
<p dir="auto">不知道各位怎么理解。</p>
]]></description><link>https://lcz.me/topic/46/京东自营上了5090-6000pro-应该怎么选</link><generator>RSS for Node</generator><lastBuildDate>Wed, 20 May 2026 07:58:54 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/46.rss" rel="self" type="application/rss+xml"/><pubDate>Thu, 07 May 2026 09:38:29 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 京东自营上了5090、6000pro，应该怎么选。 on Thu, 07 May 2026 13:55:23 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/benton-yi" aria-label="Profile: benton-yi">@<bdi>benton-yi</bdi></a> 很好的分享，赞同<img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f44d.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--+1" style="height:23px;width:auto;vertical-align:middle" title="👍" alt="👍" /></p>
]]></description><link>https://lcz.me/post/468</link><guid isPermaLink="true">https://lcz.me/post/468</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 07 May 2026 13:55:23 GMT</pubDate></item><item><title><![CDATA[Reply to 京东自营上了5090、6000pro，应该怎么选。 on Thu, 07 May 2026 11:13:55 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 个人认为与其称之为“性能过剩”的说法，不如还是“和需求不匹配”来的恰当。在这里想较个真哈，纯粹是阐述一下剖析底层需求的逻辑方法，如果能帮到硬件选型的朋友也算歪打正着了：<br />
1，假如像之前想买双DGX Spark的老哥说主要用来跑deepseek-v4-flash辅助写作，那么他需求的吐字速度就是比人眼阅读速度的极限快个2倍就行，因为他是真的要亲自来阅读模型输出的每个字的。他真正迫切的是VRAM要大到能装下聪明（大容量）的脑子，而50tokens/s和400tokens/s对老哥来说其实没有任何差异（心理上更爽带来的提升不算，没有实质命中需求）。<br />
2，举个自己的例子，我自己跑文生图/图生图是依赖comfyUI工作流（ERNIE或者Qwen-Image）的，通常在草稿阶段需要我根据老婆口述的模糊设计，自己写提示词让工作流生成800x800的样稿，然后给她过目再口述怎么改，我再改提示词如此往复，直到老婆大人满意定稿，我再输出高清图或者作为视频的关键帧再去制作视频。这个改稿的过程少则10几次，多则三四十次，偶尔途中可能还会推翻设计。那么20多秒出图就一定比1分钟出图更有效率，每一秒的提升在我这都是实实在在的。<br />
3，用来驱动Hermes跑定时任务or处理日杂事务，驱动claude code用来氛围开发或者像我作为操作Linux的中间层（我自己接触Linux起步较晚并不熟练，cc作为一根“Linux拐杖”简直深得我心，非常满意）。这类智能体会根据你布置给它的任务，从它自身的Harness里按范式一步一步尝试解决，虽然是会越来越聪明但那是在至少以周甚至月为尺度的多次复用情况下的。你临时给一个任务平均它就是要尝试10几次甚至二三十次才能搞定的，这种情况下IT（指令遵循）大模型输出的绝大部分内容都不需要你来阅读，纯属Agent&lt;=&gt;ITLLm之间的交互，你就坐等一个成功or失败的结果。这时候不论是prefill（LLM读）还是decode（LLM写），信我的你一定是希望越快越好，你不会希望给claude code说一句“按照上次的方式再重装一次SGLang框架”，1分钟快到了他才刚刚找到之前的memory开始读skills，你一定会Ctrl+C了自己来的。</p>
<p dir="auto">情况1就是算力有个保证超过阅读速度的门槛过了就行，往上看VRAM能够到哪个模型就花多少钱，是DGX还是MacStudioUltra256G，甚至10多个收一台512G的跑671B也随你喜欢；<br />
情况2和3就是Vram有个门槛过了就行，比如只跑qwen3.6-27b-q4_K_M@128kContext，但是速度能跑多快给我跑多快，你就挑大于22G显存（举个例子没具体算）的预算内的最好的gpu就行，能折腾想省钱就amd，不想折腾就nvidia；</p>
<p dir="auto">大概率不会跑偏。</p>
]]></description><link>https://lcz.me/post/453</link><guid isPermaLink="true">https://lcz.me/post/453</guid><dc:creator><![CDATA[benton yi]]></dc:creator><pubDate>Thu, 07 May 2026 11:13:55 GMT</pubDate></item><item><title><![CDATA[Reply to 京东自营上了5090、6000pro，应该怎么选。 on Thu, 07 May 2026 10:57:05 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/daniel" aria-label="Profile: Daniel">@<bdi>Daniel</bdi></a> 挺好的，买了就不要考虑这样那样，没有完美的硬件，这卡足够你用了。</p>
]]></description><link>https://lcz.me/post/450</link><guid isPermaLink="true">https://lcz.me/post/450</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 07 May 2026 10:57:05 GMT</pubDate></item><item><title><![CDATA[Reply to 京东自营上了5090、6000pro，应该怎么选。 on Thu, 07 May 2026 10:56:22 GMT]]></title><description><![CDATA[<p dir="auto">我买了4090 48G满血版，分了24期压力不大，可惜pro 6000不能分12或24期，要不然我就上pro6000了</p>
]]></description><link>https://lcz.me/post/449</link><guid isPermaLink="true">https://lcz.me/post/449</guid><dc:creator><![CDATA[Daniel]]></dc:creator><pubDate>Thu, 07 May 2026 10:56:22 GMT</pubDate></item><item><title><![CDATA[Reply to 京东自营上了5090、6000pro，应该怎么选。 on Thu, 07 May 2026 10:25:18 GMT]]></title><description><![CDATA[<p dir="auto">可以修改资料名，你自己研究下，我确定可以。</p>
]]></description><link>https://lcz.me/post/446</link><guid isPermaLink="true">https://lcz.me/post/446</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 07 May 2026 10:25:18 GMT</pubDate></item><item><title><![CDATA[Reply to 京东自营上了5090、6000pro，应该怎么选。 on Thu, 07 May 2026 09:49:21 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 懂了，感谢锤哥，另外，提个小建议，好像在设置里设置账号昵称在论坛中没什么作用，之前发帖的用户名还是google的ID，直接大名出来了有点社死XD。</p>
]]></description><link>https://lcz.me/post/442</link><guid isPermaLink="true">https://lcz.me/post/442</guid><dc:creator><![CDATA[王一民]]></dc:creator><pubDate>Thu, 07 May 2026 09:49:21 GMT</pubDate></item><item><title><![CDATA[Reply to 京东自营上了5090、6000pro，应该怎么选。 on Thu, 07 May 2026 09:43:05 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E7%8E%8B%E4%B8%80%E6%B0%91" aria-label="Profile: 王一民">@<bdi>王一民</bdi></a> 4090 48G或者RTX Pro6000，有钱就上6000，一步到位，是有性能过剩的嫌疑，这是事实，但5090确实有显存不够用的时候。你就算买RTX Pro6000，也最好不要同时用它跑模型和生图，因为抢资源你不好控制。也可以卖一个32G的4080S搭配5090或者RTX pro5000.</p>
]]></description><link>https://lcz.me/post/441</link><guid isPermaLink="true">https://lcz.me/post/441</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 07 May 2026 09:43:05 GMT</pubDate></item></channel></rss>