<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[律师找到了我了]]></title><description><![CDATA[<blockquote>
<p dir="auto">本人有一个律师事务所的朋友，他们可能需要对他们客户的资料进行分析，因为涉及机密，所以不能用公有云和大模型，朋友找到我，其实朋友感觉也不是很懂，一上来就和我说要120b模型。。。。。。 ，问我需要什么样的配置. 对于此，我并不是特别胸有成竹，所以上来求助各位大神给推荐一个硬件配置，并发数应该不大，最高3-4人。</p>
</blockquote>
<p dir="auto">越详细越好，本人特感谢。</p>
]]></description><link>https://lcz.me/topic/347/律师找到了我了</link><generator>RSS for Node</generator><lastBuildDate>Sun, 31 May 2026 04:50:34 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/347.rss" rel="self" type="application/rss+xml"/><pubDate>Fri, 29 May 2026 08:56:25 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 律师找到了我了 on Sat, 30 May 2026 02:25:10 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E4%B9%9D%E9%BE%99%E6%9D%A8%E7%94%9F" aria-label="Profile: 九龙杨生">@<bdi>九龙杨生</bdi></a> 如果用QWEN3.6 27B FP8模型字符，感觉的确这个硬件配置不用这么高，6000 应该可以了，但主要是不知道使用效果，这个硬件也不好进行迭代。所以比较慎重。当然也不想花冤枉钱。</p>
]]></description><link>https://lcz.me/post/4294</link><guid isPermaLink="true">https://lcz.me/post/4294</guid><dc:creator><![CDATA[Devin Hi]]></dc:creator><pubDate>Sat, 30 May 2026 02:25:10 GMT</pubDate></item><item><title><![CDATA[Reply to 律师找到了我了 on Fri, 29 May 2026 15:58:04 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/devin-hi" aria-label="Profile: Devin-Hi">@<bdi>Devin-Hi</bdi></a> 直接 rtx 6000 pro 双卡</p>
]]></description><link>https://lcz.me/post/4239</link><guid isPermaLink="true">https://lcz.me/post/4239</guid><dc:creator><![CDATA[johnnybegood]]></dc:creator><pubDate>Fri, 29 May 2026 15:58:04 GMT</pubDate></item><item><title><![CDATA[Reply to 律师找到了我了 on Fri, 29 May 2026 13:46:39 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/devin-hi" aria-label="Profile: Devin-Hi">@<bdi>Devin-Hi</bdi></a> 个人认为单张卡就行了，3-4人应该也不会说需要分析特别多的案子，可能刚开始积累的案子都分析了，后面机器利用率其实就比较低了，一个案子估计几十万或者复杂点上百万的卷宗文字对机器来说负荷都比较低的，甚至上千万的数据都不算多。<br />
主要还是追求上下文长度和精确度，就是说要大显存来容纳高精度和上下文，因为大模型的读取速度和思考速度不一样的，我用的RTX6000用QWEN3.6 27B FP8模型字符读取速度最多能到8万字符每秒，但是字符输出速度50-200token/秒平均在90多；输出的都是精炼了的东西。<br />
你这种专业领域比较偏向的，感觉是不是MOE那种专家模型会好一些。</p>
]]></description><link>https://lcz.me/post/4221</link><guid isPermaLink="true">https://lcz.me/post/4221</guid><dc:creator><![CDATA[九龙杨生]]></dc:creator><pubDate>Fri, 29 May 2026 13:46:39 GMT</pubDate></item><item><title><![CDATA[Reply to 律师找到了我了 on Fri, 29 May 2026 12:31:56 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/devin-hi" aria-label="Profile: Devin-Hi">@<bdi>Devin-Hi</bdi></a> 如果有更新的信息，可以单独发一帖或者编辑下标题和正文，这样更容易吸引到大佬</p>
]]></description><link>https://lcz.me/post/4212</link><guid isPermaLink="true">https://lcz.me/post/4212</guid><dc:creator><![CDATA[kop wang]]></dc:creator><pubDate>Fri, 29 May 2026 12:31:56 GMT</pubDate></item><item><title><![CDATA[Reply to 律师找到了我了 on Fri, 29 May 2026 09:57:43 GMT]]></title><description><![CDATA[<p dir="auto">初步沟通：准备部署deepseeek V4 flash   4张 A100  配套的都有啥？有兄弟有实际经验分享没有？</p>
]]></description><link>https://lcz.me/post/4187</link><guid isPermaLink="true">https://lcz.me/post/4187</guid><dc:creator><![CDATA[Devin Hi]]></dc:creator><pubDate>Fri, 29 May 2026 09:57:43 GMT</pubDate></item><item><title><![CDATA[Reply to 律师找到了我了 on Fri, 29 May 2026 09:20:14 GMT]]></title><description><![CDATA[<p dir="auto">个人建议是先找一个硬件租赁平台，用公开数据先跑一个demo实验，确定功能性和企业需求相契合再推敲方案。<br />
最起码要有一些定量信息作为标的参考，比如信息总量是多少，成功率/采纳率要多少，性能指标要多少。</p>
<p dir="auto">否则闷头做方案过于被动，无论是从最终效果呈现上，还是说从商业流程上。</p>
]]></description><link>https://lcz.me/post/4177</link><guid isPermaLink="true">https://lcz.me/post/4177</guid><dc:creator><![CDATA[kop wang]]></dc:creator><pubDate>Fri, 29 May 2026 09:20:14 GMT</pubDate></item></channel></rss>