<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[本地单显卡10G显存部署DeepSeek相关资源]]></title><description><![CDATA[<p dir="auto">首先说下，相关原理，我在视频里有详细讲解：<a href="https://www.youtube.com/watch?v=ux9z-Bqhzps" rel="nofollow ugc">https://www.youtube.com/watch?v=ux9z-Bqhzps</a></p>
<p dir="auto">推理框架Fastllm：<a href="https://github.com/ztxz16/fastllm" rel="nofollow ugc">https://github.com/ztxz16/fastllm</a> 4.3k星，到了这个级别就不是玩具了，是可实用的。<br />
模型下载地址：<a href="https://modelscope.cn/models/huangyuyang/DeepSeek-V4-Flash-FP8-Q4" rel="nofollow ugc">https://modelscope.cn/models/huangyuyang/DeepSeek-V4-Flash-FP8-Q4</a> 这是把原版FP4 FP8混合权重的FP4部分换成了INT4，因为这样有利于CPU AVX-512指令集反量化权重，官方原版FP8模型，FP4 FP8混合模型都能跑，但是速度没Q4转译的快。</p>
<p dir="auto">关于速度和推荐配置，大家可以去官网推荐的群里去询问相关信息，我这边有朋友实测9004配置没问题，能跑起来。所以第一个视频表述有错误，我删除了修正表述重发，防止误导大家。</p>
<p dir="auto">近期我没计划测试这玩意，不过如果对1M上下文有刚需的情况下，我会尝试。</p>
]]></description><link>https://lcz.me/topic/36/本地单显卡10g显存部署deepseek相关资源</link><generator>RSS for Node</generator><lastBuildDate>Wed, 20 May 2026 07:56:40 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/36.rss" rel="self" type="application/rss+xml"/><pubDate>Wed, 06 May 2026 10:51:28 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 本地单显卡10G显存部署DeepSeek相关资源 on Thu, 07 May 2026 06:57:42 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/stakira" aria-label="Profile: stakira">@<bdi>stakira</bdi></a> 参考苹果，一个鸟样</p>
]]></description><link>https://lcz.me/post/416</link><guid isPermaLink="true">https://lcz.me/post/416</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 07 May 2026 06:57:42 GMT</pubDate></item><item><title><![CDATA[Reply to 本地单显卡10G显存部署DeepSeek相关资源 on Thu, 07 May 2026 06:57:07 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/pilipala" aria-label="Profile: pilipala">@<bdi>pilipala</bdi></a> 我1200w电源，一直跑没啥问题。我是xtx最高300w，驱动限制了这么多，然后4090d 425w，一般在400w以内，其它的消耗不超过150w。你的两个4090d满载加起来850w，其他的加起来150w。1000w到顶了。你上1200w也就够了。电源没那么玄乎，买大品牌的全模组就好。</p>
]]></description><link>https://lcz.me/post/415</link><guid isPermaLink="true">https://lcz.me/post/415</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 07 May 2026 06:57:07 GMT</pubDate></item><item><title><![CDATA[Reply to 本地单显卡10G显存部署DeepSeek相关资源 on Thu, 07 May 2026 03:12:29 GMT]]></title><description><![CDATA[<p dir="auto">玩这个其实没有多大意义的吧。decode速度是还可以，prefill速度感人，看起来是不过百。想象一下读个system prompt几十秒，读个代码文件好几分钟，读个网页好几分钟，根本没法用吧。</p>
]]></description><link>https://lcz.me/post/403</link><guid isPermaLink="true">https://lcz.me/post/403</guid><dc:creator><![CDATA[stakira]]></dc:creator><pubDate>Thu, 07 May 2026 03:12:29 GMT</pubDate></item><item><title><![CDATA[Reply to 本地单显卡10G显存部署DeepSeek相关资源 on Thu, 07 May 2026 03:05:58 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 锤哥，我在组双4090D的机器的时候碰到个问题，电源必须是1600W朝上的 16A的，插座是10A的，用转接头一直满载跑会不会有火灾隐患，你那台4090D+7900XTX是怎么解决的呢</p>
]]></description><link>https://lcz.me/post/402</link><guid isPermaLink="true">https://lcz.me/post/402</guid><dc:creator><![CDATA[pilipala]]></dc:creator><pubDate>Thu, 07 May 2026 03:05:58 GMT</pubDate></item><item><title><![CDATA[Reply to 本地单显卡10G显存部署DeepSeek相关资源 on Wed, 06 May 2026 20:41:14 GMT]]></title><description><![CDATA[<p dir="auto">配件就多到头皮发麻</p>
]]></description><link>https://lcz.me/post/359</link><guid isPermaLink="true">https://lcz.me/post/359</guid><dc:creator><![CDATA[墙内人]]></dc:creator><pubDate>Wed, 06 May 2026 20:41:14 GMT</pubDate></item><item><title><![CDATA[Reply to 本地单显卡10G显存部署DeepSeek相关资源 on Wed, 06 May 2026 13:54:02 GMT]]></title><description><![CDATA[<p dir="auto">这玩意还是要用显卡推理，原理应该差不多，但它比KT效果更好，目前就它能做到v4丝滑</p>
]]></description><link>https://lcz.me/post/335</link><guid isPermaLink="true">https://lcz.me/post/335</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Wed, 06 May 2026 13:54:02 GMT</pubDate></item><item><title><![CDATA[Reply to 本地单显卡10G显存部署DeepSeek相关资源 on Wed, 06 May 2026 11:58:06 GMT]]></title><description><![CDATA[<p dir="auto">和ktransformers类似权重都加载到内存里吧</p>
]]></description><link>https://lcz.me/post/329</link><guid isPermaLink="true">https://lcz.me/post/329</guid><dc:creator><![CDATA[zhiqing]]></dc:creator><pubDate>Wed, 06 May 2026 11:58:06 GMT</pubDate></item></channel></rss>