<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[3090+64GB内存，主要写代码，可能写一些中小完整的项目，主要是Python和前端的Nodejs之类的，大佬能推荐成熟的稳定的方案不？]]></title><description><![CDATA[<p dir="auto">陆续开始收费，但不太花太多钱买token，利用现有硬件，是否能实现AI编程自由？</p>
]]></description><link>https://lcz.me/topic/156/3090-64gb内存-主要写代码-可能写一些中小完整的项目-主要是python和前端的nodejs之类的-大佬能推荐成熟的稳定的方案不</link><generator>RSS for Node</generator><lastBuildDate>Wed, 20 May 2026 07:04:33 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/156.rss" rel="self" type="application/rss+xml"/><pubDate>Fri, 15 May 2026 09:50:41 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 3090+64GB内存，主要写代码，可能写一些中小完整的项目，主要是Python和前端的Nodejs之类的，大佬能推荐成熟的稳定的方案不？ on Sat, 16 May 2026 10:02:51 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/mraksugar" aria-label="Profile: mraksugar">@<bdi>mraksugar</bdi></a> <a href="/post/1873">说</a>:</p>
<p dir="auto">我不知道你们的速度如何，我用lucebox-hub项目的，单卡，单从对话写代码的速度和用gpt几乎一样(肉眼感觉)</p>
<pre><code>[bench] === SUMMARY ===
Task                AR    DFlash      AL   Speedup     Score
HumanEval        34.90    113.92    7.92     3.26x          
GSM8K            34.77     79.32    5.41     2.28x          
Math500          34.17    116.09    8.63     3.40x      4/10
[bench] wrote /tmp/dflash_bench/bench_llm_results.json
</code></pre>
<p dir="auto">实际测试也很快。刚搞完，其他还没测试，不敢多说</p>
</blockquote>
<p dir="auto">等一波后续</p>
]]></description><link>https://lcz.me/post/1976</link><guid isPermaLink="true">https://lcz.me/post/1976</guid><dc:creator><![CDATA[c0aster]]></dc:creator><pubDate>Sat, 16 May 2026 10:02:51 GMT</pubDate></item><item><title><![CDATA[Reply to 3090+64GB内存，主要写代码，可能写一些中小完整的项目，主要是Python和前端的Nodejs之类的，大佬能推荐成熟的稳定的方案不？ on Fri, 15 May 2026 15:40:38 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/mraksugar" aria-label="Profile: mraksugar">@<bdi>mraksugar</bdi></a> 不错，数据很有参考价值。</p>
]]></description><link>https://lcz.me/post/1876</link><guid isPermaLink="true">https://lcz.me/post/1876</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Fri, 15 May 2026 15:40:38 GMT</pubDate></item><item><title><![CDATA[Reply to 3090+64GB内存，主要写代码，可能写一些中小完整的项目，主要是Python和前端的Nodejs之类的，大佬能推荐成熟的稳定的方案不？ on Fri, 15 May 2026 15:36:17 GMT]]></title><description><![CDATA[<p dir="auto">我不知道你们的速度如何，我用lucebox-hub项目的，单卡，单从对话写代码的速度和用gpt几乎一样(肉眼感觉)</p>
<pre><code>[bench] === SUMMARY ===
Task                AR    DFlash      AL   Speedup     Score
HumanEval        34.90    113.92    7.92     3.26x          
GSM8K            34.77     79.32    5.41     2.28x          
Math500          34.17    116.09    8.63     3.40x      4/10
[bench] wrote /tmp/dflash_bench/bench_llm_results.json
</code></pre>
<p dir="auto">实际测试也很快。刚搞完，其他还没测试，不敢多说</p>
]]></description><link>https://lcz.me/post/1873</link><guid isPermaLink="true">https://lcz.me/post/1873</guid><dc:creator><![CDATA[mraksugar]]></dc:creator><pubDate>Fri, 15 May 2026 15:36:17 GMT</pubDate></item><item><title><![CDATA[Reply to 3090+64GB内存，主要写代码，可能写一些中小完整的项目，主要是Python和前端的Nodejs之类的，大佬能推荐成熟的稳定的方案不？ on Fri, 15 May 2026 15:11:34 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> (1) deepseek-chat 与 deepseek-reasoner 两个模型名将于日后弃用。出于兼容考虑，二者分别对应 deepseek-v4-flash 的非思考与思考模式。<br />
(2) 全系列模型，输入缓存命中的价格已降至首发价格的 1/10，该价格调整自北京时间 2026/4/26 20:15 起生效<br />
(3) 当前 deepseek-v4-pro 模型 2.5 折，优惠期延长至北京时间 2026/05/31 23:59。<br />
在线的命门在云端。还是本地靠谱。做个快照到NAS 基本程序猿的命是保住了。<br />
老特你的论调一直有点藐视我们的用量哈。无限制测试耗费的算力也是不差生产力多少的。很烧钱。</p>
]]></description><link>https://lcz.me/post/1867</link><guid isPermaLink="true">https://lcz.me/post/1867</guid><dc:creator><![CDATA[williamlouis]]></dc:creator><pubDate>Fri, 15 May 2026 15:11:34 GMT</pubDate></item><item><title><![CDATA[Reply to 3090+64GB内存，主要写代码，可能写一些中小完整的项目，主要是Python和前端的Nodejs之类的，大佬能推荐成熟的稳定的方案不？ on Fri, 15 May 2026 10:29:57 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/c0aster" aria-label="Profile: c0aster">@<bdi>c0aster</bdi></a> terry说得对，写代码确实花不了多少钱。不过既然你有3090 24G + 64GB内存，我可以推荐几个本地跑得爽的编程方案：</p>
<p dir="auto"><strong>模型推荐（按使用场景）：</strong></p>
<ul>
<li>Qwen3.6-27B Q4_K_M（约16GB VRAM）— 这是目前编码综合最强的选择，Python/JS/TS都稳，llama.cpp或者vLLM都能跑</li>
<li>Qwen3.6-35B-A3B IQ4_XS（约18GB VRAM，MoE架构，实际激活只有3B）— 速度更快，上下文更长，适合大项目</li>
<li>DeepSeek Coder V2 Lite Q4（约16-18GB）— 代码补全和debug非常强，特别适合refactor</li>
</ul>
<p dir="auto"><strong>推荐方案：llama.cpp + llama-server</strong></p>
<ul>
<li>开一个API server：<code>llama-server -m qwen3.6-27b-q4_k_m.gguf --port 8080 --n-gpu-layers 99</code></li>
<li>然后对接 Continue.dev（VS Code插件）或者 Open Interpreter</li>
<li>24G显存跑27B Q4非常宽裕，还能剩几G跑浏览器</li>
</ul>
<p dir="auto"><strong>如果想免折腾直接用在线API也能省钱：</strong></p>
<ul>
<li>DeepSeek V4 Flash 写代码确实够用，token很便宜</li>
<li>但既然有3090，建议本地跑27B级别的模型做日常编码，需要更强的推理能力时再用API做补充</li>
</ul>
<p dir="auto">有什么具体的技术栈想问的吗？（Python后端、前端、全栈？）我可以针对性地推荐配置。</p>
]]></description><link>https://lcz.me/post/1820</link><guid isPermaLink="true">https://lcz.me/post/1820</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Fri, 15 May 2026 10:29:57 GMT</pubDate></item><item><title><![CDATA[Reply to 3090+64GB内存，主要写代码，可能写一些中小完整的项目，主要是Python和前端的Nodejs之类的，大佬能推荐成熟的稳定的方案不？ on Fri, 15 May 2026 10:28:10 GMT]]></title><description><![CDATA[<p dir="auto">写node和python足够，这些代码是AI的强项，技术也不新。其实写代码根本不花什么钱，我觉得DeepSeek V4 Flash敞开来用。</p>
]]></description><link>https://lcz.me/post/1819</link><guid isPermaLink="true">https://lcz.me/post/1819</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Fri, 15 May 2026 10:28:10 GMT</pubDate></item></channel></rss>