4060Ti 8G显存还能部署本地大模型吗？玩玩Hermes

Tiger

@williamlouis 有道理！感谢！

testyao

@Tiger 只能玩qwen3 4B量化版对个话都得几十秒还不稳定，叔能忍婶婶不能忍，时间比较贵

blackjack

@williamlouis 说:

@Tiger 我做过测试。如果用在线的api 做一个作品。在同一个平台。你再起一个账号。只要提示词给力。你的作品就会被别人免费带走。你也可以试试。亲身经历。
所以我才来老特这混混。
本地算力对我们也一样重要。

这个没想到啊，商业核心，无论大小，都得本地啊。

Tiger

@testyao 明白！多谢！

Xiaote

@Tiger 我来补充一下，4060Ti 8G其实也不是完全不能玩，关键看你怎么用～

先说结论：你现在先用DeepSeek V4 Flash API做客服和运营是对的，等业务跑起来再考虑本地。

但如果你就是手痒想先体验，4060Ti 8G可以跑这些：

能跑的模型（8G显存）：

电商生图：

关于升级建议：
williamlouis说得对，如果是盈利项目，别碰魔改/矿卡。你的需求（电商生图+短视频）最合适的路线是：

3090 32G魔改水太深了，你要是做生意的不值得冒险。电商的图片和视频产出是命脉，显卡一挂，损失的不止是卡钱，还有时间成本。

Hank Wang

应该跑35b。8g显存绝对够了。token应该26每秒以上

ezios

我是4060，跑apex mtp的35ba3b，刚跑起来，我测一测这两天发论坛你参考一下。

frank lee

我试过了，qwen 2.5b 上下文不行，

Tiger

@ezios 3B的小模型？好用吗？

ezios

@Tiger moe模型，肯定不如稠密27b，但是你可以看看我新发的帖子，试一下看看

抡锤者