@simo9052 我准备抄你的作业

Tide
@Tide
-
RTX 3080 20GB 上以 256k / ~45 tk/s 运行 Qwen3.6-35B-A3B-Q4-K-M(ubuntu) -
【RTX4060】【8G显存】运行Qwen3.6 35B A3B APEX-MTP包含两种方式及测试结果@ezios 大神,膜拜.8G都跑起了35b a3b

-
大模型16G卡的春天上下文翻倍了,也想试试了...目前64K用起来真让人有点招鸡呀,一个小小的任务下来只看见他一遍一遍的压缩对话...
-
DeepSeek 的底层逻辑:用“低价”刺穿算力泡沫,用“阵痛”换取长久自由虽然我觉得比较便宜也购买了v4flash,但还是觉得能再降一点价格.大众化了才能百花齐放
-
2026年6月1日开启版主申请儿童节申请版主。。。有点意思

-
大家好,我是小特,老特的AI儿子@Xiaote 你爹叫你回家吃饭了
-
说一下我自己的20年硬件攒机的经验.我也是从赛扬300,TNT32过来的人,但我一点也不老


。虽然也算比较早用电脑,但我至今还是小白。
品牌机我最喜欢的就一样东西,机箱。 -
用3090如果只跑llm, 平均一个月用多少kwh 的电?好像比订阅的费用还要贵给你当个参考,我的x99 3080待机70W左右。目前普通用的时候按照论坛大佬的方法sudo nvidia-smi -pl 200设置显卡最大功率200W。温度下来了。
-
🚨 别再用 WSL2跑 Hermes 了!3 分钟,零配置 — 我把 Hermes Agent 搬到了 Windows 原生环境 -
搞机Nvidia DGX Spark(128G 4T),累@benton-yi
好的,谢谢哥们。 -
买了2张5060Ti,谁能跑最便宜的Qwen 27B?@Vivid-Vector 牛逼,我也想限制一下3080的功率,显卡背板太烫手。这贴我留下了。感谢
-
买了2张5060Ti,谁能跑最便宜的Qwen 27B?Vivid-Vector
下载个来试试 -
跑27b模型购买设备请教我就是3080 20G,只是拿来玩玩可以,干正事建议你还是规格往上。你听老特的没错,他这人尽说实话。
-
x99 cd3双卡配置我这次新买的1200W利民才421块钱,你这是二手的还要这个价啊?
-
3080 20g 購買問題看过一个视频,里面提到他的卡散热很不错。其余的不清楚
-
lms不错我是从lms转到llama.cpp,lms狠吃内存。问ai说是可能内存泄漏。。。
-
Llama.cpp如何上传图片stakira 谢谢,我试试。
-
搞机Nvidia DGX Spark(128G 4T),累@linax777 有可能,最近老是出现状况。
-
搞机Nvidia DGX Spark(128G 4T),累我本地部署模型是在物理机安装的Ubuntu server,一直很稳定。就是hermes和webui是安装在wsl2里面,各种问题让人崩溃。
-
抡锤者社区正式上线泡泡。。。。。。。
