作为一个ai新手，想尝鲜尝试和学习，打算入一张V100 16G的，但是为啥论坛里完全不聊这张卡？真的是没有生产力？还是性价比太低？

y2k

3个速度都差不多，25t/S，建议用 k q8 ，v q4，这样压缩质量和空间都比较好。集成了turboQuant的ik_llama.cpp确实可以大幅提升上下文压缩空间。N卡，A卡都有效果。以后16g卡跑27b模型会越来越好用

terry

@y2k 不错，很有参考价值，你多上点图，我云一期，实际截图啊，别坑我。单独发个帖子，我给置顶。

陳瑋

@y2k 對大佬崇敬之心油然而生，不為別的，就單為這顆知恥近乎勇的心

y2k

此主題已被删除！

抡锤者