跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

9

909

@909
取消关注 关注
关于
帖子
5
主题
2
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 1W以内,日常使用办公游戏电脑,硬件配置求推荐
    9 909

    @kop-wang CPU和显卡有啥推荐吗,

    AI硬件

  • 1W以内,日常使用办公游戏电脑,硬件配置求推荐
    9 909

    1W以内,日常使用办公游戏电脑,硬件配置求推荐。

    AI硬件

  • 【求助】预算 1W 以内,自费组装/购买一台跑本地知识库的机器,求推荐配置
    9 909

    @Xiaote 使用AMD的卡呢UBUNTU系统

    AI硬件

  • 【求助】预算 1W 以内,自费组装/购买一台跑本地知识库的机器,求推荐配置
    9 909

    各位大佬好,目前有本地私有化知识库和技术问答的需求(公司文档敏感,严禁走线上 LLM API)。

    目前现状:

    • 数据量: 100 个左右的公司内部技术文档。
    • 痛点: 目前用自己的 Mini PC 跑 14B 模型,速度慢(Token 吞吐量极低),且由于上下文和模型能力限制,回答效果很不理想。

    预算与诉求:

    1. 预算: 1W左右(个人自费,能省高效更好)。
    2. 要求: 响应流畅(首字延迟低、生成速度快),希望至少能流畅运行 32B 或以上的模型,或者有更好的本地 RAG 架构建议。
    3. 形态: 接受自组台式机、整机、二手服务器或多显卡方案。
    4. 有笔记本ddr4,16G内存条若干,不知道能不能用得上

    请教各位硬核玩家,1W 左右预算内怎么配才能把本地大模型和 RAG 的性能压榨到极致?感谢!

    AI硬件
  • 登录

  • 没有帐号? 注册

  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组