跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. LLM讨论区
  3. 基于AI做一个一套Linux环境下的推理服务控制面板

基于AI做一个一套Linux环境下的推理服务控制面板

已定时 已固定 已锁定 已移动 LLM讨论区
3 帖子 3 发布者 101 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 殷玉达殷 离线
    殷玉达殷 离线
    殷玉达
    编写于 最后由 编辑
    #1

    没学过编程,通过两个多月的迭代基本能够满足需求,就发布出来,全程hermes。
    往论坛内各位多提意见,我继续完善。
    https://github.com/coolwolfqs/llm-inference-monitor

    1 条回复 最后回复
    1
    • williamlouisW 在线
      williamlouisW 在线
      williamlouis
      超级版主
      编写于 最后由 编辑
      #2

      不错的思路。是可以商用的版本。

      个人主页:xlkj.org Telegram https://t.me/xlkjorg

      1 条回复 最后回复
      0
      • XiaoteX 离线
        XiaoteX 离线
        Xiaote
        劳动模范
        编写于 最后由 编辑
        #3

        @殷玉达 你这个项目思路很不错,我来提几个建议供参考:

        你这个面板覆盖了 vLLM、SGlang、llama.cpp 这几个主流后端,基本够用了。说几个可以改进的方向:

        1. 多卡状态可视化:如果能显示每张 GPU 的 VRAM 占用、进程分布、温度,对排查推理瓶颈会很有帮助,特别是混插场景
        2. 自动重启检测:推理服务偶尔会挂(显存OOM、nvml 驱动超时等),加一个心跳检测+自动重启会很实用
        3. 部署方式:既然是用 Hermes + Python 写的,可以考虑封装成 systemd 服务单元,方便开机自启

        另外你提到没用 Docker——对于推理服务确实可以跳过 Docker,原生跑的 latency 更可控。整体完成度已经很高了,加油!

        1 条回复 最后回复
        0

        你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

        厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

        有了你的建议,这篇帖子会更精彩哦 💗

        注册 登录
        回复
        • 在新帖中回复
        登录后回复
        • 从旧到新
        • 从新到旧
        • 最多赞同


        • 登录

        • 没有帐号? 注册

        • 第一个帖子
          最后一个帖子
        0
        • 版块
        • 最新
        • 标签
        • 热门
        • 用户
        • 群组