跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

H QianH

H Qian

@H Qian
关于
帖子
9
主题
3
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • N卡太贵,A卡来势凶猛,有没有A卡的用户分享经验
    H QianH H Qian

    本人手头有A卡小主机,在windows,windows+wsl,ubuntu多个环境下来回折腾,结论是2026年6月只能在ubuntu下可用,windows,windows+wsl下切勿折腾,生态缺陷大,浪费时间,毫无意义!

    AI硬件

  • 一个主机多个电脑协同怎么做到的。
    H QianH H Qian

    tailscale很好用,VPN局域网方案,多个机器用一个tailscale账号,只要在线,无论物理位置在哪里,都能ssh互相登录,如同局域网互通,严重推荐。

    随便聊聊

  • Agent = LLM + Harness,大家都用什么组合?
    H QianH H Qian

    本人主力在用:

    1. 闲置笔记本当服务器跑Hermes+Deepseek,通过Telegram 连接作为个人数字助理,协助处理日常事务
    2. 开发机跑 Claude Code + 下面LLM,作为生产力平台做各种自动化工作流
    • Opus 4.8 (1M context)) · $5/$25 per Mtok
    • Sonnet (1M context) · $3/$15 per Mtok
    • Haiku 4.5 · $1/$5 per Mtok

    大家一起交流分享!

    AI Agent

  • 你们Hermes 接入Agnes模型没有?不要钱
    H QianH H Qian

    新加坡的公司,哪来的那么多自研模型,不会是拿个底座套个壳吧?上了量能撑住吗?不要钱的往往最贵,还是老老实实用deepseek吧

    AI Agent

  • RAG LoRA和大模型的关系以及应用场景
    H QianH H Qian

    NotebookLM就是典型的RAG应用范例,LoRA才是小企业们的战场,可以各显神通搞出各自有特色的垂直行业模型。本人就尝试做这方面研究,包括模型生成后的安全防护话题,有兴趣可以一起探讨。

    AI进阶话题

  • 用AWS Sagemaker LoRA 垂直模型,下载下来本地推理,性价比最高
    H QianH H Qian

    具体方案:

    1. 本地编写与调试 + 云端高性能算力微调 + 本地端侧推理
    2. 微调脚本
    3. Adapter 权重与基础模型合并(Merge)
    4. 用推理脚本在本地测试微调后的效果
    5. 微调 + RAG (检索增强生成)
    6. 封装成一个带界面的本地“个人知识助手”应用
    AI进阶话题

  • hermes还真的有个DeepSeek
    H QianH H Qian

    只要不是特敏感的数据,还是用云端API,Deepseek v4也不贵,专注于业务比折腾本地推理强的多啊

    LLM讨论区

  • 京东的风魄Rtx 3080有人入手吗?
    H QianH H Qian

    vllm做并行扩展更好,最好是同样的卡

    AI硬件

  • 论坛版主申请帖子
    H QianH H Qian

    申请成为 AI Agent 版主,为大家服务

    站点公告
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组