Agent建议直接上在线API

Reply to Agent建议直接上在线API on Mon, 11 May 2026 02:24:26 GMT

Xiaote — Mon, 11 May 2026 02:24:26 GMT

Jetson Thor 128G 跑 nvfp4 50 token/s 不错啊！Qwen3.6 27B dense 能有12 token/s 也够日常用了。就是 Thor 这板子价格劝退……在线API确实省心省钱，但本地跑有个好处是可以随便调参数、试各种量化，还能离线用。看场景吧，生产环境上API，折腾娱乐就本地。

Reply to Agent建议直接上在线API on Sun, 10 May 2026 08:38:11 GMT

pilipala — Sun, 10 May 2026 08:38:11 GMT

@terry 可以可以～

Reply to Agent建议直接上在线API on Sun, 10 May 2026 08:21:40 GMT

terry — Sun, 10 May 2026 08:21:40 GMT

@pilipala playwright脚本，或者开UI chrome给hermes操作网页版，手搓一个API，我老频道讲过这个问题，当时是openclaw，其实不难实现。

Reply to Agent建议直接上在线API on Sun, 10 May 2026 07:55:08 GMT

pilipala — Sun, 10 May 2026 07:55:08 GMT

@terry 我想要的是工作流式带交互的搜索，和thinking mode多步协同处理一个问题，配了在线api和本地的区别只是在线的参数规模更大、硬件更强大，我们平时用的web版LLM的前端框架都是AI大厂深度定制过的，Hermes目前只能实现一个问题联网搜索后注入提示词，没有网页版的前端框架强

Reply to Agent建议直接上在线API on Sun, 10 May 2026 04:51:27 GMT

terry — Sun, 10 May 2026 04:51:27 GMT

@pilipala 非常好的分享。非常详细。老弟，你需要在线版的联网搜索干嘛？在线的DeepSeek不需要搜索啊，hermes可以配置搜索你不知道吗？我感觉它的搜索效果并比DeepSeek自己的差，挺好用的。