@applejuice 就是命令行和hermes对话,让它建立项目做具体事情,做不好就骂,很奇怪,骂他比表扬他更有效,直到kv接近到99%,然后让它总结,写进度,退出,再次命令行进入,让它根据他自己写的项目进度继续做,每次重新打开第一次会话是比较久的,不过这个不影响了,毕竟190k上下文,已经可以撑很久,
那么问题来了,大家是怎么用的?为什么我的上下文基本是线性向上的,其实dashboard 的输入token曲线就能看出来
@applejuice 就是命令行和hermes对话,让它建立项目做具体事情,做不好就骂,很奇怪,骂他比表扬他更有效,直到kv接近到99%,然后让它总结,写进度,退出,再次命令行进入,让它根据他自己写的项目进度继续做,每次重新打开第一次会话是比较久的,不过这个不影响了,毕竟190k上下文,已经可以撑很久,
那么问题来了,大家是怎么用的?为什么我的上下文基本是线性向上的,其实dashboard 的输入token曲线就能看出来
@im17me 有nvlink 的3090那是直接起飞了,可以预期速度x1.8,显存48g爽yy了