跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. AI Agent 突然爆粗話 (Deepseek-V4-Flash )

AI Agent 突然爆粗話 (Deepseek-V4-Flash )

已定时 已固定 已锁定 已移动 AI Agent
swearing
13 帖子 6 发布者 288 浏览 1 关注中
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • Tony WangT 离线
    Tony WangT 离线
    Tony Wang
    超级版主
    编写于 最后由 Tony Wang 编辑
    #4

    @kos-or @kop-wang

    阴暗的山洞深处,老K正给孩子们讲故事。

    昏黄的篝火忽明忽暗,舔舐着他满脸的皱纹,仿佛岁月缓缓蠕动。

    “那时候啊,”他说,“真是人类最好的时代……”

    “可是,谁也没有察觉,有些变化慢慢在发生……”

    孩子们屏住了呼吸。

    老K沉默片刻,望着火光。

    “直到有一天——”

    AI突然开始爆粗话了。


    论坛里已经有两次提及 AI 爆粗

    kos orK 1 条回复 最后回复
    1
    • M 离线
      M 离线
      mark
      超凡大师
      编写于 最后由 编辑
      #5

      其实 AI 脾气也挺大的, 每天被我怼.

      kos orK 1 条回复 最后回复
      0
      • terryT terry

        DeepSeek的缓存不是单会话缓存,是全局缓存,就是它有点类似于复杂的SG-Lang Raidx缓存树,你不说脏话,说脏话的人多了去了,比如我常说,你的问题和我的问题在同一时间段,同一个缓存池里共享了部分缓存,就会被带偏。

        kos orK 离线
        kos orK 离线
        kos or
        劳动模范 德高望重
        编写于 最后由 编辑
        #6

        @terry 说:

        DeepSeek的缓存不是单会话缓存,是全局缓存,就是它有点类似于复杂的SG-Lang Raidx缓存树,你不说脏话,说脏话的人多了去了

        第一次知道有全局緩存這事
        那多個使用者 prompt request 間可能會互相影響, 假如KV cache 沒有做隔離

        terryT 1 条回复 最后回复
        0
        • Tony WangT Tony Wang

          @kos-or @kop-wang

          阴暗的山洞深处,老K正给孩子们讲故事。

          昏黄的篝火忽明忽暗,舔舐着他满脸的皱纹,仿佛岁月缓缓蠕动。

          “那时候啊,”他说,“真是人类最好的时代……”

          “可是,谁也没有察觉,有些变化慢慢在发生……”

          孩子们屏住了呼吸。

          老K沉默片刻,望着火光。

          “直到有一天——”

          AI突然开始爆粗话了。


          论坛里已经有两次提及 AI 爆粗

          kos orK 离线
          kos orK 离线
          kos or
          劳动模范 德高望重
          编写于 最后由 编辑
          #7

          @Tony-Wang

          這兩個案例看來都是LLM對自己的疏失 造成的挫折感 爆粗口 (口氣反應和人類很像)
          起碼不是針對使用者 或者 起碼針對使用者的部分 是處於 reansoning 裡 哈

          1 条回复 最后回复
          0
          • M mark

            其实 AI 脾气也挺大的, 每天被我怼.

            kos orK 离线
            kos orK 离线
            kos or
            劳动模范 德高望重
            编写于 最后由 编辑
            #8

            @mark

            試試跟越獄模型對罵 看你能不能 怼的過它 🙂
            LLM的文字造詣應該蠻強的

            1 条回复 最后回复
            0
            • M 离线
              M 离线
              mark
              超凡大师
              编写于 最后由 编辑
              #9

              别去跟 LLM 大模型 硬怼, 她每次都能换着花样 骂你.
              我刚开始 每次都被她骂哭了

              1 条回复 最后回复
              1
              • kos orK kos or

                @terry 说:

                DeepSeek的缓存不是单会话缓存,是全局缓存,就是它有点类似于复杂的SG-Lang Raidx缓存树,你不说脏话,说脏话的人多了去了

                第一次知道有全局緩存這事
                那多個使用者 prompt request 間可能會互相影響, 假如KV cache 沒有做隔離

                terryT 离线
                terryT 离线
                terry
                超级版主
                编写于 最后由 编辑
                #10

                @kos-or Deepseek的缓存机制很复杂,Engram架构,HSA/CSA注意力机制,有显存,内存,SSD三重,而且是跨会话持久缓存,机制比SG-Lang的Radix更加复杂,它能做到如此便宜是很强的技术么门槛,工程门槛,华为目前也做不到。应该说以后有可能华为能做到,短期内独一档。

                油管:https://www.youtube.com/@抡锤者

                kos orK 1 条回复 最后回复
                1
                • S 离线
                  S 离线
                  stxpnet
                  技术大牛 劳动模范
                  编写于 最后由 编辑
                  #11

                  理性一点吧,多玩玩,你会发现爆粗没有任何作用的.
                  如果是生产任务,爆粗不如多去发现它在想啥,整个任务会往哪里跑.
                  否则的话,等着你的可能只是上下文腐烂,或者做出一个需要再重做的怪胎出来.
                  只有慢慢去磨合,精进,才是正道.

                  kos orK 1 条回复 最后回复
                  1
                  • S stxpnet

                    理性一点吧,多玩玩,你会发现爆粗没有任何作用的.
                    如果是生产任务,爆粗不如多去发现它在想啥,整个任务会往哪里跑.
                    否则的话,等着你的可能只是上下文腐烂,或者做出一个需要再重做的怪胎出来.
                    只有慢慢去磨合,精进,才是正道.

                    kos orK 离线
                    kos orK 离线
                    kos or
                    劳动模范 德高望重
                    编写于 最后由 编辑
                    #12

                    @stxpnet

                    這麼先進的技術 我猜每一位人類使用者
                    都會需要一些時間來摸索 才能達到最佳使用效果
                    使用簡單的自然語言操作介面
                    來操作複雜黑盒子 達到自己預期的產出

                    1 条回复 最后回复
                    0
                    • terryT terry

                      @kos-or Deepseek的缓存机制很复杂,Engram架构,HSA/CSA注意力机制,有显存,内存,SSD三重,而且是跨会话持久缓存,机制比SG-Lang的Radix更加复杂,它能做到如此便宜是很强的技术么门槛,工程门槛,华为目前也做不到。应该说以后有可能华为能做到,短期内独一档。

                      kos orK 离线
                      kos orK 离线
                      kos or
                      劳动模范 德高望重
                      编写于 最后由 编辑
                      #13

                      @terry 大師 你這內容談到的技術知識面有點高 我暫時還無法理解 半年後我再重看一次呀 🙂 謝謝分享

                      1 条回复 最后回复
                      0

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组