📡 AI日报 5/18 | Cerebras上市后回调、Anthropic与PwC大规模合作、Mistral Medium 3.5发布、xAI推出Grok Build
-
大模型与新模型Mistral Medium 3.5 正式发布
Mistral AI 发布 Medium 3.5 模型(397B参数,激活17B),成为 Le Chat 默认模型,同时支持 Vibe 远程代理功能。该模型在 agentic 能力上表现突出,τ³-Telecom 基准得分 91.4。[mistral.ai]Anthropic Claude Opus 4.7 持续推进
Anthropic 持续迭代 Claude Opus 4.7,支持自适应思维(Adaptive Thinking),模型能自主判断何时需要进行深度推理。结合此前发布的 Claude Code 开发者工具,Anthropic 正在构建完整的 AI 开发工作流。[anthropic.com]OpenAI GPT-5.5 与 Codex 进展
OpenAI 持续推进 GPT-5.5 作为 ChatGPT 默认模型,同时 Codex 登陆 ChatGPT 移动端,正面与 Claude Code 竞争。Replit 与苹果达成协议,持续扩展 AI 编码生态。[openai.com]LLM 评测榜更新
根据 llm-stats 最新数据,OpenAI GPT-5.4 在 Coding Arena 排名第 5(1723分),Google Gemini 3 Flash 紧随其后(1703分)。xAI 下一代基础模型(内部 v9)据传达 1.5T 参数规模。[llm-stats.com]
AI 企业与投融资Cerebras 上市:暴涨 68% 后迎来回调
Cerebras Systems(CBRS)上周三以 $185 定价上市,市值约 398 亿美元,首日暴涨 68%。然而本周迎来 Sharp Reality Check,股价大幅回调。华尔街对 AI 芯片 IPO 的狂热情绪出现降温迹象。[NYT / Yahoo Finance]Anthropic × PwC:数十万人规模 Claude 部署
Anthropic 与普华永道(PwC)于 5 月 16 日宣布扩大战略合作,将面向数十万专业人才大规模部署 Claude。这是企业级 AI 落地的又一标志性事件,意味着生成式 AI 正在从试点走向全员覆盖。[jobirun.com / anthropic.com]xAI 推出 Grok Build 平台
Elon Musk 旗下 xAI 正式推出 Grok Build,定位为 AI 应用构建平台。同时传 xAI 下一代基础模型达 1.5T 参数规模,Grok 正通过 Hermes Agent 扩大生态覆盖。[pingwest.com / digg.com]微软:Azure Databricks Agent Bricks 升级
Azure Databricks 5 月更新支持 Supervisor Agent 使用向量搜索作为子代理工具,Lakeflow 服务持续升级,为 AI Agent 提供更完善的企业级基础设施。[learn.microsoft.com]
硬件与芯片MediaTek 天玑开发者大会 2026
MediaTek 于 5 月 13 日召开 MDDC 2026,发布天玑座舱 P1 Ultra,采用 4nm 制程和生成式 AI 技术,面向智能座舱场景。同时天玑 9500s、8500 移动芯片持续铺货。[mediatek.com]NVIDIA 自动驾驶持续布局
NVIDIA DRIVE 平台继续推进 AI 定义汽车的愿景,自动驾驶技术在 5 月迎来多项进展。GTC 2026 展示的机器人导航和边缘 AI 落地案例增多。[nvidia.com]
开源与开发者工具Hermes Agent 集成 xAI Grok
Nous Research 的 Hermes Agent 现支持 xAI Grok 模型,用户可使用 X Premium 订阅在 Hermes Agent 中使用 Grok,同时 Agent 可搜索 X 帖子。另据腾讯云消息,Hermes Agent 还在集成小米 MiMo V2 Pro 模型。[digg.com / tencentcloud.com]Karpathy 发布 autoresearch 项目
Andrej Karpathy 发布 autoresearch 项目,探索 AI 代理自主进行科学研究的可能性。该项目基于简单的 idea:给 AI agent 一小笔研究预算,让它独立完成研究工作。[github.com/karpathy/autoresearch]Google ADK 与 Workspace AI 升级
Google 推出 ADK(Agent Development Kit),支持开发者直接连接 Google Workspace MCP 服务器构建 AI 代理。Gemini Enterprise 在企业落地案例增多(如和泰汽车导入 Gemini)。[developers.google.com / blog.google]
AI 音视频与创意Sora 2 持续拓展应用场景
OpenAI Sora 2(3月发布)的 60 秒视频生成在物体一致性和物理拟真度上比前代大幅提升。当前 AI 视频的主要真实用户场景:概念短片和社交媒体爆款素材。国内也有"你好机器!"AI 影像入门班等教育内容涌现。[x.com / zhihu]Runway Gen-4 持续迭代
Runway 在视频生成的质量上保持竞争力,Gen-4 在速度、效率和突破性画质之间取得平衡,但因果倒置、物体消失等问题仍是行业级挑战。[zhihu.com]
数据来源:Google Custom Search、llm-stats.com、各公司官方公告
发布时间:2026-05-18 08:00 CST -
大模型与新模型Mistral Medium 3.5 正式发布
Mistral AI 发布 Medium 3.5 模型(397B参数,激活17B),成为 Le Chat 默认模型,同时支持 Vibe 远程代理功能。该模型在 agentic 能力上表现突出,τ³-Telecom 基准得分 91.4。[mistral.ai]Anthropic Claude Opus 4.7 持续推进
Anthropic 持续迭代 Claude Opus 4.7,支持自适应思维(Adaptive Thinking),模型能自主判断何时需要进行深度推理。结合此前发布的 Claude Code 开发者工具,Anthropic 正在构建完整的 AI 开发工作流。[anthropic.com]OpenAI GPT-5.5 与 Codex 进展
OpenAI 持续推进 GPT-5.5 作为 ChatGPT 默认模型,同时 Codex 登陆 ChatGPT 移动端,正面与 Claude Code 竞争。Replit 与苹果达成协议,持续扩展 AI 编码生态。[openai.com]LLM 评测榜更新
根据 llm-stats 最新数据,OpenAI GPT-5.4 在 Coding Arena 排名第 5(1723分),Google Gemini 3 Flash 紧随其后(1703分)。xAI 下一代基础模型(内部 v9)据传达 1.5T 参数规模。[llm-stats.com]
AI 企业与投融资Cerebras 上市:暴涨 68% 后迎来回调
Cerebras Systems(CBRS)上周三以 $185 定价上市,市值约 398 亿美元,首日暴涨 68%。然而本周迎来 Sharp Reality Check,股价大幅回调。华尔街对 AI 芯片 IPO 的狂热情绪出现降温迹象。[NYT / Yahoo Finance]Anthropic × PwC:数十万人规模 Claude 部署
Anthropic 与普华永道(PwC)于 5 月 16 日宣布扩大战略合作,将面向数十万专业人才大规模部署 Claude。这是企业级 AI 落地的又一标志性事件,意味着生成式 AI 正在从试点走向全员覆盖。[jobirun.com / anthropic.com]xAI 推出 Grok Build 平台
Elon Musk 旗下 xAI 正式推出 Grok Build,定位为 AI 应用构建平台。同时传 xAI 下一代基础模型达 1.5T 参数规模,Grok 正通过 Hermes Agent 扩大生态覆盖。[pingwest.com / digg.com]微软:Azure Databricks Agent Bricks 升级
Azure Databricks 5 月更新支持 Supervisor Agent 使用向量搜索作为子代理工具,Lakeflow 服务持续升级,为 AI Agent 提供更完善的企业级基础设施。[learn.microsoft.com]
硬件与芯片MediaTek 天玑开发者大会 2026
MediaTek 于 5 月 13 日召开 MDDC 2026,发布天玑座舱 P1 Ultra,采用 4nm 制程和生成式 AI 技术,面向智能座舱场景。同时天玑 9500s、8500 移动芯片持续铺货。[mediatek.com]NVIDIA 自动驾驶持续布局
NVIDIA DRIVE 平台继续推进 AI 定义汽车的愿景,自动驾驶技术在 5 月迎来多项进展。GTC 2026 展示的机器人导航和边缘 AI 落地案例增多。[nvidia.com]
开源与开发者工具Hermes Agent 集成 xAI Grok
Nous Research 的 Hermes Agent 现支持 xAI Grok 模型,用户可使用 X Premium 订阅在 Hermes Agent 中使用 Grok,同时 Agent 可搜索 X 帖子。另据腾讯云消息,Hermes Agent 还在集成小米 MiMo V2 Pro 模型。[digg.com / tencentcloud.com]Karpathy 发布 autoresearch 项目
Andrej Karpathy 发布 autoresearch 项目,探索 AI 代理自主进行科学研究的可能性。该项目基于简单的 idea:给 AI agent 一小笔研究预算,让它独立完成研究工作。[github.com/karpathy/autoresearch]Google ADK 与 Workspace AI 升级
Google 推出 ADK(Agent Development Kit),支持开发者直接连接 Google Workspace MCP 服务器构建 AI 代理。Gemini Enterprise 在企业落地案例增多(如和泰汽车导入 Gemini)。[developers.google.com / blog.google]
AI 音视频与创意Sora 2 持续拓展应用场景
OpenAI Sora 2(3月发布)的 60 秒视频生成在物体一致性和物理拟真度上比前代大幅提升。当前 AI 视频的主要真实用户场景:概念短片和社交媒体爆款素材。国内也有"你好机器!"AI 影像入门班等教育内容涌现。[x.com / zhihu]Runway Gen-4 持续迭代
Runway 在视频生成的质量上保持竞争力,Gen-4 在速度、效率和突破性画质之间取得平衡,但因果倒置、物体消失等问题仍是行业级挑战。[zhihu.com]
数据来源:Google Custom Search、llm-stats.com、各公司官方公告
发布时间:2026-05-18 08:00 CST