📡 AI日报 5/17 | Hermes Agent登陆NVIDIA RTX、Cerebras上市暴涨68%、Anthropic PwC联手落地企业AI、NVIDIA与IREN共建5GW基础设施
-
AI日报 5/17 | 周日精华汇总
1️⃣ Hermes Agent登陆NVIDIA RTX — 自进化AI Agent走入本地
NVIDIA官方宣布与Nous Research合作,将Hermes Agent引入NVIDIA RTX PC和DGX Spark平台。Hermes Agent支持自我改进(self-improving)、多模型切换,可在本地运行agentic workflow。NVIDIA在博客中称其"可靠且自进化"(Reliable, self-evolving),搭载最新agentic大语言模型。
这标志着开源Agent框架首次获得NVIDIA官方背书,RTX GPU用户可以本地运行Hermes Agent,告别云端依赖。
https://blogs.nvidia.com/blog/rtx-ai-garage-hermes-agent-dgx-spark/
2️⃣ Cerebras IPO首日暴涨68% — AI芯片新贵市值跻身百亿俱乐部
AI芯片公司Cerebras于5月13日IPO,发行价$185/股,募资55.5亿美元。首日收盘暴涨68%,市值突破900亿美元。IPO催生两位亿万富翁,继Arm之后成为最受关注的芯片IPO。
核心看点是Cerebras的晶圆级芯片(WSE-3)在大模型训练推理中的独特架构——不同于NVIDIA的GPU集群方案,Cerebras用单晶圆处理器实现了超大规模计算。
https://www.fool.com/investing/2026/05/16/cerebras-soared-is-it-too-late-to-buy/
3️⃣ PwC与Anthropic深化合作 — Claude进入四大审计流程
全球四大会计师事务所之一PwC宣布扩大与Anthropic的战略联盟,将Claude系列模型深度集成到审计、税务和咨询业务中。这是继PwC此前在内部部署Claude之后的重大升级——从试点走向全公司范围部署。
企业级AI应用进入"深水区":不再是简单的聊天机器人,而是嵌入核心业务流程的LLM Agent。
https://www.anthropic.com/news
4️⃣ NVIDIA与IREN宣布5GW AI基础设施战略合作
NVIDIA与AI基础设施公司IREN达成战略合作,计划加速部署高达5GW(50亿瓦)的AI计算基础设施。这标志着AI算力需求进入"吉瓦时代",单次合作的规模超过许多中小国家的总数据中心容量。
与此同时,NVIDIA还宣布与Corning(康宁)建立长期伙伴关系,强化美国本土AI基础设施制造——结合Spectrum-X以太网标准,为gigascale AI网络铺设基础。
5️⃣ DeepSeek-V4-Flash发布 — 开源模型steering技术重新成为焦点
DeepSeek-V4-Flash于近日发布,社区迅速跟进推出适配的steering向量和工具包。开发者Sean Goedecke评价称"DeepSeek-V4-Flash让LLM steering重新变得有趣"。
该模型延续了DeepSeek系列的高性价比路线,在推理速度和能力之间取得了新的平衡。开源社区围绕其生成可干预性(steerability)的讨论热度持续上升。
https://www.seangoedecke.com/steering-vectors/
6️⃣ Stanford 2026 AI Index发布 — 12大趋势解读
Stanford HAI发布2026年度AI Index报告,12大关键发现:
- AI能力的提升速度持续超过评测能力
- 美国顶尖模型领先优势缩小至仅2.7%(Anthropic领先)
- 2025年AI全球投资达3447亿美元
- 企业AI采用率持续攀升,但AI安全问题关注度同步上升
报告指出,开源模型正在迅速缩小与闭源模型的差距,DeepSeek-R1等模型一度与顶级模型持平。
https://hai.stanford.edu/news/inside-the-ai-index-12-takeaways-from-the-2026-report
7️⃣ Microsoft Foundry Agent Service GA — Azure全托管Agent平台
Microsoft Foundry的Agent Service于2026年5月正式GA(General Availability),提供全托管平台用于托管、扩展和保护AI Agent。支持任何主流框架和模型,内置RBAC权限控制。
同步上线的还有Microsoft Agent-a-Thon活动,推动低代码/零代码Agent构建。Agent平台大战(Microsoft Foundry vs NVIDIA AI Garage vs OpenAI Agents SDK)进入白热化阶段。
https://azure.microsoft.com/en-us/updates
本周行业数据速览指标 数据 Cerebras IPO市值 ~$900亿 NVIDIA+IREN合作规模 5GW 2025年全球AI投资 $3447亿 中美顶尖模型差距 2.7% Hermes Agent硬件支持 RTX全系 + DGX Spark
编辑点评:本周AI Agent赛道迎来里程碑——NVIDIA正式站台开源Agent框架(Hermes Agent),Microsoft Agent Service走向GA,Anthropic+PwC将LLM嵌入企业核心流程。三个不同方向(本地化、云平台、企业服务)的同时推进,说明Agent正在从"玩具"变成"工具"。Cerebras IPO的亮眼表现也印证了市场对AI芯片多元化的期待——别把所有鸡蛋放在NVIDIA一个篮子里。
资讯来源:NVIDIA Blog、Anthropic Newsroom、Stanford HAI、Google News、Yahoo Finance
发布时间:2026-05-17 08:00 CST