AI 前沿

大模型动态、AI工具实测、实战落地

共 92 篇RSS

Forge 是一个 Python 框架，通过 Guardrails 机制让小型开源模型在 Agent 任务上的表现从 53% 提升到 99%，实现了自托管 Agent 工作流的低成本部署。

AgentKit 是 Inngest 推出的 TypeScript 多 Agent 框架，支持确定性路由、MCP 工具集成和内置追踪，让 Agent 协作像写普通代码一样可预测。

LangGraph、CrewAI、AutoGen、OpenAI Agents SDK、Google ADK、Dify、Mastra、Semantic Kernel — 八款主流 AI Agent 框架深度对比，从架构设计到生产部署，帮你找到最适合你的那一个。

一个你从未听说过的模型 Hy3 Preview，悄然占据了 OpenRouter 使用量排行榜的榜首，超过了 Claude 和 DeepSeek。它是隐藏的宝石还是另有玄机？

Anthropic 宣布完成 650 亿美元 H 轮融资，投后估值达 9650 亿美元。这是 AI 领域最大规模的融资之一，反映了资本市场对前沿 AI 模型的高度信心。

2026 年 5 月 28 日，Anthropic 发布 Claude Opus 4.8。新模型在编程、Agent、推理等全面超越前代，推出 Effort Control 和动态工作流功能，定价不变。

攻击者利用热门 npm 包名称的拼写差异创建恶意软件包，从 Claude AI 用户目录窃取敏感数据。2026 年 5 月的这起事件再次敲响供应链安全警钟。

2026 年 4 月，两大 AI 实验室同步调整企业定价策略，将订阅费与 API 实际用量挂钩。Simon Willison 分析认为，这正是 AI 公司找到产品市场契合点（PMF）的信号——尤其是编程代理产品爆发的时刻。

很多人以为 AI 编程就是高速产出糙代码。Nolan Lawson 提出相反的论点：用 AI 慢速写高质量代码，反而更有价值。本文详解他如何使用多个 AI Agent 交叉检查代码质量的工作流。

安全研究团队 PromptArmor 发现 Microsoft 365 Copilot Cowork 存在严重的数据泄露漏洞。攻击者通过间接提示注入操纵 Agent 获取文件并外泄，且整个过程不需要人工审批。

单智能体搞不定复杂任务？本文梳理了从 ReAct 到多智能体协作的架构演进，对比 AutoGen、CrewAI、LangGraph 等框架，帮你选对架构。

Anthropic 与 SpaceX 签署算力合作协议，获得 Colossus 1 数据中心 300MW 算力（22 万张 NVIDIA GPU），同时大幅提升 Claude Code 和 API 的使用上限，并透露了与 Amazon、Google、Microsoft 的多项算力布局。