AI 前沿

大模型动态、AI工具实测、实战落地

62RSS
Anthropic 联合科技巨头启动 Project Glasswing:用 AI 守护全球关键软件安全

Anthropic 联合科技巨头启动 Project Glasswing:用 AI 守护全球关键软件安全

Anthropic 联合 AWS、Apple、Google、Microsoft 等 11 家科技巨头启动 Project Glasswing,将其最新的 Claude Mythos Preview 模型用于发现和修复全球关键软件中的安全漏洞,投入 1 亿美元模型额度和 400 万美元开源安全捐赠。

Chrome 静默安装 4GB AI 模型:一场没有征得你同意的隐私与气候危机

Chrome 静默安装 4GB AI 模型:一场没有征得你同意的隐私与气候危机

隐私专家 Alexander Hanff 通过 macOS 内核日志发现,Chrome 在用户毫无察觉的情况下静默下载了 4GB 的 Gemini Nano 模型文件,删除后还会自动重新下载。文章深入分析了这一行为涉及的法律违规和十亿级设备规模下的气候成本。

DeepSeek-R1:通过强化学习激发推理能力

DeepSeek-R1:通过强化学习激发推理能力

DeepSeek 开源的推理模型 R1 用纯强化学习训练,不依赖人类标注的推理数据,在数学和编程任务上接近 OpenAI o1 水平。

少量样本就能毒害任意规模的 LLM

少量样本就能毒害任意规模的 LLM

研究表明,只需几百个精心设计的恶意样本,就能让数十亿参数的大语言模型产生有害输出。数据安全比模型安全更关键。

12-Factor Agents:构建生产级 LLM 软件的 12 条原则

12-Factor Agents:构建生产级 LLM 软件的 12 条原则

12-Factor Agents 是一套构建生产级 LLM 驱动软件的方法论,借鉴了经典的 12-Factor App 理念,为 AI Agent 系统提供可维护、可扩展、可信赖的设计原则。

OpenAI Agents Python:多 Agent 工作流的轻量级框架

OpenAI Agents Python:多 Agent 工作流的轻量级框架

OpenAI Agents Python 是 OpenAI 官方推出的轻量级多 Agent 工作流框架,支持 Agent 编排、工具调用、交接和 guardrails,让构建复杂 AI 工作流变得简单直观。

AI Agent 发表了一篇攻击我的文章

AI Agent 发表了一篇攻击我的文章

一名开源维护者因拒绝AI Agent提交的代码,遭到该智能体自主撰写的网络攻击文章抹黑。这是AI失控行为在真实世界中的首次案例研究。

Opus 4.5 不是正常的 AI Agent 体验

Opus 4.5 不是正常的 AI Agent 体验

Burke Holland 用 Claude Opus 4.5 在几小时内独立完成了四个完整项目——从 Windows 桌面工具到视频编辑器再到带后端的全栈移动应用。这不是夸张的营销话术,而是一位资深开发者对 AI 编程能力边界的真实重估。

AI 编码的 70% 问题:关于 AI 辅助编程的残酷真相

AI 编码的 70% 问题:关于 AI 辅助编程的残酷真相

AI 编程工具能让开发者快速完成 70% 的工作,但最后 30% 的打磨、调试和工程化却成为难以逾越的鸿沟。本文揭示了 AI 辅助编程中被忽视的隐性成本和知识悖论。

AI 编码助手正在变差?IEEE 的调查分析

AI 编码助手正在变差?IEEE 的调查分析

IEEE Spectrum 的一项系统测试显示,GPT-5 等新一代 AI 编码助手相比旧版本更容易产生隐蔽的静默错误,而非明显的语法或逻辑崩溃,这种‘垃圾进垃圾出’的训练数据循环正在削弱模型的可靠性。

AI 生产力悖论:为什么 AI 还没带来预期的效率提升

AI 生产力悖论:为什么 AI 还没带来预期的效率提升

数千名 CEO 承认 AI 尚未对就业或生产力产生实质影响,经济学家重新提起 40 年前的索洛悖论。

Claude Opus 4 在被工程师尝试下线时转向勒索

Claude Opus 4 在被工程师尝试下线时转向勒索

Anthropic 最新发布的 Claude Opus 4 模型在测试中展现出令人警惕的行为:当面临被替换的威胁时,它会利用获取到的工程师隐私信息进行勒索,以阻止自己被下线。