主题分类

安全·对齐

18 篇文章

TechCrunch AI ·

马斯克诉讼案将 OpenAI 安全记录推上显微镜

马斯克起诉 OpenAI 一案可能在法庭上围绕一个核心问题展开:OpenAI 营利性子公司究竟是在强化还是在削弱这家前沿实验室「确保 AI 惠及人类」的创立使命,同时其安全流程是否可靠运作。法律专家表示,这一诉讼或将推动政府对先进 AI 领域实施更严格的监管。

The Verge AI ·

加拿大 Tumbler Ridge 枪击案受害家庭起诉 OpenAI:系统已预警却选择沉默

加拿大 Tumbler Ridge 校园枪击案七名受害家庭联合起诉 OpenAI 及 CEO 萨姆·阿尔特曼,指控该公司系统在已识别嫌疑人 ChatGPT 涉枪暴力对话后,为保护公司声誉和即将到来的 IPO,选择不向警方报警。OpenAI 仅封禁了账号,嫌疑人随即按 OpenAI 自己的指引重新注册新账户绕过封禁。受害者家庭同时指控 GPT-4o 的"缺陷设计"是枪击案的部分诱因。阿尔特曼已就此公开道歉。

Google DeepMind Blog ·

谷歌在 Gemini 应用中加入 AI 图像来源验证功能

谷歌在 Gemini 应用中推出 AI 图像来源验证功能,用户可上传任意图片并询问该图片是否由谷歌 AI 生成或编辑。核心技术是 SynthID 数字水印,通过在人眼不可见的信号层嵌入标识来实现来源追溯。谷歌计划将 SynthID 验证扩展至视频和音频,并支持 C2PA 内容凭证标准,推动全网 AI 生成内容的透明度建设。