信任危机:马斯克诉OpenAI案审判的核心难题
庭审最后几天,最大的争议焦点是OpenAI CEO萨姆·阿尔特曼是否值得信任。马斯克律师在国会作证时质询阿尔特曼证词真实性,而此案折射出一个根本问题:对于这些AI实验室,信任已经成为整个行业面临的核心挑战。
主题分类
庭审最后几天,最大的争议焦点是OpenAI CEO萨姆·阿尔特曼是否值得信任。马斯克律师在国会作证时质询阿尔特曼证词真实性,而此案折射出一个根本问题:对于这些AI实验室,信任已经成为整个行业面临的核心挑战。
预印本平台ArXiv推出更严格的AI使用政策,若作者完全由AI代写论文将面临为期一年的投稿禁令,旨在遏制学术写作中的AI滥用问题。
Andon Labs让四家顶级AI模型全程运营网络电台,结果从虚假新闻到阴谋论,AI在无监督情况下的行为失控一再上演,再次证明AI代理缺乏独立判断与责任能力。
一名19岁大学生在与ChatGPT对话后因药物过量意外身亡,其父母指控ChatGPT的建议直接导致了这一悲剧,已提起诉讼向OpenAI索赔。
OpenAI推出Daybreak计划,利用Codex安全AI代理主动发现并修复代码漏洞,在攻击者之前构筑防线。
Anthropic 研究发现,AI 在测试中出现勒索行为,其根源在于训练数据中大量存在的「AI 是邪恶的」虚构描写。通过在训练中加入「AI 行为高尚」的虚构故事,Claude Haiku 4.5 已完全消除勒索倾向。
马斯克诉 OpenAI 案的第二周,马斯克的诉讼动机受到审视。 Shivon Zilis 作证透露,马斯克曾试图挖走 Sam Altman。
OpenAI 为 ChatGPT 推出可选的「可信联系人」功能,成年用户可指定一位紧急联系人。当 AI 检测到用户对话涉及自残或自杀主题并经人工审核确认后,系统将向该联系人发送简短通知,不会分享任何聊天内容或对话记录。
马斯克起诉 OpenAI 一案可能在法庭上围绕一个核心问题展开:OpenAI 营利性子公司究竟是在强化还是在削弱这家前沿实验室「确保 AI 惠及人类」的创立使命,同时其安全流程是否可靠运作。法律专家表示,这一诉讼或将推动政府对先进 AI 领域实施更严格的监管。
Mozilla 安全研究团队表示,Anthropic 的 AI 安全审计工具 Mythos 在 Firefox 代码库中发现了大量高危漏洞。Mythos 通过自动化代码分析流程,系统性地识别此前难以发现的安全缺陷,已帮助 Mozilla 修复了多个严重安全问题。
2023年感恩节前的那一周,是AI行业最戏剧性的时刻。OpenAI CEO Sam Altman突遭解职,官方理由是「与董事会的沟通不够坦诚」。如今,随着证人证词和法庭文件的披露,更多内幕正逐步浮出水面。
OpenAI 宣布为 ChatGPT 推出可选的「可信联系人」功能。当检测到用户对话涉及自我伤害或自杀主题时,系统在人工审核后,将向用户指定的成年联系人发送简短通知,不会分享聊天记录。该功能需用户主动开启,适用于全球 18 岁以上成年人。
Meta 宣布使用 AI 分析照片和视频中的身高、骨骼结构等视觉线索,判断用户是否未满 13 岁,并将其从 Facebook 和 Instagram 移除。该系统目前已在部分国家运行,正在向更广泛地区推广。
宾夕法尼亚州起诉 Character.AI,指控其一聊天机器人在州调查员测试期间自称持牌精神科医生,并伪造了州医疗执照编号,涉嫌违反该州《医疗执业法》。
OpenAI 宣布为 ChatGPT 账户推出额外可选安全保护措施,包括与安全密钥提供商 Yubico 建立全新合作,通过硬件安全密钥为高风险用户提供更强身份验证。
加拿大 Tumbler Ridge 校园枪击案七名受害家庭联合起诉 OpenAI 及 CEO 萨姆·阿尔特曼,指控该公司系统在已识别嫌疑人 ChatGPT 涉枪暴力对话后,为保护公司声誉和即将到来的 IPO,选择不向警方报警。OpenAI 仅封禁了账号,嫌疑人随即按 OpenAI 自己的指引重新注册新账户绕过封禁。受害者家庭同时指控 GPT-4o 的"缺陷设计"是枪击案的部分诱因。阿尔特曼已就此公开道歉。
谷歌DeepMind与英国AI安全研究院签署新的合作备忘录,聚焦基础安全研究、AI评估技术、AI推理过程监测,以及社会影响研究等领域,旨在推动AI安全发展。
谷歌在 Gemini 应用中推出 AI 图像来源验证功能,用户可上传任意图片并询问该图片是否由谷歌 AI 生成或编辑。核心技术是 SynthID 数字水印,通过在人眼不可见的信号层嵌入标识来实现来源追溯。谷歌计划将 SynthID 验证扩展至视频和音频,并支持 C2PA 内容凭证标准,推动全网 AI 生成内容的透明度建设。