主题分类

智能体·工具

57 篇文章

TechCrunch AI ·

OpenAI 在 API 中推出新语音智能功能

OpenAI 发布三项 Realtime API 新功能:GPT-Realtime-2 实现实时语音对话理解,GPT-Realtime-Translate 支持 70 余种语言的实时翻译,GPT-Realtime-Whisper 提供实时语音转文字服务。三款模型共同将实时音频从简单的问答推进到可听、可推理、可翻译、可转录并可采取行动的语音交互阶段。

TechCrunch AI ·

Lovable 在苹果打压 vibe-coding 之际逆势上线 iOS 和安卓应用

AI 编程助手 Lovable 宣布其 vibe-coding 移动应用正式登陆 iOS 和安卓平台,用户可通过语音或文字 AI 指令随时随地对 web 应用进行编程和修改。应用支持跨设备同步进度,Build 完成时会推送通知。上线恰逢苹果对 vibe-coding 类应用的审查收紧——Replit 和 Vibecode 已因"上架后动态修改代码功能"被阻止更新。苹果澄清并非封杀 vibe-coding 本身,而是出于安全审查考量。

TechCrunch AI ·

Otter 推出企业跨工具搜索:接入 Gmail、Jira、Salesforce,用 MCP 协议统一查询

AI 会议记录应用 Otter 推出企业搜索功能,作为 MCP(模型上下文协议)客户端连接外部应用数据。用户可将 Gmail、Google Drive、Notion、Jira、Salesforce 等工具与会议记录统一查询,微软 Outlook、Teams、SharePoint、Slack 等支持即将上线。用户还可在 Otter 内直接将会议摘要推送至 Notion 或起草 Gmail 邮件。Otter 同步升级了 AI 助手,使其能够理解当前界面上下文并给出相关答案。

Google DeepMind Blog ·

谷歌发布 Gemini 3:基准测试全面超越前代,编程能力再度突破

谷歌发布 Gemini 3 系列,其中 Gemini 3 Pro 在所有主流 AI 基准测试中均超越前代,编程能力更胜 2.5 Pro,熟练掌握智能体工作流和复杂零样本任务。该模型支持多模态理解、视觉推理和空间推理,可通过 Google AI Studio 和 Vertex AI 中的 Gemini API 调用,也可使用 Google Antigravity 平台进行智能体开发。Gemini 3 还在 AI Studio 中解锁了"vibe coding"能力,用户可通过自然语言提示直接创建应用。