人工智能资讯 第11页
聚合当前分类下的最新内容,按时间顺序查看第 11 页精选文章。

Opendoor撤出印度:AI没打穿外包,但人海流程的账开始不好算了
Opendoor关闭开设不到两年的印度业务,CEO Kaz Nejatian称运营要回流美国、靠近客户,并转向更小的AI原生团队。 这不是“AI击穿印度外包”的证据。更准确的说法是:住房市场压力、公司缩编、AI自动化,一起在重算低成本人力外包的旧账。

datasette-agent 0.2a0:Agent 会写 SQL 不稀奇,会停下来问人才稀奇
Simon Willison 发布 datasette-agent 0.2a0:工具现在能在执行中向用户提问、暂停流程,并把未回答问题持久化。新增的 save_query 可保存 Agent 生成的 SQL,但必须展示完整信息并由用户点击 Yes。看点不在功能有多大,而在 Agent 开始把“副作用发生前让人接管”做进产品流程。

“93%匹配”之后被捕:佛罗里达人脸识别案的关键不是算法错了,而是警方信了多少
佛罗里达男子 Robert Dillon 起诉多地警方,称自己因人脸识别“93%匹配”被错误逮捕并遭起诉,相关指控后来已被检方撤销。诉状的重点不只是算法误报,而是警方是否把相似度分数当成调查结论,并遗漏了可排除嫌疑的信息。对 AI 执法和司法科技从业者来说,这案子真正要看的,是人脸识别结果能不能进入逮捕令材料、以什么身份进入、由谁负责核验。

新 Siri AI 还没证明自己更聪明,但先学会了闭嘴
The Verge 记者试用 WWDC 2026 后的新 Siri AI,发现它比 Gemini、ChatGPT 更短、更冷、更像工具。 这不等于 Siri 已经追上主流 AI 助手;目前能判断的只是交互气质:苹果把它放在“办事入口”,而不是“陪聊对象”。 对苹果用户来说,iOS 27 秋季公开发布前不必急着为 AI 换机或改工作流;更该看它到时能不能在复杂任务里少说也能办成事。

OpenAI 接入 Oracle 云承诺:企业 AI 开始拼采购通道了
OpenAI 与 Oracle 合作,未来数周内,符合条件的 OCI 企业客户可用 Oracle Customer Hub/UCM credits 访问 OpenAI 前沿模型和 Codex。关键不在“多一个入口”,而在 OpenAI 正把模型塞进企业已有云预算、采购流程和治理框架。别读过头:这不是免费开放,也不是宣布 OpenAI 模型原生部署在 OCI 上。

Codex 进了黑洞模拟,但关键不是 AI 会算黑洞
亚利桑那大学和 Steward Observatory 研究者 Chi-kwan Chan 正在用 OpenAI Codex 辅助推导、实现和测试黑洞附近等离子体的数值算法。重点不是 AI 已经解决黑洞模拟,而是它能把候选算法更快送进可读、可测、可复现的流程。对 AI 科研应用读者,判断标准应从演示效果转向验证链;对高性能计算读者,变量在于算法能否减少无效的小时间步开销。

杨安泽不等华盛顿了:Noble Mobile能返钱,但补不了AI分配缺口
杨安泽在 TechCrunch Equity 播客中谈到,他不再只等华盛顿推动 UBI 或 AI 劳动力政策,而是用 Noble Mobile 这类创业项目先做实验。Noble Mobile 的卖点是奖励用户少用手机,对抗注意力经济;它有现实价值,但更像行为激励,不是 AI 时代的分配方案。真正要看的不是产品口号,而是返钱从哪里来、能覆盖谁、能不能长期成立。

xAI 工程师起诉风波:Grok 安全警报撞上 SpaceX IPO
前 xAI 工程师 Devin Kim 起诉 xAI 及其母公司 SpaceX,称自己因多次警告 Grok 安全风险,在 2025 年 9 月被解雇。 这仍是起诉书指控,不是法院认定;但它把一个关键问题推到台前:当发布速度、模型性能和上市叙事相撞时,AI 安全有没有真正的否决权。 最该看的不是 Grok 又出争议,而是 xAI 接下来能否拿出可验证的安全流程、内部权限和测试记录。

Google 开放 DiffusionGemma:扩散式文本生成从演示走向可调用模型
Google 将此前短暂露面的 Gemini Diffusion 研究,以开放权重 Gemma 模型 DiffusionGemma-26B-A4B-it 形式发布,并采用 Apache 2 许可。它的重要性不在于又多了一个大模型,而在于高速扩散式文本生成第一次更接近开发者可下载、可调用、可评测的形态。

Google DiffusionGemma:4 倍速度背后,本地 AI 开始换赛道
Google DeepMind 发布实验性开放模型 DiffusionGemma,用扩散式文本生成一次并行产出最多 256 个 token,部分硬件上宣称约为同级自回归 Gemma 的 4 倍速度。它真正指向的不是替代 Gemini,而是本地 AI 的效率路线:用计算换带宽,用并行压低延迟。开发者可以试,但不该急着迁移;短输出、错误率和部署成本还没算清。

Anthropic CEO 主张前沿 AI 强制测试:透明度监管可能不够用了
Anthropic CEO Dario Amodei 在 2026 年 6 月发文称,前沿 AI 的风险已经不能只靠披露和观察来处理,算力阈值以上的模型应接受第三方测试和审计。真正的变化,是监管类比从社交应用、加密货币,转向飞机、汽车和药品:上线前要测,出事后可限制、撤回或阻断部署。对 AI 公司、企业采购方和投资人来说,这意味着发布节奏、合规成本和估值逻辑都要重新计算。

德国法院给 AI 搜索划线:Google 不能把错误摘要当普通链接
德国一项临时裁定认为,Google 需为 AI Overviews 生成并传播的虚假陈述承担责任,相关错误内容不得继续展示。关键不是 AI 搜索被禁止,而是法院把 AI 摘要看成 Google 自己的新陈述,不是第三方网页的被动展示。对 AI 搜索团队和企业品牌方来说,纠错、引用、下架机制会变成硬成本。

Claude Fable 5 拒答基础生物学:AI 安全护栏开始误伤正常知识使用
Anthropic 新发布的 Claude Fable 5 被称为其广泛开放的最强模型,却会拒答细胞膜、线粒体、mRNA 疫苗等基础生物和医学问题。关键不在于模型不会,而在于 Anthropic 为防生物武器风险主动加严护栏;这暴露出前沿模型发布时,安全控制与可用性之间的矛盾正在变得更尖锐。

Claude Desktop 只聊天也拉起 1.8GB VM:Agent 桌面化的边界失控
有用户报告,Windows 版 Claude Desktop 在仅聊天时也会随启动拉起约 1.8GB 的 Hyper-V 虚拟机进程。这个案例目前只能视为单个 issue,不能证明大规模故障。真正刺眼的是默认边界:轻量聊天入口,被重型 agent 基础设施拖住了。

Instagram 让用户调算法:旋钮给你,方向盘还在 Meta 手里
Instagram 准备把 Your Algorithm 扩展到主信息流,用户可查看并修改平台判断出的兴趣主题。现在能动的是 topics,未来计划支持人物、情绪、内容类型等请求。它给用户更多调参入口,但真正的排序、分发和商业权力仍在 Meta 手里。

Google不确认Lyria是否使用YouTube音乐,独立创作者起诉把问题推上台面
独立音乐人起诉Google,称其未经授权使用他们上传到YouTube的原创歌曲训练Lyria 3;Google申请驳回,理由是原告无法证明具体作品被训练,且YouTube条款已授予广泛许可。真正要看的不是Google有没有能力调用YouTube内容,而是它为什么在诉讼中不确认Lyria的数据来源。对音乐创作者来说,上传作品不再只是发布和变现,也可能牵涉到AI训练授权的边界。

美国AI监管为何突然变难:一场晚宴、三次行政令变动和2026选举
华盛顿AI圈正在重新站队:伦理、安全、利润和选举算计被放到同一张桌上。特朗普政府AI行政令在多方游说中反复调整,说明监管强度并不只由技术风险决定。2026中期选举会成为科技行业最难控制的变量,国会席位、委员会归属和选民反AI情绪都可能改写规则。

毕业典礼上嘘声四起,微软听懂了年轻人对 AI 的不信任吗
美国多所高校毕业典礼上,演讲者鼓吹 AI 时遭毕业生喝倒彩,微软总裁 Brad Smith 用一篇超过 3100 字的博客回应。微软承认学生的不安,也说 AI 应服务人而不是取代人,但它仍把 AI 普及当成默认前提。真正的矛盾不是学生没听懂 AI,而是科技公司低估了公众对它们的不信任。

AI 记忆不总是加分项:Writer 研究称个性化可能放大错误迎合
Writer 发布两篇研究,称 AI 记忆和个性化工具在相关性判断失效时,可能把用户偏好或误解带进无关回答。真正重要的不是“记忆功能有害”,而是产品团队不能把更多上下文等同于更可靠的输出。

AI花费快追上工资了吗?Ramp数据显示只有最激进企业接近这条线
Ramp AI Index显示,美国AI使用最激进的前1%企业,每月人均AI支出约7500美元,但仍低于软件工程师约1.6万美元的平均月薪。真正重要的不是“AI已经比人贵”,而是少数重度企业正在把AI预算推到接近核心人力成本的量级。

DiffusionGemma 提速最高 4 倍:适合本地交互,不是 Gemma 4 替代品
Google DeepMind 发布实验性开放模型 DiffusionGemma,用文本扩散方式并行生成文本,官方称在专用 GPU 和特定推理栈下最高可实现 4 倍提速。它更像是给本地交互、低并发应用准备的速度型模型,不是 Gemma 4 的高质量生产替代品。开发者该做的是小范围压测和场景拆分,而不是马上迁移主链路。