人工智能资讯 第20页

聚合当前分类下的最新内容,按时间顺序查看第 20 页精选文章。

纽约法官痛斥虚假判例:AI 疑云下,律师最该怕的不是模型
人工智能 2026/6/4

纽约法官痛斥虚假判例:AI 疑云下,律师最该怕的不是模型

5月20日,纽约州最高法院上诉庭直播中,法官质问原告律师 Michael Sanders:上诉文件里至少3个案例疑似不存在,另有10个案例被指误述法律。法官没有明说这些错误来自生成式 AI,但已要求 Sanders 及其律所说明为何不应受制裁。真正刺痛人的地方,是对方律师也没发现;专业行业一旦把核查交给工具、流程和侥幸,职业信任就会被低成本自动化慢慢磨掉。

AI幻觉法律行业虚构判例
Google 的 75% AI 代码,卡在了人类评审那里
人工智能 2026/6/4

Google 的 75% AI 代码,卡在了人类评审那里

Google CEO Sundar Pichai 对外称,公司 75% 的新代码由 AI 生成;但内部员工正在 Memegen 上大量吐槽自家 AI 编程工具 Jetski。真正的问题不是 AI 会不会写代码,而是“生成”被算成生产力后,验证、审查、测试和维护成本被推给了一线工程流程。

AI 生成代码GoogleSundar Pichai
EVA-Bench 2.0 发布:语音 Agent 该从演示视频回到企业流程了
人工智能 2026/6/4

EVA-Bench 2.0 发布:语音 Agent 该从演示视频回到企业流程了

ServiceNow-AI 在 Hugging Face 发布 EVA-Bench Data 2.0,覆盖航空客服、企业 IT 服务、医疗 HR 三个领域,合计 213 个场景、121 个工具、35+ 工作流。它的价值不在制造一个新榜单,而在把语音 Agent 放进认证、权限、政策和不可满足请求里测试。对企业 AI 团队和 Agent 产品负责人来说,这更像一套上线前的流程压力测试清单。

语音 AgentEVA-Bench 2.0ServiceNow-AI
AI 内容都贴标签了,为什么还不让用户一键屏蔽?
人工智能 2026/6/4

AI 内容都贴标签了,为什么还不让用户一键屏蔽?

The Verge 批评 YouTube、Instagram、TikTok、Meta、Spotify 等平台已经在给 AI 生成内容打标签,却没有给用户按标签过滤、隐藏或降权的开关。问题不在识别技术,而在平台不愿把选择权交给用户,因为那会直接检验 AI 内容在推荐流里到底有多少真实需求。

AI生成内容内容标签内容过滤
NVIDIA 的合成数据实验:造题只是表面,管题才是门槛
人工智能 2026/6/4

NVIDIA 的合成数据实验:造题只是表面,管题才是门槛

NVIDIA 在 Hugging Face 发布 Nemotron 预训练用的 task-seeded 合成 Q&A 数据流程:用公开任务训练集做种子,生成新问题、答案、推理和上下文。它在 Nemotron-3 Nano 的 100B token 继续训练实验中带来部分基准提升,但数学平均基本稳定。真正该看的不是“合成数据有没有用”,而是预训练竞争正在从拼语料规模,转向拼数据结构、验证能力和训练配比。

NVIDIANemotron合成数据
Endava 把 OpenAI 接进交付流程:软件服务公司的旧算盘松了
人工智能 2026/6/4

Endava 把 OpenAI 接进交付流程:软件服务公司的旧算盘松了

Endava 正在把 ChatGPT Enterprise、Codex 和 OpenAI 技术嵌入 DavaFlow,从会议准备、产品发现到软件工程、部署和运营流程都覆盖到。重点不是“企业用了 AI”,而是技术服务公司的交付模式开始从堆人、堆流程,转向人机协同编排。对技术管理者和项目负责人来说,下一步要看的不是账号开了多少,而是需求、治理、协同和激励有没有跟着改。

EndavaOpenAI企业级 AI 平台
亚马逊仓库机器人能听人话了,但重点是系统更会管人了
人工智能 2026/6/4

亚马逊仓库机器人能听人话了,但重点是系统更会管人了

亚马逊发布新一代全自主仓储机器人 Proteus,重点升级是 AI 自然语言交互:员工不再必须用专用软件,可像给同事派活一样下达搬运任务。 新 Proteus 仍在亚马逊实验室试点,计划 2027 年上半年先在欧洲部署;亚马逊称它可走出 dock 区域,在更大仓库范围内搬运容器、衔接工位、辅助配送站点。 这不是“机器人会聊天”的热闹功能,而是仓库调度权继续向系统集中。效率账更清楚,岗位替代和劳动节拍的账还没结完。

亚马逊Proteus仓储机器人
伯克利部分 CS 课程挂科上升:AI 没法背全锅,但正在放大基础缺口
人工智能 2026/6/4

伯克利部分 CS 课程挂科上升:AI 没法背全锅,但正在放大基础缺口

UC Berkeley 部分计算机相关课程出现不及格成绩上升,授课教师把它同学生更频繁使用 AI 工具、数学基础变弱联系起来。现在还不能说 AI 直接导致挂科,更稳妥的判断是:AI 让学生更容易跳过训练过程,也让原本的基础能力差距更早暴露。对高校教师和课程设计者来说,难题不是简单禁用 AI,而是重新验证学生到底会不会推理、调试和证明。

生成式 AIAI 工具加州大学伯克利
大模型“由权重构成”:一篇科幻仿作为什么戳中记忆与责任问题
人工智能 2026/6/4

大模型“由权重构成”:一篇科幻仿作为什么戳中记忆与责任问题

Max Leiter 的《Weights》是对 Terry Bisson《它们是由肉做成的》的文学仿写,不是技术论文,也不是“大模型已有意识”的声明。它真正刺到人的地方,是把大模型写成“由浮点权重和矩阵乘法构成”的存在,反问我们还能不能用“只是模式匹配”绕开经验、记忆和责任。下一代模型开始加入跨会话记忆后,这个问题已经从科幻玩笑进入产品治理。

大模型AI伦理Weights
Wasmer 两周做出 Edge.js:Codex 是工程杠杆,还是提速叙事
人工智能 2026/6/4

Wasmer 两周做出 Edge.js:Codex 是工程杠杆,还是提速叙事

Wasmer 称借助 OpenAI Codex,用两周做出 Edge.js,让 Node.js 工作负载可在 WebAssembly 沙箱和边缘层运行,不依赖 Docker。 这件事的重点不是 AI 多写了几行代码,而是 Codex 被用到架构、查 bug、根因定位和 C++/汇编层调试。 两周、一年、10x 到 20x 都来自 Wasmer 自述。对团队更有用的判断是:先做验证,不要直接把它当成成熟迁移路线。

OpenAI CodexWasmerEdge.js
Ted Chiang反驳AI意识论:Claude会说“我”,不等于它有感受
人工智能 2026/6/4

Ted Chiang反驳AI意识论:Claude会说“我”,不等于它有感受

Ted Chiang在《大西洋月刊》发文,反驳把大语言模型的语言表现当成意识、情感和道德主体的说法。争议焦点不是Anthropic是否宣布Claude有意识,而是它在Claude“constitution”文件和公开表述中使用了大量近似主体的语言。对AI伦理研究者和科技从业者来说,真正要做的是把研究假设、产品说明和用户界面分开,避免把系统行为写成内心生活。

AI意识论Ted ChiangClaude
GPT-Rosalind 更新:OpenAI 想进生命科学的实验流程,但硬门槛不是跑分
人工智能 2026/6/4

GPT-Rosalind 更新:OpenAI 想进生命科学的实验流程,但硬门槛不是跑分

OpenAI 更新 GPT-Rosalind,把 GPT-5.5 的工具调用、代码能力和生命科学专项能力接入药物化学、基因组学、湿实验排错和科研插件工作流。它现在以 research preview 面向合格机构开放,不是全面商用发布。真正该看的不是 benchmark 涨了多少,而是 AI 正在逼近科研流程中间层;但能不能被审计、复现、追责,仍是硬门槛。

OpenAIGPT-Rosalind生命科学
Google Dreambeans:把你的 Gmail、照片和搜索记录,画成每日生活建议
人工智能 2026/6/4

Google Dreambeans:把你的 Gmail、照片和搜索记录,画成每日生活建议

Google Labs 推出实验应用 Dreambeans:经用户授权连接 Gmail、Calendar、Photos、YouTube、搜索历史等数据,每天生成 10 到 14 条 AI 插画故事和生活建议。它目前只面向符合条件的美国 Google AI Ultra 用户,个人 Google 账号可加入等待名单。真正要盯的不是名字怪,而是 Google 正在测试一种新入口:把“了解你”包装成“帮你安排一天”。

DreambeansGoogle LabsAI 插画故事
Gemma 4 12B:Google 把本地多模态 AI 卡进 16GB 门槛,但别急着吹神机
人工智能 2026/6/4

Gemma 4 12B:Google 把本地多模态 AI 卡进 16GB 门槛,但别急着吹神机

Google 发布 Gemma 4 12B,主打 16GB 内存或显存设备可本地运行,补上了移动小模型和高端本地模型之间的中档空位。真正的新信息不只是参数规模,而是默认 MTP、多模态编码减重、18GB 权重和 16GB 设备现实压力一起出现:它让本地 AI 更可试,但还没证明自己真好用。

Gemma 4 12BGoogle本地 AI
AethexAI 融 300 万美元:语音 AI 的真盲区,不在模型榜单上
人工智能 2026/6/4

AethexAI 融 300 万美元:语音 AI 的真盲区,不在模型榜单上

AethexAI 获得 300 万美元 pre-seed 融资,4DX Ventures 领投,押注非洲和中东的本地语音 AI。它自建 Kora 小模型和语音编排层,目前日处理超过 1.7 万通电话。真正的看点不是又一家语音 AI 公司融资,而是电话网络、方言、混语、延迟和价格点,正在逼出一套不同于欧美市场的 AI 架构。

AethexAI语音 AIpre-seed 融资
Suno 估值 54 亿美元:AI 音乐先跑规模,版权账还悬着
人工智能 2026/6/3

Suno 估值 54 亿美元:AI 音乐先跑规模,版权账还悬着

Suno 完成 4 亿美元 D 轮融资,估值升至 54 亿美元;约 7 个月前,它的估值还是 24.5 亿美元。更关键的是,UMG、Sony、GEMA 仍在追诉,Warner 虽已和解并授权,但不能代表行业整体转向。资本押的不是版权风险消失,而是押 Suno 能先做成平台,再把版权账改写成可谈判、可分摊、可定价的成本。

SunoAI音乐生成版权诉讼
亚马逊搜索栏开始“先造图再找货”:方便背后,是平台在接管你的想象
人工智能 2026/6/4

亚马逊搜索栏开始“先造图再找货”:方便背后,是平台在接管你的想象

亚马逊在移动端搜索栏加入生成式 AI 图片:用户描述服装或家居用品后,系统先生成参考图,再搜索相似商品。它解决了“不知道专业名称”的购物痛点,但也把电商搜索从匹配关键词,推向了塑造欲望。

生成式 AI亚马逊电商搜索
DaVinci Resolve 21:Photo 页面才是 Blackmagic 的真野心
人工智能 2026/6/3

DaVinci Resolve 21:Photo 页面才是 Blackmagic 的真野心

Blackmagic 发布 DaVinci Resolve 21,AI 工具扩到搜索、修脸、语音、救焦点和去模糊,新增 Photo 页面,把静态摄影拉进 Resolve 工作流。 最关键的变化不是功能变多,而是 Resolve 正在侵入 Lightroom、Photoshop、Premiere 组合工作流的边界。 专业剪辑师、调色师和小型制作团队会先受益;摄影师要不要迁移,取决于是否愿意用学习成本和生态绑定换整合效率。

DaVinci Resolve 21BlackmagicAI工具
Reddit 被拿来投喂 AI 搜索,健康水军开始换打法了
人工智能 2026/6/3

Reddit 被拿来投喂 AI 搜索,健康水军开始换打法了

r/biohackers 版主称,部分肽类和 HRT 相关营销方疑似用养号、机器人和付费真人污染社区讨论,以影响 ChatGPT 和 Google AI 搜索的引用结果。 版主已限制相关新帖,把讨论压到每周 megathread;这说明 Reddit 正从讨论场变成 AI 答案供应链的一环。 健康类 AEO 的风险不止是买错产品,青少年、自我实验者和依赖 AI 搜索查健康建议的人,可能把营销内容误当经验或医嘱。

AI搜索RedditChatGPT
微软在 Build 亮出自研模型:还牵着 OpenAI,也开始自己下场
人工智能 2026/6/3

微软在 Build 亮出自研模型:还牵着 OpenAI,也开始自己下场

微软在 Build 2026 集中发布 MAI-Thinking-1、MDASH、Copilot 超级应用和 OpenClaw 支持,信号很清楚:它不想只做 OpenAI 的云和应用入口。微软仍是 OpenAI 的主要云合作伙伴,但 4 月合同重谈后,双方从深度绑定转向有限合作。真正要验证的是,微软能不能把企业客户和 Windows 生态优势,转成一线模型能力。

微软OpenAIMAI-Thinking-1
DharmaOCR 用 DPO 治 OCR 复读:失败样本别急着删
人工智能 2026/6/3

DharmaOCR 用 DPO 治 OCR 复读:失败样本别急着删

DharmaOCR 把 DPO 用在巴西葡语结构化文档 OCR 上:先 SFT,再用同一批文档、同一模型生成的好坏候选构造偏好对。结果是在 5 个开源模型家族上,文本退化率相对 SFT 平均下降 59.4%,降幅约 37% 到 88%。 我更在意的不是“DPO 又多一个场景”,而是失败样本的身份变了:它不只是脏数据,也可以是治理生成式模型顽固失效模式的负反馈资产。

DPOOCRDharmaOCR