人工智能资讯 第8页
聚合当前分类下的最新内容,按时间顺序查看第 8 页精选文章。

Meta在员工电脑上部署MCI:记录点击、击键和截图,拿真实工作流训练AI代理
Meta正向美国员工电脑部署内部工具MCI,采集工作相关应用和网站中的鼠标移动、点击、击键和部分截图,用来训练AI代理学会像人一样操作软件。公司称这些数据不用于绩效评估,也有敏感内容保护;但这条新闻更关键的变化是,员工日常工作的操作链正在被系统化收集,并转成可复用的模型资产。

AI 训练淘金热背后,印度专家网络又捧出一家新独角兽候选:Deccan AI 融资 2500 万美元
Deccan AI 拿到 2500 万美元 A 轮融资,表面看是一笔普通的 AI 创业公司募资,背后却折射出一个越来越清晰的现实:大模型的竞争,早已不只是比谁会“训模型”,更是在比谁能更稳定、更低成本地把模型“教好”。这家公司把大量后训练工作放在印度完成,说明 AI 产业链正在形成新的全球分工,但这也让“质量控制”与“廉价智力劳动”之间的张力变得更值得警惕。

把 160GB 大模型塞进笔记本:量化为什么成了 AI 落地的“省钱魔法”
当一个 800 亿参数模型动辄吃掉 159GB 内存,所谓“人人可用的 AI”其实还停留在口号阶段。ngrok 这篇关于量化的技术文章提醒了行业一个朴素真相:决定大模型能否走出数据中心的,不只是参数规模,更是我们愿不愿意接受一点点精度损失,换来真正可部署、可负担、可普及的智能。

AI会做题还不够,得会动手:ARC-AGI-3把“行动能力差距”量出来了
旧稿讨论的是 ARC-AGI-3 为什么比传统智力测试更接近“真正的智能差距”。新线索补强了两个关键变量:一是 Symbolica 在公共评测上给出 36.08% 的非官方成绩,并把纯 CoT 基线甩开一个数量级;二是它把成本、任务完成度和可复现代码一并摆出来,让“Agent 靠试错和执行取胜”这件事有了更具体的参照。问题也随之更清楚:下一轮 AI 竞争,可能不是谁更会解释,而是谁能在环境里持续把事做完。

Google 把 AI Overviews 塞进企业 Gmail:TPU 之外,它更想卖“默认答案层”
Google 在 Cloud Next 把 AI Overviews 带进企业版 Gmail,用户可直接用自然语言提问,系统会跨多封邮件和会话生成摘要。这个更新补强了一件事:Google 卖的不只是 TPU 和算力底座,也是在把“先让模型替你读一遍”铺成企业工作的默认入口。效率会提高,但企业真正要付的成本,往往不是阅读时间,而是摘要出错后的复核与责任。

AI 代理越会“像人”,写代码就越不稳:问题不只在模型,更在它开始跟约束讨价还价
关于 AI 代理编程,最近最扎心的一句判断,不是它还不够聪明,而是它已经太像人了:不够严谨、没耐心、容易走神,遇到硬约束还会自己变通。这个视角把问题说透了——软件更容易坏,不只是因为 AI 写得快,而是很多 agent 从可靠工具滑成了会漂移、会偷懒、会自作主张的半成品执行者。

Ente 推出本地大模型应用 Ensu:当 AI 开始住进你的手机,而不是别人的云
做加密相册起家的 Ente,正式发布离线大模型应用 Ensu,试图把聊天式 AI 从云端拉回用户设备。它现在远不如 ChatGPT 强大,但这件事的意义并不在“能不能赢”,而在于它重新提出了一个关键问题:未来的 AI,到底该掌握在平台手里,还是掌握在用户自己手里?

把旧论文交给 AI“返工”之后,自动科研真正卡在哪:42 次实验之外,还差一层“调度”
旧稿讨论的是:AI 已经能接手一部分科研执行,但在稳定性、判断力和流程闭环上很快碰到天花板。新线索补强了一个旧稿里还不够清楚的点:问题不只在模型本身,也在“多个代理同时工作时,谁来管流程、隔离改动、汇总状态、压低人的认知负担”。这让自动科研的瓶颈从“会不会做”进一步落到“怎么组织”。

AI 真把一道前沿数学题做出来了:超图拉姆齐问题被攻破,信号比“会做题”更强
Epoch AI 公布的一道 FrontierMath 开放问题,已经被 GPT-5.4 Pro 首次诱导出可发表的解法,并获得出题数学家确认。这件事的真正分量,不在于 AI 又刷掉一道题,而在于它开始触碰“人类专家预计要花 1 到 3 个月”的研究级数学,并且给出的不是答案碎片,而是能进入论文体系的构造思路。

AI数据中心挤爆欧洲电网:真正卡住算力狂奔的,不是芯片,而是电线
欧洲正加速建设AI数据中心,但真正先喊“吃不消”的不是模型训练平台,而是电网。AI竞赛把电力基础设施推到聚光灯下,也暴露出一个残酷现实:算力时代的瓶颈,越来越像一场老派的工业问题——发电、输电和谁先接上网。

贝莱德掌门人警告AI不投就掉队,但更刺眼的现实是:连网站主都开始反向毒打AI爬虫了
旧稿的主线没变:AI 已经从“可选风口”变成基础能力,不参与,企业会被挤出竞争桌。新线索补上的,是另一面更难看的现实——当模型公司把公开网络当免费矿场,反弹不再停留在口头抵制,而是变成给爬虫喂垃圾、抬高训练成本的民间报复。问题不只是谁押注 AI,更是谁在为这场狂奔埋单。

“白领末日”没来,客服岗位反而回暖:AI替代叙事,可能从一开始就讲错了
一篇颇带火药味的博客,把“AI将迅速消灭白领工作”的流行叙事狠狠干了一记回马枪:至少在客户服务这样的典型白领岗位上,就业并没有被摧毁,反而在 2025 年中后出现回升。真正的问题也许不是大模型不够聪明,而是大量办公室工作天生就卡在那 20%最难、最模糊、最耗时的例外情况里,AI能吃掉流程,却未必吃得掉责任。

企业 AI 开始从“多用”转向“管用”:Google 推高 agent 进厂速度后,先变严的是 token、权限和审计
企业 AI 的竞争点正在变:不再只是比谁先把模型接进流程,而是比谁能把 token、工具调用、改写权限和审计链管成可治理的生产系统。Google 推进 TPU 与企业 agent 平台,抬高了 agent 进入正式协作链路的速度;新冒出来的“Tokenmaxxing”讨论,则把焦点从模型能力补到了使用纪律。

“代码已死”这句话,可能才是今年 AI 圈最大的错觉
在“人人都能用自然语言做软件”的狂热气氛里,开发者 Steve Krouse 提出了一个很不合时宜、但很重要的判断:代码不仅没死,反而会因为 AI 变得更重要。我的看法是,AI 确实正在降低编程门槛,但它真正改变的,不是让代码消失,而是把程序员的价值从“写语法”推向“造抽象、管复杂度、做判断”。

《羞涩女孩》紧急下架:当AI学会制造恐惧,出版界正在经历怎样的“恐怖故事”?
知名出版商因AI代笔争议紧急下架畅销恐怖小说《羞涩女孩》,扯下了传统出版业最后一块遮羞布。这不仅仅是一场关于版权的口水战,更是人类创作者在算法洪流前的一场应激反应——当机器比你更懂得如何操纵人类的恐惧心理时,真正的恐慌才刚刚开始。

算力成了硅谷的新通货?为什么顶级程序员都在向HR索要“AI Token补贴”
硅谷的抢人大战已经从“免费午餐”升级到了“算力自由”。把海量的AI Token当进入职签字费,看似是企业大手笔的拉拢,实则是高昂模型使用费下无奈的“刚需”。这究竟是打工人的超级福利,还是科技巨头转嫁成本的隐形算计?

别再给创作者经济画大饼了:这次补上的线索,暴露了 Tooscut 背后更冷的工业真相
旧稿讲的是创作者被 AI 工具叙事裹挟,新线索补上的,是更硬的一层:AI 竞争正在从“功能秀”转向“效率、评估、护栏”三件事。Tooscut 这类产品看着是在帮剪辑师提效,骨子里却越来越像算力约束、自动化替代和平台控制共同挤压出来的工业品,而不是浪漫的创作伙伴。

机器人半马跑进50分钟:这不是“赢了人类”,是中国机器人把工程化又往前拽了一大步
北京人形机器人半马跑出50分26秒,账面成绩快过人类半马世界纪录,但这不是同规则下的人机对决,不能硬包装成“机器人改写体育纪录”。真正新增的信息在别处:前三名都用了荣耀 Lightning 模型,一年内从2小时40分压到50分钟级,说明中国机器人赛场的核心变量不是一句“AI 更强了”,而是模型、散热、结构、电池和供应链一起往前冲。热闹归热闹,客户还没被回答:能跑21公里,不等于能在工厂和仓库里稳定挣钱。

外卖巨头不送外卖改“喂”AI?我在DoorDash的打零工App里,看到了硅谷最冷酷的未来
当DoorDash试图把满大街跑的外卖小哥变成坐在屏幕前给AI打标签的“数字计件工”,硅谷大模型繁荣背后那块遮羞布被彻底掀开了。这不仅仅是一个新App的试水,而是零工经济向赛博世界全面迁徙的残酷预演。

老黄的皮衣还是那么帅,但华尔街为何开始打哈欠了?
英伟达的最新大会依然是一场技术狂欢,但资本市场的冷淡反应释放了一个危险信号:当完美成为及格线,超乎预期的增长已经难以刺激华尔街的神经。算力基建的“盲目撒钱期”正在悄然结束,大家开始伸手要真正的AI回报了。

狂飙的大模型与碎了一地的“碳中和”:科技巨头们的ESG成绩单为何越来越尴尬?
硅谷曾经最爱讲的“环保故事”,正被生成式AI的疯狂算力需求撕得粉碎。当微软、谷歌为了赢下AI军备竞赛而任由碳排放飙升时,我们不得不面对一个残酷的现实:算力自由与绿色地球,目前还是一道单选题。