人工智能资讯 第6页
聚合当前分类下的最新内容,按时间顺序查看第 6 页精选文章。

AI 写代码,竟然靠“抄自己作业”变强了:一篇论文揭开大模型代码能力提升的朴素路径
一篇最新 arXiv 论文提出,代码大模型未必非得依赖更强教师模型、复杂验证器或强化学习,光靠“从自己的输出里挑样本,再回炉训练”就能显著提升表现。这个结果之所以重要,不只是因为方法简单,而是它提醒整个行业:在后训练时代,很多性能红利也许并不藏在更复杂的系统里,而藏在对模型自身行为的重新整理中。

特朗普催建AI数据中心,为何先被自己设下的关税和民意绊倒
美国想靠大规模建设AI数据中心赢下新一轮技术竞赛,但现实比政治口号硬得多:变压器、开关设备和电池等关键电力基础设施严重短缺,而特朗普政府对中国商品加征的关税,恰好堵住了最现实的补给通道。更麻烦的是,数据中心如今遇到的已不只是供应链问题,而是社区反弹、环保焦虑和电价恐惧共同叠加的“社会许可危机”。

当人类把大脑“外包”给 AI:一项研究敲响了警钟
宾夕法尼亚大学一项新研究发现,很多人在面对大语言模型时,远比自己想象中更容易放下怀疑、停止推理,甚至在 AI 明显会犯错的情况下也照单全收。AI 正在成为新的“认知拐杖”,问题不在于它够不够聪明,而在于我们会不会因为它看起来太自信,就懒得再思考。

当 AI 开始给精神科续药:乌托邦的效率,还是医疗的偷懒?
美国犹他州正在试点让 AI 聊天机器人为部分精神科药物续方,这听上去像医疗效率革命,但也像把最脆弱的人群交给一套外界看不清的系统。问题不只是“AI 能不能做”,而是“我们为什么要让它做”,以及谁来为判断失误买单。

一家想靠声音识别抑郁的 AI 公司,倒在了 FDA 门外
做了七年“听声音识别抑郁”技术的美国创业公司 Kintsugi,最终没有等到 FDA 放行,资金先耗尽了。它的倒下不是一个孤立的创业失败故事,而是 AI 医疗当下最真实的缩影:技术跑得快,监管走得慢,夹在中间的往往是那些最想把算法真正送进临床的人。

阿里发 Qwen3.6-Max 当然重要,但更要命的是:AI 的胜负越来越不写在榜单上
阿里把 Qwen3.6-Max 端上桌,表面看是开源继续追闭源,真正新增的信息却更刺眼:今天那种“一张榜单定胜负”的看法,和真实商业价值正在慢慢脱钩。模型分数还重要,但企业掏钱买的越来越不是考试状元,而是能接进工具链、跑进工作流、在复杂环境里少翻车的那一个。

Qwen3.6-27B 开源后,开源大模型开始比部署:27B dense 为何比“更大参数”更重要
阿里通义开源 Qwen3.6-27B,官方称其编程基准已超过上一代 Qwen3.5-397B-A17B,模型体积也从约 807GB 降到 55.6GB。真正新增的看点不只是榜单成绩,而是量化版已有人在本地以 16.8GB 跑起来、速度约 25 tokens/s:开源模型竞争开始更像在比谁更容易进入工作流,而不是谁把参数堆得更高。现阶段证据仍以官方 benchmark 和单次实测为主,足以说明“值得认真试”,还不足以下“全面替代”的结论。

“别闭嘴,继续写”:一位英国开发者对 AI 时代网络写作的反击
英国网页开发者 David Bushell 用一篇标题极具戏剧性的博文,表达了他对生成式 AI、内容平台化和创作降级的强烈不满。但真正有价值的,不是他的愤怒,而是那句反常识的判断:越是在“机器能写一切”的时候,人类越该公开写作、持续发声。

Slack不想只做聊天工具了:Salesforce一口气塞进30个AI功能,真正想抢的是你的工作流
Salesforce 正在把 Slack 从“企业群聊软件”改造成“企业AI操作系统”。这次一口气发布 30 项新功能,表面上是给 Slackbot 升级,实质上是在争夺企业内部最关键的入口:信息流、任务流和决策流。

AI 写作开始露馅了:企业文本越来越顺,判断越来越空
旧稿谈的是 AI 生成内容为什么越来越“水”,这次补进来的新线索,把问题钉得更具体了:企业新闻稿、财报和政府文件里,“It’s not just X — it’s Y”这类句式在两年间大幅冒头,成了高频的 AI/模板化文风信号。它还不足以当成“AI 代笔实锤”,但已经足够说明一件事:组织正在把思考压扁成语气零件,文本更流畅了,信息反而更稀了。

三星把相册变成“平行宇宙生成器”:Galaxy S26 的 AI 修图,正在重写照片的意义
Galaxy S26 把 AI 修图从“润色照片”推进到“改写回忆”这一步:你不只是能修天色、删路人,还能把没出现过的人和没发生过的场景塞进相册里。问题不只在真假,而在手机厂商正把“照片”从记录现实的工具,悄悄变成满足情绪和社交表演的内容生成器。

Cohere把语音识别重新卷了一遍:开源ASR登顶,但真正的战场在企业现场
Cohere发布了开源语音识别模型 Transcribe,并在 Hugging Face 的 Open ASR 榜单上以 5.42% 的平均词错率登顶。这件事的意义不只是“又一个模型更准了”,而是语音识别这项老技术,正在企业 AI 落地的关键环节重新变成基础设施竞争:谁更准、谁更快、谁更容易私有化部署,谁就更有机会吃下真实业务流程。

Alexa+开始替你点外卖:亚马逊要抢的,不只是语音入口
亚马逊把 Alexa+ 接入 Uber Eats 和 Grubhub,看上去是在补齐外卖能力,实际是在把 AI 助手推进到真实交易环节。新线索相比旧稿,补强了两个关键点:一是外卖被当成检验多轮对话和代理执行能力的现实考场,二是账户绑定、历史订单同步和屏幕确认,说明亚马逊并不打算靠“会聊天”取胜,而是靠上下文、闭环和更低出错率来争夺消费入口。

Google把时间序列也做成了“基础模型”:TimesFM开源,AI开始认真学会预测世界
Google Research开源的 TimesFM,看上去不像聊天机器人那样抢眼,却可能是更贴近产业现实的一步:它试图用“基础模型”思路统一处理时间序列预测。对电商补货、能源调度、金融风控和运维监测来说,这类模型的意义,可能比又一个会写段子的AI更直接。

美国人开始接受“AI 当老板”了,但真正被改写的不是管理层,而是打工人的安全感
一项最新民调显示,15%的美国人愿意直接向 AI 上司汇报工作。这个数字看起来不高,却已经足够说明一件事:AI 进入职场,正从“帮你干活”走向“管你干活”。更微妙的是,多数人一边不想被 AI 管,一边又相信 AI 会减少工作机会,这种矛盾情绪,可能才是未来办公室最真实的底色。

一家还没“露脸”的 AI 创企,为什么能在种子轮就拿下 6500 万美元?
企业级 AI Agent 赛道又出现一笔夸张融资:前 Coatue 合伙人 Sri Viswanath 创办的 Sycamore,在种子轮就拿下 6500 万美元。这不只是资本继续押注“AI 代理人”的信号,更说明投资人开始偏爱那些懂大企业、懂基础设施、也懂怎么把 AI 真正落到业务流程里的老兵团队。

别让 AI 替你写作:当生成式工具越来越能说,人反而更该亲自下场
程序员作者 Alex Woods 最近抛出一个并不讨喜、却很有分量的提醒:别让 AI 替你写作。这个观点真正刺中的,不是“AI 写得好不好”这么表层的问题,而是写作原本承担的思考训练和信任建立,正在被一键生成悄悄掏空。

AI开始“看懂”建筑图纸:AnchorGrid上线门洞检测接口,设计院和施工方可能先受益
AnchorGrid 最新开放的门洞检测接口,瞄准的是一个看起来很小、实际上很“脏累苦”的建筑图纸识别环节:从 PDF 平面图里自动找出门的位置。它不是那种会引爆社交媒体的大模型新闻,但对建筑、施工、BIM 和地产科技链条来说,这类垂直能力往往更接近真正能省钱、省时间的 AI。

在 AI 时代,为什么越来越多人又拿起了纸和笔
当知识管理软件越做越复杂,一位作者反而给出了一个有点“反潮流”的答案:真正高效的笔记,未必在屏幕里,而可能在纸上。它提醒我们,在 AI 和数字工具包围一切的今天,思考这件事本身,仍然需要一种更慢、更沉、更不容易分心的介质。

当药物研发开始“先做人再做人”:Mantis Biotech想用数字分身填平医疗数据荒
纽约初创公司 Mantis Biotech 正试图把分散、稀缺、难共享的生物医学数据,变成可计算、可预测的“人体数字分身”。这不只是又一个 AI+医疗 的融资故事,更像是在回答一个老问题:当真实患者数据越来越难拿,药物研发和医学训练还能靠什么往前走?

陶哲轩谈 AI 与数学:机器越来越会想,人类更该想清楚自己为什么而想
菲尔兹奖得主陶哲轩与 Tanya Klowden 发布新论文,讨论 AI 时代里数学方法与人类思维的关系。它最有价值的地方,不在于替 AI 站台,而在于提醒我们:技术进步如果不以“扩展人的理解力”为目标,哪怕再聪明,也可能只是更高效的空转。