人工智能资讯
聚合当前分类下的最新内容,按时间顺序查看第 1 页精选文章。

NVIDIA把Gemma 4塞进8GB Jetson:边缘多模态 Agent能跑了,但离好用还差三道坎
NVIDIA 工程师在 Hugging Face 放出一个可复现的 Gemma 4 本地 VLA 演示:8GB 的 Jetson Orin Nano Super 上,用 Parakeet 做语音识别、Gemma 4 决定是否调用摄像头,再用 Kokoro 语音回复,代码和部署步骤全部公开。真正重要的不是“它能跑”,而是边缘端多模态 agent 已经从炫技视频走到可复现原型;但 8GB 能跑不等于轻松跑,更不等于能直接做成稳定产品。

Qwen3.6-27B 发布:27B 稠密模型冲击旧旗舰,开源模型开始比体积和成本
Qwen 发布 open weight 模型 Qwen3.6-27B,并宣称它在主要代码基准上超过上一代开源旗舰 Qwen3.5-397B-A17B。更关键的是,Hugging Face 体积从约 807GB 降到 55.6GB,Simon Willison 本地实测的 16.8GB GGUF 量化版也已经能跑出像样的 SVG 代码生成。真正值得盯的不是“又一个更强模型”,而是开源竞争正在从拼参数,转向拼可部署性、推理成本和本地控制权。

阿里、OpenAI、小米、谷歌同日发新:AI开始比整条落地链,而不只是模型分数
同一天里,阿里发开源编码模型,OpenAI放出隐私过滤工具模型,小米押注长程 agent,谷歌则把 TPU、模型和企业代理平台打包推进。几条新闻看着分散,实际都在抢同一个入口:谁能把模型、部署、治理和成本更快接进真实业务。对开发者和企业决策者来说,今年更该看的不是榜单高低,而是谁的链路更短、生态更快、锁定更深。

特斯拉把2026年资本开支上调至250亿美元:钱不是花更多了,而是押注公司要换轨
特斯拉把2026年资本开支计划上调到250亿美元,较1月“超过200亿美元”的指引再加50亿美元,也远高于2025年的85亿、2024年的113亿和2023年的89亿美元。公司同时表态,受这轮投入影响,2026年余下时间将转入负自由现金流;但一季度末账上仍有447亿美元现金、现金等价物和短期投资,问题不在缺钱,而在回收期和执行力。钱主要投向AI训练、芯片、数据中心、robotaxi、Optimus和制造扩张,这更像一次商业身份切换,而不只是汽车公司的常规扩产。

Google升级Workspace:争的不是AI按钮,而是办公室里的默认工作层
Google 在 Cloud Next 2026 把 Workspace Intelligence 深度并入 Gmail、Docs、Sheets、Calendar、Chat 和 Drive,让 AI 直接调用工作上下文,去做写作、录入和整理这类杂务。关键不在功能清单,而在一个更现实的交换:数据给得越深,自动化就越强,平台也就越难被绕开。对已用 Workspace 的企业来说,这会先像低摩擦升级;对采购、IT 和合规来说,真正要审的是权限边界,不是演示效果。

OpenAI把 ChatGPT 推进临床:美国医护免费用,真正要抢的是工作流入口
OpenAI推出 ChatGPT for Clinicians,先向经验证的美国医生、执业护士、助理医师和药师免费开放,覆盖临床问答、文书、医学检索、文献综述和继续教育。关键点不在“AI进医疗”这句旧话,而在它开始正面切临床工作流,并试图用免费、评测和合规选项一起占住医生入口。现在还不能把它写成“可替代医生”:产品定位仍是辅助判断,HIPAA/BAA 也只对符合条件的账户开放。

Ars Technica公开AI编辑政策:工具可以进流程,责任不能退出新闻
Ars Technica公布面向读者的生成式AI编辑政策:新闻、评论、分析由人类撰写,AI只能用于受监督的编辑辅助、研究检索和部分视觉制作流程,且不能冒充真实报道材料。真正有价值的,不是它写了多少正确原则,而是把“谁写、谁核验、谁担责”公开成了规则。对科技读者和新闻从业者来说,这提供了一个很实用的判断尺子:看一家媒体谈AI,别只看效率口号,要看署名、核验和责任有没有写清。

X让Grok参与首页推荐,又下线Communities:更顺手,也更可控
X开始把Grok接进首页时间线。iOS 版 Premium 用户可抢先把特定话题钉到 Home 页,由 Grok 结合现有个性化算法筛选内容,Android 也将很快跟进。 几乎同时,X又宣布因“使用下降”在 5 月 6 日下线 Communities,并引导用户转去 XChat 群聊。两件事放在一起看,X在把公开讨论空间做轻,把分发和关系更紧地收回到付费入口、算法推荐和私域聊天里。

Shopify把AI推到接近全员使用,但真正难的已经不是生成代码
Shopify CTO Mikhail Parakhin披露,内部AI工具日活占比已逼近全员覆盖,2025年12月模型能力出现明显拐点后,使用继续加速,公司也基本放开了高端模型的token预算。更值得看的是,Shopify公开的不是单个助手,而是Tangle、Tangent、SimGym这套把数据、实验、仿真和上线流程连起来的内部基础设施。问题同样清楚:token烧得快,不等于工程产出就稳,瓶颈正从生成转向review、测试、发布和回滚。

AI 修 bug 为何总想多改几行:400 个样本显示,问题不在能不能修,在会不会收手
一项基于 400 个 BigCodeBench 程序化造错样本的评测发现,主流 AI 编程模型普遍存在“过度编辑”:bug 能修对,但常常顺手重写更多代码。评测不只看 Pass@1,还看 token-level Levenshtein distance 和 Added Cognitive Complexity,核心问题是“修对了之外,多改了多少”。Claude Opus 4.6 在正确率和最小改动上都领先;GPT-5.4 过度编辑最明显,且正确率并不突出,而一句“尽量保留原代码逻辑”的提示,几乎就能让多数模型明显收敛。

索尼乒乓机器人 Ace 赢球了,但更重要的是:具身智能终于碰到“真球”了
索尼 AI 在《Nature》披露的乒乓球机器人 Ace,已经能在遵守 ITTF 正式规则下与顶尖人类球员对打,并在部分比赛中取胜。真正重要的不是“机器人会打球”这件旧闻,而是感知、预测和控制闭环终于在高速物理世界里跑通了一段。只是这仍是高度定制的单任务系统,离便宜、泛化、可复制的产业化,还有一大截路。

OpenAI 给 Responses API 接上 WebSocket:Agent 竞争开始从模型速度转向工作流摩擦
OpenAI 把 Responses API 的 agent 工作流接入 WebSocket 长连接,接口形态基本不变,但用连接级缓存和增量处理压低了重复校验、重复 tokenization 和工具往返带来的开销。新信息不在“WebSocket”这个词,而在一个更清楚的判断:当模型速度从几十 TPS 走向上千 TPS,决定 agent 体验的越来越不是推理本身,而是 API 编排、工具回路和系统摩擦。

Mary Minno联手Wojcicki姐妹做AI医疗加速器:补科研创业断层,但别把小基金看成解药
Mary Minno推出AI医疗驻留项目Treehub和配套早期基金AI Health Fund,拉来Anne Wojcicki任operating partner、Esther Wojcicki任founding advisor,并有斯坦福生物医学数据科学团队参与。它的卖点很直接:用6个月驻留和5万到15万美元小额支票,把学术研究者往公司化推进一段。这个模式有现实针对性,但医疗创业真正卡住的地方仍是临床验证、医院采购、监管流程和工作流整合,不是再多一个明星顾问名单。

Show HN 投稿翻了三倍,页面却越做越像:AI 没毁产品,先抹平了门面
一项对 500 个最新 Show HN 页面的分析发现:约 21% 的页面触发了 5 项以上常见“AI 味”设计特征,轻度同质化占 46%,真正相对干净的只有 33%。这不等于页面一定由 AI 生成,更不等于项目质量差;它至少说明,LLM 加模板化前端工具,正在把独立开发者的展示页压成一套低成本默认审美。问题不只是好不好看,而是当 everyone can ship,产品表达反而更容易外包给默认值。

AI“金发MAGA护士”在社媒卖软色情赚到钱,暴露的是平台治理的空档
一名化名“Sam”的印度医学生自称,用 Gemini 和 Grok 生成“白人金发MAGA护士”人设,在 Instagram 吸粉,再把流量导向 Fanvue 卖 AI 软色情内容,短时间内赚到数千美元,直到账号因可疑或欺诈活动被封。 关键不在一个人会不会钻空子,而在平台推荐、AI降本和情绪消费凑到了一起:政治身份、性吸引力和 rage bait 被打包成了一套高转化灰色模板。 平台并非没有规则,问题是规则落在后面,流量和收钱跑在前面;被消耗掉的,最后还是用户对“这到底是不是真人”的基本信任。

10x Science 融资 480 万美元:AI 能批量生分子,但药企真正缺的是把它们测清楚
10x Science 宣布完成 480 万美元种子轮融资,想用“化学/生物规则算法 + AI”加速质谱数据解析,帮助药企和研究者判断哪些候选分子值得继续推进。重点不在又一家生物 AI 公司拿到钱,而在药物研发的瓶颈正在后移:前端生成越来越快,后端表征、验证和可追溯分析越来越慢。我的判断是,这更像卖铲子的基础设施机会,但成败要看三件事:结果准不准、流程能不能审计、系统能不能进药企现有工作流。

DeepMind联手咨询公司推企业AI:争的已不是模型分数,而是落地入口
Google DeepMind宣布与全球咨询公司合作,加速企业采用AI。已知事实很有限:原文没有披露具体伙伴名单、金额、签约规模,也没有发布新模型;能确认的重点,是它在借咨询渠道把Gemini等前沿AI更快送进企业采购和实施流程。 这件事的重要性不在技术突破,而在企业入口。大模型竞争走到今天,能不能进预算、过合规、接系统、有人背书,往往比单次模型跑分更决定订单去向。

OpenAI 发布 ChatGPT Images 2.0:文生图开始抢设计交付,不只是在拼好看
OpenAI 于 2026 年 4 月 21 日发布 ChatGPT Images 2.0,并直接集成进 ChatGPT。官方重点展示的不是艺术图,而是海报、杂志页、多语言广告和连续漫画这类更接近真实工作的输出。 真正重要的变化,不是模型又会画多少风格,而是它开始补文生图最影响交付的短板:文字渲染、版式控制、角色与风格连续性。它会先压缩中低端视觉生产,但离稳定进入专业工作流,还有合规、版权、真实性和复现率几道关没过。

当维护者说“不想再收陌生 PR”:AI 正在改写开源协作的默认规则
一位开源维护者公开表示,LLM 让写代码更便宜后,他越来越不愿合并陌生贡献者的 PR。理由很实际:安全审查、风格磨合和沟通往返的成本,已经常常高过自己直接实现。 更值得看的是协作重心在变。对不少小项目来说,稀缺项不再是“写出代码”,而是理解系统、做设计、做 review、承担后果。效率可能提高,但维护权也会更集中。

AI还不是美国中期选举头号议题,但已经在地方政治里变成真账单
美国选民普遍担心AI。Ipsos今年调查显示,两党中都有超过60%支持政府为经济稳定和公共安全监管AI,并放慢其发展。问题是,这种担忧还没压过经济、移民等全国议题,AI暂时还不是2026年中期选举的头号投票理由。 真正先起火的是地方政治。Data Center Watch称,全美因反对而被阻挡或延迟的数据中心开发规模已达640亿美元,公开反对者两党都有。AI正在沿着就业、能源、儿童安全和社区开发冲突进入选战;一旦代价落到岗位、电价、地价和电网上,反弹就不再只是情绪。

OpenAI 的 Images 2.0 变强了,但真正关键的是它终于把图里的字做到了接近可用
OpenAI 上线 ChatGPT Images 2.0,最醒目的进步不是更会画,而是图里的文字、UI 元素和多语言排版终于接近可用。和 2024 年 DALL-E 3 还常把菜单写成乱码相比,这一代更像能进工作流的工具。更值得盯住的是,OpenAI 对底层路线语焉不详,这说明竞争重点正在从演示效果转向可交付能力。