最新科技资讯 第153页
聚合 AI、科技、商业、硬件与开发工具的最新内容,按时间顺序查看第 153 页精选文章。

NVIDIA把超声AI推到原始通道数据层,难点不只是模型
NVIDIA与Siemens Healthineers发布NV-Raw2Insights-US,输入不是B超图像,而是超声探头的raw ultrasound channel data。它首个应用是估计患者个体化声速,并用于自适应聚焦,不是自动诊断疾病。目前项目仍处研究开发阶段,未获美国或其他国家销售许可,真正门槛在原始数据链路、设备接入和监管定义。

微软 VibeVoice 不只是本地转写更快:真正变了的是开发者入口
VibeVoice 本地转写一小时播客可以跑到 8 分 45 秒,这个速度已经足够让内容团队心动;但新线索显示,微软更大的动作不是单点性能,而是把 VibeVoice-ASR 接入 Hugging Face Transformers,并用开源、vLLM、finetuning 和 MIT license 降低集成门槛。我的判断是:VibeVoice 的分水岭不在 demo 有多炫,而在它能不能从“能跑”变成“好接、好管、能进生产”。

YouTube 把 AI 塞进 Shorts:答案先到,素材也要被改写了
YouTube 一边测试 Ask YouTube 这类 AI 搜索,让用户先拿答案;一边在 Shorts 里上线 Gemini Omni 驱动的 reimagine 混剪,让用户直接改写别人的短视频。新变量不只是“AI 创作更方便”,而是创作者同时失去两件东西:流量入口和影像语境的控制权。

Talkie 这个“1930 年大模型”,拆的是今天 AI 的底牌
Talkie 团队发布 talkie-1930-13b:13B 参数、约 260B 个 1931 年前英文 token 训练,并开放 base 与对话版 checkpoint。它的重点不是复古聊天,而是提供一个少见的“时间隔离”对照组,用来检验泛化、数据污染、OCR 质量和后训练塑形。对评测团队和数据治理关注者来说,真正该看的是它和现代 FineWeb twin 的差距在哪里、差距又被哪些时代错位放大。

一位 CS 教授写给学生:别急着给坏系统添燃料
Hendrix College 计算机科学与数学教师 Brent A. Yorgey 写信给学生,批评软件行业在就业、AI 叙事、知识产权、监控、资源消耗和伦理激励上正在失控。他没有劝退 CS,而是在提醒学生:学会写代码之前,也要先知道哪些系统不该帮忙加速。对计算机学生和新程序员来说,这封信最现实的价值是提前划清边界,而不是等进了项目才被排期和绩效推着走。

Applied Intuition 押注 Physical AI:移动机器缺的不是 Demo,是 Android 层
Applied Intuition 在访谈中把自己放到 Physical AI 平台位置:从自动驾驶仿真和数据工具,扩到机器操作系统、验证工具和自治模型。真正值得看的不是“AI 上车”这个词,而是它能不能把智能做成低延迟、可验证、可更新的工程底座。对车企、机器人公司和工业设备厂商来说,这决定了自研、采购和平台迁移的节奏。

FreeBSD 新书《Integrated by Design》发布:72 小时里卡住的四个环节
Vivian Voss 在 2026 年 4 月 23 日世界读书日发售 FreeBSD 新书《Integrated by Design》,精装和平装已发货,Kindle 仍在 Amazon 审核队列。上线前 72 小时暴露出字体、封面、欧洲定价和 Kindle 审核四类问题。它说明独立技术出版的难点不只在写作和排版,还在平台规则、实物印刷和价格传播之间反复校准。

Ubuntu 加 AI,真正的雷不是功能,而是没有总闸
Canonical 计划在 Ubuntu 26.10 先以 opt-in preview 方式引入 AI 功能,包括语音、排障和自动化代理,但不会提供全局 AI kill switch。Linux 用户的反弹不只是怕 AI,而是怕操作系统把“可控”这份旧契约慢慢改成“默认接受”。

多伦多首例 SMS Blaster 案:车后箱里的伪基站,把短信信任撬开了
多伦多警方逮捕3名涉嫌使用 SMS blaster 的男子,称这是加拿大已知首例此类案件;设备被装在车后,从市中心向数万台设备推送钓鱼短信。真正要紧的不是诈骗短信又换了话术,而是旧2G网络和移动伪基站把城市通信变成了可移动攻击面。

AI 帮人自己打官司后,美国联邦法院的队可能更长了
一篇预印本研究称,生成式 AI 普及后,美国联邦法院非囚犯民事案件中,自行诉讼占比从长期约 11% 升至 2025 年的 16.8%。 更该看的不是案子多了多少,而是自行诉讼案件的案内活动量较 AI 普及前上升 158%,动议、文件和程序管理都在变重。 这项研究不能证明 GPT-4 直接导致个案增长,但它提醒了一件事:AI 降低司法入口成本时,法院的人工判断资源没有同步变多。

美国消费者被社交媒体诈骗卷走21亿美元:平台入口的账,该算了
FTC 报告称,2025 年美国消费者报告的社交媒体诈骗损失达 21 亿美元,相关损失增长 8 倍,并超过短信、邮件等接触渠道。更关键的变化是,诈骗正在贴着社交平台的广告、推荐和关系链生长。对重度社媒用户来说,最危险的不只是陌生私信,而是看起来像正常广告、正常社群、正常关系的入口。

《万智牌:竞技场》员工组工会,威世智要回答一个硬问题
2026年4月27日,《万智牌:竞技场》团队员工宣布组建 United Wizards of the Coast - CWA,并称前一周已有绝大多数合格员工签署工会授权卡。员工要求威世智领导层自愿承认工会,并进入集体谈判,议题指向待遇、工作条件、劳动权利与福祉。这件事的看点不在口号,而在 Hasbro/威世智是否愿意把数字业务背后的劳动者当长期资产来谈。

ASU 的 AI 课程切片争议:别盯着阴谋论,真正的问题是教师被默认素材化
亚利桑那州立大学测试 ASU Atomic,把教师讲座切成短视频,再由 AI 生成学习模块,多名教师称事前不知情,也没有明确退出机制。比起早先围绕页面配图、AI 阴谋论的争吵,后续报道补上了更关键的事实:错误转写进入课程文本和测验,外部邮箱一度可注册试用,问题已经从“工具准不准”变成“谁有权把教学劳动重新包装”。

18赫兹次声会抬高压力,但别急着把鬼屋都交给科学解释
《Frontiers in Behavioral Neuroscience》一项小样本实验显示,人耳听不到的18赫兹次声,可能让皮质醇升高,并让人更易怒、对音乐体验更负面。它补强了“闹鬼感”背后的环境解释,但证据还只够说明低频噪声值得被测量,远远不能把所有超自然体验归因于次声。

Google给五角大楼开了AI接口,真正敏感的是“任何合法用途”
据The Information报道,Google与美国国防部签署涉密AI协议,允许后者将Google AI模型用于“任何合法政府目的”。这条线索比“AI进入军方网络”更关键:合同里也许有反监控、反自主武器措辞,但如果Google没有审查、暂停和否决权,护栏就很难从原则变成刹车。

特朗普要求 ABC 解雇 Jimmy Kimmel:问题不只是一句冒犯玩笑
特朗普要求 Disney 和 ABC 立即解雇 Jimmy Kimmel,起因是 Kimmel 在周四短剧中称梅拉尼娅像“expectant widow”,随后周六白宫记者晚宴发生针对特朗普的枪击未遂。现有材料不能证明这句玩笑与枪击未遂有因果关系,真正的争议是:总统把它定性为“despicable call to violence”后,是否在用权力压媒体公司的用人判断。对 ABC、Disney 和深夜秀团队来说,接下来要看的不是段子好不好笑,而是公司会按编辑标准处理,还是按政治压力处理。

Super ZSNES 回来了:老模拟器复活,真正的争议是“增强版”该不该存在
ZSNES 两位原开发者重聚,发布完全重写的 Super ZSNES,核心卖点是更准确的 CPU/音频核心、GPU 驱动 PPU、高清 Mode 7 和逐游戏增强。它仍是早期版本,特殊芯片、兼容性和性能优化都没做完,不能当成熟替代品。真正值得看的是路线选择:复古模拟器正在从“尽量还原原机”,分出一条“可关闭、可选择的现代增强”路线。

Easyduino 开源 KiCad 开发板工程:把经典板型整理成可打样、可改板的工程包
Easyduino 在 GitHub 开源了一组常见微控制器开发板 PCB 工程,覆盖 UNO、Nano、ESP32、ESP32 S3、RP2040 和 STM32F103 Bluepill。它的价值不在发明新板,而在把分散在不同工具和年代里的经典设计,统一成 KiCad 工程和生产文件。使用时要看边界:部分板型仍待订购测试,复刻程度也不等同原版。

Choco把OpenAI API接进食品订货台:AI agent开始接管最碎的订单入口
Choco将OpenAI API嵌入订单系统,用OrderAgent和VoiceAgent把邮件、短信、图片、文档和电话订单转成可进入ERP的结构化订单。这个案例的价值不在“AI能听懂订单”,而在它尝试处理SKU映射、单位偏好、配送习惯等隐性上下文,说明AI agent正在进入传统分销的执行环节。风险也很清楚:错误率仍是1%至5%以下区间,必须依赖阈值、监控和人工介入,不能被解读成完全无人值守。

OpenAI 开源 Symphony 规范:编码代理开始从会话走向任务流水线
OpenAI 开源的 Symphony 不是一个完整托管平台,而是一套用 Linear 等 issue tracker 调度 Codex 编码代理的规范。它的重点不是让单个代理更会写代码,而是把工程师盯多个会话的模式,改成按任务并行、失败可恢复、结果再审核的流程。OpenAI 提到部分团队前三周 landed PR 增加 500%,但这只是内部观察,能否复制取决于仓库、测试、CI、文档和安全边界。

Google Meet 语音翻译登陆移动端:科幻感有了,可靠性还没到
Google Meet 的语音翻译功能开始向移动设备推出,会议中可把发言翻译成对方偏好语言,并以近似原声朗读。它已经能展示实时跨语言会议的雏形,但从早期试用看,距离稳定工作流还有明显距离。