AI Know 早报

2026.05.17 星期日
📡 全球 AI 动态 · 热点追踪 · 智能解读
📋 今日新闻摘要

今日共收录 30 条全球AI领域动态,涵盖模型发布 3条、产品更新 7条、行业动态 5条、论文研究 2条、技巧观点 13条。 头条聚焦:MagicPath与Codex深度整合,设计开发流程合二为一、工具使用代理认知与行动脱节机制研究、美国开始出现人工智能相关岗位的大规模裁员

💡 观点分析
🧠 模型发布
社区协作再创佳绩,vLLM支持万亿级模型
模型发布X:蚂蚁百灵 (@AntLingAGI)

又一次Day0协作,又一次社区胜利。感谢@vllm_project团队始终可靠的支持~ 🫡🫡

阅读原文 ↗
Ring-2.6-1T开源并上线OpenRouter,专为智能体工作流设计
模型发布X:蚂蚁百灵 (@AntLingAGI)

Ring-2.6-1T模型现已开源,并上线OpenRouter平台,5月底前享有75%折扣。该模型由AntLingAGI开发,是一个为现实世界智能体构建的万亿级推理模型,其核心设计目标不仅是回答问题,更是执行任务。它专注于规划步骤、使用工具、维持上下文和完成复杂工作流,具备强大的智能体执行能力和高推理模式,并采用了Async RL与IcePop训练方法。

阅读原文 ↗
SANA-WM:一个用于生成1分钟720p视频的26亿级开源世界模型
模型发布Hacker News 热门(buzzing.cc 中文翻译)

NVIDIA研究团队发布了SANA-WM,这是一个参数规模达26亿的开源世界模型,专门用于生成长达1分钟、分辨率为720p的视频。该模型已在GitHub页面开源,旨在推动高质量长视频生成的研发。其在Hacker News社区获得了107点热度,显示出业界对该技术进展的关注。

阅读原文 ↗
🛠️ 产品更新
Codex新增键盘快捷键自定义功能
产品更新X:Tibo (@thsottiaux)

不知为何我们选择周六发布更新,但Codex确实迎来了一系列优化。 这些改进让使用体验愉悦许多,实在不该拖到周二再公布。 键盘快捷键现已支持自定义。 根据实际工作方式配置Codex,通过设置调整快捷键,不必再迁就默认设定。

阅读原文 ↗
按需定制快捷键,优化工作流效率
产品更新X:OpenAI Developers (@OpenAIDevs)

处理大家的反馈让我们感到太有趣了。 (请继续反馈。) 键盘快捷键现已支持自定义。 围绕你的实际工作方式设置 Codex,然后通过设置调整快捷键,无需再适应我们的默认配置。

阅读原文 ↗
Notion推出开发者平台及CLI工具
产品更新X:Oran Ge (@oran_ge)

Notion正式推出开发者平台,核心组件包括Notion CLI终端工具、Workers计算服务、数据库同步功能以及多种Agent工具与API。平台旨在让开发者更便捷地在Notion基础设施上运行代码、连接外部数据源并构建自动化工作流。未来,即使非开发者也能通过AI Agent在Notion上构建应用。

阅读原文 ↗
Claude Code v2.1.143 版本更新:插件管理与用户体验增强
产品更新Claude Code:GitHub Releases(RSS)

Claude Code 发布 v2.1.143 版本,重点增强了插件管理功能,包括强制执行插件依赖关系,并新增了插件市场的预估上下文成本显示。为方便直接编辑工作副本,增加了 `worktree.bgIsolation: "none"` 设置。多项体验得到改进:后台会话唤醒后保留模型与努力级别设置;Windows PowerShell 工具默认绕过执行策略;`claude agents` 命令新增多个参数以配置默认会话。此外,本次更新修复了大量错误,包括修复损坏的 `.credentials.json` 文件导致 CLI 启动卡住、Windows Terminal 中的右键粘贴问题、后台会话错误捕获 IDE 文件引用,以及 macOS 上后台作业读取特定目录文件的权限错误等。

阅读原文 ↗
Krea 2正式上线面向专业用户
产品更新X:Krea AI (@krea_ai)

从今天起,Krea 2 正式为 Pro 用户上线。

阅读原文 ↗
语义代码审查工具clawpatch发布
产品更新X:Peter Steinberger (@steipete)

🩹 clawpatch 0.1.0 已上线: Clawpatch 将代码库映射成语义功能切片,审查其中的错误和质量问题,并记录经过验证的明确修复尝试。 您会发现它能发现的问题之多令人惊讶。 npm install -g clawpatch https://clawpatch.ai

阅读原文 ↗
Runway Agent一键生成完整广告
产品更新X:Runway (@runwayml)

Runway Agent 让你仅需一次会话,就能从产品照片和想法转变为完全制作完成的广告。 立即通过下方链接开始体验。

阅读原文 ↗
📡 行业动态
美国开始出现人工智能相关岗位的大规模裁员
行业动态Hacker News 热门(buzzing.cc 中文翻译)

美国人工智能相关岗位正出现大规模裁员。根据彭博社报道,受AI影响的职位开始经历严重的就业岗位流失。这一趋势表明AI技术对劳动力市场的冲击已从理论讨论进入现实阶段,具体裁员数字和涉及的行业领域在进一步显现中。

阅读原文 ↗
杭州基地启用,机器人有了国家级职业技能训练场
行业动态IT之家(RSS)

国家人工智能应用中试基地(具身智能)5月16日在浙江杭州挂牌启用,为机器人提供国家级职业技能训练场。该基地是集场景体验、技术展示、研发合作、产业赋能于一体的综合性平台,旨在推动具身智能技术从实验室迈向现实应用。杭州市于5月1日施行首部具身智能机器人地方性法规,支持核心研发、平台建设和场景开放。目前杭州已集聚机器人产业相关企业700余家,2025年具身智能产业集群产值达1068亿元。

阅读原文 ↗
研究人员利用Anthropic Mythos工具构建macOS内核漏洞,绕过苹果M5芯片内存完整性执行安全系统
行业动态X:Kim (@kimmonismus)

三名研究人员借助Anthropic的Mythos工具,成功开发出一个可绕过苹果M5芯片内存完整性执行(MIE)安全机制的macOS内核漏洞利用程序。MIE是苹果耗时五年、投入巨资为M5和A19芯片打造的旗舰安全功能,旨在彻底消除内存损坏漏洞。研究团队于4月25日发现漏洞,5月1日即完成开发,并亲自前往苹果园区提交报告。该攻击采用纯数据攻击方式,无需操纵指针,仅通过非特权用户的标准系统调用即可获取根权限。完整技术报告将在苹果发布补丁后公开。

阅读原文 ↗
突发!OpenAI 大规模重组,总裁 Brockman 夺权挂帅
行业动态IT之家(RSS)

OpenAI宣布进行史上最大规模重组,将ChatGPT、Codex和API三大核心产品线合并为统一组织。联合创始人兼总裁Greg Brockman正式全面接管产品战略,成为实际掌权者,而ChatGPT原负责人Nick Turley被调离核心岗位。此次重组旨在整合资源,聚焦"智能体时代",并秘密开发集成多项功能的"超级应用"桌面端产品。与此同时,竞争对手Anthropic估值飙升至9000亿美元,使OpenAI面临严峻挑战。

阅读原文 ↗
OpenAI 与马耳他合作,向所有公民提供 ChatGPT Plus
行业动态OpenAI:官网动态(RSS · 排除企业/客户案例)

OpenAI 与马耳他政府达成合作,将向该国所有公民免费提供 ChatGPT Plus 订阅服务。此次合作旨在扩大人工智能技术的普及范围,并包含面向公民的 AI 技能实践培训,以帮助民众负责任地使用 AI。该计划是国家级大规模推广 ChatGPT Plus 的首例,预计将提升马耳他全民的 AI 素养与应用能力。

阅读原文 ↗
📄 论文研究
Δ-Mem:适用于大型语言模型的高效在线内存
论文研究Hacker News 热门(buzzing.cc 中文翻译)

研究人员提出了Δ-Mem,一种专为大型语言模型设计的高效在线内存系统。该系统通过仅存储和更新模型激活的增量变化,而非完整的激活状态,显著降低了内存占用。实验表明,Δ-Mem能将内存使用量减少高达70%,同时保持模型输出的质量基本无损。这一方法有助于在资源受限的环境中部署和运行大规模语言模型,提升其在线推理和持续学习场景下的可行性。

阅读原文 ↗
智能体驱动系统Articraft实现3D资产生成自动化,开源万件数据集降低门槛
论文研究X:Berry Xia (@berryxia)

剑桥大学团队推出Articraft,这是一个由智能体驱动的编码系统,能全自动生成带关节、可运动的交互式3D资产。系统通过AI智能体自主编写代码、执行并接收物理反馈迭代优化,将以往需数日甚至数周的创作过程极大简化。团队同时开源了Articraft-10K数据集,包含超1万个物体,覆盖250个类别,所有资产均仿真就绪。此举显著降低了机器人训练和物理AI领域对高质量3D资产的数据门槛,为解决"数据饥渴"问题提供了高效的自动化方案。

阅读原文 ↗
💡 技巧观点
MagicPath与Codex深度整合,设计开发流程合二为一
技巧观点X:Berry Xia (@berryxia)

MagicPath AI CEO @skirano 演示了其产品与Codex的深度整合。用户现可将MagicPath作为原生画布直接在Codex中运行,通过拖拽设计UI,Codex能实时感知项目并自动生成、编辑代码,实现设计与开发的无缝衔接,无需在Figma和IDE间切换。安装简便,只需在Codex中粘贴一条命令即可完成配置。此举将"设计-开发-迭代"流程整合于单一窗口,显著缩短了从创意到可运行应用的距离。

阅读原文 ↗
工具使用代理认知与行动脱节机制研究
技巧观点X:Elvis Saravia (@omarsar0, DAIR.AI)

该可解释性论文聚焦工具使用代理,通过探测隐藏状态发现模型常能识别应调用工具,但实际调用失败,不匹配率达26%-54%。问题完全集中于认知到行动的过渡阶段,而非认知本身。内部探测方向可解码,但后期层的最后令牌机制使信号旋转,几乎与产生的行动正交。研究旨在预测干预措施效果,指出常见归因如提示或训练不足可能忽略后期层几何结构,这为工具使用提示A/B测试中的性能上限提供了合理解释。

阅读原文 ↗
RLVR 可能在科学领域格外糟糕
技巧观点Dwarkesh Patel:Podcast & Blog(RSS)

RLVR(强化学习与验证)在科学理论验证中可能表现出不成比例的缺陷。科学理论的验证循环周期长达数十年甚至数个世纪,且当前被视为更优的理论实际上常会做出更差的预测。这一矛盾揭示了基于短期反馈的强化学习范式与科学探索长期性、复杂性之间的根本冲突,凸显了现有AI方法在应对科学发现这类超长反馈周期任务时存在的结构性局限。

阅读原文 ↗
Eric Jang分享从零构建AlphaGo的经历与见解
技巧观点X:Marc Andreessen (@pmarca, a16z)

Eric Jang在过去几个月从零开始实现AlphaGo,这是2016年激发他进入深度学习的AI突破。他最初理解AlphaGo为"通过自我对弈训练的搜索增强深度神经网络",但通过亲手构建获得了更深层次的理解。他指出,前沿深度学习研究虽昂贵,但特定能力的实现成本下降迅速;在2026年,训练强大围棋AI仅需几千美元租赁算力,无需DeepMind级别的资源。他荣幸受邀在播客中分享这一过程,并提供了详细教程和代码,同时谦虚自称围棋与AlphaGo学徒,对任何事实错误负责。

阅读原文 ↗
最新开源成果(#21):开源模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。
技巧观点Nathan Lambert:Interconnects(RSS)

本月开源AI模型领域迎来密集发布,包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新,反映出开源社区当前高速迭代的竞争态势。

阅读原文 ↗
Show HN: 烧吧,宝贝,烧吧(那些代币)
技巧观点Hacker News 热门(buzzing.cc 中文翻译)

开发者发布了一个名为"烧吧,宝贝,烧吧"的开源项目,旨在通过销毁代币来应对加密货币领域的通胀问题。该项目提供了一个工具,允许用户主动销毁自己持有的代币,从而减少总供应量。此举可能提升剩余代币的稀缺性与潜在价值。项目已在GitHub上开源,并在Hacker News上获得了100点的社区热度。

阅读原文 ↗
Anthropic《Founder's Playbook》:AI提高创业失败率的警示
技巧观点X:Berry Xia (@berryxia)

Anthropic发布内部手册《Founder's Playbook》,核心观点是AI(如Claude Code)将提高创业失败率,而非降低。手册指出,AI能快速生成原型,易使创始人混淆"能运行"与"有市场需求",并通过确认偏误和研究引擎强化错误想法。它将创业分为Idea、MVP、Launch、Scale四阶段,剖析AI放大的风险:如原型不等于验证、Agentic技术债、创始人成为决策瓶颈等。最终结论是,AI极大降低执行成本,使得判断力成为最稀缺资源,真正护城河在于将垂直领域知识结构化沉淀为专属Skills。

阅读原文 ↗
Codex实现多设备远程控制与上下文共享
技巧观点X:歸藏 (@op7418)

Codex除了通过ChatGPT连接和远程控制外,还能控制另一台电脑,实现在ChatGPT上直接管理多台设备而无需切换,只需切换项目即可访问不同设备的上下文和文件。引用推文补充,此功能还支持通过远程SSH设置其他VMs等,增强了多设备协作的灵活性和实用性。

阅读原文 ↗
藏师傅PPT Skills更新,AI自动美化截图
技巧观点X:歸藏 (@op7418)

藏师傅PPT Skills产品更新,新增截图美化功能。该功能无需消耗GPT-Image 2.0资源,即可根据用户截图的大小、长宽比以及当前PPT的模板类型和颜色主题,自动匹配合适的背景图,实现类似CleanShot X等专业软件的截图美化效果。AI还能处理过长等有问题的图片,例如将其自动裁剪并排成两列展示。

阅读原文 ↗
无视令牌成本,用百个AI实例自动化驱动开源项目
技巧观点X:Peter Steinberger (@steipete)

作者在OpenClaw项目中大规模运用AI,探索在"令牌成本无关紧要"的未来如何构建软件。团队持续运行约100个Codex实例,自动化处理多项核心工作:审查代码与安全问题、去重归类议题、自动重现复杂测试环境并录制验证视频、从会议讨论中主动创建任务、过滤垃圾评论以及监控性能回归。通过clawpatch.ai等工具将项目拆分为功能单元进行审查,并整合Vercel DeepSec等进行安全分析。整套自动化体系使得项目能够以极精简的团队高效运作。

阅读原文 ↗
英伟达CEO称技工前景优于计算机科学毕业生
技巧观点X:Kim (@kimmonismus)

英伟达CEO Jensen Huang在卡内基梅隆大学告诉2026届计算机科学毕业生,电工、水管工等技工比他们更有前景。数据支持这一观点:Randstad分析显示技工需求增长是白领职位的三倍,机器人技术员职位增长107%,而斯坦福研究发现AI相关职位早期就业下降16%。顶级电工年薪超10.6万美元,无需学位负债。科技公司今年投资7000亿美元建设数据中心,全球到2030年预计达7万亿美元,这些基础设施依赖人力完成,但制造业面临劳动力短缺,每100名新工人进入就有102人离开。AI时代最大赢家是能建设数据中心的技工,而非提示工程师。

阅读原文 ↗
AI助手Sai化身虚拟同事,自主完成深度研究
技巧观点X:Kim (@kimmonismus)

AI工具Sai被设计为拥有独立桌面的"虚拟同事",而非仅提供聊天窗口。用户可向其下达"深度研究某主题"等指令后离线,Sai会在安全的工作空间内自主操作:打开标签页、点击应用、阅读并交叉引用资料、做笔记,其工作方式类似人类研究员。任务完成后,它会整理好引用来源,并在执行任何潜在风险操作前请求用户批准。这展示了"始终在线"的计算机使用代理的实际形态。

阅读原文 ↗
杨立昆访谈:剖析LLM局限,畅谈AI未来与创业新途
技巧观点X:Yann LeCun (@ylecun)

在Unsupervised Learning播客中,AI先驱杨立昆阐述了其对大型语言模型局限性的反主流观点,并探讨了机器人技术的发展路径。他解释了离开Meta的原因,以及与Geoff Hinton、Yoshua Bengio在图灵奖观点上的重大分歧。访谈还涵盖了他对2027年的预测、新公司AMI对世界模型的押注,并将OpenAI和Anthropic比作Sun Microsystems。此外,他建议博士生停止研究LLM,并分享了对AI安全、突破性研究发生机制以及Meta FAIR得失的尖锐见解。

阅读原文 ↗