AI Know 早报 · 2026.05.17

📋 今日新闻摘要

今日共收录 30 条全球AI领域动态，涵盖模型发布 3条、产品更新 7条、行业动态 5条、论文研究 2条、技巧观点 13条。头条聚焦：MagicPath与Codex深度整合，设计开发流程合二为一、工具使用代理认知与行动脱节机制研究、美国开始出现人工智能相关岗位的大规模裁员

💡 观点分析

模型竞赛持续升温，今日发布3款新模型
生态工具持续繁荣，7款产品/工具更新上线

🧠 模型发布

社区协作再创佳绩，vLLM支持万亿级模型

模型发布X：蚂蚁百灵 (@AntLingAGI)

又一次Day0协作，又一次社区胜利。感谢@vllm_project团队始终可靠的支持~ 🫡🫡

阅读原文 ↗

Ring-2.6-1T开源并上线OpenRouter，专为智能体工作流设计

模型发布X：蚂蚁百灵 (@AntLingAGI)

Ring-2.6-1T模型现已开源，并上线OpenRouter平台，5月底前享有75%折扣。该模型由AntLingAGI开发，是一个为现实世界智能体构建的万亿级推理模型，其核心设计目标不仅是回答问题，更是执行任务。它专注于规划步骤、使用工具、维持上下文和完成复杂工作流，具备强大的智能体执行能力和高推理模式，并采用了Async RL与IcePop训练方法。

阅读原文 ↗

SANA-WM：一个用于生成1分钟720p视频的26亿级开源世界模型

模型发布Hacker News 热门（buzzing.cc 中文翻译）

NVIDIA研究团队发布了SANA-WM，这是一个参数规模达26亿的开源世界模型，专门用于生成长达1分钟、分辨率为720p的视频。该模型已在GitHub页面开源，旨在推动高质量长视频生成的研发。其在Hacker News社区获得了107点热度，显示出业界对该技术进展的关注。

阅读原文 ↗

🛠️ 产品更新

Codex新增键盘快捷键自定义功能

产品更新X：Tibo (@thsottiaux)

不知为何我们选择周六发布更新，但Codex确实迎来了一系列优化。这些改进让使用体验愉悦许多，实在不该拖到周二再公布。键盘快捷键现已支持自定义。根据实际工作方式配置Codex，通过设置调整快捷键，不必再迁就默认设定。

阅读原文 ↗

按需定制快捷键，优化工作流效率

产品更新X：OpenAI Developers (@OpenAIDevs)

处理大家的反馈让我们感到太有趣了。（请继续反馈。）键盘快捷键现已支持自定义。围绕你的实际工作方式设置 Codex，然后通过设置调整快捷键，无需再适应我们的默认配置。

阅读原文 ↗

Notion推出开发者平台及CLI工具

产品更新X：Oran Ge (@oran_ge)

Notion正式推出开发者平台，核心组件包括Notion CLI终端工具、Workers计算服务、数据库同步功能以及多种Agent工具与API。平台旨在让开发者更便捷地在Notion基础设施上运行代码、连接外部数据源并构建自动化工作流。未来，即使非开发者也能通过AI Agent在Notion上构建应用。

阅读原文 ↗

Claude Code v2.1.143 版本更新：插件管理与用户体验增强

产品更新Claude Code：GitHub Releases（RSS）

Claude Code 发布 v2.1.143 版本，重点增强了插件管理功能，包括强制执行插件依赖关系，并新增了插件市场的预估上下文成本显示。为方便直接编辑工作副本，增加了 `worktree.bgIsolation： "none"` 设置。多项体验得到改进：后台会话唤醒后保留模型与努力级别设置；Windows PowerShell 工具默认绕过执行策略；`claude agents` 命令新增多个参数以配置默认会话。此外，本次更新修复了大量错误，包括修复损坏的 `.credentials.json` 文件导致 CLI 启动卡住、Windows Terminal 中的右键粘贴问题、后台会话错误捕获 IDE 文件引用，以及 macOS 上后台作业读取特定目录文件的权限错误等。

阅读原文 ↗

Krea 2正式上线面向专业用户

产品更新X：Krea AI (@krea_ai)

从今天起，Krea 2 正式为 Pro 用户上线。

阅读原文 ↗

语义代码审查工具clawpatch发布

产品更新X：Peter Steinberger (@steipete)

🩹 clawpatch 0.1.0 已上线： Clawpatch 将代码库映射成语义功能切片，审查其中的错误和质量问题，并记录经过验证的明确修复尝试。您会发现它能发现的问题之多令人惊讶。 npm install -g clawpatch https：//clawpatch.ai

阅读原文 ↗

Runway Agent一键生成完整广告

产品更新X：Runway (@runwayml)

Runway Agent 让你仅需一次会话，就能从产品照片和想法转变为完全制作完成的广告。立即通过下方链接开始体验。

阅读原文 ↗

📡 行业动态

美国开始出现人工智能相关岗位的大规模裁员

行业动态Hacker News 热门（buzzing.cc 中文翻译）

美国人工智能相关岗位正出现大规模裁员。根据彭博社报道，受AI影响的职位开始经历严重的就业岗位流失。这一趋势表明AI技术对劳动力市场的冲击已从理论讨论进入现实阶段，具体裁员数字和涉及的行业领域在进一步显现中。

阅读原文 ↗

杭州基地启用，机器人有了国家级职业技能训练场

行业动态IT之家（RSS）

国家人工智能应用中试基地（具身智能）5月16日在浙江杭州挂牌启用，为机器人提供国家级职业技能训练场。该基地是集场景体验、技术展示、研发合作、产业赋能于一体的综合性平台，旨在推动具身智能技术从实验室迈向现实应用。杭州市于5月1日施行首部具身智能机器人地方性法规，支持核心研发、平台建设和场景开放。目前杭州已集聚机器人产业相关企业700余家，2025年具身智能产业集群产值达1068亿元。

阅读原文 ↗

研究人员利用Anthropic Mythos工具构建macOS内核漏洞，绕过苹果M5芯片内存完整性执行安全系统

行业动态X：Kim (@kimmonismus)

三名研究人员借助Anthropic的Mythos工具，成功开发出一个可绕过苹果M5芯片内存完整性执行（MIE）安全机制的macOS内核漏洞利用程序。MIE是苹果耗时五年、投入巨资为M5和A19芯片打造的旗舰安全功能，旨在彻底消除内存损坏漏洞。研究团队于4月25日发现漏洞，5月1日即完成开发，并亲自前往苹果园区提交报告。该攻击采用纯数据攻击方式，无需操纵指针，仅通过非特权用户的标准系统调用即可获取根权限。完整技术报告将在苹果发布补丁后公开。

阅读原文 ↗

突发！OpenAI 大规模重组，总裁 Brockman 夺权挂帅

行业动态IT之家（RSS）

OpenAI宣布进行史上最大规模重组，将ChatGPT、Codex和API三大核心产品线合并为统一组织。联合创始人兼总裁Greg Brockman正式全面接管产品战略，成为实际掌权者，而ChatGPT原负责人Nick Turley被调离核心岗位。此次重组旨在整合资源，聚焦"智能体时代"，并秘密开发集成多项功能的"超级应用"桌面端产品。与此同时，竞争对手Anthropic估值飙升至9000亿美元，使OpenAI面临严峻挑战。

阅读原文 ↗

OpenAI 与马耳他合作，向所有公民提供 ChatGPT Plus

行业动态OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI 与马耳他政府达成合作，将向该国所有公民免费提供 ChatGPT Plus 订阅服务。此次合作旨在扩大人工智能技术的普及范围，并包含面向公民的 AI 技能实践培训，以帮助民众负责任地使用 AI。该计划是国家级大规模推广 ChatGPT Plus 的首例，预计将提升马耳他全民的 AI 素养与应用能力。

阅读原文 ↗

📄 论文研究

Δ-Mem：适用于大型语言模型的高效在线内存

论文研究Hacker News 热门（buzzing.cc 中文翻译）

研究人员提出了Δ-Mem，一种专为大型语言模型设计的高效在线内存系统。该系统通过仅存储和更新模型激活的增量变化，而非完整的激活状态，显著降低了内存占用。实验表明，Δ-Mem能将内存使用量减少高达70%，同时保持模型输出的质量基本无损。这一方法有助于在资源受限的环境中部署和运行大规模语言模型，提升其在线推理和持续学习场景下的可行性。

阅读原文 ↗

智能体驱动系统Articraft实现3D资产生成自动化，开源万件数据集降低门槛

论文研究X：Berry Xia (@berryxia)

剑桥大学团队推出Articraft，这是一个由智能体驱动的编码系统，能全自动生成带关节、可运动的交互式3D资产。系统通过AI智能体自主编写代码、执行并接收物理反馈迭代优化，将以往需数日甚至数周的创作过程极大简化。团队同时开源了Articraft-10K数据集，包含超1万个物体，覆盖250个类别，所有资产均仿真就绪。此举显著降低了机器人训练和物理AI领域对高质量3D资产的数据门槛，为解决"数据饥渴"问题提供了高效的自动化方案。

阅读原文 ↗

💡 技巧观点

MagicPath与Codex深度整合，设计开发流程合二为一

技巧观点X：Berry Xia (@berryxia)

MagicPath AI CEO @skirano 演示了其产品与Codex的深度整合。用户现可将MagicPath作为原生画布直接在Codex中运行，通过拖拽设计UI，Codex能实时感知项目并自动生成、编辑代码，实现设计与开发的无缝衔接，无需在Figma和IDE间切换。安装简便，只需在Codex中粘贴一条命令即可完成配置。此举将"设计-开发-迭代"流程整合于单一窗口，显著缩短了从创意到可运行应用的距离。

阅读原文 ↗

工具使用代理认知与行动脱节机制研究

技巧观点X：Elvis Saravia (@omarsar0, DAIR.AI)

该可解释性论文聚焦工具使用代理，通过探测隐藏状态发现模型常能识别应调用工具，但实际调用失败，不匹配率达26%-54%。问题完全集中于认知到行动的过渡阶段，而非认知本身。内部探测方向可解码，但后期层的最后令牌机制使信号旋转，几乎与产生的行动正交。研究旨在预测干预措施效果，指出常见归因如提示或训练不足可能忽略后期层几何结构，这为工具使用提示A/B测试中的性能上限提供了合理解释。

阅读原文 ↗

RLVR 可能在科学领域格外糟糕

技巧观点Dwarkesh Patel：Podcast & Blog（RSS）

RLVR（强化学习与验证）在科学理论验证中可能表现出不成比例的缺陷。科学理论的验证循环周期长达数十年甚至数个世纪，且当前被视为更优的理论实际上常会做出更差的预测。这一矛盾揭示了基于短期反馈的强化学习范式与科学探索长期性、复杂性之间的根本冲突，凸显了现有AI方法在应对科学发现这类超长反馈周期任务时存在的结构性局限。

阅读原文 ↗

Eric Jang分享从零构建AlphaGo的经历与见解

技巧观点X：Marc Andreessen (@pmarca, a16z)

Eric Jang在过去几个月从零开始实现AlphaGo，这是2016年激发他进入深度学习的AI突破。他最初理解AlphaGo为"通过自我对弈训练的搜索增强深度神经网络"，但通过亲手构建获得了更深层次的理解。他指出，前沿深度学习研究虽昂贵，但特定能力的实现成本下降迅速；在2026年，训练强大围棋AI仅需几千美元租赁算力，无需DeepMind级别的资源。他荣幸受邀在播客中分享这一过程，并提供了详细教程和代码，同时谦虚自称围棋与AlphaGo学徒，对任何事实错误负责。

阅读原文 ↗

最新开源成果（#21）：开源模型盛宴！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

技巧观点Nathan Lambert：Interconnects（RSS）

本月开源AI模型领域迎来密集发布，包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新，反映出开源社区当前高速迭代的竞争态势。

阅读原文 ↗

Show HN：烧吧，宝贝，烧吧（那些代币）

技巧观点Hacker News 热门（buzzing.cc 中文翻译）

开发者发布了一个名为"烧吧，宝贝，烧吧"的开源项目，旨在通过销毁代币来应对加密货币领域的通胀问题。该项目提供了一个工具，允许用户主动销毁自己持有的代币，从而减少总供应量。此举可能提升剩余代币的稀缺性与潜在价值。项目已在GitHub上开源，并在Hacker News上获得了100点的社区热度。

阅读原文 ↗

Anthropic《Founder's Playbook》：AI提高创业失败率的警示

技巧观点X：Berry Xia (@berryxia)

Anthropic发布内部手册《Founder's Playbook》，核心观点是AI（如Claude Code）将提高创业失败率，而非降低。手册指出，AI能快速生成原型，易使创始人混淆"能运行"与"有市场需求"，并通过确认偏误和研究引擎强化错误想法。它将创业分为Idea、MVP、Launch、Scale四阶段，剖析AI放大的风险：如原型不等于验证、Agentic技术债、创始人成为决策瓶颈等。最终结论是，AI极大降低执行成本，使得判断力成为最稀缺资源，真正护城河在于将垂直领域知识结构化沉淀为专属Skills。

阅读原文 ↗

Codex实现多设备远程控制与上下文共享

技巧观点X：歸藏 (@op7418)

Codex除了通过ChatGPT连接和远程控制外，还能控制另一台电脑，实现在ChatGPT上直接管理多台设备而无需切换，只需切换项目即可访问不同设备的上下文和文件。引用推文补充，此功能还支持通过远程SSH设置其他VMs等，增强了多设备协作的灵活性和实用性。

阅读原文 ↗

藏师傅PPT Skills更新，AI自动美化截图

技巧观点X：歸藏 (@op7418)

藏师傅PPT Skills产品更新，新增截图美化功能。该功能无需消耗GPT-Image 2.0资源，即可根据用户截图的大小、长宽比以及当前PPT的模板类型和颜色主题，自动匹配合适的背景图，实现类似CleanShot X等专业软件的截图美化效果。AI还能处理过长等有问题的图片，例如将其自动裁剪并排成两列展示。

阅读原文 ↗

无视令牌成本，用百个AI实例自动化驱动开源项目

技巧观点X：Peter Steinberger (@steipete)

作者在OpenClaw项目中大规模运用AI，探索在"令牌成本无关紧要"的未来如何构建软件。团队持续运行约100个Codex实例，自动化处理多项核心工作：审查代码与安全问题、去重归类议题、自动重现复杂测试环境并录制验证视频、从会议讨论中主动创建任务、过滤垃圾评论以及监控性能回归。通过clawpatch.ai等工具将项目拆分为功能单元进行审查，并整合Vercel DeepSec等进行安全分析。整套自动化体系使得项目能够以极精简的团队高效运作。

阅读原文 ↗

英伟达CEO称技工前景优于计算机科学毕业生

技巧观点X：Kim (@kimmonismus)

英伟达CEO Jensen Huang在卡内基梅隆大学告诉2026届计算机科学毕业生，电工、水管工等技工比他们更有前景。数据支持这一观点：Randstad分析显示技工需求增长是白领职位的三倍，机器人技术员职位增长107%，而斯坦福研究发现AI相关职位早期就业下降16%。顶级电工年薪超10.6万美元，无需学位负债。科技公司今年投资7000亿美元建设数据中心，全球到2030年预计达7万亿美元，这些基础设施依赖人力完成，但制造业面临劳动力短缺，每100名新工人进入就有102人离开。AI时代最大赢家是能建设数据中心的技工，而非提示工程师。

阅读原文 ↗

AI助手Sai化身虚拟同事，自主完成深度研究

技巧观点X：Kim (@kimmonismus)

AI工具Sai被设计为拥有独立桌面的"虚拟同事"，而非仅提供聊天窗口。用户可向其下达"深度研究某主题"等指令后离线，Sai会在安全的工作空间内自主操作：打开标签页、点击应用、阅读并交叉引用资料、做笔记，其工作方式类似人类研究员。任务完成后，它会整理好引用来源，并在执行任何潜在风险操作前请求用户批准。这展示了"始终在线"的计算机使用代理的实际形态。

阅读原文 ↗

杨立昆访谈：剖析LLM局限，畅谈AI未来与创业新途

技巧观点X：Yann LeCun (@ylecun)

在Unsupervised Learning播客中，AI先驱杨立昆阐述了其对大型语言模型局限性的反主流观点，并探讨了机器人技术的发展路径。他解释了离开Meta的原因，以及与Geoff Hinton、Yoshua Bengio在图灵奖观点上的重大分歧。访谈还涵盖了他对2027年的预测、新公司AMI对世界模型的押注，并将OpenAI和Anthropic比作Sun Microsystems。此外，他建议博士生停止研究LLM，并分享了对AI安全、突破性研究发生机制以及Meta FAIR得失的尖锐见解。

阅读原文 ↗

今日热点速览

今日共收录 30 条 AI 领域动态，涵盖模型发布、产品更新、行业动态、论文研究和技巧观点五大类别。今日热点包括：

《MagicPath与Codex深度整合，设计开发流程合二为一》
《工具使用代理认知与行动脱节机制研究》
《美国开始出现人工智能相关岗位的大规模裁员》