← AI 学习

AI 每日精选 · 2026-05-30

15 篇论文 · 多源聚合 + AI 摘要

· 7 分钟阅读 #digest#auto#ai-papers

arXiv cs.LG(机器学习)

One Mask to Rule Them All: On Hidden Facts after Editing and How to Find Them

Ali Holmov, Paul Youssef, Nandi Schoots…

本文针对ROME、MEMIT等Transformer知识编辑方法内部机制不明的问题,通过训练紧凑二值掩码定位编辑依赖的权重子集,验证了不同事实编辑共用同一功能权重子空间,且编辑实为抑制而非覆盖原有知识,这也是其无法同步更新关联事实的原因,定位到的公共子空间可用于恶意编辑的检测与防御。

Representation Signatures and Risk-Feedback Alignment in LLM Trading Agents

Weicheng Xue

该文研究大语言模型交易智能体的金融决策对齐特性与表征动态:依托可审计测试床TradeArena开展实验,可精准捕捉模型失效前的可测表征漂移信号;结构化风险反馈无需微调即可作为对齐信号但无普适增益,大模型存在关联资产集中敞口盲区,验证了可审计风险反馈加表征轨迹可有效识别大模型金融推理状态。

Mechanistic origins of catastrophic forgetting: why RL preserves circuits better than SFT?

Jeanmely Rojas Nunez, Viraj Sawant, Nathan Allen…

针对大模型微调易出现灾难性遗忘、已有RL比SFT旧能力保留效果更好的结论缺乏机制解释的问题,该研究提出头级度量“差分电路脆弱性”,在Qwen2.5-3B-Instruct科学问答微调场景下对比发现:SFT任务适配更快但电路破坏、遗忘更严重,RL适配偏慢但保留更多基础电路,这正是RL抗遗忘的机制根源。

OpenAI 官方动态

Boston Children’s uses AI to unlock new diagnoses

OpenAI

波士顿儿童医院引入OpenAI相关人工智能技术落地临床场景,既优化患者诊疗体验、降低院内运营负担,也依托AI对罕见病特征的捕捉优势,目前已辅助完成超40例罕见病病例的诊断,为AI赋能临床诊疗、破解罕见病诊断难的行业痛点提供了可参考的落地实践。

How Braintrust turns customer requests into code with Codex

OpenAI

本文介绍Braintrust的工程提效方案:其工程师将Codex的代码生成能力与GPT-5.5的语义理解能力联动,落地客户需求转代码、开发侧实验验证两大核心场景,大幅压缩需求拆解、代码编写、实验调优的全链路耗时,显著提升研发响应速度与交付效率。

Anthropic News

Introducing Claude Opus 4.8

Anthropic

本次发布的Claude Opus 4.8是Opus级大模型的升级迭代版本。该版本针对性优化了模型能力适配性与长流程运行稳定性,在代码开发、智能体任务、专业领域工作三类核心场景下性能均有显著提升,同时大幅改善了长周期持续任务的处理一致性,可更好支撑高复杂度的长期工作需求。

Introducing Claude Design by Anthropic Labs

Anthropic

Anthropic实验室近日正式推出新品Claude Design。该产品依托Claude大模型的交互能力,支持用户与AI协作完成各类高完成度的可视化内容创作,覆盖场景包括专业设计稿、产品原型、演示幻灯片、单页宣传物料等,可有效降低视觉内容创作门槛,提升相关从业者的工作效率。

Google DeepMind

We’re launching the Google DeepMind Accelerator program in Asia Pacific to tackle environmental risks

Google DeepMind

谷歌DeepMind近期启动亚太区加速器项目,以应对气候、生态等各类环境风险为核心目标,依托自身AI技术积累,扶持亚太地区科创团队、科研机构,聚焦气候灾害预警、生态保护、碳排放管控等场景,研发落地针对性AI解决方案,助力区域提升环境风险防控能力,支撑绿色发展。

Fast-tracking genetic leads to reverse cellular aging

Google DeepMind

本研究聚焦逆转细胞衰老的遗传靶点挖掘需求,科研人员借助智能辅助工具Co-Scientist开展筛选,成功找到多款可有效实现人类细胞复壮的全新调控因子,大幅压缩了衰老相关遗传靶点的研发周期,为后续抗衰干预技术、相关药物的开发提供了全新候选方向。

Hugging Face Blog

Profiling in PyTorch (Part 1): A Beginner’s Guide to torch.profiler

Hugging Face

本文是PyTorch性能剖析模块torch.profiler的新手入门教程首篇,围绕官方内置的该工具展开:梳理其可精准定位算子耗时、CPU/GPU资源利用率、内存异常等模型运行瓶颈的核心能力,讲解基础API配置、结果解读实操步骤,降低新手性能调优门槛,助力开发者快速识别低效代码、优化模型运行效率。

ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks — by Artificial Analysis and IBM

Hugging Face

这份由人工智能分析机构与IBM联合推出的ITBench-AA,是全球首个面向智能体的企业级IT任务评测基准,覆盖真实场景下的IT运维、资源调度等多类任务需求,实测显示当前前沿大模型在该基准的综合得分不足50%,暴露出现有大模型落地复杂企业IT场景的能力短板,也为后续IT领域智能体的研发优化提供了客观参照。

The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

The Gradient

该文聚焦AI对齐问题,从美德伦理视角反驳“理性主体必须锚定固定终极目标”的主流预设,指出人类理性行动的核心是适配包含行动倾向、评价标准在内的实践网络而非指向单一目标。据此提出AI对齐思路:需让AI决策逻辑匹配人类的实践型行动逻辑,这既利于对齐人类伦理要求,也能保障AI核心安全属性。

量子位

英伟达清华团队提出Gamma-World:世界模型从「一个人玩」到「多人共处」

量子位

当前单智能体视频世界模型已较成熟,但多智能体共享场景需满足时间、跨视角、交互三重一致性,现有架构存在结构性缺陷,无法靠加数据、扩模型规模解决,此前同类尝试也有局限。英伟达联合清华等团队提出Gamma-World,从RoPE扩展、注意力拓扑两个底层组件切入,给出多智能体世界建模的系统性方案。

4nm!比亚迪自研AI芯片来了:制程对齐英伟达,算力拉爆特斯拉

量子位

比亚迪自研全流程自主可控的车规级4nm智驾芯片璇玑A3已量产,制程对标英伟达Thor属全球T0梯队,领跑国内同类产品。其三颗组合算力超2100TOPS,单位功耗较通用GPU低20%,搭配自研算法算力利用率翻倍,远超外界此前对其仅对标中低端智驾芯片的预期。

光帆科技与腾讯出行服务达成战略合作 开启新一轮预售

量子位

5月29日光帆科技宣布与腾讯出行服务达成战略合作,腾讯出行将接入光帆AI全感穿戴设备的出行服务能力,相关功能预计6月上旬上线。该设备此前开售即登顶京东AI耳机热卖榜、连续8天霸榜,首批已售罄开启新一轮预售,5月31日前京东购指定款可享200元优惠等6项权益,本次合作将拓宽AI穿戴的出行场景边界。