← AI 学习

AI 每日精选 · 2026-05-31

12 篇论文 · 多源聚合 + AI 摘要

· 6 分钟阅读 #digest#auto#ai-papers

OpenAI 官方动态

Boston Children’s uses AI to unlock new diagnoses

OpenAI

波士顿儿童医院将OpenAI人工智能技术落地临床场景,核心价值体现在两大方面:一是优化患者护理服务质量,同时降低医院运营端负担,提升整体运转效率;二是该技术已辅助临床成功确诊超40例罕见病病例,为罕见病诊断难、误诊率高的临床痛点提供了可行的技术解法,也为AI落地儿科诊疗场景提供了参考。

How Braintrust turns customer requests into code with Codex

OpenAI

这篇实践文章披露了Braintrust团队的研发提效方案:工程师将代码生成模型Codex与GPT-5.5搭配融入开发流程,可实现客户需求到可运行代码的高效转换,同时大幅压缩技术实验的验证周期,整体代码产出效率、客户需求响应速度均得到显著提升,为大模型赋能研发链路提供了落地参考。

Anthropic News

Introducing Claude Opus 4.8

Anthropic

Claude Opus 4.8是Opus级大模型的最新迭代版本。该版本核心能力实现多维度升级:编程开发、智能体任务、专业领域工作三类场景的处理性能均有明显提升,同时优化了长周期运行的表现稳定性,可适配更为复杂的持续性工作需求,综合实用价值进一步增强。

Introducing Claude Design by Anthropic Labs

Anthropic

Anthropic实验室最新发布旗下全新产品Claude Design。该产品支持用户与Claude大模型协同创作,可共同产出成熟度高的可视化成果,覆盖平面设计、产品原型、演示幻灯片、单页宣传物料等多类常见视觉工作场景,进一步拓展了生成式AI的落地应用边界。

Google DeepMind

We’re launching the Google DeepMind Accelerator program in Asia Pacific to tackle environmental risks

Google DeepMind

谷歌DeepMind正式推出亚太区加速器项目,核心目标为依托前沿AI技术应对区域各类环境风险。项目将为环境领域的创新团队、科研主体提供技术赋能、资源对接支持,重点推进气候应对、灾害预警、生态保护等场景的AI解决方案落地,助力提升亚太区域环境风险防控的整体效能。

Fast-tracking genetic leads to reverse cellular aging

Google DeepMind

本研究聚焦细胞衰老逆转的遗传靶点发掘,生物学家借助Co-Scientist科研工具开展筛选,成功挖掘出此前未被报道的全新调控因子,经验证该因子可有效实现人类细胞复壮。该成果大幅缩短了抗衰靶点研发周期,为后续衰老相关疾病的临床干预、抗衰药物研发提供了全新候选方向。

Hugging Face Blog

Profiling in PyTorch (Part 1): A Beginner’s Guide to torch.profiler

Hugging Face

这是面向PyTorch使用者的torch.profiler入门指南,围绕PyTorch内置的性能分析工具展开,覆盖工具基础配置、常用调用API、性能报告解读等全流程入门操作,可帮助新手快速掌握定位模型训练、推理阶段性能瓶颈的方法,排查算子耗时异常、GPU利用率低、内存占用过高等问题,优化模型运行效率。

ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks — by Artificial Analysis and IBM

Hugging Face

人工智能分析机构联合IBM发布全球首个面向企业IT场景的智能体专项评测基准ITBench-AA,专门考核大模型智能体处理运维部署、故障排查等专业企业IT任务的能力。实测显示当前全球前沿大模型在该基准上得分不足50%,表明大模型落地企业级IT智能体场景仍存在显著能力短板。

The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

The Gradient

这篇基于美德伦理的AI对齐研究,挑战“理性主体需绑定固定终极目标”的预设,提出人类理性并非指向特定目标,而是行动适配含规则、评价体系的社会实践网络。认为AI若要适配、协作人类,决策逻辑需匹配人类实践导向范式,这对伦理对齐及核心安全保障均至关重要。

量子位

AI原生时代下,让世界适应Agent,而非教AI做人 | 港大黄超@AIGC2026

量子位

港大助理教授黄超在2026中国AIGC产业峰会提出Agent时代核心思路:无需让Agent适配人类,应改造数字世界适配Agent。其团队开源的轻量化通用Agent nanobot下载量破20万,获行业高度认可。后续将挑战跨生态长程任务,还推出CLI-Anything方案,改造专业软件为命令行接口适配Agent,重构交互范式,推动Agent升级为数字劳动力。

从Token无上限到全员Agent:MiniMax的AI Native组织进化实践

量子位

2026中国AIGC产业峰会上,刚登陆港股的多模态大模型企业MiniMax分享AI原生组织实践:建议从员工抵触的高价值场景切入,发放Token补贴鼓励员工用Agent搭建自动化工作流,以Token消耗量为新效率指标,可推动组织扁平化。其判断未来2-3年AI将深度渗透各行业,企业无需焦虑,直接动手实践即可。

帮Gemini拿下IMO金牌的关键先生,差点成了职业钢琴家

量子位

本文介绍谷歌DeepMind研究科学家、南洋理工大学校友Yi Tay:他曾差点成为职业钢琴家,14年前弹奏的肖邦《幻想即兴曲》技法娴熟、情绪张力拉满。作为核心成员,他带队研发的Gemini Deep Think拿下IMO金牌,也是Gemini 2.5、3 Deep Think的核心贡献者,后者还在国际物化奥赛笔试达金牌水准。