TL;DR · 30 秒看完今日

Anthropic连发两款Claude新品并提交招股书，Meta、JetBrains、MiniMax等均有新动态披露
多篇前沿AI论文发布，覆盖具身智能、模型记忆、AI对齐、分布式微调等方向
AI产业落地场景持续拓展，涉及环境治理、脑机接口安全、保险理赔、衰老研究等领域

🧠论文研究🔥厂商动态💡新品发布⚡落地应用📈上市进展

Hugging Face Daily Papers

Trust Region On-Policy Distillation

HF 18 · Xingrun Xing, Haoqing Wang, Boyan Gao… · HF 镜像

针对大语言模型同策略蒸馏（OPD）在师生分布差异较大时梯度不可靠、易优化失败的问题，该研究提出信任域同策略蒸馏方法TrOPD：仅在教师监督可靠的信任域执行蒸馏，对异常域用梯度裁剪等降低不可靠监督的负面影响，同时引入异策略引导鼓励探索可靠区。实验显示其在数学推理、代码生成等任务上全面优于现有最优OPD基线。

Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking

HF 8 · Zekun Qi, Xuchuan Chen, Dairu Liu… · HF 镜像

本文提出面向人形全身控制的类GPT因果注意力Transformer模型Humanoid-GPT，针对此前浅层MLP跟踪器数据稀缺、灵活度与泛化性难以兼顾的痛点，在整合主流动捕数据集与自研大规模采集数据的20亿帧重定向语料上预训练。实验证实，该模型可跟踪高动态复杂动作，在未见任务上实现前所未有的零样本泛化，刷新领域性能前沿。

Ψ-Bench: Evaluating Persona-Sensitive Influencing in Persuasive Dialogues

HF 8 · Peixuan Han, Hongyi Du, Jiayu Liu… · HF 镜像

现有大模型的个性化能力多局限于被动响应用户偏好，缺乏主动说服引导的相关评估。对此研究提出Ψ-Bench基准，设置三类真实说服对话场景，基于对话历史生成用户画像模拟受众，测试10款前沿大模型。结果显示当前顶尖模型说服能力仍有较大提升空间，接入用户画像可使性能平均提升18.24%，凸显个性化信息对主动说服的价值。

Decentralized Instruction Tuning: Conflict-Aware Splitting and Weight Merging

HF 6 · Minsik Choi, Geewook Kim · HF 镜像

针对大模型（含多模态）指令调优面临梯度干扰、同步带宽开销高的瓶颈，本文提出分布式调优框架MERIT：先估算数据集间梯度冲突，沿PCA高冲突轴拆分任务，各分区无通信独立微调后仅做一次token加权参数合并，兼具方差降低、隐式正则效果。在多模态、纯文本多组任务上，其性能优于或追平集中式联合训练，成本开销极低。

Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories

HF 4 · Ali Behrouz, Farnoosh Hashemi, Vahab Mirrokni · HF 镜像

现有大模型难以实现持续学习，无法将上下文短期知识有效沉淀为长期参数记忆。受人类学习机制启发，本文提出“睡眠”范式：一是记忆巩固阶段，通过广义蒸馏将小模型记忆迁移至大模型，转化为稳定长期知识；二是“做梦”阶段，无监督用强化学习生成合成数据自优化，实验验证该范式在多类任务上效果优异。

arXiv cs.LG（机器学习）

Human-in-the-Loop Contextual Bandits for Short-Term Rental Dynamic Pricing: Structural Equivalence of Historical Warm-Up and Approval-Gated Live Learning

Oleg Miroshnichenko

针对短租动态定价风险高、需可解释、预订反馈稀疏，纯在线老虎机学习冷启动周期过长的痛点，该研究提出人在环门控老虎机框架：算法生成定价建议后由人类审核调整，基于四年真实生产数据验证历史定价数据与在线预热数据结构等价，可将冷启动从150轮压缩至30轮，该结论适用于所有需人类审批的高风险领域，证实强制人监管是统计资产而非部署约束。

Spectral Asymptotics of Neural Network Loss Landscapes: An Exact Decomposition of the Curvature Exponent

Anherutowa Calvo

本文针对卷积、注意力、MLP层曲率指数α存在系统性差异的问题，证明谱对齐分解公式，将α拆解为特征基与梯度奇异方向对齐度的函数，推导得到α、梯度秩衰减γ、海森衰减指数s的代数恒等式，跨多架构数据集实测误差仅约2%，基于此设计的谱牛顿优化器在视觉任务上性能优于AdamW。

Making Brain-Computer Interfaces More Secure

Md Fahimul Kabir Chowdhury, Gahangir Hossain

该研究针对当前EEG型脑机接口普遍侧重分类精度、安全鲁棒性研究不足，易被微小对抗攻击干扰致误判的问题，提出轻量定制CNN架构，经两套EEG数据集测试，在梯度对抗攻击场景下，其分类表现始终优于EEGNet等三款专用基线模型，抗扰动鲁棒性更优，为提升脑机接口部署可靠性提供了新方向。

OpenAI 官方动态

Travelers deploys AI-powered claims countrywide with OpenAI

OpenAI

保险企业Travelers联合OpenAI研发的AI理赔助手目前已完成全国范围落地部署。该工具可全程引导用户完成理赔申请提交，提供7×24小时不间断服务，还能在业务需求峰值期弹性扩容支撑运营，既大幅优化了用户理赔体验，也有效降低运营成本，提升了高峰时段的业务承载与响应效率。

Codex for every role, tool, and workflow

OpenAI

本研究聚焦AI工具Codex的多场景适配升级，针对分析师、营销、设计、投资等各岗位的差异化工作需求，推出适配不同角色、工具栈与工作流的全新插件、站点资源与标注功能，可大幅降低各职能团队用AI提效的落地门槛，无需复杂定制即可嵌入日常流程，助力全岗位效能提升。

Anthropic News

Introducing Claude Opus 4.8

Anthropic

最新推出的Claude Opus 4.8是Opus系列旗舰大模型的迭代版本，核心性能实现多维度提升：在代码开发、智能体任务、专业领域作业三类核心场景的表现明显优于前代，同时优化了长周期任务的处理一致性，可稳定承接耗时久、流程复杂的持续性工作需求。

Introducing Claude Design by Anthropic Labs

Anthropic

Anthropic实验室最新推出旗下新产品Claude Design，核心功能为支持用户与Claude大模型协作完成专业级视觉产出，覆盖设计稿、交互原型、演示幻灯片、单页宣传物料等多类场景。该产品将大模型能力边界从文本生成拓展到可视化创作领域，可大幅降低非设计用户产出高品质视觉内容的门槛。

Google DeepMind

We’re launching the Google DeepMind Accelerator program in Asia Pacific to tackle environmental risks

Google DeepMind

谷歌DeepMind正式启动亚太区加速器项目，核心目标为依托AI技术应对各类环境风险。该项目将依托DeepMind的技术积累，扶持亚太区域深耕环保领域的科创团队，推动AI在气候灾害预警、生态保护、污染治理等场景落地，助力区域提升环境风险应对能力，探索AI赋能环境治理的可行路径。

Fast-tracking genetic leads to reverse cellular aging

Google DeepMind

这篇题为《加速挖掘遗传靶点逆转细胞衰老》的研究中，生物学家借助Co-Scientist科研工具筛选，成功找到一批此前未被发现的新型调控因子，可有效实现人类细胞年轻化重编程。该成果大幅提升了衰老相关遗传靶点发掘效率，为后续抗衰技术研发、细胞治疗落地提供了全新可行思路。

Hugging Face Blog

Holo3.1: Fast & Local Computer Use Agents

Hugging Face

针对现有云端计算机操作智能体时延高、隐私风险大的痛点推出的Holo3.1，是主打低时延的本地端操作智能体。技术上优化了端侧轻量化UI识别模型、操作决策推理链路，全程无需云端交互，普通消费级硬件即可运行。实测较同类云端方案响应速度提升3倍以上，隐私风险大幅降低，可适配办公自动化等多场景。

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains