TL;DR · 30 秒看完今日

大模型领域技术突破不断，OpenAI证伪离散几何猜想、Anthropic推出Claude 4.7及设计工具
国内AI产业动态活跃，智象未来发布超两千亿参数图像大模型，异构计算成算力方向
AI技术渗透多领域场景，覆盖地球观测、遗传研究、智能体对齐、时空预测等方向

📈大模型进展🔥新品发布🧠前沿研究💡产业动态⚡跨域应用

Hugging Face Daily Papers

OScaR: The Occam’s Razor for Extreme KV Cache Quantization in LLMs and Beyond

HF 15 · Zunhai Su, Rui Yang, Chao Zhang… · HF 镜像

针对大模型长上下文、多模态部署中KV缓存的内存瓶颈，以及现有逐通道量化极端压缩效果差的问题，本文定位核心缺陷为令牌范数不平衡，提出轻量化KV压缩框架OScaR，通过通道旋转加全令牌缩放消解误差，搭配优化CUDA内核。实测INT2量化近无损，相较BF16基线解码最高提速3倍，显存降5.3倍、吞吐升4.1倍，适配各类文本、多模态大模型。

Evaluating Temporal Semantic Caching and Workflow Optimization in Agentic Plan-Execute Pipelines

HF 7 · Alimurtaza Mustafa Merchant, Krish Veera, Sajal Kumar Goyla… · HF 镜像

针对工业资产运维智能体规划执行管线延迟高、现有通用大模型缓存适配性差的问题，本文在AssetOpsBench基准上测试提出两套互补优化方案：时序语义缓存、结合磁盘级工具发现缓存与依赖感知并行执行的MCP工作流优化。结果显示，MCP优化提效1.67倍、降延40%，缓存命中时提效达30.6倍，同时明确了纯语义缓存适配参数化工业查询的失效问题。

Generative Recursive Reasoning

HF 7 · Junyeob Baek, Mingyu Jo, Minsu Kim… · HF 镜像

现有递归推理模型多为确定性，仅沿单条潜态轨迹迭代优化、输出单一预测，存在局限。本文提出生成式递归推理框架GRAM，将递归潜推理转化为概率多轨迹计算，采用摊销变分推断训练，支持条件推理及无输入场景下的无条件生成。其在结构化推理、多解约束满足任务上表现优于确定性基线，还可通过调整递归深度、并行采样轨迹实现推理时算力缩放。

Uni-Edit: Intelligent Editing Is A General Task For Unified Model Tuning

HF 4 · Dian Zheng, Manyuan Zhang, Hongyu Li… · HF 镜像

现有统一多模态模型提升图像理解、生成、编辑能力依赖的混合多任务训练存在固有冲突，需复杂多阶段流程，仅能实现性能权衡而非互促。本文提出Uni-Edit，将智能编辑作为通用调优任务，构建含复杂推理指令的148k数据集，单任务单阶段训练即可同步提升三类能力，经实验验证效果显著。

On the limits and opportunities of AI reviewers: Reviewing the reviews of Nature-family papers with 45 expert scientists

HF 2 · Seungone Kim, Dongkeun Yoon, Kiril Gashteovski… · HF 镜像

针对AI审稿人能力存疑、现有评估仅对标人类判决的不足，该研究邀请45名跨领域专家耗时469小时，对82篇Nature系列论文的人类与3款AI审稿意见的三类核心指标做标注评估。结果显示GPT-5.2表现优于单篇最高评分人类审稿人，所有AI表现均优于低分人类，还可发现26%人类未提及的问题，但存在特有缺陷，现阶段仅可作为人类审稿的补充。

arXiv cs.LG（机器学习）

Dimensional Balance Improves Large Scale Spatiotemporal Prediction Performance

Jing Chen, Shixiang Pan, Yujie Fan…

针对现有时空预测方法性能提升有限、跨域迁移性弱的痛点，该研究以时空熵为指标诊断时空复杂度不匹配瓶颈，提出可扩展自适应框架：通过低秩嵌入压缩空间维度保留关键结构，扩展时域捕捉长程依赖缓解累积误差。多领域测试显示精度提升显著、通用性强，代码已开源。

Robust Basis Spline Decoupling for the Compression of Transformer Models

Joppe De Jonghe, Van Tien Pham, Mariya Ishteva

针对现有张量解耦的神经网络压缩方法依赖多项式、分段线性参数化，存在数值不稳定或表达性有限的问题，本文提出基于B样条的解耦框架，设计融合归一化与Tikhonov正则的鲁棒交替最小二乘算法R-CMTF-BSD。实验验证其在视觉、Swin Transformer上可大幅减参同时保持精度，是结构化网络压缩的有效方案。

HELLoRA: Hot Experts Layer-Level Low-Rank Adaptation for Mixture-of-Experts Models

Jia Wei, Zhonghao Zhang, Ping Chen…

针对现有LoRA多适配稠密大模型参数高效微调场景、未利用MoE稀疏激活特性的问题，本文提出HELLoRA方法：仅为每层激活频率最高的专家挂载LoRA模块，还可搭配LoRI形成更省参数的HELLoRI。在三类MoE基座、数学推理等三类任务上，该方法较常规LoRA可降超8成可训练参数、提近10%精度，同时提升训练效率，验证了激活感知适配器部署对MoE微调的实用价值。

OpenAI 官方动态

An OpenAI model has disproved a central conjecture in discrete geometry

OpenAI

OpenAI研发的AI模型攻克了离散几何领域悬置80年的经典单位距离难题，推翻了该领域此前公认的核心相关猜想。这一成果既突破了长期困扰数学家的纯理论瓶颈，也标志着人工智能驱动数学研究取得里程碑式进展，为AI跨界攻坚基础科学前沿未知问题提供了全新可行思路。

The next phase of OpenAI’s Education for Countries

OpenAI

本文介绍OpenAI“面向国家的教育行动计划”进入下一阶段，核心推进方向为扩大AI技术在各级各类校园场景的落地应用，具体举措包括搭建多元新合作生态、开展教师AI应用专项培训、开发适配教学需求的专用工具，项目最终目标是覆盖全球范围，切实提升整体学习成效。

Anthropic News

Introducing Claude Opus 4.7

Anthropic

Anthropic最新大模型Claude Opus 4.7现已全面开放使用。该版本相较于前代Opus 4.6实现了明显升级，核心提升集中在高阶软件工程方向，对复杂度最高的开发类任务处理能力增益尤为突出，可更好支撑高难度代码开发、复杂系统调试等专业软件工程场景。

Introducing Claude Design by Anthropic Labs

Anthropic

Anthropic实验室近期发布全新产品Claude Design，这款工具主打人机协作式视觉创作能力，支持用户与Claude大模型配合，高效产出设计稿、交互原型、演示幻灯片、单页宣传物料等多种规范化视觉作品，可大幅降低非专业设计用户制作优质可视化内容的门槛。

Google DeepMind

Fast-tracking genetic leads to reverse cellular aging

Google DeepMind

这项研究聚焦逆转细胞衰老的遗传靶点挖掘需求，生物学家借助Co-Scientist AI智能科研工具开展筛选，成功发掘出新型调控因子，实现人类细胞有效年轻化。该成果既为抗衰研究提供了全新干预靶标，也验证了AI辅助工具在遗传筛选研究中的高效性，可加快衰老相关转化研究的推进。

Simulate real-world places with Project Genie and Street View

Google DeepMind

谷歌本次推出两项服务更新：一是面向全球范围放开Google AI Ultra订阅服务的使用权限，覆盖更多区域的付费用户；二是上线搭载谷歌街景数据支撑的「Genie项目」新功能，依托真实空间采集信息，可实现对现实世界各类地点的高保真模拟，为空间相关AI应用提供新的底层支撑。

Hugging Face Blog

OlmoEarth v1.1: A more efficient family of Earth observation models

Hugging Face

本次推出的OlmoEarth v1.1为升级版对地观测模型家族，针对现有遥感模型算力开销高、下游适配性弱的痛点，优化了轻量化骨干架构与多模态预训练策略，基于海量多源公开遥感数据完成预训练。实测显示，其相比旧版、同参数通用CV模型，在遥感分类、变化检测等典型下游任务上精度与推理效率均有明显提升，更适配端侧落地场景。

Introducing the Ettin Reranker Family