Skip to content

2026-06-10

Anthropic发布Claude Fable 5和Mythos 5,在软件工程、科研、药物设计等基准达SOTA,售价减半,安全机制调整,性能与价格优势显著。 Anthropic 即将发布高端模型 Claude Mythos 及精简版 Fable,定价为 Opus 的 5 倍和 2 倍,定位顶级推理能力。 小米 MiMo 与 TileRT 发布 UltraS…

Claude Fable 5 和 Claude Mythos 5 85

  • Tags: 模型发布 大模型 公司动态 AI安全

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Anthropic发布Claude Fable 5和Mythos 5,在软件工程、科研、药物设计等基准达SOTA,售价减半,安全机制调整,性能与价格优势显著。


Claude Mythos 即将发布,Fable 精简版同日登场 85

  • Tags: 模型发布 公司动态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Anthropic 即将发布高端模型 Claude Mythos 及精简版 Fable,定价为 Opus 的 5 倍和 2 倍,定位顶级推理能力。


小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s 85

  • Tags: 推理优化 模型发布 开源生态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
小米 MiMo 与 TileRT 发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s,采用 FP4 量化与推测解码,已开源。


奥尔特曼宣布 OpenAI 进入第三发展阶段:让 AI 普及、易用且安全 85

  • Tags: 公司动态 政策监管 AI安全

  • Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI CEO宣布进入第三发展阶段,聚焦AI普及、易用与安全,并呼吁国际监管;同日秘密提交IPO申请,引发行业格局关注。


Elon Musk 详解 SpaceX AI1 轨道 AI 数据中心卫星方案 85

  • Tags: AI算力 基础设施 公司动态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
SpaceX公布AI1轨道AI数据中心卫星,峰值功率150kW,激光互联1Tbps,计划2027年前量产百万颗卫星实现太瓦级太空AI算力,可能颠覆地面算力格局。


Variational Proximal Policy Optimization 85

  • Tags: 大模型 模型训练 推理优化

  • Source: arXiv Statistics - Machine Learning | 阅读原文

[摘要]
提出变分PPO(VP2O),结合SVGD与MoE,在33B稀疏模型上实现Codeforces ELO提升179、AIME数学推理token减少32%,改进RLHF稳定性与效率。


INFUSER: Influence-Guided Self-Evolution Improves Reasoning 85

  • Tags: 模型训练 推理优化 自进化 研究

  • Source: arXiv Statistics - Machine Learning | 阅读原文

[摘要]
INFUSER提出影响引导的自协同训练框架,通过生成器与求解器迭代进化显著提升LLM推理能力,在Qwen3-8B上超越强基线。


Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps 85

  • Tags: 推理优化 模型效率 注意力机制

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出 RTPurbo 方法,仅需数百步训练即可将全注意力 LLM 转化为稀疏注意力,实现长上下文推理近无损精度和高达 9.36 倍加速。


Item Response Scaling Laws: A Measurement Theory Approach for Efficient and Generalizable Neural Scaling Estimation 85

  • Tags: 研究 缩放定律 模型评估 效率提升

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出项目反应缩放定律(IRSL),融合项目反应理论,将缩放定律评估所需问题数减少99.9%,仅用50题即可达到同等或更优决策准确率,极大降低计算成本。


The Amplifying Mirror: Locating and Steering the Partisan Direction inside a Large Language Model 85

  • Tags: 模型可解释性 AI安全 大模型

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
论文证明大语言模型中的党派偏见是可在激活空间中精确定位和操控的几何特征,通过中间层线性探测和稀疏自编码器实现因果干预,揭示模型生成偏见的本质。


Memory Beyond Recall: A Dual-Process Cognitive Memory System for Self-Evolving LLM Agents 85

  • Tags: 智能体 大模型 认知架构 推理优化

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
论文提出DCPM,一种基于双过程理论的LLM代理认知记忆系统,通过System1记录信念演化、System2归纳跨域模式,在跨会话推理基准上显著提升性能(最高+5.20)。


PBSD: Privileged Bayesian Self-Distillation for Long-Horizon Credit Assignment 85

  • Tags: 强化学习 智能体 信用分配 自蒸馏

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
PBSD提出贝叶斯自蒸馏方法,解决长程智能体任务中稀疏奖励下的细粒度信用分配问题,通过将评估结果信号转化为步骤级信用信号,提升策略学习与泛化能力。


Late-Layer Fusion is Enough: Dual-Path Vision Token Routing for Multimodal Large Language Models under Visual Saturation 85

  • Tags: 多模态大模型 推理优化 研究发布

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出DPVR-LF方法,发现多模态大模型中视觉token在深层饱和,通过将视觉token路由到单层侧分支并在最后融合,仅需3%可训练参数即保持性能并减少计算量,挑战了视觉token必须经过全部深层的假设。


Mechanistic Data Attribution: Tracing the Training Origins of Interpretable LLM Units 85

  • Tags: 可解释性 大模型 训练数据 因果推理

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出 Mechanistic Data Attribution (MDA) 框架,通过影响函数追溯大模型可解释单元的训练数据来源,实验因果验证干预高影响样本可调控可解释头涌现,为模型开发提供新方法论。


The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes 82

  • Tags: 研究 训练数据影响 高效方法

  • Source: arXiv Statistics - Machine Learning | 阅读原文

[摘要]
提出镜像影响假设,利用前向传播高效估计训练数据对模型预测的影响,在扩散模型、数据泄露检测等场景验证,大幅提升计算效率。


Intrinsic Selection and Particle Resampling for Inference-Time Scaling Beyond Domain Verifiability 82

  • Tags: 推理优化 大模型 研究论文

  • Source: arXiv Statistics - Machine Learning | 阅读原文

[摘要]
提出内在选择与粒子重采样的推理时缩放方法,无需外部验证器即可在非可验证领域(工程设计、临床)提升推理质量,分别实现20%和26.5%的性能提升。


Imagination Helps Visual Reasoning, But Not Yet in Latent Space 82

  • Tags: 大模型 多模态 推理 研究

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
论文通过因果中介分析发现多模态大模型潜在空间视觉推理存在因果断连,提出显式文本想象方法CapImagine,性能显著优于潜在空间方法。


里程碑式德国裁决:Google AI Overviews 被视为谷歌自身言论,需为错误回答承担责任 80

  • Tags: 政策监管 AI安全 公司动态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
德国法院裁定Google对AI概览内容承担直接法律责任,不可援引原有有限责任保护,可能为全球AI内容责任认定树立先例。


Luma AI Ray3.2:方向进,电影出 80

  • Tags: 模型发布 视频生成 产品更新

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Luma AI 发布 Ray3.2 视频生成模型,支持方向控制生成高质量电影级视频,提升创作效率。


台湾考虑限制AI芯片对华出口以配合美国 80

  • Tags: 芯片算力 政策监管

  • Source: AI HOT 精选 | 阅读原文

[摘要]
台湾拟收紧AI芯片对大陆出口以配合美国限制,或影响全球AI芯片供应链格局。