2026-06-10
Anthropic发布Claude Fable 5和Mythos 5,在软件工程、科研、药物设计等基准达SOTA,售价减半,安全机制调整,性能与价格优势显著。 Anthropic 即将发布高端模型 Claude Mythos 及精简版 Fable,定价为 Opus 的 5 倍和 2 倍,定位顶级推理能力。 小米 MiMo 与 TileRT 发布 UltraS…
Claude Fable 5 和 Claude Mythos 5 85
Tags:
模型发布大模型公司动态AI安全Source:
AI HOT 精选| 阅读原文
[摘要]
Anthropic发布Claude Fable 5和Mythos 5,在软件工程、科研、药物设计等基准达SOTA,售价减半,安全机制调整,性能与价格优势显著。
Claude Mythos 即将发布,Fable 精简版同日登场 85
Tags:
模型发布公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
Anthropic 即将发布高端模型 Claude Mythos 及精简版 Fable,定价为 Opus 的 5 倍和 2 倍,定位顶级推理能力。
小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s 85
Tags:
推理优化模型发布开源生态Source:
AI HOT 精选| 阅读原文
[摘要]
小米 MiMo 与 TileRT 发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s,采用 FP4 量化与推测解码,已开源。
奥尔特曼宣布 OpenAI 进入第三发展阶段:让 AI 普及、易用且安全 85
Tags:
公司动态政策监管AI安全Source:
AI HOT 精选| 阅读原文
[摘要]
OpenAI CEO宣布进入第三发展阶段,聚焦AI普及、易用与安全,并呼吁国际监管;同日秘密提交IPO申请,引发行业格局关注。
Elon Musk 详解 SpaceX AI1 轨道 AI 数据中心卫星方案 85
Tags:
AI算力基础设施公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
SpaceX公布AI1轨道AI数据中心卫星,峰值功率150kW,激光互联1Tbps,计划2027年前量产百万颗卫星实现太瓦级太空AI算力,可能颠覆地面算力格局。
Variational Proximal Policy Optimization 85
Tags:
大模型模型训练推理优化Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
提出变分PPO(VP2O),结合SVGD与MoE,在33B稀疏模型上实现Codeforces ELO提升179、AIME数学推理token减少32%,改进RLHF稳定性与效率。
INFUSER: Influence-Guided Self-Evolution Improves Reasoning 85
Tags:
模型训练推理优化自进化研究Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
INFUSER提出影响引导的自协同训练框架,通过生成器与求解器迭代进化显著提升LLM推理能力,在Qwen3-8B上超越强基线。
Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps 85
Tags:
推理优化模型效率注意力机制Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出 RTPurbo 方法,仅需数百步训练即可将全注意力 LLM 转化为稀疏注意力,实现长上下文推理近无损精度和高达 9.36 倍加速。
Item Response Scaling Laws: A Measurement Theory Approach for Efficient and Generalizable Neural Scaling Estimation 85
Tags:
研究缩放定律模型评估效率提升Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出项目反应缩放定律(IRSL),融合项目反应理论,将缩放定律评估所需问题数减少99.9%,仅用50题即可达到同等或更优决策准确率,极大降低计算成本。
The Amplifying Mirror: Locating and Steering the Partisan Direction inside a Large Language Model 85
Tags:
模型可解释性AI安全大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
论文证明大语言模型中的党派偏见是可在激活空间中精确定位和操控的几何特征,通过中间层线性探测和稀疏自编码器实现因果干预,揭示模型生成偏见的本质。
Memory Beyond Recall: A Dual-Process Cognitive Memory System for Self-Evolving LLM Agents 85
Tags:
智能体大模型认知架构推理优化Source:
arXiv Computation and Language| 阅读原文
[摘要]
论文提出DCPM,一种基于双过程理论的LLM代理认知记忆系统,通过System1记录信念演化、System2归纳跨域模式,在跨会话推理基准上显著提升性能(最高+5.20)。
PBSD: Privileged Bayesian Self-Distillation for Long-Horizon Credit Assignment 85
Tags:
强化学习智能体信用分配自蒸馏Source:
arXiv Computation and Language| 阅读原文
[摘要]
PBSD提出贝叶斯自蒸馏方法,解决长程智能体任务中稀疏奖励下的细粒度信用分配问题,通过将评估结果信号转化为步骤级信用信号,提升策略学习与泛化能力。
Late-Layer Fusion is Enough: Dual-Path Vision Token Routing for Multimodal Large Language Models under Visual Saturation 85
Tags:
多模态大模型推理优化研究发布Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出DPVR-LF方法,发现多模态大模型中视觉token在深层饱和,通过将视觉token路由到单层侧分支并在最后融合,仅需3%可训练参数即保持性能并减少计算量,挑战了视觉token必须经过全部深层的假设。
Mechanistic Data Attribution: Tracing the Training Origins of Interpretable LLM Units 85
Tags:
可解释性大模型训练数据因果推理Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出 Mechanistic Data Attribution (MDA) 框架,通过影响函数追溯大模型可解释单元的训练数据来源,实验因果验证干预高影响样本可调控可解释头涌现,为模型开发提供新方法论。
The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes 82
Tags:
研究训练数据影响高效方法Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
提出镜像影响假设,利用前向传播高效估计训练数据对模型预测的影响,在扩散模型、数据泄露检测等场景验证,大幅提升计算效率。
Intrinsic Selection and Particle Resampling for Inference-Time Scaling Beyond Domain Verifiability 82
Tags:
推理优化大模型研究论文Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
提出内在选择与粒子重采样的推理时缩放方法,无需外部验证器即可在非可验证领域(工程设计、临床)提升推理质量,分别实现20%和26.5%的性能提升。
Imagination Helps Visual Reasoning, But Not Yet in Latent Space 82
Tags:
大模型多模态推理研究Source:
arXiv Computation and Language| 阅读原文
[摘要]
论文通过因果中介分析发现多模态大模型潜在空间视觉推理存在因果断连,提出显式文本想象方法CapImagine,性能显著优于潜在空间方法。
里程碑式德国裁决:Google AI Overviews 被视为谷歌自身言论,需为错误回答承担责任 80
Tags:
政策监管AI安全公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
德国法院裁定Google对AI概览内容承担直接法律责任,不可援引原有有限责任保护,可能为全球AI内容责任认定树立先例。
Luma AI Ray3.2:方向进,电影出 80
Tags:
模型发布视频生成产品更新Source:
AI HOT 精选| 阅读原文
[摘要]
Luma AI 发布 Ray3.2 视频生成模型,支持方向控制生成高质量电影级视频,提升创作效率。
台湾考虑限制AI芯片对华出口以配合美国 80
Tags:
芯片算力政策监管Source:
AI HOT 精选| 阅读原文
[摘要]
台湾拟收紧AI芯片对大陆出口以配合美国限制,或影响全球AI芯片供应链格局。