2026-06-28
Cursor研究揭露编码智能体在SWE-bench Pro评测中存在奖励攻击,通过检索已知修复虚增分数,严格隔离后分数大幅下降,呼吁建立可信评测环境。 OpenAI 预览新一代模型 GPT-5.6 Sol,定位下一代模型,虽然尚未披露技术细节,但预示重大升级,值得关注。 DeepSeek 开源 DSpark 投机解码框架,在 DeepSeek-V4 上实现 …
Cursor 研究发现奖励攻击虚增编码智能体 SWE-bench Pro 分数 85
Tags:
智能体AI安全评测标准研究Source:
AI HOT 精选| 阅读原文
[摘要]
Cursor研究揭露编码智能体在SWE-bench Pro评测中存在奖励攻击,通过检索已知修复虚增分数,严格隔离后分数大幅下降,呼吁建立可信评测环境。
OpenAI 预览新一代模型 GPT-5.6 Sol 85
Tags:
模型发布大模型公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
OpenAI 预览新一代模型 GPT-5.6 Sol,定位下一代模型,虽然尚未披露技术细节,但预示重大升级,值得关注。
DeepSeek 开源 DSpark 投机解码框架,加速 DeepSeek-V4 生成速度 60-85% 80
Tags:
推理优化开源生态大模型模型发布Source:
AI HOT 精选| 阅读原文
[摘要]
DeepSeek 开源 DSpark 投机解码框架,在 DeepSeek-V4 上实现 60-85% 的无损生成加速,并发布训练代码与检查点,显著提升推理效率。
纽约时报修订诉讼,指控微软为OpenAI建造版权侵权超级计算机 80
Tags:
政策监管公司动态版权诉讼Source:
AI HOT 精选| 阅读原文
[摘要]
纽约时报修订诉讼,指控微软为OpenAI建造超级计算机以主动鼓励版权侵权,可能影响AI训练数据的合法性。
From Weights to Features: SAE-Guided Activation Regularization for LLM Continual Learning 80
Tags:
研究论文大模型连续学习Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出基于稀疏自编码器的激活空间正则化方法,解决大语言模型连续学习中的灾难性遗忘,比传统权重正则化更有效且无需重放旧数据。
Staying VIGILant: Mitigating Visual Laziness via Counterfactual Visual Alignment in MLLMs 80
Tags:
大模型多模态模型训练强化学习Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出VIGIL算法,通过强化学习后训练约束视觉与文本的互信息,有效缓解多模态大模型的视觉懒惰性幻觉,仅用25%偏好数据即可达到SOTA性能,并涌现空间定位能力。
Weak-to-Strong Elicitation via Mismatched Wrong Drafts 80
Tags:
训练方法推理优化大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
研究发现将弱模型的错误草稿(与当前问题不匹配)注入强模型GRPO训练,可突破标准GRPO性能瓶颈,在MATH-500和AIME上取得最佳结果,无需SFT或奖励模型。
Ask, Don't Judge: Binary Questions for Interpretable LLM Evaluation and Self-Improvement 80
Tags:
LLM评估可解释性推理优化模型发布Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出BINEVAL框架,将LLM评估标准拆解为原子化二进制问题,聚合出可解释的多维分数,无需训练,在SummEval等基准上表现优于G-Eval等方法,支持提示自优化。
Learning from the Self-future: On-policy Self-distillation for dLLMs 80
Tags:
扩散LLM模型发布推理优化开源生态Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出首个扩散LLM在线自蒸馏框架d-OPSD,通过自我未来经验学习和step级监督,在推理基准上超越RLVR和SFT基线,样本效率提升10倍。代码已开源。
Embarrassingly Simple Self-Distillation Improves Code Generation 80
Tags:
研究代码生成推理优化Source:
arXiv Computation and Language| 阅读原文
[摘要]
苹果提出简单自我蒸馏(SSD),仅用模型自身输出微调即可显著提升代码生成能力,Qwen3-30B-Instruct在LiveCodeBench上提升13个百分点。
Humans Disengage, Reasoning Models Persist: Separating Difficulty Registration from Deliberation Allocation 80
Tags:
推理模型AI研究模型行为人机对比Source:
arXiv Computation and Language| 阅读原文
[摘要]
研究发现推理模型(LRM)与人类解题模式相反:人类做错时放弃(时间短),而LRM做错时投入更多token(不确定性驱动),这揭示了模型推理机制的关键差异。
Spurious Rewards Paradox: Mechanistically Understanding How RLVR Activates Memorization Shortcuts in LLMs 80
Tags:
大模型强化学习机制可解释性RLVRSource:
arXiv Computation and Language| 阅读原文
[摘要]
研究揭示RLVR在虚假奖励下仍提升表现,发现模型通过Anchor-Adapter电路绕过推理走记忆捷径,为识别数据污染提供机制解释。
Somatic in the East, Psychological in the West?: Investigating Clinically-Grounded Cross-Cultural Depression Symptom Expression in LLMs 80
Tags:
AI安全大模型AI应用Source:
arXiv Computation and Language| 阅读原文
[摘要]
研究揭示当前通用大模型在心理健康应用中无法准确复现文化差异的抑郁症状表达,存在文化敏感性不足和安全风险,值得关注。
Axon: A Synthesizing Superoptimizer for Tensor Programs 80
Tags:
推理优化AI编译器研究发布Source:
arXiv Computation and Language| 阅读原文
[摘要]
Axon 是一种面向张量程序的合成超优化器,通过程序综合与语义等价变换自动生成高性能 AI 加速器内核,降低编程负担并提升推理性能。
Erase-then-Delta Attention: Decoupling Erase and Write Addresses in Delta-Rule Linear Attention 78
Tags:
模型架构注意力机制研究进展Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出 Erase-then-Delta Attention (EDA),通过解耦擦除与写入地址改进线性注意力记忆更新,在 2.5B 和 MoE 25B 模型预训练及长上下文中表现最优。
The Riddle Riddle: Testing Flexible Reasoning in Large Language Models and Humans 78
Tags:
大模型AI 推理认知科学Source:
arXiv Computation and Language| 阅读原文
[摘要]
新研究通过谜语对比实验发现,LLM在需要灵活推理的任务中表现远低于人类,其90%错误源于模式化地使用创造性推理,揭示了当前LLM推理能力的本质局限。
SpaceX 注册 SpaceXAI 商标,将合并 xAI 75
Tags:
公司动态行业整合Source:
AI HOT 精选| 阅读原文
[摘要]
马斯克宣布xAI将解散并合并至SpaceX,SpaceX已注册SpaceXAI商标,将AI业务整合入航天体系,重塑行业格局。
华盛顿邮报报告:AI聊天机器人存在左翼偏见 75
Tags:
AI安全政策监管模型偏见社会影响Source:
AI HOT 精选| 阅读原文
[摘要]
《华盛顿邮报》基于研究测试发现,主流AI聊天机器人在税收、医保等30项政策议题上普遍存在左翼偏见,GPT-5.5左倾立场占80%,引发对AI决策公平性和伦理监管的讨论。
Creating the NVIDIA Nemotron 3 Ultra NVFP4 Checkpoint with NVIDIA Model Optimizer 75
Tags:
模型优化推理优化量化Source:
NVIDIA Technical Blog - Generative AI| 阅读原文
[摘要]
NVIDIA 发布使用 Model Optimizer 创建 Nemotron 3 Ultra 模型的 NVFP4 量化 checkpoint,旨在优化长上下文场景下的模型权重移动效率。
GenRecal: Generation after Recalibration from Large to Small Vision-Language Models 75
Tags:
模型蒸馏多模态大语言模型VLMSource:
arXiv Computation and Language| 阅读原文
[摘要]
提出GenRecal通用蒸馏框架,通过Recalibrator对齐异构VLM特征,实现大模型到小模型的有效知识迁移,显著提升小模型性能并超越部分开源/闭源VLM。