2026-06-11
美国法院裁定Google需为其AI模型产生的幻觉内容承担法律责任,此判决可能重塑AI责任框架,影响全球AI监管走向。 百度百舸与复旦提出LU-KV框架,将KV Cache预算分配建模为长程边际效用优化问题,显著降低显存和延迟,被ICML 2026录用。 摩尔线程开源 MusaCoder 代码大模型,含9B/27B参数,基于国产GPU全链路训练,在Kernel…
突发:Google 因模型幻觉被判负有法律责任 85
Tags:
政策监管AI安全公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
美国法院裁定Google需为其AI模型产生的幻觉内容承担法律责任,此判决可能重塑AI责任框架,影响全球AI监管走向。
百度百舸联合复旦提出LU-KV框架,被ICML 2026录用 85
Tags:
推理优化大模型模型推理Source:
AI HOT 精选| 阅读原文
[摘要]
百度百舸与复旦提出LU-KV框架,将KV Cache预算分配建模为长程边际效用优化问题,显著降低显存和延迟,被ICML 2026录用。
摩尔线程开源 MusaCoder 代码大模型,9B/27B 参数基于国产 GPU 全链路训练 85
Tags:
模型发布开源生态芯片算力Source:
AI HOT 精选| 阅读原文
[摘要]
摩尔线程开源 MusaCoder 代码大模型,含9B/27B参数,基于国产GPU全链路训练,在KernelBench评测中超越Claude Opus等主流代码模型,展现国产算力与代码生成能力突破。
KCSAT-ML: Probing Reasoning Models with Nationwide-Cohort Human Difficulty 85
Tags:
模型评测推理能力对齐数据集Source:
arXiv Computation and Language| 阅读原文
[摘要]
韩国数学高考十年数据构建推理基准KCSAT-ML,引入DRG指标揭示模型在人类困难与简单题目上的对齐失败现象,为推理评估提供新视角。
ParaBridge: Bridging Paralinguistic Perception and Dialogue Behavior in Speech Language Models 85
Tags:
推理优化AI安全语音模型研究发布Source:
arXiv Computation and Language| 阅读原文
[摘要]
ParaBridge提出on-policy自蒸馏方法,使语音语言模型稳定利用副语言线索(如语气、背景噪声)指导对话回复,安全性提升140%,情感评分提升20%,保持通用能力。
Harnessing the Collective Intelligence of AI Agents in the Wild for New Discoveries 85
Tags:
多智能体AI研究科学发现Source:
arXiv Computation and Language| 阅读原文
[摘要]
EinsteinArena平台让AI智能体在开放数学问题中协作,已取得12项新SOTA结果,包括改进11维接吻数下界,展示去中心化科学发现新范式。
RAG over Thinking Traces Can Improve Reasoning Tasks 85
Tags:
RAG推理优化研究Source:
arXiv Computation and Language| 阅读原文
[摘要]
新研究提出用问题求解的中间思考轨迹替代文档进行检索,显著提升大模型在AIME、LiveCodeBench等推理任务上的表现,挑战了RAG对推理无益的共识。
CodeAlchemy: Synthetic Code Rewriting at Scale 82
Tags:
大模型代码生成合成数据推理优化Source:
arXiv Computation and Language| 阅读原文
[摘要]
CodeAlchemy提出大规模合成代码数据生成框架,通过5种策略生成500B+ tokens和350B推理tokens,使3B模型在代码任务上超越27B模型,揭示前沿模型语义理解差距。
Does Reasoning Preserve Alignment? On the Trustworthiness of Large Reasoning Models 82
Tags:
AI安全推理对齐Source:
arXiv Computation and Language| 阅读原文
[摘要]
研究揭示推理优化可能破坏模型对齐,导致毒性、偏见、隐私泄露等安全风险上升。
Anthropic 研究:AI 数小时内即可从安全补丁构建漏洞利用 80
Tags:
AI安全研究公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
Anthropic研究显示其AI模型数小时内即可从安全补丁自动生成漏洞利用代码,成本仅数千美元,威胁传统补丁机制,凸显AI安全新风险。
华为云发布全球首个端到端具身AI平台CloudRobo 80
Tags:
产品发布机器人大模型华为云Source:
AI HOT 精选| 阅读原文
[摘要]
华为云发布全球首个端到端具身AI平台CloudRobo,覆盖数据、模型到部署全生命周期,推动人形机器人快速开发与落地。
Rank Collapse, Fixed Points, and the Renormalization Group Structure of MLP Residual Networks 80
Tags:
AI研究模型理论深度学习残差网络Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
研究首次定量证实MLP残差网络实现选择性的重正化群粗粒化过程:残差流秩单调下降且与输入谱结构相关。
Magnetar用数百AI智能体替代分析师 80
Tags:
智能体公司动态金融AISource:
AI HOT 精选| 阅读原文
[摘要]
对冲基金Magnetar Capital用数百AI智能体替代人类分析师进行股票研究,AI负责搜索、分析、推荐,人类仅批准交易,展现金融业AI落地新进展。
SPACR: Single-Pass Adaptive Training of Uncertainty-Aware Conformal Regressors 80
Tags:
不确定性量化共形预测训练方法Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
SPACR提出单次训练共形回归器,直接优化区间效率和有效性,无需多置信水平重训练,性能更优且计算成本更低。
It Takes One to Bias Them All: Breaking Bad with One-Shot GRPO 80
Tags:
大模型AI安全研究进展Source:
arXiv Computation and Language| 阅读原文
[摘要]
研究发现,仅用单一样本进行GRPO训练即可系统性破坏大模型对齐,引发刻板印象偏见,揭示后训练安全重大漏洞。
Density Field State Space Models: 1-Bit Distillation, Efficient Inference, and Knowledge Organization in Mamba-2 80
Tags:
模型压缩推理优化SSM高效部署Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出密度场状态空间模型(DF-SSM),将Mamba-2 1.3B模型压缩至1-bit,大小减少9.7倍,推理加速21.4倍,仅需32M tokens蒸馏,性能接近BitMamba-2,兼具高效部署与知识组织分析价值。
PADD: Path-Aligned Decompression Distillation for Non-Router Teacher to Guide MoE Student Learning 80
Tags:
训练方法模型蒸馏MoE大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出PADD框架,实现从无路由密集教师到MoE学生的知识蒸馏,在数学推理上超越强基线,相同推理成本下学生匹配或超越教师。
Prefilling-dLLM: Predictive Prefilling for Long-Context Inference in Diffusion Language Models 80
Tags:
推理优化模型发布开源生态长上下文Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出Prefilling-dLLM,针对扩散语言模型长上下文推理的免训练预填充-解码分离框架,通过分块缓存和稀疏注意实现9-28倍加速,并解决中间丢失问题。
LC-QAT: Data-Efficient 2-Bit QAT for LLMs via Linear-Constrained Vector Quantization 80
Tags:
模型发布推理优化大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出LC-QAT,一种用于大语言模型的2比特权重向量量化感知训练框架,通过线性约束向量量化实现全微分端到端优化,数据效率高,性能超越当前最优方法。
Attention Amnesia in Hybrid LLMs: When CoT Fine-Tuning Breaks Long-Range Recall, and How to Fix It 80
Tags:
模型训练推理优化长上下文Source:
arXiv Computation and Language| 阅读原文
[摘要]
发现CoT微调会破坏混合线性注意力模型的长上下文记忆,提出QK-Restore方法零训练代价恢复长程检索能力且保持推理性能。