2026-06-30
美团LongCat发布1.6万亿MoE模型Owl Alpha,在OpenRouter上最流行,使用35万亿tokens在5万块国产ASIC上训练,性能达Gemini/Opus 4.6级别,体现国产算力与模型能力突破。 SK集团宣布到2035年建设15GW AI数据中心,总投资1000万亿韩元(约4.4万亿元),旨在打造韩国AI基础设施底座,推动产业转型。 美…
美团LongCat Owl Alpha:OpenRouter最流行模型,1.6万亿MoE,国产ASIC训练 88
Tags:
模型发布大模型芯片算力公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
美团LongCat发布1.6万亿MoE模型Owl Alpha,在OpenRouter上最流行,使用35万亿tokens在5万块国产ASIC上训练,性能达Gemini/Opus 4.6级别,体现国产算力与模型能力突破。
SK 集团会长崔泰源:到 2035 年建设 15GW AI 数据中心,总投资达 1000 万亿韩元 88
Tags:
算力产业政策公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
SK集团宣布到2035年建设15GW AI数据中心,总投资1000万亿韩元(约4.4万亿元),旨在打造韩国AI基础设施底座,推动产业转型。
美军用AI选目标却误炸伊朗学校,Anthropic Claude嵌入Palantir系统首日建议约1000目标 85
Tags:
AI安全政策监管军事AI大模型Source:
AI HOT 精选| 阅读原文
[摘要]
美军首次大规模使用AI选择目标,Anthropic Claude嵌入Palantir系统首日建议约1000目标,但因情报数据库未连接导致误炸学校引发伦理监管讨论。
Can Generative Artificial Intelligence Survive Data Contamination? Theoretical Guarantees under Contaminated Recursive Training 85
Tags:
AI安全理论分析训练稳定性Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
该论文首次提供理论保证,证明在自生成数据污染下模型仍能收敛到真实分布,揭示数据有限与模型有限之间的相变,对AI长期稳定性有重要指导意义。
The Context-Ready Transformer 85
Tags:
模型发布推理优化Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出 Context-Ready Transformer,通过预上下文化 token 和校正链实现高性能推理加速,D=5 模型比 12 层 Transformer 快 1.7 倍,单层模型可超越 6 层 Transformer 并快 2.6 倍。
Supersede: Diagnosing and Training the Memory-Update Gap in LLM Agents 85
Tags:
智能体记忆更新模型训练研究发布Source:
arXiv Computation and Language| 阅读原文
[摘要]
研究揭示LLM智能体在长程对话中记忆更新存在显著失败(准确率从92%降至77%),并开源强化学习环境Supersede,通过GRPO微调小模型使准确率翻倍。
三星和SK海力士计划投资5900亿美元扩产芯片,AI需求推高内存价格 82
Tags:
芯片算力公司动态产业趋势Source:
AI HOT 精选| 阅读原文
[摘要]
三星和SK海力士计划投资5900亿美元扩产芯片,AI需求推动内存价格预计持续上涨至2028年,影响全球AI基础设施成本。
Training-free Truthfulness Detection via Sparse MLP Value Vectors 82
Tags:
研究论文大模型推理优化AI安全Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出TruthV方法,利用稀疏MLP值向量进行无需训练的真值检测,性能超越现有基线,为LLM事实性判断提供新思路。
LiveClawBench: Benchmarking LLM Agents on Complex, Real-World Assistant Tasks 82
Tags:
智能体基准测试模型发布开源生态Source:
arXiv Computation and Language| 阅读原文
[摘要]
LiveClawBench发布,可执行134个跨10领域的智能体任务,提升评估真实性与可复现性,推动LLM助手从工具调用向开放软件环境进化。
Claude 在 Microsoft Foundry 正式可用 80
Tags:
模型发布产品发布公司动态云服务Source:
AI HOT 精选| 阅读原文
[摘要]
Claude 模型(Opus 4.8 和 Haiku 4.5)在 Microsoft Foundry 正式可用,运行于 Azure 和 NVIDIA GB300 GPU,支持提示缓存与扩展思考,Azure 用户可统一计费并计入承诺消费。
为 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway 80
Tags:
产品发布企业级多云AI安全Source:
AI HOT 精选| 阅读原文
[摘要]
Anthropic 推出 Claude apps gateway,一个自托管控制平面,支持企业在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code,提供企业级 SSO、策略管理和消费上限,增强多云部署与安全性。
Rubin Ultra取消,新版尺寸性能减半 80
Tags:
芯片算力公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
NVIDIA取消原4-die Rubin Ultra,新版本尺寸与性能减半,可能影响AI算力供应格局。
b9840 80
Tags:
开源生态模型推理DeepSeekSource:
GitHub Release - llama.cpp| 阅读原文
[摘要]
llama.cpp 合并 DeepSeek V4 模型支持,可在多种硬件上本地推理,推动开源生态发展。
Meta发布Brain2Qwerty v2:非侵入式实时句子解码 80
Tags:
模型发布AI研究脑机接口MetaSource:
AI HOT 精选| 阅读原文
[摘要]
Meta发布Brain2Qwerty v2,基于Nature论文实现非侵入式实时句子解码,从字符级提升到单词和语义,有望帮助失语者恢复沟通能力。
VGB for Masked Diffusion Model: Efficient Test-time Scaling for Reward Satisfaction and Sample Editing 80
Tags:
模型研究推理优化扩散模型Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
MDM-VGB提出了一种基于回溯马尔可夫链的奖励引导遮罩扩散模型推理缩放方法,理论上优于Best-of-N,并在Sudoku等约束满足任务上取得强实证效果
ELF: Embedded Language Flows 80
Tags:
扩散模型语言建模模型发布Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出ELF,一种基于连续嵌入空间的流匹配扩散语言模型,在少步采样下取得优于现有离散/连续DLMs的生成质量。
Random Matrix Theory for Deep Learning: Beyond Eigenvalues of Linear Models 80
Tags:
大模型理论推理优化模型理解Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
该论文扩展随机矩阵理论到非线性深度学习模型,提出“高维等价”框架,统一分析线性/非线性网络性能,揭示缩放定律与双重下降等关键现象,为高维学习理论提供本质洞察。
RateQuant: Optimal Mixed-Precision KV Cache Quantization via Rate-Distortion Theory 80
Tags:
推理优化模型压缩大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
RateQuant 提出基于率失真理论的最优混合精度 KV Cache 量化方法,解决不同量化器失真模型失配问题,在 2.5 平均比特下将 KIVI 困惑度从 49.3 降至 14.9,大幅提升大模型推理效率。
Yuvion LLM: An Adversarially-Aware Large Language Model for Content And AI Safety 80
Tags:
模型发布AI安全对抗性鲁棒性Source:
arXiv Computation and Language| 阅读原文
[摘要]
Yuvion LLM发布:一个将对抗性鲁棒性及智能体能力作为核心目标的语言模型,配合93项安全评估,证明其8B参数版本在安全任务上超过GPT-5.4等大模型。
Masked Language Flow Models 80
Tags:
模型发布大模型推理优化Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出掩码语言流模型(MLFM),融合掩码扩散与连续流,实现快速并行生成并支持多步推理,首次在GSM8K和MT-Bench上验证了流式语言模型扩展到复杂推理任务的能力。