2026-06-17
DeepSeek完成首轮超500亿元外部融资,估值超500亿美元,创始人梁文锋表示优先AGI研发并坚持开源,腾讯、宁德时代参投,将对AI生态与竞争格局产生深远影响。 Nemotron 3 Ultra 开源,550B/55B参数混合Mamba-Transformer MoE模型,支持1M上下文,创新训练方法与更高推理吞吐,适合智能体任务。 SpaceX以600…
DeepSeek 完成首轮外部融资,估值超 500 亿美元 90
Tags:
公司动态大模型开源生态融资Source:
AI HOT 精选| 阅读原文
[摘要]
DeepSeek完成首轮超500亿元外部融资,估值超500亿美元,创始人梁文锋表示优先AGI研发并坚持开源,腾讯、宁德时代参投,将对AI生态与竞争格局产生深远影响。
Nemotron 3 Ultra: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning 90
Tags:
模型发布开源大模型推理优化Source:
arXiv Computation and Language| 阅读原文
[摘要]
Nemotron 3 Ultra 开源,550B/55B参数混合Mamba-Transformer MoE模型,支持1M上下文,创新训练方法与更高推理吞吐,适合智能体任务。
SpaceX 以 600 亿美元股票收购 AI 编程公司 Cursor 88
Tags:
公司动态AI编程投资收购Source:
AI HOT 精选| 阅读原文
[摘要]
SpaceX以600亿美元股票收购AI编程公司Cursor,旨在强化其xAI构建的AI部门,追赶主要AI实验室,标志着AI编程领域重大产业整合。
VibeThinker-3B: Exploring the Frontier of Verifiable Reasoning in Small Language Models 88
Tags:
模型发布推理优化小模型研究突破Source:
arXiv Computation and Language| 阅读原文
[摘要]
3B参数小模型VibeThinker-3B通过后训练优化,在可验证推理任务上达到前沿水平,超越DeepSeek V3.2等大模型,挑战“大模型才能强推理”认知。
五角大楼将大部分日常AI工作流从Anthropic转移,目标9月前完全切断 87
Tags:
AI安全政策监管公司动态军事应用Source:
AI HOT 精选| 阅读原文
[摘要]
五角大楼因Anthropic拒绝允许Claude用于监控和自动武器,将超2/3工作流转移至OpenAI,目标9月前完全切断,凸显AI军事伦理与政企合作冲突。
NVIDIA Blackwell Tops MLPerf Training 6.0 with Industry-Leading Scale and Performance 85
Tags:
芯片算力公司动态性能评测Source:
NVIDIA Technical Blog - Generative AI| 阅读原文
[摘要]
NVIDIA Blackwell在MLPerf Training 6.0中全面领先,展现行业最强AI训练性能与扩展能力。
Qwen-RobotWorld:具身智能体的无界世界 85
Tags:
具身智能大模型模型发布机器人Source:
AI HOT 精选| 阅读原文
[摘要]
阿里发布Qwen-RobotWorld,以语言为统一接口,采用双流MMDiT架构,在4个基准测试中取得顶尖成绩,统一20余种机器人形态,支持操作、自动驾驶等多任务联合训练。
Qwen-RobotManip:对齐解锁机器人操作基础模型的规模化能力 85
Tags:
模型发布大模型机器人智能体Source:
AI HOT 精选| 阅读原文
[摘要]
通义千问发布Qwen-RobotManip,基于Qwen-VL的VLA基础模型,通过对齐框架实现多机器人操作,在多个基准夺冠,推动机器人基础模型发展。
Qwen-RobotNav:面向智能体导航系统的可扩展导航模型 85
Tags:
模型发布智能体大模型机器人Source:
AI HOT 精选| 阅读原文
[摘要]
Qwen发布Qwen-RobotNav模型,统一五大导航任务并在多项基准取得SOTA,支持零样本部署于机器人,代表具身智能与导航的重要突破。
HyDRA: Hybrid Dynamic Routing Architecture for Heterogeneous LLM Pools 85
Tags:
模型路由推理优化工程实践GitHub CopilotSource:
arXiv Computation and Language| 阅读原文
[摘要]
HyDRA 混合动态路由架构,根据查询能力需求从异构LLM池中选择最廉价模型,已在 GitHub Copilot VS Code Chat 部署,实现质量提升与数倍成本节约。
Not All Skills Help: Measuring and Repairing Agent Knowledge 85
Tags:
智能体推理优化研究发布Source:
arXiv Computation and Language| 阅读原文
[摘要]
ASSAY框架通过测量技能因果贡献,在推理时抑制负面技能,显著提升LLM智能体任务完成率,DeepSeek-V3在AppWorld达69.3%新SOTA。
A Mechanistic Understanding of Pronoun Fidelity in LLMs 85
Tags:
AI研究大模型推理机制AI安全Source:
arXiv Computation and Language| 阅读原文
[摘要]
研究通过因果分析揭示LLM中代词准确性由组实体绑定、近期偏差和刻板偏差三种竞争机制实现,解释91-99.5%行为,对模型公平性和可解释性有重要意义。
Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models 85
Tags:
推理优化模型改进大模型Source:
arXiv Computation and Language| 阅读原文
[摘要]
Think-at-Hard提出选择性潜在迭代方法,通过轻量决策器触发深度感知LoRA模块,在九项基准上提升LLM推理能力3.8-6.8%,同时跳过93%令牌迭代,开源代码。
Focus When Necessary: Adaptive Routing and Collaborative Grounding for Training-Free Visual Grounding 85
Tags:
多模态视觉定位推理优化模型发布Source:
arXiv Computation and Language| 阅读原文
[摘要]
腾讯提出LazyMCoT,一种训练无关的动态视觉定位框架,通过自适应路由和协作定位精准处理复杂高分辨率图像,减少计算冗余,提升推理准确率和速度。
Metacognitive Myopia in Large Language Models 82
Tags:
AI安全大模型研究Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出元认知短视框架,解释LLM在信息环境中产生多种偏见的机制(集成无效嵌入、频率偏向等),并探讨通过隐式推理历史实现监控与控制,对AI安全与伦理有重要意义。
Ling and Ring 2.6 Technical Report: Efficient and Instant Agentic Intelligence at Trillion-Parameter Scale 82
Tags:
模型发布推理优化智能体开源生态Source:
arXiv Computation and Language| 阅读原文
[摘要]
Ling-2.6与Ring-2.6模型发布,通过混合线性注意力和KPop强化学习框架,实现高效推理与深层推理能力,支持万亿级参数智能体工作流,并完全开源。
VeriGraph: Towards Verifiable Data-Analytic Agents 82
Tags:
智能体推理优化研究前沿Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出VeriGraph框架,通过构建异构图DAG实现LLM数据分析智能体的可验证性,在多项基准上取得最优结果,是可验证智能体方向的重要进展。
项目负责人揭秘为何苹果 AI 版 Siri 姗姗来迟:推倒重来,彻底重构 82
Tags:
智能体公司动态大模型Source:
AI HOT 精选| 阅读原文
[摘要]
苹果AI版Siri因原方案无法实现产品愿景,选择从零重构基于大模型,支持多模态与全平台统一体验,项目负责人透露重构细节。
美国司法部援引国家安全为xAI未经许可的燃气轮机辩护 80
Tags:
公司动态政策监管AI安全Source:
AI HOT 精选| 阅读原文
[摘要]
美国司法部以Grok对军事行动至关重要为由,为xAI未经许可增加燃气轮机辩护;NAACP指控污染加剧,事件涉及AI用于国家安全与监管冲突。
Grok for PowerPoint 发布:在 Microsoft PowerPoint 内直接生成和编辑幻灯片 80
Tags:
产品发布公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
xAI 发布 Grok for PowerPoint 免费插件,能在 PowerPoint 内直接生成和编辑幻灯片,并支持 Word 和 Excel,提升办公效率。