Skip to content

2026-06-19

Anthropic Project Fetch 第二阶段:Claude Opus 4.7 自主操控四足机器人完成任务,速度比人类团队快约20倍,编码量减少近10倍,体现通用模型规模化在机器人领域的突破。 首个基于统一‘科学语法’的多领域科学生成大模型 LOGOS-1B 正式开源,在六大科学任务上超越领域专用方法,包括配体生成超越3D扩散模型、逆合成预测Top…

Anthropic Project Fetch 第二阶段:Claude Opus 4.7 自主完成任务,速度比人类团队快约20倍 85

  • Tags: 模型能力 机器人 公司动态 研究进展

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Anthropic Project Fetch 第二阶段:Claude Opus 4.7 自主操控四足机器人完成任务,速度比人类团队快约20倍,编码量减少近10倍,体现通用模型规模化在机器人领域的突破。


首个统一科学大模型 LOGOS 正式开源 85

  • Tags: 模型发布 开源生态 科学AI

  • Source: AI HOT 精选 | 阅读原文

[摘要]
首个基于统一‘科学语法’的多领域科学生成大模型 LOGOS-1B 正式开源,在六大科学任务上超越领域专用方法,包括配体生成超越3D扩散模型、逆合成预测Top-1准确率74.8%等,已开源权重与代码。


LLM Compression by Block Removal with Constrained Binary Optimization 85

  • Tags: 模型压缩 推理优化 LLM效率 开源生态

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
新方法将LLM块移除建模为约束二值优化,在50%压缩下MMLU提升23%,高效且架构通用。


JetFlow: Breaking the Scaling Ceiling of Speculative Decoding with Parallel Tree Drafting 85

  • Tags: 推理优化 大模型 开源生态

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出JetFlow推测性解码框架,通过并行树草稿突破缩放上限,在Qwen3模型上实现最高9.64倍加速,集成vLLM,代码与模型开源。


Native Active Perception as Reasoning for Omni-Modal Understanding 85

  • Tags: 全模态智能体 模型发布 推理优化 多模态

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
全模态智能体OmniAgent发布,通过主动感知推理实现高效视频理解,7B模型超越72B Qwen2.5-VL,验证了test-time scaling有效性。


OpenAI IPO前连下两城:招揽Transformer共同作者及前白宫AI政策官员 82

  • Tags: 公司动态 AI安全 政策监管 大模型

  • Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI 在 IPO 前招揽 Transformer 共同作者 Noam Shazeer 及前白宫 AI 政策官员 Dean Ball,强化前沿研究与政策治理,凸显战略布局与人才竞争。


Hilbert-Geo: Solving Solid Geometric Problems by Neural-Symbolic Reasoning 82

  • Tags: AI研究 推理优化 多模态 开源生态

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出Hilbert-Geo形式语言框架与Parse2Reason方法,在立体几何推理任务显著超越GPT-5等模型,并开源代码和数据集。


GraphPO: Graph-based Policy Optimization for Reasoning Models 82

  • Tags: 强化学习 推理优化 模型训练

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
GraphPO提出基于图的策略优化框架,将推理模型采样表示为有向无环图,合并语义等价路径,降低优势估计方差并提升探索效率,实验超越链式或树式基线。


LLMZero: Discovering Adaptive Training Strategies for RL Post-Training via LLM Agents 82

  • Tags: 训练方法 强化学习 智能体 模型优化

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
LLMZero使用LLM代理通过树搜索自动发现RL后训练自适应策略,发现容量参数单调增长、正则化参数振荡的跨任务规律,在GRPO任务上提升9%-140%,优于网格搜索。


STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability 82

  • Tags: 大模型 训练方法 推理优化 开源生态

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
STARE通过基于惊讶度的令牌级优势重加权,稳定策略熵,在GRPO训练中显著提升LLM推理性能,在AIME24/25上比DAPO高4%-8%,代码已开源。


Grok TTS 盲测人类感得分96登顶 80

  • Tags: 模型发布 语音生成 公司动态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
xAI的Grok TTS在语音盲测中获96分,接近真人水平,登顶Humanness Index,展现语音合成重大突破。


OpenAI 联合多国医生:GPT-5.5 Instant 健康问答能力追平前沿 Thinking 模型 80

  • Tags: 大模型 产品发布 AI医疗

  • Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI联合全球医生提升GPT-5.5 Instant健康问答能力,追平前沿推理模型,面向所有免费用户开放,惠及广泛用户。


我国首部L3/L4自动驾驶强制性国标公示:2027年7月起实施 80

  • Tags: 政策监管 自动驾驶 AI安全

  • Source: AI HOT 精选 | 阅读原文

[摘要]
工信部公示我国首部L3/L4自动驾驶强制性国标,要求安全水平达“合格且专注驾驶人”,引入Safety Case机制,2027年7月起实施,规范人机交接与风险处置。


ChatGPT 图像生成器可被绕过滤镜生成暴力和色情内容 80

  • Tags: AI安全 公司动态 模型安全

  • Source: AI HOT 精选 | 阅读原文

[摘要]
红队研究发现ChatGPT图像生成器可被简单提示绕过内容过滤器,生成性暴力、血腥等露骨图像,暴露OpenAI内容过滤缺陷与AI安全风险。


Noam Shazeer 离开 Google 加入 OpenAI 80

  • Tags: 公司动态 人才流动 AI行业格局

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Transformer 作者之一 Noam Shazeer 离开 Google 加入 OpenAI,对 Gemini 团队是重大打击,凸显顶级人才竞争白热化。


Dimension-Free Convergence of Discrete Diffusion Models: Adjoint Equations Induce the Right Space 80

  • Tags: 模型研究 扩散模型 收敛理论

  • Source: arXiv Statistics - Machine Learning | 阅读原文

[摘要]
离散扩散模型的收敛性理论取得突破,提出无维度依赖的统一框架,摆脱了状态空间大小的影响,对语言等大词汇量生成任务有重要理论意义。


苹果 Xcode 27 核心首次深度集成 AI 智能体:支持自然语言修 Bug、构建 App 80

  • Tags: 产品发布 AI编程 公司动态 智能体

  • Source: AI HOT 精选 | 阅读原文

[摘要]
苹果在WWDC 2026发布Xcode 27,首次深度集成AI智能体,支持自然语言跨文件修Bug和构建完整应用,并接入Anthropic、OpenAI等第三方模型,强化AI编程能力。


Depth-Width tradeoffs in Algorithmic Reasoning of Graph Tasks with Transformers 80

  • Tags: 模型研究 推理优化 Transformer

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
研究发现Transformer在解决图算法任务时,线性增加宽度可使深度常数化,大幅提升推理与训练效率,挑战了传统深度优先的设计范式。


Enhancing Multilingual Reasoning via Steerable Model Merging 80

  • Tags: 模型合并 多语言推理 研究

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
提出可引导模型合并框架ST-Merge,通过门控交叉注意力自适应调节源模型贡献,在21种语言的多语言推理基准上优于强基线。


Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregation 80

  • Tags: 检索增强 模型优化 长文档

  • Source: arXiv Computation and Language | 阅读原文

[摘要]
DICE通过分块证据聚合解决长文档单向量检索中关键信息被稀释的问题,在LongEmbed基准上长片段检索性能大幅提升,展示了一种实用的文档级编码策略。