2026-06-19

Anthropic Project Fetch 第二阶段：Claude Opus 4.7 自主操控四足机器人完成任务，速度比人类团队快约20倍，编码量减少近10倍，体现通用模型规模化在机器人领域的突破。首个基于统一‘科学语法’的多领域科学生成大模型 LOGOS-1B 正式开源，在六大科学任务上超越领域专用方法，包括配体生成超越3D扩散模型、逆合成预测Top…

Anthropic Project Fetch 第二阶段：Claude Opus 4.7 自主完成任务，速度比人类团队快约20倍 85

Tags: 模型能力 机器人 公司动态 研究进展
Source: AI HOT 精选 | 阅读原文

[摘要]
Anthropic Project Fetch 第二阶段：Claude Opus 4.7 自主操控四足机器人完成任务，速度比人类团队快约20倍，编码量减少近10倍，体现通用模型规模化在机器人领域的突破。

首个统一科学大模型 LOGOS 正式开源 85

Tags: 模型发布 开源生态 科学AI
Source: AI HOT 精选 | 阅读原文

[摘要]
首个基于统一‘科学语法’的多领域科学生成大模型 LOGOS-1B 正式开源，在六大科学任务上超越领域专用方法，包括配体生成超越3D扩散模型、逆合成预测Top-1准确率74.8%等，已开源权重与代码。

LLM Compression by Block Removal with Constrained Binary Optimization 85

Tags: 模型压缩 推理优化 LLM效率 开源生态
Source: arXiv Computation and Language | 阅读原文

[摘要]
新方法将LLM块移除建模为约束二值优化，在50%压缩下MMLU提升23%，高效且架构通用。

JetFlow: Breaking the Scaling Ceiling of Speculative Decoding with Parallel Tree Drafting 85

Tags: 推理优化 大模型 开源生态
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出JetFlow推测性解码框架，通过并行树草稿突破缩放上限，在Qwen3模型上实现最高9.64倍加速，集成vLLM，代码与模型开源。

Tags: 全模态智能体 模型发布 推理优化 多模态
Source: arXiv Computation and Language | 阅读原文

[摘要]
全模态智能体OmniAgent发布，通过主动感知推理实现高效视频理解，7B模型超越72B Qwen2.5-VL，验证了test-time scaling有效性。

OpenAI IPO前连下两城：招揽Transformer共同作者及前白宫AI政策官员 82

Tags: 公司动态 AI安全 政策监管 大模型
Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI 在 IPO 前招揽 Transformer 共同作者 Noam Shazeer 及前白宫 AI 政策官员 Dean Ball，强化前沿研究与政策治理，凸显战略布局与人才竞争。

Hilbert-Geo: Solving Solid Geometric Problems by Neural-Symbolic Reasoning 82

Tags: AI研究 推理优化 多模态 开源生态
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出Hilbert-Geo形式语言框架与Parse2Reason方法，在立体几何推理任务显著超越GPT-5等模型，并开源代码和数据集。

GraphPO: Graph-based Policy Optimization for Reasoning Models 82

Tags: 强化学习 推理优化 模型训练
Source: arXiv Computation and Language | 阅读原文

[摘要]
GraphPO提出基于图的策略优化框架，将推理模型采样表示为有向无环图，合并语义等价路径，降低优势估计方差并提升探索效率，实验超越链式或树式基线。

LLMZero: Discovering Adaptive Training Strategies for RL Post-Training via LLM Agents 82

Tags: 训练方法 强化学习 智能体 模型优化
Source: arXiv Computation and Language | 阅读原文

[摘要]
LLMZero使用LLM代理通过树搜索自动发现RL后训练自适应策略，发现容量参数单调增长、正则化参数振荡的跨任务规律，在GRPO任务上提升9%-140%，优于网格搜索。

STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability 82

Tags: 大模型 训练方法 推理优化 开源生态
Source: arXiv Computation and Language | 阅读原文

[摘要]
STARE通过基于惊讶度的令牌级优势重加权，稳定策略熵，在GRPO训练中显著提升LLM推理性能，在AIME24/25上比DAPO高4%-8%，代码已开源。

Grok TTS 盲测人类感得分96登顶 80

Tags: 模型发布 语音生成 公司动态
Source: AI HOT 精选 | 阅读原文

[摘要]
xAI的Grok TTS在语音盲测中获96分，接近真人水平，登顶Humanness Index，展现语音合成重大突破。

OpenAI 联合多国医生：GPT-5.5 Instant 健康问答能力追平前沿 Thinking 模型 80

Tags: 大模型 产品发布 AI医疗
Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI联合全球医生提升GPT-5.5 Instant健康问答能力，追平前沿推理模型，面向所有免费用户开放，惠及广泛用户。

我国首部L3/L4自动驾驶强制性国标公示：2027年7月起实施 80

Tags: 政策监管 自动驾驶 AI安全
Source: AI HOT 精选 | 阅读原文

[摘要]
工信部公示我国首部L3/L4自动驾驶强制性国标，要求安全水平达“合格且专注驾驶人”，引入Safety Case机制，2027年7月起实施，规范人机交接与风险处置。

ChatGPT 图像生成器可被绕过滤镜生成暴力和色情内容 80

Tags: AI安全 公司动态 模型安全
Source: AI HOT 精选 | 阅读原文

[摘要]
红队研究发现ChatGPT图像生成器可被简单提示绕过内容过滤器，生成性暴力、血腥等露骨图像，暴露OpenAI内容过滤缺陷与AI安全风险。

Noam Shazeer 离开 Google 加入 OpenAI 80

Tags: 公司动态 人才流动 AI行业格局
Source: AI HOT 精选 | 阅读原文

[摘要]
Transformer 作者之一 Noam Shazeer 离开 Google 加入 OpenAI，对 Gemini 团队是重大打击，凸显顶级人才竞争白热化。

Dimension-Free Convergence of Discrete Diffusion Models: Adjoint Equations Induce the Right Space 80

Tags: 模型研究 扩散模型 收敛理论
Source: arXiv Statistics - Machine Learning | 阅读原文

[摘要]
离散扩散模型的收敛性理论取得突破，提出无维度依赖的统一框架，摆脱了状态空间大小的影响，对语言等大词汇量生成任务有重要理论意义。

苹果 Xcode 27 核心首次深度集成 AI 智能体：支持自然语言修 Bug、构建 App 80

Tags: 产品发布 AI编程 公司动态 智能体
Source: AI HOT 精选 | 阅读原文

[摘要]
苹果在WWDC 2026发布Xcode 27，首次深度集成AI智能体，支持自然语言跨文件修Bug和构建完整应用，并接入Anthropic、OpenAI等第三方模型，强化AI编程能力。

Depth-Width tradeoffs in Algorithmic Reasoning of Graph Tasks with Transformers 80

Tags: 模型研究 推理优化 Transformer
Source: arXiv Computation and Language | 阅读原文

[摘要]
研究发现Transformer在解决图算法任务时，线性增加宽度可使深度常数化，大幅提升推理与训练效率，挑战了传统深度优先的设计范式。

Enhancing Multilingual Reasoning via Steerable Model Merging 80

Tags: 模型合并 多语言推理 研究
Source: arXiv Computation and Language | 阅读原文

[摘要]
提出可引导模型合并框架ST-Merge，通过门控交叉注意力自适应调节源模型贡献，在21种语言的多语言推理基准上优于强基线。

Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregation 80

Tags: 检索增强 模型优化 长文档
Source: arXiv Computation and Language | 阅读原文

[摘要]
DICE通过分块证据聚合解决长文档单向量检索中关键信息被稀释的问题，在LongEmbed基准上长片段检索性能大幅提升，展示了一种实用的文档级编码策略。

2026-06-19 ​

Anthropic Project Fetch 第二阶段：Claude Opus 4.7 自主完成任务，速度比人类团队快约20倍 85 ​

首个统一科学大模型 LOGOS 正式开源 85 ​

LLM Compression by Block Removal with Constrained Binary Optimization 85 ​

JetFlow: Breaking the Scaling Ceiling of Speculative Decoding with Parallel Tree Drafting 85 ​

Native Active Perception as Reasoning for Omni-Modal Understanding 85 ​

OpenAI IPO前连下两城：招揽Transformer共同作者及前白宫AI政策官员 82 ​

Hilbert-Geo: Solving Solid Geometric Problems by Neural-Symbolic Reasoning 82 ​

GraphPO: Graph-based Policy Optimization for Reasoning Models 82 ​

LLMZero: Discovering Adaptive Training Strategies for RL Post-Training via LLM Agents 82 ​

STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability 82 ​

Grok TTS 盲测人类感得分96登顶 80 ​

OpenAI 联合多国医生：GPT-5.5 Instant 健康问答能力追平前沿 Thinking 模型 80 ​

我国首部L3/L4自动驾驶强制性国标公示：2027年7月起实施 80 ​

ChatGPT 图像生成器可被绕过滤镜生成暴力和色情内容 80 ​

Noam Shazeer 离开 Google 加入 OpenAI 80 ​

Dimension-Free Convergence of Discrete Diffusion Models: Adjoint Equations Induce the Right Space 80 ​

苹果 Xcode 27 核心首次深度集成 AI 智能体：支持自然语言修 Bug、构建 App 80 ​

Depth-Width tradeoffs in Algorithmic Reasoning of Graph Tasks with Transformers 80 ​

Enhancing Multilingual Reasoning via Steerable Model Merging 80 ​

Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregation 80 ​

2026-06-19

Anthropic Project Fetch 第二阶段：Claude Opus 4.7 自主完成任务，速度比人类团队快约20倍 85

首个统一科学大模型 LOGOS 正式开源 85

LLM Compression by Block Removal with Constrained Binary Optimization 85

JetFlow: Breaking the Scaling Ceiling of Speculative Decoding with Parallel Tree Drafting 85

Native Active Perception as Reasoning for Omni-Modal Understanding 85

OpenAI IPO前连下两城：招揽Transformer共同作者及前白宫AI政策官员 82

Hilbert-Geo: Solving Solid Geometric Problems by Neural-Symbolic Reasoning 82

GraphPO: Graph-based Policy Optimization for Reasoning Models 82

LLMZero: Discovering Adaptive Training Strategies for RL Post-Training via LLM Agents 82

STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability 82

Grok TTS 盲测人类感得分96登顶 80

OpenAI 联合多国医生：GPT-5.5 Instant 健康问答能力追平前沿 Thinking 模型 80

我国首部L3/L4自动驾驶强制性国标公示：2027年7月起实施 80

ChatGPT 图像生成器可被绕过滤镜生成暴力和色情内容 80

Noam Shazeer 离开 Google 加入 OpenAI 80

Dimension-Free Convergence of Discrete Diffusion Models: Adjoint Equations Induce the Right Space 80

苹果 Xcode 27 核心首次深度集成 AI 智能体：支持自然语言修 Bug、构建 App 80

Depth-Width tradeoffs in Algorithmic Reasoning of Graph Tasks with Transformers 80

Enhancing Multilingual Reasoning via Steerable Model Merging 80

Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregation 80