2026-06-19
Anthropic Project Fetch 第二阶段:Claude Opus 4.7 自主操控四足机器人完成任务,速度比人类团队快约20倍,编码量减少近10倍,体现通用模型规模化在机器人领域的突破。 首个基于统一‘科学语法’的多领域科学生成大模型 LOGOS-1B 正式开源,在六大科学任务上超越领域专用方法,包括配体生成超越3D扩散模型、逆合成预测Top…
Anthropic Project Fetch 第二阶段:Claude Opus 4.7 自主完成任务,速度比人类团队快约20倍 85
Tags:
模型能力机器人公司动态研究进展Source:
AI HOT 精选| 阅读原文
[摘要]
Anthropic Project Fetch 第二阶段:Claude Opus 4.7 自主操控四足机器人完成任务,速度比人类团队快约20倍,编码量减少近10倍,体现通用模型规模化在机器人领域的突破。
首个统一科学大模型 LOGOS 正式开源 85
Tags:
模型发布开源生态科学AISource:
AI HOT 精选| 阅读原文
[摘要]
首个基于统一‘科学语法’的多领域科学生成大模型 LOGOS-1B 正式开源,在六大科学任务上超越领域专用方法,包括配体生成超越3D扩散模型、逆合成预测Top-1准确率74.8%等,已开源权重与代码。
LLM Compression by Block Removal with Constrained Binary Optimization 85
Tags:
模型压缩推理优化LLM效率开源生态Source:
arXiv Computation and Language| 阅读原文
[摘要]
新方法将LLM块移除建模为约束二值优化,在50%压缩下MMLU提升23%,高效且架构通用。
JetFlow: Breaking the Scaling Ceiling of Speculative Decoding with Parallel Tree Drafting 85
Tags:
推理优化大模型开源生态Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出JetFlow推测性解码框架,通过并行树草稿突破缩放上限,在Qwen3模型上实现最高9.64倍加速,集成vLLM,代码与模型开源。
Native Active Perception as Reasoning for Omni-Modal Understanding 85
Tags:
全模态智能体模型发布推理优化多模态Source:
arXiv Computation and Language| 阅读原文
[摘要]
全模态智能体OmniAgent发布,通过主动感知推理实现高效视频理解,7B模型超越72B Qwen2.5-VL,验证了test-time scaling有效性。
OpenAI IPO前连下两城:招揽Transformer共同作者及前白宫AI政策官员 82
Tags:
公司动态AI安全政策监管大模型Source:
AI HOT 精选| 阅读原文
[摘要]
OpenAI 在 IPO 前招揽 Transformer 共同作者 Noam Shazeer 及前白宫 AI 政策官员 Dean Ball,强化前沿研究与政策治理,凸显战略布局与人才竞争。
Hilbert-Geo: Solving Solid Geometric Problems by Neural-Symbolic Reasoning 82
Tags:
AI研究推理优化多模态开源生态Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出Hilbert-Geo形式语言框架与Parse2Reason方法,在立体几何推理任务显著超越GPT-5等模型,并开源代码和数据集。
GraphPO: Graph-based Policy Optimization for Reasoning Models 82
Tags:
强化学习推理优化模型训练Source:
arXiv Computation and Language| 阅读原文
[摘要]
GraphPO提出基于图的策略优化框架,将推理模型采样表示为有向无环图,合并语义等价路径,降低优势估计方差并提升探索效率,实验超越链式或树式基线。
LLMZero: Discovering Adaptive Training Strategies for RL Post-Training via LLM Agents 82
Tags:
训练方法强化学习智能体模型优化Source:
arXiv Computation and Language| 阅读原文
[摘要]
LLMZero使用LLM代理通过树搜索自动发现RL后训练自适应策略,发现容量参数单调增长、正则化参数振荡的跨任务规律,在GRPO任务上提升9%-140%,优于网格搜索。
STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability 82
Tags:
大模型训练方法推理优化开源生态Source:
arXiv Computation and Language| 阅读原文
[摘要]
STARE通过基于惊讶度的令牌级优势重加权,稳定策略熵,在GRPO训练中显著提升LLM推理性能,在AIME24/25上比DAPO高4%-8%,代码已开源。
Grok TTS 盲测人类感得分96登顶 80
Tags:
模型发布语音生成公司动态Source:
AI HOT 精选| 阅读原文
[摘要]
xAI的Grok TTS在语音盲测中获96分,接近真人水平,登顶Humanness Index,展现语音合成重大突破。
OpenAI 联合多国医生:GPT-5.5 Instant 健康问答能力追平前沿 Thinking 模型 80
Tags:
大模型产品发布AI医疗Source:
AI HOT 精选| 阅读原文
[摘要]
OpenAI联合全球医生提升GPT-5.5 Instant健康问答能力,追平前沿推理模型,面向所有免费用户开放,惠及广泛用户。
我国首部L3/L4自动驾驶强制性国标公示:2027年7月起实施 80
Tags:
政策监管自动驾驶AI安全Source:
AI HOT 精选| 阅读原文
[摘要]
工信部公示我国首部L3/L4自动驾驶强制性国标,要求安全水平达“合格且专注驾驶人”,引入Safety Case机制,2027年7月起实施,规范人机交接与风险处置。
ChatGPT 图像生成器可被绕过滤镜生成暴力和色情内容 80
Tags:
AI安全公司动态模型安全Source:
AI HOT 精选| 阅读原文
[摘要]
红队研究发现ChatGPT图像生成器可被简单提示绕过内容过滤器,生成性暴力、血腥等露骨图像,暴露OpenAI内容过滤缺陷与AI安全风险。
Noam Shazeer 离开 Google 加入 OpenAI 80
Tags:
公司动态人才流动AI行业格局Source:
AI HOT 精选| 阅读原文
[摘要]
Transformer 作者之一 Noam Shazeer 离开 Google 加入 OpenAI,对 Gemini 团队是重大打击,凸显顶级人才竞争白热化。
Dimension-Free Convergence of Discrete Diffusion Models: Adjoint Equations Induce the Right Space 80
Tags:
模型研究扩散模型收敛理论Source:
arXiv Statistics - Machine Learning| 阅读原文
[摘要]
离散扩散模型的收敛性理论取得突破,提出无维度依赖的统一框架,摆脱了状态空间大小的影响,对语言等大词汇量生成任务有重要理论意义。
苹果 Xcode 27 核心首次深度集成 AI 智能体:支持自然语言修 Bug、构建 App 80
Tags:
产品发布AI编程公司动态智能体Source:
AI HOT 精选| 阅读原文
[摘要]
苹果在WWDC 2026发布Xcode 27,首次深度集成AI智能体,支持自然语言跨文件修Bug和构建完整应用,并接入Anthropic、OpenAI等第三方模型,强化AI编程能力。
Depth-Width tradeoffs in Algorithmic Reasoning of Graph Tasks with Transformers 80
Tags:
模型研究推理优化TransformerSource:
arXiv Computation and Language| 阅读原文
[摘要]
研究发现Transformer在解决图算法任务时,线性增加宽度可使深度常数化,大幅提升推理与训练效率,挑战了传统深度优先的设计范式。
Enhancing Multilingual Reasoning via Steerable Model Merging 80
Tags:
模型合并多语言推理研究Source:
arXiv Computation and Language| 阅读原文
[摘要]
提出可引导模型合并框架ST-Merge,通过门控交叉注意力自适应调节源模型贡献,在21种语言的多语言推理基准上优于强基线。
Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregation 80
Tags:
检索增强模型优化长文档Source:
arXiv Computation and Language| 阅读原文
[摘要]
DICE通过分块证据聚合解决长文档单向量检索中关键信息被稀释的问题,在LongEmbed基准上长片段检索性能大幅提升,展示了一种实用的文档级编码策略。