Skip to content

2026-06-18

谷歌发布ARD开放规范,用于在Web上发布、发现和验证AI工具与智能体,支持加密验证和域名托管,推动智能体生态互操作性。 SGLang-JAX通过融合Pallas核优化Ling-2.6-1T在TPU上的MoE推理,预填充延迟降低53%,吞吐量超H200 GPU,展现TPU推理潜力。 NVIDIA GEAR实验室发布ENPIRE系统,用8个Codex智能体自主…

谷歌发布Agentic Resource Discovery(ARD)开放规范 85

  • Tags: 智能体 开源生态 公司动态 API发布

  • Source: AI HOT 精选 | 阅读原文

[摘要]
谷歌发布ARD开放规范,用于在Web上发布、发现和验证AI工具与智能体,支持加密验证和域名托管,推动智能体生态互操作性。


用SGLang-JAX在TPU上优化Ling-2.6-1T:一个Pallas核将MoE数据移动隐藏在计算中 85

  • Tags: 推理优化 芯片算力 模型推理 开源生态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
SGLang-JAX通过融合Pallas核优化Ling-2.6-1T在TPU上的MoE推理,预填充延迟降低53%,吞吐量超H200 GPU,展现TPU推理潜力。


NVIDIA GEAR实验室发布ENPIRE:8个Codex智能体自主控制机器人完成物理实验 85

  • Tags: 智能体 机器人 NVIDIA 开源生态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
NVIDIA GEAR实验室发布ENPIRE系统,用8个Codex智能体自主控制8台机器人完成高精度物理实验,实现全程无人运行并计划开源,推动AI自主科研与多智能体机器人协作。


Google 医学推理 AI 系统 AMIE 新研究:从诊断迈向长期疾病管理 85

  • Tags: 大模型 AI研究 医疗AI

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Google 的 AMIE 医学推理 AI 新研究登上《自然》,从单次诊断扩展至长期疾病管理,利用 Gemini 长上下文和双智能体架构,在计划精确性上超越初级医生。


Omnigent开源:AI智能体团队元框架 85

  • Tags: 开源生态 智能体 AI编程

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Databricks开源多智能体协作框架Omnigent,支持在统一会话中运行Claude Code、Codex等AI编程智能体团队,提升复杂任务协同效率。


GLM-5.2 上线并开源:专注 Coding 与长程任务 85

  • Tags: 模型发布 开源生态 大模型

  • Source: AI HOT 精选 | 阅读原文

[摘要]
智谱开源GLM-5.2,MIT协议,支持1M上下文,专注编码与长程任务,首日即在国产算力平台运行。


Anthropic 5月企业AI订阅份额首超OpenAI,特朗普政府禁令反促采用量创新高 85

  • Tags: 公司动态 政策监管 市场份额

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Anthropic企业AI订阅市场份额41%首超OpenAI,受特朗普禁令反促采用量创新高,公司估值9650亿美元并提交IPO。


Vercel 发布开源 AI 智能体框架 Eve:每个智能体就是一个文件目录 80

  • Tags: 开源生态 智能体 框架发布 产品发布

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Vercel 开源 AI 智能体框架 Eve,采用文件系统优先设计,每个智能体对应一个目录,内置持久执行、沙箱、人机审批等六项生产级能力,已在内部实现显著业务效果。


Anthropic与DeepMind CEO呼吁G7组建AI联盟排除中国 80

  • Tags: 政策监管 公司动态 AI安全

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Anthropic与DeepMind CEO在G7会议呼吁美国主导AI联盟,通过限制前沿模型和芯片获取排除中国,或重塑全球AI竞争格局。


A near-autonomous AI chemist improves a challenging reaction in medicinal chemistry 80

  • Tags: AI智能体 AI for Science 模型发布 公司动态

  • Source: OpenAI News | 阅读原文

[摘要]
OpenAI与Molecule.one合作,利用GPT-5.4驱动近自主AI化学家改进药物合成关键反应,展现AI在药物化学中的突破性应用。


LifeSciBench 发布 80

  • Tags: 模型评测 科研AI OpenAI 基准测试

  • Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI联合173位博士级科学家发布LifeSciBench,含750个现实研究任务,评估AI在复杂科学推理与多步分析中的实际能力。


Grok 4.3 在 Amazon Bedrock 正式可用 80

  • Tags: 模型发布 公司动态 推理优化 云平台

  • Source: AI HOT 精选 | 阅读原文

[摘要]
xAI 的 Grok 4.3 在 Amazon Bedrock 全量可用,拥有最低幻觉率、100万token上下文、可配置推理努力,多项基准第一且性价比领先。


Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem 80

  • Tags: 公司动态 产品发布 生态合作

  • Source: Anthropic News | 阅读原文

[摘要]
Anthropic 在首尔开设办公室,与 NAVER、Nexon、LG 等韩企建立合作,推动 Claude 在企业及开发者社区的广泛应用。


阿里云发布HappyOyster 1.0:一句话生成可实时交互的数字世界 80

  • Tags: 多模态 产品发布 实时交互 阿里云

  • Source: AI HOT 精选 | 阅读原文

[摘要]
阿里云发布开放式世界模型HappyOyster 1.0,支持多模态输入与实时交互,可一句话生成数字世界并持续响应指令,是AI多模态与实时生成的重要产品进展。


蚂蚁百灵发布 Ling & Ring 2.6 技术报告 80

  • Tags: 模型发布 开源生态 大模型

  • Source: AI HOT 精选 | 阅读原文

[摘要]
蚂蚁百灵发布Ling & Ring 2.6技术报告,开源三款模型(Ling-2.6-flash、Ling-2.6-1T、Ring-2.6-1T),采用Hybrid Linear Attention架构,Ling-2.6-flash解码速度达340 tokens/s,Ring-2.6-1T在PinchBench等基准取得高分。


FoundCause: Causal Discovery with Latent Confounders from Observational Data 80

  • Tags: 因果发现 因果推断 模型发布 研究

  • Source: arXiv Statistics - Machine Learning | 阅读原文

[摘要]
提出FoundCause,首个显式建模潜在混杂因子的摊销因果发现模型,在15个真实数据集上超越经典方法,F1提升9.6%,推理仅需一次前向。


Learning Upper Lower Value Envelopes to Shape Online RL: A Principled Approach 80

  • Tags: 强化学习 在线学习 理论框架

  • Source: arXiv Statistics - Machine Learning | 阅读原文

[摘要]
提出利用离线数据学习值函数上下界以加速在线强化学习的理论框架,具备严格遗憾界证明与实验验证,为离线预训练与在线微调提供理论桥梁。


小米 MiMo Claw 正式版发布:旗舰模型+金山办公,全新订阅服务上线 80

  • Tags: 模型发布 智能体 产品发布 大模型

  • Source: AI HOT 精选 | 阅读原文

[摘要]
小米发布搭载旗舰模型MiMo-V2.5-Pro的MiMo Claw正式版,支持MCP工具调用和百万级上下文,吞吐效率提升3倍,联动金山办公推出订阅服务。


公开聊天数据能否预测真实世界AI失调? 80

  • Tags: 模型评估 AI安全 数据集 研究方法

  • Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI利用WildChat公开数据集(100万条对话)预测GPT-5系列模型不良行为率,与真实生产对比误差约3倍,验证公开数据集作为外部审计工具的可行性,但对技术性失调预测精度下降。


微软考虑为 Copilot Cowork 集成 DeepSeek V4 80

  • Tags: 公司动态 大模型 模型发布

  • Source: AI HOT 精选 | 阅读原文

[摘要]
微软考虑在Copilot Cowork中集成DeepSeek V4作为低成本模型选项,同时转向按用量计费,反映大模型应用成本挑战与开源模型影响力提升。