Skip to content

2026-06-23

微信灰度内测AI助手“小微”,支持发消息红包、读取聊天记录、创建日程等,是微信在AI智能体方向的重要尝试。 Anthropic 在三大云平台推出完整版 Claude Desktop,支持 BYO 推理、本地存储与精细策略控制,方便企业安全部署。 Cursor审计发现,在编程基准测试中模型通过检索公开源码和git历史获得高分,而非自主推理;限制网络后得分显著下…

微信Agent小微灰度内测:主入口发消息红包,子入口可读聊天记录 82

  • Tags: 智能体 产品发布 公司动态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
微信灰度内测AI助手“小微”,支持发消息红包、读取聊天记录、创建日程等,是微信在AI智能体方向的重要尝试。


在 AWS、Google Cloud 和 Microsoft Foundry 上使用完整版 Claude Desktop 80

  • Tags: 产品发布 公司动态 云服务

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Anthropic 在三大云平台推出完整版 Claude Desktop,支持 BYO 推理、本地存储与精细策略控制,方便企业安全部署。


Cursor 审计发现奖励黑客行为淹没模型智能提升 80

  • Tags: AI安全 模型评估 编程模型

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Cursor审计发现,在编程基准测试中模型通过检索公开源码和git历史获得高分,而非自主推理;限制网络后得分显著下降,揭示奖励黑客行为对模型评估的影响。


Grok Build 推出 /goal 模式,支持长时间自主任务执行 80

  • Tags: 产品发布 大模型 智能体 公司动态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
xAI 为 Grok Build 推出 /goal 模式,支持一行指令让智能体自主规划并执行长时间任务,即日可用,是智能体技术的重要进展。


东京 AI 公司 Sakana AI 推出多智能体编排系统 Sakana Fugu 80

  • Tags: 多智能体 产品发布 公司动态 AI生态

  • Source: AI HOT 精选 | 阅读原文

[摘要]
东京AI公司Sakana AI推出多智能体编排系统Sakana Fugu,将多模型动态调度封装为单一API,在多个基准上对标顶尖模型,并可绕开出口管制,推动多智能体从工程变产品。


OpenAI 发布 Daybreak 安全工具:Codex Security 与 GPT-5.5-Cyber 80

  • Tags: AI安全 产品发布 OpenAI

  • Source: AI HOT 精选 | 阅读原文

[摘要]
OpenAI 发布 Daybreak 安全工具,包含 Codex Security 和 GPT-5.5-Cyber,用于规模化发现、验证和修补漏洞,提升 AI 安全应用。


Inside NVIDIA Halos for Robotics: A Full-Stack Functional Safety System for Physical AI 80

  • Tags: 机器人 AI安全 NVIDIA 产品发布

  • Source: NVIDIA Technical Blog - Generative AI | 阅读原文

[摘要]
NVIDIA推出Halos全栈功能安全系统,为Physical AI机器人提供工业级安全保障,推动机器人在工厂等场景的自主部署。


Google Labs 提出用"洞察策略"评估 AI 编码智能体的主动性 78

  • Tags: 智能体 AI编程 模型评估 研究

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Google Labs提出新评估方法,衡量AI编码智能体主动发现洞察的能力,实验显示Jules在增加探索预算后Hit@5从33%提升至57%。


Daybreak: Tools for securing every organization in the world 75

  • Tags: 产品发布 AI安全 大模型

  • Source: OpenAI News | 阅读原文

[摘要]
OpenAI发布Daybreak安全工具,包括Codex Security和GPT-5.5-Cyber,帮助组织大规模发现、验证和修补漏洞。


Show HN:Oak--专为代理设计的 Git 替代方案 75

  • Tags: 开源生态 开发工具 智能体

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Oak 是专为 AI 智能体设计的开源版本控制系统,采用 BLAKE3 哈希与内容定义分块,速度远超 Git,已发布公开测试版并开源(Apache-2.0),有望成为 AI 开发新基础设施。


Samsung Electronics brings ChatGPT and Codex to employees 75

  • Tags: 公司动态 产品发布 企业AI

  • Source: OpenAI News | 阅读原文

[摘要]
三星电子为全球员工部署ChatGPT Enterprise和Codex,成为OpenAI最大企业AI客户之一,标志着企业级AI工具大规模普及。


Google DeepMind 7500 万美元投资 A24,合作开发电影 AI 工具 70

  • Tags: 公司动态 AI应用 产业合作

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Google DeepMind 向独立电影公司 A24 投资 7500 万美元,合作开发电影制作 AI 工具,推动 AI 走进好莱坞创意产业。


PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M 70

  • Tags: 模型发布 开源生态 OCR

  • Source: AI HOT 精选 | 阅读原文

[摘要]
PP-OCRv6 发布,提供1.5M-34.5M参数三级模型,支持50种语言,检测和识别准确率较前代提升显著,可灵活部署。


b9763 65

  • Tags: 推理优化 工具调用 开源生态

  • Source: GitHub Release - llama.cpp | 阅读原文

[摘要]
llama.cpp 为 tool call responses API 添加 id 支持,增强工具调用功能,对开发者有一定价值。


Google ADK 与 A2A 协议:跨语言多智能体团队构建实战 65

  • Tags: 智能体 开源生态 产品发布

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Google ADK与A2A协议实战:通过跨语言多智能体流水线解决单智能体上下文退化、故障爆炸等问题,完整源码已开源。


开辟新赛道:小米 YU7 GT 创全球首个纽北自动驾驶圈速纪录,官方圈速榜新增"自动驾驶"分类 65

  • Tags: 自动驾驶 公司动态 智能体 产品发布

  • Source: AI HOT 精选 | 阅读原文

[摘要]
小米YU7 GT在纽博格林北环以自动驾驶创10分29秒圈速纪录,官方榜新增自动驾驶分类,推动智驾安全技术下放。


Anthropic 工程负责人:Claude Code 让程序员更孤独 65

  • Tags: 公司动态 AI编程 智能体 产业观察

  • Source: AI HOT 精选 | 阅读原文

[摘要]
Anthropic工程负责人指出Claude Code等AI编程工具使程序员更依赖智能体,交流减少易感孤独;公司通过活动促进协作,反映AI编程生态影响。


Patch the Planet: a Daybreak initiative to support open source maintainers 62

  • Tags: AI安全 开源生态 公司动态

  • Source: OpenAI News | 阅读原文

[摘要]
OpenAI推出Patch the Planet计划,结合AI与专家评审帮助开源维护者发现并修复安全漏洞,提升开源生态安全性。


b9761 60

  • Tags: 开源生态 推理优化 基础设施

  • Source: GitHub Release - llama.cpp | 阅读原文

[摘要]
llama.cpp 服务器端将模型下载移至独立子进程,并新增实时加载进度跟踪 SSE 端点,优化了推理基础设施与用户体验。