Skip to content

2026-06-22

美团上线tabbit国际版,免费集成GPT-5.5、Claude Opus 4.8等海外及国内旗舰模型,旨在抢占AI入口,当前处于免费推广阶段。 llama.cpp提交PR优化多步预测(MTP)与推测解码,提升推理效率,增强开源推理基础设施。 ggml 优化 Intel AMX 指令集加速量化推理,在 Sapphire Rapids CPU 上实现最高 1.…

美团tabbit国际版免费接入GPT-5.5/Claude Opus 4.8等旗舰模型 75

  • Tags: 产品发布 公司动态 大模型

  • Source: AI HOT 精选 | 阅读原文

[摘要]
美团上线tabbit国际版,免费集成GPT-5.5、Claude Opus 4.8等海外及国内旗舰模型,旨在抢占AI入口,当前处于免费推广阶段。


b9745 65

  • Tags: 推理优化 开源生态

  • Source: GitHub Release - llama.cpp | 阅读原文

[摘要]
llama.cpp提交PR优化多步预测(MTP)与推测解码,提升推理效率,增强开源推理基础设施。


b9735 65

  • Tags: 推理优化 开源生态 芯片算力

  • Source: GitHub Release - llama.cpp | 阅读原文

[摘要]
ggml 优化 Intel AMX 指令集加速量化推理,在 Sapphire Rapids CPU 上实现最高 1.47 倍性能提升,提升 CPU 运行大模型效率。


开源教程《Deep Agents 实战》发布 65

  • Tags: 开源生态 智能体 产品发布

  • Source: AI HOT 精选 | 阅读原文

[摘要]
LangChain 官方认证大使推出开源教程《Deep Agents 实战》,基于 LangChain/LangGraph 生态,讲解三层架构构建真实 Agent 应用,覆盖虚拟文件系统、任务规划等模块,适合开发者学习 Agent 开发实践。


b9747 62

  • Tags: 大模型 开源生态 推理优化

  • Source: GitHub Release - llama.cpp | 阅读原文

[摘要]
llama.cpp新增实时模型加载进度跟踪接口,支持SSE推送,提升开发者对本地大模型推理过程的监控能力。