2026-06-22
美团上线tabbit国际版,免费集成GPT-5.5、Claude Opus 4.8等海外及国内旗舰模型,旨在抢占AI入口,当前处于免费推广阶段。 llama.cpp提交PR优化多步预测(MTP)与推测解码,提升推理效率,增强开源推理基础设施。 ggml 优化 Intel AMX 指令集加速量化推理,在 Sapphire Rapids CPU 上实现最高 1.…
美团tabbit国际版免费接入GPT-5.5/Claude Opus 4.8等旗舰模型 75
Tags:
产品发布公司动态大模型Source:
AI HOT 精选| 阅读原文
[摘要]
美团上线tabbit国际版,免费集成GPT-5.5、Claude Opus 4.8等海外及国内旗舰模型,旨在抢占AI入口,当前处于免费推广阶段。
b9745 65
Tags:
推理优化开源生态Source:
GitHub Release - llama.cpp| 阅读原文
[摘要]
llama.cpp提交PR优化多步预测(MTP)与推测解码,提升推理效率,增强开源推理基础设施。
b9735 65
Tags:
推理优化开源生态芯片算力Source:
GitHub Release - llama.cpp| 阅读原文
[摘要]
ggml 优化 Intel AMX 指令集加速量化推理,在 Sapphire Rapids CPU 上实现最高 1.47 倍性能提升,提升 CPU 运行大模型效率。
开源教程《Deep Agents 实战》发布 65
Tags:
开源生态智能体产品发布Source:
AI HOT 精选| 阅读原文
[摘要]
LangChain 官方认证大使推出开源教程《Deep Agents 实战》,基于 LangChain/LangGraph 生态,讲解三层架构构建真实 Agent 应用,覆盖虚拟文件系统、任务规划等模块,适合开发者学习 Agent 开发实践。
b9747 62
Tags:
大模型开源生态推理优化Source:
GitHub Release - llama.cpp| 阅读原文
[摘要]
llama.cpp新增实时模型加载进度跟踪接口,支持SSE推送,提升开发者对本地大模型推理过程的监控能力。