2026-06-29
开源模型生态多元化,NVIDIA发布Nemotron-3-Ultra-550B MoE模型并改用OpenMDW许可证,Cohere以Apache 2.0开源218B参数Command A+模型,具备多模态与智能体能力。 xAI 的 Grok 4.5 模型在 SpaceX 和 Tesla 私测,性能接近或超越 Opus,基于 1.5T 参数基础模型,强化学习和…
Artifacts 22:Zyphra、Cohere 和 Poolside 正在扩展生态系统广度 85
Tags:
模型发布开源生态大模型Source:
AI HOT 精选| 阅读原文
[摘要]
开源模型生态多元化,NVIDIA发布Nemotron-3-Ultra-550B MoE模型并改用OpenMDW许可证,Cohere以Apache 2.0开源218B参数Command A+模型,具备多模态与智能体能力。
Grok 4.5 私测于 SpaceX 和 Tesla,性能接近 Opus 85
Tags:
模型发布公司动态大模型Source:
AI HOT 精选| 阅读原文
[摘要]
xAI 的 Grok 4.5 模型在 SpaceX 和 Tesla 私测,性能接近或超越 Opus,基于 1.5T 参数基础模型,强化学习和工具链持续优化,SpaceX 将每月发布全新模型。
仅有三个AI模型在500天创业测试中盈利超过起始资本 75
Tags:
智能体模型评估研究Source:
AI HOT 精选| 阅读原文
[摘要]
普林斯顿大学CEO-Bench测试AI智能体运营软件公司500天,仅Claude和GPT最新模型盈利超过起始资本,揭示AI长期战略决策能力的差距。
新浪开源VibeThinker-3B:推理可压缩,事实知识不能 70
Tags:
模型发布开源生态推理优化研究Source:
AI HOT 精选| 阅读原文
[摘要]
新浪开源仅3B参数的VibeThinker-3B,在数学编程基准上持平大它数百倍的模型,提出推理可压缩但事实知识不可压缩的假说。
"Raise Us"启动:前美商务部长与四州合作筹集10亿美元应对AI就业冲击 70
Tags:
政策监管AI安全产业变化Source:
AI HOT 精选| 阅读原文
[摘要]
前美商务部长等发起非营利 Raise Us,联合亚马逊、Anthropic、微软、OpenAI 等筹集10亿美元,用于在四州试点AI就业冲击下的工人再培训,反映产业与政策协同应对自动化影响。
AI 账单失控后 DeepSeek 成"香饽饽",部分美国企业已 100% 切换 70
Tags:
公司动态产业变化模型应用Source:
AI HOT 精选| 阅读原文
[摘要]
因AI账单失控,美国企业Lindy等全面转向DeepSeek,通过模型路由优化成本,反应AI商业落地中的成本压力与模型竞争新趋势。
b9828 65
Tags:
推理优化开源生态模型部署Source:
GitHub Release - llama.cpp| 阅读原文
[摘要]
针对llama.cpp等OpenCL后端Flash Attention进行性能重写与优化,新增f16/f32及量化类型支持,降低本地推理延迟。
四大顶级AI对决《文明VI》:Claude核平法国仍输,暴露感知与执行短板 65
Tags:
智能体模型评测AI能力Source:
AI HOT 精选| 阅读原文
[摘要]
四大顶级AI模型在《文明VI》中对决,暴露感知盲区与知行差距,只有1-2%时间检查全局状态、执行率不足66%,揭示复杂任务中感知与执行是当前AI关键短板。
苹果Vision负责人跳槽OpenAI,触控OLED MacBook用M5芯片 65
Tags:
公司动态AI硬件高管变动OpenAISource:
AI HOT 精选| 阅读原文
[摘要]
苹果Vision产品副总裁Paul Meade将离职加入OpenAI硬件部门,同时苹果计划推出触控OLED MacBook搭载M5芯片,核心高管流失至OpenAI凸显AI硬件竞争加速。
Runway API 推出广告本地化 Recipe 65
Tags:
产品发布API视频生成Source:
AI HOT 精选| 阅读原文
[摘要]
Runway API 推出广告本地化 Recipe,支持单次调用翻译静态广告和图形资产,提升跨语言广告制作效率。
Wayfinder Router:在本地和托管的大语言模型之间进行确定性查询路由 62
Tags:
推理优化开源生态基础设施Source:
AI HOT 精选| 阅读原文
[摘要]
Wayfinder Router 是一种微秒级离线查询路由器,通过分析提示词结构而非调用模型来决定路由,显著降低延迟和成本,支持多种 API,适合多模型部署场景。
b9831 55
Tags:
推理优化开源生态Source:
GitHub Release - llama.cpp| 阅读原文
[摘要]
llama.cpp 新增 DFlash 支持,优化滑动窗口注意力计算,提升推理性能,适用于多种硬件平台。
b9833 55
Tags:
开源生态模型支持推理框架Source:
GitHub Release - llama.cpp| 阅读原文
[摘要]
llama.cpp 新增对 MiniCPM5 模型的完整解析与模板支持,提升该多模态模型的开源推理可用性。
一次失败的(民族国家?)攻击的剖析 55
Tags:
AI安全供应链安全开源生态Source:
AI HOT 精选| 阅读原文
[摘要]
一次针对Rust开发者的供应链攻击被揭露:攻击者伪造VC面试邮件,诱导执行含后门(PinpinRAT)的TypeScript代码,目标窃取crates.io包。事件凸显AI生态中的安全风险。
阿里千问输入法上线 macOS 版:最快 300 字/分,AI 自动润色 55
Tags:
产品发布AI应用大模型Source:
AI HOT 精选| 阅读原文
[摘要]
阿里千问输入法上线macOS版,支持AI语音输入、自动润色及9种方言,填补千问在独立AI输入法产品空白。