Skip to content

AI & ML 2026-3-4

AI训练效率再突破,24小时完成文本生成图像模型训练;Gemini 3.1 Flash-Lite发布,聚焦大规模智能应用,性能与速度双重优化。

PRX Part 3 — Training a Text-to-Image Model in 24h! 92

  • Tags: 扩散模型 文本到图像 像素空间训练 感知损失 高效训练

  • Source: HuggingFace | 阅读原文

[摘要]
通过整合多项训练优化技术,在32张H200 GPU上实现24小时完成512→1024像素文本到图像扩散模型的高效训练,验证了像素空间直接建模与感知损失的有效性。


Gemini 3.1 Flash-Lite: Built for intelligence at scale 87

  • Tags: 大模型 轻量化模型 推理优化 高吞吐 多模态理解

  • Source: DeepMind | 阅读原文

[摘要]
Gemini 3.1 Flash-Lite 提出一种高性价比、低延迟的轻量级大模型架构,支持可调节推理深度,在保持高质量输出的同时显著提升吞吐效率,适用于大规模实时开发场景。