扩散模型（Diffusion Model）

概念定义
详细解释
工作原理
实际应用
相关概念
延伸阅读

概念定义

扩散模型是一类生成式AI模型，通过模拟物理扩散过程，先将数据（如图像）逐步加噪至纯噪声，再学习逆向去噪过程，从噪声中重构出高质量的数据样本。

详细解释

扩散模型的核心思想源于热力学中的扩散过程。模型包含两个过程：正向扩散过程将原始数据逐步添加高斯噪声直至完全破坏；逆向扩散过程则学习从噪声中逐步重构原始数据。这种设计使模型能够生成高质量、多样化的样本。 DDPM（2020）奠定了现代扩散模型基础，随后发展出DDIM、Score-based Models等变体。Stable Diffusion（2022）通过在潜在空间而非像素空间操作，大幅降低了计算成本，使高分辨率图像生成成为可能。DALL-E 2（2022）将CLIP与扩散模型结合，实现了高质量的文本到图像生成。 2025年的重要进展包括：Stable Diffusion 3.5采用多模态扩散Transformer架构和流匹配技术；FLUX.1系列由前Stability AI团队开发，在提示遵循和真实感方面达到新高度；Midjourney V6增强了一致性风格生成；GPT-4o将扩散能力集成到多模态系统中。视频生成方面，FLUX正在开发SOTA级别的文本到视频模型。

工作原理

实际应用

文本到图像生成：DALL-E 3、Midjourney、Stable Diffusion等商业应用
图像编辑：局部重绘、风格转换、图像修复和超分辨率
艺术创作：概念设计、数字艺术、广告创意、游戏美工
视频生成：文本到视频、图像动画、视频插帧和增强
时尚设计：服装设计、产品原型、建筑可视化
医学影像：合成训练数据、图像增强、病灶模拟
虚拟现实：场景生成、材质贴图、3D资产创建
教育培训：可视化教学材料、历史场景重建

基础概念

学习范式

推理与能力

基础架构

主流模型

特殊架构

训练技术

应用实践

最佳实践

开发框架

评估工具

基础设施

百科专题

扩散模型（Diffusion Model）

概念定义

详细解释

工作原理

实际应用

相关概念

延伸阅读

基础概念

学习范式

推理与能力

基础架构

主流模型

特殊架构

训练技术

应用实践

最佳实践

开发框架

评估工具

基础设施

百科专题

​概念定义

​详细解释

​工作原理

​实际应用

​相关概念

​延伸阅读

概念定义

详细解释

工作原理

实际应用

相关概念

延伸阅读