11 文生图Stable Diffusion:生成第一个图像的基础用法
系列进度
Stable Diffusion 教程 · 第 11 / 18 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
文生图学习要同时看输入描述、生成流程、参数影响和最终用途。阅读时可以按「一、准备工作 -> 二、生成第一个图像 -> 加载模型 -> 准备输入文本」建立结构,再回到正文里的代码、案例或指标做验证。
读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「一、准备工作」,再查「二、生成第一个图像」。
在前一篇文章中,我们介绍了如何使用API调用Stable Diffusion来生成图像。本文将深入探索基础的生成用法,并通过简单的示例引导你成功生成你的第一个图像。
一、准备工作
在生成图像之前,确保你已经安装了相关的库和工具,包括Stable Diffusion的模型和所需的Python库,比如torch、transformers和diffusers。如果还未安装,可以使用以下命令:
生成第一张 Stable Diffusion 图像时,先固定模型、提示词、尺寸、步数、种子和保存目录。
pip install torch transformers diffusers
二、生成第一个图像
在Stable Diffusion中,生成图像的基本步骤包括加载模型、准备输入文本以及执行生成过程。我们来看看如何一步步实现。
看完《文生图Stable Diffusion:生成第一个图像的基础用法》后,建议用一分钟复盘:关键概念是否分清、练习步骤是否可复现、结论能不能换成自己的话。
1. 加载模型
首先,我们需要导入所需的库并加载Stable Diffusion的预训练模型:
import torch
from diffusers import StableDiffusionPipeline
# 设置设备为cuda以加速生成过程
device = "cuda" if torch.cuda.is_available() else "cpu"
# 加载Stable Diffusion模型
model_id = "CompVis/stable-diffusion-v1-4"
pipe = StableDiffusionPipeline.from_pretrained(model_id).to(device)
2. 准备输入文本
Stable Diffusion生成图像的关键是输入的文本提示。我们将定义一个简单的文本提示作为例子:
prompt = "A futuristic city skyline at sunset"
3. 执行图像生成
通过调用管道的__call__方法,我们可以生成图像:
# 生成图像
with torch.no_grad():
image = pipe(prompt).images[0]
# 保存生成的图像
image.save("futuristic_city_sunset.png")
在上面的代码中,生成的图像被保存为futuristic_city_sunset.png。你可以打开这个文件,欣赏一下Stable Diffusion生成的美丽图像。
4. 运行示例
将以上代码放入一个Python脚本中,并运行它。你应该会看到生成的图像文件在你的工作目录中。下面是完整的示例代码:
import torch
from diffusers import StableDiffusionPipeline
# 设置设备为cuda
device = "cuda" if torch.cuda.is_available() else "cpu"
# 加载模型
model_id = "CompVis/stable-diffusion-v1-4"
pipe = StableDiffusionPipeline.from_pretrained(model_id).to(device)
# 输入文本提示
prompt = "A futuristic city skyline at sunset"
# 生成图像
with torch.no_grad():
image = pipe(prompt).images[0]
# 保存图像
image.save("futuristic_city_sunset.png")
如果《文生图Stable Diffusion:生成第一个图像的基础用法》还没完全消化,可以从这张卡片的四个动作重新走一遍。
回看《文生图Stable Diffusion:生成第一个图像的基础用法》时,不必一次做大项目,先用一条简单样例确认主线是否清楚。
三、总结
通过上述步骤,你成功地生成了第一个图像。在使用Stable Diffusion时,需要特别注意输入的文本描述,它将直接影响生成图像的质量和内容。
在下一篇文章中,我们将深入探讨一些进阶技巧,比如如何使用可调参数和后处理策略来提升生成图像的效果。那么,准备好探索更多的可能性了吗?让我们一起前进!
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
文生图Stable Diffusion:生成第一个图像的基础用法适合谁读?
这是 Stable Diffusion 教程 系列第 11 / 18 篇,适合正在学习Stable Diffusion 教程,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇Stable Diffusion教程要多久?
按中文技术文章阅读速度估算,通读大约 3 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读