12 深度学习入门：使用PyTorch构建你的第一个模型

Q: 深度学习入门：使用PyTorch构建你的第一个模型适合谁读？

这是 深度学习入门 系列第 12 / 24 篇，适合正在学习深度学习入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: 深度学习小白

预计阅读: 3 分钟

阅读次数: 0

系列进度

深度学习入门 · 第 12 / 24 篇

上一篇深度学习框架之Keras 下一篇数据清洗与准备

预计阅读3 分钟

结构重点9 个

图文要点6 张

正文规模1.4k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 9 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步PyTorch简介 02第 2 步PyTorch基础 03第 3 步小结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线深度学习入门：使用PyTorch构建你的第一个模型结构图跳到对应正文位置

图 02 · 步骤PyTorch 更像写普通程序核对图跳到对应正文位置

图 03 · 配置PyTorch首个模型判断卡跳到对应正文位置

图 04 · 判断深度学习阅读地图卡跳到对应正文位置

图 05 · 复盘深度学习入门：使用PyTorch构建你的第一个模型应用复盘卡跳到对应正文位置

图 06 · 细节深度学习入门：使用PyTorch构建你的第一个模型应用检查卡跳到对应正文位置

PyTorch 的优势是训练过程直观，很多步骤都能直接在代码里看见。新手不要怕训练循环，理解它反而能更快看清模型怎么学习。

第一次写 PyTorch 模型时，把每一步 shape 打出来：输入、模型输出、标签和 loss。shape 对了，很多错误就少一半。

在上一篇我们讨论了常用的深度学习框架之一——Keras，它因其简洁的API和即插即用的特性，使得模型构建变得轻松。不过，对于一些更为复杂的任务或需要更高灵活性的项目，PyTorch无疑是一个非常优秀的选择。本篇教程，我们将围绕PyTorch的基本知识，带你实践构建一个简单的深度学习模型。

PyTorch简介

PyTorch是一个开源的深度学习框架，由Facebook的人工智能研究小组开发。它提供了灵活的动态计算图和简洁的API，非常适合研究和实验。PyTorch的主要特点包括：

动态图（Dynamic Computation Graph）：允许你在运行时更改网络结构，这对需要频繁调试的研究者尤为重要。
强大的GPU支持：PyTorch能够利用GPU加速计算，使得大规模数据处理和训练更加高效。
社区活跃：有大量的教程和开源项目，便于学习和探索。

PyTorch基础

在开始构建模型之前，我们需要先安装PyTorch。可以通过以下命令进行安装：

pip install torch torchvision torchaudio

创建张量

在PyTorch中，最基本的构建单元是张量（Tensor）。张量可以看作是一个多维数组，与NumPy的数组类似。

import torch

# 创建一个1维张量
tensor_1d = torch.tensor([1, 2, 3, 4, 5])
print(tensor_1d)

# 创建一个2维张量
tensor_2d = torch.tensor([[1, 2, 3], [4, 5, 6]])
print(tensor_2d)

构建简单的神经网络

接下来，我们将构建一个简单的全连接神经网络，这个网络将用于解决分类问题。例如，我们将使用MNIST手写数字识别数据集进行演示。

创建一个神经网络的基本步骤如下：

定义模型结构
定义损失函数
定义优化器
训练模型

定义模型

我们将创建一个包含两个全连接层的简单神经网络。可以使用torch.nn模块来定义模型。

import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        
        # 定义网络层
        self.fc1 = nn.Linear(28 * 28, 128)  # 输入层
        self.fc2 = nn.Linear(128, 10)        # 输出层
        
    def forward(self, x):
        x = x.view(-1, 28 * 28)  # 将输入展平
        x = torch.relu(self.fc1(x))  # 激活函数
        x = self.fc2(x)
        return x

# 创建模型实例
model = SimpleNN()

定义损失函数和优化器

接下来，我们选择交叉熵损失作为损失函数，并使用Adam优化器。

用 PyTorch 构建第一个模型时，先确认数据加载、模型结构、损失函数、优化器、训练循环和验证输出。

import torch.optim as optim

criterion = nn.CrossEntropyLoss()  # 损失函数
optimizer = optim.Adam(model.parameters(), lr=0.001)  # 优化器

训练模型

在训练之前，我们需要准备数据集。可以使用torchvision中的数据集和数据加载器。

from torchvision import datasets, transforms
from torch.utils.data import DataLoader

# 数据预处理
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])

# 加载MNIST数据集
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = DataLoader(dataset=train_dataset, batch_size=64, shuffle=True)

# 训练模型
num_epochs = 5
for epoch in range(num_epochs):
    for images, labels in train_loader:
        optimizer.zero_grad()  # 清除梯度
        output = model(images)  # 前向传播
        loss = criterion(output, labels)  # 计算损失
        loss.backward()  # 反向传播
        optimizer.step()  # 更新参数
    
    print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

测试模型

训练完模型后，可以评估其性能。这里我们仅举个简单的例子。

开始读《深度学习入门：使用PyTorch构建你的第一个模型》前，可以先看图中从问题到结果的路径。读完后再对照正文，确认自己能不能照着复现。

# 测试代码略

读到这里，可以把《深度学习入门：使用PyTorch构建你的第一个模型》整理成一张复盘表：先说清主线，再拿一个小任务检查结果。

读完《深度学习入门：使用PyTorch构建你的第一个模型》后，可以先挑一个小样例走完整流程，再判断哪些步骤已经能独立完成。

小结

通过本篇教程，我们学习了PyTorch的基本用法，并构建了一个简单的神经网络，以解决手写数字识别问题。与上一篇中的Keras相比，PyTorch提供了更大的灵活性和控制力，非常适合科研和复杂任务。

在下一篇教程中，我们将深入探讨数据预处理，包括数据清洗与准备，这对于模型训练至关重要。希望大家能够继续跟随系列教程，逐步掌握深度学习的技巧与知识！

继续阅读

从这篇继续找到相关教程

AI 教程总索引

深度学习入门教程目录24 篇按顺序阅读本系列图文节点6 个位置可直达 AI 图文教程索引按主题继续找可复现教程 AI 图文教程全量清单浏览全部已整理教程跨领域 AI 文章入口继续找其它技术系列里的 AI 章节 AI 教程图片索引6 张图文节点

常见问题

读前先确认这三点

深度学习入门：使用PyTorch构建你的第一个模型适合谁读？

这是深度学习入门系列第 12 / 24 篇，适合正在学习深度学习入门，并且需要把概念落到操作步骤或判断标准里的读者。

读这篇深度学习入门教程要多久？

按中文技术文章阅读速度估算，通读大约 3 分钟；如果要跟着复现，建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用？

正文里有 6 个图文节点，可以先用它们抓住流程、配置和判断点，再回到对应段落细读。

分享文章

微信/朋友圈可先复制链接

微博 X LinkedIn Facebook Telegram 邮件

继续找到相关 AI 教程

返回栏目

继续学习数据清洗与准备深度学习入门 · 第 13 篇 · 6 张图 · 1.1k 字

图文补读深度学习的工作原理之梯度下降与优化算法深度学习入门 · 6 张图 · 2.1k 字，适合回看流程和判断点。AI 教程总索引全部 AI 教程文章按大模型、Agent、本地部署、机器学习和工程实践继续查找相关文章。AI 图文教程索引按流程和判断点找教程先看每篇文章里的流程、配置和复盘节点，再回到原文细读。跨领域 AI 入口其它技术系列里的 AI 章节从大数据、爬虫、量子计算和 Spark 章节继续找 AI 内容。AI 教程图片索引按图查找教程文章从流程图、配置图和判断卡片直接定位对应文章。深度学习入门目录深度学习入门完整目录按顺序查看全部小节、图文密度和后续阅读路线。

12 深度学习入门：使用PyTorch构建你的第一个模型

深度学习入门 · 第 12 / 24 篇

这篇内容怎么整理

先按这条路线读

先看本文图文节点

PyTorch简介

PyTorch基础

创建张量

构建简单的神经网络

定义模型

定义损失函数和优化器

训练模型

测试模型

小结

从这篇继续找到相关教程

读前先确认这三点

深度学习入门：使用PyTorch构建你的第一个模型适合谁读？

读这篇深度学习入门教程要多久？

这篇文章里的图文节点怎么用？

继续找到相关 AI 教程

读者留言

留言列表

12 深度学习入门：使用PyTorch构建你的第一个模型

深度学习入门 · 第 12 / 24 篇

这篇内容怎么整理

先按这条路线读

先看本文图文节点

PyTorch简介

PyTorch基础

创建张量

构建简单的神经网络

定义模型

定义损失函数和优化器

训练模型

测试模型

小结

从这篇继续找到相关教程

读前先确认这三点

深度学习入门：使用PyTorch构建你的第一个模型适合谁读？

读这篇深度学习入门教程要多久？

这篇文章里的图文节点怎么用？

转发到常用平台

从相近问题继续读

继续找到相关 AI 教程

读者留言

留言列表