15 深度学习与神经网络之前向传播与反向传播

Q: 深度学习与神经网络之前向传播与反向传播适合谁读？

这是 计算机视觉网络教程 系列第 15 / 31 篇，适合正在学习计算机视觉网络教程，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: 计算机视觉

预计阅读: 5 分钟

阅读次数: 0

系列进度

计算机视觉网络教程 · 第 15 / 31 篇

上一篇深度学习与神经网络之神经元模型与激活函数下一篇深度学习与神经网络之梯度下降与优化算法

预计阅读5 分钟

结构重点6 个

图文要点6 张

正文规模2.2k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 6 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步前向传播 02第 2 步反向传播

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线前向传播与反向传播流程图跳到对应正文位置

图 02 · 步骤前向传播与反向传播实操核对图跳到对应正文位置

图 03 · 配置前向反向传播视觉判断卡跳到对应正文位置

图 04 · 判断深度学习与神经网络之前向传播与反向传播应用检查卡跳到对应正文位置

图 05 · 复盘深度学习与神经网络之前向传播与反向传播应用复盘卡跳到对应正文位置

图 06 · 细节计算机视觉阅读地图卡跳到对应正文位置

前向传播回答模型怎么算，反向传播回答参数怎么改。两者合起来，才是一个完整训练闭环。

我会检查每一层输出形状和 loss 是否能下降。形状对不上会报错，loss 不降则说明数据、模型或学习率有问题。

在上一篇中，我们讨论了神经元模型与激活函数，它们是构建深度学习模型的基本单元。接下来，我们将深入探讨两个关键过程：前向传播和反向传播。这两者是神经网络训练的核心机制。

前向传播

在神经网络中，前向传播是指输入数据通过网络进行处理的过程。这一过程涉及到每个神经元的计算，最终输出网络的预测结果。

理解视觉网络前向与反向传播时，先看输入特征、预测输出、损失计算、梯度回传和参数更新。

1. 前向传播过程

假设我们有一个简单的全连接网络，包含输入层、一个隐藏层以及输出层。假设输入层的节点数为 $n_{\text{input}}$ ，隐藏层的节点数为 $n_{\text{hidden}}$ ，输出层的节点数为 $n_{\text{output}}$ 。

步骤如下：

输入层传递输入向量：输入向量可以表示为 $X = [x_1, x_2, ..., x_{n_{\text{input}}}]^T$ 。
计算隐藏层输出：隐藏层到每个神经元的输入是前一层（输入层）的输出与相应的权重相乘并加上偏置：
$Z^{(1)} = W^{(1)}X + b^{(1)}$
其中， $W^{(1)}$ 是从输入层到隐藏层的权重矩阵， $b^{(1)}$ 是隐藏层的偏置向量。然后，经过激活函数激活：
$A^{(1)} = \sigma(Z^{(1)})$
其中， $\sigma$ 是选择的激活函数，如ReLU、Sigmoid等。
计算输出层输出：输出层的计算过程与隐藏层类似，设置 $A^{(1)}$ 为输入：
$Z^{(2)} = W^{(2)}A^{(1)} + b^{(2)}$
激活得到输出：

A^{(2)} = \text{softmax}(Z^{(2)})

在分类任务中，我们通常使用 softmax 函数作为输出层的激活函数，以获得各类别的概率分布。

2. 示例代码

下面是一个使用Python和NumPy库实现简单前向传播的示例代码：

import numpy as np

# 定义激活函数
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# 前向传播示例
def forward_propagation(X, W1, b1, W2, b2):
    # 隐藏层计算
    Z1 = np.dot(W1, X) + b1
    A1 = sigmoid(Z1)
    
    # 输出层计算
    Z2 = np.dot(W2, A1) + b2
    A2 = np.exp(Z2) / np.sum(np.exp(Z2), axis=0)  # softmax
    return A1, A2

# 假设输入和参数
X = np.array([[0.1], [0.2]])
W1 = np.random.rand(3, 2)  # 隐藏层权重
b1 = np.random.rand(3, 1)  # 隐藏层偏置
W2 = np.random.rand(2, 3)  # 输出层权重
b2 = np.random.rand(2, 1)  # 输出层偏置

A1, A2 = forward_propagation(X, W1, b1, W2, b2)
print("隐藏层输出:", A1)
print("最终输出:", A2)

在这个例子中，我们定义了一个简单的前向传播过程，得到了隐藏层和输出层的结果。

反向传播

反向传播是用来训练神经网络的过程，其目标是通过调整权重和偏置来减少网络的误差。反向传播的核心是应用链式法则计算损失函数关于各个参数的梯度。

回看《深度学习与神经网络之前向传播与反向传播》时，不必一次做大项目，先用一条简单样例确认主线是否清楚。

如果《深度学习与神经网络之前向传播与反向传播》还没完全消化，可以从这张卡片的四个动作重新走一遍。

读完《深度学习与神经网络之前向传播与反向传播》不要只停在“看懂了”。回头挑一个步骤动手做一遍，再记录哪里卡住，后面的学习会更稳。

1. 反向传播过程

计算输出误差：输出层的误差为：
$\delta^{(2)} = A^{(2)} - Y$
其中， $Y$ 是实际标签。
计算输出层梯度：输出层权重梯度为：
$\frac{\partial \mathcal{L}}{\partial W^{(2)}} = \delta^{(2)} A^{(1)T}$
输出层偏置梯度为：
$\frac{\partial \mathcal{L}}{\partial b^{(2)}} = \delta^{(2)}$
反向传播到隐藏层：隐藏层的误差由输出层的误差通过权重传递回来的：
$\delta^{(1)} = (W^{(2)T} \delta^{(2)}) \circ \sigma'(Z^{(1)})$
其中， $\circ$ 表示Hadamard乘积， $\sigma'(Z^{(1)})$ 是激活函数的导数。
计算隐藏层梯度：隐藏层权重梯度为：
$\frac{\partial \mathcal{L}}{\partial W^{(1)}} = \delta^{(1)} X^T$
隐藏层偏置梯度为：
$\frac{\partial \mathcal{L}}{\partial b^{(1)}} = \delta^{(1)}$

2. 示例代码

下面是相应的反向传播的实现示例：

# 反向传播示例
def backward_propagation(X, Y, A1, A2, W2):
    m = Y.shape[1]  # 样本数

    # 计算误差
    delta2 = A2 - Y
    dW2 = np.dot(delta2, A1.T) / m
    db2 = np.sum(delta2, axis=1, keepdims=True) / m

    # 传播到隐藏层
    delta1 = np.dot(W2.T, delta2) * (A1 * (1 - A1))  # sigmoid的导数
    dW1 = np.dot(delta1, X.T) / m
    db1 = np.sum(delta1, axis=1, keepdims=True) / m

    return dW1, db1, d

继续阅读

从这篇继续找到相关教程

AI 教程总索引

计算机视觉网络教程目录31 篇按顺序阅读本系列图文节点6 个位置可直达 AI 图文教程索引按主题继续找可复现教程 AI 图文教程全量清单浏览全部已整理教程跨领域 AI 文章入口继续找其它技术系列里的 AI 章节 AI 教程图片索引6 张图文节点

常见问题

读前先确认这三点

深度学习与神经网络之前向传播与反向传播适合谁读？

这是计算机视觉网络教程系列第 15 / 31 篇，适合正在学习计算机视觉网络教程，并且需要把概念落到操作步骤或判断标准里的读者。

读这篇计算机视觉网络教程要多久？

按中文技术文章阅读速度估算，通读大约 5 分钟；如果要跟着复现，建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用？

正文里有 6 个图文节点，可以先用它们抓住流程、配置和判断点，再回到对应段落细读。

分享文章

微信/朋友圈可先复制链接

微博 X LinkedIn Facebook Telegram 邮件

继续找到相关 AI 教程

返回栏目

继续学习深度学习与神经网络之梯度下降与优化算法计算机视觉网络教程 · 第 16 篇 · 6 张图 · 2.3k 字 AI 教程总索引全部 AI 教程文章按大模型、Agent、本地部署、机器学习和工程实践继续查找相关文章。AI 图文教程索引按流程和判断点找教程先看每篇文章里的流程、配置和复盘节点，再回到原文细读。跨领域 AI 入口其它技术系列里的 AI 章节从大数据、爬虫、量子计算和 Spark 章节继续找 AI 内容。AI 教程图片索引按图查找教程文章从流程图、配置图和判断卡片直接定位对应文章。计算机视觉网络教程目录计算机视觉网络教程完整目录按顺序查看全部小节、图文密度和后续阅读路线。模型怎么选郭震 AI 综合加权榜按写作、代码、行业、研究和本地部署场景看模型。

15 深度学习与神经网络之前向传播与反向传播

计算机视觉网络教程 · 第 15 / 31 篇

这篇内容怎么整理

先按这条路线读

先看本文图文节点