10 神经网络基础：神经网络的基本结构

Q: 神经网络基础：神经网络的基本结构适合谁读？

这是 PyTorch 入门 系列第 10 / 20 篇，适合正在学习PyTorch 入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: Pytorch小白

预计阅读: 4 分钟

阅读次数: 0

系列进度

PyTorch 入门 · 第 10 / 20 篇

上一篇使用torch.autograd实现自动求导下一篇神经网络基础之如何定义模型

预计阅读4 分钟

结构重点6 个

图文要点6 张

正文规模1.5k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 6 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步神经网络的基本组成 02第 2 步总结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线神经网络基本结构流程图跳到对应正文位置

图 02 · 步骤神经网络基本结构核对图跳到对应正文位置

图 03 · 配置神经网络结构判断卡跳到对应正文位置

图 04 · 判断神经网络基础：神经网络的基本结构应用复盘卡跳到对应正文位置

图 05 · 复盘神经网络基础：神经网络的基本结构应用检查卡跳到对应正文位置

图 06 · 细节PyTorch阅读地图卡跳到对应正文位置

神经网络可以看成一串可学习变换。线性层负责组合特征，激活函数引入非线性，输出层把结果变成任务需要的形状。

定义网络前，我会先写出输入维度和输出维度。维度写清楚，模型结构就不会凭感觉搭。

在前一篇教程中，我们探讨了torch.autograd如何实现自动求导，这是构建深度学习模型所必不可少的工具。今天，我们将继续深入学习神经网络的基础知识，特别是神经网络的基本结构。

神经网络的基本组成

一个神经网络的基本结构通常由以下几个主要部分组成：

学习神经网络基本结构时，先看输入层、隐藏层、输出层、权重参数、激活函数和损失函数。

输入层（Input Layer）：接收原始数据。
隐藏层（Hidden Layer）：进行特征转换，可以有一个或多个隐藏层。
输出层（Output Layer）：输出最终结果。
权重和偏置（Weights and Biases）：每个连接都有一个权重，而每个神经元有一个偏置。

神经元的基本计算

一个单独的神经元的计算可以被表示为以下公式：

y = f(w \cdot x + b)

其中：

$y$ 是神经元的输出。
$f$ 是激活函数，常用的有ReLU、Sigmoid、Tanh等。
$w$ 是权重向量。
$x$ 是输入向量。
$b$ 是偏置。

这个计算通过对输入进行线性变换，然后应用激活函数，将非线性引入模型中。

激活函数

激活函数的选择对神经网络的性能有很大影响。以下是几种常用的激活函数：

ReLU（Rectified Linear Unit）： $f(x) = \max(0, x)$ 。适用于深度神经网络，因为它能够解决梯度消失问题。
Sigmoid： $f(x) = \frac{1}{1 + e^{-x}}$ 。常用于二分类任务，但在深层网络中可能导致梯度消失。
Tanh： $f(x) = \tanh(x)$ 。输出范围在 $[-1, 1]$ 之间，也能解决部分梯度消失问题。

网络结构示例

假设我们想要构建一个简单的全连接神经网络（Feedforward Neural Network），其结构可以用如下方式理解：

输入层（数据） → 隐藏层（特征提取） → 输出层（预测结果）

例如，一个简单的结构包括：

输入层：有10个神经元（假设每个神经元对应一个特征）。
隐藏层：有5个神经元，可以使用ReLU激活函数。
输出层：有1个神经元，用于二分类任务，可以使用Sigmoid激活函数。

代码示例

下面是如何用PyTorch定义一个简单的神经网络结构的示例代码：

import torch
import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(10, 5)  # 输入层到隐藏层
        self.fc2 = nn.Linear(5, 1)  # 隐藏层到输出层
        self.relu = nn.ReLU()  # 使用ReLU激活函数
        self.sigmoid = nn.Sigmoid()  # 使用Sigmoid激活函数

    def forward(self, x):
        x = self.fc1(x)  # 前向传播到隐藏层
        x = self.relu(x)  # 激活
        x = self.fc2(x)  # 前向传播到输出层
        x = self.sigmoid(x)  # 激活
        return x

# 创建一个神经网络实例
model = SimpleNN()
print(model)