郭震 AI公众号:郭震AI

14 深度学习与神经网络之神经元模型与激活函数

发布日期:

最近更新:

分类: 计算机视觉

预计阅读: 4 分钟

阅读次数: 0

预计阅读4 分钟
结构重点8 个
图文要点6 张
正文规模1.5k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 8 个结构重点拆成环境、步骤、验证点和常见误区,尽量让读者能照着复现。
图文对照保留 6 张和配置、流程、判断结果有关的图片,方便快速定位正文重点。
持续校对工具、模型和命令变化较快,后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线,再回到代码、配置和图文细节,读起来会更稳。

图文要点

先看本文图文节点

按图先建立主线,再跳回正文核对步骤、配置和判断标准。

神经元模型与激活函数流程图查看大图
神经元模型与激活函数流程图

神经元模型可以看成一个可学习的计算单元。激活函数让网络有非线性表达能力,否则多层线性叠加仍然只是线性模型。

神经元模型与激活函数实操核对图查看大图
神经元模型与激活函数实操核对图

我会区分隐藏层激活和输出层激活。分类任务、回归任务、多标签任务的输出处理并不一样。

在深度学习与神经网络的基础上,我们需要进一步了解神经网络的基本构建块——神经元,以及如何通过激活函数引入非线性特性。这一部分将承接之前的内容,探讨神经元模型的组成及其重要性。

神经元模型

一个简单的神经元模型通常包含三个主要部分:输入、权重和偏置。神经元的工作可以通过以下步骤描述:

神经元激活函数判断卡查看大图
神经元激活函数判断卡

理解神经元模型与激活函数时,先看输入权重、偏置、加权和、激活输出和梯度传递。

  1. 接收输入:神经元从上一层接收输入信号,通常用特征向量表示,比如 x1,x2,,xnx_1, x_2, \ldots, x_n
  2. 加权求和:每个输入对应一个权重,记作 w1,w2,,wnw_1, w_2, \ldots, w_n。神经元的加权和可以表示为: z=w1x1+w2x2++wnxn+bz = w_1 x_1 + w_2 x_2 + \ldots + w_n x_n + b 其中 bb 是偏置,帮助神经元调整输出。
  3. 激活函数:计算出的加权和 zz 会通过激活函数进行处理,从而生成神经元的输出。这个过程可以用公式表示为: a=f(z)a = f(z) 其中 ff 是激活函数,aa 是神经元的输出。

示例

假设我们有三维输入向量 x=[x1,x2,x3]x = [x_1, x_2, x_3],权重为 w=[w1,w2,w3]w = [w_1, w_2, w_3],偏置为 bb。我们可以构造一个简单的神经元并计算其输出:

import numpy as np

# 输入
x = np.array([0.5, 0.3, 0.2])
# 权重
w = np.array([0.4, 0.6, 0.2])
# 偏置
b = 0.1

# 计算加权和
z = np.dot(w, x) + b

激活函数

激活函数的主要目的是引入非线性,使得神经网络能够学习复杂的模式。常见的激活函数有以下几种:

计算机视觉阅读地图卡查看大图
计算机视觉阅读地图卡

读《深度学习与神经网络之神经元模型与激活函数》时,先确定要解决的场景,再把关键概念和练习动作串起来。这样读到细节时,不容易只记住零散名词。

1. Sigmoid 函数

定义为:

f(z)=11+ezf(z) = \frac{1}{1 + e^{-z}}

特点

  • 输出范围在 (0, 1) 之间。
  • 在大于 0 或小于 0 时梯度非常小,可能导致“梯度消失”。

2. Tanh 函数

定义为:

f(z)=tanh(z)=ezezez+ezf(z) = \tanh(z) = \frac{e^z - e^{-z}}{e^z + e^{-z}}

特点

  • 输出范围在 (-1, 1) 之间。
  • 相比 Sigmoid 函数,Tanh 函数在原点附近更为平滑,通常表现更好。

3. ReLU 函数(修正线性单元)

定义为:

f(z)=max(0,z)f(z) = \max(0, z)

特点

  • 对于 z>0z > 0 输出 zz,对于 z0z \leq 0 输出 0。
  • 可以有效缓解梯度消失问题。
  • 可能出现 "Dying ReLU" 问题,即部分神经元永远不会被激活。

代码示例

下面的代码展示了如何计算不同激活函数的输出:

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

def tanh(z):
    return np.tanh(z)

def relu(z):
    return np.maximum(0, z)

# 计算激活函数输出
output_sigmoid = sigmoid(z)
output_tanh = tanh(z)
output_relu = relu(z)

print(f'Sigmoid output: {output_sigmoid}')
print(f'Tanh output: {output_tanh}')
print(f'ReLU output: {output_relu}')
深度学习与神经网络之神经元模型与激活函数应用复盘卡查看大图
深度学习与神经网络之神经元模型与激活函数应用复盘卡

学完《深度学习与神经网络之神经元模型与激活函数》后,不妨换一个自己的场景试一次,重点观察输入、处理和输出是否能对应起来。

深度学习与神经网络之神经元模型与激活函数应用检查卡查看大图
深度学习与神经网络之神经元模型与激活函数应用检查卡

如果想把《深度学习与神经网络之神经元模型与激活函数》用到自己的任务里,可以先缩小场景,只验证一个最关键的判断点。

小结

在这一部分,我们深入了解了神经元的基本模型,探索了其主要构件――输入、权重和偏置,以及激活函数在引入非线性方面的关键作用。正确选择激活函数对于提高神经网络的学习能力与性能至关重要,接下来我们将讨论 前向传播与反向传播 的过程,以进一步揭示神经网络的工作原理。

请继续关注下一篇文章,我们将探讨前向传播和反向传播的具体实现以及其在模型训练中的重要性。

继续阅读

从这篇继续找到相关教程

AI 教程总索引

常见问题

读前先确认这三点

深度学习与神经网络之神经元模型与激活函数适合谁读?

这是 计算机视觉网络教程 系列第 14 / 31 篇,适合正在学习计算机视觉网络教程,并且需要把概念落到操作步骤或判断标准里的读者。

读这篇计算机视觉网络教程要多久?

按中文技术文章阅读速度估算,通读大约 4 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用?

正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关教程

AI 教程总索引

继续阅读

继续找到相关 AI 教程

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...