8 深度学习的工作原理之损失函数的概念

Q: 深度学习的工作原理之损失函数的概念适合谁读？

这是 深度学习入门 系列第 8 / 24 篇，适合正在学习深度学习入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: 深度学习小白

预计阅读: 4 分钟

阅读次数: 0

系列进度

深度学习入门 · 第 8 / 24 篇

上一篇深度学习的工作原理：前向传播与反向传播下一篇深度学习的工作原理之梯度下降与优化算法

预计阅读4 分钟

结构重点6 个

图文要点6 张

正文规模1.5k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 6 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步什么是损失函数？02第 2 步常见的损失函数 03第 3 步如何选择损失函数？04第 4 步结论

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线深度学习的工作原理之损失函数的概念结构图跳到对应正文位置

图 02 · 步骤损失函数定义学习目标核对图跳到对应正文位置

图 03 · 配置损失函数判断卡跳到对应正文位置

图 04 · 判断深度学习阅读地图卡跳到对应正文位置

图 05 · 复盘深度学习的工作原理之损失函数的概念应用复盘卡跳到对应正文位置

图 06 · 细节深度学习的工作原理之损失函数的概念应用检查卡跳到对应正文位置

损失函数告诉模型什么叫“错”。选错损失函数，模型可能会朝错误目标努力。理解损失函数，就是理解训练到底在优化什么。

遇到模型效果差时，不要只调网络结构，也要检查损失函数是否和任务目标一致。

在上一篇中，我们探讨了深度学习中的前向传播和反向传播的基本原理。通过前向传播，我们能够计算出模型的输出，而反向传播则计算出每个参数对损失的贡献。从而，我们可以通过优化这些参数来提升模型的性能。而要优化参数，我们需要一个能够量化模型表现的指标，这就是“损失函数”。

什么是损失函数？

损失函数是一个用于衡量模型预测结果与真实值之间差距的函数。在深度学习中，损失函数的主要两个作用是：

理解损失函数时，先看预测输出、真实标签和错误度量如何对应。分类、回归和生成任务的损失目标不同。

评估模型的预测质量：损失函数的值越小，代表模型的预测结果越接近真实值。
导向模型参数的更新：通过计算损失函数关于模型参数的梯度，我们可以采用梯度下降等优化算法来更新这些参数，从而降低损失函数的值。

常见的损失函数

在具体应用中，损失函数会根据任务的类型不同而有所变化。以下是一些常用的损失函数：

《深度学习的工作原理之损失函数的概念》这类内容容易被细节带偏。先看图里的主线，再回到正文核对环境、输入、输出和判断标准。

回归任务中的损失函数

对于回归任务，最常用的损失函数是均方误差（MSE）。其定义如下：

\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y_i})^2

其中， $y_i$ 是实际值， $\hat{y_i}$ 是预测值， $n$ 是样本的数量。均方误差通过平方来惩罚预测错误的程度，使得大错误的影响更为显著。

代码示例

以下是一个使用Python和NumPy计算均方误差的简单例子：

import numpy as np

# 实际值和预测值
y_true = np.array([3.0, -0.5, 2.0, 7.0])
y_pred = np.array([2.5, 0.0, 2.0, 8.0])

# 计算均方误差
mse = np.mean((y_true - y_pred) ** 2)
print("均方误差:", mse)

分类任务中的损失函数

对于分类任务，交叉熵损失函数是最常用的选择。对于二分类问题，交叉熵损失的定义为：

\text{Binary Cross-Entropy} = -\frac{1}{n} \sum_{i=1}^{n} [y_i \log(\hat{y_i}) + (1 - y_i) \log(1 - \hat{y_i})]

其中， $y_i$ 为真实标签（0或1）， $\hat{y_i}$ 为模型的预测概率。

代码示例

以下是一个使用Python计算二分类问题中交叉熵损失的示例：

import numpy as np

# 实际标签和预测概率
y_true = np.array([1, 0, 1, 1])
y_pred = np.array([0.9, 0.1, 0.8, 0.7])

# 计算交叉熵损失
binary_cross_entropy = -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))
print("交叉熵损失:", binary_cross_entropy)

如何选择损失函数？

选择合适的损失函数对于模型的最终性能至关重要。以下是一些选择时需要考虑的因素：

任务类型：回归、分类或排序等不同任务需要不同的损失函数。
数据分布：若数据存在类不平衡现象，可能需要使用加权的损失函数。
对异常值的敏感度：某些损失函数（如MSE）对异常值较敏感，而绝对误差（MAE）则较为稳健。

读到这里，可以把《深度学习的工作原理之损失函数的概念》整理成一张复盘表：先说清主线，再拿一个小任务检查结果。

读完《深度学习的工作原理之损失函数的概念》后，可以先挑一个小样例走完整流程，再判断哪些步骤已经能独立完成。

结论

损失函数在深度学习中扮演着至关重要的角色。它不仅帮助我们评估模型的性能，而且在参数更新过程中的梯度计算也是基于损失函数。理解损失函数的概念和应用将帮助我们更好地设计和优化模型，为下一步的梯度下降和优化算法打下基础。

在接下来的文章中，我们将讨论深度学习中梯度下降和其他优化算法的原理及其作用。通过这些知识，您将能够更深入地理解如何有效地训练深度学习模型。

继续阅读

从这篇继续找到相关教程

AI 教程总索引

深度学习入门教程目录24 篇按顺序阅读本系列图文节点6 个位置可直达 AI 图文教程索引按主题继续找可复现教程 AI 图文教程全量清单浏览全部已整理教程跨领域 AI 文章入口继续找其它技术系列里的 AI 章节 AI 教程图片索引6 张图文节点

常见问题

读前先确认这三点

深度学习的工作原理之损失函数的概念适合谁读？

这是深度学习入门系列第 8 / 24 篇，适合正在学习深度学习入门，并且需要把概念落到操作步骤或判断标准里的读者。

读这篇深度学习入门教程要多久？

按中文技术文章阅读速度估算，通读大约 4 分钟；如果要跟着复现，建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用？

正文里有 6 个图文节点，可以先用它们抓住流程、配置和判断点，再回到对应段落细读。

分享文章

微信/朋友圈可先复制链接

微博 X LinkedIn Facebook Telegram 邮件

继续找到相关 AI 教程

返回栏目