21 奇异值分解的概念

Q: 奇异值分解的概念适合谁读？

这是 AI 线性代数必备 系列第 21 / 26 篇，适合正在学习AI 线性代数必备，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: AI线性代数小白

预计阅读: 4 分钟

阅读次数: 0

系列进度

AI 线性代数必备 · 第 21 / 26 篇

上一篇内积与正交性之内积空间的应用下一篇奇异值分解之奇异值的计算

预计阅读4 分钟

结构重点7 个

图文要点6 张

正文规模1.5k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 7 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步奇异值分解的定义 02第 2 步应用案例 03第 3 步总结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线奇异值分解的概念概念图跳到对应正文位置

图 02 · 步骤奇异值分解的概念核对图跳到对应正文位置

图 03 · 配置奇异值分解概念判断卡跳到对应正文位置

图 04 · 判断线性代数阅读地图卡跳到对应正文位置

图 05 · 复盘奇异值分解的概念应用复盘卡跳到对应正文位置

图 06 · 细节奇异值分解的概念应用检查卡跳到对应正文位置

SVD 可以把任意矩阵拆成方向、强度和方向三部分。它比特征分解更通用，也更适合实际数据矩阵。

我会把奇异值看成各方向上的重要程度。越大的奇异值，通常保留的信息越多。

在前一篇中，我们讨论了内积与正交性，介绍了内积空间的应用。在这一篇中，我们将探讨奇异值分解（SVD）的基本概念，以及它在数据分析和机器学习中的重要性。奇异值分解是一种非常强大的工具，它在特征提取、降维和噪声过滤等方面发挥着重要作用。

奇异值分解的定义

奇异值分解是线性代数中的一个重要分解方法，它将一个任意的矩阵分解为三个特殊矩阵的乘积。更 formally，一个 $m \times n$ 矩阵 $A$ 可以被分解为：

理解奇异值分解时，先看原矩阵、左右奇异向量、奇异值大小、低秩近似和信息保留比例。

A = U \Sigma V^T

其中：

$U$ 是一个 $m \times m$ 的正交矩阵，其列向量称为左奇异向量。
$\Sigma$ 是一个 $m \times n$ 的对角矩阵，其中对角线上的元素（称为奇异值）是非负的，并且按降序排列。
$V^T$ 是 $n \times n$ 的正交矩阵， $V$ 的列向量称为右奇异向量。

奇异值的意义

在这个分解中，奇异值 $\sigma_i$ （ $\Sigma$ 矩阵的对角线元素）表示了原始数据在某一个特定方向上的“重要性”或“信息量”。奇异值越大，代表该方向上的信息越重要。因此，通过选择前 $k$ 个最大的奇异值和对应的奇异向量，我们可以进行数据的降维处理。

奇异值分解的几何意义

从几何的角度理解，奇异值分解可以被视为将数据从原始空间转换到一个新的空间。在 $U$ 的列空间中，每个数据点（即矩阵 $A$ 的行）被投影到一个新的“特征空间”中，保留了数据的重要结构信息。矩阵 $A$ 的奇异值则量化了这些特征的“重要性”。

应用案例

案例：图像压缩

开始读《奇异值分解的概念》前，可以先看图中从问题到结果的路径。读完后再对照正文，确认自己能不能照着复现。

奇异值分解在图像处理领域有着广泛应用。其中一个经典的应用是图像压缩。假设我们有一个灰度图像，它可以用一个矩阵 $A$ 表示。通过奇异值分解，我们可以将这个矩阵分解为三个矩阵的乘积：

计算奇异值分解： $A = U \Sigma V^T$ 。
选择前 $k$ 个奇异值及其对应的奇异向量来重构图像：

A_k = U_k \Sigma_k V_k^T

这里， $U_k$ 、 $\Sigma_k$ 和 $V_k$ 分别是矩阵 $U$ 、 $\Sigma$ 和 $V$ 的前 $k$ 列。

通过这种方式，我们可以仅用 $k$ 个奇异值来近似重构原始图像，这样就达到了压缩的目的，同时尽量保留重要的图像信息。此方法特别有效，能够显著减少存储空间并保持图像的可读性。

Python 代码示例

下面是一个使用 Python 的 numpy 库来进行奇异值分解的简单示例：

import numpy as np
import matplotlib.pyplot as plt

# 生成一个简单的随机矩阵（这里我们可以想象成一幅图像）
A = np.random.rand(100, 100)

# 进行奇异值分解
U, S, VT = np.linalg.svd(A)

# 选择前 k 个奇异值
k = 10
A_k = np.dot(U[:, :k], np.dot(np.diag(S[:k]), VT[:k, :]))

# 可视化结果
plt.subplot(1, 2, 1)
plt.title('Original Matrix')
plt.imshow(A, cmap='gray')

plt.subplot(1, 2, 2)
plt.title('Reconstructed Matrix (k=10)')
plt.imshow(A_k, cmap='gray')

plt.show()