20 内积与正交性之内积空间的应用

Q: 内积与正交性之内积空间的应用适合谁读？

这是 AI 线性代数必备 系列第 20 / 26 篇，适合正在学习AI 线性代数必备，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: AI线性代数小白

预计阅读: 3 分钟

阅读次数: 0

系列进度

AI 线性代数必备 · 第 20 / 26 篇

上一篇正交向量与正交基下一篇奇异值分解的概念

预计阅读3 分钟

结构重点4 个

图文要点6 张

正文规模1.4k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 4 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步内积空间的基本概念 02第 2 步应用：数据分析中的向量比较 03第 3 步正交性在信号处理中的应用 04第 4 步结论

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线内积空间的应用概念图跳到对应正文位置

图 02 · 步骤内积空间的应用核对图跳到对应正文位置

图 03 · 配置内积空间应用判断卡跳到对应正文位置

图 04 · 判断内积与正交性之内积空间的应用应用复盘卡跳到对应正文位置

图 05 · 复盘内积与正交性之内积空间的应用应用检查卡跳到对应正文位置

图 06 · 细节线性代数阅读地图卡跳到对应正文位置

内积空间让距离、角度、投影这些几何概念可以进入算法。推荐、搜索和回归都离不开它。

我会看任务到底需要长度信息还是方向信息。不同相似度选择会改变结果排序。

在上一篇中，我们讨论了正交向量与正交基的概念，了解了如何通过这些概念来简化线性代数中的许多问题。接下来，我们将继续探索内积空间的应用，特别是在数据分析和机器学习等领域中的重要性。

内积空间的基本概念

在内积空间中，每一对向量都可以通过内积运算得到一个标量，内积的定义为：

理解内积空间应用时，先看向量表示、距离或相似度、投影计算、正交分解和在推荐、检索或降维中的作用。

\langle \mathbf{u}, \mathbf{v} \rangle = \sum_{i=1}^n u_i v_i

其中， $\mathbf{u}$ 和 $\mathbf{v}$ 是 $n$ 维向量。内积的几何意义可以通过以下两种方式理解：

长度：内积的平方根给出了向量的长度，即 $\|\mathbf{u}\| = \sqrt{\langle \mathbf{u}, \mathbf{u} \rangle}$ 。
角度：内积可用于计算两向量间的夹角，即 $\cos \theta = \frac{\langle \mathbf{u}, \mathbf{v} \rangle}{\|\mathbf{u}\|\|\mathbf{v}\|}$ ，这表明向量的方向关系。

应用：数据分析中的向量比较

在实际应用中，尤其是在机器学习和数据分析中，内积提供了一个强大的工具来比较特征向量之间的相似性。例如，在信息检索中，我们可能会用到文档之间的相似性度量，这可以通过计算文档向量的内积来实现。

示例：计算文本相似性

假设我们要比较两个文本的相似性，首先需要将文本转换为向量表示。这里我们使用词频-逆文档频率（TF-IDF）来表示文本：

from sklearn.feature_extraction.text import TfidfVectorizer

documents = [
    "这是第一篇文档。",
    "这是第二篇文档。",
    "这是第三篇文档。",
]

vectorizer = TfidfVectorizer()
tfidf_matrix = vectorizer.fit_transform(documents)

# 获取第一个和第二个文档的TF-IDF向量
doc1 = tfidf_matrix[0].toarray()[0]
doc2 = tfidf_matrix[1].toarray()[0]

# 计算内积
inner_product = sum(d1 * d2 for d1, d2 in zip(doc1, doc2))
print("文档1与文档2的内积相似性:", inner_product)