12 变量与占位符
系列进度
TensorFlow 入门 · 第 12 / 25 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
TensorFlow 学习要把张量、模型、训练和部署放在一条线上,而不是只看单段代码。阅读时可以按「变量 -> 创建变量 -> 更新变量 -> 占位符」建立结构,再回到正文里的代码、案例或指标做验证。
读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「变量」,再查「创建变量」。
在TensorFlow中,变量和占位符是构建计算图的基础元素。在这一章节中,我们将深入探讨这两个概念,以及它们如何帮助我们构建和管理计算图。
变量
变量是可以在计算过程中改变的张量。它们用于存储模型的状态,例如神经网络的权重和偏置。变量通常在模型训练之前初始化,然后在训练过程中不断更新。
理解 TensorFlow 变量与占位符时,先看参数初始化、输入传递、图执行、训练更新和版本差异。
创建变量
我们可以使用tf.Variable来创建一个变量。例如,下面的代码创建了一个初始化为0的变量:
import tensorflow as tf
# 创建一个初始化为0的变量
variable = tf.Variable(initial_value=0, trainable=True, name='my_variable')
# 查看变量的值
print("Variable value:", variable.numpy()) # 输出: Variable value: 0
在这里,initial_value参数指定了变量的初始值。trainable=True表示这个变量会在训练过程中被优化。
更新变量
在训练过程中,通常需要更新变量的值。可以使用assign方法来更新变量的值。例如:
# 将变量的值更新为10
variable.assign(10)
print("Updated variable value:", variable.numpy()) # 输出: Updated variable value: 10
占位符
占位符是另一种重要的TensorFlow组件。占位符用于在计算图中占用空间,但在构建图时不会分配任何存储空间。占位符通常用于输入数据的传递,允许我们在执行时提供数据。
学《变量与占位符》时,可以先找一个自己能复现的小场景,再看相关概念和练习步骤,读完后用自己的例子复述一遍。
创建占位符
我们可以使用tf.placeholder来创建一个占位符。值得注意的是,TensorFlow 2.x不再推荐使用tf.placeholder,而是使用tf.keras.Input来代替。然而,在理解旧版本的代码和构建逻辑时,理解占位符的概念仍然重要。
# 在 TensorFlow 1.x 中创建占位符
x = tf.placeholder(dtype=tf.float32, shape=[None], name='input_x')
# 在 TensorFlow 2.x 中使用 tf.keras.Input
# x = tf.keras.Input(shape=(None,), name='input_x')
在上述代码中,dtype指定了数据类型,shape定义了输入的形状。None表示这一维的大小可以是任意的。
使用占位符
一旦创建了占位符,我们可以在计算图中使用它。以下是一个简单的示例,演示如何使用占位符进行加法运算:
# 创建一个占位符
x = tf.placeholder(dtype=tf.float32, shape=[None], name='input_x')
y = tf.placeholder(dtype=tf.float32, shape=[None], name='input_y')
# 定义一个简单的计算图
z = x + y
# 在会话中执行计算
with tf.Session() as sess:
result = sess.run(z, feed_dict={x: [1, 2, 3], y: [4, 5, 6]})
print("Result of x + y:", result) # 输出: Result of x + y: [5. 7. 9.]
在这个例子中,我们定义了两个占位符 x 和 y,然后计算它们的和 z。使用feed_dict可以将实际数据传入占位符。
变量与占位符的关系
变量与占位符使得TensorFlow可以灵活地构建和管理计算图。占位符用于捕获用户输入,而变量则用于存储和更新模型的参数。理解这两者的区别和联系,对于搭建任何机器学习模型至关重要。
读到这里,可以把《变量与占位符》整理成一张复盘表:先说清主线,再拿一个小任务检查结果。
读完《变量与占位符》后,可以先挑一个小样例走完整流程,再判断哪些步骤已经能独立完成。
小结
在本章节中,我们介绍了TensorFlow中的变量和占位符,了解了如何创建和使用它们。变量允许我们维护和更新模型状态,而占位符则用于传递外部数据。掌握这两个概念,为我们后续深入构建计算图的步骤打下了基础。
下一个章节将深入探讨构建计算图的基本步骤,我们将学习如何将这些元素组合在一起,从而构建出我们需要的计算图。
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
变量与占位符适合谁读?
这是 TensorFlow 入门 系列第 12 / 25 篇,适合正在学习TensorFlow 入门,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇TensorFlow 入门教程要多久?
按中文技术文章阅读速度估算,通读大约 3 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读