本文最后更新于:14 天前

TensorFlow 从入门到实践

导入TensorFlow模块,查看下当前模块的版本

import tensorflow as tf

print(tf.__version__)
1.4.0

tensorflow是一种图计算框架,所有的计算操作被声明为图(graph)中的节点(Node)

即使只是声明一个变量或者常量,也并不执行实际的操作,而是向图中增加节点

我们来看一上前面安装TensorFlow的时候的测试代码

# 创建名为hello_constant的TensorFlow对象
hello_constant = tf.constant('Hello World!')

with tf.Session() as sess:
    
    # 在session中运行tf.constant 操作
    output = sess.run(hello_constant)
    
    print(output)
b'Hello World!'

Tensor

在 TensorFlow 中,数据不是以整数,浮点数或者字符串形式存在的。

这些值被封装在一个叫做 tensor 的对象中。

在 hello_constant = tf.constant(‘Hello World!’) 代码中,
hello_constant是一个 0 维度的字符串 tensor。

tensors 还有很多不同大小:

# A 是一个0维的 int32 tensor
A = tf.constant(1234) 
# B 是一个1维的  int32 tensor
B = tf.constant([123,456,789]) 
 # C 是一个2维的  int32 tensor
C = tf.constant([ [123,456,789], [222,333,444] ])

with tf.Session() as sess:
    out_A = sess.run(A)
    out_B = sess.run(B)
    out_C = sess.run(C)
    
    print('\n', out_A, '\n', '----------', '\n', out_B, '\n', '----------', '\n', out_C)
1234 
---------- 
[123 456 789] 
---------- 
[[123 456 789]
[222 333 444]]

Session

TensorFlow 的 api 构建在 computational graph(计算图) 的概念上,它是一种对数学运算过程进行可视化的一种方法。让我们把你刚才运行的 TensorFlow 的代码变成一个图:

44.png

如上图所示,一个 “TensorFlow Session” 是用来运行图的环境。这个 session 负责分配 GPU(s) 和/或 CPU(s) 包括远程计算机的运算。让我们看看怎么使用它:

with tf.Session() as sess:
    output = sess.run(hello_constant)

这段代码已经从上一行创建了一个 tensor hello_constant。下一行是在session里对 tensor 求值。

这段代码用 tf.Session 创建了一个sess的 session 实例。 sess.run() 函数对 tensor 求值,并返回结果。

constant运算

我们先计算一个线性函数,y=wx+b

w = tf.Variable([[1., 2.]])
x = tf.Variable([[3.], [4.]])
b = tf.constant(.9)

y = tf.add(tf.matmul(w, x), b)

# 变量必须要初始化后才能使用
init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)
    print(y.eval())
[[11.9]]

计算图中所有的数据均以tensor来存储和表达。
tensor是一个高阶张量,二阶张量为矩阵,一阶张量为向量,0阶张量为一个数(标量)。

a = tf.constant(0, name='B')
b = tf.constant(1)
print(a)
print(b)
Tensor("B:0", shape=(), dtype=int32)
Tensor("Const_5:0", shape=(), dtype=int32)

其他计算操作也同样如此。 tensorflow中的大部分操作都需要通过tf.xxxxx的方式进行调用。

c = tf.add(a,b)
print(c)
Tensor("Add_1:0", shape=(), dtype=int32)

从加法开始, tf.add() 完成的工作与你期望的一样。它把两个数字,两个 tensor,返回他们的和。减法和乘法同样也是直接调用对应的接口函数

x = tf.subtract(10, 4) # 6
y = tf.multiply(2, 5)  # 10

还有很多关于数学的api,你可以自己去查阅文档

mat_a = tf.constant([[1, 1, 1], [3, 3, 3]])
mat_b = tf.constant([[2, 2, 2],[5, 5, 5]], name='mat_b')
mul_a_b = mat_a * mat_b
tf_mul_a_b = tf.multiply(mat_a, mat_b)
tf_matmul_a_b = tf.matmul(mat_a, tf.transpose(mat_b), name='matmul_with_name')
print(mul_a_b)
print(tf_mul_a_b)
print(tf_matmul_a_b)
Tensor("mul:0", shape=(2, 3), dtype=int32)
Tensor("Mul_1:0", shape=(2, 3), dtype=int32)
Tensor("matmul_with_name:0", shape=(2, 2), dtype=int32)
with tf.Session() as sess:
    mul_value, tf_mul_value, tf_matmul_value = sess.run([mul_a_b, tf_mul_a_b, tf_matmul_a_b])
print(mul_value)
print(tf_mul_value)
print(tf_matmul_value)
[[ 2  2  2]
 [15 15 15]]
[[ 2  2  2]
 [15 15 15]]
[[ 6 15]
 [18 45]]

我们再举几个具体的实例来看看

a = tf.constant(2)
b = tf.constant(3)
x = tf.add(a, b)
with tf.Session() as sess:
	writer = tf.summary.FileWriter('./graphs/const_add', sess.graph)
	print(sess.run(x))
writer.close()
5
a = tf.constant([2, 2], name='a')
b = tf.constant([[0, 1], [2, 3]], name='b')
x = tf.multiply(a, b, name='dot_product')
with tf.Session() as sess:
	writer = tf.summary.FileWriter('./graphs/const_mul', sess.graph) 
	print(sess.run(x))
writer.close()
[[0 2]
 [4 6]]
a = tf.constant([[2, 2],[1, 4]], name='a')
b = tf.constant([[0, 1], [2, 3]], name='b')
x = tf.multiply(a, b, name='dot_product')
y = tf.matmul(a, b, name='mat_mul')
with tf.Session() as sess:
	writer = tf.summary.FileWriter('./graphs/const_mul_2', sess.graph) 
	print(sess.run(x))
	print(sess.run(y))
writer.close()
[[ 0  2]
 [ 2 12]]
[[ 4  8]
 [ 8 13]]

各式各样的常量

x = tf.zeros([2, 3], tf.int32)
y = tf.zeros_like(x, optimize=True)
print(y)
Tensor("zeros_like:0", shape=(2, 3), dtype=int32)
with tf.Session() as sess:
    print(sess.run(y))
[[0 0 0]
 [0 0 0]]
t_0 = 19 
x = tf.zeros_like(t_0) # ==> 0
y = tf.ones_like(t_0) # ==> 1

with tf.Session() as sess:
    print(sess.run([x]))
    print(sess.run([y]))
[0]
[1]

变量

with tf.variable_scope('meh') as scope:
    a = tf.get_variable('a', [10])
    b = tf.get_variable('b', [100])

writer = tf.summary.FileWriter('./graphs/test', tf.get_default_graph())
writer.close()

例如:求导也是一个运算

x = tf.Variable(2.0)
y = 2.0 * (x ** 3)
z = 3.0 + y ** 2
grad_z = tf.gradients(z, y)
with tf.Session() as sess:
    sess.run(x.initializer)
    print(sess.run(grad_z))
[32.0]

一次性初始化所有变量

my_var = tf.Variable(2, name="my_var") 

my_var_times_two = my_var.assign(2 * my_var)

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(my_var_times_two))
    print(sess.run(my_var_times_two))
    print(sess.run(my_var_times_two))
4
8
16

在前面我们都是采用,先赋值再计算的方法,但是在我们的工作过程中,我会遇到先定义变量,后赋值的情况。
如果你想用一个非常量 non-constant 该怎么办?这就是 tf.placeholder() 和 feed_dict 派上用场的时候了。我们来看看如何向 TensorFlow 传输数据的基本知识。

tf.placeholder()

当你你不能把数据赋值到 x 在把它传给 TensorFlow。因为后面你需要你的 TensorFlow 模型对不同的数据集采取不同的参数。这时你需要 tf.placeholder()!

数据经过 tf.session.run() 函数得到的值,由 tf.placeholder() 返回成一个 tensor,这样你可以在 session 开始跑之前,设置输入。

Session’s feed_dict 功能

x = tf.placeholder(tf.string)

with tf.Session() as sess:
    out = sess.run(x, feed_dict={x: 'Hello World'})
    print(out)
Hello World

用 tf.session.run() 里 feed_dict 参数设置占位 tensor。上面的例子显示 tensor x 被设置成字符串 “Hello, world”。当然你也可以用 feed_dict 设置多个 tensor。

placeholder是一个占位符,它通常代表着从外界输入的值。 其中None代表着尚不确定的维度。

input1 = tf.placeholder(tf.float32)
input2 = tf.placeholder(tf.float32)
output = tf.multiply(input1, input2)
with tf.Session() as sess:
    print(sess.run([output], feed_dict={input1:[7.], input2:[2.]}))
[array([14.], dtype=float32)]

把numpy转换成Tensor

import numpy as np
a = np.zeros((3,3))
print(a)
print('----------------')
ta = tf.convert_to_tensor(a)
with tf.Session() as sess:
     print(sess.run(ta))
[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]
----------------
[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]

类型转换

为了让特定运算能运行,有时会对类型进行转换。例如,你尝试下列代码,会报错:

tf.subtract(tf.constant(2.0),tf.constant(1))
TypeError: Input 'y' of 'Sub' Op has type int32 that does not match type float32 of argument 'x'.

只是因为常量 1 是整数,但是常量 2.0 是浮点数 subtract 需要他们能相符。

在这种情况下,你可以让数据都是同一类型,或者强制转换一个值到另一个类型。这里,我们可以把 2.0 转换成整数再相减,这样就能得出正确的结果:

number = tf.subtract(tf.cast(tf.constant(2.0), tf.int32), tf.constant(1))   
with tf.Session() as sess:
    print(sess.run(number))
1

tensorboard 了解图结构/可视化利器

import tensorflow as tf
a = tf.constant(2, name='A')
b = tf.constant(3, name='B')
x = tf.add(a,b, name='addAB')
with tf.Session() as sess:
    print(sess.run(x))
    #写到日志文件里
    writer = tf.summary.FileWriter('./graphs/add_test', sess.graph)
    #关闭writer
    writer.close()
5

启动 TensorBoard

在命令端运行:tensorboard –logdir=”./graphs” –port 7007

然后打开Google浏览器访问:http://localhost:7007/

实践

TensorFlow实现线性回归

import numpy as np
import os
import tensorflow as tf
import matplotlib.pyplot as plt

设置生成的图像尺寸和去除警告

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
plt.rcParams["figure.figsize"] = (14, 8)  # 生成的图像尺寸

随机生成一个线性的数据,当然你可以换成读取对应的数据集

n_observations = 100
xs = np.linspace(-3, 3, n_observations)
ys = 0.8*xs + 0.1 + np.random.uniform(-0.5, 0.5, n_observations)
plt.scatter(xs, ys)
plt.show()

images

准备好placeholder

X = tf.placeholder(tf.float32, name='X')
Y = tf.placeholder(tf.float32, name='Y')

初始化参数/权重

W = tf.Variable(tf.random_normal([1]), name='weight')
b = tf.Variable(tf.random_normal([1]), name='bias')

计算预测结果

Y_pred = tf.add(tf.multiply(X, W), b)

计算损失值函数

loss = tf.square(Y - Y_pred, name='loss')

初始化optimizer

learning_rate = 0.01
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

指定迭代次数,并在session里执行graph

n_samples = xs.shape[0]
init = tf.global_variables_initializer()
with tf.Session() as sess:
    # 记得初始化所有变量
    sess.run(init)

    writer = tf.summary.FileWriter('./graphs/linear_regression', sess.graph)

    # 训练模型
    for i in range(50):
        total_loss = 0
        for x, y in zip(xs, ys):
            # 通过feed_dic把数据灌进去
            _, loss_value = sess.run([optimizer, loss], feed_dict={X: x, Y: y})
            total_loss += loss_value
        if i % 5 == 0:
            print('Epoch {0}: {1}'.format(i, total_loss / n_samples))

    # 关闭writer
    writer.close()

    # 取出w和b的值
    W, b = sess.run([W, b])
Epoch 0: [0.7908481]
Epoch 5: [0.07929672]
Epoch 10: [0.07929661]
Epoch 15: [0.07929661]
Epoch 20: [0.07929661]
Epoch 25: [0.07929661]
Epoch 30: [0.07929661]
Epoch 35: [0.07929661]
Epoch 40: [0.07929661]
Epoch 45: [0.07929661]

打印最后更新的w、b的值

print(W, b)
print("W:"+str(W[0]))
print("b:"+str(b[0]))
[0.82705235] [0.16835527]
W:0.82705235
b:0.16835527

画出线性回归线

plt.plot(xs, ys, 'bo', label='Real data')
plt.plot(xs, xs * W + b, 'r', label='Predicted data')
plt.legend()
plt.show()

44.png