在Theano中,可以通过定义计算图来训练和推理模型。下面是一个简单的示例:
-
定义模型结构:首先,需要定义模型的输入、参数和输出。例如,可以使用Theano的
T.matrix
来定义输入和输出的矩阵。然后,定义模型的参数,例如权重和偏置。 -
定义损失函数:在训练模型时,需要定义损失函数来衡量模型的性能。常见的损失函数包括均方误差(MSE)和交叉熵损失。
-
定义优化算法:选择一个优化算法来最小化损失函数,例如随机梯度下降(SGD)或Adam。
-
编译函数:使用Theano的
function
来编译训练和推理函数。在训练函数中,将输入数据传入模型并计算损失函数,然后使用优化算法更新模型参数。在推理函数中,将输入数据传入模型并输出预测结果。 -
训练和推理:使用训练函数来训练模型,并使用推理函数来对新数据进行预测。
下面是一个简单的示例代码:
import theano import theano.tensor as T import numpy as np # 定义模型结构 X = T.matrix('X') Y = T.matrix('Y') W = theano.shared(np.random.randn(2, 2), name='W') b = theano.shared(np.zeros(2), name='b') # 定义模型 Y_pred = T.dot(X, W) + b # 定义损失函数 loss = T.mean((Y_pred - Y) ** 2) # 定义优化算法 learning_rate = 0.01 updates = [(W, W - learning_rate * T.grad(loss, W)), (b, b - learning_rate * T.grad(loss, b))] # 编译函数 train = theano.function(inputs=[X, Y], outputs=loss, updates=updates) predict = theano.function(inputs=[X], outputs=Y_pred) # 训练模型 X_train = np.array([[0, 1], [2, 3]]) Y_train = np.array([[1, 3], [5, 7]]) for i in range(100): loss = train(X_train, Y_train) print('Epoch {}, Loss: {}'.format(i, loss)) # 推理模型 X_test = np.array([[4, 5], [6, 7]]) Y_pred = predict(X_test) print('Predictions:', Y_pred)
在这个示例中,我们定义了一个简单的线性模型,并使用随机梯度下降算法训练模型。最后,使用训练好的模型对新数据进行预测。