在Ubuntu系统中使用Python进行机器学习应用是一个相对简单且高效的过程。以下是一个详细的步骤指南,帮助你搭建环境并进行基本的机器学习任务。
系统要求与准备
首先,确保你的Ubuntu系统满足以下要求:
- 操作系统:Ubuntu 24.04 LTS 或更新版本
- 处理器:64 位 CPU,至少 2 核(推荐 Intel Core i5 或 AMD Ryzen 5)
- 内存:最小 4 GB(推荐 8 GB 或更多,适合密集 AI 模型)
- 存储:至少 10 GB 可用空间(推荐使用 SSD 以提高性能)
- 显卡:可选,推荐 NVIDIA GPU(至少 4 GB VRAM,用于 TensorFlow 或 PyTorch 的 GPU 加速)
设置 AI 开发环境
-
安装 Python:
- 检查 Python 版本:
python3 --version
- 安装 Python 3(如果未安装):
sudo apt update sudo apt install python3
- 安装 pip:
sudo apt install python3-pip
- 检查 Python 版本:
-
安装 Git:
- 安装 Git:
sudo apt install git
- 验证安装:
git --version
- 安装 Git:
-
设置虚拟环境:
- 安装
python3-venv
包:sudo apt install python3-venv
- 创建项目目录并激活虚拟环境:
mkdir my_ai_project cd my_ai_project python3 -m venv venv source venv/bin/activate
- 安装
-
安装 AI 库:
- 在虚拟环境中安装 TensorFlow、Keras 和 PyTorch:
pip3 install tensorflow pip3 install keras pip3 install torch
- 在虚拟环境中安装 TensorFlow、Keras 和 PyTorch:
构建并运行第一个 AI 模型
以下是一个使用 TensorFlow 和 Keras 对 MNIST 数据集进行分类的简单示例:
-
创建 Python 文件:
sudo nano first_ai_model.py
-
添加以下代码:
import tensorflow as tf from tensorflow import keras from tensorflow.keras import layers # 加载 MNIST 数据集 (x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data() # 预处理:归一化像素值 x_train = x_train / 255.0 x_test = x_test / 255.0 # 构建神经网络模型 model = keras.Sequential() model.add(layers.Flatten(input_shape=(28, 28))) # 展平 28x28 图像 model.add(layers.Dense(128, activation='relu')) # 隐藏层,128 个单元,使用 ReLU 激活 model.add(layers.Dense(10, activation='softmax')) # 输出层,10 类,使用 softmax # 编译模型 model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 训练模型,5 个 epoch model.fit(x_train, y_train, epochs=5) # 评估模型 test_loss, test_acc = model.evaluate(x_test, y_test) print(f'Test accuracy: {test_acc * 100:.2f}%')
-
运行 Python 脚本:
python3 first_ai_model.py
训练完成后,将显示测试准确率,通常在 97%-98% 左右,验证模型有效性。
使用 Jupyter 进行机器学习项目开发
-
安装 Anaconda 或 Miniconda:
-
创建一个新的 conda 环境:
conda create -n myenv python3.8
-
激活新环境:
conda activate myenv
-
安装 Jupyter 和其他必要的库:
conda install jupyter numpy pandas matplotlib seaborn scikit-learn
-
启动 Jupyter Notebook:
jupyter notebook
-
创建一个新的 Notebook 文件:
- 在 Jupyter Notebook 界面中,点击“New”按钮,然后选择“Python 3”(或者你创建的 conda 环境的名称)。
-
编写代码并运行:
- 在新创建的 Notebook 文件中,导入之前安装的库,然后使用它们进行机器学习项目开发。
通过以上步骤,你可以在 Ubuntu 系统上使用 Python 进行机器学习应用。根据具体需求,你可以进一步探索和优化模型,使用更多的机器学习库和工具。