人工智能(AI)是当今科技领域中备受瞩目的领域之一,它正在改变我们的生活方式、工作方式以及与技术互动的方式。本文将带您从零开始,一步步搭建一个完整的AI开发环境,并创建一个简单的AI应用程序,以便您能够亲身体验AI的魅力。
一、准备工作
在开始之前,我们需要做一些准备工作。这包括安装必要的工具和设置开发环境。
(一)硬件要求
运行 AI 开发环境,对计算机硬件有一定要求。至少配备 4GB 内存,如果想更流畅地训练模型,8GB 及以上内存更佳。处理器方面,多核 CPU 能加快计算速度,若有 NVIDIA 显卡,借助 CUDA 加速,可大幅提升深度学习模型训练效率。
(二)软件准备
二、搭建 AI 开发环境
(一)安装 TensorFlow
安装 TensorFlow 前,建议先创建一个虚拟环境,避免不同项目的依赖冲突。以 Windows 系统为例,打开命令提示符,执行以下命令:
- 安装虚拟环境工具(如果未安装)
pip install virtualenv
- 创建虚拟环境
virtualenv myenv
这里 “myenv” 是虚拟环境的名称,你可以自行修改。
- 激活虚拟环境
myenv\Scripts\activate
在虚拟环境激活后,使用以下命令安装 TensorFlow:
pip install tensorflow
如果你有 NVIDIA 显卡,想利用 GPU 加速,可以安装 TensorFlow-GPU 版本:
pip install tensorflow-gpu
安装完成后,可以在 Python 交互环境中输入以下代码验证是否安装成功:
import tensorflow as tf
print(tf.__version__)
若能正常输出版本号,说明 TensorFlow 安装成功。
(二)安装其他常用库
除了 TensorFlow,还需要安装一些常用的库,如 NumPy(用于数值计算)、Pandas(用于数据处理和分析)、Matplotlib(用于数据可视化)。在虚拟环境激活状态下,执行以下命令安装:
pip install numpy pandas matplotlib
三、创建第一个 AI 应用:手写数字识别
(一)项目介绍
手写数字识别是 AI 领域一个经典的入门项目。我们将使用 TensorFlow 构建一个简单的神经网络模型,训练它识别 0 - 9 的手写数字图像。
(二)数据准备
TensorFlow 提供了 MNIST 数据集,这是一个非常著名的手写数字图像数据集,包含 60,000 张训练图像和 10,000 张测试图像。在代码中可以直接通过 TensorFlow 加载该数据集:
import tensorflow as tf
from tensorflow.keras.datasets import mnist
# 加载数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()
加载后的数据集,x_train和x_test分别是训练集和测试集的图像数据,形状为(样本数量, 图像高度, 图像宽度);y_train和y_test是对应的标签数据,代表图像中数字的类别。
(三)数据预处理
在训练模型之前,需要对数据进行预处理。将图像数据归一化到 0 - 1 之间,以提高模型的训练效果:
x_train, x_test = x_train / 255.0, x_test / 255.0
同时,将标签数据进行独热编码(One-Hot Encoding),将类别标签转换为向量形式:
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)
(四)模型构建
使用 TensorFlow 的 Keras API 构建一个简单的神经网络模型:
model = tf.keras.models.Sequential([
tf.keras.layers.Flatten(input_shape=(28, 28)),
tf.keras.layers.Dense(128, activation='relu'),
tf.keras.layers.Dense(10, activation='softmax')
])
这个模型包含三层:
-
Flatten 层:将 28x28 的二维图像数据展平为一维向量,方便后续处理。
-
Dense 层:包含 128 个神经元,使用 ReLU 激活函数,用于提取图像特征。
-
Dense 层:包含 10 个神经元,对应 0 - 9 的 10 个类别,使用 softmax 激活函数,输出每个类别的概率。
(五)模型编译
在训练模型之前,需要对模型进行编译,指定优化器、损失函数和评估指标:
model.compile(optimizer='adam',
loss='categorical_crossentropy',
metrics=['accuracy'])
这里使用 Adam 优化器,它是一种自适应学习率的优化算法;损失函数选择categorical_crossentropy,适用于多分类问题;评估指标选择accuracy,用于衡量模型的预测准确率。
(六)模型训练
使用准备好的训练数据对模型进行训练:
model.fit(x_train, y_train, epochs=5, batch_size=32)
这里设置训练 5 个 epochs(迭代次数),每次训练使用 32 个样本作为一个批次。训练过程中,模型会不断调整参数,以最小化损失函数。
(七)模型评估
使用测试数据对训练好的模型进行评估:
test_loss, test_acc = model.evaluate(x_test, y_test)
print('Test accuracy:', test_acc)
运行上述代码,你将得到模型在测试集上的准确率,评估模型的性能表现。
(八)模型预测
训练好的模型可以用来对新的图像进行预测。例如,随机选取测试集中的一张图像进行预测:
import numpy as np
import matplotlib.pyplot as plt
# 随机选取一张测试图像
index = np.random.randint(0, len(x_test))
image = x_test[index]
label = np.argmax(y_test[index])
# 显示图像
plt.imshow(image, cmap='gray')
plt.title(f"True Label: {label}")
plt.show()
# 进行预测
image = np.expand_dims(image, axis=0) # 增加一个维度,符合模型输入要求
prediction = model.predict(image)
predicted_label = np.argmax(prediction)
print(f"Predicted Label: {predicted_label}")
这段代码会显示随机选取的测试图像及其真实标签,并输出模型的预测结果。
通过以上步骤,你已经成功搭建了 AI 开发环境,并创建了第一个 AI 应用。AI 的世界丰富多彩,后续你还可以尝试更多复杂的模型和应用,探索更多有趣的实际案例,比如图像分类、自然语言处理等。
那么,如何系统的去学习大模型LLM?
作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
👉④.福利篇👈
保证100%免费相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!