123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107 |
- from model import LeNet5 # 引入我们写好的神经网络(也是我们要训练的网络)
- from torch.nn import CrossEntropyLoss # 引入损失函数(用来做分类损失最佳)
- from torch.optim import Adam # 损失函数优化器(其他损失函数的最小值:使用梯度下降法)
- from torchvision.datasets import MNIST # 数据集
- from torchvision.transforms import Compose, ToTensor # 图像转换为张量
- from torch.utils.data import DataLoader # 批次数据集(数据集不是一次训练,而是分成多个批次)
- import torch # 调用torch的基本函数
- import os # 路径与文件处理
- class Trainer:
- def __init__(self):
- # 判定电脑安装GPU的环境:cuda,cnn,pytorch-
- self.CUDA = False # torch.cuda.is_available() # 返回逻辑值:True:支持GPU,False不支持GPU
- # 准备训练需要的数据、损失函数,优化器,学习率
- self.lr = 0.0001
- self.m_file = "lenet5.pt" # 模型的保存文件
- self.net = LeNet5() # 需要训练的网络
- if self.CUDA:
- self.net.cuda() # 把net网络模型存储到GPU上面
- # 加载上一次训练的模型
- if os.path.exists(self.m_file):
- # 存在就加载
- print("加载模型中...")
- state = torch.load(self.m_file) # 读取文件
- self.net.load_state_dict(state)
- else:
- print("模型存在,重头训练")
- self.loss_f = CrossEntropyLoss() # 损失函数
- self.optimizer = Adam(self.net.parameters(), lr=self.lr) # 优化器
- # 数据集 - 训练集
- self.trans = Compose([ToTensor()])
- self.ds_train = MNIST(root="datasets", download=True, train=True, transform=self.trans)
- self.bt_train = DataLoader(self.ds_train, batch_size=1000, shuffle=True)
- # 数据集 - 验证集
- self.ds_valid = MNIST(root="datasets", download=True, train=False, transform=self.trans)
- self.bt_valid = DataLoader(self.ds_valid, batch_size=1000, shuffle=False) # shuffle=False是否随机打乱
- def train_one(self):
- # 训练一轮epoch,60批次batch,每个批次1000张录像
- # 循环训练每个批次
- batch = 1
- for x, y in self.bt_train:
- # print(F"\t|-第{batch:02d}批次训练。")
- if self.CUDA:
- x = x.cuda()
- y = y.cuda()
- y_ = self.net(x) # 进行预测
- # 计算误差
- loss = self.loss_f(y_, y) # 使用真实的标签与预测标签计算sunshi
- # 优化卷积核与全链接矩阵
- self.optimizer.zero_grad()
- loss.backward() # 使用导数计算梯度
- self.optimizer.step() # 更新梯度,优化网络模型
- batch+=1
- @torch.no_grad() # 该函数中的运算都不会进行求导跟踪
- def valid(self):
- # 使用测试数据集验证 (准确率,损失值)
- all_num = 0.0 # 验证的样本数
- acc_num = 0.0 # 识别正确数量
- all_loss = 0.0 # 累加每个样本的损失
- for t_x, t_y in self.bt_valid:
- if self.CUDA:
- t_x = t_x.cuda()
- t_y = t_y.cuda()
- # 统计样本数
- all_num += len(t_x)
- # 预测
- t_y_ = self.net(t_x)
- # 判定准确
- y_cls = torch.argmax(t_y_, dim=1)
- # 统计正确率
- acc_num += (y_cls == t_y).float().sum()
- # 统计损失
- all_loss += self.loss_f(t_y_, t_y)
- print(F"\t|- 训练损失:{all_loss/all_num:8.6f}")
- print(F"\t|- 准确率:{acc_num * 100.0/all_num:5.2f}%")
- def train(self, epoch):
- # 训练指定的论数
- for e in range(epoch):
- print(F"第{e:04d}轮训练。")
- self.train_one()
- self.valid()
- # 保存训练的模型
- torch.save(self.net.state_dict(), self.m_file)
- if __name__ == "__main__":
- trainer = Trainer()
- trainer.train(50) # 训练10轮
- # print(torch.cuda.is_available())
- """
- 244K = 6 * 5 * 5 * 8 矩阵
- 16 * 5 * 5 * 8
- 120 * 5 * 5 * 8
- 120 * 84* 8
- 84 * 10*8
- """
|