实验二:分类预测小项目作业
实验简介
本课程为 2024 年数字媒体技术虚拟现实方向机器学习课程第二次小组作业(实验),主要内容为分类预测。
TIP
项目一参考内容为 2020 级数据专业张开源学长的思路,其他实验请自行查找相关资料。
关于 HWDG 数据集导入
参考导入方式:MNIST 数据集:解析 train-images-idx3-ubyte 格式
或者可以参考如下代码:
python
import numpy as np
import struct
# 导入idx3ubyte格式的HWDG数据集
dataPath = f"" # 这里填入idx3ubyte格式数据集路径
with open(dataPath, 'rb') as f:
magic, imgNum, rows, cols = struct.unpack('>IIII', f.read(16))
images = np.fromfile(f, dtype=np.uint8).reshape(imgNum, rows, cols)
print(images.shape) # 这就是图片数据集,与MNIST数据集类似
# 导入idx1ubyte格式的数据集
dataPath = f""
with open(dataPath, 'rb') as f:
magic, labelNum = struct.unpack('>II', f.read(8))
labels = np.fromfile(f, dtype=np.uint8)
print(labels) # 这就是标签数据集,与MNIST数据集类似