手写数字识别数据集教程：读懂 train.csv、test.csv 和标签

Q: 这篇文章适合谁读？

这篇文章适合想用 入门 难度理解“手写数字识别项目入门：先读懂 train.csv、test.csv 和标签结构”的读者，预计阅读时间约 8 分钟，重点覆盖 Dataset, CSV, Image Classification。

阅读信息

难度: 入门阅读时间: 8 分钟

Dataset
CSV
Image Classification

打开知识图谱

中文

手写数字识别项目入门：先读懂 train.csv、test.csv 和标签结构

这组手写数字项目来自一个非常典型的入门场景：我们拿到一份已经展开成表格的图像数据，目标是根据 28 x 28 像素的灰度值预测数字 0 到 9。和很多只讲模型公式的文章不同，这个项目更适合从“文件结构”和“数据长什么样”开始读，因为后面的 C 程序、浏览器实验台和提交文件都建立在同一套输入格式上。

如果你已经会一点 C 或 Python，这类项目是很好的过渡练习。它既不像纯算法题那样只有抽象状态，也不像完整深度学习项目那样一开始就需要复杂框架。先把数据读懂，后面的训练、预测和调试会顺很多。

一、这个项目里有哪些文件

train.csv：训练集，共 42000 条样本，每条样本包含 1 个标签和 784 个像素值
test.csv：测试集，共 28000 条样本，只包含 784 个像素值，没有标签
sample_submission.csv：官方给出的提交格式示例
submission.csv：当前项目运行后生成的预测结果
digit_softmax_classifier.c：本项目的 C 语言实现

这类结构很适合做监督学习入门，因为训练集和测试集分工很清楚：训练集负责学习参数，测试集负责生成最终预测结果。

二、train.csv 的每一行到底是什么

train.csv 的第一列是标签，也就是这张图片真实对应的数字。后面 784 列是像素值，范围通常在 0 到 255 之间：

label,pixel0,pixel1,pixel2,...,pixel783
5,0,0,0,0,...,0
0,0,0,12,178,...,0
4,0,0,0,0,...,0

这里最重要的理解是：原始图像已经被“拉平”成一个长度为 784 的向量。也就是说，程序读到的不是图片文件，而是一行一行的数字表格。

因为 28 x 28 = 784，所以你可以把它理解成：

第 1 行像素  +  第 2 行像素  +  ...  +  第 28 行像素
= 一条长度为 784 的特征向量

这就是为什么传统的线性分类器也能直接拿它做输入：对模型来说，它只是一组 784 维数值特征。

三、test.csv 和训练集的区别

test.csv 只有像素，没有标签。这意味着程序不能再拿它继续训练，而是要基于已经学到的参数直接做预测：

训练时：输入特征 + 正确答案
预测时：只有输入特征，没有正确答案

这一步在初学者项目里很关键，因为它会逼着你把“训练逻辑”和“推理逻辑”分开写。项目里最后导出的 submission.csv，本质上就是把测试集逐条送进模型之后得到的标签结果。

四、C 程序是怎么把这些数据读进来的

这个项目的读取方式比较直接：先按逗号切开每一行，再把第一个字段当成标签，把后面的 784 个字段当成像素。

y_train[sample_count] = atoi(tokens[0]);
for (int j = 0; j < FEATURES; j++) {
    X_train[sample_count][j] = atof(tokens[j + 1]) / 255.0;
}

这里有两个重要细节：

标签单独保存：便于后续计算损失和判断预测是否正确
像素除以 255：把原始灰度值压到 0 到 1 之间，训练会更稳定

如果你直接把 0 到 255 的原始像素塞给一个梯度下降模型，参数更新会更容易受尺度影响。对这类表格化图像项目来说，做一次简单归一化几乎是默认操作。

五、为什么这种“表格图像”特别适合入门

它有三个优点：

数据结构简单：不需要先学图像文件解码
标签明确：10 个数字类别，适合多分类练习
调试直接：任何一行都能拿出来还原成 28 x 28 网格查看

也正因为这样，这个项目很适合把“机器学习流程”真正串起来：读入数据、归一化、训练参数、输出预测，再把预测写回 CSV 文件。

六、开始训练前最值得先检查什么

如果你准备自己写一个版本，建议先确认下面几件事：

有没有正确跳过表头
训练集行数是不是接近 42000，测试集是不是接近 28000
每行是不是刚好有 785 或 784 个字段
像素值是否已经缩放到 0 到 1
标签是不是仍然保持在 0 到 9 之间

这些检查比换模型更基础。很多训练失败并不是算法错误，而是 CSV 没读对、字段偏移、或者归一化漏掉了。

七、用几行统计先确认数据没有读歪

在训练模型之前，最好先做一次小型数据体检。它不需要复杂可视化，只要确认标签分布、像素范围和空白像素比例是否合理。下面这类检查能很快发现字段错位、缺行、表头没跳过或像素没有归一化的问题。

import csv
from collections import Counter

labels = Counter()
pixel_min, pixel_max = 255, 0
nonzero_pixels = 0
total_pixels = 0

with open("train.csv", newline="") as f:
    reader = csv.reader(f)
    header = next(reader)
    for row in reader:
        labels[int(row[0])] += 1
        pixels = [int(v) for v in row[1:]]
        pixel_min = min(pixel_min, min(pixels))
        pixel_max = max(pixel_max, max(pixels))
        nonzero_pixels += sum(v > 0 for v in pixels)
        total_pixels += len(pixels)

print(labels)
print(pixel_min, pixel_max, nonzero_pixels / total_pixels)

检查项	正常信号	异常时可能说明什么
标签分布	0 到 9 都有足够样本	标签列读错、文件被截断或类别严重不平衡
像素范围	原始 CSV 在 0 到 255 之间	字段偏移、非数字内容或归一化重复执行
非零像素比例	远低于 1，但不能接近 0	图片全黑、读取空列或分隔符解析错误
每行字段数	训练集 785，测试集 784	换行、缺列、额外逗号或表头处理错误

八、如何把一行数据还原成 28 x 28

只看 CSV 行很难发现图像是否读反、读偏或顺序错了。最直接的办法是把任意一行的 784 个像素重新按 28 列切开，打印成字符图或保存成小图片。哪怕不用绘图库，也可以用简单字符判断数字轮廓是否合理。

pixels = [int(v) for v in row[1:]]
for r in range(28):
    line = pixels[r * 28:(r + 1) * 28]
    print("".join("#" if v > 80 else "." for v in line))

如果字符图完全看不出数字，先不要怀疑模型。更应该回到读取流程，检查表头、分隔符、字段数量和像素顺序。对机器学习项目来说，能把输入样本还原成人能检查的形式，是非常重要的调试能力。

九、接下来该读哪篇

如果你已经看懂了这份数据长什么样，下一步建议直接读用 C 实现手写数字 Softmax 分类器。那篇会把这 784 维输入如何经过权重矩阵、softmax 和梯度更新，最终变成 submission.csv 讲清楚。

项目文件和压缩数据已经放到下载页的手写数字资源区；如果你想直接试网页上的轻量演示，可以继续打开算法实验台里的手写数字标签页。

英文

Handwritten Digit Project Basics: Understanding train.csv, test.csv, and Labels

在独立页面打开

This handwritten digit project is a good bridge between theory-heavy machine learning notes and a real classification workflow. The input is simple enough to inspect row by row, but the project still forces you to deal with data loading, normalization, model training, and prediction output in a coherent way.

The best place to start is not the training loop. It is the dataset structure. The C classifier, the browser playground, and the final submission file all depend on the same flat 28 by 28 pixel format, so understanding the CSV layout makes the rest of the project much easier to follow.

1. What files are in the project

train.csv: the training set with 42000 labeled samples
test.csv: the test set with 28000 unlabeled samples
sample_submission.csv: the expected output format
submission.csv: the prediction file generated by the current implementation
digit_softmax_classifier.c: the C implementation used on the site

This layout is common in beginner-friendly supervised learning challenges because it keeps the separation of responsibilities clear: one file for learning parameters, one file for final predictions.

2. What one row in `train.csv` means

The first column is the label, which is the true digit for that image. The remaining 784 columns are grayscale pixel intensities between 0 and 255:

label,pixel0,pixel1,pixel2,...,pixel783
5,0,0,0,0,...,0
0,0,0,12,178,...,0
4,0,0,0,0,...,0

The important detail is that the original image has already been flattened into a feature vector. The program does not read image files. It reads numeric rows.

Because 28 x 28 = 784, every sample is effectively:

row 1 pixels + row 2 pixels + ... + row 28 pixels
= one 784-dimensional feature vector

That is why a plain linear classifier can still work on this task. To the model, the image is just a structured numeric input vector.

3. How `test.csv` differs from the training set

test.csv contains only pixels and no labels. That means the program cannot keep training on it. It must use the parameters learned from train.csv and produce predictions directly.

Training: input features plus the correct answer
Inference: input features only, no answer attached

This distinction matters because it forces the implementation to separate training logic from prediction logic. The exported submission.csv is simply the predicted label for each test sample written back into the required output format.

4. How the C program loads the data

The loader is intentionally straightforward. It splits each CSV row by commas, stores the first field as the label, and turns the remaining 784 fields into numeric features.

y_train[sample_count] = atoi(tokens[0]);
for (int j = 0; j < FEATURES; j++) {
    X_train[sample_count][j] = atof(tokens[j + 1]) / 255.0;
}

Two implementation details matter here:

The label is stored separately so the training loop can compute loss and accuracy
The pixels are divided by 255 so the values stay in the 0 to 1 range

If you skip the normalization step and train directly on raw 0 to 255 pixel values, gradient-based optimization becomes less stable. For flat image tables like this one, simple scaling is the right default.

5. Why this format is good for learning

This project is useful because it removes a lot of incidental complexity:

Simple input structure: no image decoding pipeline required
Clear labels: ten classes, one digit per sample
Direct debugging path: any row can be reshaped back into a 28 by 28 grid

That makes it a strong practice task for the full machine learning workflow: load data, normalize features, train parameters, run predictions, and export a CSV result.

6. What to validate before training

If you implement your own version, check these first:

Whether the header row is skipped correctly
Whether the training and test counts are close to 42000 and 28000
Whether each row contains exactly 785 or 784 fields
Whether pixel values have been scaled to 0 to 1
Whether labels still stay in the 0 to 9 range

Those checks matter more than changing the model too early. Many broken training runs come from bad CSV parsing, off-by-one field mistakes, or missing normalization.

7. Dataset Audit Table

Before training a classifier, the dataset itself needs an audit trail. The table below turns the CSV description into concrete checks a reader can repeat locally, which is more useful than only saying that the file has pixels and labels.

Audit item	What to verify	Why it matters	Failure signal
Row shape	`train.csv` has 785 fields per row; `test.csv` has 784.	The label column exists only in training data.	Predictions shift by one pixel column or labels are parsed as features.
Pixel scale	Values are integers from 0 to 255 before normalization.	The C model divides by 255.0 to keep optimization stable.	Loss becomes unstable or gradients are much larger than expected.
Label range	Training labels stay in the 0 to 9 class range.	Softmax output has exactly ten classes.	Array indexing errors or impossible labels appear in logs.
Output contract	`submission.csv` keeps `ImageId,Label` and one prediction per test row.	The pipeline must export reusable predictions, not only train locally.	Wrong row count, missing header, or predicted labels outside 0 to 9.

8. What to read next

Once the dataset format makes sense, continue with the C softmax classifier article. That article walks through the weight matrix, softmax probabilities, gradient updates, and how the project produces submission.csv.

The downloadable files now live on the downloads page, and the lightweight interactive version is available in the handwritten digit tab inside the playground.

一、这个项目里有哪些文件

train.csv：训练集，共 42000 条样本，每条样本包含 1 个标签和 784 个像素值
test.csv：测试集，共 28000 条样本，只包含 784 个像素值，没有标签
sample_submission.csv：官方给出的提交格式示例
submission.csv：当前项目运行后生成的预测结果
digit_softmax_classifier.c：本项目的 C 语言实现

这类结构很适合做监督学习入门，因为训练集和测试集分工很清楚：训练集负责学习参数，测试集负责生成最终预测结果。

二、train.csv 的每一行到底是什么

train.csv 的第一列是标签，也就是这张图片真实对应的数字。后面 784 列是像素值，范围通常在 0 到 255 之间：

label,pixel0,pixel1,pixel2,...,pixel783
5,0,0,0,0,...,0
0,0,0,12,178,...,0
4,0,0,0,0,...,0

这里最重要的理解是：原始图像已经被“拉平”成一个长度为 784 的向量。也就是说，程序读到的不是图片文件，而是一行一行的数字表格。

因为 28 x 28 = 784，所以你可以把它理解成：

第 1 行像素  +  第 2 行像素  +  ...  +  第 28 行像素
= 一条长度为 784 的特征向量

这就是为什么传统的线性分类器也能直接拿它做输入：对模型来说，它只是一组 784 维数值特征。

三、test.csv 和训练集的区别

test.csv 只有像素，没有标签。这意味着程序不能再拿它继续训练，而是要基于已经学到的参数直接做预测：

训练时：输入特征 + 正确答案
预测时：只有输入特征，没有正确答案

四、C 程序是怎么把这些数据读进来的

这个项目的读取方式比较直接：先按逗号切开每一行，再把第一个字段当成标签，把后面的 784 个字段当成像素。

y_train[sample_count] = atoi(tokens[0]);
for (int j = 0; j < FEATURES; j++) {
    X_train[sample_count][j] = atof(tokens[j + 1]) / 255.0;
}

这里有两个重要细节：

标签单独保存：便于后续计算损失和判断预测是否正确
像素除以 255：把原始灰度值压到 0 到 1 之间，训练会更稳定

五、为什么这种“表格图像”特别适合入门

它有三个优点：

数据结构简单：不需要先学图像文件解码
标签明确：10 个数字类别，适合多分类练习
调试直接：任何一行都能拿出来还原成 28 x 28 网格查看

也正因为这样，这个项目很适合把“机器学习流程”真正串起来：读入数据、归一化、训练参数、输出预测，再把预测写回 CSV 文件。

六、开始训练前最值得先检查什么

如果你准备自己写一个版本，建议先确认下面几件事：

有没有正确跳过表头
训练集行数是不是接近 42000，测试集是不是接近 28000
每行是不是刚好有 785 或 784 个字段
像素值是否已经缩放到 0 到 1
标签是不是仍然保持在 0 到 9 之间

这些检查比换模型更基础。很多训练失败并不是算法错误，而是 CSV 没读对、字段偏移、或者归一化漏掉了。

七、用几行统计先确认数据没有读歪

import csv
from collections import Counter

labels = Counter()
pixel_min, pixel_max = 255, 0
nonzero_pixels = 0
total_pixels = 0

with open("train.csv", newline="") as f:
    reader = csv.reader(f)
    header = next(reader)
    for row in reader:
        labels[int(row[0])] += 1
        pixels = [int(v) for v in row[1:]]
        pixel_min = min(pixel_min, min(pixels))
        pixel_max = max(pixel_max, max(pixels))
        nonzero_pixels += sum(v > 0 for v in pixels)
        total_pixels += len(pixels)

print(labels)
print(pixel_min, pixel_max, nonzero_pixels / total_pixels)

检查项	正常信号	异常时可能说明什么
标签分布	0 到 9 都有足够样本	标签列读错、文件被截断或类别严重不平衡
像素范围	原始 CSV 在 0 到 255 之间	字段偏移、非数字内容或归一化重复执行
非零像素比例	远低于 1，但不能接近 0	图片全黑、读取空列或分隔符解析错误
每行字段数	训练集 785，测试集 784	换行、缺列、额外逗号或表头处理错误

八、如何把一行数据还原成 28 x 28

pixels = [int(v) for v in row[1:]]
for r in range(28):
    line = pixels[r * 28:(r + 1) * 28]
    print("".join("#" if v > 80 else "." for v in line))

九、接下来该读哪篇

项目文件和压缩数据已经放到下载页的手写数字资源区；如果你想直接试网页上的轻量演示，可以继续打开算法实验台里的手写数字标签页。

搜索问题

常见问题

这篇文章适合谁读？

这篇文章适合想用入门难度理解“手写数字识别项目入门：先读懂 train.csv、test.csv 和标签结构”的读者，预计阅读时间约 8 分钟，重点覆盖 Dataset, CSV, Image Classification。

读完后下一步应该看什么？

推荐下一步阅读“用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv”，这样可以把当前知识点接到更完整的学习路线里。

这篇文章有没有可运行代码或配套资源？

有。页面里的运行说明、资源卡片和下载入口会指向复现实验所需的命令、数据、代码或说明文件。

这篇文章和整个网站的学习路线有什么关系？

它会通过文章上下文、学习路线、资源库和项目时间线连接到同一主题下的其他内容。

文章上下文

人工智能项目

从 AI、机器学习、训练评估、神经网络到 Python 小实战、手写数字识别、CIFAR-10 CNN、对抗性流量防御和 AI 安全攻防，按顺序建立基础。

难度: 入门阅读时间: 8 分钟

Dataset
CSV
Image Classification

继续下一步

继续：用 C 实现手写数字 Softmax 分类器

打开资源查看项目

对应语言版本 Handwritten Digit Project Basics: Understanding train.csv, test.csv, and Labels

可分享摘要 手写数字识别项目入门：先读懂 train.csv、test.csv 和标签结构

从项目文件结构入手，读懂手写数字训练集、测试集、标签列和 784 维像素输入，为后续 C 分类器和实验台打基础。

下载分享图打开分享中心

配套资源

手写数字训练集压缩包，包含 42000 条带标签样本。

打开资源关联文章

手写数字测试集压缩包，包含 28000 条待预测样本。

打开资源关联文章

官方提交格式示例，可直接对照最终输出字段。

打开资源关联文章

发表回复取消回复

要发表评论，您必须先登录。

项目时间线

已发布文章

人工智能基础学习路线：先理解什么是 AI、机器学习和深度学习面向有编程基础的读者，梳理 AI、机器学习、深度学习的关系，并给出可执行的人工智能基础学习路线。
机器学习完整流程：从数据、特征到模型预测从工程视角拆解机器学习完整流程：定义问题、理解数据、处理特征、训练模型、预测和评估。
机器学习算法怎么选：分类、回归、聚类和推荐场景对照表用任务类型、数据规模、解释性和部署成本选择机器学习算法，覆盖逻辑回归、决策树、随机森林、K-means 和表格数据基线模型。
特征工程入门实战：用 scikit-learn 处理缺失值、类别变量和数值标准化用 scikit-learn Pipeline 和 ColumnTransformer 完成特征工程，处理缺失值、类别变量、数值标准化，并避免数据泄漏。
模型训练与评估入门：损失函数、过拟合和准确率怎么理解讲清楚模型训练中的参数、损失函数、梯度下降、过拟合，以及准确率、召回率、F1 等分类评估指标。
过拟合和欠拟合怎么解决：机器学习模型调优实战指南用训练分数和验证分数判断过拟合与欠拟合，并通过模型复杂度、正则化、交叉验证和特征工程调整机器学习模型。
神经网络基础：从感知机到多层网络从一个神经元讲起，解释权重、偏置、激活函数、前向传播、反向传播和典型神经网络训练循环。
神经网络矩阵微积分：从 y = Wx + b 推导 MSE 梯度用手算、矩阵形状图、NumPy 代码和梯度检查解释 y = Wx + b 下 dL/dW = (ŷ - y)x^T 的来源。
反向传播计算图：两层 MLP 的前向、局部梯度和反向传播把两层 MLP 拆成计算图，手算 ReLU、softmax cross-entropy、dW2、dW1，并用 NumPy 复现实验结果。
梯度下降与优化器几何：Momentum、Adam 和 loss surface 轨迹在二维二次函数上手算梯度下降前几步，比较 Momentum 和 Adam 的轨迹，并用代码生成 loss contour。
卷积与感受野数学：5×5 输入、3×3 kernel、padding 和 im2col 手算一次 5x5 输入与 3x3 kernel 的离散卷积，解释输出尺寸、padding、stride、感受野和 im2col。
Transformer Attention 数学：Q/K/V、Softmax 权重、Mask 与 KV Cache 用 3 个 token 手算 scaled dot-product attention，解释 Q/K/V、softmax、mask、多头注意力和 KV cache。
Python 人工智能小实战：用 scikit-learn 完成一个分类任务使用 scikit-learn 内置教学数据集跑通一个分类任务，覆盖数据加载、拆分、标准化、训练、预测、评估和实验记录。
手写数字识别项目入门：先读懂 train.csv、test.csv 和标签结构从项目文件结构入手，读懂手写数字训练集、测试集、标签列和 784 维像素输入，为后续 C 分类器和实验台打基础。
用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv 结合当前项目源码，讲清楚 softmax 多分类、损失函数、梯度更新、混淆矩阵输出，以及 submission.csv 的生成过程。
手写数字实验记录：怎么把离线分类项目接进浏览器实验台解释浏览器实验台为什么采用轻量预训练模型、它和离线 C 项目的关系，以及如何用样本浏览和手绘输入理解预测结果。
CIFAR-10 Tiny CNN 教程：用 C 语言实现小型卷积神经网络图像分类用单文件 C 程序完成 CIFAR-10 小型 CNN 图像分类，讲解数据格式、网络结构、训练命令、loss、accuracy、常见错误和改进方向。
构建高熵流量防御：基于 Python 的连接层白噪声混淆与对抗性机器学习实践以 mld_chaffing_v2.py 虚幻镜项目为例，讲解加密元数据泄漏、信息熵、分布距离、混淆矩阵、空闲窗口微脉冲和性能测试取舍。
AI 安全威胁建模：用 NIST AML、MITRE ATLAS 和 OWASP 建立攻防地图用 NIST Adversarial ML、MITRE ATLAS 和 OWASP LLM Top 10 建立 AI 安全威胁模型，覆盖资产、攻击面、证据和剩余风险。
对抗样本与鲁棒评估：从 FGSM 公式到 scikit-learn 数字分类实验从 FGSM 公式解释对抗样本，用 scikit-learn digits toy 实验评估 clean accuracy、perturbed accuracy 和扰动预算。
数据投毒与后门攻击防御：污染率、触发器和训练管线隔离用 toy digits 实验解释数据投毒、后门触发器、attack success rate、数据来源审计和训练管线隔离。
模型隐私与模型窃取风险：成员推断、模型抽取和输出接口防护用本地 toy 实验解释成员推断、模型抽取、membership AUC、surrogate fidelity、输出最小化和查询治理。
LLM/RAG/Agent 安全：Prompt Injection、工具权限和边界感知防护从 RAG 和 Agent 架构解释 prompt injection、外部数据降权、工具 allowlist、人工审批和边界感知防护。

已公开资源

Python AI 小实战代码说明文章内包含可直接复制运行的 scikit-learn 分类脚本。
digit_softmax_classifier.c 手写数字 softmax 分类器的 C 语言源码。
train.csv.zip 手写数字训练集压缩包，包含 42000 条带标签样本。
test.csv.zip 手写数字测试集压缩包，包含 28000 条待预测样本。
sample_submission.csv 官方提交格式示例，可直接对照最终输出字段。
submission.csv 当前 C 项目跑出的预测结果文件。
digit-playground-model.json 浏览器实验台使用的轻量 softmax 演示模型与样本。
digit-sample-grid.svg 从训练集中抽取的小型手写数字预览网格。
手写数字项目打包下载包含源码、压缩数据、提交文件、浏览器模型和样本预览图。
cifar10_tiny_cnn.c 源码单文件 C 语言 tiny CNN，包含 CIFAR-10 读取、卷积、池化、softmax 和反向传播。
model_weights.bin 样例权重一次本地小样本运行生成的模型权重文件。
test_predictions.csv 预测样例 CIFAR-10 tiny CNN 输出的测试预测样例。
CNN 项目说明 PDF 配套 CNN 项目说明材料。
虚幻镜脱敏代码骨架去除控制口令、真实节点和目标列表后的 mld_chaffing_v2.py 控制流程说明。
虚幻镜压力测试记录模板用于记录 CPU、内存、线程峰值、微脉冲速率、延迟和错误数的脱敏 CSV 模板。
虚幻镜分类器评估模板用于记录 TP、FN、FP、TN、accuracy、precision、recall、F1、ROC-AUC、熵和 JS 散度的 CSV 模板。
虚幻镜资源说明说明公开资源为何只提供脱敏代码、测试模板和架构笔记。
AI Security Lab 说明说明 AI 安全攻防系列的安全边界、安装命令和 quick-run 实验。
AI Security Lab 完整实验包包含安全 toy scripts、结果 CSV、风险登记表、攻防矩阵和架构图。
AI 安全风险登记表面向 AI 威胁建模和上线评审的 CSV 风险登记模板。
AI 攻防矩阵把攻击面、toy demo、指标和防护控制映射到一张 CSV 表。
AI Security Lab 架构图展示威胁建模、鲁棒评估、数据完整性、模型隐私和 RAG 防护之间的关系。
FGSM digits 鲁棒评估脚本本地 digits 分类器的 FGSM-style 扰动和准确率下降实验。
数据投毒与后门 toy 脚本用 digits 数据演示污染率、触发器和 attack success rate。
模型隐私与抽取 toy 脚本输出 membership AUC、target accuracy、surrogate fidelity 和 surrogate accuracy。
RAG prompt injection guard toy 脚本用确定性 toy agent 演示外部数据降权和工具权限阻断。
Deep Learning Math Lab 说明包含安装命令、脚本入口、输出结果和文章图示生成说明。
深度学习数学完整实验包打包 NumPy 脚本、CSV 结果、公式图、loss contour、卷积图和 attention 热图。
梯度检查结果 CSV 保存 MSE 梯度解析值、数值差分值和误差范数。
优化器轨迹 CSV 记录梯度下降、Momentum 和 Adam 在二维二次函数上的逐步坐标与 loss。
Attention 权重 CSV 三 token scaled dot-product attention 的 scores、softmax weights 和 context 输出。
深度学习数学图示目录包含矩阵形状、计算图、loss contour、卷积扫描和 attention heatmap。
深度学习数学交互演示在浏览器里调梯度检查、优化轨迹、卷积输出尺寸和 attention 权重热图。
深度学习专题分享图用于分享深度学习 / CNN 专题页的 1200x630 SVG 图。
从零实现机器学习分享图用于分享 K-means、Iris 和机器学习流程专题页的 1200x630 SVG 图。
学生 AI 项目分享图用于分享手写数字、C 分类器和浏览器实验台专题页的 1200x630 SVG 图。
CNN 卷积扫描动画 Remotion 生成的 8 秒短动画，展示 3x3 卷积核如何扫描输入并形成特征图。

当前学习路线

人工智能基础学习路线学习路线节点
机器学习完整流程学习路线节点
机器学习算法怎么选学习路线节点
特征工程入门实战学习路线节点
模型训练与评估入门学习路线节点
过拟合和欠拟合怎么解决学习路线节点
神经网络基础学习路线节点
神经网络矩阵微积分学习路线节点
反向传播计算图学习路线节点
梯度下降与优化器几何学习路线节点
卷积与感受野数学学习路线节点
Transformer Attention 数学学习路线节点
LLM 可视化教学台学习路线节点
Python 人工智能小实战学习路线节点
手写数字数据结构入门学习路线节点
用 C 实现手写数字 Softmax 分类器学习路线节点
手写数字实验台说明学习路线节点
CIFAR-10 Tiny CNN 教程学习路线节点
高熵流量防御实验学习路线节点
AI 安全威胁建模学习路线节点
对抗样本与鲁棒评估学习路线节点
数据投毒与后门防御学习路线节点
模型隐私与模型抽取防护学习路线节点
LLM/RAG/Agent 安全学习路线节点

下一步计划

补充更多图像分类和误差分析案例
把常见指标整理成速查表
继续补充 AI 安全防御实验记录

一、这个项目里有哪些文件

二、train.csv 的每一行到底是什么

三、test.csv 和训练集的区别

四、C 程序是怎么把这些数据读进来的

五、为什么这种“表格图像”特别适合入门

六、开始训练前最值得先检查什么

七、用几行统计先确认数据没有读歪

八、如何把一行数据还原成 28 x 28

九、接下来该读哪篇

1. What files are in the project

2. What one row in train.csv means

3. How test.csv differs from the training set

4. How the C program loads the data

5. Why this format is good for learning

6. What to validate before training

7. Dataset Audit Table

8. What to read next

一、这个项目里有哪些文件

二、train.csv 的每一行到底是什么

三、test.csv 和训练集的区别

四、C 程序是怎么把这些数据读进来的

五、为什么这种“表格图像”特别适合入门

六、开始训练前最值得先检查什么

七、用几行统计先确认数据没有读歪

八、如何把一行数据还原成 28 x 28

九、接下来该读哪篇

这篇文章适合谁读？

读完后下一步应该看什么？

这篇文章有没有可运行代码或配套资源？

这篇文章和整个网站的学习路线有什么关系？

配套资源

train.csv.zip

test.csv.zip

sample_submission.csv

发表回复 取消回复

项目时间线

2. What one row in `train.csv` means

3. How `test.csv` differs from the training set

发表回复取消回复