C 语言手写数字 Softmax 分类器教程：完整代码和 submission.csv

Q: 这篇文章适合谁读？

这篇文章适合想用 实战 难度理解“用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv”的读者，预计阅读时间约 11 分钟，重点覆盖 C, Softmax, Classification。

阅读信息

难度: 实战阅读时间: 11 分钟

C
Softmax
Classification

打开知识图谱

中文

用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv

读懂数据之后，这个手写数字项目最值得看的部分就是 C 语言实现本身。它没有依赖深度学习框架，而是用一个非常直接的多分类 softmax 模型，把 784 维输入像素映射到 10 个数字类别上。

这类实现很适合训练“把模型公式翻译成代码”的能力。你会看到：权重矩阵怎么定义、softmax 概率怎么计算、交叉熵损失怎么累计、梯度下降怎么一步步更新参数。

一、模型结构其实很简单

项目里最核心的参数只有两组：

W[10][784]：10 个类别各自对应一组长度为 784 的权重
b[10]：10 个类别的偏置项

对一条输入样本 x 来说，程序先计算每个类别的线性分数：

z[k] = b[k];
for (int j = 0; j < FEATURES; j++) {
    z[k] += W[k][j] * x[j];
}

这一步得到的是 10 个 logits，也就是每个类别当前的原始分数。

二、softmax 把分数变成概率

线性分数本身不方便直接解释成“属于某个数字的概率”，所以程序接着用 softmax 做归一化：

p[i] = exp(z[i] - max_z);
sum += p[i];
...
p[i] /= sum;

这里减去 max_z 是为了数值稳定，避免指数计算时数值太大。softmax 之后，10 个类别的概率会加起来等于 1，程序再选概率最大的类别作为当前预测值。

三、训练循环在做什么

当前项目设置了 20 轮训练，学习率是 0.01。每轮都会遍历训练集中的全部样本：

计算 10 个类别的 logits
做 softmax，得到概率分布
根据真实标签计算误差
用误差更新权重和偏置

更新规则写得很直接：

double error = p[k] - (k == y_train[i] ? 1.0 : 0.0);
for (int j = 0; j < FEATURES; j++) {
    W[k][j] -= LEARNING_RATE * error * X_train[i][j];
}
b[k] -= LEARNING_RATE * error;

如果你学过逻辑回归或多分类线性模型，会发现这套写法本质上就是 softmax 回归的随机梯度下降版本。它不花哨，但很适合练基本功。

四、输出里最该看哪几个指标

这个项目训练时会打印每轮的损失和训练准确率，训练结束后还会输出训练集准确率和混淆矩阵。对初学者来说，这几项最重要：

loss：有没有持续下降
accuracy：分类正确比例有没有逐步提升
混淆矩阵：哪些数字最容易互相混淆

如果某几类长期互相错分，通常说明这几个数字的局部形状更接近，或者当前线性模型的表达能力已经接近上限。

五、它是怎么生成 submission.csv 的

训练结束后，程序会逐条读取 test.csv，对每条样本调用一次 predict_one，再写成：

ImageId,Label
1,7
2,2
3,1
...

这就是最终的 submission.csv。从工程角度看，这一步很关键，因为它把“训练代码”真正变成了一个能处理未知输入并导出结果的完整项目。

六、如何在本地运行

站点下载区已经放好了源码、训练集压缩包和测试集压缩包。当前版本直接在源码所在目录读取 train.csv 和 test.csv：

unzip train.csv.zip
unzip test.csv.zip
gcc digit_softmax_classifier.c -lm -O2 -o digit_classifier
./digit_classifier

正常情况下，程序会依次输出：

训练样本数和测试样本数
每一轮训练的 loss 和 accuracy
训练集准确率与混淆矩阵
生成 submission.csv 的提示

七、这个 C 项目目前的边界在哪里

它已经足够完成一个完整的多分类练习，但也有很清楚的边界：

模型仍然是线性的，没有卷积层或更复杂的表示能力
当前训练集准确率高，并不等于线上泛化一定最好
没有单独划出验证集做调参
没有 mini-batch、正则化或更细的学习率调度

这些都不是缺点，而是后续扩展空间。先把一份能跑通、能解释、能导出结果的基础实现做好，本身就很有价值。

八、下一步怎么继续

如果你想先试交互演示，再回来看源码，可以继续打开实验台里的手写数字标签页。浏览器版不会直接跑完整训练，而是加载一份预训练的轻量 softmax 权重，让你可以手绘数字、看预测概率和样本效果。

源码、压缩数据、样例提交文件和浏览器模型文件都已经放到下载页。如果你还没看前一篇，建议补读手写数字数据结构文章，这样这份 C 代码里的每个数组就更容易对上数据来源。

九、手算一条样本的更新方向

理解这份 C 代码时，最关键的是看懂 p[k] - y[k] 这个误差项。假设真实标签是 7，当前模型却给类别 3 更高概率，那么类别 3 的误差为正，类别 7 的误差为负。梯度下降会压低类别 3 在当前像素上的权重，同时抬高类别 7 对这些像素的响应。

真实标签: 7
当前概率: p[3] = 0.62, p[7] = 0.21
更新方向: 降低类别 3 的相关权重，提高类别 7 的相关权重

这就是 softmax 回归可解释的地方：每次更新都和当前样本的像素分布直接相关。某个数字经常被错分成另一个数字，混淆矩阵会把这种模式暴露出来；回到权重矩阵看对应类别，也能理解模型为什么偏向某些形状。

十、验证改动没有破坏项目

如果你修改了学习率、训练轮次或数据读取逻辑，不要只看程序是否能编译。至少应该做三类验证：

编译验证：使用 gcc -Wall -Wextra 检查明显的类型和数组问题。
训练验证：确认 loss 大体下降，accuracy 不应长期停在随机水平附近。
输出验证：确认 submission.csv 行数、表头和标签范围仍然正确。

对于教学项目来说，这些验证比追求一次最高分更重要。只要你能解释每个指标为什么变化，就已经从“运行别人的代码”前进到了“能维护自己的实验”。

十一、Softmax 训练审计表

这份 C 项目的价值在于可解释和可复现。下面的表格把数据读取、数值稳定、训练指标和输出文件放到同一个审计框架里，方便读者判断一次改动到底提升了模型，还是只让代码“看起来能跑”。

审计项	应该检查什么	常见失败模式	修复方向
CSV 读取	样本数、字段数、标签范围和像素归一化。	表头未跳过、标签列错位或像素未除以 255。	在训练前打印前几行解析结果和特征范围。
Softmax 稳定性	是否先减去 `max_z`，概率和是否接近 1。	`exp()` 溢出导致 `NaN` loss。	保留稳定 softmax，并在异常时打印 logits。
训练趋势	loss 是否下降，accuracy 是否高于随机水平。	长期停在 10% 附近，说明更新或标签可能错了。	降低学习率，检查 `p[k] - y[k]` 更新方向。
提交文件	行数、表头、ImageId 顺序和标签范围。	训练正常但导出格式不符合提交要求。	把输出验证作为独立步骤，不和训练日志混在一起。

英文

Handwritten Digit Softmax Classifier in C: From 784 Pixels to submission.csv

在独立页面打开

Once the dataset layout is clear, the most useful part of this handwritten digit project is the C implementation itself. It does not rely on a deep learning framework. Instead, it uses a direct multi-class softmax model that maps a 784-dimensional input vector to ten digit classes.

This is a good kind of project for learning how model formulas become code. You can inspect the weight matrix, the softmax probability calculation, the cross-entropy loss accumulation, and the gradient-based parameter updates without a large abstraction layer getting in the way.

1. The model structure is deliberately small

The main parameters are only:

W[10][784]: one weight vector of length 784 for each class
b[10]: one bias term for each class

For a single input sample x, the classifier first computes one raw score per class:

z[k] = b[k];
for (int j = 0; j < FEATURES; j++) {
    z[k] += W[k][j] * x[j];
}

Those ten values are the logits for the current sample.

2. Softmax turns raw scores into probabilities

Raw linear scores are not directly interpretable as probabilities, so the implementation normalizes them with softmax:

p[i] = exp(z[i] - max_z);
sum += p[i];
...
p[i] /= sum;

The subtraction by max_z is a stability trick. It keeps the exponentials from blowing up numerically. After softmax, the probabilities over the ten classes add up to one, and the predicted label is just the class with the largest probability.

3. What the training loop is actually doing

The current project runs 20 epochs with a learning rate of 0.01. In each epoch, it loops through every training sample and repeats the same sequence:

Compute ten logits
Apply softmax to get a probability distribution
Compare that distribution to the true label
Update the weights and biases with the resulting error

The update rule is written in a very transparent way:

double error = p[k] - (k == y_train[i] ? 1.0 : 0.0);
for (int j = 0; j < FEATURES; j++) {
    W[k][j] -= LEARNING_RATE * error * X_train[i][j];
}
b[k] -= LEARNING_RATE * error;

If you already know logistic regression or linear multi-class classification, this will look familiar. It is essentially softmax regression trained with stochastic gradient descent.

4. Which metrics are worth checking

During training, the program prints epoch loss and training accuracy. After training, it prints the final training accuracy and a confusion matrix. Those are the most useful outputs to read first:

Loss: whether optimization is moving in the right direction
Accuracy: whether the classification result is improving
Confusion matrix: which digits are most often mixed up

If a few classes remain confused with each other, that is usually a sign that the digit shapes are visually close or that the linear model has reached its representational limit.

5. How `submission.csv` is generated

After training, the program reads test.csv, calls predict_one for each sample, and writes the result back into the required CSV structure:

ImageId,Label
1,7
2,2
3,1
...

That is the final submission.csv. From an engineering perspective, this step matters because it turns the training code into a complete pipeline that can process unseen inputs and export predictions in a reusable format.

6. How to run it locally

The downloads section now includes the source file plus compressed copies of the training and test data. The current implementation expects train.csv and test.csv in the same working directory:

unzip train.csv.zip
unzip test.csv.zip
gcc digit_softmax_classifier.c -lm -O2 -o digit_classifier
./digit_classifier

A normal run should print:

the number of training and test samples
loss and accuracy for each epoch
final training accuracy and the confusion matrix
a message confirming that submission.csv was written

7. What this C version does not try to do

The current implementation is already enough for a complete multi-class practice project, but its boundaries are also clear:

the model is still linear, not convolutional
a strong training accuracy does not automatically mean the best generalization
there is no dedicated validation split for tuning
there is no mini-batch schedule, regularization, or more advanced optimization

Those are not flaws so much as the next layer of work. A clean, understandable, end-to-end baseline is already valuable.

8. Softmax Training Audit Table

The value of this C project is that it can be inspected and reproduced. The table below puts data loading, numerical stability, training signals, and output files into one review framework so a reader can tell whether a change improved the model or merely kept the program running.

Audit item	What to inspect	Common failure mode	Fix direction
CSV loading	Sample count, field count, label range, and pixel normalization.	Header row is not skipped, label column shifts, or pixels are not divided by 255.	Print parsed examples and feature ranges before training begins.
Softmax stability	Whether `max_z` is subtracted and probabilities sum to about 1.	`exp()` overflows and produces `NaN` loss.	Keep the stable softmax and print logits when values become abnormal.
Training trend	Loss decreases and accuracy rises above the random baseline.	Accuracy stays near 10%, suggesting wrong labels or update direction.	Lower the learning rate and inspect the `p[k] - y[k]` update.
Submission file	Row count, header, ImageId order, and predicted label range.	Training succeeds but the exported CSV is not reusable.	Validate output format as a separate step from training logs.

9. Where to go next

If you want an interactive version before reading more source code, open the handwritten digit tab in the playground. The browser version does not retrain on the full dataset. Instead, it loads a compact pre-trained softmax demo so you can draw digits, inspect probability scores, and try labeled samples directly in the page.

The source code, zipped datasets, sample submission file, generated submission, and browser model bundle are all available on the downloads page. If you have not read the previous post yet, start with the dataset structure article so the arrays and loops in this C file are easier to place in context.

代码运行说明

环境: C 编译器（gcc 或 clang）

安装

unzip train.csv.zip
unzip test.csv.zip

运行

gcc digit_softmax_classifier.c -lm -O2 -o digit_classifier
./digit_classifier

输入文件: train.csv 和 test.csv
预期输出: 输出每轮 loss 和 accuracy，最后写出 submission.csv。

安装 unzip train.csv.zip
安装 unzip test.csv.zip
运行 gcc digit_softmax_classifier.c -lm -O2 -o digit_classifier
运行 ./digit_classifier

一、模型结构其实很简单

项目里最核心的参数只有两组：

W[10][784]：10 个类别各自对应一组长度为 784 的权重
b[10]：10 个类别的偏置项

对一条输入样本 x 来说，程序先计算每个类别的线性分数：

z[k] = b[k];
for (int j = 0; j < FEATURES; j++) {
    z[k] += W[k][j] * x[j];
}

这一步得到的是 10 个 logits，也就是每个类别当前的原始分数。

二、softmax 把分数变成概率

线性分数本身不方便直接解释成“属于某个数字的概率”，所以程序接着用 softmax 做归一化：

p[i] = exp(z[i] - max_z);
sum += p[i];
...
p[i] /= sum;

这里减去 max_z 是为了数值稳定，避免指数计算时数值太大。softmax 之后，10 个类别的概率会加起来等于 1，程序再选概率最大的类别作为当前预测值。

三、训练循环在做什么

当前项目设置了 20 轮训练，学习率是 0.01。每轮都会遍历训练集中的全部样本：

计算 10 个类别的 logits
做 softmax，得到概率分布
根据真实标签计算误差
用误差更新权重和偏置

更新规则写得很直接：

double error = p[k] - (k == y_train[i] ? 1.0 : 0.0);
for (int j = 0; j < FEATURES; j++) {
    W[k][j] -= LEARNING_RATE * error * X_train[i][j];
}
b[k] -= LEARNING_RATE * error;

如果你学过逻辑回归或多分类线性模型，会发现这套写法本质上就是 softmax 回归的随机梯度下降版本。它不花哨，但很适合练基本功。

四、输出里最该看哪几个指标

这个项目训练时会打印每轮的损失和训练准确率，训练结束后还会输出训练集准确率和混淆矩阵。对初学者来说，这几项最重要：

loss：有没有持续下降
accuracy：分类正确比例有没有逐步提升
混淆矩阵：哪些数字最容易互相混淆

如果某几类长期互相错分，通常说明这几个数字的局部形状更接近，或者当前线性模型的表达能力已经接近上限。

五、它是怎么生成 submission.csv 的

训练结束后，程序会逐条读取 test.csv，对每条样本调用一次 predict_one，再写成：

ImageId,Label
1,7
2,2
3,1
...

这就是最终的 submission.csv。从工程角度看，这一步很关键，因为它把“训练代码”真正变成了一个能处理未知输入并导出结果的完整项目。

六、如何在本地运行

站点下载区已经放好了源码、训练集压缩包和测试集压缩包。当前版本直接在源码所在目录读取 train.csv 和 test.csv：

unzip train.csv.zip
unzip test.csv.zip
gcc digit_softmax_classifier.c -lm -O2 -o digit_classifier
./digit_classifier

正常情况下，程序会依次输出：

训练样本数和测试样本数
每一轮训练的 loss 和 accuracy
训练集准确率与混淆矩阵
生成 submission.csv 的提示

七、这个 C 项目目前的边界在哪里

它已经足够完成一个完整的多分类练习，但也有很清楚的边界：

模型仍然是线性的，没有卷积层或更复杂的表示能力
当前训练集准确率高，并不等于线上泛化一定最好
没有单独划出验证集做调参
没有 mini-batch、正则化或更细的学习率调度

这些都不是缺点，而是后续扩展空间。先把一份能跑通、能解释、能导出结果的基础实现做好，本身就很有价值。

八、下一步怎么继续

九、手算一条样本的更新方向

真实标签: 7
当前概率: p[3] = 0.62, p[7] = 0.21
更新方向: 降低类别 3 的相关权重，提高类别 7 的相关权重

十、验证改动没有破坏项目

如果你修改了学习率、训练轮次或数据读取逻辑，不要只看程序是否能编译。至少应该做三类验证：

编译验证：使用 gcc -Wall -Wextra 检查明显的类型和数组问题。
训练验证：确认 loss 大体下降，accuracy 不应长期停在随机水平附近。
输出验证：确认 submission.csv 行数、表头和标签范围仍然正确。

十一、Softmax 训练审计表

审计项	应该检查什么	常见失败模式	修复方向
CSV 读取	样本数、字段数、标签范围和像素归一化。	表头未跳过、标签列错位或像素未除以 255。	在训练前打印前几行解析结果和特征范围。
Softmax 稳定性	是否先减去 `max_z`，概率和是否接近 1。	`exp()` 溢出导致 `NaN` loss。	保留稳定 softmax，并在异常时打印 logits。
训练趋势	loss 是否下降，accuracy 是否高于随机水平。	长期停在 10% 附近，说明更新或标签可能错了。	降低学习率，检查 `p[k] - y[k]` 更新方向。
提交文件	行数、表头、ImageId 顺序和标签范围。	训练正常但导出格式不符合提交要求。	把输出验证作为独立步骤，不和训练日志混在一起。

搜索问题

常见问题

这篇文章适合谁读？

这篇文章适合想用实战难度理解“用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv”的读者，预计阅读时间约 11 分钟，重点覆盖 C, Softmax, Classification。

读完后下一步应该看什么？

推荐下一步阅读“手写数字实验记录：怎么把离线分类项目接进浏览器实验台”，这样可以把当前知识点接到更完整的学习路线里。

这篇文章有没有可运行代码或配套资源？

有。页面里的运行说明、资源卡片和下载入口会指向复现实验所需的命令、数据、代码或说明文件。

这篇文章和整个网站的学习路线有什么关系？

它会通过文章上下文、学习路线、资源库和项目时间线连接到同一主题下的其他内容。

文章上下文

人工智能项目

从 AI、机器学习、训练评估、神经网络到 Python 小实战、手写数字识别、CIFAR-10 CNN、对抗性流量防御和 AI 安全攻防，按顺序建立基础。

难度: 实战阅读时间: 11 分钟

C
Softmax
Classification

继续下一步

继续：手写数字实验台说明

先补基础打开资源

对应语言版本 Handwritten Digit Softmax Classifier in C: From 784 Pixels to submission.csv

可分享摘要 用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv

结合当前项目源码，讲清楚 softmax 多分类、损失函数、梯度更新、混淆矩阵输出，以及 submission.csv 的生成过程。

下载分享图打开分享中心

配套资源

手写数字 softmax 分类器的 C 语言源码。

打开资源关联文章

手写数字训练集压缩包，包含 42000 条带标签样本。

打开资源关联文章

手写数字测试集压缩包，包含 28000 条待预测样本。

打开资源关联文章

当前 C 项目跑出的预测结果文件。

打开资源关联文章

包含源码、压缩数据、提交文件、浏览器模型和样本预览图。

打开资源关联文章

发表回复取消回复

要发表评论，您必须先登录。

项目时间线

已发布文章

人工智能基础学习路线：先理解什么是 AI、机器学习和深度学习面向有编程基础的读者，梳理 AI、机器学习、深度学习的关系，并给出可执行的人工智能基础学习路线。
机器学习完整流程：从数据、特征到模型预测从工程视角拆解机器学习完整流程：定义问题、理解数据、处理特征、训练模型、预测和评估。
机器学习算法怎么选：分类、回归、聚类和推荐场景对照表用任务类型、数据规模、解释性和部署成本选择机器学习算法，覆盖逻辑回归、决策树、随机森林、K-means 和表格数据基线模型。
特征工程入门实战：用 scikit-learn 处理缺失值、类别变量和数值标准化用 scikit-learn Pipeline 和 ColumnTransformer 完成特征工程，处理缺失值、类别变量、数值标准化，并避免数据泄漏。
模型训练与评估入门：损失函数、过拟合和准确率怎么理解讲清楚模型训练中的参数、损失函数、梯度下降、过拟合，以及准确率、召回率、F1 等分类评估指标。
过拟合和欠拟合怎么解决：机器学习模型调优实战指南用训练分数和验证分数判断过拟合与欠拟合，并通过模型复杂度、正则化、交叉验证和特征工程调整机器学习模型。
神经网络基础：从感知机到多层网络从一个神经元讲起，解释权重、偏置、激活函数、前向传播、反向传播和典型神经网络训练循环。
神经网络矩阵微积分：从 y = Wx + b 推导 MSE 梯度用手算、矩阵形状图、NumPy 代码和梯度检查解释 y = Wx + b 下 dL/dW = (ŷ - y)x^T 的来源。
反向传播计算图：两层 MLP 的前向、局部梯度和反向传播把两层 MLP 拆成计算图，手算 ReLU、softmax cross-entropy、dW2、dW1，并用 NumPy 复现实验结果。
梯度下降与优化器几何：Momentum、Adam 和 loss surface 轨迹在二维二次函数上手算梯度下降前几步，比较 Momentum 和 Adam 的轨迹，并用代码生成 loss contour。
卷积与感受野数学：5×5 输入、3×3 kernel、padding 和 im2col 手算一次 5x5 输入与 3x3 kernel 的离散卷积，解释输出尺寸、padding、stride、感受野和 im2col。
Transformer Attention 数学：Q/K/V、Softmax 权重、Mask 与 KV Cache 用 3 个 token 手算 scaled dot-product attention，解释 Q/K/V、softmax、mask、多头注意力和 KV cache。
Python 人工智能小实战：用 scikit-learn 完成一个分类任务使用 scikit-learn 内置教学数据集跑通一个分类任务，覆盖数据加载、拆分、标准化、训练、预测、评估和实验记录。
手写数字识别项目入门：先读懂 train.csv、test.csv 和标签结构从项目文件结构入手，读懂手写数字训练集、测试集、标签列和 784 维像素输入，为后续 C 分类器和实验台打基础。
用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv 结合当前项目源码，讲清楚 softmax 多分类、损失函数、梯度更新、混淆矩阵输出，以及 submission.csv 的生成过程。
手写数字实验记录：怎么把离线分类项目接进浏览器实验台解释浏览器实验台为什么采用轻量预训练模型、它和离线 C 项目的关系，以及如何用样本浏览和手绘输入理解预测结果。
CIFAR-10 Tiny CNN 教程：用 C 语言实现小型卷积神经网络图像分类用单文件 C 程序完成 CIFAR-10 小型 CNN 图像分类，讲解数据格式、网络结构、训练命令、loss、accuracy、常见错误和改进方向。
构建高熵流量防御：基于 Python 的连接层白噪声混淆与对抗性机器学习实践以 mld_chaffing_v2.py 虚幻镜项目为例，讲解加密元数据泄漏、信息熵、分布距离、混淆矩阵、空闲窗口微脉冲和性能测试取舍。
AI 安全威胁建模：用 NIST AML、MITRE ATLAS 和 OWASP 建立攻防地图用 NIST Adversarial ML、MITRE ATLAS 和 OWASP LLM Top 10 建立 AI 安全威胁模型，覆盖资产、攻击面、证据和剩余风险。
对抗样本与鲁棒评估：从 FGSM 公式到 scikit-learn 数字分类实验从 FGSM 公式解释对抗样本，用 scikit-learn digits toy 实验评估 clean accuracy、perturbed accuracy 和扰动预算。
数据投毒与后门攻击防御：污染率、触发器和训练管线隔离用 toy digits 实验解释数据投毒、后门触发器、attack success rate、数据来源审计和训练管线隔离。
模型隐私与模型窃取风险：成员推断、模型抽取和输出接口防护用本地 toy 实验解释成员推断、模型抽取、membership AUC、surrogate fidelity、输出最小化和查询治理。
LLM/RAG/Agent 安全：Prompt Injection、工具权限和边界感知防护从 RAG 和 Agent 架构解释 prompt injection、外部数据降权、工具 allowlist、人工审批和边界感知防护。

已公开资源

Python AI 小实战代码说明文章内包含可直接复制运行的 scikit-learn 分类脚本。
digit_softmax_classifier.c 手写数字 softmax 分类器的 C 语言源码。
train.csv.zip 手写数字训练集压缩包，包含 42000 条带标签样本。
test.csv.zip 手写数字测试集压缩包，包含 28000 条待预测样本。
sample_submission.csv 官方提交格式示例，可直接对照最终输出字段。
submission.csv 当前 C 项目跑出的预测结果文件。
digit-playground-model.json 浏览器实验台使用的轻量 softmax 演示模型与样本。
digit-sample-grid.svg 从训练集中抽取的小型手写数字预览网格。
手写数字项目打包下载包含源码、压缩数据、提交文件、浏览器模型和样本预览图。
cifar10_tiny_cnn.c 源码单文件 C 语言 tiny CNN，包含 CIFAR-10 读取、卷积、池化、softmax 和反向传播。
model_weights.bin 样例权重一次本地小样本运行生成的模型权重文件。
test_predictions.csv 预测样例 CIFAR-10 tiny CNN 输出的测试预测样例。
CNN 项目说明 PDF 配套 CNN 项目说明材料。
虚幻镜脱敏代码骨架去除控制口令、真实节点和目标列表后的 mld_chaffing_v2.py 控制流程说明。
虚幻镜压力测试记录模板用于记录 CPU、内存、线程峰值、微脉冲速率、延迟和错误数的脱敏 CSV 模板。
虚幻镜分类器评估模板用于记录 TP、FN、FP、TN、accuracy、precision、recall、F1、ROC-AUC、熵和 JS 散度的 CSV 模板。
虚幻镜资源说明说明公开资源为何只提供脱敏代码、测试模板和架构笔记。
AI Security Lab 说明说明 AI 安全攻防系列的安全边界、安装命令和 quick-run 实验。
AI Security Lab 完整实验包包含安全 toy scripts、结果 CSV、风险登记表、攻防矩阵和架构图。
AI 安全风险登记表面向 AI 威胁建模和上线评审的 CSV 风险登记模板。
AI 攻防矩阵把攻击面、toy demo、指标和防护控制映射到一张 CSV 表。
AI Security Lab 架构图展示威胁建模、鲁棒评估、数据完整性、模型隐私和 RAG 防护之间的关系。
FGSM digits 鲁棒评估脚本本地 digits 分类器的 FGSM-style 扰动和准确率下降实验。
数据投毒与后门 toy 脚本用 digits 数据演示污染率、触发器和 attack success rate。
模型隐私与抽取 toy 脚本输出 membership AUC、target accuracy、surrogate fidelity 和 surrogate accuracy。
RAG prompt injection guard toy 脚本用确定性 toy agent 演示外部数据降权和工具权限阻断。
Deep Learning Math Lab 说明包含安装命令、脚本入口、输出结果和文章图示生成说明。
深度学习数学完整实验包打包 NumPy 脚本、CSV 结果、公式图、loss contour、卷积图和 attention 热图。
梯度检查结果 CSV 保存 MSE 梯度解析值、数值差分值和误差范数。
优化器轨迹 CSV 记录梯度下降、Momentum 和 Adam 在二维二次函数上的逐步坐标与 loss。
Attention 权重 CSV 三 token scaled dot-product attention 的 scores、softmax weights 和 context 输出。
深度学习数学图示目录包含矩阵形状、计算图、loss contour、卷积扫描和 attention heatmap。
深度学习数学交互演示在浏览器里调梯度检查、优化轨迹、卷积输出尺寸和 attention 权重热图。
深度学习专题分享图用于分享深度学习 / CNN 专题页的 1200x630 SVG 图。
从零实现机器学习分享图用于分享 K-means、Iris 和机器学习流程专题页的 1200x630 SVG 图。
学生 AI 项目分享图用于分享手写数字、C 分类器和浏览器实验台专题页的 1200x630 SVG 图。
CNN 卷积扫描动画 Remotion 生成的 8 秒短动画，展示 3x3 卷积核如何扫描输入并形成特征图。

当前学习路线

人工智能基础学习路线学习路线节点
机器学习完整流程学习路线节点
机器学习算法怎么选学习路线节点
特征工程入门实战学习路线节点
模型训练与评估入门学习路线节点
过拟合和欠拟合怎么解决学习路线节点
神经网络基础学习路线节点
神经网络矩阵微积分学习路线节点
反向传播计算图学习路线节点
梯度下降与优化器几何学习路线节点
卷积与感受野数学学习路线节点
Transformer Attention 数学学习路线节点
LLM 可视化教学台学习路线节点
Python 人工智能小实战学习路线节点
手写数字数据结构入门学习路线节点
用 C 实现手写数字 Softmax 分类器学习路线节点
手写数字实验台说明学习路线节点
CIFAR-10 Tiny CNN 教程学习路线节点
高熵流量防御实验学习路线节点
AI 安全威胁建模学习路线节点
对抗样本与鲁棒评估学习路线节点
数据投毒与后门防御学习路线节点
模型隐私与模型抽取防护学习路线节点
LLM/RAG/Agent 安全学习路线节点

下一步计划

补充更多图像分类和误差分析案例
把常见指标整理成速查表
继续补充 AI 安全防御实验记录

一、模型结构其实很简单

二、softmax 把分数变成概率

三、训练循环在做什么

四、输出里最该看哪几个指标

五、它是怎么生成 submission.csv 的

六、如何在本地运行

七、这个 C 项目目前的边界在哪里

八、下一步怎么继续

九、手算一条样本的更新方向

十、验证改动没有破坏项目

十一、Softmax 训练审计表

1. The model structure is deliberately small

2. Softmax turns raw scores into probabilities

3. What the training loop is actually doing

4. Which metrics are worth checking

5. How submission.csv is generated

6. How to run it locally

7. What this C version does not try to do

8. Softmax Training Audit Table

9. Where to go next

一、模型结构其实很简单

二、softmax 把分数变成概率

三、训练循环在做什么

四、输出里最该看哪几个指标

五、它是怎么生成 submission.csv 的

六、如何在本地运行

七、这个 C 项目目前的边界在哪里

八、下一步怎么继续

九、手算一条样本的更新方向

十、验证改动没有破坏项目

十一、Softmax 训练审计表

这篇文章适合谁读？

读完后下一步应该看什么？

这篇文章有没有可运行代码或配套资源？

这篇文章和整个网站的学习路线有什么关系？

配套资源

digit_softmax_classifier.c

train.csv.zip

test.csv.zip

submission.csv

手写数字项目打包下载

发表回复 取消回复

项目时间线

5. How `submission.csv` is generated

发表回复取消回复