机器学习完整流程教程：数据、特征、训练、预测和评估

Q: 这篇文章适合谁读？

这篇文章适合想用 入门 难度理解“机器学习完整流程：从数据、特征到模型预测”的读者，预计阅读时间约 9 分钟，重点覆盖 Machine Learning, Features, scikit-learn。

阅读信息

难度: 入门阅读时间: 9 分钟

Machine Learning
Features
scikit-learn

打开知识图谱

中文

机器学习完整流程：从数据、特征到模型预测

机器学习不是把数据丢给一个算法就结束。一个可复查的机器学习项目，通常有一条比较稳定的流程：定义问题、整理数据、构造特征、训练模型、评估结果，最后再把模型用于预测。

这篇文章不追求覆盖所有算法，而是用工程视角把机器学习的完整流程拆开。理解这条流程后，再学习线性回归、逻辑回归、决策树或神经网络时，会更容易知道每一步在做什么。

读这篇时建议把重点放在“输入、处理、输出”三件事上：输入是什么数据，中间做了哪些变换，最后用什么指标判断输出是否可靠。

一、第一步：把问题定义清楚

机器学习项目开始前，先要回答一个问题：

我们希望模型根据什么输入，预测什么输出？

常见问题类型包括：

分类：预测类别，例如邮件是否为垃圾邮件
回归：预测连续数值，例如房价、销量或温度
聚类：没有标签时自动分组，例如把用户分成几类
排序：对候选结果排序，例如搜索结果推荐

如果问题没有定义清楚，后面很容易出现“模型训练出来了，但不知道怎么判断是否有用”的情况。

二、第二步：理解数据表里的每一列

对初学者来说，最常见的数据形态是一张表：

样本  特征1  特征2  特征3  标签
1     ...   ...   ...   A
2     ...   ...   ...   B
3     ...   ...   ...   A

这里有两个核心概念：

样本：每一行通常是一条样本
特征：用于预测的输入字段
标签：监督学习中已知的正确答案

写代码前，应该先知道每一列的含义、单位、取值范围，以及有没有明显错误值。很多机器学习问题，失败原因不是算法太弱，而是数据字段理解错了。

三、第三步：划分训练集和测试集

模型不能只在训练数据上表现好。为了检查它有没有真正学到规律，我们会把数据拆成两部分：

训练集：用于让模型学习参数
测试集：用于模拟模型面对新数据时的表现

常见写法是：

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.2,
    random_state=42
)

random_state 的作用是固定随机划分结果，方便你以后复现实验。

四、第四步：特征处理

模型通常只能处理数字，所以原始数据经常需要转换。常见特征处理包括：

把文本类别转成数字编码
处理缺失值
对数值特征做标准化
删除明显无意义或泄漏答案的字段

标准化是很常见的一步，尤其是逻辑回归、K-means、神经网络这类对数值尺度敏感的方法：

x_scaled = (x - mean) / std

它不会改变样本之间的相对关系，但会让不同特征处在更接近的尺度上。

五、第五步：选择一个基线模型

入门阶段不要一开始就追复杂模型。更好的做法是先建立一个基线：

分类问题可以先试逻辑回归或决策树
回归问题可以先试线性回归
聚类问题可以先试 K-means

基线模型的意义不是一定要达到最好效果，而是给你一个可比较的起点。后续更换模型、调整特征或改参数，都要和这个起点比较。

六、第六步：训练模型

在 scikit-learn 里，训练过程通常很统一：

model.fit(X_train, y_train)

这行代码背后发生的是：模型根据训练数据不断调整内部参数，让预测结果尽量接近标签。

不同算法的参数含义不同，但从使用者视角看，核心目标都是一样的：找到一组参数，让模型在训练数据上犯的错误更少，同时不要只记住训练数据。

七、第七步：预测和评估

训练完成后，可以对测试集预测：

y_pred = model.predict(X_test)

然后用指标评估结果。分类任务常见指标有：

Accuracy：整体预测正确比例
Precision：预测为正类的样本里，有多少真的为正
Recall：真实正类里，有多少被找出来
F1-score：precision 和 recall 的折中

不要只看一个数字。尤其是类别不平衡时，准确率可能会误导你。

八、完整流程长什么样

把上面的步骤连起来，一个最小流程可以写成：

# 1. 准备 X 和 y
# 2. 拆分训练集和测试集
# 3. 处理特征
# 4. 训练模型
# 5. 预测测试集
# 6. 计算评估指标

真正的项目可能还会加入日志、交叉验证、模型保存、线上监控等环节。但无论复杂度多高，核心流程都离不开这几步。

九、学习时最应该养成的习惯

建议每次练习机器学习项目时，都记录下面几个问题：

输入特征是什么，标签是什么
训练集和测试集怎么划分
做了哪些特征处理
使用了什么基线模型
评估指标是什么，为什么选它
模型犯错的样本有什么特点

如果你能把这些问题说清楚，就已经不是只会复制代码，而是在按机器学习的方式分析问题了。

十、常见错误

初学者写第一个机器学习项目时，最容易踩下面几个坑：

先处理完整数据，再拆分训练集和测试集，导致测试集信息泄漏
没有建立基线模型，直接堆复杂算法，最后不知道提升是否真实
只打印 accuracy，不看类别分布和错误样本
把字段名当成理所当然，没有确认每一列的业务含义

如果你能主动避免这些问题，一个小项目的可信度会明显提高。

十一、把流程写成可复现脚本

一个机器学习项目如果只能在 Notebook 里手动点几格，很难长期维护。更好的做法是把关键步骤整理成脚本或固定函数，让别人可以从原始数据重新跑到评估结果。

data/raw.csv
scripts/01_profile_data.py
scripts/02_train_baseline.py
scripts/03_evaluate.py
reports/metrics.json
reports/confusion_matrix.csv

这个结构不复杂，但能把数据体检、训练和评估分开。后续你换模型时，只要比较 metrics.json 和混淆矩阵，就能知道变化是否真实，而不是只凭一次控制台输出判断。

十二、流程审计表

流程节点	最低要求	常见失败信号
问题定义	说明输入、输出和成功指标	训练完成后无法判断是否有用
数据理解	记录字段含义、缺失值和类别分布	模型学到字段偏差或泄漏信息
特征处理	只在训练集上拟合 scaler/encoder	测试集信息提前进入预处理
模型评估	和基线比较，并查看错误样本	只报告一个 accuracy
结果记录	保存参数、随机种子和指标文件	隔天无法复现实验

这张表可以作为每个小项目的提交检查。哪怕只是课程练习，只要流程可复查，后续阅读神经网络、特征工程或模型部署时都会更稳。

十三、下一步读什么

上一篇是人工智能基础学习路线。理解完整流程后，建议继续读模型训练与评估入门，把损失函数、过拟合和评估指标补上。

英文

Machine Learning Workflow: From Data and Features to Predictions

在独立页面打开

Machine learning is not just sending data into an algorithm. A reproducible machine learning project usually follows a stable workflow: define the problem, inspect the data, build features, train a model, evaluate the result, and then use the model for prediction.

This article does not try to cover every algorithm. Instead, it explains the workflow from an engineering perspective. Once this structure is clear, linear regression, logistic regression, decision trees, and neural networks become much easier to place.

While reading, focus on three questions: what data enters the system, what transformations happen in the middle, and which metrics tell you whether the output is reliable.

1. Define the Problem

Before writing model code, answer this question:

Given which inputs, what output should the model predict?

Common problem types include:

Classification: predict a category, such as spam or not spam
Regression: predict a continuous value, such as price, demand, or temperature
Clustering: group data without labels, such as user segmentation
Ranking: order candidate results, such as search or recommendation output

If the problem is vague, you may train a model but still have no reliable way to judge whether it is useful.

2. Understand Each Column

For beginners, the most common data shape is a table:

sample  feature1  feature2  feature3  label
1       ...       ...       ...       A
2       ...       ...       ...       B
3       ...       ...       ...       A

The key concepts are:

Sample: usually one row of data
Feature: an input field used for prediction
Label: the known answer in supervised learning

Before writing code, understand what each column means, what unit it uses, what range it should have, and whether obvious bad values exist. Many machine learning failures come from misunderstood data rather than weak algorithms.

3. Split Training and Test Data

A model should not be judged only on data it used for training. To check whether it learned a general pattern, split the data:

Training set: used to fit model parameters
Test set: used to estimate behavior on new data

A common scikit-learn pattern is:

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.2,
    random_state=42
)

random_state fixes the split, which makes experiments easier to reproduce.

4. Process Features

Models usually work with numbers, so raw data often needs conversion. Common feature processing steps include:

Encoding text categories as numbers
Handling missing values
Standardizing numeric features
Removing fields that are meaningless or leak the answer

Standardization is common for methods that are sensitive to numeric scale, such as logistic regression, K-means, and neural networks:

x_scaled = (x - mean) / std

It does not change the basic relationship between samples, but it puts different numeric features on more comparable scales.

5. Choose a Baseline Model

Do not start with the most complex model. First build a baseline:

For classification, try logistic regression or a decision tree
For regression, try linear regression
For clustering, try K-means

The baseline does not have to be the best model. It gives you a reference point. Later model changes, feature changes, and parameter changes should be compared against it.

6. Train the Model

In scikit-learn, training is usually expressed with a consistent method call:

model.fit(X_train, y_train)

Behind this call, the model adjusts internal parameters so predictions become closer to labels in the training data.

Different algorithms have different parameter meanings, but the goal is the same: find parameters that reduce mistakes on training data without merely memorizing it.

7. Predict and Evaluate

After training, predict on the test set:

y_pred = model.predict(X_test)

Then measure performance. Common classification metrics include:

Accuracy: the overall proportion of correct predictions
Precision: among predicted positives, how many are truly positive
Recall: among true positives, how many the model found
F1-score: a combined measure of precision and recall

Do not rely on one number. Accuracy can be misleading when classes are imbalanced.

8. The Whole Workflow

Combined, a minimal workflow looks like this:

# 1. Prepare X and y
# 2. Split training and test data
# 3. Process features
# 4. Train a model
# 5. Predict on the test set
# 6. Compute evaluation metrics

Real projects may add logging, cross-validation, model persistence, deployment, and monitoring. But even complex systems still depend on this core sequence.

9. A Good Practice Checklist

When practicing machine learning, write down answers to these questions:

What are the input features and target label?
How were training and test data split?
Which feature processing steps were used?
What baseline model was chosen?
Which metric was used, and why?
What do the model's mistakes have in common?

If you can answer these questions, you are no longer just copying code. You are starting to analyze problems in the machine learning workflow.

10. Workflow Evidence Table

A workflow becomes trustworthy when each step produces evidence that can be inspected later. The table below turns the abstract workflow into a review checklist for small projects.

Workflow step	Evidence to keep	Why it matters	Common failure
Problem definition	Input fields, target label, task type, and business metric	Prevents training a model for an undefined success condition	The model has a score, but nobody can explain what decision it supports
Data inspection	Missing values, class balance, units, duplicates, and suspicious ranges	Most model failures begin as data interpretation failures	Columns are trusted by name without validating their meaning
Split and features	Train/test split rule, preprocessing pipeline, and leakage checks	Separates real generalization from accidental access to test information	Scaling, imputation, or feature selection is fitted on the full dataset
Evaluation	Baseline score, final score, confusion matrix, and error examples	Shows whether the model improved for the right reasons	Only a single accuracy value is saved

11. Common Mistakes

When building a first machine learning project, beginners often run into these problems:

Processing the full dataset before splitting train and test data, which leaks test information into training
Skipping a baseline model and jumping directly to complex algorithms
Printing only accuracy without checking class balance or wrong predictions
Trusting column names without confirming what each field actually means

If you actively avoid these issues, even a small project becomes much easier to trust.

12. What to Read Next

The previous article is the AI Basics Learning Roadmap. After the full workflow is clear, continue with Model Training and Evaluation to understand loss functions, overfitting, and metrics.

读这篇时建议把重点放在“输入、处理、输出”三件事上：输入是什么数据，中间做了哪些变换，最后用什么指标判断输出是否可靠。

一、第一步：把问题定义清楚

机器学习项目开始前，先要回答一个问题：

我们希望模型根据什么输入，预测什么输出？

常见问题类型包括：

分类：预测类别，例如邮件是否为垃圾邮件
回归：预测连续数值，例如房价、销量或温度
聚类：没有标签时自动分组，例如把用户分成几类
排序：对候选结果排序，例如搜索结果推荐

如果问题没有定义清楚，后面很容易出现“模型训练出来了，但不知道怎么判断是否有用”的情况。

二、第二步：理解数据表里的每一列

对初学者来说，最常见的数据形态是一张表：

样本  特征1  特征2  特征3  标签
1     ...   ...   ...   A
2     ...   ...   ...   B
3     ...   ...   ...   A

这里有两个核心概念：

样本：每一行通常是一条样本
特征：用于预测的输入字段
标签：监督学习中已知的正确答案

三、第三步：划分训练集和测试集

模型不能只在训练数据上表现好。为了检查它有没有真正学到规律，我们会把数据拆成两部分：

训练集：用于让模型学习参数
测试集：用于模拟模型面对新数据时的表现

常见写法是：

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.2,
    random_state=42
)

random_state 的作用是固定随机划分结果，方便你以后复现实验。

四、第四步：特征处理

模型通常只能处理数字，所以原始数据经常需要转换。常见特征处理包括：

把文本类别转成数字编码
处理缺失值
对数值特征做标准化
删除明显无意义或泄漏答案的字段

标准化是很常见的一步，尤其是逻辑回归、K-means、神经网络这类对数值尺度敏感的方法：

x_scaled = (x - mean) / std

它不会改变样本之间的相对关系，但会让不同特征处在更接近的尺度上。

五、第五步：选择一个基线模型

入门阶段不要一开始就追复杂模型。更好的做法是先建立一个基线：

分类问题可以先试逻辑回归或决策树
回归问题可以先试线性回归
聚类问题可以先试 K-means

基线模型的意义不是一定要达到最好效果，而是给你一个可比较的起点。后续更换模型、调整特征或改参数，都要和这个起点比较。

六、第六步：训练模型

在 scikit-learn 里，训练过程通常很统一：

model.fit(X_train, y_train)

这行代码背后发生的是：模型根据训练数据不断调整内部参数，让预测结果尽量接近标签。

不同算法的参数含义不同，但从使用者视角看，核心目标都是一样的：找到一组参数，让模型在训练数据上犯的错误更少，同时不要只记住训练数据。

七、第七步：预测和评估

训练完成后，可以对测试集预测：

y_pred = model.predict(X_test)

然后用指标评估结果。分类任务常见指标有：

Accuracy：整体预测正确比例
Precision：预测为正类的样本里，有多少真的为正
Recall：真实正类里，有多少被找出来
F1-score：precision 和 recall 的折中

不要只看一个数字。尤其是类别不平衡时，准确率可能会误导你。

八、完整流程长什么样

把上面的步骤连起来，一个最小流程可以写成：

# 1. 准备 X 和 y
# 2. 拆分训练集和测试集
# 3. 处理特征
# 4. 训练模型
# 5. 预测测试集
# 6. 计算评估指标

真正的项目可能还会加入日志、交叉验证、模型保存、线上监控等环节。但无论复杂度多高，核心流程都离不开这几步。

九、学习时最应该养成的习惯

建议每次练习机器学习项目时，都记录下面几个问题：

输入特征是什么，标签是什么
训练集和测试集怎么划分
做了哪些特征处理
使用了什么基线模型
评估指标是什么，为什么选它
模型犯错的样本有什么特点

如果你能把这些问题说清楚，就已经不是只会复制代码，而是在按机器学习的方式分析问题了。

十、常见错误

初学者写第一个机器学习项目时，最容易踩下面几个坑：

先处理完整数据，再拆分训练集和测试集，导致测试集信息泄漏
没有建立基线模型，直接堆复杂算法，最后不知道提升是否真实
只打印 accuracy，不看类别分布和错误样本
把字段名当成理所当然，没有确认每一列的业务含义

如果你能主动避免这些问题，一个小项目的可信度会明显提高。

十一、把流程写成可复现脚本

data/raw.csv
scripts/01_profile_data.py
scripts/02_train_baseline.py
scripts/03_evaluate.py
reports/metrics.json
reports/confusion_matrix.csv

十二、流程审计表

流程节点	最低要求	常见失败信号
问题定义	说明输入、输出和成功指标	训练完成后无法判断是否有用
数据理解	记录字段含义、缺失值和类别分布	模型学到字段偏差或泄漏信息
特征处理	只在训练集上拟合 scaler/encoder	测试集信息提前进入预处理
模型评估	和基线比较，并查看错误样本	只报告一个 accuracy
结果记录	保存参数、随机种子和指标文件	隔天无法复现实验

这张表可以作为每个小项目的提交检查。哪怕只是课程练习，只要流程可复查，后续阅读神经网络、特征工程或模型部署时都会更稳。

十三、下一步读什么

上一篇是人工智能基础学习路线。理解完整流程后，建议继续读模型训练与评估入门，把损失函数、过拟合和评估指标补上。

搜索问题

常见问题

这篇文章适合谁读？

这篇文章适合想用入门难度理解“机器学习完整流程：从数据、特征到模型预测”的读者，预计阅读时间约 9 分钟，重点覆盖 Machine Learning, Features, scikit-learn。

读完后下一步应该看什么？

推荐下一步阅读“机器学习算法怎么选：分类、回归、聚类和推荐场景对照表”，这样可以把当前知识点接到更完整的学习路线里。

这篇文章有没有可运行代码或配套资源？

这篇文章以解释为主，文末相关阅读会继续指向更接近实战的代码和资源页面。

这篇文章和整个网站的学习路线有什么关系？

它会通过文章上下文、学习路线、资源库和项目时间线连接到同一主题下的其他内容。

文章上下文

人工智能项目

从 AI、机器学习、训练评估、神经网络到 Python 小实战、手写数字识别、CIFAR-10 CNN、对抗性流量防御和 AI 安全攻防，按顺序建立基础。

难度: 入门阅读时间: 9 分钟

Machine Learning
Features
scikit-learn

继续下一步

继续：机器学习算法怎么选

查看项目

对应语言版本 Machine Learning Workflow: From Data and Features to Predictions

可分享摘要 机器学习完整流程：从数据、特征到模型预测

从工程视角拆解机器学习完整流程：定义问题、理解数据、处理特征、训练模型、预测和评估。

下载分享图打开分享中心

发表回复取消回复

要发表评论，您必须先登录。

项目时间线

已发布文章

人工智能基础学习路线：先理解什么是 AI、机器学习和深度学习面向有编程基础的读者，梳理 AI、机器学习、深度学习的关系，并给出可执行的人工智能基础学习路线。
机器学习完整流程：从数据、特征到模型预测从工程视角拆解机器学习完整流程：定义问题、理解数据、处理特征、训练模型、预测和评估。
机器学习算法怎么选：分类、回归、聚类和推荐场景对照表用任务类型、数据规模、解释性和部署成本选择机器学习算法，覆盖逻辑回归、决策树、随机森林、K-means 和表格数据基线模型。
特征工程入门实战：用 scikit-learn 处理缺失值、类别变量和数值标准化用 scikit-learn Pipeline 和 ColumnTransformer 完成特征工程，处理缺失值、类别变量、数值标准化，并避免数据泄漏。
模型训练与评估入门：损失函数、过拟合和准确率怎么理解讲清楚模型训练中的参数、损失函数、梯度下降、过拟合，以及准确率、召回率、F1 等分类评估指标。
过拟合和欠拟合怎么解决：机器学习模型调优实战指南用训练分数和验证分数判断过拟合与欠拟合，并通过模型复杂度、正则化、交叉验证和特征工程调整机器学习模型。
神经网络基础：从感知机到多层网络从一个神经元讲起，解释权重、偏置、激活函数、前向传播、反向传播和典型神经网络训练循环。
神经网络矩阵微积分：从 y = Wx + b 推导 MSE 梯度用手算、矩阵形状图、NumPy 代码和梯度检查解释 y = Wx + b 下 dL/dW = (ŷ - y)x^T 的来源。
反向传播计算图：两层 MLP 的前向、局部梯度和反向传播把两层 MLP 拆成计算图，手算 ReLU、softmax cross-entropy、dW2、dW1，并用 NumPy 复现实验结果。
梯度下降与优化器几何：Momentum、Adam 和 loss surface 轨迹在二维二次函数上手算梯度下降前几步，比较 Momentum 和 Adam 的轨迹，并用代码生成 loss contour。
卷积与感受野数学：5×5 输入、3×3 kernel、padding 和 im2col 手算一次 5x5 输入与 3x3 kernel 的离散卷积，解释输出尺寸、padding、stride、感受野和 im2col。
Transformer Attention 数学：Q/K/V、Softmax 权重、Mask 与 KV Cache 用 3 个 token 手算 scaled dot-product attention，解释 Q/K/V、softmax、mask、多头注意力和 KV cache。
Python 人工智能小实战：用 scikit-learn 完成一个分类任务使用 scikit-learn 内置教学数据集跑通一个分类任务，覆盖数据加载、拆分、标准化、训练、预测、评估和实验记录。
手写数字识别项目入门：先读懂 train.csv、test.csv 和标签结构从项目文件结构入手，读懂手写数字训练集、测试集、标签列和 784 维像素输入，为后续 C 分类器和实验台打基础。
用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv 结合当前项目源码，讲清楚 softmax 多分类、损失函数、梯度更新、混淆矩阵输出，以及 submission.csv 的生成过程。
手写数字实验记录：怎么把离线分类项目接进浏览器实验台解释浏览器实验台为什么采用轻量预训练模型、它和离线 C 项目的关系，以及如何用样本浏览和手绘输入理解预测结果。
CIFAR-10 Tiny CNN 教程：用 C 语言实现小型卷积神经网络图像分类用单文件 C 程序完成 CIFAR-10 小型 CNN 图像分类，讲解数据格式、网络结构、训练命令、loss、accuracy、常见错误和改进方向。
构建高熵流量防御：基于 Python 的连接层白噪声混淆与对抗性机器学习实践以 mld_chaffing_v2.py 虚幻镜项目为例，讲解加密元数据泄漏、信息熵、分布距离、混淆矩阵、空闲窗口微脉冲和性能测试取舍。
AI 安全威胁建模：用 NIST AML、MITRE ATLAS 和 OWASP 建立攻防地图用 NIST Adversarial ML、MITRE ATLAS 和 OWASP LLM Top 10 建立 AI 安全威胁模型，覆盖资产、攻击面、证据和剩余风险。
对抗样本与鲁棒评估：从 FGSM 公式到 scikit-learn 数字分类实验从 FGSM 公式解释对抗样本，用 scikit-learn digits toy 实验评估 clean accuracy、perturbed accuracy 和扰动预算。
数据投毒与后门攻击防御：污染率、触发器和训练管线隔离用 toy digits 实验解释数据投毒、后门触发器、attack success rate、数据来源审计和训练管线隔离。
模型隐私与模型窃取风险：成员推断、模型抽取和输出接口防护用本地 toy 实验解释成员推断、模型抽取、membership AUC、surrogate fidelity、输出最小化和查询治理。
LLM/RAG/Agent 安全：Prompt Injection、工具权限和边界感知防护从 RAG 和 Agent 架构解释 prompt injection、外部数据降权、工具 allowlist、人工审批和边界感知防护。

已公开资源

Python AI 小实战代码说明文章内包含可直接复制运行的 scikit-learn 分类脚本。
digit_softmax_classifier.c 手写数字 softmax 分类器的 C 语言源码。
train.csv.zip 手写数字训练集压缩包，包含 42000 条带标签样本。
test.csv.zip 手写数字测试集压缩包，包含 28000 条待预测样本。
sample_submission.csv 官方提交格式示例，可直接对照最终输出字段。
submission.csv 当前 C 项目跑出的预测结果文件。
digit-playground-model.json 浏览器实验台使用的轻量 softmax 演示模型与样本。
digit-sample-grid.svg 从训练集中抽取的小型手写数字预览网格。
手写数字项目打包下载包含源码、压缩数据、提交文件、浏览器模型和样本预览图。
cifar10_tiny_cnn.c 源码单文件 C 语言 tiny CNN，包含 CIFAR-10 读取、卷积、池化、softmax 和反向传播。
model_weights.bin 样例权重一次本地小样本运行生成的模型权重文件。
test_predictions.csv 预测样例 CIFAR-10 tiny CNN 输出的测试预测样例。
CNN 项目说明 PDF 配套 CNN 项目说明材料。
虚幻镜脱敏代码骨架去除控制口令、真实节点和目标列表后的 mld_chaffing_v2.py 控制流程说明。
虚幻镜压力测试记录模板用于记录 CPU、内存、线程峰值、微脉冲速率、延迟和错误数的脱敏 CSV 模板。
虚幻镜分类器评估模板用于记录 TP、FN、FP、TN、accuracy、precision、recall、F1、ROC-AUC、熵和 JS 散度的 CSV 模板。
虚幻镜资源说明说明公开资源为何只提供脱敏代码、测试模板和架构笔记。
AI Security Lab 说明说明 AI 安全攻防系列的安全边界、安装命令和 quick-run 实验。
AI Security Lab 完整实验包包含安全 toy scripts、结果 CSV、风险登记表、攻防矩阵和架构图。
AI 安全风险登记表面向 AI 威胁建模和上线评审的 CSV 风险登记模板。
AI 攻防矩阵把攻击面、toy demo、指标和防护控制映射到一张 CSV 表。
AI Security Lab 架构图展示威胁建模、鲁棒评估、数据完整性、模型隐私和 RAG 防护之间的关系。
FGSM digits 鲁棒评估脚本本地 digits 分类器的 FGSM-style 扰动和准确率下降实验。
数据投毒与后门 toy 脚本用 digits 数据演示污染率、触发器和 attack success rate。
模型隐私与抽取 toy 脚本输出 membership AUC、target accuracy、surrogate fidelity 和 surrogate accuracy。
RAG prompt injection guard toy 脚本用确定性 toy agent 演示外部数据降权和工具权限阻断。
Deep Learning Math Lab 说明包含安装命令、脚本入口、输出结果和文章图示生成说明。
深度学习数学完整实验包打包 NumPy 脚本、CSV 结果、公式图、loss contour、卷积图和 attention 热图。
梯度检查结果 CSV 保存 MSE 梯度解析值、数值差分值和误差范数。
优化器轨迹 CSV 记录梯度下降、Momentum 和 Adam 在二维二次函数上的逐步坐标与 loss。
Attention 权重 CSV 三 token scaled dot-product attention 的 scores、softmax weights 和 context 输出。
深度学习数学图示目录包含矩阵形状、计算图、loss contour、卷积扫描和 attention heatmap。
深度学习数学交互演示在浏览器里调梯度检查、优化轨迹、卷积输出尺寸和 attention 权重热图。
深度学习专题分享图用于分享深度学习 / CNN 专题页的 1200x630 SVG 图。
从零实现机器学习分享图用于分享 K-means、Iris 和机器学习流程专题页的 1200x630 SVG 图。
学生 AI 项目分享图用于分享手写数字、C 分类器和浏览器实验台专题页的 1200x630 SVG 图。
CNN 卷积扫描动画 Remotion 生成的 8 秒短动画，展示 3x3 卷积核如何扫描输入并形成特征图。

当前学习路线

人工智能基础学习路线学习路线节点
机器学习完整流程学习路线节点
机器学习算法怎么选学习路线节点
特征工程入门实战学习路线节点
模型训练与评估入门学习路线节点
过拟合和欠拟合怎么解决学习路线节点
神经网络基础学习路线节点
神经网络矩阵微积分学习路线节点
反向传播计算图学习路线节点
梯度下降与优化器几何学习路线节点
卷积与感受野数学学习路线节点
Transformer Attention 数学学习路线节点
LLM 可视化教学台学习路线节点
Python 人工智能小实战学习路线节点
手写数字数据结构入门学习路线节点
用 C 实现手写数字 Softmax 分类器学习路线节点
手写数字实验台说明学习路线节点
CIFAR-10 Tiny CNN 教程学习路线节点
高熵流量防御实验学习路线节点
AI 安全威胁建模学习路线节点
对抗样本与鲁棒评估学习路线节点
数据投毒与后门防御学习路线节点
模型隐私与模型抽取防护学习路线节点
LLM/RAG/Agent 安全学习路线节点

下一步计划

补充更多图像分类和误差分析案例
把常见指标整理成速查表
继续补充 AI 安全防御实验记录

一、第一步：把问题定义清楚

二、第二步：理解数据表里的每一列

三、第三步：划分训练集和测试集

四、第四步：特征处理

五、第五步：选择一个基线模型

六、第六步：训练模型

七、第七步：预测和评估

八、完整流程长什么样

九、学习时最应该养成的习惯

十、常见错误

十一、把流程写成可复现脚本

十二、流程审计表

十三、下一步读什么

1. Define the Problem

2. Understand Each Column

3. Split Training and Test Data

4. Process Features

5. Choose a Baseline Model

6. Train the Model

7. Predict and Evaluate

8. The Whole Workflow

9. A Good Practice Checklist

10. Workflow Evidence Table

11. Common Mistakes

12. What to Read Next

一、第一步：把问题定义清楚

二、第二步：理解数据表里的每一列

三、第三步：划分训练集和测试集

四、第四步：特征处理

五、第五步：选择一个基线模型

六、第六步：训练模型

七、第七步：预测和评估

八、完整流程长什么样

九、学习时最应该养成的习惯

十、常见错误

十一、把流程写成可复现脚本

十二、流程审计表

十三、下一步读什么

这篇文章适合谁读？

读完后下一步应该看什么？

这篇文章有没有可运行代码或配套资源？

这篇文章和整个网站的学习路线有什么关系？

发表回复 取消回复

项目时间线

发表回复取消回复