项目索引

项目页把站内较完整的实验材料集中起来。每个项目至少应说明目标、数据或输入、实现语言、复核方法和已知边界；还没达到这个标准的内容，不会被包装成“成熟产品”。

项目类型	目前覆盖	可验证材料	边界
算法实现	八皇后、K-means、手写数字 softmax。	C 源码、输入数据、输出结果、复杂度说明。	用于教学和复现实验，不直接承诺生产稳定性。
AI/ML 实验	机器学习工作流、深度学习数学、PyBaMM 电池数据。	参数表、数据生成步骤、评估指标、失败模式。	小样本实验强调解释性，不替代工业级评估。
网络协议实验	DNS、TLS、HTTP/3、代理和缓存。	时间线、状态码、缓存命中、信任边界图。	仅用于学习和排障理解，不鼓励滥用网络测试。
站点工具	ANSI 图片转换器、浏览器实验台、知识图谱。	可交互页面、说明文章、下载材料。	浏览器端工具会明确输入处理和数据边界。

项目专题

按项目组织学习材料

每个项目集中展示目标、推荐路线、时间线、已发布文章、资源和下一步计划。

网络基础原理

把协议标准中的概念转化为能够手算、运行、观测和审计的工程实验。

从 DNS、TCP、TLS 与 HTTP/3 到代理隧道、负载均衡和共享缓存，以可重现的代码和图分析网页请求路径。

打开推荐路线打开知识图谱运行网络演示

下一步计划

补充 IPv6 与 QUIC 报文观察笔记
继续用真实用户指标复查缓存与协议收益

已发布文章

DNS 解析过程详解：从域名查询到 TTL 缓存的 Python 实验

从 RFC DNS 报文与递归查询出发，用 Python 和 C 实验计算 TTL 缓存命中对解析延迟的影响。

难度: 进阶阅读时间: 12 分钟

DNS
Python
C
RFC 1035

CIDR、子网掩码与最长前缀匹配：用代码算清 IP 路由和 MTU

手算 CIDR 网段、最长前缀匹配与 MTU/MSS 分段，并用 Python/C 输出固定路由结果。

难度: 进阶阅读时间: 12 分钟

IPv4
CIDR
MTU
Python
C

TCP 三次握手、重传与拥塞窗口：可运行的序列号实验

从 TCP sequence/ACK 和慢启动出发，用确定性丢包曲线与 localhost C socket 实验理解可靠传输。

难度: 进阶阅读时间: 13 分钟

TCP
Congestion Control
Python
C sockets

HTTPS 与 TLS 1.3 握手原理：密钥交换、证书和 RTT 实验

解释 TLS 1.3 消息 flight、证书与临时密钥交换，用安全的教学模型计算一次 RTT 握手。

难度: 专业阅读时间: 13 分钟

TLS 1.3
HTTPS
Key Agreement
Python

HTTP/2、HTTP/3 与 CDN 缓存：从网络瀑布图理解网页加载速度

用确定性 waterfall 模型拆解 HTTP/2、HTTP/3、QUIC stream 和 CDN HIT/MISS 对网页等待时间的影响。

难度: 专业阅读时间: 14 分钟

HTTP/2
HTTP/3
QUIC
CDN
Python

正向代理与反向代理原理：连接路径、信任边界和时延计算

从连接方向和 TLS 终止点解释正向代理、反向代理与隧道代理，并用 Python 模型分段计算代理 hop 与缓存收益。

难度: 进阶阅读时间: 12 分钟

Forward Proxy
Reverse Proxy
TLS
Python

HTTP CONNECT 与 HTTPS 代理隧道：TLS 边界和握手时延

以 RFC CONNECT 状态机解释 HTTPS 代理隧道、TLS 可见性和首次加密请求时延。

难度: 专业阅读时间: 12 分钟

HTTP CONNECT
HTTPS
TLS 1.3
Python

SOCKS5 代理原理：协议字节、DNS 解析边界与泄漏风险

按 RFC 1928 拆解 SOCKS5 CONNECT 字节，通过安全编码实验比较本地 DNS 与代理侧域名解析。

难度: 专业阅读时间: 13 分钟

SOCKS5
DNS
Protocol Bytes
Python

反向代理负载均衡原理：队列、健康检查和可复现调度实验

用固定请求队列比较 round robin 与负载感知调度，并解释反向代理健康检查和重试边界。

难度: 专业阅读时间: 13 分钟

Reverse Proxy
Load Balancing
Health Checks
Python

代理缓存与重新验证：Cache-Control、ETag 和可观测性实验

依据 RFC 9111 计算共享缓存 MISS、HIT 与 304 revalidation 的时延，并解释缓存 key 和隐私边界。

难度: 专业阅读时间: 13 分钟

HTTP Cache
ETag
Observability
Python

项目时间线

已发布文章

DNS 解析过程详解：从域名查询到 TTL 缓存的 Python 实验从 RFC DNS 报文与递归查询出发，用 Python 和 C 实验计算 TTL 缓存命中对解析延迟的影响。
CIDR、子网掩码与最长前缀匹配：用代码算清 IP 路由和 MTU 手算 CIDR 网段、最长前缀匹配与 MTU/MSS 分段，并用 Python/C 输出固定路由结果。
TCP 三次握手、重传与拥塞窗口：可运行的序列号实验从 TCP sequence/ACK 和慢启动出发，用确定性丢包曲线与 localhost C socket 实验理解可靠传输。
HTTPS 与 TLS 1.3 握手原理：密钥交换、证书和 RTT 实验解释 TLS 1.3 消息 flight、证书与临时密钥交换，用安全的教学模型计算一次 RTT 握手。
HTTP/2、HTTP/3 与 CDN 缓存：从网络瀑布图理解网页加载速度用确定性 waterfall 模型拆解 HTTP/2、HTTP/3、QUIC stream 和 CDN HIT/MISS 对网页等待时间的影响。
正向代理与反向代理原理：连接路径、信任边界和时延计算从连接方向和 TLS 终止点解释正向代理、反向代理与隧道代理，并用 Python 模型分段计算代理 hop 与缓存收益。
HTTP CONNECT 与 HTTPS 代理隧道：TLS 边界和握手时延以 RFC CONNECT 状态机解释 HTTPS 代理隧道、TLS 可见性和首次加密请求时延。
SOCKS5 代理原理：协议字节、DNS 解析边界与泄漏风险按 RFC 1928 拆解 SOCKS5 CONNECT 字节，通过安全编码实验比较本地 DNS 与代理侧域名解析。
反向代理负载均衡原理：队列、健康检查和可复现调度实验用固定请求队列比较 round robin 与负载感知调度，并解释反向代理健康检查和重试边界。
代理缓存与重新验证：Cache-Control、ETag 和可观测性实验依据 RFC 9111 计算共享缓存 MISS、HIT 与 304 revalidation 的时延，并解释缓存 key 和隐私边界。

已公开资源

Network Fundamentals Lab 说明安装、无权限安全边界、十个 Python 实验和三个 C 示例的运行说明。
网络基础原理完整实验包打包 Python/C 源码、固定场景、十份结果 CSV 与协议/代理图。
DNS TTL 结果 CSV 四次固定查询的 HIT/MISS、过期时间和解析延迟。
CIDR 与 MTU 结果 CSV 最长前缀路由和 3600 B payload 分段计算结果。
TCP cwnd 事件 CSV 逐轮记录 ACK、窗口和固定重传事件。
TLS 1.3 flight 结果 CSV 固定 RTT 模型中的消息方向、时间点和教学共享值。
HTTP/CDN waterfall 结果 CSV HTTP/2 与 HTTP/3 在冷暖缓存模型中的分阶段耗时。
代理路径时延结果 CSV 直接访问、正向代理隧道与反向代理缓存路径的分阶段等待。
CONNECT/TLS 时间线 CSV 记录 CONNECT authority、隧道建立与加密 HTTPS 请求的状态边界。
SOCKS5 DNS 边界 CSV 保存 ATYP、目标字节、请求长度和本机 DNS 解析计数。
代理负载均衡队列 CSV 比较 round robin 与 least queue 的 backend 选择和排队等待。
代理缓存重新验证 CSV 记录 MISS、HIT、304 重新验证、对象年龄和响应时延。
网络请求链路交互演示在浏览器里调整 TTL、前缀、丢包、握手 RTT 与缓存路径。
网络基础原理专题分享图用于分享 DNS、TLS、HTTP/3、代理隧道和缓存专题的 1200x630 SVG 图。

下一步计划

补充 IPv6 与 QUIC 报文观察笔记
继续用真实用户指标复查缓存与协议收益

配套资源

安装、无权限安全边界、十个 Python 实验和三个 C 示例的运行说明。

打开资源关联文章

打包 Python/C 源码、固定场景、十份结果 CSV 与协议/代理图。

打开资源关联文章

四次固定查询的 HIT/MISS、过期时间和解析延迟。

打开资源关联文章

最长前缀路由和 3600 B payload 分段计算结果。

打开资源关联文章

逐轮记录 ACK、窗口和固定重传事件。

打开资源关联文章

固定 RTT 模型中的消息方向、时间点和教学共享值。

打开资源关联文章

HTTP/2 与 HTTP/3 在冷暖缓存模型中的分阶段耗时。

打开资源关联文章

直接访问、正向代理隧道与反向代理缓存路径的分阶段等待。

打开资源关联文章

记录 CONNECT authority、隧道建立与加密 HTTPS 请求的状态边界。

打开资源关联文章

保存 ATYP、目标字节、请求长度和本机 DNS 解析计数。

打开资源关联文章

比较 round robin 与 least queue 的 backend 选择和排队等待。

打开资源关联文章

记录 MISS、HIT、304 重新验证、对象年龄和响应时延。

打开资源关联文章

在浏览器里调整 TTL、前缀、丢包、握手 RTT 与缓存路径。

打开资源关联文章

用于分享 DNS、TLS、HTTP/3、代理隧道和缓存专题的 1200x630 SVG 图。

打开资源关联文章

电池建模与 AI

让电池、控制和机器学习方向的博士生能审计 PyBaMM 模型、批量生成带标签数据，并清楚区分仿真标签和实验真值。

围绕 PyBaMM、EIS、老化仿真和 AI 标签数据，建立可复查的物理建模到机器学习数据管线。

打开推荐路线打开知识图谱

下一步计划

补充实验数据校准与参数可识别性笔记
增加 PyBOP/SEIS 对照实验的重新验证版本

已发布文章

PyBaMM 快速解读：从 Oxford 电池模型架构到 AI 数据管线

面向博士生拆解 PyBaMM expression tree、Simulation 管线、模型选项和 AI 数据 schema。

难度: 博士生阅读时间: 14 分钟

PyBaMM
DFN
Expression Tree
AI Dataset

PyBaMM 阻抗谱数据生成：EISSimulation、SOC sweep 与 AI 标签

用 PyBaMM core 的 EISSimulation 生成阻抗谱，提取 Nyquist/Bode 特征并对齐老化标签。

难度: 博士生阅读时间: 13 分钟

PyBaMM
EISSimulation
Impedance
Labels

用 PyBaMM 生成电池老化与阻抗 AI 数据集：标签、切分和质量控制

构建可复现 PyBaMM 数据工厂，生成 SOH、RUL、LLI、LAM、plating 和 EIS 特征标签。

难度: 博士生阅读时间: 15 分钟

PyBaMM
Battery Aging
SOH
RUL
Data Quality

训练电池 AI 实例：用 PyBaMM 仿真数据预测 SOH 与 RUL

用 PyBaMM 或 surrogate 生成的 EIS 特征和工况数据训练 scikit-learn 模型，预测电池 SOH 与 RUL。

难度: 博士生阅读时间: 14 分钟

PyBaMM
scikit-learn
SOH
RUL
Group Split

项目时间线

已发布文章

PyBaMM 快速解读：从 Oxford 电池模型架构到 AI 数据管线面向博士生拆解 PyBaMM expression tree、Simulation 管线、模型选项和 AI 数据 schema。
PyBaMM 阻抗谱数据生成：EISSimulation、SOC sweep 与 AI 标签用 PyBaMM core 的 EISSimulation 生成阻抗谱，提取 Nyquist/Bode 特征并对齐老化标签。
用 PyBaMM 生成电池老化与阻抗 AI 数据集：标签、切分和质量控制构建可复现 PyBaMM 数据工厂，生成 SOH、RUL、LLI、LAM、plating 和 EIS 特征标签。
训练电池 AI 实例：用 PyBaMM 仿真数据预测 SOH 与 RUL 用 PyBaMM 或 surrogate 生成的 EIS 特征和工况数据训练 scikit-learn 模型，预测电池 SOH 与 RUL。

已公开资源

PyBaMM AI Data Lab 说明说明 PyBaMM 电池建模与 AI 数据管线的安装、quick run、backend 和输出 schema。
PyBaMM AI Data Lab 完整实验包打包设计生成、老化 sweep、EIS sweep、标签构建、质量检查、样例 CSV 和图示。
PyBaMM 样本 manifest 保存 sample_id、模型族、参数集、协议、温度、SOC、cycle、split group 和标签来源。
PyBaMM EIS 样例谱 CSV 频点级阻抗输出，包含 frequency、Z_re、Z_im、幅值、相位、backend 和 solver status。
电池老化与阻抗标签 CSV 保存 SOH、RUL proxy、LLI、LAM、plating、local resistance 和 EIS 特征。
PyBaMM AI 数据质量报告记录重复 sample、频点重复、缺失标签、split leakage 和 backend 使用情况。
PyBaMM 到 AI 数据管线图展示设计网格、老化求解、EIS 求解、标签构建、质量门和 AI split。
EIS 特征与标签 schema 图把频点、阻抗特征、工况 metadata 与 SOH/RUL/退化模式标签连接起来。
老化标签样例图样例展示 cycle snapshot、SOH 与 local ECM resistance 的标签变化。
SOH/RUL 训练指标 CSV 保存 group split、MAE、RMSE、R2、label source 和 backend used，用于复查训练结果。
SOH/RUL held-out 预测 CSV 保存测试样本的真实值、预测值和绝对误差。
SOH/RUL 特征重要性 CSV 记录每个目标模型的随机森林特征重要性。
SOH/RUL 训练结果图展示 held-out SOH/RUL 预测散点图和 SOH 特征重要性。
电池建模与 AI 分享图面向 PyBaMM 电池建模、EIS、老化仿真和 AI 数据专题的 OG 分享图。

下一步计划

补充实验数据校准与参数可识别性笔记
增加 PyBOP/SEIS 对照实验的重新验证版本

配套资源

说明 PyBaMM 电池建模与 AI 数据管线的安装、quick run、backend 和输出 schema。

打开资源关联文章

打包设计生成、老化 sweep、EIS sweep、标签构建、质量检查、样例 CSV 和图示。

打开资源关联文章

保存 sample_id、模型族、参数集、协议、温度、SOC、cycle、split group 和标签来源。

打开资源关联文章

频点级阻抗输出，包含 frequency、Z_re、Z_im、幅值、相位、backend 和 solver status。

打开资源关联文章

保存 SOH、RUL proxy、LLI、LAM、plating、local resistance 和 EIS 特征。

打开资源关联文章

记录重复 sample、频点重复、缺失标签、split leakage 和 backend 使用情况。

打开资源关联文章

展示设计网格、老化求解、EIS 求解、标签构建、质量门和 AI split。

打开资源关联文章

把频点、阻抗特征、工况 metadata 与 SOH/RUL/退化模式标签连接起来。

打开资源关联文章

样例展示 cycle snapshot、SOH 与 local ECM resistance 的标签变化。

打开资源关联文章

保存 group split、MAE、RMSE、R2、label source 和 backend used，用于复查训练结果。

打开资源关联文章

保存测试样本的真实值、预测值和绝对误差。

打开资源关联文章

记录每个目标模型的随机森林特征重要性。

打开资源关联文章

展示 held-out SOH/RUL 预测散点图和 SOH 特征重要性。

打开资源关联文章

面向 PyBaMM 电池建模、EIS、老化仿真和 AI 数据专题的 OG 分享图。

打开资源关联文章

人工智能项目

让有编程基础的读者能完整跑通一次机器学习学习流程，并继续进入卷积网络、鲁棒评估、模型隐私和 LLM/RAG/Agent 安全防护。

从 AI、机器学习、训练评估、神经网络到 Python 小实战、手写数字识别、CIFAR-10 CNN、对抗性流量防御和 AI 安全攻防，按顺序建立基础。

打开推荐路线打开知识图谱打开 LLM 可视化

下一步计划

补充更多图像分类和误差分析案例
把常见指标整理成速查表
继续补充 AI 安全防御实验记录

已发布文章

人工智能基础学习路线：先理解什么是 AI、机器学习和深度学习

面向有编程基础的读者，梳理 AI、机器学习、深度学习的关系，并给出可执行的人工智能基础学习路线。

难度: 入门阅读时间: 8 分钟

AI
Machine Learning
Deep Learning

机器学习完整流程：从数据、特征到模型预测

从工程视角拆解机器学习完整流程：定义问题、理解数据、处理特征、训练模型、预测和评估。

难度: 入门阅读时间: 9 分钟

Machine Learning
Features
scikit-learn

机器学习算法怎么选：分类、回归、聚类和推荐场景对照表

用任务类型、数据规模、解释性和部署成本选择机器学习算法，覆盖逻辑回归、决策树、随机森林、K-means 和表格数据基线模型。

难度: 入门阅读时间: 10 分钟

Machine Learning
Model Selection
scikit-learn

特征工程入门实战：用 scikit-learn 处理缺失值、类别变量和数值标准化

用 scikit-learn Pipeline 和 ColumnTransformer 完成特征工程，处理缺失值、类别变量、数值标准化，并避免数据泄漏。

难度: 实战阅读时间: 11 分钟

Feature Engineering
Pipeline
ColumnTransformer

模型训练与评估入门：损失函数、过拟合和准确率怎么理解

讲清楚模型训练中的参数、损失函数、梯度下降、过拟合，以及准确率、召回率、F1 等分类评估指标。

难度: 入门阅读时间: 9 分钟

Model Training
Metrics
Evaluation

过拟合和欠拟合怎么解决：机器学习模型调优实战指南

用训练分数和验证分数判断过拟合与欠拟合，并通过模型复杂度、正则化、交叉验证和特征工程调整机器学习模型。

难度: 实战阅读时间: 10 分钟

Overfitting
Cross Validation
Model Tuning

神经网络基础：从感知机到多层网络

从一个神经元讲起，解释权重、偏置、激活函数、前向传播、反向传播和典型神经网络训练循环。

难度: 进阶阅读时间: 8 分钟

Neural Networks
Backpropagation
Python

神经网络矩阵微积分：从 y = Wx + b 推导 MSE 梯度

用手算、矩阵形状图、NumPy 代码和梯度检查解释 y = Wx + b 下 dL/dW = (ŷ - y)x^T 的来源。

难度: 进阶阅读时间: 13 分钟

Matrix Calculus
NumPy
Gradient Check

反向传播计算图：两层 MLP 的前向、局部梯度和反向传播

把两层 MLP 拆成计算图，手算 ReLU、softmax cross-entropy、dW2、dW1，并用 NumPy 复现实验结果。

难度: 进阶阅读时间: 14 分钟

Backpropagation
Computation Graph
Softmax

梯度下降与优化器几何：Momentum、Adam 和 loss surface 轨迹

在二维二次函数上手算梯度下降前几步，比较 Momentum 和 Adam 的轨迹，并用代码生成 loss contour。

难度: 进阶阅读时间: 13 分钟

Gradient Descent
Momentum
Adam
Loss Surface

卷积与感受野数学：5×5 输入、3×3 kernel、padding 和 im2col

手算一次 5x5 输入与 3x3 kernel 的离散卷积，解释输出尺寸、padding、stride、感受野和 im2col。

难度: 进阶阅读时间: 13 分钟

Convolution
Receptive Field
im2col

Transformer Attention 数学：Q/K/V、Softmax 权重、Mask 与 KV Cache

用 3 个 token 手算 scaled dot-product attention，解释 Q/K/V、softmax、mask、多头注意力和 KV cache。

难度: 进阶阅读时间: 14 分钟

Transformer
Attention
QKV
KV Cache

Python 人工智能小实战：用 scikit-learn 完成一个分类任务

使用 scikit-learn 内置教学数据集跑通一个分类任务，覆盖数据加载、拆分、标准化、训练、预测、评估和实验记录。

难度: 实战阅读时间: 10 分钟

Python
scikit-learn
Classification

手写数字识别项目入门：先读懂 train.csv、test.csv 和标签结构

从项目文件结构入手，读懂手写数字训练集、测试集、标签列和 784 维像素输入，为后续 C 分类器和实验台打基础。

难度: 入门阅读时间: 8 分钟

Dataset
CSV
Image Classification

用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv

结合当前项目源码，讲清楚 softmax 多分类、损失函数、梯度更新、混淆矩阵输出，以及 submission.csv 的生成过程。

难度: 实战阅读时间: 11 分钟

C
Softmax
Classification

手写数字实验记录：怎么把离线分类项目接进浏览器实验台

解释浏览器实验台为什么采用轻量预训练模型、它和离线 C 项目的关系，以及如何用样本浏览和手绘输入理解预测结果。

难度: 实战阅读时间: 8 分钟

Browser Demo
Softmax
Visualization

CIFAR-10 Tiny CNN 教程：用 C 语言实现小型卷积神经网络图像分类

用单文件 C 程序完成 CIFAR-10 小型 CNN 图像分类，讲解数据格式、网络结构、训练命令、loss、accuracy、常见错误和改进方向。

难度: 进阶阅读时间: 13 分钟

C
CNN
CIFAR-10
Backpropagation

构建高熵流量防御：基于 Python 的连接层白噪声混淆与对抗性机器学习实践

以 mld_chaffing_v2.py 虚幻镜项目为例，讲解加密元数据泄漏、信息熵、分布距离、混淆矩阵、空闲窗口微脉冲和性能测试取舍。

难度: 进阶阅读时间: 16 分钟

Python
Traffic Analysis
Adversarial ML
Networking

AI 安全威胁建模：用 NIST AML、MITRE ATLAS 和 OWASP 建立攻防地图

用 NIST Adversarial ML、MITRE ATLAS 和 OWASP LLM Top 10 建立 AI 安全威胁模型，覆盖资产、攻击面、证据和剩余风险。

难度: 专业阅读时间: 12 分钟

AI Security
Threat Modeling
NIST
MITRE ATLAS
OWASP

对抗样本与鲁棒评估：从 FGSM 公式到 scikit-learn 数字分类实验

从 FGSM 公式解释对抗样本，用 scikit-learn digits toy 实验评估 clean accuracy、perturbed accuracy 和扰动预算。

难度: 专业阅读时间: 11 分钟

Adversarial Examples
FGSM
Robust Evaluation
scikit-learn

数据投毒与后门攻击防御：污染率、触发器和训练管线隔离

用 toy digits 实验解释数据投毒、后门触发器、attack success rate、数据来源审计和训练管线隔离。

难度: 专业阅读时间: 11 分钟

Data Poisoning
Backdoor Defense
Training Pipeline
scikit-learn

模型隐私与模型窃取风险：成员推断、模型抽取和输出接口防护

用本地 toy 实验解释成员推断、模型抽取、membership AUC、surrogate fidelity、输出最小化和查询治理。

难度: 专业阅读时间: 12 分钟

Model Privacy
Membership Inference
Model Extraction
Prediction API

LLM/RAG/Agent 安全：Prompt Injection、工具权限和边界感知防护

从 RAG 和 Agent 架构解释 prompt injection、外部数据降权、工具 allowlist、人工审批和边界感知防护。

难度: 专业阅读时间: 12 分钟

LLM Security
RAG
Agent Tools
Prompt Injection

项目时间线

已发布文章

人工智能基础学习路线：先理解什么是 AI、机器学习和深度学习面向有编程基础的读者，梳理 AI、机器学习、深度学习的关系，并给出可执行的人工智能基础学习路线。
机器学习完整流程：从数据、特征到模型预测从工程视角拆解机器学习完整流程：定义问题、理解数据、处理特征、训练模型、预测和评估。
机器学习算法怎么选：分类、回归、聚类和推荐场景对照表用任务类型、数据规模、解释性和部署成本选择机器学习算法，覆盖逻辑回归、决策树、随机森林、K-means 和表格数据基线模型。
特征工程入门实战：用 scikit-learn 处理缺失值、类别变量和数值标准化用 scikit-learn Pipeline 和 ColumnTransformer 完成特征工程，处理缺失值、类别变量、数值标准化，并避免数据泄漏。
模型训练与评估入门：损失函数、过拟合和准确率怎么理解讲清楚模型训练中的参数、损失函数、梯度下降、过拟合，以及准确率、召回率、F1 等分类评估指标。
过拟合和欠拟合怎么解决：机器学习模型调优实战指南用训练分数和验证分数判断过拟合与欠拟合，并通过模型复杂度、正则化、交叉验证和特征工程调整机器学习模型。
神经网络基础：从感知机到多层网络从一个神经元讲起，解释权重、偏置、激活函数、前向传播、反向传播和典型神经网络训练循环。
神经网络矩阵微积分：从 y = Wx + b 推导 MSE 梯度用手算、矩阵形状图、NumPy 代码和梯度检查解释 y = Wx + b 下 dL/dW = (ŷ - y)x^T 的来源。
反向传播计算图：两层 MLP 的前向、局部梯度和反向传播把两层 MLP 拆成计算图，手算 ReLU、softmax cross-entropy、dW2、dW1，并用 NumPy 复现实验结果。
梯度下降与优化器几何：Momentum、Adam 和 loss surface 轨迹在二维二次函数上手算梯度下降前几步，比较 Momentum 和 Adam 的轨迹，并用代码生成 loss contour。
卷积与感受野数学：5×5 输入、3×3 kernel、padding 和 im2col 手算一次 5x5 输入与 3x3 kernel 的离散卷积，解释输出尺寸、padding、stride、感受野和 im2col。
Transformer Attention 数学：Q/K/V、Softmax 权重、Mask 与 KV Cache 用 3 个 token 手算 scaled dot-product attention，解释 Q/K/V、softmax、mask、多头注意力和 KV cache。
Python 人工智能小实战：用 scikit-learn 完成一个分类任务使用 scikit-learn 内置教学数据集跑通一个分类任务，覆盖数据加载、拆分、标准化、训练、预测、评估和实验记录。
手写数字识别项目入门：先读懂 train.csv、test.csv 和标签结构从项目文件结构入手，读懂手写数字训练集、测试集、标签列和 784 维像素输入，为后续 C 分类器和实验台打基础。
用 C 实现手写数字 Softmax 分类器：从 784 维像素到 submission.csv 结合当前项目源码，讲清楚 softmax 多分类、损失函数、梯度更新、混淆矩阵输出，以及 submission.csv 的生成过程。
手写数字实验记录：怎么把离线分类项目接进浏览器实验台解释浏览器实验台为什么采用轻量预训练模型、它和离线 C 项目的关系，以及如何用样本浏览和手绘输入理解预测结果。
CIFAR-10 Tiny CNN 教程：用 C 语言实现小型卷积神经网络图像分类用单文件 C 程序完成 CIFAR-10 小型 CNN 图像分类，讲解数据格式、网络结构、训练命令、loss、accuracy、常见错误和改进方向。
构建高熵流量防御：基于 Python 的连接层白噪声混淆与对抗性机器学习实践以 mld_chaffing_v2.py 虚幻镜项目为例，讲解加密元数据泄漏、信息熵、分布距离、混淆矩阵、空闲窗口微脉冲和性能测试取舍。
AI 安全威胁建模：用 NIST AML、MITRE ATLAS 和 OWASP 建立攻防地图用 NIST Adversarial ML、MITRE ATLAS 和 OWASP LLM Top 10 建立 AI 安全威胁模型，覆盖资产、攻击面、证据和剩余风险。
对抗样本与鲁棒评估：从 FGSM 公式到 scikit-learn 数字分类实验从 FGSM 公式解释对抗样本，用 scikit-learn digits toy 实验评估 clean accuracy、perturbed accuracy 和扰动预算。
数据投毒与后门攻击防御：污染率、触发器和训练管线隔离用 toy digits 实验解释数据投毒、后门触发器、attack success rate、数据来源审计和训练管线隔离。
模型隐私与模型窃取风险：成员推断、模型抽取和输出接口防护用本地 toy 实验解释成员推断、模型抽取、membership AUC、surrogate fidelity、输出最小化和查询治理。
LLM/RAG/Agent 安全：Prompt Injection、工具权限和边界感知防护从 RAG 和 Agent 架构解释 prompt injection、外部数据降权、工具 allowlist、人工审批和边界感知防护。

已公开资源

Python AI 小实战代码说明文章内包含可直接复制运行的 scikit-learn 分类脚本。
digit_softmax_classifier.c 手写数字 softmax 分类器的 C 语言源码。
train.csv.zip 手写数字训练集压缩包，包含 42000 条带标签样本。
test.csv.zip 手写数字测试集压缩包，包含 28000 条待预测样本。
sample_submission.csv 官方提交格式示例，可直接对照最终输出字段。
submission.csv 当前 C 项目跑出的预测结果文件。
digit-playground-model.json 浏览器实验台使用的轻量 softmax 演示模型与样本。
digit-sample-grid.svg 从训练集中抽取的小型手写数字预览网格。
手写数字项目打包下载包含源码、压缩数据、提交文件、浏览器模型和样本预览图。
cifar10_tiny_cnn.c 源码单文件 C 语言 tiny CNN，包含 CIFAR-10 读取、卷积、池化、softmax 和反向传播。
model_weights.bin 样例权重一次本地小样本运行生成的模型权重文件。
test_predictions.csv 预测样例 CIFAR-10 tiny CNN 输出的测试预测样例。
CNN 项目说明 PDF 配套 CNN 项目说明材料。
虚幻镜脱敏代码骨架去除控制口令、真实节点和目标列表后的 mld_chaffing_v2.py 控制流程说明。
虚幻镜压力测试记录模板用于记录 CPU、内存、线程峰值、微脉冲速率、延迟和错误数的脱敏 CSV 模板。
虚幻镜分类器评估模板用于记录 TP、FN、FP、TN、accuracy、precision、recall、F1、ROC-AUC、熵和 JS 散度的 CSV 模板。
虚幻镜资源说明说明公开资源为何只提供脱敏代码、测试模板和架构笔记。
AI Security Lab 说明说明 AI 安全攻防系列的安全边界、安装命令和 quick-run 实验。
AI Security Lab 完整实验包包含安全 toy scripts、结果 CSV、风险登记表、攻防矩阵和架构图。
AI 安全风险登记表面向 AI 威胁建模和上线评审的 CSV 风险登记模板。
AI 攻防矩阵把攻击面、toy demo、指标和防护控制映射到一张 CSV 表。
AI Security Lab 架构图展示威胁建模、鲁棒评估、数据完整性、模型隐私和 RAG 防护之间的关系。
FGSM digits 鲁棒评估脚本本地 digits 分类器的 FGSM-style 扰动和准确率下降实验。
数据投毒与后门 toy 脚本用 digits 数据演示污染率、触发器和 attack success rate。
模型隐私与抽取 toy 脚本输出 membership AUC、target accuracy、surrogate fidelity 和 surrogate accuracy。
RAG prompt injection guard toy 脚本用确定性 toy agent 演示外部数据降权和工具权限阻断。
Deep Learning Math Lab 说明包含安装命令、脚本入口、输出结果和文章图示生成说明。
深度学习数学完整实验包打包 NumPy 脚本、CSV 结果、公式图、loss contour、卷积图和 attention 热图。
梯度检查结果 CSV 保存 MSE 梯度解析值、数值差分值和误差范数。
优化器轨迹 CSV 记录梯度下降、Momentum 和 Adam 在二维二次函数上的逐步坐标与 loss。
Attention 权重 CSV 三 token scaled dot-product attention 的 scores、softmax weights 和 context 输出。
深度学习数学图示目录包含矩阵形状、计算图、loss contour、卷积扫描和 attention heatmap。
深度学习数学交互演示在浏览器里调梯度检查、优化轨迹、卷积输出尺寸和 attention 权重热图。
深度学习专题分享图用于分享深度学习 / CNN 专题页的 1200x630 SVG 图。
从零实现机器学习分享图用于分享 K-means、Iris 和机器学习流程专题页的 1200x630 SVG 图。
学生 AI 项目分享图用于分享手写数字、C 分类器和浏览器实验台专题页的 1200x630 SVG 图。
CNN 卷积扫描动画 Remotion 生成的 8 秒短动画，展示 3x3 卷积核如何扫描输入并形成特征图。

当前学习路线

人工智能基础学习路线学习路线节点
机器学习完整流程学习路线节点
机器学习算法怎么选学习路线节点
特征工程入门实战学习路线节点
模型训练与评估入门学习路线节点
过拟合和欠拟合怎么解决学习路线节点
神经网络基础学习路线节点
神经网络矩阵微积分学习路线节点
反向传播计算图学习路线节点
梯度下降与优化器几何学习路线节点
卷积与感受野数学学习路线节点
Transformer Attention 数学学习路线节点
LLM 可视化教学台学习路线节点
Python 人工智能小实战学习路线节点
手写数字数据结构入门学习路线节点
用 C 实现手写数字 Softmax 分类器学习路线节点
手写数字实验台说明学习路线节点
CIFAR-10 Tiny CNN 教程学习路线节点
高熵流量防御实验学习路线节点
AI 安全威胁建模学习路线节点
对抗样本与鲁棒评估学习路线节点
数据投毒与后门防御学习路线节点
模型隐私与模型抽取防护学习路线节点
LLM/RAG/Agent 安全学习路线节点

下一步计划

补充更多图像分类和误差分析案例
把常见指标整理成速查表
继续补充 AI 安全防御实验记录

配套资源

文章内包含可直接复制运行的 scikit-learn 分类脚本。

打开资源关联文章

手写数字 softmax 分类器的 C 语言源码。

打开资源关联文章

手写数字训练集压缩包，包含 42000 条带标签样本。

打开资源关联文章

手写数字测试集压缩包，包含 28000 条待预测样本。

打开资源关联文章

官方提交格式示例，可直接对照最终输出字段。

打开资源关联文章

当前 C 项目跑出的预测结果文件。

打开资源关联文章

浏览器实验台使用的轻量 softmax 演示模型与样本。

打开资源关联文章

从训练集中抽取的小型手写数字预览网格。

打开资源关联文章

包含源码、压缩数据、提交文件、浏览器模型和样本预览图。

打开资源关联文章

单文件 C 语言 tiny CNN，包含 CIFAR-10 读取、卷积、池化、softmax 和反向传播。

打开资源关联文章

一次本地小样本运行生成的模型权重文件。

打开资源关联文章

CIFAR-10 tiny CNN 输出的测试预测样例。

打开资源关联文章

配套 CNN 项目说明材料。

打开资源关联文章

去除控制口令、真实节点和目标列表后的 mld_chaffing_v2.py 控制流程说明。

打开资源关联文章

用于记录 CPU、内存、线程峰值、微脉冲速率、延迟和错误数的脱敏 CSV 模板。

打开资源关联文章

用于记录 TP、FN、FP、TN、accuracy、precision、recall、F1、ROC-AUC、熵和 JS 散度的 CSV 模板。

打开资源关联文章

说明公开资源为何只提供脱敏代码、测试模板和架构笔记。

打开资源关联文章

说明 AI 安全攻防系列的安全边界、安装命令和 quick-run 实验。

打开资源关联文章

包含安全 toy scripts、结果 CSV、风险登记表、攻防矩阵和架构图。

打开资源关联文章

面向 AI 威胁建模和上线评审的 CSV 风险登记模板。

打开资源关联文章

把攻击面、toy demo、指标和防护控制映射到一张 CSV 表。

打开资源关联文章

展示威胁建模、鲁棒评估、数据完整性、模型隐私和 RAG 防护之间的关系。

打开资源关联文章

本地 digits 分类器的 FGSM-style 扰动和准确率下降实验。

打开资源关联文章

用 digits 数据演示污染率、触发器和 attack success rate。

打开资源关联文章

输出 membership AUC、target accuracy、surrogate fidelity 和 surrogate accuracy。

打开资源关联文章

用确定性 toy agent 演示外部数据降权和工具权限阻断。

打开资源关联文章

包含安装命令、脚本入口、输出结果和文章图示生成说明。

打开资源关联文章

打包 NumPy 脚本、CSV 结果、公式图、loss contour、卷积图和 attention 热图。

打开资源关联文章

保存 MSE 梯度解析值、数值差分值和误差范数。

打开资源关联文章

记录梯度下降、Momentum 和 Adam 在二维二次函数上的逐步坐标与 loss。

打开资源关联文章

三 token scaled dot-product attention 的 scores、softmax weights 和 context 输出。

打开资源关联文章

包含矩阵形状、计算图、loss contour、卷积扫描和 attention heatmap。

打开资源关联文章

在浏览器里调梯度检查、优化轨迹、卷积输出尺寸和 attention 权重热图。

打开资源关联文章

用于分享深度学习 / CNN 专题页的 1200x630 SVG 图。

打开资源关联文章

用于分享 K-means、Iris 和机器学习流程专题页的 1200x630 SVG 图。

打开资源关联文章

用于分享手写数字、C 分类器和浏览器实验台专题页的 1200x630 SVG 图。

打开资源关联文章

Remotion 生成的 8 秒短动画，展示 3x3 卷积核如何扫描输入并形成特征图。

打开资源关联文章

算法实现项目

把算法讲解和可运行实现放在同一个长期可复查的项目里。

围绕回溯、位运算和聚类实现，保留可以复查的代码、流程图和下载资料。

打开推荐路线打开知识图谱打开实验台

下一步计划

补充更多算法题的可运行实现
为下载资源增加更多示例输入

已发布文章

人物图片转 SVG 动画资产管线：ComfyUI、Grounded-SAM、OpenPose 与 vtracer

2D 动画原理专栏第一篇：用 ComfyUI IP-Adapter、OpenPose 拆件、Grounded-SAM 抠图和 vtracer 生成 SVG 骨骼资产库。

难度: 实战阅读时间: 14 分钟

ComfyUI
IP-Adapter
OpenPose
Grounded-SAM
vtracer
SVG

回溯算法入门：用 C 和 Python 解决 8 皇后问题

用 C 和 Python 讲清楚 8 皇后回溯搜索的状态表示、冲突判断、递归过程与完整求解思路。

难度: 入门阅读时间: 12 分钟

C
Python
Backtracking

回溯算法进阶：用位运算优化 8 皇后（C / Python）

介绍如何用位运算优化 8 皇后搜索，降低状态判断成本，并给出 C / Python 对照实现。

难度: 进阶阅读时间: 12 分钟

C
Python
Bit Operations
Backtracking

K-means 聚类算法入门：基于 Iris 数据集的 C 语言实现

结合 Iris.csv、C 语言源码、流程图和可视化，完整讲解 K-means++ 初始化、迭代收敛与结果分析。

难度: 进阶阅读时间: 14 分钟

C
K-means
Iris Dataset

图片转 Unicode 四象限 ANSI：原理、实现与浏览器工具

解释如何把任意图片压缩成 truecolor Unicode 四象限 ANSI：2 x 2 像素、两色最小误差、.ans 文件和浏览器端隐私边界。

难度: 入门阅读时间: 10 分钟

C
Python
Backtracking
K-means

项目时间线

已发布文章

人物图片转 SVG 动画资产管线：ComfyUI、Grounded-SAM、OpenPose 与 vtracer 2D 动画原理专栏第一篇：用 ComfyUI IP-Adapter、OpenPose 拆件、Grounded-SAM 抠图和 vtracer 生成 SVG 骨骼资产库。
回溯算法入门：用 C 和 Python 解决 8 皇后问题用 C 和 Python 讲清楚 8 皇后回溯搜索的状态表示、冲突判断、递归过程与完整求解思路。
回溯算法进阶：用位运算优化 8 皇后（C / Python）介绍如何用位运算优化 8 皇后搜索，降低状态判断成本，并给出 C / Python 对照实现。
K-means 聚类算法入门：基于 Iris 数据集的 C 语言实现结合 Iris.csv、C 语言源码、流程图和可视化，完整讲解 K-means++ 初始化、迭代收敛与结果分析。
图片转 Unicode 四象限 ANSI：原理、实现与浏览器工具解释如何把任意图片压缩成 truecolor Unicode 四象限 ANSI：2 x 2 像素、两色最小误差、.ans 文件和浏览器端隐私边界。

已公开资源

Iris.csv 数据集 K-means 文章使用的 150 条 Iris 样本。
Iris_sort_K_mean.c 源码包含标准化、K-means++ 初始化、多次重启和 SSE 选择。
K-means 流程图对应 C 程序执行顺序的 SVG 流程图。
聚类可视化图基于花瓣长度和花瓣宽度投影的二维散点图。
K-means 打包下载包含数据、源码、流程图和可视化图。
高数联系 PDF 公开下载的高数课程 PDF，适合复习或打印。
基础 SAM + vtracer 脚本本机运行的角色图片分割、PNG 图层和 SVG 矢量化参考脚本。
ComfyUI + Grounded-SAM 生产脚本调度本机 ComfyUI、Grounding DINO、SAM 和 vtracer，生成带稳定 ID 的 SVG 骨骼资产。
ComfyUI 拆件角色工作流模板 IP-Adapter 锁定角色特征，ControlNet OpenPose 约束拆件排版的可编辑 API 模板。
拆件 OpenPose 骨架图用于生成头、躯干、手脚分开的角色部件板，可导出 PNG 后喂给 ControlNet。
动画部件 prompt 清单 Grounding DINO 使用的 head、left arm、torso、tail、accessory 等语义抠图提示词。
算法可视化专题分享图用于分享 8 皇后、回溯、位运算和实验台专题页的 1200x630 SVG 图。
K-means 一轮迭代动画 Remotion 生成的短动画，展示样本分配、质心更新和 SSE 下降。
8 皇后回溯搜索动画 Remotion 生成的短动画，展示逐行尝试、冲突剪枝和回溯。

当前学习路线

下一步计划

补充更多算法题的可运行实现
为下载资源增加更多示例输入

配套资源

K-means 文章使用的 150 条 Iris 样本。

打开资源关联文章

包含标准化、K-means++ 初始化、多次重启和 SSE 选择。

打开资源关联文章

对应 C 程序执行顺序的 SVG 流程图。

打开资源关联文章

基于花瓣长度和花瓣宽度投影的二维散点图。

打开资源关联文章

包含数据、源码、流程图和可视化图。

打开资源关联文章

公开下载的高数课程 PDF，适合复习或打印。

打开资源

本机运行的角色图片分割、PNG 图层和 SVG 矢量化参考脚本。

打开资源关联文章

调度本机 ComfyUI、Grounding DINO、SAM 和 vtracer，生成带稳定 ID 的 SVG 骨骼资产。

打开资源关联文章

IP-Adapter 锁定角色特征，ControlNet OpenPose 约束拆件排版的可编辑 API 模板。

打开资源关联文章

用于生成头、躯干、手脚分开的角色部件板，可导出 PNG 后喂给 ControlNet。

打开资源关联文章

Grounding DINO 使用的 head、left arm、torso、tail、accessory 等语义抠图提示词。

打开资源关联文章

用于分享 8 皇后、回溯、位运算和实验台专题页的 1200x630 SVG 图。

打开资源关联文章

Remotion 生成的短动画，展示样本分配、质心更新和 SSE 下降。

打开资源关联文章

Remotion 生成的短动画，展示逐行尝试、冲突剪枝和回溯。

打开资源关联文章

站点建设项目

让站点建设过程可回滚、可维护、可继续扩展。

记录这个双语技术站的结构、内容同步、分类、评论和部署方式。

打开推荐路线打开知识图谱

下一步计划

继续整理部署和维护笔记
把内容同步流程写成更清晰的说明

已发布文章

欢迎来到浩天博客：这个双语技术站会发布什么

介绍浩天博客的定位、双语结构，以及后续会持续发布的算法、编程与项目内容。

难度: 说明阅读时间: 3 分钟

WordPress
Cloudflare
Content Workflow

项目时间线

已发布文章

欢迎来到浩天博客：这个双语技术站会发布什么介绍浩天博客的定位、双语结构，以及后续会持续发布的算法、编程与项目内容。

已公开资源

SEO 分发短视频脚本 4 个内容集群的 45-60 秒短视频脚本，可后续交给 Remotion 制作。

下一步计划

继续整理部署和维护笔记
把内容同步流程写成更清晰的说明

配套资源

4 个内容集群的 45-60 秒短视频脚本，可后续交给 Remotion 制作。

打开资源关联文章

项目收录标准

项目索引不会把单篇概念文章直接当成完整项目。一个项目至少需要有明确目标、输入材料、运行步骤、结果解释和限制说明；如果包含代码，还需要说明运行环境、参数和可能失败的情况。这样读者才能判断它是否值得下载和复现。

当前项目大多是教学型项目，重点是解释算法、模型或协议行为。它们适合课堂、作业、个人练习和技术笔记，不适合未经审计就直接进入生产系统。涉及网络、安全或数据处理的项目，会优先写清楚边界和误用风险。

后续项目会按“问题背景、最小实现、实验结果、失败情况、改进方向”的顺序补充。这样即使项目还很小，也能让读者知道它解决了什么、没解决什么，以及下一步应该怎样验证。

项目页也会区分“已经可复现”和“仍在整理”的材料。已经可复现的项目会尽量提供下载、运行步骤和结果解释；仍在整理的项目会明确标注阶段，不会用空标题占据入口。这样可以减少审核时看到大量半成品页面的风险。

如果某个项目暂时只有想法，没有代码、数据或实验记录，它更适合留在私人草稿里，而不是发布成公开页面。

这也是项目页当前的质量底线。