分类博客
按项目阅读文章
文章按人工智能、算法实现、站点建设组织,每组都保留难度、阅读时间和技术栈。
专题系列
深度学习数学可视化系列
五篇文章从矩阵微积分、反向传播、优化器、卷积到 Attention,每篇都有手算、代码、图和动画。
5 篇文章神经网络矩阵微积分:从 y = Wx + b 推导 MSE 梯度
用手算、矩阵形状图、NumPy 代码和梯度检查解释 y = Wx + b 下 dL/dW = (ŷ - y)x^T 的来源。
反向传播计算图:两层 MLP 的前向、局部梯度和反向传播
把两层 MLP 拆成计算图,手算 ReLU、softmax cross-entropy、dW2、dW1,并用 NumPy 复现实验结果。
梯度下降与优化器几何:Momentum、Adam 和 loss surface 轨迹
在二维二次函数上手算梯度下降前几步,比较 Momentum 和 Adam 的轨迹,并用代码生成 loss contour。
卷积与感受野数学:5×5 输入、3×3 kernel、padding 和 im2col
手算一次 5x5 输入与 3x3 kernel 的离散卷积,解释输出尺寸、padding、stride、感受野和 im2col。
Transformer Attention 数学:Q/K/V、Softmax 权重、Mask 与 KV Cache
用 3 个 token 手算 scaled dot-product attention,解释 Q/K/V、softmax、mask、多头注意力和 KV cache。
项目分类
人工智能项目
从 AI、机器学习、训练评估、神经网络到 Python 小实战、手写数字识别、CIFAR-10 CNN、对抗性流量防御和 AI 安全攻防,按顺序建立基础。
27 篇文章人工智能基础学习路线:先理解什么是 AI、机器学习和深度学习
面向有编程基础的读者,梳理 AI、机器学习、深度学习的关系,并给出可执行的人工智能基础学习路线。
机器学习完整流程:从数据、特征到模型预测
从工程视角拆解机器学习完整流程:定义问题、理解数据、处理特征、训练模型、预测和评估。
机器学习算法怎么选:分类、回归、聚类和推荐场景对照表
用任务类型、数据规模、解释性和部署成本选择机器学习算法,覆盖逻辑回归、决策树、随机森林、K-means 和表格数据基线模型。
特征工程入门实战:用 scikit-learn 处理缺失值、类别变量和数值标准化
用 scikit-learn Pipeline 和 ColumnTransformer 完成特征工程,处理缺失值、类别变量、数值标准化,并避免数据泄漏。
模型训练与评估入门:损失函数、过拟合和准确率怎么理解
讲清楚模型训练中的参数、损失函数、梯度下降、过拟合,以及准确率、召回率、F1 等分类评估指标。
过拟合和欠拟合怎么解决:机器学习模型调优实战指南
用训练分数和验证分数判断过拟合与欠拟合,并通过模型复杂度、正则化、交叉验证和特征工程调整机器学习模型。
神经网络基础:从感知机到多层网络
从一个神经元讲起,解释权重、偏置、激活函数、前向传播、反向传播和典型神经网络训练循环。
神经网络矩阵微积分:从 y = Wx + b 推导 MSE 梯度
用手算、矩阵形状图、NumPy 代码和梯度检查解释 y = Wx + b 下 dL/dW = (ŷ - y)x^T 的来源。
反向传播计算图:两层 MLP 的前向、局部梯度和反向传播
把两层 MLP 拆成计算图,手算 ReLU、softmax cross-entropy、dW2、dW1,并用 NumPy 复现实验结果。
梯度下降与优化器几何:Momentum、Adam 和 loss surface 轨迹
在二维二次函数上手算梯度下降前几步,比较 Momentum 和 Adam 的轨迹,并用代码生成 loss contour。
卷积与感受野数学:5×5 输入、3×3 kernel、padding 和 im2col
手算一次 5x5 输入与 3x3 kernel 的离散卷积,解释输出尺寸、padding、stride、感受野和 im2col。
Transformer Attention 数学:Q/K/V、Softmax 权重、Mask 与 KV Cache
用 3 个 token 手算 scaled dot-product attention,解释 Q/K/V、softmax、mask、多头注意力和 KV cache。
Python 人工智能小实战:用 scikit-learn 完成一个分类任务
使用 scikit-learn 内置教学数据集跑通一个分类任务,覆盖数据加载、拆分、标准化、训练、预测、评估和实验记录。
手写数字识别项目入门:先读懂 train.csv、test.csv 和标签结构
从项目文件结构入手,读懂手写数字训练集、测试集、标签列和 784 维像素输入,为后续 C 分类器和实验台打基础。
用 C 实现手写数字 Softmax 分类器:从 784 维像素到 submission.csv
结合当前项目源码,讲清楚 softmax 多分类、损失函数、梯度更新、混淆矩阵输出,以及 submission.csv 的生成过程。
手写数字实验记录:怎么把离线分类项目接进浏览器实验台
解释浏览器实验台为什么采用轻量预训练模型、它和离线 C 项目的关系,以及如何用样本浏览和手绘输入理解预测结果。
CIFAR-10 Tiny CNN 教程:用 C 语言实现小型卷积神经网络图像分类
用单文件 C 程序完成 CIFAR-10 小型 CNN 图像分类,讲解数据格式、网络结构、训练命令、loss、accuracy、常见错误和改进方向。
构建高熵流量防御:基于 Python 的连接层白噪声混淆与对抗性机器学习实践
以 mld_chaffing_v2.py 虚幻镜项目为例,讲解加密元数据泄漏、信息熵、分布距离、混淆矩阵、空闲窗口微脉冲和性能测试取舍。
AI 安全威胁建模:用 NIST AML、MITRE ATLAS 和 OWASP 建立攻防地图
用 NIST Adversarial ML、MITRE ATLAS 和 OWASP LLM Top 10 建立 AI 安全威胁模型,覆盖资产、攻击面、证据和剩余风险。
对抗样本与鲁棒评估:从 FGSM 公式到 scikit-learn 数字分类实验
从 FGSM 公式解释对抗样本,用 scikit-learn digits toy 实验评估 clean accuracy、perturbed accuracy 和扰动预算。
数据投毒与后门攻击防御:污染率、触发器和训练管线隔离
用 toy digits 实验解释数据投毒、后门触发器、attack success rate、数据来源审计和训练管线隔离。
模型隐私与模型窃取风险:成员推断、模型抽取和输出接口防护
用本地 toy 实验解释成员推断、模型抽取、membership AUC、surrogate fidelity、输出最小化和查询治理。
LLM/RAG/Agent 安全:Prompt Injection、工具权限和边界感知防护
从 RAG 和 Agent 架构解释 prompt injection、外部数据降权、工具 allowlist、人工审批和边界感知防护。
人工智能 NLP 基础:词袋模型与 TF-IDF 详解
介绍自然语言处理中最基础的文本表示方法:词袋模型(Bag of Words)与 TF-IDF,理解它们的工作原理及优缺点。
循环神经网络 (RNN) 基础:处理序列数据的记忆力
理解 RNN 的核心思想、隐藏状态的作用,以及它在处理自然语言序列任务时的优势与挑战。
Transformer 与自注意力机制:AI 领域的革命性突破
深入浅出地讲解 Transformer 架构的核心:自注意力机制(Self-Attention)及其运作方式。
用 C 从零实现 CIFAR-10 Tiny CNN:卷积、池化和反向传播
基于实际 cifar10_tiny_cnn.c 项目,讲解 CIFAR-10 数据格式、3x3 卷积、ReLU、最大池化、全连接层、softmax、反向传播和本地运行方式。
项目分类
算法实现项目
围绕回溯、位运算和聚类实现,保留可以复查的代码、流程图和下载资料。
3 篇文章回溯算法入门:用 C 和 Python 解决 8 皇后问题
用 C 和 Python 讲清楚 8 皇后回溯搜索的状态表示、冲突判断、递归过程与完整求解思路。
回溯算法进阶:用位运算优化 8 皇后(C / Python)
介绍如何用位运算优化 8 皇后搜索,降低状态判断成本,并给出 C / Python 对照实现。
K-means 聚类算法入门:基于 Iris 数据集的 C 语言实现
结合 Iris.csv、C 语言源码、流程图和可视化,完整讲解 K-means++ 初始化、迭代收敛与结果分析。
项目分类
站点建设项目
记录这个双语技术站的结构、内容同步、分类、评论和部署方式。
1 篇文章欢迎来到浩天博客:这个双语技术站会发布什么
介绍浩天博客的定位、双语结构,以及后续会持续发布的算法、编程与项目内容。
