浩天博客
AI 安全攻防专题

AI 安全攻防专题

专题路线

AI 安全攻防专题

把威胁建模、对抗样本、数据投毒、模型隐私和 LLM/RAG/Agent 安全组织成一条可复现实验路线。

面向搜索 AI 安全威胁建模、对抗样本鲁棒评估、数据投毒防御、成员推断、模型抽取和 Prompt Injection 防护的工程读者。

你会完成什么

你会得到一套安全 toy 实验包,并能把风险、指标、边界和工程防护清单放进同一个复查流程。

  • AI 安全威胁建模
  • 对抗样本鲁棒评估
  • 数据投毒后门防御
  • 模型隐私成员推断
  • RAG Prompt Injection 防护

推荐阅读顺序

先建立概念,再进入可运行项目

资源与分发素材

代码、数据、图示和可分享摘要集中管理

常见问题

把搜索问题直接回答清楚

这个专题会提供真实攻击系统的步骤吗?

不会。实验只使用 scikit-learn 内置数据和自造 toy 数据,目标是防御评估、风险记录和工程复查。

适合什么背景的读者?

适合已经能阅读 Python、理解基本机器学习流程,并希望把 AI 系统纳入安全评审的工程读者。