🤖 AI大模型工程师 · 学习记录

AI工程师 · 14周系统学习之路

📚 14周AI大模型工程师学习计划

从基础入门到就业冲刺,系统化学习路径


第一阶段:基础入门(第1-2周)

第1周:Python For AI + 开发环境

日期 内容 目标 资源
第1天 Python数据类型、变量、运算符 掌握基础语法 Python官方教程-入门
第2天 控制流(if/for/while)、函数定义 能独立写简单脚本 菜鸟教程-Python3 控制流
第3天 Numpy数组创建、索引、矩阵运算 理解张量基础概念 Numpy快速入门 + 李沐《动手学深度学习》预备知识
第4天 Pandas Series/DataFrame、数据清洗 会做基本数据处理 Pandas 10分钟入门
第5天 面向对象编程:类、继承、封装 理解OOP思想 Python官方-OOP教程
第6天 Git版本控制:init/add/commit/push/branch 能提交代码到GitHub GitHub Git入门
第7天 Anaconda环境配置 + CUDA检测 + Python包管理 跑通第一个LLM调用 Miniconda安装指南 + HuggingFace快速入门

第2周:Linux基础 + 本地问答机器人

日期 内容 目标 资源
第1天 Linux文件系统、cd/ls/mkdir/cp/mv/rm 掌握基本命令行操作 Linux命令大全-文件管理
第2天 vim编辑器、权限管理(chmod/chown)、进程管理(ps/top) 能编辑配置、管理进程 鸟哥的Linux私房菜-文件权限
第3天 Docker安装、镜像拉取(pull/run/exec) 理解容器基本概念 Docker从入门到实践-安装与镜像
第4天 Dockerfile编写、docker-compose多容器编排 能部署简单服务 Docker从入门到实践-Dockerfile
第5天 Ollama安装 + 模型下载(qwen2/llama3) 本地运行大模型 Ollama官方文档 + Ollama模型库
第6天 用Python调用Ollama API + Streamlit构建聊天界面 搭建简易问答机器人 Ollama Python库 + Streamlit教程
第7天 整合项目:完善本地问答机器人 + Docker部署 产出第一个完整项目 结合前6天内容,参考Ollama+LangChain教程

第二阶段:核心技能(第3-7周)

第3周:Prompt Engineering 基础与进阶

日期 内容 目标 资源
第1天 提示词四要素:角色/任务/格式/示例 能写出结构化的高质量提示词 OpenAI Prompt Engineering Guide — 六大策略
第2天 零样本、少样本、思维链(CoT)提示 掌握Few-shot和CoT技巧 吴恩达-ChatGPT Prompt Engineering for Developers 第4-5讲
第3天 思维树(ToT) & 自我一致性(Self-Consistency) 理解多路径推理方法 思维树论文 + 图解ToT
第4天 结构化输出:JSON/Markdown/XML格式控制 能稳定获取结构化数据 OpenAI JSON Mode
第5天 提示词审计与版本管理 学会追踪和迭代提示词 LangSmith Tracing — 调试与追踪
第6天 工具调用基础(Function Calling) 让LLM调用外部工具/API OpenAI Function Calling
第7天 综合实践:用CoT+Few-shot解决一个复杂推理问题 巩固本周所学 实战:用GPT设计一个数学解题Agent

第4周:Prompt Engineering 高阶与项目实践

日期 内容 目标 资源
第1天 提示词注入与安全防护 了解Prompt Injection防御 提示词注入攻击与防御
第2天 系统提示词设计技巧 写出角色鲜明、边界清晰的系统提示 Anthropic:系统提示词最佳实践
第3天 对话上下文管理与Memory 实现多轮对话的短期/长期记忆 LangChain Memory模块
第4天 多模型对比与评估方法 能客观评估不同模型输出质量 LangChain Evaluation
第5天 实战项目:构建Prompt优化工作台(Web UI) 产出Prompt作品 用Streamlit + OpenAI API搭建
第6天 项目打磨与测试 完善项目 结合LangSmith追踪效果
第7天 周复习 + 学习笔记整理 巩固输出 整理本周笔记,发布到博客

第5周:企业级RAG应用开发(上)

日期 内容 目标 资源
第1天 RAG架构设计:检索+生成全流程 理解RAG基本原理 LangChain RAG from Scratch 第一篇
第2天 文档加载与解析:PDF/HTML/Markdown 能处理多种文档格式 LangChain Document Loaders
第3天 文档切分策略:递归/语义/父子切分 掌握不同切分场景选择 LangChain Text Splitters
第4天 向量数据库入门:FAISS vs Chroma vs Milvus 了解向量库选型 向量数据库Milvus中文教程
第5天 Embedding模型选型与文本向量化 会选择合适的向量化模型 MTEB Leaderboard
第6天 相似度检索与Top-K策略 理解检索参数影响 LangChain Vector Stores
第7天 综合实践:搭建一个PDF问答系统(基础版) 跑通RAG最小闭环 连接前面6天内容,用FAISS+LLM实现

第6周:企业级RAG应用开发(下)

日期 内容 目标 资源
第1天 混合检索:关键词(BM25)+向量双重检索 提升检索召回率 Elasticsearch混合检索
第2天 重排序(Re-ranking):Cross-Encoder精排 提升Top-K结果质量 Cohere Rerank + LangChain重排序
第3天 Query转换:HyDE / Multi-Query / 查询分解 解决用户查询不精确问题 LangChain Query Transformations
第4天 RAG评估:检索质量与生成质量指标 学会客观评估RAG系统 RAGAS评估框架
第5天 实战项目启动:企业知识库问答系统设计 完成系统架构设计 FastGPT中文指南 — 参考其架构
第6天 实战项目开发:数据入库 + 检索服务 实现核心检索功能 LangChain RAG实战
第7天 实战项目开发:问答接口 + 前端展示 完成可用Demo 用FastAPI+Streamlit搭建

第7周:RAG项目打磨与部署

日期 内容 目标 资源
第1天 RAG进阶:多模态RAG(图文检索) 拓展RAG到图片场景 Multimodal RAG with LangChain
第2天 Agent + RAG:让LLM自主决定检索时机 理解Agentic RAG LangGraph RAG Agent
第3天 日志与监控:LangSmith追踪RAG调用链 能Debug和优化RAG性能 LangSmith RAG Tracing
第4天 实战项目:优化企业知识库(增加重排序+混合检索) 提升项目质量 结合本周前三天内容优化
第5天 项目Docker化 + 部署文档 可部署、可演示 Docker Compose部署
第6天 项目测试 + Bug修复 确保稳定性 写测试用例 + 压力测试
第7天 周复习 + 学习笔记 + 项目展示 第二份核心作品完成 整理RAG项目笔记,发布博客

第三阶段:进阶技能(第8-12周)

第8周:AI Agent 入门与核心架构

日期 内容 目标 资源
第1天 Agent架构概述:ReAct / Plan-and-Execute 理解Agent基本运行逻辑 ReAct论文精读 + 图解ReAct
第2天 LangChain Agent + 工具链入门 构建第一个简单Agent LangChain Agent教程
第3天 Function Calling深度:多参数/嵌套工具 能编写复杂工具函数 OpenAI Tools详解
第4天 记忆系统:Buffer / Summary / VectorStore记忆 Agent能记住长对话 LangChain Memory Types
第5天 LangGraph入门:StateGraph / Node / Edge 理解有向图Agent编排 LangGraph Quickstart
第6天 Agent错误处理与重试机制 Agent更健壮 LangChain Agent Error Handling
第7天 综合实践:构建一个信息检索Agent 跑通Agent完整流程 结合本周所学,实现搜索+总结Agent

第9周:多Agent系统与项目实践

日期 内容 目标 资源
第1天 多Agent协作模式:Supervisor / Orcastrator / Debate 理解多Agent架构 AutoGPT源码分析 — 多Agent协作
第2天 LangGraph多Agent编排 能搭建2+ Agent协作系统 LangGraph Multi-Agent
第3天 Agent最佳实践:工具设计原则 设计高效工具 Anthropic Tool Use最佳实践
第4天 实战项目启动:Agent指令引擎设计 完成架构设计 设计一个可配置的指令解析执行Agent系统
第5天 实战项目开发:核心引擎 + 工具集实现 核心功能完成 实现工具注册、调度、执行模块
第6天 实战项目开发:前端交互界面 可交互Demo 用Gradio或Streamlit搭建交互界面
第7天 项目打磨 + 测试 第三份核心作品完成 写README,整理Demo部署

第10周:模型微调入门

日期 内容 目标 资源
第1天 微调基础:全量微调 vs 参数高效微调(PEFT) 理解微调基本原理 Hugging Face PEFT库入门
第2天 LoRA原理与实践:低秩适配矩阵 理解LoRA工作机制 李沐-LoRA论文精读 + LoRA论文
第3天 QLoRA:量化+LoRA双重压缩 能在消费级显卡上微调 QLoRA论文
第4天 数据集准备:格式转换、清洗、分割 会准备训练数据 Hugging Face Datasets库
第5天 数据增强与指令数据集构建 能构建高质量指令集 Alpaca数据集格式
第6天 使用Unsloth/LLaMA-Factory进行微调 跑通微调流水线 LLaMA-Factory文档
第7天 微调评估:Loss曲线 + 人工评测 能评估微调效果 用测试集对比微调前后效果

第11周:分布式训练与行业微调项目

日期 内容 目标 资源
第1天 分布式训练基础:DeepSpeed ZeRO Stage 理解分布式训练原理 DeepSpeed文档
第2天 FSDP全分片数据并行 了解另一种分布式方案 PyTorch FSDP教程
第3天 模型合并与导出:LoRA权重合并 + GGUF格式转换 能部署微调后的模型 mergekit工具
第4天 实战项目启动:行业垂直模型微调 选择领域+收集数据 选定一个垂直领域(客服/法律/医疗等)
第5天 实战数据准备:爬取/整理/清洗/格式转换 构建领域数据集 参考OpenAssistant格式
第6天 实战微调训练 + 效果评估 产出垂直模型 在选定的领域数据上完成微调
第7天 项目打包 + 部署 + 笔记整理 第四份核心作品完成 整理微调全流程笔记,部署Demo

第12周:模型部署与推理优化

日期 内容 目标 资源
第1天 模型部署架构:API服务器设计模式 理解推理服务设计 vLLM官方文档-架构
第2天 模型量化:GPTQ / AWQ / GGUF对比 掌握不同量化方案选型 Hugging Face量化指南
第3天 vLLM部署:PagedAttention + 连续批处理 能部署高性能推理服务 vLLM快速部署
第4天 Hugging Face TGI部署方案 了解另一主流部署方案 Hugging Face TGI文档
第5天 TensorRT-LLM优化(可选+NVIDIA GPU) 了解极致优化方案 TensorRT-LLM快速入门
第6天 实战项目:模型高效推理服务化(基于vLLM或TGI) 第五份核心作品 将微调模型部署为API服务 + 设置监控
第7天 压力测试 + 性能调优 + 部署文档 可上线服务 用locust或wrk做压力测试

第四阶段:就业冲刺(第13-14周)

第13周:简历优化与作品集整理

日期 内容 目标 资源
第1天 简历诊断:分析目标岗位JD 明确简历修改方向 Boss直聘/拉勾搜索"AI大模型工程师"JD
第2天 简历优化:突出项目经验,弱化无关背景 产出高质量简历 参考大模型岗位简历模板
第3天 GitHub组织:README/Wiki/项目展示 GitHub有说服力 GitHub README最佳实践
第4天 在线Demo部署:将项目部署到云服务器 所有项目可在线演示 将RAG知识库/Agent/微调模型部署到阿里云
第5天 技术博客整理:将每周笔记发布到博客站 展示持续学习能力 精选10+篇高质量技术笔记发布
第6天 建立个人品牌:知乎/掘金/公众号同步 扩大技术影响力 将博客同步到各个平台
第7天 作品集自查清单 + 面试准备启动 作品集Ready 对照岗位要求检查技能树

第14周:面试冲刺

日期 内容 目标 资源
第1天 RAG方向高频面试题整理 能流利回答RAG问题 RAG面试题汇总
第2天 Agent方向高频面试题整理 能流利回答Agent问题 结合LangGraph/Semantic Kernel面经
第3天 微调与部署方向高频题整理 能流利回答训练部署问题 LLM面试八股文
第4天 模拟面试1:技术面(RAG+Agent) 实战演练 找朋友或AI做模拟面试官
第5天 模拟面试2:系统设计面(架构设计) 实战演练 设计一个企业级AI问答系统
第6天 模拟面试3:项目深挖(项目细节) 能深入讲解项目 准备好每个项目的技术难点和亮点
第7天 查漏补缺 + 心态调整 + 投简历启动 准备好求职 对自己的技能树做最后复盘

✅ 推荐学习顺序与产出节奏

第1周 Python → 第2周 Linux+项目
     ↓           ↓
第3周 Prompt → 第5周 RAG知识库
     ↓           ↓
第8周 Agent → 第10周 模型微调
     ↓           ↓
第12周 部署优化 → 第13周 就业冲刺

每周必做

关键里程碑


按日拆分,每天有明确目标、内容和对应资源。祝你学习顺利!🚀