📚 14周AI大模型工程师学习计划
从基础入门到就业冲刺,系统化学习路径
第一阶段:基础入门(第1-2周)
第1周:Python For AI + 开发环境
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | Python数据类型、变量、运算符 | 掌握基础语法 | Python官方教程-入门 |
| 第2天 | 控制流(if/for/while)、函数定义 | 能独立写简单脚本 | 菜鸟教程-Python3 控制流 |
| 第3天 | Numpy数组创建、索引、矩阵运算 | 理解张量基础概念 | Numpy快速入门 + 李沐《动手学深度学习》预备知识 |
| 第4天 | Pandas Series/DataFrame、数据清洗 | 会做基本数据处理 | Pandas 10分钟入门 |
| 第5天 | 面向对象编程:类、继承、封装 | 理解OOP思想 | Python官方-OOP教程 |
| 第6天 | Git版本控制:init/add/commit/push/branch | 能提交代码到GitHub | GitHub Git入门 |
| 第7天 | Anaconda环境配置 + CUDA检测 + Python包管理 | 跑通第一个LLM调用 | Miniconda安装指南 + HuggingFace快速入门 |
第2周:Linux基础 + 本地问答机器人
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | Linux文件系统、cd/ls/mkdir/cp/mv/rm | 掌握基本命令行操作 | Linux命令大全-文件管理 |
| 第2天 | vim编辑器、权限管理(chmod/chown)、进程管理(ps/top) | 能编辑配置、管理进程 | 鸟哥的Linux私房菜-文件权限 |
| 第3天 | Docker安装、镜像拉取(pull/run/exec) | 理解容器基本概念 | Docker从入门到实践-安装与镜像 |
| 第4天 | Dockerfile编写、docker-compose多容器编排 | 能部署简单服务 | Docker从入门到实践-Dockerfile |
| 第5天 | Ollama安装 + 模型下载(qwen2/llama3) | 本地运行大模型 | Ollama官方文档 + Ollama模型库 |
| 第6天 | 用Python调用Ollama API + Streamlit构建聊天界面 | 搭建简易问答机器人 | Ollama Python库 + Streamlit教程 |
| 第7天 | 整合项目:完善本地问答机器人 + Docker部署 | 产出第一个完整项目 | 结合前6天内容,参考Ollama+LangChain教程 |
第二阶段:核心技能(第3-7周)
第3周:Prompt Engineering 基础与进阶
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | 提示词四要素:角色/任务/格式/示例 | 能写出结构化的高质量提示词 | OpenAI Prompt Engineering Guide — 六大策略 |
| 第2天 | 零样本、少样本、思维链(CoT)提示 | 掌握Few-shot和CoT技巧 | 吴恩达-ChatGPT Prompt Engineering for Developers 第4-5讲 |
| 第3天 | 思维树(ToT) & 自我一致性(Self-Consistency) | 理解多路径推理方法 | 思维树论文 + 图解ToT |
| 第4天 | 结构化输出:JSON/Markdown/XML格式控制 | 能稳定获取结构化数据 | OpenAI JSON Mode |
| 第5天 | 提示词审计与版本管理 | 学会追踪和迭代提示词 | LangSmith Tracing — 调试与追踪 |
| 第6天 | 工具调用基础(Function Calling) | 让LLM调用外部工具/API | OpenAI Function Calling |
| 第7天 | 综合实践:用CoT+Few-shot解决一个复杂推理问题 | 巩固本周所学 | 实战:用GPT设计一个数学解题Agent |
第4周:Prompt Engineering 高阶与项目实践
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | 提示词注入与安全防护 | 了解Prompt Injection防御 | 提示词注入攻击与防御 |
| 第2天 | 系统提示词设计技巧 | 写出角色鲜明、边界清晰的系统提示 | Anthropic:系统提示词最佳实践 |
| 第3天 | 对话上下文管理与Memory | 实现多轮对话的短期/长期记忆 | LangChain Memory模块 |
| 第4天 | 多模型对比与评估方法 | 能客观评估不同模型输出质量 | LangChain Evaluation |
| 第5天 | 实战项目:构建Prompt优化工作台(Web UI) | 产出Prompt作品 | 用Streamlit + OpenAI API搭建 |
| 第6天 | 项目打磨与测试 | 完善项目 | 结合LangSmith追踪效果 |
| 第7天 | 周复习 + 学习笔记整理 | 巩固输出 | 整理本周笔记,发布到博客 |
第5周:企业级RAG应用开发(上)
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | RAG架构设计:检索+生成全流程 | 理解RAG基本原理 | LangChain RAG from Scratch 第一篇 |
| 第2天 | 文档加载与解析:PDF/HTML/Markdown | 能处理多种文档格式 | LangChain Document Loaders |
| 第3天 | 文档切分策略:递归/语义/父子切分 | 掌握不同切分场景选择 | LangChain Text Splitters |
| 第4天 | 向量数据库入门:FAISS vs Chroma vs Milvus | 了解向量库选型 | 向量数据库Milvus中文教程 |
| 第5天 | Embedding模型选型与文本向量化 | 会选择合适的向量化模型 | MTEB Leaderboard |
| 第6天 | 相似度检索与Top-K策略 | 理解检索参数影响 | LangChain Vector Stores |
| 第7天 | 综合实践:搭建一个PDF问答系统(基础版) | 跑通RAG最小闭环 | 连接前面6天内容,用FAISS+LLM实现 |
第6周:企业级RAG应用开发(下)
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | 混合检索:关键词(BM25)+向量双重检索 | 提升检索召回率 | Elasticsearch混合检索 |
| 第2天 | 重排序(Re-ranking):Cross-Encoder精排 | 提升Top-K结果质量 | Cohere Rerank + LangChain重排序 |
| 第3天 | Query转换:HyDE / Multi-Query / 查询分解 | 解决用户查询不精确问题 | LangChain Query Transformations |
| 第4天 | RAG评估:检索质量与生成质量指标 | 学会客观评估RAG系统 | RAGAS评估框架 |
| 第5天 | 实战项目启动:企业知识库问答系统设计 | 完成系统架构设计 | FastGPT中文指南 — 参考其架构 |
| 第6天 | 实战项目开发:数据入库 + 检索服务 | 实现核心检索功能 | LangChain RAG实战 |
| 第7天 | 实战项目开发:问答接口 + 前端展示 | 完成可用Demo | 用FastAPI+Streamlit搭建 |
第7周:RAG项目打磨与部署
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | RAG进阶:多模态RAG(图文检索) | 拓展RAG到图片场景 | Multimodal RAG with LangChain |
| 第2天 | Agent + RAG:让LLM自主决定检索时机 | 理解Agentic RAG | LangGraph RAG Agent |
| 第3天 | 日志与监控:LangSmith追踪RAG调用链 | 能Debug和优化RAG性能 | LangSmith RAG Tracing |
| 第4天 | 实战项目:优化企业知识库(增加重排序+混合检索) | 提升项目质量 | 结合本周前三天内容优化 |
| 第5天 | 项目Docker化 + 部署文档 | 可部署、可演示 | Docker Compose部署 |
| 第6天 | 项目测试 + Bug修复 | 确保稳定性 | 写测试用例 + 压力测试 |
| 第7天 | 周复习 + 学习笔记 + 项目展示 | 第二份核心作品完成 | 整理RAG项目笔记,发布博客 |
第三阶段:进阶技能(第8-12周)
第8周:AI Agent 入门与核心架构
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | Agent架构概述:ReAct / Plan-and-Execute | 理解Agent基本运行逻辑 | ReAct论文精读 + 图解ReAct |
| 第2天 | LangChain Agent + 工具链入门 | 构建第一个简单Agent | LangChain Agent教程 |
| 第3天 | Function Calling深度:多参数/嵌套工具 | 能编写复杂工具函数 | OpenAI Tools详解 |
| 第4天 | 记忆系统:Buffer / Summary / VectorStore记忆 | Agent能记住长对话 | LangChain Memory Types |
| 第5天 | LangGraph入门:StateGraph / Node / Edge | 理解有向图Agent编排 | LangGraph Quickstart |
| 第6天 | Agent错误处理与重试机制 | Agent更健壮 | LangChain Agent Error Handling |
| 第7天 | 综合实践:构建一个信息检索Agent | 跑通Agent完整流程 | 结合本周所学,实现搜索+总结Agent |
第9周:多Agent系统与项目实践
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | 多Agent协作模式:Supervisor / Orcastrator / Debate | 理解多Agent架构 | AutoGPT源码分析 — 多Agent协作 |
| 第2天 | LangGraph多Agent编排 | 能搭建2+ Agent协作系统 | LangGraph Multi-Agent |
| 第3天 | Agent最佳实践:工具设计原则 | 设计高效工具 | Anthropic Tool Use最佳实践 |
| 第4天 | 实战项目启动:Agent指令引擎设计 | 完成架构设计 | 设计一个可配置的指令解析执行Agent系统 |
| 第5天 | 实战项目开发:核心引擎 + 工具集实现 | 核心功能完成 | 实现工具注册、调度、执行模块 |
| 第6天 | 实战项目开发:前端交互界面 | 可交互Demo | 用Gradio或Streamlit搭建交互界面 |
| 第7天 | 项目打磨 + 测试 | 第三份核心作品完成 | 写README,整理Demo部署 |
第10周:模型微调入门
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | 微调基础:全量微调 vs 参数高效微调(PEFT) | 理解微调基本原理 | Hugging Face PEFT库入门 |
| 第2天 | LoRA原理与实践:低秩适配矩阵 | 理解LoRA工作机制 | 李沐-LoRA论文精读 + LoRA论文 |
| 第3天 | QLoRA:量化+LoRA双重压缩 | 能在消费级显卡上微调 | QLoRA论文 |
| 第4天 | 数据集准备:格式转换、清洗、分割 | 会准备训练数据 | Hugging Face Datasets库 |
| 第5天 | 数据增强与指令数据集构建 | 能构建高质量指令集 | Alpaca数据集格式 |
| 第6天 | 使用Unsloth/LLaMA-Factory进行微调 | 跑通微调流水线 | LLaMA-Factory文档 |
| 第7天 | 微调评估:Loss曲线 + 人工评测 | 能评估微调效果 | 用测试集对比微调前后效果 |
第11周:分布式训练与行业微调项目
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | 分布式训练基础:DeepSpeed ZeRO Stage | 理解分布式训练原理 | DeepSpeed文档 |
| 第2天 | FSDP全分片数据并行 | 了解另一种分布式方案 | PyTorch FSDP教程 |
| 第3天 | 模型合并与导出:LoRA权重合并 + GGUF格式转换 | 能部署微调后的模型 | mergekit工具 |
| 第4天 | 实战项目启动:行业垂直模型微调 | 选择领域+收集数据 | 选定一个垂直领域(客服/法律/医疗等) |
| 第5天 | 实战数据准备:爬取/整理/清洗/格式转换 | 构建领域数据集 | 参考OpenAssistant格式 |
| 第6天 | 实战微调训练 + 效果评估 | 产出垂直模型 | 在选定的领域数据上完成微调 |
| 第7天 | 项目打包 + 部署 + 笔记整理 | 第四份核心作品完成 | 整理微调全流程笔记,部署Demo |
第12周:模型部署与推理优化
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | 模型部署架构:API服务器设计模式 | 理解推理服务设计 | vLLM官方文档-架构 |
| 第2天 | 模型量化:GPTQ / AWQ / GGUF对比 | 掌握不同量化方案选型 | Hugging Face量化指南 |
| 第3天 | vLLM部署:PagedAttention + 连续批处理 | 能部署高性能推理服务 | vLLM快速部署 |
| 第4天 | Hugging Face TGI部署方案 | 了解另一主流部署方案 | Hugging Face TGI文档 |
| 第5天 | TensorRT-LLM优化(可选+NVIDIA GPU) | 了解极致优化方案 | TensorRT-LLM快速入门 |
| 第6天 | 实战项目:模型高效推理服务化(基于vLLM或TGI) | 第五份核心作品 | 将微调模型部署为API服务 + 设置监控 |
| 第7天 | 压力测试 + 性能调优 + 部署文档 | 可上线服务 | 用locust或wrk做压力测试 |
第四阶段:就业冲刺(第13-14周)
第13周:简历优化与作品集整理
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | 简历诊断:分析目标岗位JD | 明确简历修改方向 | Boss直聘/拉勾搜索"AI大模型工程师"JD |
| 第2天 | 简历优化:突出项目经验,弱化无关背景 | 产出高质量简历 | 参考大模型岗位简历模板 |
| 第3天 | GitHub组织:README/Wiki/项目展示 | GitHub有说服力 | GitHub README最佳实践 |
| 第4天 | 在线Demo部署:将项目部署到云服务器 | 所有项目可在线演示 | 将RAG知识库/Agent/微调模型部署到阿里云 |
| 第5天 | 技术博客整理:将每周笔记发布到博客站 | 展示持续学习能力 | 精选10+篇高质量技术笔记发布 |
| 第6天 | 建立个人品牌:知乎/掘金/公众号同步 | 扩大技术影响力 | 将博客同步到各个平台 |
| 第7天 | 作品集自查清单 + 面试准备启动 | 作品集Ready | 对照岗位要求检查技能树 |
第14周:面试冲刺
| 日期 | 内容 | 目标 | 资源 |
|---|---|---|---|
| 第1天 | RAG方向高频面试题整理 | 能流利回答RAG问题 | RAG面试题汇总 |
| 第2天 | Agent方向高频面试题整理 | 能流利回答Agent问题 | 结合LangGraph/Semantic Kernel面经 |
| 第3天 | 微调与部署方向高频题整理 | 能流利回答训练部署问题 | LLM面试八股文 |
| 第4天 | 模拟面试1:技术面(RAG+Agent) | 实战演练 | 找朋友或AI做模拟面试官 |
| 第5天 | 模拟面试2:系统设计面(架构设计) | 实战演练 | 设计一个企业级AI问答系统 |
| 第6天 | 模拟面试3:项目深挖(项目细节) | 能深入讲解项目 | 准备好每个项目的技术难点和亮点 |
| 第7天 | 查漏补缺 + 心态调整 + 投简历启动 | 准备好求职 | 对自己的技能树做最后复盘 |
✅ 推荐学习顺序与产出节奏
第1周 Python → 第2周 Linux+项目
↓ ↓
第3周 Prompt → 第5周 RAG知识库
↓ ↓
第8周 Agent → 第10周 模型微调
↓ ↓
第12周 部署优化 → 第13周 就业冲刺
每周必做
- 每天:按计划完成当日学习 + 动手实践
- 每周产出:至少一篇学习笔记/博客
- 每阶段产出:一个可部署的完整项目
- 总产出:5个核心作品 + 15+篇技术笔记
关键里程碑
- 第2周末:本地问答机器人 ✅
- 第7周末:企业级RAG知识库系统
- 第9周末:Agent指令引擎
- 第11周末:行业垂直微调模型
- 第12周末:模型推理服务
- 第14周末:简历+作品集+面试就绪 🚀
按日拆分,每天有明确目标、内容和对应资源。祝你学习顺利!🚀