📚 14周AI大模型工程师学习计划

从基础入门到就业冲刺，系统化学习路径

第一阶段：基础入门（第1-2周）

第1周：Python For AI + 开发环境

日期	内容	目标	资源
第1天	Python数据类型、变量、运算符	掌握基础语法	Python官方教程-入门
第2天	控制流（if/for/while）、函数定义	能独立写简单脚本	菜鸟教程-Python3 控制流
第3天	Numpy数组创建、索引、矩阵运算	理解张量基础概念	Numpy快速入门 + 李沐《动手学深度学习》预备知识
第4天	Pandas Series/DataFrame、数据清洗	会做基本数据处理	Pandas 10分钟入门
第5天	面向对象编程：类、继承、封装	理解OOP思想	Python官方-OOP教程
第6天	Git版本控制：init/add/commit/push/branch	能提交代码到GitHub	GitHub Git入门
第7天	Anaconda环境配置 + CUDA检测 + Python包管理	跑通第一个LLM调用	Miniconda安装指南 + HuggingFace快速入门

第2周：Linux基础 + 本地问答机器人

日期	内容	目标	资源
第1天	Linux文件系统、cd/ls/mkdir/cp/mv/rm	掌握基本命令行操作	Linux命令大全-文件管理
第2天	vim编辑器、权限管理(chmod/chown)、进程管理(ps/top)	能编辑配置、管理进程	鸟哥的Linux私房菜-文件权限
第3天	Docker安装、镜像拉取(pull/run/exec)	理解容器基本概念	Docker从入门到实践-安装与镜像
第4天	Dockerfile编写、docker-compose多容器编排	能部署简单服务	Docker从入门到实践-Dockerfile
第5天	Ollama安装 + 模型下载（qwen2/llama3）	本地运行大模型	Ollama官方文档 + Ollama模型库
第6天	用Python调用Ollama API + Streamlit构建聊天界面	搭建简易问答机器人	Ollama Python库 + Streamlit教程
第7天	整合项目：完善本地问答机器人 + Docker部署	产出第一个完整项目	结合前6天内容，参考Ollama+LangChain教程

第二阶段：核心技能（第3-7周）

第3周：Prompt Engineering 基础与进阶

日期	内容	目标	资源
第1天	提示词四要素：角色/任务/格式/示例	能写出结构化的高质量提示词	OpenAI Prompt Engineering Guide — 六大策略
第2天	零样本、少样本、思维链(CoT)提示	掌握Few-shot和CoT技巧	吴恩达-ChatGPT Prompt Engineering for Developers 第4-5讲
第3天	思维树(ToT) & 自我一致性(Self-Consistency)	理解多路径推理方法	思维树论文 + 图解ToT
第4天	结构化输出：JSON/Markdown/XML格式控制	能稳定获取结构化数据	OpenAI JSON Mode
第5天	提示词审计与版本管理	学会追踪和迭代提示词	LangSmith Tracing — 调试与追踪
第6天	工具调用基础(Function Calling)	让LLM调用外部工具/API	OpenAI Function Calling
第7天	综合实践：用CoT+Few-shot解决一个复杂推理问题	巩固本周所学	实战：用GPT设计一个数学解题Agent

第4周：Prompt Engineering 高阶与项目实践

日期	内容	目标	资源
第1天	提示词注入与安全防护	了解Prompt Injection防御	提示词注入攻击与防御
第2天	系统提示词设计技巧	写出角色鲜明、边界清晰的系统提示	Anthropic：系统提示词最佳实践
第3天	对话上下文管理与Memory	实现多轮对话的短期/长期记忆	LangChain Memory模块
第4天	多模型对比与评估方法	能客观评估不同模型输出质量	LangChain Evaluation
第5天	实战项目：构建Prompt优化工作台（Web UI）	产出Prompt作品	用Streamlit + OpenAI API搭建
第6天	项目打磨与测试	完善项目	结合LangSmith追踪效果
第7天	周复习 + 学习笔记整理	巩固输出	整理本周笔记，发布到博客

第5周：企业级RAG应用开发（上）

日期	内容	目标	资源
第1天	RAG架构设计：检索+生成全流程	理解RAG基本原理	LangChain RAG from Scratch 第一篇
第2天	文档加载与解析：PDF/HTML/Markdown	能处理多种文档格式	LangChain Document Loaders
第3天	文档切分策略：递归/语义/父子切分	掌握不同切分场景选择	LangChain Text Splitters
第4天	向量数据库入门：FAISS vs Chroma vs Milvus	了解向量库选型	向量数据库Milvus中文教程
第5天	Embedding模型选型与文本向量化	会选择合适的向量化模型	MTEB Leaderboard
第6天	相似度检索与Top-K策略	理解检索参数影响	LangChain Vector Stores
第7天	综合实践：搭建一个PDF问答系统（基础版）	跑通RAG最小闭环	连接前面6天内容，用FAISS+LLM实现

第6周：企业级RAG应用开发（下）

日期	内容	目标	资源
第1天	混合检索：关键词(BM25)+向量双重检索	提升检索召回率	Elasticsearch混合检索
第2天	重排序(Re-ranking)：Cross-Encoder精排	提升Top-K结果质量	Cohere Rerank + LangChain重排序
第3天	Query转换：HyDE / Multi-Query / 查询分解	解决用户查询不精确问题	LangChain Query Transformations
第4天	RAG评估：检索质量与生成质量指标	学会客观评估RAG系统	RAGAS评估框架
第5天	实战项目启动：企业知识库问答系统设计	完成系统架构设计	FastGPT中文指南 — 参考其架构
第6天	实战项目开发：数据入库 + 检索服务	实现核心检索功能	LangChain RAG实战
第7天	实战项目开发：问答接口 + 前端展示	完成可用Demo	用FastAPI+Streamlit搭建

第7周：RAG项目打磨与部署

日期	内容	目标	资源
第1天	RAG进阶：多模态RAG（图文检索）	拓展RAG到图片场景	Multimodal RAG with LangChain
第2天	Agent + RAG：让LLM自主决定检索时机	理解Agentic RAG	LangGraph RAG Agent
第3天	日志与监控：LangSmith追踪RAG调用链	能Debug和优化RAG性能	LangSmith RAG Tracing
第4天	实战项目：优化企业知识库（增加重排序+混合检索）	提升项目质量	结合本周前三天内容优化
第5天	项目Docker化 + 部署文档	可部署、可演示	Docker Compose部署
第6天	项目测试 + Bug修复	确保稳定性	写测试用例 + 压力测试
第7天	周复习 + 学习笔记 + 项目展示	第二份核心作品完成	整理RAG项目笔记，发布博客

第三阶段：进阶技能（第8-12周）

第8周：AI Agent 入门与核心架构

日期	内容	目标	资源
第1天	Agent架构概述：ReAct / Plan-and-Execute	理解Agent基本运行逻辑	ReAct论文精读 + 图解ReAct
第2天	LangChain Agent + 工具链入门	构建第一个简单Agent	LangChain Agent教程
第3天	Function Calling深度：多参数/嵌套工具	能编写复杂工具函数	OpenAI Tools详解
第4天	记忆系统：Buffer / Summary / VectorStore记忆	Agent能记住长对话	LangChain Memory Types
第5天	LangGraph入门：StateGraph / Node / Edge	理解有向图Agent编排	LangGraph Quickstart
第6天	Agent错误处理与重试机制	Agent更健壮	LangChain Agent Error Handling
第7天	综合实践：构建一个信息检索Agent	跑通Agent完整流程	结合本周所学，实现搜索+总结Agent

第9周：多Agent系统与项目实践

日期	内容	目标	资源
第1天	多Agent协作模式：Supervisor / Orcastrator / Debate	理解多Agent架构	AutoGPT源码分析 — 多Agent协作
第2天	LangGraph多Agent编排	能搭建2+ Agent协作系统	LangGraph Multi-Agent
第3天	Agent最佳实践：工具设计原则	设计高效工具	Anthropic Tool Use最佳实践
第4天	实战项目启动：Agent指令引擎设计	完成架构设计	设计一个可配置的指令解析执行Agent系统
第5天	实战项目开发：核心引擎 + 工具集实现	核心功能完成	实现工具注册、调度、执行模块
第6天	实战项目开发：前端交互界面	可交互Demo	用Gradio或Streamlit搭建交互界面
第7天	项目打磨 + 测试	第三份核心作品完成	写README，整理Demo部署

第10周：模型微调入门

日期	内容	目标	资源
第1天	微调基础：全量微调 vs 参数高效微调(PEFT)	理解微调基本原理	Hugging Face PEFT库入门
第2天	LoRA原理与实践：低秩适配矩阵	理解LoRA工作机制	李沐-LoRA论文精读 + LoRA论文
第3天	QLoRA：量化+LoRA双重压缩	能在消费级显卡上微调	QLoRA论文
第4天	数据集准备：格式转换、清洗、分割	会准备训练数据	Hugging Face Datasets库
第5天	数据增强与指令数据集构建	能构建高质量指令集	Alpaca数据集格式
第6天	使用Unsloth/LLaMA-Factory进行微调	跑通微调流水线	LLaMA-Factory文档
第7天	微调评估：Loss曲线 + 人工评测	能评估微调效果	用测试集对比微调前后效果

第11周：分布式训练与行业微调项目

日期	内容	目标	资源
第1天	分布式训练基础：DeepSpeed ZeRO Stage	理解分布式训练原理	DeepSpeed文档
第2天	FSDP全分片数据并行	了解另一种分布式方案	PyTorch FSDP教程
第3天	模型合并与导出：LoRA权重合并 + GGUF格式转换	能部署微调后的模型	mergekit工具
第4天	实战项目启动：行业垂直模型微调	选择领域+收集数据	选定一个垂直领域（客服/法律/医疗等）
第5天	实战数据准备：爬取/整理/清洗/格式转换	构建领域数据集	参考OpenAssistant格式
第6天	实战微调训练 + 效果评估	产出垂直模型	在选定的领域数据上完成微调
第7天	项目打包 + 部署 + 笔记整理	第四份核心作品完成	整理微调全流程笔记，部署Demo

第12周：模型部署与推理优化

日期	内容	目标	资源
第1天	模型部署架构：API服务器设计模式	理解推理服务设计	vLLM官方文档-架构
第2天	模型量化：GPTQ / AWQ / GGUF对比	掌握不同量化方案选型	Hugging Face量化指南
第3天	vLLM部署：PagedAttention + 连续批处理	能部署高性能推理服务	vLLM快速部署
第4天	Hugging Face TGI部署方案	了解另一主流部署方案	Hugging Face TGI文档
第5天	TensorRT-LLM优化（可选+NVIDIA GPU）	了解极致优化方案	TensorRT-LLM快速入门
第6天	实战项目：模型高效推理服务化（基于vLLM或TGI）	第五份核心作品	将微调模型部署为API服务 + 设置监控
第7天	压力测试 + 性能调优 + 部署文档	可上线服务	用locust或wrk做压力测试

第四阶段：就业冲刺（第13-14周）

第13周：简历优化与作品集整理

日期	内容	目标	资源
第1天	简历诊断：分析目标岗位JD	明确简历修改方向	Boss直聘/拉勾搜索"AI大模型工程师"JD
第2天	简历优化：突出项目经验，弱化无关背景	产出高质量简历	参考大模型岗位简历模板
第3天	GitHub组织：README/Wiki/项目展示	GitHub有说服力	GitHub README最佳实践
第4天	在线Demo部署：将项目部署到云服务器	所有项目可在线演示	将RAG知识库/Agent/微调模型部署到阿里云
第5天	技术博客整理：将每周笔记发布到博客站	展示持续学习能力	精选10+篇高质量技术笔记发布
第6天	建立个人品牌：知乎/掘金/公众号同步	扩大技术影响力	将博客同步到各个平台
第7天	作品集自查清单 + 面试准备启动	作品集Ready	对照岗位要求检查技能树

第14周：面试冲刺

日期	内容	目标	资源
第1天	RAG方向高频面试题整理	能流利回答RAG问题	RAG面试题汇总
第2天	Agent方向高频面试题整理	能流利回答Agent问题	结合LangGraph/Semantic Kernel面经
第3天	微调与部署方向高频题整理	能流利回答训练部署问题	LLM面试八股文
第4天	模拟面试1：技术面（RAG+Agent）	实战演练	找朋友或AI做模拟面试官
第5天	模拟面试2：系统设计面（架构设计）	实战演练	设计一个企业级AI问答系统
第6天	模拟面试3：项目深挖（项目细节）	能深入讲解项目	准备好每个项目的技术难点和亮点
第7天	查漏补缺 + 心态调整 + 投简历启动	准备好求职	对自己的技能树做最后复盘

✅ 推荐学习顺序与产出节奏

第1周 Python → 第2周 Linux+项目
     ↓           ↓
第3周 Prompt → 第5周 RAG知识库
     ↓           ↓
第8周 Agent → 第10周 模型微调
     ↓           ↓
第12周 部署优化 → 第13周 就业冲刺

每周必做

每天：按计划完成当日学习 + 动手实践
每周产出：至少一篇学习笔记/博客
每阶段产出：一个可部署的完整项目
总产出：5个核心作品 + 15+篇技术笔记

关键里程碑

第2周末：本地问答机器人 ✅
第7周末：企业级RAG知识库系统
第9周末：Agent指令引擎
第11周末：行业垂直微调模型
第12周末：模型推理服务
第14周末：简历+作品集+面试就绪 🚀

按日拆分，每天有明确目标、内容和对应资源。祝你学习顺利！🚀