侧边栏壁纸
  • 累计撰写 9 篇文章
  • 累计创建 4 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

AI大模型学习路径

温馨提示:
部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

一、AI 及 LLM 基础

1. AI 领域基础概念

学习目标:建立对AI和LLM的基础理解,了解主要的机器学习和神经网络模型,掌握API调用方法。

  • AI, NL/NLU/NLG
  • 机器学习:学习方法,拟合评估
  • 神经网络:CNN, RNN, Transformer
  • Transformer, BERT 架构简介
  • LLM, Generative AI
  • OpenAI 及其他常用大模型介绍演示
  • 参数详解:max_tokens, temperature, n, top_p, presence_penalty, frequency_penalty
  • API Key
  • OpenAI API 调用

2. OpenAI 开发

学习目标:学会使用OpenAI API开发聊天机器人,理解API的参数和计费,掌握不同API调用方法。

  • OpenAI API 参数,Token,计费
  • Rest API 调用(Postman):Model, Chat, Audio, Images, Embedding
  • Python API 调用
  • Tool calls
  • 调用具有视觉的 GPT-4o
  • 使用本地图片
  • JSON 模式
  • seed 可重现输出
  • 使用代码统计 token 数量
  • 开发控制台循环聊天
  • 管理对话 token:实现基于最大 token 数量的消息列表限制
  • 带会话长度管理的控制台循环聊天
  • 带会话长度管理的控制台 Chatbot 示例

3. 支持多模态输入的 AI Chatbot App

学习目标:开发支持图片等多模态输入的Chatbot应用,优化代码结构以提高开发效率。

  • 开发基于 Streamlit 和 OpenAI 大模型的 Chatbot App
  • 支持图片的多模态输入
  • Python 项目代码结构优化
  • 基于 Streamlit 的 Web UI 多模态 Chatbot

4. Prompt Engineering 提示词工程

学习目标:学习如何设计高效的Prompt以获得最佳模型输出结果,深入掌握Prompt Engineering技巧,提升与大模型的交互质量。

从事岗位:提示词工程师(15K-30K)

  • Prompt engineering 介绍
  • 最佳实践
  • Zero-shot, Few-shot
  • CoT, ReAct, Reflexion
  • Prompt Chaining
  • 结构化输出
  • Prompt 应用:数据,代码,函数,分类,创意,生成,汇总
  • 风险与安全
  • gpt-4-version 图像提示工程技术

二、LangChain 开发

1. LangChain 基础

学习目标:掌握LangChain的基本用法,理解如何在复杂任务中使用该框架。

  • LangChain 模块和体系
  • LLM & Chat models
  • PromptTemplates, OutputParsers
  • Chains
  • LCEL & Runnable interface
  • LLM apps debug: Verbose, Debug Mode & LangSmith Tracing

2. LangChain Chat Model

学习目标:能够使用LangChain开发具有记忆功能的Chatbot。

  • Prompt templates: Few shot
  • LangServe
  • 为 Chain 添加 Message history(Memory)
  • 单行初始化 chat model
  • 基于 LangChain 的 Chatbot: Chat History
  • Track token usage
  • Cache model responses

3. LangChain Tools & Agent

学习目标:深入学习LangChain的工具和Agent,包括数据处理、任务管理、插件使用等。

  • Multimode 集成
  • Output parsers: JSON, XML, YAML
  • 自定义 Tools,调用 Tools
  • 集成内建 Tools
  • 创建和运行 Agent

4. Embedding & Vector Store

学习目标:掌握如何使用Embedding模型和向量数据库进行高效的信息检索。

  • Embedding models
  • Vector stores 向量数据库: Chroma, Weaviate, Qdrant, Milvus, Pinecone, FAISS, Lance
  • Similarity search
  • 向量检索: Documents, Retrievers
  • 基于 LangChain 构建向量存储和查询
  • 开发基于 Embedding 的意图匹配和问答实例

5. RAG 专题

学习目标:理解RAG工作机制,学会使用文档加载器和文本分割器处理数据,学习如何结合检索和生成模型来处理复杂的任务。

  • RAG 简介
  • Document loaders: CSV, HTML, JSON, Markdown, PDF
  • Text splitters: recursively, HTML, code, Markdown, JSON, semantic chunks, tokens
  • Loader, Splitter, Embedding, Vector Store, Retrievers 的综合应用

6. 自定义组件专题

学习目标:掌握回调处理和自定义模型的开发。学会自定义组件以满足特定需求,增强模型的灵活性和功能性。

  • Callback 处理
  • 自定义 callback handlers
  • 自定义 Chat model
  • 自定义 RAG: Retriever, document loader

7. 基于 LangChain 的常用案例实战

学习目标:掌握使用LangChain处理实际问题的方法,包括文档问答、数据查询和集成网络搜索功能。

  • PDF 文档问答
  • 基于 Web URL 的问答
  • 基于 SQL 的 CSV 数据分析问答
  • Web Search 集成

8. 带 RAG 的 Chatbot 实战

学习目标:构建一个具有复杂对话记录处理能力的Chatbot。

  • Chatbot Memory
  • RAG
  • Tools
  • 大对话记录处理
  • 带 RAG 的 Chatbot

9. LangGraph 开发实战

学习目标:掌握LangGraph的应用,理解如何通过图结构来增强模型的推理能力,学会构建复杂的多智能体系统。

  • LangGraph 核心组件: Graphs, State, Nodes, Edges, Send...
  • LangGraph 实现:可控性 Agent 框架,持久化,Human-in-the-loop,streaming,React agent
  • Agent 使用案例: Chatbots, Multi-Agent Systems, RAG, Planning Agent...

三、LlamaIndex 开发

1. LlamaIndex 框架

学习目标:掌握LlamaIndex的核心模块和应用构建。

  • 与 LangChain 框架对比
  • 核心模块介绍: Models, Prompts, Loading, Indexing, Storing, Querying, Agent, Evaluation
  • RAG pipeline 构建: Loading, Indexing, Querying, Evaluating
  • Agent 构建

2. 基于 LlamaIndex 框架的应用

学习目标:基于LlamaIndex框架开发大规模文本搜索和内容推荐系统。

  • 大规模文本数据搜索
  • 内容推荐
  • AI 问答
  • LlamaIndex 与 LangChain 集成
  • LlamaIndex RAG CLI 工具

四、AutoGen 开发

1. AutoGen Studio

学习目标:学习使用AutoGen studio进行工作流设计与管理,理解其核心组件及功能。

  • AutoGen Studio UI
  • AutoGen Studio workflow
  • Python 集成 workflow

2. AutoGen Framework

学习目标:掌握AI代理的开发与集成,如何通过代理来增强模型的应用场景。使用AutoGen进行自动化代码生成和多智能体对话。

  • 快速入门
  • LLM 配置
  • Agent 类型:UserProxy, Assistant, ConversableAgent
  • Code Executors 自动化代码
  • Tool Use
  • GroupChat 多 Agent 对话

五、LLM 大模型训练与微调

从事岗位:AI大模型工程师(40K+)

1. 模型即服务共享平台

学习目标:学会使用共享平台和本地环境开发和部署大型语言模型。

  • Hugging Face, ModelScope 平台功能
  • 加载在线模型,离线模型
  • 模型推理调用
  • Transformers 使用
  • 利用模型完成任务:文本,语音,Embedding Models

2. 私有部署本地大模型

学习目标:掌握本地大模型的安装部署和调用。

  • 硬件配置分析(推理和微调)
  • 常用大模型选型: LlaMA 3, Gemma, Mistral...
  • 本地大模型安装部署
  • 本地大模型调用
  • 本地大模型与对话 APP 应用集成

3. 训练自己的大模型

学习目标:深入理解Transformer模型的工作原理,掌握大模型的训练流程和评估、量化技术。

  • Transformer 模型详解, Encoder, Decoder
  • 制作和加载数据集(训练、验证、测试)
  • 模型训练 Train(单卡,多卡),分布式训练
  • 模型评估:方法论、评估指标
  • 模型量化: AWQ, GPTQ, GGUF
  • 模型部署
  • API 调用

4. 大模型微调

学习目标:掌握基于预训练模型的微调技术,针对特定领域进行模型的训练与优化,构建专属行业模型。

  • 构建专属行业模型: 基于预训练大模型 Fine-tune
  • 微调对比: 提示工程, RAG, Fine-tuning 对比
  • Prompt Tuning, Prefix-Tuning, LoRA, QLoRA
  • 基于 OpenAI Fine-tuning
  • 本地大模型的 Fine-tuning

5. 特定任务的模型微调训练

  • 基于BERT的中文评价情感分析
  • 如何处理超长文本训练问题
  • GPT2-中文生成模型定制化微调训练
  • GPT2-中文生成模型定制化内容输出
  • LlaMA3大模型本地部署与调用
  • 使用自定义数据集和LlaMA-Factory完成LlaMA3微调训练
  • LlaMA3 LoRA微调测试评估、模型合并、量化
  • LoRA微调后的模型部署

6. 多模态大模型使用

  • 多模态大模型基本概念
  • 本地部署CogVideoX-5B文生视频模型
  • Llama 3.2-Vision模型架构剖析
  • Llama 3.2-Vision模型预期用途
  • 使用ollama部署Llama-3.2-11B-Vision-Instruct-GGUF实现视觉问答

六、企业级项目实战

学习目标:通过企业级真实项目场景落地,锤炼大模型全栈技术应用能力。完成AI应用从策划到开发到落地的全过程。

1. RAG项目实战(基于 LlamaIndex 构建企业私有知识库)

  • RAG项目背景介绍
  • 大模型企业级业务场景落地方案实践
  • 使用Conda配置项目环境
  • Sentence Transformer 模型详解
  • Embedding 文本向量化处理
  • InternLM2 1.8B / Qwen2.5_0.5B模型实战
  • 使用HuggingFace调用本地模型
  • 知识库模型问答测试与实际效果评估
  • 创建Web应用
  • 自定义知识库设置

2. 基于本地大模型的在线心理问诊系统(微调项目)

  • AI大模型项目开发流程
  • 基座模型选择
  • 训练数据集制作
  • Xtuner微调大模型
  • 模型评估
  • 模型量化 Weight Only
  • 模型部署,LMDeploy
  • 静态和动态推理性能
  • 推理服务 API Server
  • 服务部署
  • 模型转换与合并
  • 模型打包、部署

3. 基于YOLO的骨龄识别项目(视觉项目)

  • 目标侦测与图像识别概念
  • YOLO目标侦测架构分析
  • YOLO模型的基本使用
  • 目标侦测模型数据标注与模型训练
  • 使用自定义数据集完成YOLO的多目标侦测
  • 骨龄检测项目流程分析
  • voc数据集转为yolo数据集
  • 手骨关节检测模型
  • 骨龄分类模型
  • 整合目标检测与图像识别模型实现骨龄识别

4. 企业业务需求-政府招标采购项目(新)

  • 企业基础数据采集
  • 配置 Qwen2.5 3B模型
  • 数据集转换
  • 使用 Llama Factory 进行模型微调
  • open compass模型评估
  • 测试 Qwen2.5 3B 模型微调效果
  • 基于 LlamaIndex 实现 RAG
  • 模型训练获取标的物
  • 构建知识图谱“标的物”
  • 应用场景1:采购企业,热门采购物资市场查询
  • 应用场景2:供应商,查找采购企业
  • 应用场景3:技术研发、技术方向、设计材料

5. 基于大模型的语音唤醒项目实战(新)

  • 语音应用场景
  • PyTorch语音模块介绍
  • PyTorch解析音频数据
  • 使用 Wav2Vec2 实现语音识别

6. 其他

  • AI虚拟数字人项目正在测试阶段...
  • 更多AI大模型项目每期持续增加中...

七、前沿技术扩展

学习目标:了解并掌握AI领域的前沿技术,包括语音识别、图像处理、目标检测和多模态学习。

1. OpenAI Assistants 开发

  • Assistant 关键组件
  • 创建 Assistant, Thread, 消息处理
  • 工具集成: Code interpreter, Function calling, File search
  • Vector store
  • Preview

2. 音频模型专题

  • Large Audio Language Model
  • 中英文语音识别
  • 语音翻译
  • 语音标题生成
  • 带词级时间戳的语音识别
  • 音频场景分类
  • 语音情绪识别
  • 问答

3. 人脸模型专题

  • Face detection Model
  • 人脸检测
  • 人脸活体
  • 人脸关键点
  • 人脸属性&表情,表情识别
  • 人脸识别,人脸认证、通行等

4. 图片处理模型专题

  • Text to Image/Stable Diffusion Model
  • Text-to-Image Diffusion Models 扩散模型
  • 文生图模型的应用场景: 中英文图像生成, 卡通系列, 漫画风, 水彩风, 剪切画生成
  • 抠图
  • stable video diffusion 视频生成模型
  • 图片生成视频
  • 画质增强, 人像修复, 图像去模糊, 去噪

5. 检测模型应用专题

  • Object Detection Model
  • 垂直类检测: 安全帽, 香烟, 口罩, 人体, 人头
  • 视频目标检测跟踪: 自动驾驶, 交通标志, 行人
  • 行为检测
  • 关键点检测: 人脸, 人手, 人体

6. 行业信息处理专题

  • StructBERT Model
  • 零样本学习: 抽取式, 生成式
  • 信息抽取: 分词, 词性标注, 命名实体识别, 关系抽取, 事件抽取, 关键词抽取, 匹配, 分类, 指代消解, 阅读理解

7. 多模态应用专题

  • MultiModal
  • 图像描述
  • 视频描述
  • 视觉定位
  • 文本生成图片
  • 文本生成视频
  • 多模态表征

8. 其他

  • 更多AI前沿技术持续更新中...
0

评论区