首页
前端
后端
大模型
开源项目
创作者
极简笔记
累计撰写
56
篇文章
累计创建
5
个标签
累计收到
0
条评论
栏目
首页
前端
后端
大模型
开源项目
创作者
目 录
CONTENT
最新文章
2026-06-10
MHA、MQA 和 GQA 有什么区别
MHA(Multi-Head Attention,多头注意力)、MQA(Multi-Query Attention,多查询注意力)和 GQA(Grouped-Query Attention,分组查询注意力)是大型语言模型(LLM)中注意力机制的三种主要变体。 它们的核心区别在于 Query(查询)、
2026-06-10
4
0
1
2026-06-10
LlamaIndex核心概念:索引类型、检索策略与查询引擎的区别
这三个概念在LlamaIndex中扮演不同角色,共同构成RAG(检索增强生成)流程的核心链条:索引是数据的结构化存储形式 → 检索策略是从索引中查找相关内容的方法 → 查询引擎是封装检索与生成的完整问答接口。 一、Index(索引):数据的结构化存储形态 定义:索引是将原始文档(Documents)
2026-06-10
4
0
1
2026-06-10
LlamaIndex大厂面试题25道核心题型
在大厂的高级 AI 工程师或架构师面试中,面试官往往不会只考基础的 API 调用,而是直奔 系统设计、大规模生产环境下的性能瓶颈、以及复杂 RAG(检索增强生成)场景的落地优化。 为了帮你高效、高质地突击“八股文”,我将结合当前大厂(腾讯、阿里、字节、百度等)的核心高频考点,为你梳理出 LlamaI
2026-06-10
2
0
1
2026-06-10
LlamaIndex 索引类型详解
LlamaIndex 索引类型详解 前言 LlamaIndex 是一个强大的大语言模型数据框架,其核心能力之一是通过各种索引类型对非结构化数据进行组织和检索。不同的索引类型采用不同的数据结构和检索策略,适用于不同的应用场景。本文将基于 LlamaIndex 源码中实际导出的索引类型,全面详细地讲解每
2026-06-10
1
0
0
2026-06-10
LlamaIndex 核心包中 15 种分块策略完全指南
LlamaIndex 核心包中 15 种分块策略完全指南 在 RAG(检索增强生成)系统中,分块(Chunking)是影响检索质量最关键的一步。文本被切割成多大、怎么切,直接决定了嵌入向量的语义完整性和检索的准确性。 LlamaIndex 作为当前最流行的 RAG 框架,提供了非常丰富的分块策略。本
2026-06-10
1
0
0
2026-06-10
LlamaIndex 文档解析与分块策略深度解析
LlamaIndex 文档解析与分块策略深度解析 一、引言 在 RAG(Retrieval-Augmented Generation)系统中,文档解析与分块(Chunking)是决定检索质量和生成效果的关键环节。LlamaIndex 提供了一套层次分明、功能丰富的文档解析与分块体系,从最基础的文本切
2026-06-10
3
0
0
2026-06-10
LlamaIndex 支持哪些索引类型
LlamaIndex 支持的索引类型 根据 LlamaIndex 框架的文档和最新版本,主要支持以下几大类索引类型: 1. 基础索引类型 索引类型 说明 VectorStoreIndex(向量存储索引) 最核心、最常用的索引类型。将文档拆分为节点(Node)后,通过嵌入模型将节点转为向量,存入向量数
2026-06-10
1
0
0
2026-06-10
LlamaIndex NodeParser
2026-06-10
1
0
0
2026-06-10
ChromaDB 为何使用 SQLite 持久化
ChromaDB 为何使用 SQLite 持久化 ChromaDB 选择 SQLite 作为底层持久化引擎,是一个经过深思熟虑的架构决策。核心原因是 “小即是美”——在保持零依赖部署的同时获得足够的持久化能力。 核心原因 1. 零运维依赖(Embeddable Database) 传统向量数据库架构
2026-06-10
1
0
0
2026-06-10
2026.6.9原力健康 双非硕鼠鼠Agent开发凉经
# 2026.6.9原力健康 双非硕鼠鼠Agent开发凉经 1. 知识库的检索过程能介绍一下吗? 2. 你的原始知识来自哪里? 3. chunk 切片阶段有哪些优化手段? 4. 有没有专门解析这些文档的模型? 5. 向量化用的是什么模型? 6. 检索的时候也需要向量化吗? 7. 你会把用户问题进行改
2026-06-10
1
0
0
大模型
查看更多