#
向量存储 / RAG
使用检索增强生成提升AI的知识能力。
#
📚 功能介绍
RAG(Retrieval-Augmented Generation)让AI能够:
- 检索相关文档
- 基于文档回答问题
- 扩展知识范围
- 提供有依据的回复
#
🗂️ Collections(集合)
#
创建集合
- 进入 设置 → 向量存储
- 点击 "新建集合"
- 命名集合
- 添加文档
#
添加文档
支持的格式:
- 纯文本 (.txt)
- Markdown (.md)
- PDF(部分支持)
#
✂️ 文档分块
文档会被分割成小块以便检索:
#
推荐设置
- 块大小:200-500 tokens
- 重叠:10-20%
#
🔍 相似度搜索
当用户发送消息时:
- 消息被转换为向量
- 搜索最相关的文档块
- 将相关内容注入上下文
- AI基于这些内容回复
#
🎯 提示词集成
#
自动注入
开启后,相关文档会自动添加到提示词中。
#
注入位置
可以选择注入位置:
- 系统提示后
- 用户消息前
- 自定义位置
#
检索数量
设置检索多少个相关块:
- 推荐:3-5个
- 过多可能占用上下文
#
📤 导入/导出
#
导出集合
以JSON格式导出,包含:
- 文档内容
- 向量索引
- 配置信息
#
导入集合
从JSON文件恢复集合。
#
💡 使用场景
为角色创建专属知识库,让AI能准确回答角色相关问题。
大量世界观设定可以存入向量库,按需检索。
存储故事大纲和章节,AI能保持一致性。
#
⚠️ 注意事项
- 向量计算需要时间
- 大量文档会占用存储
- 检索质量影响回答质量