分布式 RAG 流水线#

本教程涵盖使用 Ray 的端到端检索增强生成 (RAG) 流水线,从数据摄取和 LLM 部署到提示工程、评估以及应用程序中所有工作负载的扩展。

Notebooks#

  1. 01_(Optional)_Regular_Document_Processing_Pipeline.ipynb
    演示了一个基准文档处理工作流,用于在 RAG 之前进行文本提取、清理和索引。

  2. 02_Scalable_RAG_Data_Ingestion_with_Ray_Data.ipynb
    展示了如何使用 Ray Data 构建高吞吐量的 RAG 数据摄取流水线。

  3. 03_Deploy_LLM_with_Ray_Serve.ipynb
    指导您使用 Ray Serve 对大型语言模型进行容器化并大规模部署。

  4. 04_Build_Basic_RAG_Chatbot
    结合您的索引文档和已部署的 LLM,创建一个简单、交互式的 RAG 聊天机器人。

  5. 05_Improve_RAG_with_Prompt_Engineering
    探索提示工程技术,以提高 RAG 回复的相关性和准确性。

  6. 06_(Optional)_Evaluate_RAG_with_Online_Inference
    提供通过实时查询和指标跟踪来评估 RAG 质量的方法。

  7. 07_Evaluate_RAG_with_Ray_Data_LLM_Batch_inference
    使用 Ray Data + LLM 批处理推理来实现 RAG 输出的大规模批处理评估。


注意: 标记为“(可选)”的 Notebook 涵盖了补充主题,如果您想专注于核心 RAG 流程,可以跳过它们。