精通-如何使用-有什么中文资料面包板社区

相关资源

[完结14章]RAG全栈技术从基础到精通，打造高精准AI应用

所需E币: 0

时间: 2025-4-14 09:25

大小: 3.21KB

上传者: huangyasir1990

一、RAG是什么？RAG是一种结合检索（Retrieval）和生成（Generation）的技术，主要用于让AI在回答问题或生成内容时，能够更好地利用外部知识库，而不是完全依赖于自身预训练的知识。简单来说，它就像是给AI配了一个“外挂”，让它在回答问题时可以先去知识库中查找相关的资料，然后再生成答案。二、RAG的工作原理RAG的工作可以分为三个阶段：（1）检索（Retrieval）用户提出问题后，RAG会先将问题转换成一个“向量”（一种数学表示），然后在知识库中查找最相关的向量。知识库中的内容会被提前处理成向量，并存储在一个叫“向量数据库”的地方。这个数据库可以根据语义理解来检索数据，而不是单纯靠关键词匹配。比如，你问“如何做巧克力蛋糕”，RAG会在知识库中找到与“巧克力蛋糕制作”最相关的资料片段。（2）增强（Augmented）找到相关资料后，RAG会把资料和用户的问题组合在一起，形成一个新的输入，送给大模型。这就好比你给AI提供了一个“提示”，让它在回答问题时有更具体的参考。（3）生成（Generation）最后，AI根据组合后的输入生成答案。因为有知识库的支持，生成的内容会更准确、更有针对性三、RAG的关键特性与挑战探讨了检索增强型生成（RAG）模型的核心要素和目标，详细分析了用户意图理解、知识检索、知识整合、答案生成和评估指标等关键环节。这些要素共同构成了RAG系统的框架，并揭示了其在自然语言处理任务中的重要性和面临的挑战。精准的用户意图理解准确理解用户意图是生成相关响应的关键，但用户查询的模糊性和多样性增加了理解难度，需借助文本建模、查询重写等策略提升意图理解的准确性。准确的知识检索知识检索为生成过程提供相关上下文，直接影响输出质量，但处理大规模数据集、平衡精确度与召回率以及应对动态数据源是其主要挑战，需优化检索算法并利用相关性反馈来解决。无缝的知识整合将外部知识与内部知识无缝整合是生成连贯输出的重要环节，面临处理不同数据类型、解决知识冲突和确保知识时效性的挑战，可通过多层整合策略灵活处理不同来源的知识。四、RAG训练分类：不更新数据存储的RAG训练：只更新RAG中每个模块的可训练参数，数据存储中的知识保持不变。更新数据存储的RAG训练：先更新数据存储中的知识，然后更新RAG中每个模块的参数。数据存储更新（RAGwithoutDatastoreUpdate）：检索器训练（TrainingRetriever）：训练检索器编码器并重建索引，通常涉及密集编码方法。根据训练目标，可能需要更换编码器或使用对比学习训练现有编码器。生成器训练（TrainingGenerator）：更新生成器的参数或检索融合模块中的参数。采用参数高效的微调技术，如LoRA，以解决大型语言模型（LLMs）的微调问题。联合训练检索器和生成器（JointlyTrainingRetrieverandGenerator）：同时训练检索器和生成器以提高下游任务的性能。确保从输入到输出的正向过程中的可微性，以实现端到端优化。数据存储更新（DatastoreUpdate）：种场景涉及两个阶段：更新知识库，然后训练检索器和生成器。更新知识库有三种情况，即用可训练的嵌入更新、用新值更新和用新语料库更新。在第一种情况下，值通常是可训练的嵌入，并且与RAG中的参数同时/异步更新。最后两种情况通常指的是用最新信息更新知识库。以问答语料库为例，用新值更新指的是更新现有问题的答案，而用新语料库更新指的是添加新的问答对。要更新现有键的值，首先需要查询现有的键值对，然后执行就地更新。对于新的语料库，数据存储首先需要执行插入操作，然后重建或更新新键的索引。更新数据存储后，训练检索器和生成器类似于没有数据存储更新的RAG。五、RAG技术原理拆解RAG=检索系统+生成模型的架构设计，打破了传统生成模型的闭门造车模式：1.检索模块（Retrieval）A、基于用户输入的问题，从知识库/文档集中检索相关片段B、采用**稠密向量检索（DenseRetrieval）**技术，通过语义相似度匹配内容C、主流工具：FAISS、Milvus等向量数据库2.生成模块（Generation）A、将检索结果与原始问题拼接输入生成模型B、支持动态知识融合，如使用**FiD（Fusion-in-Decoder）**架构C、典型模型：GPT-4、Llama2等大语言模型3.协同优化机制A、端到端联合训练检索器和生成器（如REALM模型）B、基于强化学习的反馈机制提升结果相关性六、工作流程：查询提交和评估：用户提交查询，协调代理（或主检索代理）接收查询并分析以确定最合适的信息源。知识源选择：根据查询类型，协调代理从多种检索选项中选择：结构化数据库：对于需要表格数据访问的查询，系统可能使用Text-to-SQL引擎与如PostgreSQL或MySQL等数据库交互。语义搜索：处理非结构化信息时，使用基于向量的检索获取相关文档（例如PDF、书籍、组织记录）。网络搜索：对于实时或广泛上下文信息，系统利用网络搜索工具访问最新的在线数据。推荐系统：对于个性化或上下文查询，系统利用推荐引擎提供定制化建议。数据整合和LLM合成：从选定源检索到的相关数据传递给大型语言模型（LLM）。LLM合成收集的信息，将多个来源的见解整合成连贯且上下文相关的回答。输出生成：系统最终生成一个全面的、面向用户的答案，以解决原始查询。此回答以可操作、简洁的格式呈现，可能包括对使用源的引用或引用。
RAG全栈技术从基础到精通，打造高精准AI应用

所需E币: 0

时间: 2025-3-4 13:49

大小: 3KB

上传者: huangyasir1990

一、什么是RAGRAG即“检索增强生成”（RetrievalAugmentedGeneration），这项技术通过将大量外部数据与基础模型相结合，显著增强了语言模型（LLM）的能力，使得AI的回应更加真实、个性化和可靠。RAG技术的核心在于结合了检索（Retrieval）和生成（Generation）两大核心技术。在处理复杂的查询和生成任务时，RAG首先通过检索模块从大量数据中找到与查询最相关的信息，然后生成模块会利用这些检索到的信息来构建回答或生成文本。自2020年提出以来，从最初的朴素RAG（NaiveRag），到高级RAG（AdvanceRag），再到模块化RAG（ModularRag），RAG系统不断优化和迭代，以解决实际应用中遇到的问题，如索引环节中的核心知识淹没问题、「检索环节中的用户意图理解不准确问题」，以及生成环节中的冗余信息干扰问题等二、GraphRAG框架的关键组件查询处理器（QueryProcessor）：负责预处理用户定义的查询，使其能够与图数据源进行交互。检索器（Retriever）：根据预处理后的查询从图数据源中检索相关内容。组织者（Organizer）：对检索到的内容进行整理和优化，以提高生成器的性能。生成器（Generator）：根据组织后的信息生成最终答案。三、企业大规模落地RAG核心问题经过了很长时间对RAG的研发，总结出了企业RAG落地的关键点，分别是效果、性能和成本。效果：今天很多企业并没有大规模的落地RAG，或者说是在一些关键场景上没有去使用RAG，是因为企业担心用了以后，会因为效果问题，影响他们核心场景的业务。所以效果问题是现在RAG落地最关键的因素。性能：在RAG链路里很多环节是需要使用大模型的，比如说向量化、文档解析，最后大模型的生成、大模型Agent等。这样整个链路多次调用大模型，会导致离线和在线性能都会有不同程度的下降。比如说像GraphRAG，一个30K的文档需要将近1个小时时间才能把数据处理好，这样的话很难在一个生产环境中去落地。成本：相对于其他的应用来说，RAG应用需要去多次调用大模型，而大模型背后就是GPU,但GPU资源是紧缺和昂贵的，这就不可避免的导致这类应用比其他应用的成本高很多，所以很多客户无法接受这个成本。四、RAG优化效果—数据提取和解析首先在效果层面，离线链路里第一个优化点就是文档解析。文档有很多格式，比如说PDF、Word、PPT,等等，还有一些结构化数据。然而最大的难点还是一些非结构化的文档，因为里面会有不同的内容。比如说像表格、图片，这些内容AI其实是很难理解的。在通过长期大量的优化以后，我们在搜索开放平台里面提供了文档解析服务，支持各种各样常见的文档格式和内容的解析。五、RAG优化效果—文本切片文档解析完，从文档里面能够正确的提取出内容后，接下来就可以进行文本切片。切片有很多种方法，最常见的有层次切分，把段落提取出来，对段落里面的内容再进行段落级的切片；还有多粒度切分，有时除了段落的切片，还可以增加单句的切片。这两种切片都是最常用的。另外对于一些场景，我们还可以进行基于大模型的语义切片，就是把文档的结构用大模型处理一遍，然后再提取一些更精细的文档结构。那么经过了多种切片以后，我们就可以继续进行向量化了。六、RAG评估纯检索指标精准率（Precision）：衡量信号与噪音的比例——检索到的相关文档/所有检索到的文档。召回率（Recall）：衡量完整性——检索到的相关文档/所有相关文档。我们认为召回率是检索领域的北极星指标。这是因为只有当我们有足够的信心，相信检索到的上下文完整到足以回答问题时，检索系统对于生成任务来说才是可接受的。F1分数：精确率和召回率的调和平均值。检索&重排指标平均倒数排名（MeanReciprocalRank,MRR）：MRR计算的是最相关文档的倒数排名的平均值。如果正确答案的排名是高的（即排名接近第一位），则倒数值会大。MRR值的范围是0到1，值越高表示检索系统性能越好。平均精确率均值（MeanAveragePrecision,MAP）：MAP首先计算每个查询的平均精确率，然后对所有查询的平均精确率进行平均。这里的“精确率”是指在每个排名阶段检索到的相关文档数量占到目前为止所有检索到的文档数量的比例。MAP考虑了所有相关文档，并且对检索结果的排序非常敏感，值越高，表示检索系统的排名性能越好。归一化折损累计增益（NormalizedDiscountedCumulativeGain,NDCG）：NDCG倾向于赋予排在前面的相关文档更高的权重，是一种位置敏感的度量方法。NDCG先计算一个未经归一化的折扣累积增益（DiscountedCumulativeGain,DCG），然后用这个值除以一个理想状态（即最佳排名顺序）下的DCG，从而得到归一化的值。NDCG的值范围在0到1之间，越接近1表示检索性能越佳，特别是在前面几个结果的质量方面。
112页！DeepSeek 7大场景+50大案例+全套提示词从入门到精通干货

所需E币: 5

时间: 2025-2-13 14:00

大小: 11.48MB

上传者: 二月半

112页！DeepSeek7大场景+50大案例+全套提示词从入门到精通干货
C语言从入门到精通（第4版）

所需E币: 3

时间: 2023-7-17 14:28

大小: 91.66MB

上传者: 小袁

C语言从入门到精通（第4版）
精通开关电源设计[中文版2008]_部分3.pdf

所需E币: 1

时间: 2023-7-3 10:42

大小: 4.03MB

上传者: 张红川

精通开关电源设计[中文版2008]_部分3.pdf
精通LabVIEW程序设计

所需E币: 2

时间: 2023-7-2 23:19

大小: 16.84MB

上传者: Argent

精通LabVIEW程序设计
[电子书]Python数据分析——从入门到精通.pdf

所需E币: 4

时间: 2023-6-22 17:33

大小: 284.97MB

上传者: 电子阔少

[电子书]Python数据分析——从入门到精通.pdf
ChatGPT从入门到精通

所需E币: 0

时间: 2023-6-6 17:50

大小: 33.93MB

上传者: 木头1233

ChatGPT从入门到精通ChatGPT从入门到精通
三菱plc从入门到精通

所需E币: 0

时间: 2023-6-4 17:27

大小: 1.07MB

上传者: 小宫

三菱plc从入门到精通,学PLC之路详解(附各种图例)免费下载.pdf
精通Rust（第2版）-[印度]Rahul Sharma&[芬兰]Vesa Kaihlavirta

所需E币: 1

时间: 2023-6-1 11:58

大小: 9.1MB

上传者: 无量头颅无量血

精通Rust（第2版）-[印度]RahulSharma&[芬兰]VesaKaihlavirta
《精通机器学习：MATLAB 分步实施指南》

所需E币: 5

时间: 2023-5-28 11:58

大小: 3.27MB

上传者: 木头1233

《精通机器学习：MATLAB分步实施指南》
Oracle从入门到精通-(程序员书库)-秦靖

所需E币: 1

时间: 2023-5-12 15:49

大小: 23.98MB

上传者: 无量头颅无量血

Oracle从入门到精通-(程序员书库)-秦靖
精通CSS：高级web标准解决方案（第2版）-(图灵程序设计丛书)-[英]Andy Budd

所需E币: 0

时间: 2023-5-12 11:02

大小: 21.19MB

上传者: 无量头颅无量血

精通CSS：高级web标准解决方案（第2版）-(图灵程序设计丛书)-[英]AndyBudd-SimonCollison-CameronMoll
玩转ECS从入门到精通：进阶篇-(阿里云开发者电子书系列)

所需E币: 1

时间: 2023-5-12 10:26

大小: 4.61MB

上传者: 无量头颅无量血

玩转ECS从入门到精通：进阶篇-(阿里云开发者电子书系列)
电子工程师从入门到精通-韩雪涛

所需E币: 1

时间: 2023-5-9 14:58

大小: 31.25MB

上传者: 无量头颅无量血

电子工程师从入门到精通-韩雪涛
AutoCAD 2022建筑设计从⼊⻔到精通(升级版)-陈晓东

所需E币: 1

时间: 2023-5-6 20:14

大小: 140.52MB

上传者: 无量头颅无量血

AutoCAD2022建筑设计从⼊⻔到精通(升级版)-陈晓东
AutoCAD 2022电⽓设计从⼊⻔到精通(升级版)-李诗洋

所需E币: 1

时间: 2023-5-6 20:17

大小: 66.63MB

上传者: 无量头颅无量血

AutoCAD2022电⽓设计从⼊⻔到精通(升级版)-李诗洋
精通CSS：高级Web标准解决方案（第3版）-(图灵程序设计丛书)-[英]Andy Budd

所需E币: 1

时间: 2023-5-9 10:04

大小: 58.72MB

上传者: 无量头颅无量血

精通CSS：高级Web标准解决方案（第3版）-(图灵程序设计丛书)-[英]AndyBudd&[瑞典]EmilBjörklund
FFmpeg从入门到精通-(电子与嵌入式系统设计丛书)-刘歧-赵文杰

所需E币: 1

时间: 2023-5-6 15:59

大小: 166.99MB

上传者: 无量头颅无量血

FFmpeg从入门到精通-(电子与嵌入式系统设计丛书)-刘歧-赵文杰
Premiere Pro 2020中⽂版⼊⻔、精通与实战

所需E币: 1

时间: 2023-5-6 15:56

大小: 181.96MB

上传者: 无量头颅无量血

PremierePro2020中⽂版⼊⻔、精通与实战

更多...

标签: 精通