做设计太依赖网站素材网站建设关键词优化

张小明 2025/12/28 6:15:23
做设计太依赖网站素材,网站建设关键词优化,江苏工程建设信息官方网站,太原关键词排名首页1 介绍 本文全面回顾了当前最先进的RAG技术#xff0c;包括朴素RAG、进阶RAG和模块RAG等范式#xff0c;并置于LLM背景下。文章讨论了RAG过程中的核心技术#xff0c;如“检索”、“生成”和“增强”#xff0c;并深入探讨了它们的协同作用。此外#xff0c;文章还构建了…1 介绍本文全面回顾了当前最先进的RAG技术包括朴素RAG、进阶RAG和模块RAG等范式并置于LLM背景下。文章讨论了RAG过程中的核心技术如“检索”、“生成”和“增强”并深入探讨了它们的协同作用。此外文章还构建了一个全面的评估框架概述了评估目标和度量标准并进行了比较分析阐明了RAG的优缺点。最后文章预测了RAG的未来发展方向强调了解决当前挑战的潜在增强、多模式设置的扩展以及其生态系统的发展。图1 RAG技术发展科技树2 定义RAG是一种通过整合外部知识库来增强LLM的性能的模式采用协同方法结合信息检索机制和上下文学习来提高LLM的性能。其工作流程包括三个关键步骤将语料库划分为离散块构建向量索引并根据与查询和索引块的向量相似性来识别和检索块。这些步骤支持其信息检索和上下文感知生成能力。RAG已成为LLMs系统中最受欢迎的架构之一许多对话产品几乎完全基于RAG构建。图 2 RAG 技术在 QA 问题中的案例3 RAG框架在RAG的技术演进历程中基于技术范式的考量我们将其划分为以下几个发展阶段朴素RAG、进阶RAG和模块RAG。3.1 朴素RAG朴素RAG研究范式是一种早期的方法学用于处理自然语言生成任务。它包括索引、检索和生成三个阶段。索引阶段从原始数据中提取文本并将其转化为向量表示以便于检索和生成。检索阶段计算查询向量与索引语料库中向量化的块之间的相似度分数并优先检索出最相似的块作为扩展上下文的基础。生成阶段将查询和选定的文档合成一个连贯的提示并要求大型语言模型根据提示来制定响应。这种方法允许模型利用其内在的参数知识或将其响应限制在提供文档中所包含的信息。Naive RAG在检索、生成和增强三个关键领域面临挑战包括精度低、召回率低、幻觉挑战、难以结合上下文、重复冗余、平衡段落价值、协调写作风格和语气、过度依赖增强信息等。这些问题影响了模型性能和输出质量。3.2 进阶RAG进阶RAG通过增强有针对性的检索策略和改进索引方法来弥补Naive RAG的缺点。它实施了预检索和后检索策略并采用了滑动窗口、细粒度分割和元数据等技术来改进索引方法。此外还引入了各种方法来优化检索过程如ILIN。在检索阶段通过计算查询和块之间的相似性来确定适当的上下文并微调嵌入模型以增强特定领域上下文中的检索相关性。在后检索阶段应对上下文窗口限制带来的挑战并对检索到的内容进行重新排名和提示压缩。3.3 模块RAG图3 RAG 范式对比图模块RAG结构是新型框架具大灵活性和适应性可整合各种方法增强功能模块解决特定问题。此范式渐成常态支持多模块间串行流水线或端到端训练方法。进阶RAG是模块RAG的专门形式Naive RAG是进阶RAG的特例。三者关系为继承和发展。新模块搜索模块通过集成LLM生成的代码、查询语言和其他定制工具实现了对特定场景的定制和额外的语料库的直接搜索。记忆模块利用LLM的记忆能力来引导检索通过迭代创建无界的记忆池并结合“原始问题”和“双重问题”。RAG-Fusion通过采用多查询方法来增强传统搜索系统并揭示更深层次的变革性知识。查询路由决定用户的查询的后续操作选择适合查询的数据存储并确保搜索结果与用户的显式和隐含意图紧密匹配。任务适配器专注于将RAG适应于各种下游任务并增强了跨任务和模型的通用性。新模式下的模块RAG具有高度的适应性允许在RAG过程中替换或重新排列模块以适应特定问题情境。优化RAG管道可以提高信息效率和信息质量通过整合各种搜索技术、改进检索步骤、融入认知回溯、实施多功能的查询策略和利用嵌入相似性实现检索效率和上下文信息的深度之间的平衡。这些方法有助于生成对后退提示的响应和最终的答案生成过程。然而这种方法可能不会始终产生令人满意的结果特别是在语言模型对主题不熟悉时。4 检索在RAG中精确语义表示、协调查询和文档语义空间、以及检索器输出与大型语言模型偏好的协调是高效检索相关文档的核心问题。4.1 加强语义表示RAG中的语义空间对于查询和文档的多维映射至关重要建立准确语义空间的方法包括块优化和管理外部文档的微调嵌入模型。块优化需要考虑索引内容的性质、嵌入模型、用户查询的预期长度和复杂性以及应用程序的使用情况而微调嵌入模型需要使用专门领域的数据集以提高模型准确捕捉特定领域信息的能力。最近的研究引入了多样化的方法如摘要嵌入技术、元数据筛选技术和图索引技术等以提高检索结果和RAG的性能。4.2 对齐查询和文档RAG应用中检索器可以通过查询重写和嵌入变换两种基本技术实现查询和文档语义对齐。查询重写通过将原始查询与额外指导结合来创建伪文档或生成“假设”文档而嵌入变换则通过优化查询嵌入的表示并将其映射到与预期任务更紧密对齐的潜在空间中。这两种技术都能提高检索器识别结构化信息的能力。4.3 对齐检索器和LLM在RAG管道中提高检索命中率不一定能改善最终结果因为检索到的文档可能不满足LLMs的需求。为了改善检索性能和更准确地响应用户查询提出了两种将检索器输出与LLMs偏好对齐的方法微调检索器和适配器。微调检索器时可以使用LLM反馈信号来完善检索模型并使用监督信号进行训练。适配器则通过API集成功能或解决本地计算资源有限的问题来帮助对齐。此外还介绍了四种监督微调嵌入模型的方法以提高检索器和LLM之间的协同作用。这些方法有助于提高检索性能和更准确地响应用户查询。5 生成RAG的重要组件是生成器负责将检索信息转换为连贯文本。它通过整合数据提高准确性受检索文本指导确保一致性。这种全面输入让生成器深入了解问题上下文提供更有信息和上下文相关的响应。生成器有助于提高大型模型对输入数据的适应能力。5.1 使用冷冻LLM进行后检索使用大型语言模型进行后检索处理可以优化检索结果质量使其更符合用户需求或后续任务。信息压缩和重新排序是两种常见的操作通过减少噪音、解决上下文长度限制和增强生成效应来提高模型回答的准确性。重新排序模型在优化检索器检索的文档集合方面起着重要作用通过重新排列文档记录优先考虑最相关的项目从而限制文档总数提高检索效率和响应速度。这种方法还纳入了上下文压缩以提供更精确的检索信息。5.2 针对RAG的微调LLM优化RAG模型的关键在于生成器的优化生成器的作用是接收检索到的信息并生成相关文本。为了提高生成器的性能需要对模型进行微调并使用代表性工作进行数据和优化函数的探索。总体优化过程包括训练数据通常包括输入-输出对旨在训练模型根据输入生成输出。利用对比学习和实施结构化数据训练方案也可以提高模型性能。6 RAG的增强RAG发展关键技术主要围绕增强阶段、增强数据来源和增强过程三个方面。图4展示了RAG核心组件的分类。图4 RAG的核心组件的分类体系6.1 RAG的增强阶段RAG的增强阶段包括预训练、微调和推理阶段。预训练阶段通过基于检索的策略加强开放域QA的PTMs如REALM模型和RETRO模型。微调阶段RAG与微调结合能更好地满足特定场景需求微调检索器能优化语义表示协调检索与生成模型提升通用性和适应性。推理阶段RAG模型的推理阶段十分重要与LLM的集成广泛如DSP框架、PKG方法、CREAICL、RECITE和ITRG等。这些增强阶段能利用预训练模型的能力而无需进一步训练。6.2 增强源RAG模型通过增强数据源的选择和不同层次的知识处理技术来提高有效性。增强方法包括使用纯文本等非结构化数据、结构化数据以及利用LLM自身生成的内容进行检索和增强。结合无结构数据时模型生成低概率单词触发创建临时句子用检索到的上下文重新生成句子以预测后续句子。结合结构化数据时模型使用知识图谱提供高质量的上下文信息缓解模型幻觉。在RAG中利用LLMs生成的文本时模型将问题分为已知或未知选择性地应用检索增强或将LLM生成器用于取代检索器通过迭代创建与检索增强生成器无界的内存池使用内存选择器来选择作为原始问题的双重问题的输出从而自我增强生成模型。这些方法强调了RAG中创新数据源利用的广泛性旨在提高模型性能和任务有效性。6.3 增强过程在RAG领域为了解决单一检索步骤和生成可能导致效率低下的问题提出了改进检索过程的方法包括迭代检索、递归检索和自适应检索。迭代检索通过多次迭代提供额外的上下文参考增强后续答案生成的鲁棒性。递归检索通过反复改进搜索查询来提高搜索结果的深度和相关性。自适应检索通过使LLM主动确定检索的最佳时间和内容来提高检索信息的效率和相关性。这些方法需要根据特定场景的要求和每个方法的固有属性进行选择。图5 具有不同增强方面的代表性 RAG 研究的技术树图谱图6 RAG与其他模型优化方法的比较表1 RAG与微调之间的比较6.4 RAG与微调的比较RAG和FT是两种不同的方法RAG适合特定查询FT适合复制特定结构、样式或格式。FT可以提升模型性能和效率但不适合整合新知识或快速迭代新用途。这两种方法可以相互补充结合使用可能产生最优性能。优化过程可能需要多次迭代。7 RAG评估自然语言处理中的RAG模型评估在法律语言学社区中受到关注评估主要目的是理解和优化模型在不同应用场景的性能。历史上评估主要集中在特定下游任务中的表现使用适合手头任务的既定指标。现在评估的目标、方面、基准和工具已经转向基于RAG模型独特属性的研究以提供一个全面的概述。7.1 评估目标RAG模型的评价集中于检索和生成模块评估检索质量可以使用命中率、MRR和NDCG等指标评估生成质量包括真实性、相关性、非危害性和准确性可以通过手动或自动评估方法进行。对于未标记的内容评估还包括上下文相关的答案。评估方法可以用于检索和生成的质量评估。7.2 评估方面RAG模型的评价主要关注三个关键质量分数上下文相关性和答案准确性、相关性和四种基本能力噪声鲁棒性、负拒绝、信息整合、反事实鲁棒性。这些因素共同影响着模型的检索和生成两大目标。质量分数从信息检索和生成过程中的不同角度评估模型的效率而能力则对模型在各种挑战和复杂场景下的性能至关重要。表2总结了每个评估方面的具体指标。表2 适用于评价方面RAG的指标摘要表7.3 评估基准和工具RAG模型评估框架由基准测试和自动化评估工具组成提供定量指标以衡量模型表现并加深对其能力的理解。基准测试评估模型基本能力而自动化工具利用LLM裁定质量分数。这些工具和基准共同构成强大的RAG模型评估框架如表3所示。表3 评价框架摘要8 未来展望这一部分探讨了RAG的三个未来展望未来的挑战、模式扩展和RAG生态系统。8.1 RAG的未来挑战RAG技术虽然取得了显著进展但仍面临一些挑战如扩大LLM角色、规模定律和生产就绪的RAG等。RAG技术已经超越了基于文本的问答接纳了图像、音频和视频等多种模态数据催生了创新的多模态模型。在图像领域RA-CM3和BLIP-2等模型实现了文本和图像的检索和生成以及零样本图像到文本转换。在音频和视频领域GSS方法、UEOP、基于KNN的注意力融合、Vid2Seq等也取得了进展。在代码领域RBPS通过编码和频率分析检索与开发人员目标一致的代码示例表现出色。RAG技术还有很大的发展空间。8.2 RAG生态系统RAG生态系统是一种强大的语言模型能够处理复杂的查询并产生详细的响应在医学、法律和教育等领域表现出色。RAG生态系统的发展受到技术堆栈发展的影响如关键工具的流行和新兴技术堆栈的独特贡献。RAG模型和技术堆栈的共同增长是显而易见的技术进步不断为现有基础设施制定新标准。RAG工具包正在汇集成为一个基础技术堆栈为高级企业应用程序奠定基础。然而完全集成和全面的平台的概念仍然存在有待进一步的创新和发展。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

如何免费搭建自己的网站建站培训班

贝贝BiliBili是一款功能强大的B站视频下载工具,专为需要批量下载B站视频的用户设计。这款PC版工具操作简便,能够显著提升您的视频下载效率,让您轻松保存喜爱的B站内容。 【免费下载链接】贝贝BiliBili-B站视频下载 贝贝BiliBili是一款专为B站…

张小明 2025/12/28 6:14:51 网站建设

永康做网站公司专门做进口产品的网站6

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个性能测试场景,比较MySQL存储过程和传统SQL语句在处理批量数据时的效率差异。具体要求:1. 生成测试数据(10万条记录)&#xf…

张小明 2025/12/28 6:14:19 网站建设

做海外网站的公司品牌网站的推广

第一章:Open-AutoGLM沉思官网概览 Open-AutoGLM 是一个面向自动化代码生成与自然语言理解的开源项目,其官方网站作为核心入口,集中展示了项目架构、功能模块与开发文档。官网采用响应式设计,适配多端访问,界面简洁且信…

张小明 2025/12/28 6:13:45 网站建设

产品发布网站的装饰怎么做南宁东凯做网站的公司

一分钟语音数据能做什么?GPT-SoVITS告诉你答案 在数字内容爆炸式增长的今天,声音正成为人机交互中最自然、最具情感张力的媒介。我们早已不满足于机械朗读的合成语音——人们想要的是“像自己”的声音,是那个熟悉语调里藏着情绪与记忆的回响。…

张小明 2025/12/28 6:13:13 网站建设

益阳 网站制作维护焦作专业做网站公司

你知道吗?90% 的系统性能瓶颈,往往只源于那 10% 的烂 SQL。很多时候,我们为了提升系统响应速度,不惜重金升级 CPU、扩容内存、上 Redis 集群。然而,线上系统的一次次告警,最终查下来的元凶,往往…

张小明 2025/12/28 6:12:34 网站建设

官方网站是指哪个网站广州专业网站改版方案

呼叫中心语音自动化:EmotiVoice降本增效方案 在客服热线那头,你是否曾因一段机械、毫无起伏的语音回复而感到烦躁?“您的来电已收到,请稍后。”——语气平得像一条直线,仿佛背后没有人在听,也没有人在乎。…

张小明 2025/12/28 6:11:58 网站建设