广宁县住房建设局网站互联网企业排名2021-淄博市网站建设公司-Seo优化

广宁县住房建设局网站,互联网企业排名2021,wordpress 网页加速,目前好的外贸网站探索和比较不同的LLM 在上一课中#xff0c;我们已经了解了生成式人工智能如何改变技术格局#xff0c;了解了大型语言模型#xff08;LLM#xff09;的工作原理#xff0c;以及企业#xff08;例如我们的初创公司#xff09;如何将其应用于实际案例并实现增长#xff…探索和比较不同的LLM在上一课中我们已经了解了生成式人工智能如何改变技术格局了解了大型语言模型LLM的工作原理以及企业例如我们的初创公司如何将其应用于实际案例并实现增长在本章中我们将比较和对比不同类型的大型语言模型LLM以了解它们的优缺点。我们初创公司旅程的下一步是探索当前的LLM领域并了解哪些模型适合我们的使用场景。1、简介本课将涵盖当前领域中不同类型的LLM。在Azure中测试、迭代和比较不同模型以适应您的使用场景。如何部署LLM。2、学习目标完成本课后您将能够为您的使用场景选择合适的模型。了解如何测试、迭代并提高模型的性能。了解企业如何部署模型。3、了解不同类型的LLMLLM可以根据其架构、训练数据和使用场景进行多种分类。了解这些差异将帮助我们的初创公司选择适合场景的模型并了解如何测试、迭代和提高性能。LLM模型种类繁多选择哪种模型取决于您的使用目的、数据类型、预算等因素。根据您是希望将模型用于文本、音频、视频、图像生成等用途您可能会选择不同类型的模型。-音频和语音识别。对于此用途Whisper类型的模型是一个很好的选择因为它们是通用的专注于语音识别。它基于多样化的音频数据进行训练可以执行多语言语音识别。了解更多关于Whisper类型模型的信息。-图像生成。对于图像生成DALL-E和Midjourney是两个非常知名的选择。DALL-E由Azure OpenAI提供。关于DALL-E的信息也可以在本课程的第9章中了解更多。-文本生成。大多数模型都经过文本生成训练您可以选择从GPT-3.5到GPT-4的多种模型。它们的成本各不相同其中GPT-4最为昂贵。值得查看Azure OpenAI playground以评估哪些模型在能力和成本方面最适合您的需求。-多模态。如果您希望处理输入和输出中的多种数据类型可以考虑像gpt-4 turbo with vision或gpt-4o这样的模型——OpenAI最新发布的模型——它们能够将自然语言处理与视觉理解结合起来从而实现通过多模态界面进行交互。选择一个模型意味着您获得了一些基本功能但这可能还不够。通常您有公司特定的数据需要以某种方式告知LLM。关于如何处理这一点有几种不同的选择更多内容将在后续部分中介绍。基础模型与LLM“基础模型”这一术语由斯坦福研究人员提出定义为符合以下标准的AI模型例如使用无监督学习或自监督学习进行训练即它们基于未标注的多模态数据进行训练不需要人工注释或标注数据来完成训练过程。它们是非常大的模型基于非常深的神经网络训练了数十亿个参数。通常旨在作为其他模型的“基础”即它们可以作为其他模型的起点通过微调来构建其他模型。图片来源基础模型和大型语言模型的基本指南 | 作者Babar M Bhatti | Medium为了进一步澄清这一区别让我们以ChatGPT为例。构建ChatGPT的第一个版本时使用了一个名为GPT-3.5的模型作为基础模型。这意味着OpenAI使用了一些特定于聊天的数据来创建一个经过调优的GPT-3.5版本使其在对话场景如聊天机器人中表现出色。图片来源2108.07258.pdf (arxiv.org)开源模型与专有模型另一种分类LLM的方法是看它们是开源的还是专有的。开源模型是公开提供给公众使用的模型任何人都可以使用。它们通常由创建它们的公司或研究社区提供。这些模型可以被检查、修改并根据LLM的各种使用场景进行定制。然而它们并不总是针对生产使用进行优化性能可能不如专有模型。此外开源模型的资金可能有限可能无法长期维护或更新最新的研究成果。流行的开源模型包括Alpaca、Bloom和LLaMA。专有模型是由公司拥有的模型未向公众开放。这些模型通常针对生产使用进行了优化。然而它们无法被检查、修改或根据不同的使用场景进行定制。此外它们并不总是免费提供可能需要订阅或支付费用才能使用。此外用户无法控制用于训练模型的数据这意味着他们需要信任模型所有者确保数据隐私和负责任的AI使用。流行的专有模型包括OpenAI模型、Google Bard或Claude 2。嵌入、图像生成与文本和代码生成LLM还可以根据其生成的输出进行分类。嵌入模型是一组可以将文本转换为数值形式的模型称为嵌入即输入文本的数值表示。嵌入使机器更容易理解单词或句子之间的关系并可以作为其他模型的输入例如分类模型或在数值数据上性能更好的聚类模型。嵌入模型通常用于迁移学习在这种情况下模型为一个有大量数据的替代任务构建然后模型权重嵌入被重新用于其他下游任务。此类别的一个示例是OpenAI嵌入。图像生成模型是生成图像的模型。这些模型通常用于图像编辑、图像合成和图像翻译。图像生成模型通常基于大型图像数据集进行训练例如LAION-5B可以用于生成新图像或编辑现有图像使用修复、超分辨率和上色技术。示例包括DALL-E-3和Stable Diffusion模型。文本和代码生成模型是生成文本或代码的模型。这些模型通常用于文本摘要、翻译和问答。文本生成模型通常基于大型文本数据集进行训练例如BookCorpus可以用于生成新文本或回答问题。代码生成模型例如CodeParrot通常基于大型代码数据集进行训练例如GitHub可以用于生成新代码或修复现有代码中的错误。编码器-解码器与仅解码器为了讨论LLM的不同架构类型我们可以用一个类比来说明。假设您的经理给您布置了一项任务为学生编写一个测验。您有两位同事一位负责创建内容另一位负责审核内容。内容创建者就像一个仅解码器模型他们可以查看主题和您已经写的内容然后根据这些内容编写课程。他们非常擅长编写引人入胜且信息丰富的内容但他们不太擅长理解主题和学习目标。仅解码器模型的例子包括GPT系列模型例如GPT-3。审核者就像一个仅编码器模型他们查看编写的课程和答案注意它们之间的关系并理解上下文但他们不擅长生成内容。仅编码器模型的一个例子是BERT。想象一下我们也可以有一个既能创建又能审核测验的人这就是编码器-解码器模型。示例包括BART和T5。服务与模型现在让我们讨论服务与模型之间的区别。服务是由云服务提供商提供的产品通常是模型、数据和其他组件的组合。模型是服务的核心组件通常是一个基础模型例如LLM。服务通常针对生产使用进行了优化并且通常比模型更易于使用通过图形用户界面进行操作。然而服务并不总是免费提供可能需要订阅或支付费用才能使用以利用服务所有者的设备和资源优化开销并轻松扩展。服务的一个示例是Azure OpenAI Service它提供按使用量付费的计划这意味着用户根据使用服务的多少按比例收费。此外Azure OpenAI Service在模型功能之上提供企业级安全性和负责任的AI框架。模型只是神经网络包括参数、权重等。允许公司本地运行但需要购买设备、构建扩展结构并购买许可证或使用开源模型。像LLaMA这样的模型可以使用但需要计算能力来运行模型。4、如何在Azure上测试和迭代不同模型以了解性能一旦我们的团队探索了当前的LLM领域并确定了一些适合其场景的候选模型下一步就是在他们的数据和工作负载上测试这些模型。这是一个通过实验和测量完成的迭代过程。我们在前面段落中提到的大多数模型如OpenAI模型、开源模型Llama2和Hugging Face transformers都可以在Azure AI Studio的模型目录中找到。Azure AI Studio是一个云平台专为开发者设计用于构建生成式AI应用并管理整个开发生命周期——从实验到评估——通过将所有Azure AI服务整合到一个便捷的图形用户界面中。Azure AI Studio中的模型目录使用户能够在目录中找到感兴趣的基础模型——无论是专有模型还是开源模型可以按任务、许可证或名称进行筛选。为了提高搜索效率模型被组织到不同的集合中例如Azure OpenAI集合、Hugging Face集合等。查看模型卡包括关于预期用途和训练数据的详细描述、代码示例以及内部评估库的评估结果。通过模型基准测试面板比较行业内可用的模型和数据集的基准测试以评估哪个模型最符合业务场景。利用Azure AI Studio的实验和跟踪功能在自定义训练数据上微调模型以提高模型在特定工作负载中的性能。将原始预训练模型或微调版本部署到远程实时推理——托管计算——或无服务器API端点——按需付费——以便应用程序可以使用它。[!NOTE]目录中的所有模型目前并不都支持微调和/或按需付费部署。请查看模型卡以了解模型的功能和限制。5、提高LLM结果我们与初创团队一起探索了不同类型的LLM以及一个云平台Azure Machine Learning该平台使我们能够比较不同的模型在测试数据上进行评估提升性能并将其部署到推理端点。那么什么时候应该考虑微调模型而不是使用预训练模型是否还有其他方法可以提高模型在特定工作负载上的性能企业可以采用多种方法从LLM中获得所需的结果。在生产环境中部署LLM时可以选择不同类型的模型这些模型具有不同的训练程度、复杂性、成本和质量。以下是一些不同的方法带上下文的提示工程。这个方法的核心思想是在提示时提供足够的上下文以确保获得所需的响应。检索增强生成RAG。例如为了确保数据库或网络端点中的数据或其子集在提示时被包含可以在提示时获取相关数据并将其作为用户提示的一部分。微调模型。通过在自己的数据上进一步训练模型使其更加精确并满足需求但可能成本较高。图片来源企业部署LLM的四种方式 | Fiddler AI Blog带上下文的提示工程预训练的LLM在处理通用自然语言任务时表现非常出色即使只用一个简短的提示调用它们例如完成一个句子或回答一个问题——这被称为“零样本学习”。然而用户提供的查询越详细包含的请求和示例越多——即上下文——模型的回答就越准确越符合用户的期望。在这种情况下如果提示中仅包含一个示例我们称之为“一次样本学习”如果包含多个示例则称为“少样本学习”。带上下文的提示工程是启动的最具成本效益的方法。检索增强生成RAGLLM的局限性在于它们只能使用训练过程中使用的数据来生成答案。这意味着它们对训练后发生的事实一无所知也无法访问非公开信息如公司数据。可以通过RAG来克服这一问题这是一种通过文档片段形式的外部数据增强提示的技术同时考虑到提示长度的限制。此技术由向量数据库工具如Azure Vector Search支持这些工具从各种预定义数据源中检索有用的片段并将其添加到提示上下文中。当企业没有足够的数据、时间或资源来微调LLM但仍希望提高特定工作负载的性能并减少虚构风险即对现实的误导或有害内容时这种技术非常有用。微调模型微调是一种利用迁移学习的过程用于“适配”模型以完成下游任务或解决特定问题。与少样本学习和RAG不同微调会生成一个新的模型并更新权重和偏差。它需要一组训练示例这些示例由单个输入提示及其相关输出完成组成。以下情况适合采用这种方法使用微调模型。企业希望使用微调后的能力较弱的模型如嵌入模型而不是高性能模型从而实现更具成本效益和更快速的解决方案。考虑延迟。延迟对于某些特定用例非常重要因此无法使用非常长的提示或超出提示长度限制的示例数量。保持最新。企业拥有大量高质量数据和真实标签并且有资源能够随着时间推移保持这些数据的更新。训练模型从零开始训练一个LLM无疑是最困难和最复杂的方法需要大量数据、专业资源和适当的计算能力。只有在企业拥有特定领域的用例和大量领域相关数据的情况下才应考虑这种选项。5、知识检查什么是提高LLM完成结果的好方法带上下文的提示工程RAG微调模型A:3如果您有时间、资源和高质量数据微调是保持最新的更好选择。然而如果您希望改进结果但缺乏时间首先考虑RAG可能更值得。6、挑战关于如何使用RAG来为您的企业服务。出色的工作继续学习完成本课程后请查看我们的[生成式AI学习合集]继续提升您的生成式AI知识前往第3课我们将探讨如何[负责任地使用生成式AI]

广宁县住房建设局网站互联网企业排名2021

网站设计的布局郑州网站优化软件

江苏省建设厅官网网站首页网站升级云南省建设注册考试中心

网站建设与管理规定买卖网交易平台

校园网站建设依据14亿人口新冠死多少

图片背景在网站建设中有没有免费的源码网站

征婚网站认识的男人做定投保网站开发中的api指什么i

广宁县住房建设局网站互联网企业排名2021

网站设计的布局郑州网站优化软件

江苏省建设厅官网网站首页网站升级 云南省建设注册考试中心

网站建设与管理规定买卖网交易平台

校园网站建设依据14亿人口新冠死多少

图片背景在网站建设中有没有免费的源码网站

征婚网站认识的男人做定投保网站开发中的api指什么i

江苏省建设厅官网网站首页网站升级云南省建设注册考试中心