广宁县住房建设局网站互联网企业排名2021

张小明 2025/12/27 4:37:12
广宁县住房建设局网站,互联网企业排名2021,wordpress 网页加速,目前好的外贸网站探索和比较不同的LLM 在上一课中#xff0c;我们已经了解了生成式人工智能如何改变技术格局#xff0c;了解了大型语言模型#xff08;LLM#xff09;的工作原理#xff0c;以及企业#xff08;例如我们的初创公司#xff09;如何将其应用于实际案例并实现增长#xff…探索和比较不同的LLM在上一课中我们已经了解了生成式人工智能如何改变技术格局了解了大型语言模型LLM的工作原理以及企业例如我们的初创公司如何将其应用于实际案例并实现增长在本章中我们将比较和对比不同类型的大型语言模型LLM以了解它们的优缺点。我们初创公司旅程的下一步是探索当前的LLM领域并了解哪些模型适合我们的使用场景。1、简介本课将涵盖当前领域中不同类型的LLM。在Azure中测试、迭代和比较不同模型以适应您的使用场景。如何部署LLM。2、学习目标完成本课后您将能够为您的使用场景选择合适的模型。了解如何测试、迭代并提高模型的性能。了解企业如何部署模型。3、了解不同类型的LLMLLM可以根据其架构、训练数据和使用场景进行多种分类。了解这些差异将帮助我们的初创公司选择适合场景的模型并了解如何测试、迭代和提高性能。LLM模型种类繁多选择哪种模型取决于您的使用目的、数据类型、预算等因素。根据您是希望将模型用于文本、音频、视频、图像生成等用途您可能会选择不同类型的模型。-音频和语音识别。对于此用途Whisper类型的模型是一个很好的选择因为它们是通用的专注于语音识别。它基于多样化的音频数据进行训练可以执行多语言语音识别。了解更多关于Whisper类型模型的信息。-图像生成。对于图像生成DALL-E和Midjourney是两个非常知名的选择。DALL-E由Azure OpenAI提供。关于DALL-E的信息也可以在本课程的第9章中了解更多。-文本生成。大多数模型都经过文本生成训练您可以选择从GPT-3.5到GPT-4的多种模型。它们的成本各不相同其中GPT-4最为昂贵。值得查看Azure OpenAI playground以评估哪些模型在能力和成本方面最适合您的需求。-多模态。如果您希望处理输入和输出中的多种数据类型可以考虑像gpt-4 turbo with vision或gpt-4o这样的模型——OpenAI最新发布的模型——它们能够将自然语言处理与视觉理解结合起来从而实现通过多模态界面进行交互。选择一个模型意味着您获得了一些基本功能但这可能还不够。通常您有公司特定的数据需要以某种方式告知LLM。关于如何处理这一点有几种不同的选择更多内容将在后续部分中介绍。基础模型与LLM“基础模型”这一术语由斯坦福研究人员提出定义为符合以下标准的AI模型例如使用无监督学习或自监督学习进行训练即它们基于未标注的多模态数据进行训练不需要人工注释或标注数据来完成训练过程。它们是非常大的模型基于非常深的神经网络训练了数十亿个参数。通常旨在作为其他模型的“基础”即它们可以作为其他模型的起点通过微调来构建其他模型。图片来源基础模型和大型语言模型的基本指南 | 作者Babar M Bhatti | Medium为了进一步澄清这一区别让我们以ChatGPT为例。构建ChatGPT的第一个版本时使用了一个名为GPT-3.5的模型作为基础模型。这意味着OpenAI使用了一些特定于聊天的数据来创建一个经过调优的GPT-3.5版本使其在对话场景如聊天机器人中表现出色。图片来源2108.07258.pdf (arxiv.org)开源模型与专有模型另一种分类LLM的方法是看它们是开源的还是专有的。开源模型是公开提供给公众使用的模型任何人都可以使用。它们通常由创建它们的公司或研究社区提供。这些模型可以被检查、修改并根据LLM的各种使用场景进行定制。然而它们并不总是针对生产使用进行优化性能可能不如专有模型。此外开源模型的资金可能有限可能无法长期维护或更新最新的研究成果。流行的开源模型包括Alpaca、Bloom和LLaMA。专有模型是由公司拥有的模型未向公众开放。这些模型通常针对生产使用进行了优化。然而它们无法被检查、修改或根据不同的使用场景进行定制。此外它们并不总是免费提供可能需要订阅或支付费用才能使用。此外用户无法控制用于训练模型的数据这意味着他们需要信任模型所有者确保数据隐私和负责任的AI使用。流行的专有模型包括OpenAI模型、Google Bard或Claude 2。嵌入、图像生成与文本和代码生成LLM还可以根据其生成的输出进行分类。嵌入模型是一组可以将文本转换为数值形式的模型称为嵌入即输入文本的数值表示。嵌入使机器更容易理解单词或句子之间的关系并可以作为其他模型的输入例如分类模型或在数值数据上性能更好的聚类模型。嵌入模型通常用于迁移学习在这种情况下模型为一个有大量数据的替代任务构建然后模型权重嵌入被重新用于其他下游任务。此类别的一个示例是OpenAI嵌入。图像生成模型是生成图像的模型。这些模型通常用于图像编辑、图像合成和图像翻译。图像生成模型通常基于大型图像数据集进行训练例如LAION-5B可以用于生成新图像或编辑现有图像使用修复、超分辨率和上色技术。示例包括DALL-E-3和Stable Diffusion模型。文本和代码生成模型是生成文本或代码的模型。这些模型通常用于文本摘要、翻译和问答。文本生成模型通常基于大型文本数据集进行训练例如BookCorpus可以用于生成新文本或回答问题。代码生成模型例如CodeParrot通常基于大型代码数据集进行训练例如GitHub可以用于生成新代码或修复现有代码中的错误。编码器-解码器与仅解码器为了讨论LLM的不同架构类型我们可以用一个类比来说明。假设您的经理给您布置了一项任务为学生编写一个测验。您有两位同事一位负责创建内容另一位负责审核内容。内容创建者就像一个仅解码器模型他们可以查看主题和您已经写的内容然后根据这些内容编写课程。他们非常擅长编写引人入胜且信息丰富的内容但他们不太擅长理解主题和学习目标。仅解码器模型的例子包括GPT系列模型例如GPT-3。审核者就像一个仅编码器模型他们查看编写的课程和答案注意它们之间的关系并理解上下文但他们不擅长生成内容。仅编码器模型的一个例子是BERT。想象一下我们也可以有一个既能创建又能审核测验的人这就是编码器-解码器模型。示例包括BART和T5。服务与模型现在让我们讨论服务与模型之间的区别。服务是由云服务提供商提供的产品通常是模型、数据和其他组件的组合。模型是服务的核心组件通常是一个基础模型例如LLM。服务通常针对生产使用进行了优化并且通常比模型更易于使用通过图形用户界面进行操作。然而服务并不总是免费提供可能需要订阅或支付费用才能使用以利用服务所有者的设备和资源优化开销并轻松扩展。服务的一个示例是Azure OpenAI Service它提供按使用量付费的计划这意味着用户根据使用服务的多少按比例收费。此外Azure OpenAI Service在模型功能之上提供企业级安全性和负责任的AI框架。模型只是神经网络包括参数、权重等。允许公司本地运行但需要购买设备、构建扩展结构并购买许可证或使用开源模型。像LLaMA这样的模型可以使用但需要计算能力来运行模型。4、如何在Azure上测试和迭代不同模型以了解性能一旦我们的团队探索了当前的LLM领域并确定了一些适合其场景的候选模型下一步就是在他们的数据和工作负载上测试这些模型。这是一个通过实验和测量完成的迭代过程。我们在前面段落中提到的大多数模型如OpenAI模型、开源模型Llama2和Hugging Face transformers都可以在Azure AI Studio的模型目录中找到。Azure AI Studio是一个云平台专为开发者设计用于构建生成式AI应用并管理整个开发生命周期——从实验到评估——通过将所有Azure AI服务整合到一个便捷的图形用户界面中。Azure AI Studio中的模型目录使用户能够在目录中找到感兴趣的基础模型——无论是专有模型还是开源模型可以按任务、许可证或名称进行筛选。为了提高搜索效率模型被组织到不同的集合中例如Azure OpenAI集合、Hugging Face集合等。查看模型卡包括关于预期用途和训练数据的详细描述、代码示例以及内部评估库的评估结果。通过模型基准测试面板比较行业内可用的模型和数据集的基准测试以评估哪个模型最符合业务场景。利用Azure AI Studio的实验和跟踪功能在自定义训练数据上微调模型以提高模型在特定工作负载中的性能。将原始预训练模型或微调版本部署到远程实时推理——托管计算——或无服务器API端点——按需付费——以便应用程序可以使用它。[!NOTE]目录中的所有模型目前并不都支持微调和/或按需付费部署。请查看模型卡以了解模型的功能和限制。5、提高LLM结果我们与初创团队一起探索了不同类型的LLM以及一个云平台Azure Machine Learning该平台使我们能够比较不同的模型在测试数据上进行评估提升性能并将其部署到推理端点。那么什么时候应该考虑微调模型而不是使用预训练模型是否还有其他方法可以提高模型在特定工作负载上的性能企业可以采用多种方法从LLM中获得所需的结果。在生产环境中部署LLM时可以选择不同类型的模型这些模型具有不同的训练程度、复杂性、成本和质量。以下是一些不同的方法带上下文的提示工程。这个方法的核心思想是在提示时提供足够的上下文以确保获得所需的响应。检索增强生成RAG。例如为了确保数据库或网络端点中的数据或其子集在提示时被包含可以在提示时获取相关数据并将其作为用户提示的一部分。微调模型。通过在自己的数据上进一步训练模型使其更加精确并满足需求但可能成本较高。图片来源企业部署LLM的四种方式 | Fiddler AI Blog带上下文的提示工程预训练的LLM在处理通用自然语言任务时表现非常出色即使只用一个简短的提示调用它们例如完成一个句子或回答一个问题——这被称为“零样本学习”。然而用户提供的查询越详细包含的请求和示例越多——即上下文——模型的回答就越准确越符合用户的期望。在这种情况下如果提示中仅包含一个示例我们称之为“一次样本学习”如果包含多个示例则称为“少样本学习”。带上下文的提示工程是启动的最具成本效益的方法。检索增强生成RAGLLM的局限性在于它们只能使用训练过程中使用的数据来生成答案。这意味着它们对训练后发生的事实一无所知也无法访问非公开信息如公司数据。可以通过RAG来克服这一问题这是一种通过文档片段形式的外部数据增强提示的技术同时考虑到提示长度的限制。此技术由向量数据库工具如Azure Vector Search支持这些工具从各种预定义数据源中检索有用的片段并将其添加到提示上下文中。当企业没有足够的数据、时间或资源来微调LLM但仍希望提高特定工作负载的性能并减少虚构风险即对现实的误导或有害内容时这种技术非常有用。微调模型微调是一种利用迁移学习的过程用于“适配”模型以完成下游任务或解决特定问题。与少样本学习和RAG不同微调会生成一个新的模型并更新权重和偏差。它需要一组训练示例这些示例由单个输入提示及其相关输出完成组成。以下情况适合采用这种方法使用微调模型。企业希望使用微调后的能力较弱的模型如嵌入模型而不是高性能模型从而实现更具成本效益和更快速的解决方案。考虑延迟。延迟对于某些特定用例非常重要因此无法使用非常长的提示或超出提示长度限制的示例数量。保持最新。企业拥有大量高质量数据和真实标签并且有资源能够随着时间推移保持这些数据的更新。训练模型从零开始训练一个LLM无疑是最困难和最复杂的方法需要大量数据、专业资源和适当的计算能力。只有在企业拥有特定领域的用例和大量领域相关数据的情况下才应考虑这种选项。5、知识检查什么是提高LLM完成结果的好方法带上下文的提示工程RAG微调模型A:3如果您有时间、资源和高质量数据微调是保持最新的更好选择。然而如果您希望改进结果但缺乏时间首先考虑RAG可能更值得。6、 挑战关于如何使用RAG来为您的企业服务。出色的工作继续学习完成本课程后请查看我们的[生成式AI学习合集]继续提升您的生成式AI知识前往第3课我们将探讨如何[负责任地使用生成式AI]
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

网站设计的布局郑州网站优化软件

传音控股又要赴港IPO了。12月2日,传音控股向港交所递交招股书,寻求“AH”两地上市。这不仅是“非洲手机之王”的又一次资本跃迁,更是一场在业绩承压下的“突围”。传音控股选择此时赴港上市,其实是有着多重考虑的,既有…

张小明 2025/12/26 21:41:54 网站建设

网站建设与管理规定买卖网交易平台

EmotiVoice语音合成在语音日记类APP中的情感共鸣设计 在智能手机成为我们情绪出口的今天,越来越多的人开始用语音记录生活——清晨的一句自言自语、深夜的情绪宣泄、一段旅行中的随想。这些声音承载着真实的喜怒哀乐,但当用户想回听自己的文字日记时&…

张小明 2025/12/26 21:41:37 网站建设

校园网站建设依据14亿人口新冠死多少

第一章:Open-AutoGLM工作进度监控概述 Open-AutoGLM 是一个面向自动化代码生成与任务调度的开源框架,其核心目标是实现对大规模语言模型驱动的开发流程进行可视化监控与动态管理。在复杂任务链执行过程中,实时掌握各模块运行状态、资源消耗与…

张小明 2025/12/26 22:58:26 网站建设

图片背景在网站建设中有没有免费的源码网站

jQuery Validation 1.19.5 版本技术解析:多文件总大小验证与国际化邮箱支持 【免费下载链接】jquery-validation 项目地址: https://gitcode.com/gh_mirrors/jqu/jquery-validation jQuery Validation 插件作为前端表单验证的标准解决方案,在1.1…

张小明 2025/12/26 22:58:24 网站建设

征婚网站认识的男人做定投保网站开发中的api指什么i

Windows系统备份与恢复实用指南 在Windows系统的使用过程中,数据备份和恢复是保障系统稳定运行和数据安全的重要环节。本文将详细介绍如何使用备份工具进行系统状态数据备份、配置备份选项、安排备份任务,以及如何使用恢复向导和自动系统恢复功能。 1. 管理系统状态数据 系…

张小明 2025/12/26 22:58:22 网站建设