wp如何做引擎网站铜仁网站建设哪家专业

张小明 2025/12/30 4:03:33
wp如何做引擎网站,铜仁网站建设哪家专业,做网站被攻击谁的责任,网站版权设置原文#xff1a;towardsdatascience.com/hands-on-monotonic-time-series-forecasting-with-xgboost-using-python-ebcd2c27f9e6 几个月前#xff0c;我参与了一个研究项目#xff0c;遇到了一个涉及时间序列的问题需要解决。 问题相当直接#xff1a; “从具有 t 时间步长…原文towardsdatascience.com/hands-on-monotonic-time-series-forecasting-with-xgboost-using-python-ebcd2c27f9e6几个月前我参与了一个研究项目遇到了一个涉及时间序列的问题需要解决。问题相当直接“从具有 t时间步长的此时间序列开始预测接下来的 k值”对于那些机器学习爱好者来说这就像编写“Hello World”因为这个问题对于社区来说极其知名被称为“预测”。机器学习社区开发了多种技术可用于预测时间序列的下一个值。一些传统方法涉及**ARIMA/SARIMA或傅里叶变换分析等算法而更复杂的算法包括卷积/循环神经网络或超级著名的“Transformer**”ChatGPT 中的 T 代表 transformers。虽然预测问题非常知名但解决带有约束的预测问题可能更为罕见。让我解释一下我的意思。您有一个时间序列包含一组参数X和时间步长t。标准的时间预测问题如下https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/7d1988a29945668d534f6234016e798b.png由作者制作的照片我们面临的问题是以下https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/648b44b087670f9b27258f4468fdcfe3.png由作者制作的照片因此如果我们考虑输入参数有d个维度我想函数对于第 1 个维度例如是单调的。那么我们如何处理这个问题我们如何预测一个“单调”的时间序列我们将在这个问题中描述的方法是XGBoost。本博客文章的结构如下关于 XGBoost在几行内我们将描述XGBoost 是什么其基本思想是什么以及其优缺点。XGBoost 示例以下将描述 XGBoost 的代码从 Python 描述到玩具示例。XGBoost 单调性示例XGBoost 将在一个真实世界的例子上进行测试。结论本博客文章所讨论的内容将进行总结。1. 关于 XGBoost1.1 XGBoost 理念XGBoost 中的“XG”代表极端梯度提升。梯度提升算法旨在使用“预测器链”。给定输入矩阵X和相应的输出y我们的想法是有许多预测器。第一个预测器的目标是直接从输入X中找到相应的输出y。故事结束。不我在开玩笑 第一个预测器的目标是成为一个所谓的“弱预测器”这意味着预测的y与实际输出y之间有一个不可忽略的差异。第二个预测器的目标是纠正第一个预测的错误因此它不是训练从X到y而是训练从y2y-y1。这会重复 N 次其中 N 是预测器的数量如下面的图像所示https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/ffca26088e4bd5474463aa19fd5b64a3.pngXGBoost 想法的描述这些预测器中的每一个都是一个决策树。每次我解释决策树时我都会将其与游戏“猜猜我是谁”进行比较。在那个游戏中它的工作方式有点像这样。想象你正在玩经典的“猜猜我是谁”游戏每个玩家都有一个填满一些角色面孔的板每个角色都有独特的特征如发色、眼色、眼镜、帽子等等。目标是通过对这些特征的是或否问题来猜测对手的秘密角色。每个问题都会帮助你排除不符合答案的候选人缩小可能性直到你可以自信地猜出秘密角色是谁。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/abfae245236c51e057d703c73d5df41f.png由作者制作使用 DALL·E-3 制作的图像因此结构正如我们所看到的就像一个倒置的树从叶子底部到根顶部。每个预测器都是你看到的那棵树之一。如果你在思考分类和回归之间的区别你是正确的。我展示的例子为了简单起见是一个分类问题。然而如果你将“Kristen”替换为实数例如“0.47462”你会发现你面临的是一个回归问题。就这么简单。因此XGBoost 算法以智能的方式使用所有这些决策树来“提升”前一棵树的预测。它之所以被称为“极端”是因为为了做到这一点算法的开发者——一群非常优秀的科学家——已经进行了大量的中间优化步骤这些步骤你可以在这里找到这里。训练部分一如既往是损失函数的最小化加上正则化项以防止过拟合。参数包括叶子的数量、树的深度以及树的分割点。我所说的“树的分割点”是指以下内容在上面的例子中我们有“这个人是不是孩子”。在现实生活中我们可能会有连续特征所以它更像是“x_1 是否大于分割点”这意味着分割点成为一个参数。1.1 XGBoost 单调性现在XGBoost 算法提供了许多优点它通常对过拟合非常稳健。决策树有一个众所周知的问题就是过拟合而这些集成方法擅长克服它。它能够处理合理的计算复杂度这一点并不明显尤其是如果我们防止过拟合的同时做到这一点它仍然可以通过特征的重要性提供可解释性。这使我们能够理解哪些X的参数对我们的预测至关重要。你可以决定让响应对特定特征是单调的。例如让我们假设我们有以下函数https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/edeebdd8e146c44d29edd03bdd88daa5.png作者制作的图像这个函数相对于 x2 是单调的。想象一下如果我们想使用 XGBoost 来预测给定 x1 和 x2 的结果 f(x1,x2)。在现实生活中f(x1,x2)是未知的否则我们就不做机器学习了我们会乘飞机去佛罗里达度假但我们现在或希望我们的函数相对于 x2 是单调的。这在我现实生活中发生过我有一个物理量我知道它相对于另一个量是单调的。XGBoost 的结构可以被修改以满足这个特定特征的要求。在我们的例子中我们可以在 x2 上施加单调行为来进行预测。好了。希望你没有被吓到。现在让我们跳到有趣的部分。2. 编码2.1 玩具数据集我必须说决策树让我想起了很多往事因为它们是我最早写的机器学习代码之一听起来可能有些荒谬但我确实有点情感上的波动 ❤️虽然要 100%诚实地说代码非常简单。所以无需多言让我们直接进入正题。我想给你展示两个例子。第一个例子我将其简化为一维的以便解释整个机制是如何工作的。这是我们想要使用 XGBoost 预测的目标函数fhttps://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/66d64ffc2a22c61fde8d4f2cba9173a2.png这是这个图Jovian现在。XGBoost 的实际实现在文档中有详细的描述字斟句酌。我不会逐字逐句地讲解但我希望你能展示它在这一案例中的功能。它与你在网上找到的任何 SkLearn 模型没有区别。Jovian就这么简单。现在让我们进行真正的测试。2.2 实际世界数据集上面的例子为我们提供了 xgboost 代码的结构。尽管如此我们构建的玩具数据集有几个局限性它太简单了一维且完全是虚构的我们没有以预测方式使用它因为我们已经打乱了数据集我们没有使用任何单调约束这正是我承诺的那么让我们从一些真正的业务开始好吗我使用了这个数据集这是德里城市的数据库。该数据集由两个 csv 表格组成DailyDelhiClimateTrain.csv和DailyDelhiClimateTest.csv。cdn.embedly.com/widgets/media.html?srchttps%3A%2F%2Fjovian.com%2Fembed%3Furl%3Dhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F10%26cellId%3D7dntp1display_nameJovianurlhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F10%26cellId%3D7imagehttps%3A%2F%2Fapi.jovian.com%2Fapi%2Fgist%2F20b060f308fb4604b5c91d5f336ef8ab%2Fpreview%2F76f438de4ea54450a3d7f87b1e8d6a3f%3Fts%3D1711597080325keya19fcc184b9711e1b4764040d3dc5c07typetext%2Fhtmlscrollautoschemajovian我们已经用pandas导入并显示了 5 行。我们有 5 列date, humidity, wind_speed, meanpressure和meantemp。一个合理的问题可能是这个“假设拥有所有其他列我们想知道meantemp的温度是什么。”并且有一篇博客文章它很好地涵盖了这一点。我们希望更进一步。我们将添加另一列命名为“City_Index”。这个City_Index将模拟另一个城市我们知道它比德里更温暖或更寒冷。所以就像我们按世界不同地区分组城市索引一样*https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/1be286236775d5c4614ee5c5cf3e078c.png图片由作者制作*不要遵循地图上的实际城市索引请尝试理解它的工作原理这只是给你一个想法。现在我们将使其成为这样的方式即 CityIndex1 具有mean_temp的默认值CityIndex 2 具有作为目标值2mean_temp…CityIndex9 具有作为目标值9*mean_temp。_ 这意味着如果我们固定所有其他变量City_Index 可以成为我们的单调变量**https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/1d1e125c24beeb013c9ee21a9112ad9e.png实际上这意味着我们正在强制例如洛杉矶加利福尼亚的温度始终比阿拉斯加安克雷奇的温度温暖我必须承认我查了谷歌因为我不知道阿拉斯加的任何城市。我们将通过“City_Index”变量和这两个函数来实现这一点cdn.embedly.com/widgets/media.html?srchttps%3A%2F%2Fjovian.com%2Fembed%3Furl%3Dhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F10%26cellId%3D5dntp1display_nameJovianurlhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F10%26cellId%3D5imagehttps%3A%2F%2Fapi.jovian.com%2Fapi%2Fgist%2F20b060f308fb4604b5c91d5f336ef8ab%2Fpreview%2F76f438de4ea54450a3d7f87b1e8d6a3f%3Fts%3D1711597080325keya19fcc184b9711e1b4764040d3dc5c07typetext%2Fhtmlscrollautoschemajovian现在我们将创建一个包含新的 City_Index 变量的增强数据集将数据分为训练集和验证集使用训练数据来训练对 City_Index 进行单调性约束的时间序列 XGBoost 预测器并使用训练好的模型预测下一个值这是我们的测试方法cdn.embedly.com/widgets/media.html?srchttps%3A%2F%2Fjovian.com%2Fembed%3Furl%3Dhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F12%26cellId%3D8dntp1display_nameJovianurlhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F12%26cellId%3D8imagehttps%3A%2F%2Fapi.jovian.com%2Fapi%2Fgist%2F20b060f308fb4604b5c91d5f336ef8ab%2Fpreview%2F76f438de4ea54450a3d7f87b1e8d6a3f%3Fts%3D1711680215666keya19fcc184b9711e1b4764040d3dc5c07typetext%2Fhtmlscrollautoschemajovian(点击这里查看完整代码如果加载时间过长)这是我们的预测结果https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/335647d211d62501d32887118763209e.png单调性可以在params_constraints中看到。参数约束向量是一个除了我们想要保持单调性的特征之外都是0的向量。现在正如我们所看到的如果我们固定所有其他特征只改变 City_Index我们将看到单调行为cdn.embedly.com/widgets/media.html?srchttps%3A%2F%2Fjovian.com%2Fembed%3Furl%3Dhttps%3A%2F%2Fjovian.ml%2Fviewer%3Furl%3Dhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F10%26cellId%3D10%26hideOutput%3Dtruedntp1display_nameJovianurlhttps%3A%2F%2Fjovian.ml%2Fviewer%3Furl%3Dhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F10%26cellId%3D10%26hideOutput%3Dtruekeya19fcc184b9711e1b4764040d3dc5c07typetext%2Fhtmlscrollautoschemajoviancdn.embedly.com/widgets/media.html?srchttps%3A%2F%2Fjovian.com%2Fembed%3Furl%3Dhttps%3A%2F%2Fjovian.ml%2Fviewer%3Furl%3Dhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F10%26cellId%3D11dntp1display_nameJovianurlhttps%3A%2F%2Fjovian.ml%2Fviewer%3Furl%3Dhttps%3A%2F%2Fjovian.ml%2Fpiero-paialunga%2Fxgb-notebook%2Fv%2F10%26cellId%3D11keya19fcc184b9711e1b4764040d3dc5c07typetext%2Fhtmlscrollautoschemajovian完全单调。几乎线性这是我们事先施加的。这显示了使用 XGBoost 与 ARIMA、SARIMA 或多项式回归之间的区别使用 XGBoost您可以强制执行显式的单调行为。3. 结论让我占用您几分钟时间来总结一下我们在这里所做的工作我们引入了具有预测任务但有一些我们希望保留的单调特征的难题。在这些情况下像 ARIMA 或 RNN 这样的花哨方法可能会破坏单调性。简而言之我们通过“猜猜我是谁”示例介绍了 XGBoost 的概念并看到它可以通过修改提升算法可以选择的决策树来强制执行单调性。我们在一个玩具示例中使用了XGBoost以基本了解其语法的工作方式我们使用了气候变化数据并应用了预测研究但我们做的不仅仅是基本的预测。通过在新的特征‘City_Index’上施加单调递增的值我们基于预测温度相对于 City_Index 特征的单调性假设来预测温度。4. 关于我再次感谢您抽出宝贵时间。这对您来说意义重大 ❤我的名字是 Piero Paialunga就是我这里这位https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/4037376f60a7f790706cb2704368de34.png我是辛辛那提大学航空航天工程系的博士候选人也是 Gen Nine 的机器学习工程师。我在博客文章和领英上谈论人工智能和机器学习。如果您喜欢这篇文章并想了解更多关于机器学习的内容以及跟随我的研究您可以A. 关注我的**领英我在那里发布所有故事 B. 订阅我的通讯。这将让您了解新故事并有机会给我发信息以便接收所有更正或疑问。C. 成为推荐会员**这样您就不会有“每月故事最大数量”的限制您可以阅读我以及成千上万的机器学习和数据科学顶级作家关于最新技术的所有文章。如果您想向我提问或开始合作请在这里留言[email protected]
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

如何在阿里云部署网站关键词搜索优化外包

UNIX 终端控制与进程间通信详解 在 UNIX 系统编程中,终端控制和进程间通信是非常重要的部分。下面我们将详细介绍相关的知识。 终端控制 在 UNIX 中,有多种方式可以进行终端控制,这里我们主要探讨 System V 终端接口、BSD 终端控制等相关内容。 System V 终端接口 在 S…

张小明 2025/12/26 13:01:07 网站建设

株洲专业网站排名优化网站建设不包括以下哪个阶段

📈 算法与建模 | 专注PLC、单片机毕业设计 ✨ 擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导,毕业论文、期刊论文经验交流。✅ 专业定制毕业设计✅ 具体问题可以私信或查看文章底部二维码在智能门锁控制系统的核心架构与微控制器选…

张小明 2025/12/26 13:00:34 网站建设

二级域名网站好不好深圳实惠的专业建站公司

Cmder终极美化指南:5分钟让Windows命令行颜值爆表 【免费下载链接】cmder 项目地址: https://gitcode.com/gh_mirrors/cmd/cmder 厌倦了Windows默认的黑白命令行界面?想要一个既美观又实用的终端环境?Cmder作为Windows平台最受欢迎的…

张小明 2025/12/26 13:00:00 网站建设

南京新标特企业网站哪家广告做的正规的网站制作服务电话

在软件测试领域,传统的手动测试和脚本化自动化测试正面临日益增长的复杂性和效率挑战。随着人工智能(AI)技术的迅猛发展,下一代测试助手——智能测试机器人——正逐步从概念走向现实,为测试从业者带来革命性变革。 AI…

张小明 2025/12/26 12:59:26 网站建设

惠山区住房和建设厅网站数据分析师岗位要求

合规文化建设:从意识到行为的转变一、问题:合规意识浮于表面,落地难成常态在当今高度监管的商业环境中,合规已经成为企业经营的生命线。现实中许多企业在谈及合规时,往往将其视为一项“合规部门的责任”,或…

张小明 2025/12/26 12:58:53 网站建设

保定干洗机做网站wordpress 插件 卡

mmap 与 System V 共享内存对比 概述 mmap 和 System V 共享内存都是 Linux 中用于进程间通信(IPC)的机制, 两者都允许多个进程共享同一块物理内存, 实现零拷贝的高效通信. 本文档从使用方式、特点、实现机制等多个维度进行详细对比. 使用方式对比 API 对比 mmap 相关 API #inc…

张小明 2025/12/26 12:58:18 网站建设