新闻中心

基于Minitab预测分析模块的比特币数据分析(比特币预测涨跌)

2023-11-18
浏览次数:215次
返回列表

随着比特币的日益普及,越来越多的分析师试图更好地理解这一现象。虽然很难准确预测比特币的实际价格,但仍有可能查明一些有趣的趋势和关系。在下面的内容中,我们将了解到如何使用Minitab预测分析模块来完成这项任务。

实际的比特币数据可以从许多公共来源获得。可以下载一个非常有用的数据集。

该数据集包括每天的比特币统计数据,可以追溯到2009年。每一天都有44种不同的衡量标准,包括比特币价格、各种收费、分组计数、交易计数、投资回报等等。

为便于分析,我将查看2015年1月1日至2021年4月20日期间的比特币每日统计数据。这消除了一些早期的历史,这些历史可能会削弱最近的趋势。该数据集包含一个名为ROI30d的变量--假设在30天前购买了该资产,该资产的投资回报率为百分之一。接下来,我的主要目标将是利用剩余的变量作为潜在的预测指标,对30天的投资回报做出准确的预测。

01数据摘要

首先,让我快速查看使用Minitab的各种数据摘要。

以下是30天投资回报的时间序列图:

正如你所看到的,投资比特币可以带来丰厚的回报或巨大的损失。鉴于这一资产的波动性,投资比特币的时机对回报至关重要。因此,了解回报的影响可以帮助确定什么时候是投资的最佳时机。

02确定最重要的预测因素

所以我们经常被问到问题,需要在最短的时间内找到最好的答案。有了44个可能的预测因子,我需要知道哪一个最重要,我需要尽快知道,这样我就可以进行分析了。

这就是为什么Minitab预测分析模块有一个名为“发现关键预测器”的选项。这个选项允许我让软件识别最重要的变量,使我能够建立一个仍然是高度精确,但远没有那么复杂的模型,使它更加用户友好。

我使用我的数据集并通过TreeNet“发现关键预测器”来运行它。正如预期的那样,Minitab从提供的候选预测器集合开始,然后依次构建一系列模型,每个后续模型通过删除最不重要的变量使用一个较少的预测器。因此,整个过程是从经典回归模型中得知的向后消去过程的现代推广。下面是从完整的预测器(不包括日期)开始时发生的情况:

看一下我可能的模型的图形可视化,您可以看到模型的准确性在90%左右波动,直到只剩下两个预测器。当我深入分析时,“发现关键预测器”揭示了AssetEODCompletionTime是“最后一个站立的人”或最重要的预测器。

不幸的是,从数据字典中查找它的定义,这个“预测器”仅仅是每天收集最后一次数据的时间,这不是一个有用的度量。因此,我想消除这一点,因为我知道--当然--这些可能是相关的,但不是预测性的。这在预测器选择中并不少见:机器通常会首先选择一堆无用的玩家。此示例还强调了将预测分析与主题知识结合在一起的重要性。幸运的是,解决方案很简单--只需将其从变量的起始列表中删除,然后重新进行“发现最佳预测器”分析!

在从原始列表中删除AssetEODCompletionTime并重新启动预测器发现过程后,我获得以下总结:

注意,Minitab的引擎强调,最优模型使用8个原始变量(度量),在50%的测试分区上达到91%的R平方。对于这种类型的回归模型来说,这是一个极好的性能结果!另外要注意的是,模型性能的统计变化在90%左右。

Minitab也给了我一个有用的可视化,模型的总体精度只有在预测器数低于3时才会显著下降。为了建立最简单的模型,同时最大限度地提高模型的准确性,我选择了一个有3个预测器的模型进行更详细的分析。或者,您可以从原始候选列表中删除其中一些变量,并重新执行最佳预测器搜索,以确定不同的赢家子集。记住,在这个例子中,我试图快速确定什么是重要的。如果最大的精度是你的目标,你可能会选择最优的模型。机会是无限的,不管你的目标是什么,你只要点击几下就可以轻松地完成它!

03数据摘要

回到我的例子。现在,我将更仔细地看一看上面选择的3变量模型。以下是该模型的总结性能:

正如你所看到的,我们在50%的测试样本上有88%以上的准确性--一个很好的结果!此外,Minitab报告了三种尚存指标对该模型的总体贡献的相对排名:

与3天投资回报相关的最重要变量是CapMVRVCur。事实证明,这个变量概括了市场可能高估/低估的情况。下面是这个变量在过去6年中的时间序列图:

这个指标似乎在1.0到4.0之间波动,目前的数值在3.3左右,可能还在下降。下面是关于此度量的更详细说明:

(创造这一比率背后的直觉是将价格函数除以“基本面”,代之以已实现的资本化(见资本化,已实现,美元)。这给出了一个比率,它潜在地指示了高估期(当网络价值远远超过其与已实现上限的历史关系时)和低估时期。已实现上限是一个强有力的基础,因为它可以理解为持有人在某一特定时间的平均成本基础,因此两者的比率表明持有者是否在水下,从而洞察总体情绪。)

Treenet梯度提升模型还揭示了这一指标对30天投资回报的贡献的本质:

回想一下,这一指标的最新数值在3.3左右波动,可能还会继续下降。从上面的依赖情节来看,很明显,如果真的是这样的话,那么我们预计3天的ROI将继续下降。或者,如果有任何理由相信这一指标将增加到3.7或更高,我们可能预计在历史模式的基础上,投资回报率会大幅上升。

以上一系列步骤模拟了预测分析中遇到的典型场景。我们从一个包含44个变量的数据集开始,很快就在几分钟内找到了最重要的预测因素。关键预测器的选择创建了一条捷径,以避免每次查看每个变量的潜在繁琐和费力的过程。此外,TreeNet梯度增强模型具有很好的精度。所有这些都突出了现代预测分析的力量,并说明了为什么你需要它前进!

本文最初出现在Minitab博客上。

搜索