Python时间序列预测
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1 定义基线模型

一个基线模型是我们问题的一个简单解决方案。它通常使用启发式方法或简单的统计数据来生成预测。基线模型是你能够想到的最简单解决方案,它不需要任何训练,并且实施成本应该非常低。

你能思考出我们项目的基线吗

已知我们想要预测强生公司的每股收益,你能做的最基本、最简单的预测是什么?

在时间序列的上下文中,我们可以用来建立基线的一个简单统计数据是算术平均数。我们可以简单地计算一段时间内这些值的均值,并假设未来的值将等于该均值。在预测强生公司每股收益的背景下,这就像是在说:

1960~1979年间的平均每股收益为4.31美元。因此,我预计1980年未来四个季度的每股收益将相当于每季度4.31美元。

另一种可能的基线是简单地预测最后记录的数据点。在强生公司的背景下,这就像是在说:

如果本季度的每股收益为0.71美元,那么下个季度的每股收益也将为0.71美元。

或者,如果我们在数据中看到周期性模式,我们可以简单地在未来重复该模式。在强生公司的背景下,这就像是在说:

如果1979年第一季度的每股收益为14.04美元,那么1980年第一季度的每股收益也将为14.04美元。

你可以看到,这三个可能的基线依赖于在我们的数据集中观测到的简单统计数据、启发式方法和模式。

基线模型

基线模型是预测问题的一个简单的解决方案。它依赖于启发式或简单的统计,通常是最简单的解决方案。它不需要模型拟合,易于实现。

你可能想知道这些基线模型是否有用。这些简单的方法能在多大程度上预测未来?我们可以通过对1980年进行预测,并用1980年的观测数据检验预测,来回答这个问题。这被称为非样本预测,因为我们在开发模型时未考虑周期进行预测。通过这种方式,我们可以衡量模型的性能,并理解当我们预测超出我们所拥有的数据时,它们的表现如何,在这种情况下是1981年及以后。

接下来你将学习如何制定此处提到的不同基线,以预测强生公司的季度每股收益。