2.1 定义基线模型_Python时间序列预测-QQ阅读男生轻小说网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

2.1 定义基线模型

一个基线模型是我们问题的一个简单解决方案。它通常使用启发式方法或简单的统计数据来生成预测。基线模型是你能够想到的最简单解决方案，它不需要任何训练，并且实施成本应该非常低。

你能思考出我们项目的基线吗

已知我们想要预测强生公司的每股收益，你能做的最基本、最简单的预测是什么？

在时间序列的上下文中，我们可以用来建立基线的一个简单统计数据是算术平均数。我们可以简单地计算一段时间内这些值的均值，并假设未来的值将等于该均值。在预测强生公司每股收益的背景下，这就像是在说：

1960～1979年间的平均每股收益为4.31美元。因此，我预计1980年未来四个季度的每股收益将相当于每季度4.31美元。

另一种可能的基线是简单地预测最后记录的数据点。在强生公司的背景下，这就像是在说：

如果本季度的每股收益为0.71美元，那么下个季度的每股收益也将为0.71美元。

或者，如果我们在数据中看到周期性模式，我们可以简单地在未来重复该模式。在强生公司的背景下，这就像是在说：

如果1979年第一季度的每股收益为14.04美元，那么1980年第一季度的每股收益也将为14.04美元。

你可以看到，这三个可能的基线依赖于在我们的数据集中观测到的简单统计数据、启发式方法和模式。

基线模型

基线模型是预测问题的一个简单的解决方案。它依赖于启发式或简单的统计，通常是最简单的解决方案。它不需要模型拟合，易于实现。

你可能想知道这些基线模型是否有用。这些简单的方法能在多大程度上预测未来？我们可以通过对1980年进行预测，并用1980年的观测数据检验预测，来回答这个问题。这被称为非样本预测，因为我们在开发模型时未考虑周期进行预测。通过这种方式，我们可以衡量模型的性能，并理解当我们预测超出我们所拥有的数据时，它们的表现如何，在这种情况下是1981年及以后。

接下来你将学习如何制定此处提到的不同基线，以预测强生公司的季度每股收益。