上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.6 下一步
在本章中,我们为预测项目开发了四个不同的基线。我们使用了整个训练集的算术平均值、训练集的最后一年的均值、训练集的最后已知数值和简单的季节性数据进行预测。然后使用MAPE指标在测试集上评估每个基线。图2.12总结了我们在本章中开发的每个基线的MAPE。正如你所看到的,使用简单的季节性预测的基线具有最小的MAPE,因此性能最佳。
图2.12 本章中开发的四个基线的MAPE。MAPE越小,基线越好,因此,我们将选择简单的季节性基线作为我们的基准,并将其与我们更复杂的模型进行比较
请记住,基线模型是比较的基础。我们将通过应用统计学习或深度学习技术来开发更复杂的模型,当我们针对测试集评估更复杂的解决方案并记录误差指标时,我们可以将它们与基线进行比较。在我们的例子中,我们将把复杂模型的MAPE与我们简单的季节性预测的MAPE进行比较。如果一个复杂模型的MAPE小于11.56%,那么我们就知道我们有一个表现更好的模型。
在某些特殊情况下,只能使用简单的方法来预测时间序列。这些是过程随机移动并且不能使用统计学习方法预测的特殊情况。这意味着我们处于随机游走的状态——我们将在第3章中对此进行研究。
小结
❍时间序列预测从基线模型开始,作为与更复杂模型进行比较的基准。
❍对于我们的预测问题,基线模型是一个微不足道的解决方案,因为它只使用启发式或简单的统计数据,如均值。
❍MAPE代表平均绝对百分比误差,它是预测值偏离实际值多少的直观度量。
❍有许多方法可以开发基线。在本章中,你了解了如何使用均值、最后一个已知值或上一个季度数据来开发基线。