STConvS2S: Spatiotemporal Convolutional Sequence to Sequence Network for weather forecasting 论文理解

摘要:

将机器学习模型应用于气象数据为地球科学领域带来了许多机会,例如更准确地预测未来的天气状况。近年来,使用深度神经网络对气象数据进行建模已成为相关研究领域。这些工作要么应用循环神经网络 (RNN),要么应用一些混合 RNN 和卷积神经网络 (CNN) 的混合方法。在这项工作中,我们提出了 STConvS2S(时空卷积序列到序列网络),这是一种仅使用卷积层来学习空间和时间数据依赖关系的深度学习架构。我们提出的架构解决了卷积网络使用历史数据预测序列的两个限制:(1)它们在学习过程中违反了时间顺序,(2)它们要求输入和输出序列的长度相等。使用来自南美的气温和降雨数据的计算实验表明,我们的架构捕捉时空背景,并且它优于或匹配用于预测任务的最先进架构的结果。特别是,我们提出的架构的一种变体在预测未来序列方面比用作基线的基于 RNN 的模型快 23%,训练速度快 5 倍。

重点:

我们没有对 3D 卷积层采用传统的 t d d 内核,其中 d 和 t 分别是空间 (H W) 和时间 (T) 维度的内核大小,我们使用从 R( 2 + 1) D 网络,由 Tran 等人提出。
[24]。分解后的内核 1 d d 和 t 1 1 将一层的卷积操作分成两个连续的操作,在他们的工作中称为空间卷积和时间卷积。在我们的新架构中,我们采用了不同的方法:每个卷积层内的操作不是连续的。相反,分解后的内核被分成两个块,赋予它们特定的学习技能。时间块在其层中应用 t 1 1 内核以仅学习时间依赖关系,而下一个组件空间块使用 1 d d 内核封装空间依赖关系。图 2 示意性地说明了这三种方法之间的区别。

分析:

主要提出一种处理时间的卷积方法 参考文献24提出 使用的数据集也是再分析数据集