Page 12 - 电力与能源2022年第二期
P. 12
1 1 2 柳 杰, 等: 基于残差 - 密集连接 - 双向长短期记忆融合网络的光伏出力短期预测
性也可相应提高。然而, 深层网络存在着梯度消 般的循环神经网络( RNN ) 存在的长期依赖问题
失或者爆炸的问题, 导致模型层数越多, 训练越难 而专门设计出来的, 由t 时刻的输入、 单元状态、
以收敛。 临时单元状态、 隐藏状态、 遗忘门、 记忆门、 输出门
为解决梯度消失或梯度爆炸以及退化问题, 组成, 其结构如图 1 所示。
有学者提出了残差网络结构( ResNet ) 、 稠密连
[ 18 ]
接网络结构( DenseNet ) 。 ResNet模型的核心
[ 19 ]
是通过建立前面层与后面层之间的“ 短路连接”,
实现训练过程中梯度的反向传播, 从而训练出更
深层的网络。 DenseNet的提出, 同样是为了解决
深层网络梯度退化的问题。 DenseNet通过建立
前面所有层与后面层的密集连接, 直接连接不同
层的特征, 实现特征重用。 DenseNet可极大降低
网络参数的数据, 并通过特征重用避免过多的冗
图 1 LSTM 的结构
余特征。 ResNet和 DenseNet也广泛用于构建深
LSTM 适合处理和预测 时 间 序 列 中 间 隔 和
层的时间序列预测模型。文献[ 20-23 ] 将 LSTM
延迟非常长的重要事件。 STM 的输出表达式为
与 ResNet 、 DenseNet 进 行 组 合, 希 望 使 用 Res-
) ( 1 )
i t =ϕ ( Wxi X t+W Hi h t - 1 + b i
Net 、 DenseNet 获 取 空 间 特 征 或 局 部 特 征, 使 用
) ( 2 )
f t =ϕ ( Wx f X t+W Hf h t - 1 + b f
LSTM 获取序列特征。
) ( 3 )
对于同时依赖前后信息的时间序列, 双向长 o t =ϕ ( Wxo X t+W Ho h t - 1 + b o
。 )
c t =f t C t - 1 + i t tanh ( Wxc X t+W Hc h t - 1 + b c
短期 记 忆 网 络 ( BidirectionalLSTM , 简 称 BiL-
( 4 )
STM ) 有着更好的预测效果。文献[ 22 ] 提出基于
。 ) ( 5 )
BiLSTM 的密集连接网络进行超短期风电出力预 h t =o t tan h ( c t
测, 采用长 BiLSTM 、 短 BiLSTM 并联的方式 来 ϕ ( z ) = 1 ( 6 )
1+e - z
分别学习长期趋势和短期趋势, 实现了对新能源
式中 ϕ ——— Si g moid 函数; tan h ———双曲正切函
出力峰值的更准确预测。 ———输入、 遗 忘、 输 出 门 和
数; W ———权重; b i , f , o , c
这些研 究 表 明, 基 于 深 层 网 络 的 深 度 学 习
单元的偏差; X t ———层的输入; h t ———层的输出;
对于时间 序 列 预 测 准 确 度 的 提 高 十 分 有 效, 众
———两个向量的逐项乘积。
多研究也针对准确度提升来 设计预测模型的网
BiLSTM 的思 想 来 自 于 双 向 循 环 神 经 网 络
络结构。为 此, 本 文 提 出 残 差、 密 集 连 接、 双 向
( RNN ), 数据序列用两个隐藏层进行前向和反向
长短 时 记 忆 融 合 的 网 络 结 构, 综 合 ResNet 、
处理。 BiLSTM 由前向 LSTM 与后向 LSTM 组
DenseNet以及 Bi-LSTM 的 特 点, 进 行 光 伏 出 力 合而成, 通过双向的学习提高传统时间循环网络
的短期预测。
的准确率。 BiLSTM 的结构如图 2 所示。
1 光伏出力短期预测模型结构
本文结合 BiLSTM 、 ResNet 、 DenseNet在时
间序 列 数 据 预 测 上 的 特 点, 设 计 了 基 于 Res-
Dense-BiLSTM 融 合 网 络 ( Inte g rated ResNet-
DenseNet-BiLSTM Network ,简 称 IRD-BiL-
STM ) 的光伏出 力 短 期 预 测 模 型。下 面 对 IRD-
BiLSTM 中关键 结 构 块 以 及 总 体 结 构 进 行 详 细
阐述。 图 2 BiLSTM 的结构
1.1 双向长短期记忆网络的结构 BiLSTM 的输出表达式为
[ 24 ] , ( 7 )
长短期记忆网络 ( LSTM ) 是 为 了 解 决 一 h t =concat ( h t h t ' )
BD

