数据资源: 中文期刊论文

基于LSTM的活立木茎干水分缺失数据填补方法



编号 zgly0001695844

文献类型 期刊论文

文献题名 基于LSTM的活立木茎干水分缺失数据填补方法

作者 宋维  高超  赵玥  赵燕东 

作者单位 北京林业大学工学院  北京林业大学城乡生态环境北京实验室  北京工商大学计算机与信息工程学院 

母体文献 林业科学 

年卷期 2020年02期

年份 2020 

分类号 TP183  S718.43 

关键词 缺失数据  数据填补  时间序列  LSTM神经网络  茎体水分 

文摘内容 【目的】研究植物茎体水分数据,针对相同数据段上的缺失数据,对比不同数据填补方法,验证LSTM模型填补茎干水分数据的有效性及准确性。【方法】选取2017年6月份栽种在北京市海淀区的紫薇树茎体水分完整数据,人工删去部分数据作为缺失数据,分别使用插值方法、RNN神经网络、LSTM神经网络对缺失部分进行填补,填补结果与原始数据比对并分析结果。基于神经网络预测值误差随预测时刻推后而增大的误差分布情况,本文提出了在神经网络预测值基础上加入对数据后期处理的方法:从缺失数据的正向和反向进行预测,将2个方向的预测值各自乘以一组按照预测时刻递减的权重值并相加,结合2个预测方向的优势,进一步提高预测准确度。【结果】3种方法中,RNN与LSTM神经网络方法较传统的插值方法优势明显:插值方法准确度在缺失值增多时迅速下降;神经网络方法下降速度较慢。当填补值与真实值误差在2%以内作为准确时,插值方法的填补准确率不足50%,RNN方法达到50%且不足60%,LSTM方法达到80%以上;当填补值与真实值误差在4%以内作为准确时,插值方法填补准确率为60%,RNN方法准确度最高达到90%,LSTM方法准确率在95%以上。在此基础上加入权重处理,对LSTM预测结果处理后误差在2%以内准确率达到97%,误差在3%以内准确率达到100%。选取一组测试数据代入模型,预测结果比训练数据预测结果精度有所下降,但双向预测方式优势更加明显。【结论】采用基于LSTM模型的双向综合预测法,可显著减小长期预测中的累计误差对预测结果的影响,提升了预测数据的准确度。与其他两类数据填补方法相比,基于LSTM神经网络的数据填补方法在长期缺失的时间序列数据填补上有较大优势。

相关图谱

扫描二维码