摘要:
基于光谱的土壤氮含量预测模型泛化能力弱是制约其推广应用的瓶颈。鉴于特征提取及非线性表达能力方面的优势,深度学习模型具有较强的泛化能力。提出一种融合自动编码器和卷积神经网络(Encoder-CNN)的土壤氮含量光谱预测模型,探索模型结构和参数对模型性能的影响。根据以往研究成果和相关性分析,获得180个与氮含量强相关的波长,将其作为Encoder-CNN模型输入,而将土壤氮含量作为模型输出。Encoder-CNN模型利用自动编码器的编码部分进行光谱数据降维,然后输入到卷积神经网络进行土壤氮含量预测。设计2种网络结构,每种网络结构包含2种不同参数设置,共4个模型,用以探索Encoder-CNN土壤氮含量光谱预测模型结构和参数对模型性能的影响。利用公开数据集LUCAS对模型进行训练。按3σ原则对公开数据集LUCAS进行异常值检测与处理,获得20791个数据,其中18711个样本作为训练集,2080个样本作为测试集,对Encoder-CNN模型进行训练。结果表明:对于自动编码器,在相同隐含层数下,最后的隐含层神经元个数为30时,复现效果最优。增加隐含层数,会提升复现效果。增加卷积核数量,特别是尺寸为1×1卷积核,能够提高模型的预测性能与可靠性。增加池化层的网络结构,模型预测精度提升至0.90以上。增加全连接层神经元数量也会提升模型性能。利用自采集的黑龙江黑土实时光谱数据集进行模型迁移,观察模型泛化能力。当模型迭代100次后,在黑龙江数据集上的预测精度即可达到0.90以上;当迭代次数为900时,模型在训练集和测试集上的预测精度可以达到0.98。结果表明,所构建的Encoder-CNN土壤氮含量光谱预测模型具有较好的泛化能力。