支持向量机回归的降水量预测
摘 要西安地区位于北半球暖温带,地处关中平原,属半干旱、半湿润的大陆性季风气候,常年易旱,不仅水资源总量供给不足,而且在时空分布上亦不均匀。作为本地区水资源最直接来源之一的大气降水,其变化趋势极大程度上左右着该资源储量。因此,研究西安地区降水时空序列变化趋势及分布特征,可为水资源分析计算、水资源合理开发利用、水资源中长期规划、以及水利工程建设等提供重要的科学依据。本文在查阅大量国内外相关文献资料的基础上,通过观察研究统计年鉴中的一维时间序列观测资料,挖掘其中丰富多样的预报信息作为特征值选择的重要来源,建立了以每月平均气温为样本集的多种模型进行比较分析,并且利用网格参数寻优函数交叉验证得到模型最优参数,进而完成了对预报模型的建立。随后比较分析了不同特征值样本在训练集和测试集两部分的表现情况,根据所选评价指标得到最优降水预测模型。经过实地调研、资料收集、理论分析与数学模型的研究方法和技术路线,主要取得了如下成果:(1)结合评价指标简要对比了人工神经网络与支持向量机回归两种方法,实验结果表明支持向量机回归的预测模型性能优于基于神经网络的模型,具备更高的预测精度和更好的推广能力。(2)在预测中,以陕西西安地区为实例,对比分析了支持向量机回归的短期降水量预测方法。结果表明在短期降水量预测中支持降水量回归算法为预报建模提供了新的方向和方法。
目 录
摘要 I
ABSTRACT II
第1章 绪论 1
1.1 研究背景与意义 1
1.2 国内外研究现状 1
1.3 研究方法 3
第2章 支持向量机理论概述 4
2.1 支持向量机概念 4
2.2 支持向量机理论基本原理 4
第3章 区域概况 7
3.1 自然地理条件 7
3.1.1 地理位置 7
3.1.2 地形地貌 7
3.1.3 土壤植被 9
3.1.4 径流 9
3.2 气象因素 9
3.2.1 气温 9
3.2.2 降水 10
3.2.3 湿度和蒸发 11
3.3 水文地质 12
3.3.1 流向 12
3.
*好棒文|www.hbsrm.com +Q: ^351916072*
3.2 补给 12
3.3.3 水位动态 13
3.4 区域地质 13
第4章 降水量预测模型 14
4.1 样本数据选择 14
4.2 预报模型建立 14
4.3 预报模型评价 17
4.4 模型预测 18
4.5 预测结果分析 19
4.6 与人工神经网络算法比较 19
第5章 总结与展望 21
5.1 总结 21
5.2 展望 21
第6章 致谢 23
第1章 绪论
1.1 研究背景与意义
近几十年来,全球气候变化异常【18】,降水、蒸发、径流、土壤湿度等一众水循环过程均在不同程度上受到了显著影响。据IPCC (Intergovernmental Panel on Climate Change)报道,全球平均气温已上升了0.6±0.2℃,达到了千年以来的峰值,且温度上升趋势仍在持续。在全球气候变暖加剧的时代背景下,中国也概莫能外。中国工程院在《第三次气候变化国家评估报告》中提出,我国地表温度上涨幅度迅猛,大于全球均值,且未来十至五十年其平均温度仍将保持上升趋势,年度平均气温增长幅度总体从西北向东南逐减,2013年南方地区出现了六十年来最强部分地区增温。同时降水量变化呈现分布不均、年平均降雨日数下降、暴雨日数上涨的局势,近三十年来,气温升高已导致我国海平面上升共约9厘米,远超全球平均值。
上述现象无疑对水资源、环境、工业和农业的发展提出了重大挑战,环境污染恶化、气象灾害加剧、粮食安全频发、水文资源时空分布变化等一系列问题的出现,对全球经济和生态环境的发展造成了恶劣影响。其中水资源更是首当其冲。作为万物生命之源,水在人类的日常生命活动扮演着举重若轻的角色。然而伴随着全球气候变暖,众多国家、地区陆续出现了水资源短缺、水文环境污染等危机,如何探究和解决这些问题,已经不可避免地在当代社会的发展中提上日程。
要研究和利用水资源,人们必须重点了解降水问题。地球上水资源存储形式分基本为地表用水、土壤用水和地下用水,降水是其重要来源,为无论是地下水还是地表水提供源源不断的补给。大气降水作为水资源中可持续利用的重要资源,同时也是首要气象因素之一,是水文资源评价体系中的不可或缺的组成成分,对人们的生产、生活方面都有着巨大的影响。因此准确预测降水量,对于气象预报、提前做好防洪减灾防范工作、安排工农业生产来说,具备巨大的理论价值和实用价值,亦有利于我国经济更加健康快速地发展,促进社会经济的可持续。
1.2 国内外研究现状
降水量能在很大程度上反映灾害的发生趋势,是国家防灾减灾的重要参数,同时对农业生产、工程应用和水土流失等问题有着重要的意义。水利和农业部门对抗旱排涝的防范能力通过准确预测一个地区的降水量可以得到显著提高,同时灾害带来的危害性也得以降低。故而预测降水在作为一个重要的研究领域课题同时,由于其影响因素众多且数据常常不太完整等现实因素的困扰,预测的准确性向来成为一个十分棘手的问题。
现今对于时间序列数据建模,已有包括自回归(AR)、滑动平均(MA)、自回归滑动平均(ARMA)和自回归积分滑动平均(ARIMA)等在内的诸多方法,但预测值往往较趋于平均,对极值预测不够准确【19】。由于气象条件多变异且复杂,降水问题存在着很强的不确定性。而这些算法模型往往囿于预测暂时性的变化,不能很好地应对那些波动较大的非平稳时间序列的预测。近几年,一些具有更高能力的进步技术已被用作建模的新工具,比如,随着人工智能和机器学习预测技术的不断成熟,神经网络(ANN)、支持向量机(SVM)等方法渐渐进入人们视野,被广泛应用于众多技术领域,各自展现出了优秀性能。这些方法通过良好的非线性学习能力,在包括降水在内的对时间序列数据的预测方向,解决了被测变量随机性和不准确性问题的困扰,提高了预测精度。
由于在图象识别领域中的显著成绩,人工神经网络技术已经被应用于模拟包括水文过程在内的各种非线性时间序列的预测,并且展示出了令人惊叹的表现,比如Kisi于2003年对洪水的预测【1】;Traore等人和Harris等人分别于2008年和2002年对悬浮泥沙的估计验证【2】【3】;Bae等人于2007年对入库洪水进行的预报【4】,Solaimani于2009年对降雨径流的预测【5】;以及Babel等人和Valverde Ramírez等人分别于2009年、2005年对降水量进行预测【6】【7】,其中Valverde Ramírez等人使用多层前馈感知神经网络来预测日常降水量。大量研究结果表明,人工神经网络方法性能表现远胜于线性回归模型。此后, Saplioglu等人于2010年使用三层的前馈神经网络来预测降雨量,并表示人工神经网络模型比加权谐波装置的一般方法具备更好的配接值【8】;ElShafie 等人于2011年研究了神经网络技术在降水量预测准确性上的表现,证明了神经网络比其他线性方法更好【9】。
与此同时,基于结构风险最小化的支持向量机逐渐开始代替基于经验风险最小化的人工神经网络而被各技术领域接纳并使用。由于基于经验风险最小化在捕获一个局部最小值方面可能会导致网络过拟合问题,但是经验误差和模型复杂度能同时经由结构风险最小化,进而支持向量机分类或回归问题的泛化能力就大幅提高,使得许多学科的应用得到了改善。近几年,支持向量机已被广泛地用于预测水资源,尤其是在预测降雨量、洪水和水库水位变化等方面,比如:Khan和Coulibaly在2006年研究了支持向量机在降雨径流预测【10】;Asefa等人和Khalil等人分别于2005年和2006年对湖水水位进行预测【11】【12】;Yu 等人于2006年在洪水和水流等方面的预测【13】;以及Radhika和Shasshi于2009年对SVM在大气温度预测方面的表现进行了评价【14】。
目 录
摘要 I
ABSTRACT II
第1章 绪论 1
1.1 研究背景与意义 1
1.2 国内外研究现状 1
1.3 研究方法 3
第2章 支持向量机理论概述 4
2.1 支持向量机概念 4
2.2 支持向量机理论基本原理 4
第3章 区域概况 7
3.1 自然地理条件 7
3.1.1 地理位置 7
3.1.2 地形地貌 7
3.1.3 土壤植被 9
3.1.4 径流 9
3.2 气象因素 9
3.2.1 气温 9
3.2.2 降水 10
3.2.3 湿度和蒸发 11
3.3 水文地质 12
3.3.1 流向 12
3.
*好棒文|www.hbsrm.com +Q: ^351916072*
3.2 补给 12
3.3.3 水位动态 13
3.4 区域地质 13
第4章 降水量预测模型 14
4.1 样本数据选择 14
4.2 预报模型建立 14
4.3 预报模型评价 17
4.4 模型预测 18
4.5 预测结果分析 19
4.6 与人工神经网络算法比较 19
第5章 总结与展望 21
5.1 总结 21
5.2 展望 21
第6章 致谢 23
第1章 绪论
1.1 研究背景与意义
近几十年来,全球气候变化异常【18】,降水、蒸发、径流、土壤湿度等一众水循环过程均在不同程度上受到了显著影响。据IPCC (Intergovernmental Panel on Climate Change)报道,全球平均气温已上升了0.6±0.2℃,达到了千年以来的峰值,且温度上升趋势仍在持续。在全球气候变暖加剧的时代背景下,中国也概莫能外。中国工程院在《第三次气候变化国家评估报告》中提出,我国地表温度上涨幅度迅猛,大于全球均值,且未来十至五十年其平均温度仍将保持上升趋势,年度平均气温增长幅度总体从西北向东南逐减,2013年南方地区出现了六十年来最强部分地区增温。同时降水量变化呈现分布不均、年平均降雨日数下降、暴雨日数上涨的局势,近三十年来,气温升高已导致我国海平面上升共约9厘米,远超全球平均值。
上述现象无疑对水资源、环境、工业和农业的发展提出了重大挑战,环境污染恶化、气象灾害加剧、粮食安全频发、水文资源时空分布变化等一系列问题的出现,对全球经济和生态环境的发展造成了恶劣影响。其中水资源更是首当其冲。作为万物生命之源,水在人类的日常生命活动扮演着举重若轻的角色。然而伴随着全球气候变暖,众多国家、地区陆续出现了水资源短缺、水文环境污染等危机,如何探究和解决这些问题,已经不可避免地在当代社会的发展中提上日程。
要研究和利用水资源,人们必须重点了解降水问题。地球上水资源存储形式分基本为地表用水、土壤用水和地下用水,降水是其重要来源,为无论是地下水还是地表水提供源源不断的补给。大气降水作为水资源中可持续利用的重要资源,同时也是首要气象因素之一,是水文资源评价体系中的不可或缺的组成成分,对人们的生产、生活方面都有着巨大的影响。因此准确预测降水量,对于气象预报、提前做好防洪减灾防范工作、安排工农业生产来说,具备巨大的理论价值和实用价值,亦有利于我国经济更加健康快速地发展,促进社会经济的可持续。
1.2 国内外研究现状
降水量能在很大程度上反映灾害的发生趋势,是国家防灾减灾的重要参数,同时对农业生产、工程应用和水土流失等问题有着重要的意义。水利和农业部门对抗旱排涝的防范能力通过准确预测一个地区的降水量可以得到显著提高,同时灾害带来的危害性也得以降低。故而预测降水在作为一个重要的研究领域课题同时,由于其影响因素众多且数据常常不太完整等现实因素的困扰,预测的准确性向来成为一个十分棘手的问题。
现今对于时间序列数据建模,已有包括自回归(AR)、滑动平均(MA)、自回归滑动平均(ARMA)和自回归积分滑动平均(ARIMA)等在内的诸多方法,但预测值往往较趋于平均,对极值预测不够准确【19】。由于气象条件多变异且复杂,降水问题存在着很强的不确定性。而这些算法模型往往囿于预测暂时性的变化,不能很好地应对那些波动较大的非平稳时间序列的预测。近几年,一些具有更高能力的进步技术已被用作建模的新工具,比如,随着人工智能和机器学习预测技术的不断成熟,神经网络(ANN)、支持向量机(SVM)等方法渐渐进入人们视野,被广泛应用于众多技术领域,各自展现出了优秀性能。这些方法通过良好的非线性学习能力,在包括降水在内的对时间序列数据的预测方向,解决了被测变量随机性和不准确性问题的困扰,提高了预测精度。
由于在图象识别领域中的显著成绩,人工神经网络技术已经被应用于模拟包括水文过程在内的各种非线性时间序列的预测,并且展示出了令人惊叹的表现,比如Kisi于2003年对洪水的预测【1】;Traore等人和Harris等人分别于2008年和2002年对悬浮泥沙的估计验证【2】【3】;Bae等人于2007年对入库洪水进行的预报【4】,Solaimani于2009年对降雨径流的预测【5】;以及Babel等人和Valverde Ramírez等人分别于2009年、2005年对降水量进行预测【6】【7】,其中Valverde Ramírez等人使用多层前馈感知神经网络来预测日常降水量。大量研究结果表明,人工神经网络方法性能表现远胜于线性回归模型。此后, Saplioglu等人于2010年使用三层的前馈神经网络来预测降雨量,并表示人工神经网络模型比加权谐波装置的一般方法具备更好的配接值【8】;ElShafie 等人于2011年研究了神经网络技术在降水量预测准确性上的表现,证明了神经网络比其他线性方法更好【9】。
与此同时,基于结构风险最小化的支持向量机逐渐开始代替基于经验风险最小化的人工神经网络而被各技术领域接纳并使用。由于基于经验风险最小化在捕获一个局部最小值方面可能会导致网络过拟合问题,但是经验误差和模型复杂度能同时经由结构风险最小化,进而支持向量机分类或回归问题的泛化能力就大幅提高,使得许多学科的应用得到了改善。近几年,支持向量机已被广泛地用于预测水资源,尤其是在预测降雨量、洪水和水库水位变化等方面,比如:Khan和Coulibaly在2006年研究了支持向量机在降雨径流预测【10】;Asefa等人和Khalil等人分别于2005年和2006年对湖水水位进行预测【11】【12】;Yu 等人于2006年在洪水和水流等方面的预测【13】;以及Radhika和Shasshi于2009年对SVM在大气温度预测方面的表现进行了评价【14】。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/849.html