两成分混合gamma回归模型的参数估计
Gamma分布及其相关回归模型被广泛应用于环境科学、金融、医学等诸多领域。论文主要对两成分混合Gamma回归模型进行统计分析,具体包括两个方面一个是研究两成分混合Gamma回归模型的理论模型及其基本性质;另一个是运用Gauss-Newton迭代法、EM算法两种方法,研究两成分混合Gamma回归模型的参数估计。最后结合Monte Carlo随机模拟方法,通过Matlab统计软件进行数值模拟和计算,我们发现随着样本量的增加,基于Gauss-Newton迭代法和EM算法的参数估计值越接近真值;相比于Gauss-Newton迭代法,EM算法虽运算速度较慢,但对初值的选取依赖性较低。因此在一定程度上EM算法优于Gauss-Newton迭代法。
目录
摘要 1
关键词 1
Abstract 1
keywords 1
1 绪论 2
1.1研究目的及意义 2
1.2国内外研究现状 2
1.3 研究内容和文章结构安排 3
1.3.1研究内容 3
1.3.2文章结构安排 3
1.4 本文的创新之处 3
2 两成分混合Gamma回归模型的理论模型和基本性质 4
2.1 Gamma分布模型 4
2.2 Gamma回归模型 4
2.3混合Gamma分布模型 5
2.3.1一般混合Gamma 模型 5
2.3.2两成分混合Gamma模型及性质 5
2.4 两成分混合Gamma回归模型 6
3 两成分混合Gamma回归模型的参数估计 7
3.1极大似然估计的GaussNewton迭代法 7
3.2极大似然估计的EM算法 10
4 数据模拟 13
4.1基于GaussNewton迭代法的参数估计结果 13
4.2基于EM算法的参数估计结果 15
5 结论与展望 18
5.1结论 18
5.2本文的不足之处以及可进一步研究的问题 18
致谢 18
参考文献 18
两成分混合G *好棒文|www.hbsrm.com +Q: *351916072*
amma回归模型的参数估计
信科111 李志超
引言
1 绪论
1.1研究目的及意义
线性回归模型是统计学中较为常用的模型,其大多数的应用都基于正态性假设。但在环境科学、医学、金融、物理实验等领域,数据并不服从正态分布,且样本数据复杂多变。因此如何合理地对非正态数据进行回归分析,成为研究的热点。Gamma分布及其相应的回归模型对于非正态性数据拟合有较好的效果,如在研究可靠性分析中的寿命,生物学中的生存时间等方面。因为Gamma分布为偏态分布,它的形状参数直接影响其密度函数,越大其密度函数越接近正态密度;反之,越小偏态程度越严重。同时因为实际情况下,数据往往不来自同一总体,所以需要研究混合Gamma回归模型。本文在已有文献的基础上,对两成分混合Gamma回归模型进行了较为详细的统计分析。因此该课题的研究不仅具有一定的理论意义,还具有一定的实际意义。
1.2国内外研究现状
近来,随着人们对数据处理的要求越来越高,人们对原始数据直接拟合的关注度也开始增加。以前人们在面对非正态数据时,可能会先将其转化为正态数据,然后再对转化后的数据进行基于正态性假设的线性回归,但这种拟合方法的效果有时并不好。因此,使用偏态模型对非正态数据进行拟合得到广泛关注。例如张斌等利用Burr分布对多种非正态有偏移分布进行近似;Li和Xie研究了带重尾误差的一类生存回归模型的诊断问题等。
Gamma模型及其相应的回归模型在拟合非正态数据时也有诸多应用。如在可靠性工程中,当产品的失效可用Poisson过程冲击模型来描述时,其寿命就可以用Gamma分布来进行拟合;王娟等人运用广义Gamma回归模型对生存分析进行预测;秦凯伦等应用Gamma广义线性模型在年尺度上对大兴安岭塔河地区林火面积和当年及前一年防火期气象因子的关系进行了分析;此外GeaIzquierdo 等人运用Gamma回归模型对植物的种内斗争问题做了研究;Barber 等人将Gamma回归模型应用于同胞对的连锁分析实验中,且发现它比传统的HasemanElston回归方法效果更好。
而当数据来自于不同总体时,单一的模型已经无法满足数据拟合的需求,因此混合模型成为人们关注的焦点。例如贺宝龙将广义线性混合模型运用在精算分析中;Kamaruzzaman et al.等人对混合正态分布及其在某国家股票市场上的应用做了研究;此外 Quandt 和Ramsey对混合正态分布的估计方法进行研究;Xu和Wirjanto用混合正态分布对某地金融数据建立模型。
混合Gamma分布不仅可以拟合来自不同总体的正态数据,也可对来自不同总体的非正态数据进行拟合。例如丁恒等人运用混合Gamma分布函数,较为精确地拟合了交叉口到达车头时距;黄卓等人应用混合Gamma分布的参数估计方法对通用可靠性数据进行分析,且取得较好的拟合效果;Gharib研究了两成分混合Gamma分布,并对其基本性质进行了简单介绍。
关于参数的估计方法,也有较多相关的文献与成果。例如,Borman 较为清晰地介绍了EM算法及其相关推导过程;谢勤岚介绍了极大似然参数估计和基于EM算法的混合模型参数估计, 并使用计算机对该算法的有效性和收敛性进行验证;连军艳研究了EM算法在混合模型参数估计中的应用,并将其应用于高斯混合模型中。
在已有文献的基础上,本文将主要探讨两成分混合Gamma回归模型的参数估计,具体有极大似然估计和基于EM算法的参数估计,同时还将利用大量随机模拟来研究估计方法是否有效。
1.3 研究内容和文章结构安排
1.3.1研究内容
本文旨在研究两成分混合Gamma回归模型,探讨模型中参数的极大似然估计,并运用Matlab等软件进行随机模拟分析。具体研究内容如下:
(1)两成分混合Gamma回归模型的理论模型和基本性质;
(2)运用GaussNewton迭代法探讨两成分混合Gamma回归模型中参数的极大似然估计。
(3)运用EM算法探讨两成分混合Gamma回归模型中参数的极大似然估计。
(4)运用Matlab统计软件,结合Monte Carlo随机模拟方法,得出不同情况下的参数估计值,并对参数估计方法进行对比分析。
目录
摘要 1
关键词 1
Abstract 1
keywords 1
1 绪论 2
1.1研究目的及意义 2
1.2国内外研究现状 2
1.3 研究内容和文章结构安排 3
1.3.1研究内容 3
1.3.2文章结构安排 3
1.4 本文的创新之处 3
2 两成分混合Gamma回归模型的理论模型和基本性质 4
2.1 Gamma分布模型 4
2.2 Gamma回归模型 4
2.3混合Gamma分布模型 5
2.3.1一般混合Gamma 模型 5
2.3.2两成分混合Gamma模型及性质 5
2.4 两成分混合Gamma回归模型 6
3 两成分混合Gamma回归模型的参数估计 7
3.1极大似然估计的GaussNewton迭代法 7
3.2极大似然估计的EM算法 10
4 数据模拟 13
4.1基于GaussNewton迭代法的参数估计结果 13
4.2基于EM算法的参数估计结果 15
5 结论与展望 18
5.1结论 18
5.2本文的不足之处以及可进一步研究的问题 18
致谢 18
参考文献 18
两成分混合G *好棒文|www.hbsrm.com +Q: *351916072*
amma回归模型的参数估计
信科111 李志超
引言
1 绪论
1.1研究目的及意义
线性回归模型是统计学中较为常用的模型,其大多数的应用都基于正态性假设。但在环境科学、医学、金融、物理实验等领域,数据并不服从正态分布,且样本数据复杂多变。因此如何合理地对非正态数据进行回归分析,成为研究的热点。Gamma分布及其相应的回归模型对于非正态性数据拟合有较好的效果,如在研究可靠性分析中的寿命,生物学中的生存时间等方面。因为Gamma分布为偏态分布,它的形状参数直接影响其密度函数,越大其密度函数越接近正态密度;反之,越小偏态程度越严重。同时因为实际情况下,数据往往不来自同一总体,所以需要研究混合Gamma回归模型。本文在已有文献的基础上,对两成分混合Gamma回归模型进行了较为详细的统计分析。因此该课题的研究不仅具有一定的理论意义,还具有一定的实际意义。
1.2国内外研究现状
近来,随着人们对数据处理的要求越来越高,人们对原始数据直接拟合的关注度也开始增加。以前人们在面对非正态数据时,可能会先将其转化为正态数据,然后再对转化后的数据进行基于正态性假设的线性回归,但这种拟合方法的效果有时并不好。因此,使用偏态模型对非正态数据进行拟合得到广泛关注。例如张斌等利用Burr分布对多种非正态有偏移分布进行近似;Li和Xie研究了带重尾误差的一类生存回归模型的诊断问题等。
Gamma模型及其相应的回归模型在拟合非正态数据时也有诸多应用。如在可靠性工程中,当产品的失效可用Poisson过程冲击模型来描述时,其寿命就可以用Gamma分布来进行拟合;王娟等人运用广义Gamma回归模型对生存分析进行预测;秦凯伦等应用Gamma广义线性模型在年尺度上对大兴安岭塔河地区林火面积和当年及前一年防火期气象因子的关系进行了分析;此外GeaIzquierdo 等人运用Gamma回归模型对植物的种内斗争问题做了研究;Barber 等人将Gamma回归模型应用于同胞对的连锁分析实验中,且发现它比传统的HasemanElston回归方法效果更好。
而当数据来自于不同总体时,单一的模型已经无法满足数据拟合的需求,因此混合模型成为人们关注的焦点。例如贺宝龙将广义线性混合模型运用在精算分析中;Kamaruzzaman et al.等人对混合正态分布及其在某国家股票市场上的应用做了研究;此外 Quandt 和Ramsey对混合正态分布的估计方法进行研究;Xu和Wirjanto用混合正态分布对某地金融数据建立模型。
混合Gamma分布不仅可以拟合来自不同总体的正态数据,也可对来自不同总体的非正态数据进行拟合。例如丁恒等人运用混合Gamma分布函数,较为精确地拟合了交叉口到达车头时距;黄卓等人应用混合Gamma分布的参数估计方法对通用可靠性数据进行分析,且取得较好的拟合效果;Gharib研究了两成分混合Gamma分布,并对其基本性质进行了简单介绍。
关于参数的估计方法,也有较多相关的文献与成果。例如,Borman 较为清晰地介绍了EM算法及其相关推导过程;谢勤岚介绍了极大似然参数估计和基于EM算法的混合模型参数估计, 并使用计算机对该算法的有效性和收敛性进行验证;连军艳研究了EM算法在混合模型参数估计中的应用,并将其应用于高斯混合模型中。
在已有文献的基础上,本文将主要探讨两成分混合Gamma回归模型的参数估计,具体有极大似然估计和基于EM算法的参数估计,同时还将利用大量随机模拟来研究估计方法是否有效。
1.3 研究内容和文章结构安排
1.3.1研究内容
本文旨在研究两成分混合Gamma回归模型,探讨模型中参数的极大似然估计,并运用Matlab等软件进行随机模拟分析。具体研究内容如下:
(1)两成分混合Gamma回归模型的理论模型和基本性质;
(2)运用GaussNewton迭代法探讨两成分混合Gamma回归模型中参数的极大似然估计。
(3)运用EM算法探讨两成分混合Gamma回归模型中参数的极大似然估计。
(4)运用Matlab统计软件,结合Monte Carlo随机模拟方法,得出不同情况下的参数估计值,并对参数估计方法进行对比分析。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1793.html