江淮水稻萌发期抗旱特性鉴定与分类
目 录
1引言 1
2材料与方法 3
2.1数据来源 3
2.2数据的处理与分析 3
3结果与分析 3
3.1不同水稻品种萌发期各性状的相关性分析 3
3.2建立初始因子载荷矩阵 4
3.3不同水稻品种的萌发期抗旱性聚类分析 7
3.4ROC曲线验证 8
4讨论 11
4.1水稻品种萌发期抗旱性的综合评价 11
4.2SOM聚类分析结果的判定 11
4.3ROC曲线判定 12
结论 13
致谢 14
参考文献 15
附录 17
1 引言
水稻是世界上最重要的禾谷类作物之一,全世界约40%的人口,其主要营养来源于水稻。随着全球性气温升高,水资源贫乏问题日趋严重,干旱缺水给水稻生产造成严重威胁。在此背景下,提高水稻抗旱能力已经成为育种工作急需解决的关键问题之一。[1]我国是世界上最大的稻米生产国和消费国,其稻作面积和稻作总产量分别占全世界的23%和37% 。水资源是制约中国稻作持续发展的重要因素,培育抗旱的栽培稻品种并实现水稻旱作,不但可以在很大程度上节约水资源,而且有利于增产稳产,节约能源和减少环境污染。水稻的抗旱性鉴定比较复杂,不同的生育期有不同的方法和评价指标。[2] 各指标间存在着复杂的网络关系。指标间相关性的研究由于受水稻的遗传特性、环境因素以及所选样本的影响而错综复杂。抗旱是水稻的重要育种目标,但又是由多个性状构成的复合性状,性状之间存在一定的相关性,这就给育种家的研究带来一定的困难和麻烦。所以找到萌发期抗旱特性的黄金指标,提供品种抗旱性的的标准,减少测定的繁琐无序,提高工作效率和结果的精确性变得尤为 *好棒文|www.hbsrm.com +Q: ^3^5^1^9^1^6^0^7^2^*
重要。
近年来,许多学者运用萌发胁迫指数法、灰色关联度法、隶属函数法和主成分分析法((PCA)等对抗旱性进行了大量的研究,所以本文将用主成分分析法[11]、SOM聚类分析法[13]、ROC曲线[12]分析等手段将江淮水稻品种抗旱性进行分类并得到精确地水稻抗旱特性重要指标。[2]
关于作物萌芽期抗旱性鉴定研究,前人己经做了很多工作。鞠乐等对大麦种子萌发期进行抗旱性鉴定时发现发芽势与抗旱性不存在显著关系,他认为的抗旱性鉴定指标为胚根长、胚芽长、胚芽干重和物质转运速率;张盼盼等认为相对发芽率、相对根长、相对芽干重、相对芽鞘长、相对芽长和相对根干重可作为糜子芽期抗旱性的鉴定指标;张智猛等发现根长、生根率、根干重、发芽率与花生抗旱能力存在显著相关性;王贺正等认为相对胚根长、相对芽长和相对芽干重可作水稻芽期抗旱性鉴定指标。这些研究结果揭示了作物萌发期抗旱性鉴定指标各有其理由也有数据支持,但结果上往往不一致。在确定最佳鉴定指标上存在不同的意见----计算复杂,所以本论文准备对搜集的数据运用,主成分分析和ROC工作曲线判定,对实际采用的各种萌发期干旱胁迫耐受性数据进行分析,以期找到理想简便可靠的判定各品种干旱胁迫耐受性地萌芽期指标,为育种工作者准确判定种性提供便利。
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。 通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1 (选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1 包含的信息越多。因此在所有的线性组合中选取的 F1 应该是方差最打的,故称 F1为第一主成分。如果第一主成分不足以代表原来 P 个指标的信息,再考虑选取F2 即选第二个线性组合,为了有效地反映原来信息,F1 已有的信息就不需要再出现再 F2 中,用数学语言表达就是要求 Cov(F1, F2)=0,则称 F2 为第二主成分,依此类推可以构造出第三、第四,,第P个主成分。
主成分模型:
满足以下条件:
1.每个主成分系数平方和为1即:
2.主成分之前互不相关 即:
3.主成分方差依次递减,即
4.步骤:一般有以下四个步骤:
(1)确认待分析的原变量是否适合作因子分析。
(2)构造因子变量。
(3)利用旋转方法使因子变量更具有可解释性。
(4)计算因子变量得分。
2、因子分析的计算过程:
(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。
(2)求标准化数据的相关矩阵。
(3)求相关矩阵的特征值和特征向量。
(4)计算方差贡献率与累积方差贡献率。
(5)确定因子:设F1,F2,,Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标。
(6)因子旋转:若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。
(7)用原指标的线性组合来求各因子得分:采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。
(8)综合得分:以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。
(9)得分排序:利用综合得分可以得到得分名次。
水稻的萌发期时研究其抗旱特性时一般测定以下几个性状:相对芽鞘长、相对芽长、 相对根数、相对胚根长、相对发芽率、相对根干重,相对芽干重等。主成分分析法在很多农作物的研究上有运用如韩瑞宏在紫花苜蓿抗旱性上的研究;王艺陶用主成分和SOM聚类分析对高粱品种萌发期抗旱性鉴定与分类的研究。我的研究数据品种比较多,变量也比较多。所以使用主成分分析法是完全合适的。
2 材料与方法
2.1 数据来源
试验材料:江淮地区广泛种植的62个水稻品种(见附表)
2.2 数据处理与分析
方法和逻辑过程:1.通过测量得到所需要的数据并制作成EXCLE表格。2.用SPSS 20.0因子分析,得到公共因子并对水稻品种的抗旱性进行综合评价。3.利用MATLAB 2012a 62个品种进行SOM分析。4.用ROC曲线验证各指标作为抗旱性鉴定指标的敏感性以及主成分作为抗旱性鉴定指标的敏感性。从而得到抗旱特性鉴定的黄金指标。为了减少各水稻品种间固有的差异,对各测定指标均采用干旱胁迫处理和对照测定的相对值,相对值比绝对值能更好地反映不同水稻品种的抗旱性。
初始特征值 提取平方和载入 旋转平方和载入
成份 合计 方差的 % 累积 % 合计 方差的 % 累积 % 合计 方差的 % 累积 %
1 2.117 30.248 30.248 2.117 30.248 30.248 1.932 27.599 27.599
2 1.559 22.271 52.519 1.559 22.271 52.519 1.744 24.919 52.519
3 0.998 14.254 66.773
4 0.784 11.198 77.971
1引言 1
2材料与方法 3
2.1数据来源 3
2.2数据的处理与分析 3
3结果与分析 3
3.1不同水稻品种萌发期各性状的相关性分析 3
3.2建立初始因子载荷矩阵 4
3.3不同水稻品种的萌发期抗旱性聚类分析 7
3.4ROC曲线验证 8
4讨论 11
4.1水稻品种萌发期抗旱性的综合评价 11
4.2SOM聚类分析结果的判定 11
4.3ROC曲线判定 12
结论 13
致谢 14
参考文献 15
附录 17
1 引言
水稻是世界上最重要的禾谷类作物之一,全世界约40%的人口,其主要营养来源于水稻。随着全球性气温升高,水资源贫乏问题日趋严重,干旱缺水给水稻生产造成严重威胁。在此背景下,提高水稻抗旱能力已经成为育种工作急需解决的关键问题之一。[1]我国是世界上最大的稻米生产国和消费国,其稻作面积和稻作总产量分别占全世界的23%和37% 。水资源是制约中国稻作持续发展的重要因素,培育抗旱的栽培稻品种并实现水稻旱作,不但可以在很大程度上节约水资源,而且有利于增产稳产,节约能源和减少环境污染。水稻的抗旱性鉴定比较复杂,不同的生育期有不同的方法和评价指标。[2] 各指标间存在着复杂的网络关系。指标间相关性的研究由于受水稻的遗传特性、环境因素以及所选样本的影响而错综复杂。抗旱是水稻的重要育种目标,但又是由多个性状构成的复合性状,性状之间存在一定的相关性,这就给育种家的研究带来一定的困难和麻烦。所以找到萌发期抗旱特性的黄金指标,提供品种抗旱性的的标准,减少测定的繁琐无序,提高工作效率和结果的精确性变得尤为 *好棒文|www.hbsrm.com +Q: ^3^5^1^9^1^6^0^7^2^*
重要。
近年来,许多学者运用萌发胁迫指数法、灰色关联度法、隶属函数法和主成分分析法((PCA)等对抗旱性进行了大量的研究,所以本文将用主成分分析法[11]、SOM聚类分析法[13]、ROC曲线[12]分析等手段将江淮水稻品种抗旱性进行分类并得到精确地水稻抗旱特性重要指标。[2]
关于作物萌芽期抗旱性鉴定研究,前人己经做了很多工作。鞠乐等对大麦种子萌发期进行抗旱性鉴定时发现发芽势与抗旱性不存在显著关系,他认为的抗旱性鉴定指标为胚根长、胚芽长、胚芽干重和物质转运速率;张盼盼等认为相对发芽率、相对根长、相对芽干重、相对芽鞘长、相对芽长和相对根干重可作为糜子芽期抗旱性的鉴定指标;张智猛等发现根长、生根率、根干重、发芽率与花生抗旱能力存在显著相关性;王贺正等认为相对胚根长、相对芽长和相对芽干重可作水稻芽期抗旱性鉴定指标。这些研究结果揭示了作物萌发期抗旱性鉴定指标各有其理由也有数据支持,但结果上往往不一致。在确定最佳鉴定指标上存在不同的意见----计算复杂,所以本论文准备对搜集的数据运用,主成分分析和ROC工作曲线判定,对实际采用的各种萌发期干旱胁迫耐受性数据进行分析,以期找到理想简便可靠的判定各品种干旱胁迫耐受性地萌芽期指标,为育种工作者准确判定种性提供便利。
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。 通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1 (选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1 包含的信息越多。因此在所有的线性组合中选取的 F1 应该是方差最打的,故称 F1为第一主成分。如果第一主成分不足以代表原来 P 个指标的信息,再考虑选取F2 即选第二个线性组合,为了有效地反映原来信息,F1 已有的信息就不需要再出现再 F2 中,用数学语言表达就是要求 Cov(F1, F2)=0,则称 F2 为第二主成分,依此类推可以构造出第三、第四,,第P个主成分。
主成分模型:
满足以下条件:
1.每个主成分系数平方和为1即:
2.主成分之前互不相关 即:
3.主成分方差依次递减,即
4.步骤:一般有以下四个步骤:
(1)确认待分析的原变量是否适合作因子分析。
(2)构造因子变量。
(3)利用旋转方法使因子变量更具有可解释性。
(4)计算因子变量得分。
2、因子分析的计算过程:
(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。
(2)求标准化数据的相关矩阵。
(3)求相关矩阵的特征值和特征向量。
(4)计算方差贡献率与累积方差贡献率。
(5)确定因子:设F1,F2,,Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标。
(6)因子旋转:若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。
(7)用原指标的线性组合来求各因子得分:采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。
(8)综合得分:以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。
(9)得分排序:利用综合得分可以得到得分名次。
水稻的萌发期时研究其抗旱特性时一般测定以下几个性状:相对芽鞘长、相对芽长、 相对根数、相对胚根长、相对发芽率、相对根干重,相对芽干重等。主成分分析法在很多农作物的研究上有运用如韩瑞宏在紫花苜蓿抗旱性上的研究;王艺陶用主成分和SOM聚类分析对高粱品种萌发期抗旱性鉴定与分类的研究。我的研究数据品种比较多,变量也比较多。所以使用主成分分析法是完全合适的。
2 材料与方法
2.1 数据来源
试验材料:江淮地区广泛种植的62个水稻品种(见附表)
2.2 数据处理与分析
方法和逻辑过程:1.通过测量得到所需要的数据并制作成EXCLE表格。2.用SPSS 20.0因子分析,得到公共因子并对水稻品种的抗旱性进行综合评价。3.利用MATLAB 2012a 62个品种进行SOM分析。4.用ROC曲线验证各指标作为抗旱性鉴定指标的敏感性以及主成分作为抗旱性鉴定指标的敏感性。从而得到抗旱特性鉴定的黄金指标。为了减少各水稻品种间固有的差异,对各测定指标均采用干旱胁迫处理和对照测定的相对值,相对值比绝对值能更好地反映不同水稻品种的抗旱性。
初始特征值 提取平方和载入 旋转平方和载入
成份 合计 方差的 % 累积 % 合计 方差的 % 累积 % 合计 方差的 % 累积 %
1 2.117 30.248 30.248 2.117 30.248 30.248 1.932 27.599 27.599
2 1.559 22.271 52.519 1.559 22.271 52.519 1.744 24.919 52.519
3 0.998 14.254 66.773
4 0.784 11.198 77.971
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/nongxue/yuanlin/277.html