基于模糊支持向量机的回归算法
基于模糊支持向量机的回归算法[20200410141314]
摘 要
支持向量机是二十世纪九十年代提出的一种新式的机器的学习方法,它在解决分类和回归等方面的题目上很顺利功。因为支持向量机较好的学习能力,该技巧已经成为机械研习界的钻研热门,而且在良多方面和范畴得到了成功的使用中。可是,作为一种还不怎么老练的新型技术,支持向量机当前存在着很多局限性问题以及一些方面的误差。客观的世界存在巨额的模糊讯息,假如支持向量机的训练集中含有模糊的讯息,那么支持向量机的机能将变得不怎么好甚至是力所不及。
本文在针对存在模糊信息的样本时对已有支持向量机的不足的地方,建议改善的模糊支持向量机。最初,对支持向量机的结构原理和基础理论进行剖析析、计议以及钻研。其次,建议相应的基于模糊支持向量机回归算法并对其进行改善。在改善的基于模糊支持向量机回归模型中,对模糊支持向量机的里面结构的过程以及外部构造用数学描述方法进行了具体的叙述。
实验成果可以看出,本文建议的模糊支持向量机回归算法可以较好地处理含有模糊信息的样本题目,对比已有的少许其余的支持向量机算法可以缩小样本的空间大小和所需内存,提高训练速率等等。
*查看完整论文请 +Q: 3 5 1 9 1 6 0 7 2
关键字:机器学习统计学习理论模糊支持向量机
目 录
1. 绪论 1
1.1 研究的目的和意义 1
1.2 支持向量机显示出来的特征 1
1.3 支持向量机研究现状 2
1.4 内容安排 4
2. 相关理论与算法 5
2.1 引言 5
2.2 统计学习理论 5
2.3 支持向量机 6
2.4 支持向量机的回归算法 8
2.4.1 关于线性支持向量的回归算法 8
2.4.2 关于非线性的支持向量机的回归算法 9
3. 基于模糊支持向量机的应用 11
3.1基于模糊支持向量机基本思想 11
3.1.1 模糊支持向量机的原理 11
3.1.2 算法思想 12
3.2 数据来源的说明以及介绍 14
3.2.1 数据的来源乙烯环氧化制环氧乙烷的方法 14
3.2.2 乙烯环氧化催化剂和催化原理 16
3.2.3 工艺条件的选择 18
3.2.4 氧化反应器的介绍 19
3.3 仿真结果 20
3.4 本章小结 25
结语 26
参考文献 27
致谢 28
附录 29
1. 绪论
1.1研究的目的和意义
结合统计学习理论、支持向量机算法的长处和最优化技巧,研究设计成新算法成为机器研习范畴的一个研究热门并且不乏看点,并取得了较好的反映。支持向量机算法是被建议的一类新式的机械学习算法,遭到理论界和工程界普遍的关注。它能够在小样本的统计学习理论的基础上,拥有不错的研习本领和泛化性能,可以较好地处理小样本、高维数、非线性、局部极小等模式识别题目,且人为设置的参数比较少,利于使用,己经成功地应用于模式识别、图象处理等许多的方面。
设计了支持向量机算法的目的是申请和回归问题的分类,首先要找到训练集的一个小的子集,该子集称为支持向量集,然后在上面的架构决策函数,使它具有良好的推广能力。
本文便是在上述背景下展开研究与实践的,在研究和实践的过程中,将统计学习理论和模糊理论应用于支持向量机算法中,使得提高支持向量机对一些数据进行回归,提高支持向量机的训练速度以及精准度。基于模糊支持向量机的回归算法,是针对给定的大规模数据集的回归估计的题目,建议基于支持向量机(SVM)的模糊回归估计方式。该方式就是要把繁杂的数据集看做多个群体的混合,每一个群体选用简单的回归模型进行描绘,使得大规模数据集的回归估计题目变为了一个多模型估计的题目。在这个基础上把支持向量机与模糊C聚类联系起来获得基于模糊支持向量机的回归模子,并给出了达成该模型回归估计的算法。该方式对大规模的数据样本进行模糊C聚类,以及回归估计各聚类的数据样本。
数据仿真成果表明,基于模糊支持向量机的回归算法在聚类数据样本的同时还能达成多个模型的回归估计,对于给定的数据集,可以使用一个单一的回归模型来描述,初始化的模糊隶属度和影响力比其他的模糊回归估计方法。
1.2 支持向量机显示出来的特征
支持向量机为统计学习理论中最新研习出来的一部分算法,十多年前其焦点内容是在被建议的,亦然最合适的算法之一,当前还是处在不断进步的阶段。它本来在很好的处理模式识别的题目,推广到函数拟合的范畴之内,是可以开发在表面和在线性最优分类问题。与古老的机械研习方式互相对比一下,它拥有以下的少许长处
(1) 算法将最终被转换成一个二次优化问题的两个。从理论上讲,这将是全球最小,为极值问题的部分也用在神经网络停止。
(2) VC维知识插入后,让网络抑制率,样品分类界和风险泛函得到了控制。
(3)它是能够很好地处理小样本的数据,我们的意向是是使用已知的信息得到最优解而不是只处理的样本趋于最优的无穷多解。
(4)算法将现实题目经由非线性变更改变到高维的特征空间,在高维空间中组织线性判别函数来实现原空间中的非线性判别函数,它可以明智地对问题的维数,特殊特性可以保持机械有更好的执行机能,算法复杂度与样本维数无关。
(5)以统计学习理论为前提,选取布局风险最小化的规则,克服研习等方面存在的题目,战胜了传统神经网络研习中靠履历和开导的先验成分等弊端,提升了水准,使研习机械有良好的水准。
1.3 支持向量机研究现状
建议了支持向量机算法以后,它一直倍受国内和国外学习者的注重,全部人都认定它是继神经网络以后一个新的钻研方向。在很短的时间里,其理论和应用在所有方向上都有发展潜力,而且获得了一系列非常不错的研究成果。
理论上的进展大多由下面几方面组成:
(1) 和其机械研习的方式的联系起来。比方:最小二乘法支持向量机,这种方式是在1999年被建议的,经由这几年快速的成长,已经使用到不少相干的范畴中去了。该问题的研究已经扩展到以下几个方面:用于数据处理;参数的选取和调试;处理大型数据集等问题。
(2) 选择支持向量机参数:参数的选择是一个更严重的机械学习算法的问题,支持向量机的功能取决于它的核参数和惩罚系数的选择。最常用的方式便是经验凑试法和格点法,但这两种方式都是在许多次试验的基础上,得到的参数一般不是最优的;用梯度降落法来实现支持向量机参数的选取,其他一些采用不同的适应度函数,建议了两种基于遗传算法的SVM参数选取的方式。
(3) 核函数的选择和建设,例如核函数研究的主要部分等。在不同使用中的基础上,多多少少到学习范畴内,我们可以建造不同种类的核函数。目前的核函数用于大部分的例子:多项式逼近,偏置分类器,多层感知器等。
(4)支持向量机的模型选取准则。支持向量机和神经网络正在使用中的并不多,除了支持向量机的模型选择问题,和一个关键原因是数据多的样本问题的解决速度慢一直没有得到解决。目前较为常用的有信息几何法,验证法等。
(5)和数据的预处理(样本的要紧度,属性的要紧度,特性选取等方面)方式互相融合,将数据中加进支持向量机的算法中去从而产生新的算法。如支持向量机和层次聚类,在决策树理论和层次聚类方法的多类支持向量机的构造,使用层次聚类方法可以把(n-1)连接到一个封闭式的,作为一个临时的类别,把剩下的一类做为单独的一类,下一步的分类不再认为这是一个单独的类,只有在组合(n-1),然后关闭;比方粗糙集与支持向量机的连接,使用粗糙集的概念对数据的作用和属性可以简化,能在一定程度上减少支持向量机求解的计算量。
(6)SVM从两类问题向多类问题的扩散。在许多类型的算法中,基于支持向量机的经典理论,在目标函数中直接改善, K分类SVM的建立,多值分类模板的新的布局。因为过多的变量数目,计算繁杂度也非常高,能完成比较困难,建立这类算法所用到的目标函数十分繁杂,所以在较小数据样本中才能够使用,并取得不错的效果。
支持向量机不仅在一些高难度的应用中,取得了良好的效果,而且获得了理论的进步和飞一般的发展。如:
(1)生物信息范畴的钻研。生物信息学是最近比较被人关注的一门新学科,支持向量机在该范畴中已经取得首要的功效。已经成功的应用是应用程序已成功地对DNA的问题,DNA其中一个基因研究中最重要的问题是要区分编码和非编码序列,并区分需要多次实验,较大的计算量,使用支持向量分类机这一东西后有理想的成果。
摘 要
支持向量机是二十世纪九十年代提出的一种新式的机器的学习方法,它在解决分类和回归等方面的题目上很顺利功。因为支持向量机较好的学习能力,该技巧已经成为机械研习界的钻研热门,而且在良多方面和范畴得到了成功的使用中。可是,作为一种还不怎么老练的新型技术,支持向量机当前存在着很多局限性问题以及一些方面的误差。客观的世界存在巨额的模糊讯息,假如支持向量机的训练集中含有模糊的讯息,那么支持向量机的机能将变得不怎么好甚至是力所不及。
本文在针对存在模糊信息的样本时对已有支持向量机的不足的地方,建议改善的模糊支持向量机。最初,对支持向量机的结构原理和基础理论进行剖析析、计议以及钻研。其次,建议相应的基于模糊支持向量机回归算法并对其进行改善。在改善的基于模糊支持向量机回归模型中,对模糊支持向量机的里面结构的过程以及外部构造用数学描述方法进行了具体的叙述。
实验成果可以看出,本文建议的模糊支持向量机回归算法可以较好地处理含有模糊信息的样本题目,对比已有的少许其余的支持向量机算法可以缩小样本的空间大小和所需内存,提高训练速率等等。
*查看完整论文请 +Q: 3 5 1 9 1 6 0 7 2
关键字:机器学习统计学习理论模糊支持向量机
目 录
1. 绪论 1
1.1 研究的目的和意义 1
1.2 支持向量机显示出来的特征 1
1.3 支持向量机研究现状 2
1.4 内容安排 4
2. 相关理论与算法 5
2.1 引言 5
2.2 统计学习理论 5
2.3 支持向量机 6
2.4 支持向量机的回归算法 8
2.4.1 关于线性支持向量的回归算法 8
2.4.2 关于非线性的支持向量机的回归算法 9
3. 基于模糊支持向量机的应用 11
3.1基于模糊支持向量机基本思想 11
3.1.1 模糊支持向量机的原理 11
3.1.2 算法思想 12
3.2 数据来源的说明以及介绍 14
3.2.1 数据的来源乙烯环氧化制环氧乙烷的方法 14
3.2.2 乙烯环氧化催化剂和催化原理 16
3.2.3 工艺条件的选择 18
3.2.4 氧化反应器的介绍 19
3.3 仿真结果 20
3.4 本章小结 25
结语 26
参考文献 27
致谢 28
附录 29
1. 绪论
1.1研究的目的和意义
结合统计学习理论、支持向量机算法的长处和最优化技巧,研究设计成新算法成为机器研习范畴的一个研究热门并且不乏看点,并取得了较好的反映。支持向量机算法是被建议的一类新式的机械学习算法,遭到理论界和工程界普遍的关注。它能够在小样本的统计学习理论的基础上,拥有不错的研习本领和泛化性能,可以较好地处理小样本、高维数、非线性、局部极小等模式识别题目,且人为设置的参数比较少,利于使用,己经成功地应用于模式识别、图象处理等许多的方面。
设计了支持向量机算法的目的是申请和回归问题的分类,首先要找到训练集的一个小的子集,该子集称为支持向量集,然后在上面的架构决策函数,使它具有良好的推广能力。
本文便是在上述背景下展开研究与实践的,在研究和实践的过程中,将统计学习理论和模糊理论应用于支持向量机算法中,使得提高支持向量机对一些数据进行回归,提高支持向量机的训练速度以及精准度。基于模糊支持向量机的回归算法,是针对给定的大规模数据集的回归估计的题目,建议基于支持向量机(SVM)的模糊回归估计方式。该方式就是要把繁杂的数据集看做多个群体的混合,每一个群体选用简单的回归模型进行描绘,使得大规模数据集的回归估计题目变为了一个多模型估计的题目。在这个基础上把支持向量机与模糊C聚类联系起来获得基于模糊支持向量机的回归模子,并给出了达成该模型回归估计的算法。该方式对大规模的数据样本进行模糊C聚类,以及回归估计各聚类的数据样本。
数据仿真成果表明,基于模糊支持向量机的回归算法在聚类数据样本的同时还能达成多个模型的回归估计,对于给定的数据集,可以使用一个单一的回归模型来描述,初始化的模糊隶属度和影响力比其他的模糊回归估计方法。
1.2 支持向量机显示出来的特征
支持向量机为统计学习理论中最新研习出来的一部分算法,十多年前其焦点内容是在被建议的,亦然最合适的算法之一,当前还是处在不断进步的阶段。它本来在很好的处理模式识别的题目,推广到函数拟合的范畴之内,是可以开发在表面和在线性最优分类问题。与古老的机械研习方式互相对比一下,它拥有以下的少许长处
(1) 算法将最终被转换成一个二次优化问题的两个。从理论上讲,这将是全球最小,为极值问题的部分也用在神经网络停止。
(2) VC维知识插入后,让网络抑制率,样品分类界和风险泛函得到了控制。
(3)它是能够很好地处理小样本的数据,我们的意向是是使用已知的信息得到最优解而不是只处理的样本趋于最优的无穷多解。
(4)算法将现实题目经由非线性变更改变到高维的特征空间,在高维空间中组织线性判别函数来实现原空间中的非线性判别函数,它可以明智地对问题的维数,特殊特性可以保持机械有更好的执行机能,算法复杂度与样本维数无关。
(5)以统计学习理论为前提,选取布局风险最小化的规则,克服研习等方面存在的题目,战胜了传统神经网络研习中靠履历和开导的先验成分等弊端,提升了水准,使研习机械有良好的水准。
1.3 支持向量机研究现状
建议了支持向量机算法以后,它一直倍受国内和国外学习者的注重,全部人都认定它是继神经网络以后一个新的钻研方向。在很短的时间里,其理论和应用在所有方向上都有发展潜力,而且获得了一系列非常不错的研究成果。
理论上的进展大多由下面几方面组成:
(1) 和其机械研习的方式的联系起来。比方:最小二乘法支持向量机,这种方式是在1999年被建议的,经由这几年快速的成长,已经使用到不少相干的范畴中去了。该问题的研究已经扩展到以下几个方面:用于数据处理;参数的选取和调试;处理大型数据集等问题。
(2) 选择支持向量机参数:参数的选择是一个更严重的机械学习算法的问题,支持向量机的功能取决于它的核参数和惩罚系数的选择。最常用的方式便是经验凑试法和格点法,但这两种方式都是在许多次试验的基础上,得到的参数一般不是最优的;用梯度降落法来实现支持向量机参数的选取,其他一些采用不同的适应度函数,建议了两种基于遗传算法的SVM参数选取的方式。
(3) 核函数的选择和建设,例如核函数研究的主要部分等。在不同使用中的基础上,多多少少到学习范畴内,我们可以建造不同种类的核函数。目前的核函数用于大部分的例子:多项式逼近,偏置分类器,多层感知器等。
(4)支持向量机的模型选取准则。支持向量机和神经网络正在使用中的并不多,除了支持向量机的模型选择问题,和一个关键原因是数据多的样本问题的解决速度慢一直没有得到解决。目前较为常用的有信息几何法,验证法等。
(5)和数据的预处理(样本的要紧度,属性的要紧度,特性选取等方面)方式互相融合,将数据中加进支持向量机的算法中去从而产生新的算法。如支持向量机和层次聚类,在决策树理论和层次聚类方法的多类支持向量机的构造,使用层次聚类方法可以把(n-1)连接到一个封闭式的,作为一个临时的类别,把剩下的一类做为单独的一类,下一步的分类不再认为这是一个单独的类,只有在组合(n-1),然后关闭;比方粗糙集与支持向量机的连接,使用粗糙集的概念对数据的作用和属性可以简化,能在一定程度上减少支持向量机求解的计算量。
(6)SVM从两类问题向多类问题的扩散。在许多类型的算法中,基于支持向量机的经典理论,在目标函数中直接改善, K分类SVM的建立,多值分类模板的新的布局。因为过多的变量数目,计算繁杂度也非常高,能完成比较困难,建立这类算法所用到的目标函数十分繁杂,所以在较小数据样本中才能够使用,并取得不错的效果。
支持向量机不仅在一些高难度的应用中,取得了良好的效果,而且获得了理论的进步和飞一般的发展。如:
(1)生物信息范畴的钻研。生物信息学是最近比较被人关注的一门新学科,支持向量机在该范畴中已经取得首要的功效。已经成功的应用是应用程序已成功地对DNA的问题,DNA其中一个基因研究中最重要的问题是要区分编码和非编码序列,并区分需要多次实验,较大的计算量,使用支持向量分类机这一东西后有理想的成果。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jxgc/zdh/4202.html