混合语音信号盲分离
本文主要是以独立分量分析算法(Independent Component analysis,ICA)为主要算法,对未知方式混合的混合语音信号进行盲分离的研究。首先,详细介绍了盲源分离问题的起源,著名的“鸡尾酒会”问题。其次,在理论部分详细介绍了盲源分离的原理等主要理论知识以及独立分量分析算法的原理、基本步骤及模型的估计。最后,本文以FastICA算法为例,通过实验验证了ICA算法在混合语音信号盲分离中的有效性。实验结果表明,ICA算法对于混合语音信号分离的效果较好,分离的性能指标也较好。关键词 盲源分离,“鸡尾酒会问题”,独立分量分析
目 录
1 绪论 1
1.1 盲分离的研究背景与意义 1
1.2 国内外发展现状 2
1.3 本文研究内容及文章的结构 4
2 盲分离及语音信号处理 4
2.1 盲源分离的概念 4
2.2 盲源分离的数学模型 5
2.3 语音信号处理分析 6
3 独立分量分析理论 7
3.1 ICA的基本概念 7
3.2 ICA的原理 7
3.3 ICA模型的假设 8
3.4 ICA的数据预处理 8
3.5 ICA算法的一般步骤 9
4 ICA算法 9
4.1 ICA算法的目标函数 9
4.2 两种优化算法 11
5 FastICA算法 12
6 仿真实验及结果 14
6.1 实验过程 14
6.2 实验结果 16
结 论 17
致 谢 18
参 考 文 献 19
1 绪论
盲源分离(Blind Source Separation,BSS)问题,也可以把它称为盲信号分离。盲源分离问题是指在没有办法准确知道源信号的组成成分以及信号所要用的理论模型的状况下,将所需要提取的一种单一信号从从众多的混合信号中提取出来。随着当今科学技术的不断发展以及各类研究学者对计算机技术的不断 *好棒文|www.hbsrm.com +Q: ^351916072#
研究,数学和计算机技术的混合也在得到广泛的运用,使得盲信号分离技术成为当今数字信号功能处理中最有用的方法之一,在医疗,通讯技术,军事技术,雷达,声呐等领域都有涉及到,盲信号处理研究主要包括盲分离技术,盲卷积技术和盲辨识技术三个部分,而各方面的研究成果也在各个领域得到广泛的应用,例如一维信号处理中的语言信号处理和二维信号处理等以及实际生活中的生物医学、军事技术等。本文我们所要研究的则是盲分离技术在混合语言信号中的运用,了解并根据著名的“鸡尾酒会”问题,利用独立分量分析算法,实现未知混合语音信号的盲分离。
1.1 盲分离的研究背景与意义
本文所要研究的混合语音信号盲分离问题,就是研究的是历史上一个著名的“鸡尾酒会”问题,“鸡尾酒会”问题简而言之则是:在一个混杂的空间里,有ABC三个人以及电视声,音乐声等等各种嘈杂的声音,但是A能够清楚的听到B说话的内容,此时,A集中于B的谈话,不被其他的谈话声,电视声干扰到,而这个就能说明,我们人类在对声音的处理方面有着特殊的技能与运用。当然,我们也可以用数学的方法来解决“鸡尾酒会”问题。
在一个没有其他杂音的空房间里,放置三个不同的收音器在房间的三个不同的位置,此时我们假设房间里有ABC三个人,而三个人所发出的语音信号分别被即作为,,,其中表示的是源信号的幅值,是指时间量,而三个不同的收音器所收集到的语音信号分别记作为,,,通过这些我们能够看出,三个不同的收音器所收集到的语音信号是ABC三个人所发出的语音信号的某种加权和。此时,我们可以用线性方程组的形式来将这种关系表示出来,即为:
这里的表示的是权,而收音器与说话者之间的距离的长短决定了权的大小,我们根据收音器所收集的混合语音来计算出源语言信号,(在问题的研究中我们假设不存在其他所有的外在干扰,比如噪音等)。以上就是我们所需了解的“鸡尾酒会”的原理,同时它也是典型的混合语音信号盲分离问题。
根据上文我们对“鸡尾酒会”的问题的数字解释与了解,我们可以了解到盲源分离的数字意义,根据上点的方程,在此过程中,如果权的大小已知,我们就可以根据上面的线性方程组估算出源语音信号的大小,但是,根据现实情况我们可以看到,此时的权的大小是未知的,此情况下我们只能根据所收集到的语音来求出的大小。此时,为了估算出和的大小,我们可以通过收集到的原始信号来估算。但这里我们约束我们收集的信号都是非高斯的,当然,我们有很多的方法来求出值得大小,不同情况下的建立的模型不同,从而建立的目标函数也不同,而本文,我们主要的是用的独立分量分析算法建立模型来进行计算,利用信息论以及概率论多种数学知识来估算出的值。
1.2 国内外发展现状
1.2.1 国外发展现状
盲源分离研究,发展至今,国际上发表着很多学术文章,各国家各类研究学者,都在不断的挖掘盲分离的运用,根据各类文章的不断地发表,我们可以把这些研究学者所写的文章进行分类,最热门的分类方法就是把它们分为混合跟卷积混合分离两大类[1]。而就现在的发展趋势跟研究成果,我们可以发现,瞬时混合问题的研究相比较卷积混合问题得到了很大的发展,关于瞬时问题的盲分离研究算法已经得到了广泛的运用在我呢的现实生活中,而卷积混合分离问题相比较与瞬时混合问题来讲更要复杂,要难得多,所以,最近大多数科学家,把重点放在了卷积混合研究上[2]。关于盲分离的研究,最早应该算是在1986年,也就是近80年代的中后期,为了将盲分离技术运用在医疗学术问题上,Heuralt和Jutten两人根据一种用神经来模拟结构[3],编写了一种算法,虽然他们的研究有很多的限制,算法的收敛性以及函数的选取性有着很多的缺陷,但是,他们的研究给后来人们对盲分离问题的研究打下来基础,推动着后人对盲分离新思维新算法的不断研究。
根据这两位法国科学家的研究,以及在1987年和1991年,其他科学家对盲分离研究提供的基础与他们取得的成果,在1994年,科学家Pierre Common[4,5]首次提出了一种新的算法:独立分量分析算法,简称为ICA,这种新方法,阐述了独立分量分析的原理以及约束条件,此后,关于盲分离问题的研究以及对独立分量分析算法的研究开始发展起来,对独立分量分析的原理概念,也在不断地进行优化。独立分量分析算法也成为之后的研究的主要方向,而该算法主要是利用了原始信号的非高斯性以及高阶算法的统计。此后,在第二年,也就是在1995年,Bell与Sejnowski[6]两人利用熵的概念,同时基于信息最大的算法,两者相结合,最大程度的输出非线性节点的熵,同时,他们根据这种算法,建立了相应的准则函数,并推导出盲源分离和盲卷积法等算法规则。之后,在1997年,Hyvarinen和Oja两人经过研究提出了快速算法[7](FastICA),也就是本文我们下面主要研究的算法,也是本文我们需要运用的算法,而与之前研究的方法相比,FastICA算法它提出了固定点的算法,同时可以收集单个正负峭度的源信号。而且FastICA算法也是现在应用比较广泛的算法之一,它的优点是稳健,收敛快速,便于使用研究。
目 录
1 绪论 1
1.1 盲分离的研究背景与意义 1
1.2 国内外发展现状 2
1.3 本文研究内容及文章的结构 4
2 盲分离及语音信号处理 4
2.1 盲源分离的概念 4
2.2 盲源分离的数学模型 5
2.3 语音信号处理分析 6
3 独立分量分析理论 7
3.1 ICA的基本概念 7
3.2 ICA的原理 7
3.3 ICA模型的假设 8
3.4 ICA的数据预处理 8
3.5 ICA算法的一般步骤 9
4 ICA算法 9
4.1 ICA算法的目标函数 9
4.2 两种优化算法 11
5 FastICA算法 12
6 仿真实验及结果 14
6.1 实验过程 14
6.2 实验结果 16
结 论 17
致 谢 18
参 考 文 献 19
1 绪论
盲源分离(Blind Source Separation,BSS)问题,也可以把它称为盲信号分离。盲源分离问题是指在没有办法准确知道源信号的组成成分以及信号所要用的理论模型的状况下,将所需要提取的一种单一信号从从众多的混合信号中提取出来。随着当今科学技术的不断发展以及各类研究学者对计算机技术的不断 *好棒文|www.hbsrm.com +Q: ^351916072#
研究,数学和计算机技术的混合也在得到广泛的运用,使得盲信号分离技术成为当今数字信号功能处理中最有用的方法之一,在医疗,通讯技术,军事技术,雷达,声呐等领域都有涉及到,盲信号处理研究主要包括盲分离技术,盲卷积技术和盲辨识技术三个部分,而各方面的研究成果也在各个领域得到广泛的应用,例如一维信号处理中的语言信号处理和二维信号处理等以及实际生活中的生物医学、军事技术等。本文我们所要研究的则是盲分离技术在混合语言信号中的运用,了解并根据著名的“鸡尾酒会”问题,利用独立分量分析算法,实现未知混合语音信号的盲分离。
1.1 盲分离的研究背景与意义
本文所要研究的混合语音信号盲分离问题,就是研究的是历史上一个著名的“鸡尾酒会”问题,“鸡尾酒会”问题简而言之则是:在一个混杂的空间里,有ABC三个人以及电视声,音乐声等等各种嘈杂的声音,但是A能够清楚的听到B说话的内容,此时,A集中于B的谈话,不被其他的谈话声,电视声干扰到,而这个就能说明,我们人类在对声音的处理方面有着特殊的技能与运用。当然,我们也可以用数学的方法来解决“鸡尾酒会”问题。
在一个没有其他杂音的空房间里,放置三个不同的收音器在房间的三个不同的位置,此时我们假设房间里有ABC三个人,而三个人所发出的语音信号分别被即作为,,,其中表示的是源信号的幅值,是指时间量,而三个不同的收音器所收集到的语音信号分别记作为,,,通过这些我们能够看出,三个不同的收音器所收集到的语音信号是ABC三个人所发出的语音信号的某种加权和。此时,我们可以用线性方程组的形式来将这种关系表示出来,即为:
这里的表示的是权,而收音器与说话者之间的距离的长短决定了权的大小,我们根据收音器所收集的混合语音来计算出源语言信号,(在问题的研究中我们假设不存在其他所有的外在干扰,比如噪音等)。以上就是我们所需了解的“鸡尾酒会”的原理,同时它也是典型的混合语音信号盲分离问题。
根据上文我们对“鸡尾酒会”的问题的数字解释与了解,我们可以了解到盲源分离的数字意义,根据上点的方程,在此过程中,如果权的大小已知,我们就可以根据上面的线性方程组估算出源语音信号的大小,但是,根据现实情况我们可以看到,此时的权的大小是未知的,此情况下我们只能根据所收集到的语音来求出的大小。此时,为了估算出和的大小,我们可以通过收集到的原始信号来估算。但这里我们约束我们收集的信号都是非高斯的,当然,我们有很多的方法来求出值得大小,不同情况下的建立的模型不同,从而建立的目标函数也不同,而本文,我们主要的是用的独立分量分析算法建立模型来进行计算,利用信息论以及概率论多种数学知识来估算出的值。
1.2 国内外发展现状
1.2.1 国外发展现状
盲源分离研究,发展至今,国际上发表着很多学术文章,各国家各类研究学者,都在不断的挖掘盲分离的运用,根据各类文章的不断地发表,我们可以把这些研究学者所写的文章进行分类,最热门的分类方法就是把它们分为混合跟卷积混合分离两大类[1]。而就现在的发展趋势跟研究成果,我们可以发现,瞬时混合问题的研究相比较卷积混合问题得到了很大的发展,关于瞬时问题的盲分离研究算法已经得到了广泛的运用在我呢的现实生活中,而卷积混合分离问题相比较与瞬时混合问题来讲更要复杂,要难得多,所以,最近大多数科学家,把重点放在了卷积混合研究上[2]。关于盲分离的研究,最早应该算是在1986年,也就是近80年代的中后期,为了将盲分离技术运用在医疗学术问题上,Heuralt和Jutten两人根据一种用神经来模拟结构[3],编写了一种算法,虽然他们的研究有很多的限制,算法的收敛性以及函数的选取性有着很多的缺陷,但是,他们的研究给后来人们对盲分离问题的研究打下来基础,推动着后人对盲分离新思维新算法的不断研究。
根据这两位法国科学家的研究,以及在1987年和1991年,其他科学家对盲分离研究提供的基础与他们取得的成果,在1994年,科学家Pierre Common[4,5]首次提出了一种新的算法:独立分量分析算法,简称为ICA,这种新方法,阐述了独立分量分析的原理以及约束条件,此后,关于盲分离问题的研究以及对独立分量分析算法的研究开始发展起来,对独立分量分析的原理概念,也在不断地进行优化。独立分量分析算法也成为之后的研究的主要方向,而该算法主要是利用了原始信号的非高斯性以及高阶算法的统计。此后,在第二年,也就是在1995年,Bell与Sejnowski[6]两人利用熵的概念,同时基于信息最大的算法,两者相结合,最大程度的输出非线性节点的熵,同时,他们根据这种算法,建立了相应的准则函数,并推导出盲源分离和盲卷积法等算法规则。之后,在1997年,Hyvarinen和Oja两人经过研究提出了快速算法[7](FastICA),也就是本文我们下面主要研究的算法,也是本文我们需要运用的算法,而与之前研究的方法相比,FastICA算法它提出了固定点的算法,同时可以收集单个正负峭度的源信号。而且FastICA算法也是现在应用比较广泛的算法之一,它的优点是稳健,收敛快速,便于使用研究。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1239.html