基于麦克风阵列的声源定位技术

基于麦克风阵列的声源定位技术[20200406105909]
摘要
随着科技的进步和发展,麦克风阵列的声源定位技术已经成为人们研究的重要课题之一。用麦克风阵列接受语音信号就是声源定位技术的一种,接受到的语音技术再输出到计算机,经过计算机技术的分析和处理,然后可以确定声源是从哪个方位传过来的。声源定位技术的广泛应用在许多领域,如定位技术,在军事上的语音识别,视频会议的定位技术。麦克风阵列对于噪声、声源定位、跟踪这些方面都比单个麦克风要好,从而大大提高语音信号处理质量。
本文主要是用麦克风阵和时延估计声源定位方法对于声源的定位。首先介绍了几种常见的声源定位方法和各自的优缺点,在此基础上研究基于时延估计的声源定位方法(GCC),比较远场定位和近场定位的差别,确定本文研究的方法远场定位法。由于远场定位时,只需要测出声音信号到达各个麦克风阵列的时延(TDOA),剩下的就是简单的数学公式推导。由于该方法计算量小,易于实现的优点,实际应用比较广泛。
 *查看完整论文请 +Q: 3 5 1 9 1 6 0 7 2 
关键字:麦克风阵列,声源定位,时延估计,GCC
目 录
一、绪论 1
1.1 课题研究背景和意义 1
1.2 国内外研究现状和发展趋势 2
1.2.1研究历史和现状 2
1.2.2发展趋势 2
1.3本文所要研究的内容 2
二、麦克风阵列的处理模型和方法介绍 4
2.1麦克风阵列信号处理模型 4
2.1.1远场模型 4
2.1.2远场麦克风阵列均匀线阵模型 5
2.2基于时延估计声源定位方法的介绍 6
2.2.1广义互相关时延估计法 6
2.2.2互功率谱相位时延估计法 7
2.2.3基于基音加权的时延估计法 7
2.2.4基于声门脉冲激励的时延估计法 7
2.2.5 基于 LMS 的自适应时延估计法[8] 8
2.2.6 基于子空间分解的时延估计法 9
2.2.7基于声学传递函数比的时延估计法 9
三、麦克风声源定位的研究与设计 11
3.1广义互相关时延估计设计流程 11
3.2 时延估计定位算法实验研究 12
3.3互相关延时估计方法 12
3.4互相关延时估计加权函数性能分析 15
3.5声源定位的模型分析 16
3.6时延估计的测量与计算 17
四、总结 20
4.1 本文研究的问题与难点 20
4. 2课题研究总结 20
参考文献 22
致谢 24
一、绪论
1.1 课题研究背景和意义
定位技术是我们一直研究的课题,目前有很多定位技术都开发的比较成熟,比如我们经常使用的GPS导航系统、手机的定位与查找、超声波定位技术、蓝牙定位技术等。其中声源定位技术与语音增强在语音通信领域中是非常重要的两门技术。例如,我们可以通过声源定位技术来定位的讲话人的具体方位,然后灯光就对焦于讲话的人;为了解决人们在高速公路上接电话的问题,车载电话由此诞生[1]。当然我们不能排除车上会有噪音,这样就会影响语音系统对于我们声音的识别,然而麦克风声源定位技术可以帮助我们来解决噪声问题;在智能机器人领域也有很重要的应用,智能机器人通过传感器来定位面前的人,从而跟他交流或者接受命令。
声源定位已广泛应用于各个领域,它可用于医学研究,交通检测,雷达,视频会议,航天自动导航,智能机器人和其他成熟的先进技术。
麦克风声源定位技术大致可分为三方面:第一类是高分辨率谱估计技术,由于这类技术在计算时需要用的相关矩阵,这样我们的计算量会非常的大,同时这种定位技术跟其他技术相比定位的不准确,在实际操作过程中很少采用;第二类是最大输出功率的可控波束形成技术,这种技术室利用加权函数来求得的,原理是:1.麦克风接受语音信号;2.求加权和形成的波束;3.求出最大输出功率波束;第三类是基于声达时间差的定位技术,这种技术是利用声源传到各个麦克风阵列的时间差,然后求出角度,就可以再平面上确定声源的位置,这种技术的优点就是计算量比较小,对于噪声的处理也比较好,但是只适用与单个声源的定位,对于多个声源定位效果比较差。
1.2 国内外研究现状和发展趋势
1.2.1研究历史和现状
上个世纪80年代以来,人们就已经开始了对声源定位的研究,并取得了很多的成果,为人类的进步做出了积极的贡献。在定位技术的人的研究有很多,包括定位技术的检测和识别,人脸GPS定位技术,基于麦克风阵列定位技术。由于本文研究的是麦克风声源定位技术,下面就对声源定位技术的发展与进步进行大致的描述。在上世纪80年代中后期到90年代初在这个时间段里,罗格斯大学Flanagan教授和来自布朗大学的Silverman教授是最早研究麦克风声源定位技术[2-3],从此以后,人们开始研究声源定位,语音处理,语音识别,视频跟踪的麦克风阵列技术。人们研究发现你,麦克风阵列比单个麦克风在处理信号时有很多的优点,比如单个麦克风不是消除噪声干扰,同是拾取的信号范围也很有限,一个由多个麦克风组成阵列可以弥补单麦克风的缺点。此外还可以增强语音信号和提高识别能力。此外麦克风阵列可以进行生源定位,而单个的麦克风就不行。
1.2.2发展趋势
在几十年的发展过程中,声测系统主要是通过系统化,集成化来提高性能,其基本原理是差不多的。目前使用比较多的是麦克风阵列技术来接受信号,用无线电技术传输信号,示波器等技术来检测结果,然后用计算机技术解决问题。目前,许多国家的声源定位技术研究的都比较成熟,很多技术已经应用的实战,目前,声测系统的侦察距离可达30km同时精度达到1%,无线电传输方式的展开时间仅需半小时,可同时测量50多个目标[4],打击精度比较高,而我国在这一方面的技术就比较落后,关于目标定位和精确的打击与其他国家之间的差距比较大。
1.3本文所要研究的内容
本文研究的内容是学习阵列信号处理的基本理论;学习并掌握基于到达时间差的麦克风声源定位技术;学习并掌握各种到达时间差的估计方法;基于麦克风阵列建立广义的基于互相关时延估计,然后在MATLAB平台上实现基于到达时间差的声源定位系统。具体的工作如下:
第一章简单的叙述了声源定位的研究背景和国内外的发展状况
第二章主要讲述了麦克风阵列的几种模型和介绍了时延估计法
第三章麦克风声源定位的研究与设计
第四章总结课题的难点和遇到的问题
二、麦克风阵列的处理模型和方法介绍
2.1麦克风阵列信号处理模型
2.1.1远场模型
麦克风声源定位可以分为远场模型和近场模型,这是根据麦克风和声源的距离确定的,当麦克风阵列的位置与声音的发射源的位置较近时就可以使用近场模型,因为麦克风阵列与声源位置较近就不能忽略阵列与阵列之间由于声源引起的幅度。当麦克风的位置与声源较远时,我们可以使用远场模型,由于麦克风阵列与声源的位置较远,然而可以忽略声源到第一个和第二个阵列的幅度差比较小,可以比用考虑。本位采用的是远场定位模型,不需要考虑信号源到达每个阵列源的幅度。
远场模型如图2-1所示
图2-1远场模型
由图2-1可以看出,由于声源和麦克风的距离比较长,声源到达麦克风阵列模型可以看作平行的,这样就可以把声源到达麦克风阵列幅度差忽略不计,远场模型的计算量比较小,跟其他算法相比可以很容易实现。当然,当麦克风阵列的距离和声源较近时,就不能使用远场模型,我们经常使用一个公式来区分麦克风阵列的声源定位适合用哪一种模型,下面是判断远场模型和近场模型的公式:
其中L为阵列长度, 为声波长度。声源阵列的参考点味 ,当 > 为远场模型,当 2.1.2远场麦克风阵列均匀线阵模型
均匀线性(ULA)是常见的阵列结构,其中有M个麦克风等间距的排列在一条直线上,阵列之间的间距为波长的一半,语音信号的频率为100—3400 Hz,经过计算空气中的波长为100-340cm,根据阵列尺寸和采样定理,麦克风阵列源之间的距离为5-15cm。
由上面讨论可知,远场模型到达麦克风阵列元之前为平面波。由图2-1可知声源到达麦克风阵列的方向角是相同的,下图2-2表示均匀阵列的远场模型:

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/dzkxyjs/2329.html

好棒文