jetsontk1嵌入式终端的声源定位前端系统设计与开发(附件)【字数:12182】
摘 要摘 要伴随着科学技术的发展以及声源感知处理技术的成熟,声源定位技术在越来越多的领域得以运用。例如,视频会议、安防监控、车载免提电话对说话人的识别、智能机器人等都需要声源定位技术的支持,因此,声源定位技术研究的意义不言而喻。本课题的声源定位系统所研究的的是一种基于麦克风阵列,根据声源发出后到达各麦克风之间的时间差而估算出声源的所在位置的定位技术。本课题的声源定位系统的后端系统中还利用了CUDA运算平台提高了算法的运行效率,使得GPU与CPU并行工作,更快处理数据,得出运算计算结果后传输至前端展示出来。本篇论文主要负责是声源定位系统的前端系统。主要使用JAVA语言在eclipse中建立一个Web工程,在Tomcat上部署该工程项目,主要包括了前端系统的处理部分和前端系统的展示部分,处理部分主要是该工程的数据传输模块以及服务器模块,展示部分则是使用的成熟的框架bootstrap完成一个前端系统的页面设计。后端计算所得的声源定位数据通过CURL接口传输至前端处理部分的服务器模块来处理,当用户通过浏览器与服务器建立链接后,使用WS协议完成WebSocket的连接,最终在前端利用HTML5将声源定位的结果展示在浏览器前端页面。关键词声源定位; CUDA; WebSocket; HTML5
目 录
第一章 绪论 1
1.1 声源定位的课题背景 1
1.2 声源定位课题的目的以及意义 1
1.3 声源定位课题技术的现状以及发展 2
1.4 本课题的主要研究内容以及章节安排 3
第二章 声源定位系统的需求 4
2.1 声源定位系统的概述 4
2.2 系统整体需求分析 4
2.3 前端系统的功能需求分析 4
2.4 系统的整体功能设计 5
2.5 本章小结 6
第三章 声源定位前端系统的处理部分 7
3.1 前端系统的框架 7
3.2 数据传输模块 8
3.3 服务器模块 9
3.4 本章小结 16
第四章 声源定位前端系统的展示部分 17
4.1 HTML5界面的设计 17
4.2 摄像头联动机制的设 *好棒文|www.hbsrm.com +Q: ¥351916072¥
计 19
4.3 本章小结 19
第五章 声源定位系统的测试 20
5.1 前端系统的测试 20
5.2 系统的级联测试 21
5.3 系统性能的分析 23
5.4 本章小结 23
结 论 24
致 谢 25
参考文献 26
第一章 绪论
1.1 声源定位的课题背景
声音是人类最古老的一种信息载体,通过声音人们可以获取大量信息,而声源位置便是其中一项重要信息。伴随着多媒体技术以及各种智能终端设备的发展,在语音处理技术不断提高的今天,声源定位技术的应用呈现多元化。例如,在很多大型公司与机构的视频会议中,声源定位技术的应用尤为广泛,当发言人的声音被麦克风接收到,视频摄像头便会自动转向发言人,与会者很容易知道是谁说了什么,并且还节省了调整摄像头的精力,这就使得会议变的方便而高效。
本文所研究的声源定位技术是一种基于麦克风阵列的定位技术。麦克风作为一种传统的声音采集工具可以很方便的收集到声音信号,单一麦克风受到环境影响的可能性较大,当出现多个声源或者周围噪声较多时,对于定位的准确性存在很大问题。相对于单一麦克风,麦克风阵列对于声源定位技术研究的优势便显现出来,因此受到广泛追捧。
1.2 声源定位课题的目的以及意义
声源定位技术的研究历来已久,从最初的国防军事领域到现在的智能民用领域,声源定位技术涉及的应用越来越广泛,其地位也日益增重。在军事方面,声源定位技术最早应用于声纳系统,采用电磁波来探测水下目标,声源定位技术还应用于测量炮兵阵地、探测狙击手所在位置、测试弹药的空中炸点等。在一段时间里,随着红外、激光技术的发展,雷达侦察技术火热起来,一度影响了声源定位技术的研究。法军和美军甚至分别在上世纪70年代和80年代取消了声测技术。但随着雷达技术受到电磁干扰、隐身技术、低海拔突变的影响,使其实际效果大打折扣,因此声源定位技术重新在军事领域被重视起来。
在军事领域外,声源定位技术同样火热,上述的视频会议只是其冰山一角。随着人们收入的增加以及生活条件的提高,家用车走进了千家万户,而声源定位技术在车载免提电话中发挥着巨大作用。当车中具有多人时,具备声源定位功能的车载免提电话能够准确定位到说话人的方位,从而更好地处理语音效果,使得通话更加方便。在安防监控方面,声源定位技术同样大放异彩。当今城市中面临着很多一些大型的爆炸事故或者一些恶性枪击案件发送的威胁,如果单凭人耳对其进行准确定位简直是天方夜谭,城市中现有的一些视频监控系统也无法第一时间呈现出现场画面和报警来减少生命财产的损失。缺少了“耳朵”以及“大脑”,拥有再多“眼睛”,处理起这些事故和案件也颇为棘手,很难适应新形势下的事故、案件以及反恐状况。而具备声源定位功能的监控系统,从根本上改变了单纯只有图像的监控措施,能为解决这类事故和案件节省大量的人力物力,具有很大的推广意义。
1.3 声源定位课题技术的现状以及发展
迄今为止,声源定位技术的研究已经有了几十年的发展,但其基本原理几乎不变,主要是通过了一些现代技术实现了定位系统的集成化、自动化、智能化。在现有的各种声探测技术中,本文所用的基于麦克风阵列的声源定位课题技术在声源定位技术中具有着特殊地位,其主要具有三类定位方法:基于高分辨频谱的声源定位方法;基于最大输出功率的可控声源波束的声源定位的方法;基于时延估计的声源定位方法。本次课题采用的便是基于时延估计的声源定位方法。
相对于我国,国外对于声源定位课题的研究起步较早,主要应用于军事领域。目前,美国、英国、俄罗斯、日本、以色列和瑞典等国家均已装备被动声源探测系统[1]。如以色列的拉斐尔公司的AEWS声探测预警系统,瑞典的Helisearch直升机声测系统以及美国的ISC公司的PALS被动声源定位系统等。声源定位技术在国外的军事方面还被应用于智能地雷上,其原理是利用声源定位技术获取到声源信息,再将声源位置信息反馈给爆炸控制系统,由控制系统来决定爆炸的时间,对于打击地面坦克和低空直升机效果显著。近年来,语音识别处理的声源定位技术已成为新的研究热点,许多著名的国际公司,如IBM公司、BELL公司等都已经开始着手开发新的并且能够适用于大型会议的语音增强的产品以及滤波技术的产品,很多产品现已投入到市场中使用,囊括可视视频电话、大型的视频会议系统、电话会议系统等[2]。而一些在复杂声学环境下应对强噪声环境的语音采集处理及声源定位产品也已显示出巨大的优势和潜力。
目 录
第一章 绪论 1
1.1 声源定位的课题背景 1
1.2 声源定位课题的目的以及意义 1
1.3 声源定位课题技术的现状以及发展 2
1.4 本课题的主要研究内容以及章节安排 3
第二章 声源定位系统的需求 4
2.1 声源定位系统的概述 4
2.2 系统整体需求分析 4
2.3 前端系统的功能需求分析 4
2.4 系统的整体功能设计 5
2.5 本章小结 6
第三章 声源定位前端系统的处理部分 7
3.1 前端系统的框架 7
3.2 数据传输模块 8
3.3 服务器模块 9
3.4 本章小结 16
第四章 声源定位前端系统的展示部分 17
4.1 HTML5界面的设计 17
4.2 摄像头联动机制的设 *好棒文|www.hbsrm.com +Q: ¥351916072¥
计 19
4.3 本章小结 19
第五章 声源定位系统的测试 20
5.1 前端系统的测试 20
5.2 系统的级联测试 21
5.3 系统性能的分析 23
5.4 本章小结 23
结 论 24
致 谢 25
参考文献 26
第一章 绪论
1.1 声源定位的课题背景
声音是人类最古老的一种信息载体,通过声音人们可以获取大量信息,而声源位置便是其中一项重要信息。伴随着多媒体技术以及各种智能终端设备的发展,在语音处理技术不断提高的今天,声源定位技术的应用呈现多元化。例如,在很多大型公司与机构的视频会议中,声源定位技术的应用尤为广泛,当发言人的声音被麦克风接收到,视频摄像头便会自动转向发言人,与会者很容易知道是谁说了什么,并且还节省了调整摄像头的精力,这就使得会议变的方便而高效。
本文所研究的声源定位技术是一种基于麦克风阵列的定位技术。麦克风作为一种传统的声音采集工具可以很方便的收集到声音信号,单一麦克风受到环境影响的可能性较大,当出现多个声源或者周围噪声较多时,对于定位的准确性存在很大问题。相对于单一麦克风,麦克风阵列对于声源定位技术研究的优势便显现出来,因此受到广泛追捧。
1.2 声源定位课题的目的以及意义
声源定位技术的研究历来已久,从最初的国防军事领域到现在的智能民用领域,声源定位技术涉及的应用越来越广泛,其地位也日益增重。在军事方面,声源定位技术最早应用于声纳系统,采用电磁波来探测水下目标,声源定位技术还应用于测量炮兵阵地、探测狙击手所在位置、测试弹药的空中炸点等。在一段时间里,随着红外、激光技术的发展,雷达侦察技术火热起来,一度影响了声源定位技术的研究。法军和美军甚至分别在上世纪70年代和80年代取消了声测技术。但随着雷达技术受到电磁干扰、隐身技术、低海拔突变的影响,使其实际效果大打折扣,因此声源定位技术重新在军事领域被重视起来。
在军事领域外,声源定位技术同样火热,上述的视频会议只是其冰山一角。随着人们收入的增加以及生活条件的提高,家用车走进了千家万户,而声源定位技术在车载免提电话中发挥着巨大作用。当车中具有多人时,具备声源定位功能的车载免提电话能够准确定位到说话人的方位,从而更好地处理语音效果,使得通话更加方便。在安防监控方面,声源定位技术同样大放异彩。当今城市中面临着很多一些大型的爆炸事故或者一些恶性枪击案件发送的威胁,如果单凭人耳对其进行准确定位简直是天方夜谭,城市中现有的一些视频监控系统也无法第一时间呈现出现场画面和报警来减少生命财产的损失。缺少了“耳朵”以及“大脑”,拥有再多“眼睛”,处理起这些事故和案件也颇为棘手,很难适应新形势下的事故、案件以及反恐状况。而具备声源定位功能的监控系统,从根本上改变了单纯只有图像的监控措施,能为解决这类事故和案件节省大量的人力物力,具有很大的推广意义。
1.3 声源定位课题技术的现状以及发展
迄今为止,声源定位技术的研究已经有了几十年的发展,但其基本原理几乎不变,主要是通过了一些现代技术实现了定位系统的集成化、自动化、智能化。在现有的各种声探测技术中,本文所用的基于麦克风阵列的声源定位课题技术在声源定位技术中具有着特殊地位,其主要具有三类定位方法:基于高分辨频谱的声源定位方法;基于最大输出功率的可控声源波束的声源定位的方法;基于时延估计的声源定位方法。本次课题采用的便是基于时延估计的声源定位方法。
相对于我国,国外对于声源定位课题的研究起步较早,主要应用于军事领域。目前,美国、英国、俄罗斯、日本、以色列和瑞典等国家均已装备被动声源探测系统[1]。如以色列的拉斐尔公司的AEWS声探测预警系统,瑞典的Helisearch直升机声测系统以及美国的ISC公司的PALS被动声源定位系统等。声源定位技术在国外的军事方面还被应用于智能地雷上,其原理是利用声源定位技术获取到声源信息,再将声源位置信息反馈给爆炸控制系统,由控制系统来决定爆炸的时间,对于打击地面坦克和低空直升机效果显著。近年来,语音识别处理的声源定位技术已成为新的研究热点,许多著名的国际公司,如IBM公司、BELL公司等都已经开始着手开发新的并且能够适用于大型会议的语音增强的产品以及滤波技术的产品,很多产品现已投入到市场中使用,囊括可视视频电话、大型的视频会议系统、电话会议系统等[2]。而一些在复杂声学环境下应对强噪声环境的语音采集处理及声源定位产品也已显示出巨大的优势和潜力。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/528.html