ica的智慧医疗语音信息分离及采集设计与实现【字数:14024】

在进行临床急诊时,医护人员往往需要手写医嘱、记录病情并输入医院的信息系统中,不仅浪费抢救时间,还可能会出现人为失误。在语音识别发展迅猛的当下,实践表明在救护环境嘈杂的情况下,语音识别率低下而且由于实际情况中往往不止一个说话人,说话人的吐字清晰与发音标准与否都会对识别率产生影响。针对复杂语音环境下智能获取目标语音信息问题,为了实现复杂语音环境下根据用户需求智能分离获取用户指定的目标语音信息的目标,该算法通过采样与量化将原始语音信号变为数字信号,而后对其采用独立成分分析(Independent Component Analysis,ICA)进行处理并结合主成分分析(Principal Component Analysis,PCA)做预处理,实现语音信号的分离。为了远程监控病人病情,对病人异常情况进及时的预警,进一步采取情感识别的方法,对我们采集到的语音信息进行处理。本文使用经典的情感分类器,支持向量机(Support Vector Machine,SVM)来实现语音情感识别。使用MATLAB进行代码的设计与实现,并模拟实验分析结果。
目 录
1. 绪论 1
1.1研究背景 1
1.2研究现状 1
1.3研究内容与目的 2
2. MFCC特征提取原理与方法 4
2.1 MFCC基本原理 4
2.2 MFCC特征参数的提取原理 5
2.3 提取MFCC参数实验 11
3. 语音信号分离技术研究 12
3.1研究背景及现状 12
3.2独立成分分析原理及其算法步骤 13
3.3实验与分析 16
4. 语音情感识别 21
4.1研究背景与现状 21
4.2语音情感特征分析 21
4.3识别模型 22
4.4情感语料库 24
4.5实验与分析 25
5. 总结与展望 34
6. 参考文献 35
致谢 36
绪论
研究背景
近年来受到卫生部的信息化发展规划影响,医疗信息化不断加快,医疗大数据、智慧医疗、建立临床数据采集中心成为各大医院信 *好棒文|www.hbsrm.com +Q: @351916072@ 
息化发展的重要措施。现已有中南大学的“移动医疗”原型系统,其利用物联网、移动通信技术开展了预约诊疗、远程诊治、健康监控等服务,开启了新时代就诊的新模式。除此之外,还有一些中小型企业开发相关的临床信息管理系统以及综合数据采集等方面的应用,智慧医疗的脚步正在不断加快。
随着医疗信息化的建立,各大医院基本都具备较高的信息化水平,具有大量的重要的临床诊疗信息,比如就诊记录、医嘱、医药单、检验报告、诊疗手段等。这些信息很多都需要医护人员手动输入,并且在想要查看相关信息时,需要切换多个信息系统进行查阅,对医护人员操作带了很大不便,同时也是对患者救护时间的浪费。由此,医院急需建立一个符合卫生部最小数据集要求的统一的数据采集处理平台,来实现医院临床数据信息的有效管理。
在智慧医疗的建设中,语音信息也是不容忽视的,语音信息不仅包含了语义信息还包含了情感信息,不仅满足了上述临床数据采集的需要,还可以对一些特殊的患者提供辅助治疗。比如可以实时监控抑郁症患者的情绪,从而起到预警和及时更改诊疗方案的作用。
在人工智能迅速发展的今天,语音信息的处理对于智慧医疗的建设和发展起到重要的影响,同时也广泛适用于其他领域,拥有广阔的应用发展前景。
研究现状
目前,已经有不少的企业、研究机构、高校对语音信息处理在智慧医疗中的应用做出了研究与探索。其中,科大讯飞在语音听写、语音识别、声纹识别等方面取得了不错的研究成果。例如,在相对安静的牙科就诊室里,牙医需要双手进行操作,因此使用一个固定在操作台上的麦克风来采集语音并进行识别,识别率可达97%。在诸如此类的特定环境中,虽然得到了较为理想的识别结果,但是也存在一些限制条件,比如说话人必须佩戴麦克风、发音标准、噪声较小等。在救护车急救过程或者医院门诊、急诊等环境复杂的就诊情况下,其识别率大大下降。根据实际就诊环境,为了提高识别率,需要在进行语音识别之前,分离出纯净的说话人语音并且使其尽可能不失真,才能更好的进行识别从而提取有效信息进行数据分析。
在当下医疗信息化建设的过程中,情感识别的研究也逐渐的受到更多学者的关注,例如进行肢体情感分析、面部情感分析、语音情感分析的异常行为检测、远程监控等方面。而其中语音情感分析处理还处于不断的研究探索中,当前国内外对其的研究成果不尽相同,受到识别环境、语言种类、情感特征等因素的影响,在实际的医疗应用中,语音情感识别还需要更进一步的研究发展。
研究内容与目的
实际上,随着近几年医院信息化建设的推进,由于人工问题而导致的医嘱信息记录的不准确性和耗时性问题愈发显著。为了提高医嘱信息的准确性以及提高记录医嘱工作的效率,我们需要找到一种解决方法来代替人工从而避免由于人工问题而导致的医嘱记录的不准确性和耗时性。做到解放医护人员双手,支持医生和护士口头录入病历或护理记录,且自动转化为文字存储。为挽救患者生命大大的节约了时间,提高了医护人员的工作效率。在后续的实验中如果对采集到的信息进一步经过智能化的处理分析,可以为医生提供参考病例或者优质的诊疗方案。
此外,为了方便医护人员和患者家属对患者病情进行实时监控,对患者的语音信息进行情感识别,判别出患者异常的情感信息,从而起到预警的作用。也可以用于抑郁症或其他精神疾病患者的监控检测,起到病情实时监控记录的作用,给予患者更为及时的救助。
最后,对于分离采集后的语音信息进行统一的智慧医疗数据采集中心的建立,有益于临床诊疗信息的有效管理和充分利用。首先确保了信息的规范采集,其次通过数据分析将辅助医生提供相似的病例或者诊疗方案,为患者提供更为科学有效的救治方案,力求达到最好的诊疗效果,最后对诊疗数据进行存储以及其他相关应用。
综上所述,本文主要研究在嘈杂的医疗环境下进行语音信号的分离与识别,以及语音情感识别的分析处理。本系统使用matlab2016a进行编码实验,主要由两大模块组成,首先是语音分离模块,负责把采集到的混合语音经过分离后得到纯净的说话人的语音;其次是语音情感识别模块,可以把已知的语音通过支持向量机分类的方法找出其属于哪一种情感。系统架构具体说明如下图11所示:
/
图11 系统架构
如图所示,对于采集到的语音信息进行智能的分析处理,可以广泛用于临床数据应用,有利的促进了临床数据采集中心的建立,加快了医疗信息的进程。
MFCC特征提取原理与方法
MFCC基本原理
语音信号是连续的时变过程,是一个非稳态的过程。根据对语音信号的研究发现,从整体来看,虽然语音信号具有时变的性质,但是语音是由人的口腔肌肉运动构成声道的某种形状而产生的响应,相比于语音频率这种肌肉的运动频率是较为缓慢的。因此,在一个短时间内,语音信号的特性可以看作是基本保持不变的,即相对稳定,那么就可以认为短时内,为准稳态过程。基于这样的考虑,在“短时”的基础上,对语音信号进行分析和处理,即进行“短时分析”。又根据语音的产生机理,声门和声道相互耦合,形成了语音信号非线性的特点。为了便于研究分析,假设短时分析中语音信号是由声门的激励信号和声道的冲击响应的卷积而形成的,即认为是线性短时不变系统的输出。这个短时间一般指10~30ms。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/rjgc/602.html

好棒文