24小时咨询热线

0568-435397932

餐厅展示

您的位置:主页 > 餐厅展示 > 欧式餐厅 >

智能语音技术中麦克风阵列的原理

发布日期:2024-09-16 01:57浏览次数:
本文摘要:麦克风阵列(MicrophoneArray),从字面上,所指的是麦克风的排序。也就是说由一定数目的声学传感器(一般是麦克风)构成,用来对声场的空间特性展开取样并处置的系统。早在20世纪70、80年代,麦克风阵列早已被应用于语音信号处理的研究中,转入90年代以来,基于麦克风阵列的语音信号处理算法渐渐沦为一个新的研究热点。而到了“声控时代”,这项技术的重要性变得最为引人注目。 麦克风阵列能干什么?任何一项技术的再次发生发展都预示着问题的明确提出及解决问题,麦克风阵列也是如此。

yabo888亚博网站

麦克风阵列(MicrophoneArray),从字面上,所指的是麦克风的排序。也就是说由一定数目的声学传感器(一般是麦克风)构成,用来对声场的空间特性展开取样并处置的系统。早在20世纪70、80年代,麦克风阵列早已被应用于语音信号处理的研究中,转入90年代以来,基于麦克风阵列的语音信号处理算法渐渐沦为一个新的研究热点。而到了“声控时代”,这项技术的重要性变得最为引人注目。

麦克风阵列能干什么?任何一项技术的再次发生发展都预示着问题的明确提出及解决问题,麦克风阵列也是如此。那么它主要应用于在哪些场景下呢?又具有怎样的功能!噪声环境怎么斩?—语音强化语音强化是指当语音信号被各种各样的噪声(还包括语音)阻碍甚至水淹后,从含噪声的语音信号中萃取出有洁净语音的过程。所以DingDong在喧闹环境下,也能精确辨识语音指令。

通过麦克风阵列波束构成展开语音强化示意图从20世纪60年代开始,Boll等研究者先后明确提出了针对用于一个麦克风的语音强化技术,称作单通道语音强化。因为它用于的麦克风个数最多,并且充份考虑到了语音序和噪声序的特性,使得这些方法在某些场景下也具备较好的噪声诱导效果,并因其方法非常简单、更容易构建的特点普遍应用于现有语音通信系统与消费电子系统中。

但是,在简单的声学环境下,噪声总是来自于四面八方,且其与语音信号在时间和频谱上经常是互相交错的,再行再加脉冲和混响的影响,利用单麦克风捕猎比较洁净的语音是十分艰难的。而麦克风阵列融合了语音信号的空时信息,可以同时萃取声源并诱导噪声。目前科大讯飞早已构建了基于线性阵列、平面阵列以及空间立体阵列的波束构成和减震技术,效果皆超过业界一流水平。

说出人杨家是飞舞方位怎么斩?—声源定位现实中,声源的方位是大大变化的,这对于麦克风收音来说,是个障碍。麦克风阵列则可以展开声源定位,声源定位技术是指用于麦克风阵列来计算出来目标说出人的角度和距离,从而构建对目标说出人的追踪以及先前的语音定向掉落,是嵌入式、音视频会议等领域十分最重要的前处置技术。

所以麦克风阵列技术不容许说出人的运动,不必须移动方位以转变其接管方向,具备灵活性的波束掌控、较高的空间分辨率、低的信号增益与较强的抗干扰能力等特点,因而沦为智能语音处置系统中捕猎说出人语音的最重要手段。室内Echo过于大怎么斩?—去混响一般我们听音乐时,期望有混响的效果,这是听力上的一种享用。适合的混响不会使得声音圆润歌声、富裕感染力。

混响(Reverberation)现象所指的是声波在室内传播时,要被墙壁、天花板、地板等障碍物构成光线声,并和直达声构成变换,这种现象称作混响。但是,混响现象对于辨识就没什么益处了。

由于混响则不会使得不实时的语音互相变换,带给了音素的交错遮蔽效应(PhonemeOverlapEffect),从而严重影响语音辨识效果。影响语音辨识的部分一般是晚期混响部分,所以去混响的主要工作重点是放到如何除去晚期混响上面,多年来,去混响技术诱导是业界研究的热点和难题。利用麦克风阵列去混响的主要方法有以下几种:1、基于盲语音强化的方法(Blindsignalenhancementapproach),将要混响信号作为普通的加性噪声信号,在这个上面应用于语音强化算法。

2、基于波束构成的方法(Beamformingbasedapproach),通过将多麦克风对搜集的信号展开权重相乘,在目标信号的方向构成一个拾音波束,同时波动来自其他方向的光线声。3、基于逆滤波的方法(Aninversefilteringapproach),通过麦克风阵列估算房间的房间冲击号召(RoomImpulseResponse,RIR),设计重构滤波器来补偿来避免混响。现在科大讯飞构建的基于麦克风阵列的去混响技术能很好的对房间的混响情况展开自适应的估算,从而很好的展开洁净信号的还原成,明显的提高了语音听感和辨识效果,在测试对比中,多种混响时间下辨识效果相似手机将近谈水平。

混响语音信号频谱说出人过于多怎么斩?—声源信号萃取(分离出来)家里人说出过于多,DingDong听得谁的呢。这个时候就必须DingDong聪慧的分辨出有哪个声音才是指令。

而麦克风阵列可以构建声源信号萃取,声源信号的萃取就就是指多个声音信号中萃取出有目标信号,声源信号分离出来技术则是将必须将多个混合声音全部萃取出来。通过麦克风阵列波束构成做到语音萃取和分离出来利用麦克风阵列做到信号的萃取和分离出来主要有以下几种方式:1、基于波束构成的方法,即通过向有所不同方向的声源分别构成拾音波束,并且诱导其他方向的声音,来展开语音萃取或分离出来:2、基于传统的盲源信号分离出来(BlindSourceSeparation)的方法展开,主要还包括主成分分析(PrincipalComponentAnalysis,PCA)和基于独立国家成分分析(IndependentComponentAnalysis,ICA)的方法。进军的麦克风阵列麦克风阵列技术虽然早已可以超过非常的技术水平,但是总体上还是不存在一些问题的,比如当麦克风和信号源距离太远时(比如10m、20m距离),录音信号的信噪比不会很低,算法处置难度很大;对于便携设备来说,不受设备尺寸以及功耗的容许,麦克风的个数无法过于多,阵列尺寸也无法过于大。而分布式麦克风阵列技术则是解决问题当前问题的一个有可能途径。

所谓分布式阵列就是将子阵元或子阵列布局到更大的范围内,相互之间通过有线或者无线的方式展开数据的互相交换和分享,并在此基础上展开广义上的声源定位、波束构成等技术构建信号处理。相对于目前集中式的麦克风阵列,分布式阵列的优势也是非常明显的。

首先分布式麦克风阵列(特别是在无线传输)的尺寸的容许就不不存在了;另外,阵列的节点可以覆盖面积相当大的面积——总会有一个阵列的节点距离声源很将近,录音信噪比大幅提高,算法处置可玩性也不会减少,总体的信号处理的效果也不会有十分明显的提高,因此分布式阵列有可能是未来智能家居和会议系统中的主流方案。在万物网络的今天,麦克风阵列技术早已深刻印象的走出了我们的日常生活。在智能车载、智能家居、机器人、可穿着设备等应用于热潮于是以蓬勃发展的时代,语音交互由于其便捷性,出了嵌入式入口的第一自由选择,麦克风阵列大自然也沦为其中十分最重要的前端技术。


本文关键词:智能,语音,技术,中,麦克风,阵列,的,yabo888亚博网站,原理

本文来源:yabo888亚博网站-www.dqhryoga.com

查看更多 >>

yabo888亚博网站

XML地图 yabo888亚博网站(中国)官方网站-IOS/安卓通用版/手机APP下载