CN115567810A - 拾音系统、拾音方法及车辆 - Google Patents
拾音系统、拾音方法及车辆 Download PDFInfo
- Publication number
- CN115567810A CN115567810A CN202211204096.4A CN202211204096A CN115567810A CN 115567810 A CN115567810 A CN 115567810A CN 202211204096 A CN202211204096 A CN 202211204096A CN 115567810 A CN115567810 A CN 115567810A
- Authority
- CN
- China
- Prior art keywords
- sound
- vehicle
- radio
- audio signal
- row
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000005236 sound signal Effects 0.000 claims abstract description 144
- 238000001914 filtration Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims description 44
- 230000008569 process Effects 0.000 claims description 21
- 230000001629 suppression Effects 0.000 claims description 13
- 238000012790 confirmation Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000000926 separation method Methods 0.000 claims description 6
- 238000013316 zoning Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
- H04R1/083—Special constructions of mouthpieces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
本公开提供一种拾音系统、拾音方法及车辆。所述拾音系统包括:收音组和处理器,收音组包括至少一个收音设备;收音组,被配置为利用至少一个收音设备接收车内空间的第一音频信号,将第一音频信号发送给处理器;处理器,被配置为根据车辆座椅与至少一个收音设备之间的相对位置对车内空间进行音区划分处理,将车内空间划分为至少两个音区,对第一音频信号进行滤波处理,得到至少一个收音设备对应音区的目标音频信号;其中,至少两个音区中的任一为后排座椅对应的音区。通过后排座椅音区对应的收音设备识别车辆上后排乘坐人员的语音,保证车辆上所有位置乘坐人员的语音都可以被识别,滤波处理可以提高语音控制的抗干扰能力,提高车辆上人员的体验感。
Description
技术领域
本公开涉及拾音技术领域,尤其涉及一种拾音系统、拾音方法及车辆。
背景技术
在对车辆收音设备进行设置时,通常不进行音区划分或者只区分前排主驾音区和副驾音区。当不进行音区划分时,车辆上人员通过语音唤醒收音设备后,其他人员的语音也可以对收音设备产生干扰;当只区分前排主驾音区和副驾音区时,车辆上后排乘坐人员的语音无法被识别。上述两种情况会影响车辆上人员的体验感。
发明内容
有鉴于此,本公开的目的在于提出一种拾音系统、拾音方法及车辆,以解决现有技术中车辆上后排乘坐人员的语音无法被识别,以及语音控制抗干扰能力低,影响车辆上人员体验感的问题。
基于上述目的,本公开的第一方面提供了一种拾音系统,所述拾音系统包括:收音组和处理器,所述收音组包括至少一个收音设备;
所述收音组,被配置为利用所述至少一个收音设备接收车内空间的第一音频信号,将所述第一音频信号发送给所述处理器;
所述处理器,被配置为根据车辆座椅与所述至少一个收音设备之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区,对所述第一音频信号进行滤波处理,得到所述至少一个收音设备对应音区的目标音频信号;
其中,所述至少两个音区中的任一为后排座椅对应的音区。
在一些实施例中,所述收音组包括:两个分别设置在车内前排区域和车内后排区域的收音设备;
所述处理器,被配置为根据车辆座椅与所述两个分别设置的收音设备之间的相对位置,将车内空间划分为前排音区和后排音区。
在一些实施例中,
所述收音组包括:设置在车内顶棚中线前排位置的前排收音设备,设置在车内顶棚中线后排位置的后排收音设备;
或者,
所述收音组包括:设置在车内顶棚中线前排位置的前排收音设备,设置在车内中间扶手箱后侧位置的后排收音设备。
在一些实施例中,
所述收音组包括:设置在车内顶棚中线前排前方位置的前排收音设备,设置在车内顶棚中线后排后方位置的后排收音设备;
或者,
所述收音组包括:设置在车内顶棚中线前排前方位置的前排收音设备,设置在车内中间扶手箱后侧位置的后排收音设备;
或者,
所述收音组包括:设置在车内顶棚中线前排后方位置的前排收音设备,设置在车内顶棚中线后排前方位置的后排收音设备。
在一些实施例中,所述收音组包括:两个并列设置在车内顶棚中线前方的收音设备;
所述处理器,被配置为根据车辆座椅与所述两个并列设置的收音设备之间的相对位置,将车内空间划分为主驾音区、副驾音区和后排音区。
基于同一个发明构思,本公开的第二方面提供了一种应用于第一方面所述的拾音系统的拾音方法,包括:
所述收音组利用所述至少一个收音设备接收车内空间的第一音频信号,将所述第一音频信号发送给所述处理器;
所述处理器根据车辆座椅与所述至少一个收音设备之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区,对所述第一音频信号进行滤波处理,得到所述至少一个收音设备对应音区的目标音频信号;
其中,所述至少两个音区包括后排座椅对应的音区。
在一些实施例中,所述处理器根据车辆座椅与所述至少一个收音设备之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区,包括:
所述处理器执行下述过程:
响应于确认两个收音设备分别设置在车内前排区域和车内后排区域;
确定车辆前排座椅之间连接的线段为第一线段;
确定车辆前排座椅与所述前排收音设备之间连接的线段为第二线段;
获取所述第一线段与所述第二线段之间的夹角为目标夹角α;
响应于确认所述目标夹角α小于第一夹角阈值180°,所述座椅所处的音区为前排音区;
确定车辆后排座椅之间连接的线段为第三线段;
确定车辆后排座椅与所述后排收音设备之间连接的线段为第四线段;
获取所述第三线段与所述第四线段之间的夹角为目标夹角β;
响应于确认所述目标夹角β小于第二夹角阈值180°,所述座椅所处的音区为后排音区。
在一些实施例中,所述处理器根据车辆座椅与所述至少一个收音设备之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区,包括:
所述处理器执行下述过程:
响应于确认两个收音设备并列设置在车内顶棚中线前方;
确定两个并列设置的收音设备之间连接的线段为第五线段;
确定车辆座椅与所述两个并列设置的收音设备之间连接的线段为第六线段;
获取所述第五线段与所述第六线段之间的夹角为目标夹角θ;
响应于确认所述目标夹角θ小于预先设定的第三夹角阈值θ1,所述座椅所处的音区为主驾音区;
响应于确认所述目标夹角θ大于等于预先设定的第四夹角阈值θ2,所述座椅所处的音区为副驾音区;
响应于确认所述目标夹角θ大于等于所述第三夹角阈值θ1且小于所述第四夹角阈值θ2,所述座椅所处的音区为后排音区。
在一些实施例中,其特征在于,所述对所述第一音频信号进行滤波处理,得到所述收音组所处目标音区的目标音频信号,包括:
所述处理器执行下述过程:
通过神经网络算法对所述第一音频信号进行回声消除处理,得到第二音频信号;
通过波束形成和盲源分离相结合对所述第二音频信号进行信号识别处理,确定所述第一音频信号所处目标音区中的第三音频信号;
通过维纳滤波对所述第三音频信号进行噪声抑制处理,并通过唤醒功能对经过噪声抑制处理的所述第三音频信号进行唤醒,得到所述收音组所处目标音区的目标音频信号。
基于同一个发明构思,本公开的第三方面提供了一种车辆,包括第一方面的拾音系统。
从上面所述可以看出,本公开提供的一种拾音系统、拾音方法及车辆,收音组将接收到的第一音频信号发送给处理器;处理器根据车辆座椅与收音设备之间的相对位置对车内空间进行音区划分,将所述车内空间划分为至少两个音区,划分得到的至少两个音区中包括后排座椅对应的音区。因此,可以通过后排座椅音区对应的收音设备识别车辆上后排乘坐人员的语音,保证车辆上所有位置乘坐人员的语音都可以被识别,提高车辆上人员的体验感。对所述第一音频信号进行滤波处理,得到所述至少一个收音设备对应音区的目标音频信号。当收音设备接收到多个音区的音频信号后,通过滤波处理,提高该收音设备对应音区的音频信号的强度,抑制其他音区音频信号的强度,可以提高语音控制的抗干扰能力,提高车辆上人员的体验感。
附图说明
为了更清楚地说明本公开或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例的相关技术中的拾音系统的结构示意图;
图2为本公开实施例的拾音系统的结构示意图;
图3为本公开实施例的第一拾音系统的结构示意图;
图4为本公开实施例的第二拾音系统的结构示意图;
图5为本公开实施例的第三拾音系统的结构示意图;
图6为本公开实施例的第四拾音系统的结构示意图;
图7为本公开实施例的拾音方法的流程图;
图8为本公开实施例的波束形成的示意图;
图9为本公开实施例的音频信号处理方法的流程图。
附图标记说明:
1、收音组,11、收音设备,12、收音设备;
2、处理器;
3、音区,31、前排音区,311、主驾音区,312、副驾音区,32,后排音区;
4、抑制区。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如图1所示,图1为相关技术中的拾音系统的结构示意图。图1中包括收音组、音区和后排抑制区,其中,收音组包括并列设置在车内前排位置主驾和副驾中间区域的第一收音设备和第二收音设备;音区包括主驾音区和副驾音区。处理器通过对车内空间进行音区划分,将车内空间划分为主驾音区和副驾音区,第一收音设备识别主驾音区空间内人员的语音;第二收音设备识别副驾音区空间内人员的语音。但是,第一收音设备和第二收音设备都不能对后排抑制区位置人员的语音进行识别,由于后排位置人员不能通过语音对车辆进行控制,影响后排人员的体验感。
另外,相关技术中还包括对车内空间不进行音区划分。当不对车内空间进行音区划分时,车辆上有人员对收音设备唤醒后,车辆上其他人员的语音也会被唤醒后的收音设备识别到,语音控制的抗干扰能力差,误识别率高,影响车辆上人员的体验感。
如上所述,如何在成本较低的情况下实现对全座舱的语音识别,并提高语音控制的抗干扰能力,提高车辆上人员的体验感,成为了一个重要的研究问题。
如图2所示,图2为拾音系统的结构示意图。本公开的实施例提出的一种拾音系统,所述拾音系统包括:收音组1和处理器2,所述收音组1包括至少一个收音设备(如图3、图4、图5和图6所示,收音设备11或者收音设备12);
如图3、图4、图5和图6所示,所述收音组1,被配置为利用所述至少一个收音设备(收音设备11或者收音设备12)接收车内空间的第一音频信号,将所述第一音频信号发送给所述处理器2;所述处理器2,被配置为根据车辆座椅与所述至少一个收音设备(收音设备11或者收音设备12)之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区(前排音区31和后排音区32),对所述第一音频信号进行滤波处理,得到所述至少一个收音设备(收音设备11或者收音设备12)对应音区(前排音区31或者后排音区32)的目标音频信号;其中,所述至少两个音区中的任一为后排座椅对应的音区(后排音区32)。
在上述方案中,如图3、图4、图5和图6所示,收音组1包括收音设备11和收音设备12;音区3包括前排音区31和后排音区32,其中,图6中前排音区31还包括主驾音区311和副驾音区312。其中,所述收音设备可以是麦克风。
在拾音过程中,收音设备11或者收音设备12会接收到车内空间的第一音频信号。处理器2将根据车辆座椅与收音设备11或者收音设备12之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区(例如,前排音区31和后排音区32)。其中,处理器2对车内空间进行音区划分可以通过构建目标夹角进行划分,也可以通过车辆座椅与收音设备11或者收音设备12之间的相对距离进行划分。
对所述第一音频信号进行滤波处理,得到所述至少一个收音设备对应音区的目标音频信号。其中,所述第一音频信号包括前排音区31的音频信号和后排音区32的音频信号。
例如,当后排音区32对应的收音设备11或者收音设备12同时接收到前排音区31的音频信号和后排音区32的音频信号,收音设备11或者收音设备12会对接收到的第一音频信号进行滤波处理,过滤掉前排音区31的音频信号,得到后排音区32的音频信号。前排音区对应的收音设备11或者12的音频信号处理过程与上述过程类似,此处不再赘述。
通过上述方案,处理器2根据车辆座椅与所述至少一个收音设备(收音设备11或者收音设备12)之间的相对位置对所述车内空间进行音区划分处理,对所述车内空间划分得到的至少两个音区包括后排音区32。因此,后排音区对应的收音设备(收音设备11或者收音设备12)可以识别车辆上后排人员的语音,可以使后排人员通过语音进行车辆控制,提高车辆上后排人员的体验感。另外,处理器2通过对第一音频信号进行滤波处理,得到收音设备对应音区的目标音频信号,过滤掉其他音区的音频信号,可以减少其他音区音频信号的干扰,提高语音控制的抗干扰能力,提高车辆上人员的体验感。
在一些实施例中,所述收音组1包括:两个分别设置在车内前排区域和车内后排区域的收音设备(如图3、图4和图5所示,收音设备11和收音设备12);所述处理器2,被配置为根据车辆座椅与所述两个分别设置的收音设备(如图3、图4和图5所示,收音设备11和收音设备12)之间的相对位置,将车内空间划分为前排音区31(如图3、图4和图5所示)和后排音区32(如图3、图4和图5所示)。
在上述方案中,如图3、图4和图5所示,收音组1包括收音设备11和收音设备12;音区3包括前排音区31和后排音区32。其中,收音设备11也可以称为前排收音设备11,设置在车内前排区域;收音设备12也可以称为后排收音设备12,设置在车内后排区域。
前排收音设备11接收到的第一音频信号主要为前排音区31中的音频信号,当前排收音设备11同时接收到前排音区31和后排音区32中的音频信号时,处理器2通过滤波处理,过滤掉后排音区32中的音频信号,得到前排音区31中的音频信号。因此,前排收音设备11可以提高前排音区31中音频信号的强度,提高语音控制的抗干扰能力。对应的,后排收音设备21对第一音频信号的处理过程与上述过程类似,此处不再赘述。
通过上述方案,后排音区对应的收音设备(收音设备12)可以识别车辆上后排人员的语音,可以使后排人员通过语音进行车辆控制,提高车辆上后排人员的体验感。
在一些实施例中,
所述收音组1包括:设置在车内顶棚中线前排位置的前排收音设备11(如图3、图4和图5所示),设置在车内顶棚中线后排位置的后排收音设备12(如图3和图5所示);或者,所述收音组1包括:设置在车内顶棚中线前排位置的前排收音设备11(如图3、图4和图5所示),设置在车内中间扶手箱后侧位置的后排收音设备12(如图4所示)。
在上述方案中,如图3、图4和图5所示,收音组1包括收音设备11和收音设备12;音区3包括前排音区31和后排音区32。其中,收音设备11也可以称为前排收音设备11,设置在车内顶棚中线前排位置;收音设备12也可以称为后排收音设备12,设置在车内顶棚中线后排位置或者车内中间扶手箱后侧位置。
前排收音设备11接收到的第一音频信号主要为前排音区31中的音频信号,当前排收音设备11同时接收到前排音区31和后排音区32中的音频信号时,处理器2通过滤波处理,过滤掉后排音区32中的音频信号,得到前排音区31中的音频信号。因此,前排收音设备11可以提高前排音区31中音频信号的强度,提高语音控制的抗干扰能力。对应的,后排收音设备12对第一音频信号的处理过程与上述过程类似,此处不再赘述。
通过上述方案,进一步确定收音设备11和收音设备12的位置,每个收音设备识别对应音区的语音,前排音区31对应的收音设备11可以识别车辆上前排人员的语音,后排音区32对应的收音设备12可以识别车辆上后排人员的语音,车内后排人员也可以通过语音进行车辆控制,提高车辆上后排人员的体验感。
在一些实施例中,
所述收音组1包括:设置在车内顶棚中线前排前方位置的前排收音设备11(如图3所示),设置在车内顶棚中线后排后方位置的后排收音设备12(如图3所示);或者,所述收音组1包括:设置在车内顶棚中线前排前方位置的前排收音设备11(如图4所示),设置在车内中间扶手箱后侧位置的后排收音设备12(如图4所示);或者,所述收音组1包括:设置在车内顶棚中线前排后方位置的前排收音设备11(如图5所示),设置在车内顶棚中线后排前方位置的后排收音设备12(如图5所示)。
在上述方案中,如图3所示,收音组1包括收音设备11和收音设备12;音区3包括前排音区31和后排音区32。其中,收音设备11也可以称为前排收音设备11,设置在车内顶棚中线前排前方位置;收音设备12也可以称为后排收音设备12,设置在车内顶棚中线后排后方位置。
如图4所示,收音组1包括收音设备11和收音设备12;音区3包括前排音区31和后排音区32。其中,收音设备11也可以称为前排收音设备11,设置在车内顶棚中线前排前方位置;收音设备12也可以称为后排收音设备12,设置在车内中间扶手箱后侧位置。
如图5所示,收音组1包括收音设备11和收音设备12;音区3包括前排音区31和后排音区32。其中,收音设备11也可以称为前排收音设备11,设置在车内顶棚中线前排后方位置;收音设备12也可以称为后排收音设备12,设置在车内顶棚中线后排前方位置。
前排收音设备11接收到的第一音频信号主要为前排音区31中的音频信号,当前排收音设备11同时接收到前排音区31和后排音区32中的音频信号时,处理器2通过滤波处理,过滤掉后排音区32中的音频信号,得到前排音区31中的音频信号。因此,前排收音设备11可以提高前排音区31中音频信号的强度,提高语音控制的抗干扰能力。对应的,后排收音设备12对第一音频信号的处理过程与上述过程类似,此处不再赘述。
通过上述方案,进一步确定收音设备11和收音设备12的位置,每个收音设备识别对应音区的语音,前排音区31对应的收音设备11可以识别车辆上前排人员的语音,后排音区32对应的收音设备12可以识别车辆上后排人员的语音,车内后排人员也可以通过语音进行车辆控制,提高车辆上后排人员的体验感。
在一些实施例中,所述收音组1包括:两个并列设置在车内顶棚中线前方的收音设备(如图6所示,收音设备11和收音设备12);所述处理器2,被配置为根据车辆座椅与所述两个并列设置的收音设备(如图6所示,收音设备11和收音设备12)之间的相对位置,将车内空间划分为主驾音区311(如图6所示)、副驾音区312(如图6所示)和后排音区32(如图6所示)。
在上述方案中,如图6所示,收音组1包括收音设备11和收音设备12;音区3包括前排音区31和后排音区32,前排音区31包括主驾音区311和副驾音区312。其中,收音设备11和收音设备12并列设置在车内顶棚中线前方位置。
处理器2可以通过车辆座椅与所述两个并列设置的收音设备(收音设备11和收音设备12)构建目标夹角,通过所述目标夹角与预先设定的夹角阈值比较,将车内空间划分为主驾音区311、副驾音区312和后排音区32。
收音设备11接收到的第一音频信号主要为主驾音区311中的音频信号,当收音设备11同时接收到主驾音区311和副驾音区312中的音频信号时,处理器2通过滤波处理,过滤掉副驾音区312中的音频信号,得到主驾音区311中的音频信号。因此,收音设备11可以提高主驾音区311中音频信号的强度,提高语音控制的抗干扰能力。对应的,收音设备21对第一音频信号的处理过程与上述过程类似,此处不再赘述。
收音设备11和收音设备12都可以识别后排音区32中的音频信号,并通过滤波处理,得到后排音区32中的目标音频信号。
通过上述方案,将车内空间划分为主驾音区311、副驾音区312和后排音区32,使得音区划分更加精细,同时,语音控制的抗干扰能力进一步提高,提高车辆上人员的体验感。
通过上述实施例,收音组将接收到的第一音频信号发送给处理器;处理器根据车辆座椅与收音设备之间的相对位置对车内空间进行音区划分,将所述车内空间划分为至少两个音区,划分得到的至少两个音区中包括后排座椅对应的音区。因此,可以通过后排座椅音区对应的收音设备识别车辆上后排乘坐人员的语音,保证车辆上所有位置乘坐人员的语音都可以被识别,提高车辆上人员的体验感。对所述第一音频信号进行滤波处理,得到所述至少一个收音设备对应音区的目标音频信号。当收音设备接收到多个音区的音频信号后,通过滤波处理,提高该收音设备对应音区的音频信号的强度,抑制其他音区音频信号的强度,可以提高语音控制的抗干扰能力,提高车辆上人员的体验感。
基于同一个发明构思,本公开实施例提供的一种应用于上述各个实施例描述的拾音系统的拾音方法。
如图7所示,该方法执行的步骤包括:
步骤101,所述收音组利用所述至少一个收音设备接收车内空间的第一音频信号,将所述第一音频信号发送给所述处理器。
步骤102,所述处理器根据车辆座椅与所述至少一个收音设备之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区,对所述第一音频信号进行滤波处理,得到所述至少一个收音设备对应音区的目标音频信号。
其中,所述至少两个音区包括后排座椅对应的音区。
具体实施时,处理器对车内空间进行音区划分处理,划分为至少两个音区。处理器接收到收音设备发来的第一音频信号,对第一音频信号进行滤波处理,得到该收音设备对应音区的目标音频信号。
通过上述方案,处理器划分得到的至少两个音区中包括后排音区,因此,车内后排人员的语音也可以被收音设备识别,后排人员可以通过语音对车辆进行控制,给车内后排人员提供良好的体验感。同时,处理器对收音设备发来的第一音频信号进行滤波处理,可以增强该收音设备对应音区的目标音频信号,过滤掉其他音区的音频信号,提高语音控制的抗干扰能力,提高车辆上人员的体验感。
在一些实施例中,步骤102包括:
所述处理器执行下述过程:
步骤1021,响应于确认两个收音设备分别设置在车内前排区域和车内后排区域。
步骤1022,确定车辆前排座椅之间连接的线段为第一线段。
步骤1023,确定车辆前排座椅与所述前排收音设备之间连接的线段为第二线段。
步骤1024,获取所述第一线段与所述第二线段之间的夹角为目标夹角α。
步骤1025,响应于确认所述目标夹角α小于第一夹角阈值180°,所述座椅所处的音区为前排音区。
步骤1026,确定车辆后排座椅之间连接的线段为第三线段。
步骤1027,确定车辆后排座椅与所述后排收音设备之间连接的线段为第四线段。
步骤1028,获取所述第三线段与所述第四线段之间的夹角为目标夹角β。
步骤1029,响应于确认所述目标夹角β小于第二夹角阈值180°,所述座椅所处的音区为后排音区。
具体实施时,当车内收音设备设置如图3和图4、图5所示时,对车内空间进行音区划分的过程如下:
构建前排收音设备和车辆前排座椅之间的目标夹角,前排收音设备和前排座椅之间的线段与前排座椅之间的线段构成目标夹角α,目标夹角α小于第一夹角阈值180°时,座椅所处的音区为前排音区。类似地,后排音区划分过程与前排音区划分过程类似,此处不再赘述。
通过上述方案,当两个收音设备分别设置在车内前排区域和后排区域时,通过构建目标夹角划分车内空间,使得音区划分更加精准,从而收音设备可以准确获取对应音区的音频信号。
在一些实施例中,步骤102包括:
所述处理器执行下述过程:
步骤102A,响应于确认两个收音设备并列设置在车内顶棚中线前方。
步骤102B,确定两个并列设置的收音设备之间连接的线段为第五线段。
步骤102C,确定车辆座椅与所述两个并列设置的收音设备之间连接的线段为第六线段。
步骤102D,获取所述第五线段与所述第六线段之间的夹角为目标夹角θ。
步骤102E,响应于确认所述目标夹角θ小于预先设定的第三夹角阈值θ1,所述座椅所处的音区为主驾音区。
步骤102F,响应于确认所述目标夹角θ大于等于预先设定的第四夹角阈值θ2,所述座椅所处的音区为副驾音区。
步骤102G,响应于确认所述目标夹角θ大于等于所述第三夹角阈值θ1且小于所述第四夹角阈值θ2,所述座椅所处的音区为后排音区。
具体实施时,当车内收音设备设置如图6所示时,对车内空间进行音区划分的过程如下:
如图8所示,构建收音设备和车辆座椅之间的目标夹角θ,图8中,目标夹角θ为收音设备和车辆座椅之间的线段与两个收音设备的线段构成的夹角,当目标夹角θ小于第三夹角阈值θ1时,座椅所处的音区为主驾音区;当目标夹角θ大于等于第四夹角阈值θ2时,座椅所处的音区为副驾音区;当目标夹角θ大于等于所述第三夹角阈值θ1且小于所述第四夹角阈值θ2时,座椅所处的音区为后排音区。
通过上述方案,当两个收音设备并列设置在车内顶棚中线前方时,通过构建目标夹角划分车内空间,使得音区划分更加精准,从而收音设备可以准确获取对应音区的音频信号。
在一些实施例中,步骤102包括:
所述处理器执行下述过程:
步骤102a,通过神经网络算法对所述第一音频信号进行回声消除处理,得到第二音频信号。
步骤102b,通过波束形成和盲源分离相结合对所述第二音频信号进行信号识别处理,确定所述第一音频信号所处目标音区中的第三音频信号。
步骤102c,通过维纳滤波对所述第三音频信号进行噪声抑制处理,并通过唤醒功能对经过噪声抑制处理的所述第三音频信号进行唤醒,得到所述收音组所处目标音区的目标音频信号。
具体实施时,如图9所示,收音设备接收到第一音频信号后,将所述第一音频信号发送给处理器,处理器对接收到的第一音频信号通过基于神经网络的回声消除方法(Neural Network-Acoustic Echo Cancelation,简称NN-AEC)进行回声抑制处理,得到第二音频信号;通过波束形成(Beam Form,简称BF)和盲源分离(Blind Signal Separation,简称BSS)对所述第二音频信号进行信号识别处理,通过波束形成确定收音设备所处的目标音区,通过盲源分离对第二音频信号识别并分离出目标音区中的第三音频信号;通过噪声抑制(Noise Suppression,简称NS)中的维纳滤波对所述第三音频信号进行噪声抑制处理,并通过唤醒功能(Wake Up World,简称WUW)对经过噪声抑制处理的所述第三音频信号进行唤醒,得到所述收音组所处目标音区的目标音频信号。
通过上述方案,基于神经网络的回声消除方法,通过结合神经网络的回声消除方法,由于神经网络可以根据回声消除的效果,不断对回声消除方法做出改进,可以提高对音频信号消除回声的效果。通过波束形成和盲源分离相结合,提高对不同音区的音频信号分离的准确性,准确得到对应的目标音区的音频信号。通过噪声抑制和唤醒功能对音频信号进一步处理,使得目标音区音频信号的强度高于其他音区音频信号的强度。
通过上述实施例,收音组将接收到的第一音频信号发送给处理器;处理器根据车辆座椅与收音设备之间的相对位置对车内空间进行音区划分,将所述车内空间划分为至少两个音区,划分得到的至少两个音区中包括后排座椅对应的音区。因此,可以通过后排座椅音区对应的收音设备识别车辆上后排乘坐人员的语音,保证车辆上所有位置乘坐人员的语音都可以被识别,提高车辆上人员的体验感。对所述第一音频信号进行滤波处理,得到所述至少一个收音设备对应音区的目标音频信号。当收音设备接收到多个音区的音频信号后,通过滤波处理,提高该收音设备对应音区的音频信号的强度,抑制其他音区音频信号的强度,可以提高语音控制的抗干扰能力,提高车辆上人员的体验感。
需要说明的是,本申请实施例的方法可以由单个设备执行,例如手机、可穿戴设备、计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本公开实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本公开实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本公开实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本公开实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本公开实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本公开实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本公开实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种拾音系统,其特征在于,所述拾音系统包括:收音组和处理器,所述收音组包括至少一个收音设备;
所述收音组,被配置为利用所述至少一个收音设备接收车内空间的第一音频信号,将所述第一音频信号发送给所述处理器;
所述处理器,被配置为根据车辆座椅与所述至少一个收音设备之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区,对所述第一音频信号进行滤波处理,得到所述至少一个收音设备对应音区的目标音频信号;
其中,所述至少两个音区中的任一为后排座椅对应的音区。
2.根据权利要求1所述的系统,其特征在于,所述收音组包括:两个分别设置在车内前排区域和车内后排区域的收音设备;
所述处理器,被配置为根据车辆座椅与所述两个分别设置的收音设备之间的相对位置,将车内空间划分为前排音区和后排音区。
3.根据权利要求2所述的系统,其特征在于,
所述收音组包括:设置在车内顶棚中线前排位置的前排收音设备,设置在车内顶棚中线后排位置的后排收音设备;
或者,
所述收音组包括:设置在车内顶棚中线前排位置的前排收音设备,设置在车内中间扶手箱后侧位置的后排收音设备。
4.根据权利要求3所述的系统,其特征在于,
所述收音组包括:设置在车内顶棚中线前排前方位置的前排收音设备,设置在车内顶棚中线后排后方位置的后排收音设备;
或者,
所述收音组包括:设置在车内顶棚中线前排前方位置的前排收音设备,设置在车内中间扶手箱后侧位置的后排收音设备;
或者,
所述收音组包括:设置在车内顶棚中线前排后方位置的前排收音设备,设置在车内顶棚中线后排前方位置的后排收音设备。
5.根据权利要求1所述的系统,其特征在于,所述收音组包括:两个并列设置在车内顶棚中线前方的收音设备;
所述处理器,被配置为根据车辆座椅与所述两个并列设置的收音设备之间的相对位置,将车内空间划分为主驾音区、副驾音区和后排音区。
6.一种拾音方法,其特征在于,所述方法应用于权利要求1-5任意一项所述的拾音系统,所述方法包括:
所述收音组利用所述至少一个收音设备接收车内空间的第一音频信号,将所述第一音频信号发送给所述处理器;
所述处理器根据车辆座椅与所述至少一个收音设备之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区,对所述第一音频信号进行滤波处理,得到所述至少一个收音设备对应音区的目标音频信号;
其中,所述至少两个音区包括后排座椅对应的音区。
7.根据权利要求6所述的方法,其特征在于,所述处理器根据车辆座椅与所述至少一个收音设备之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区,包括:
所述处理器执行下述过程:
响应于确认两个收音设备分别设置在车内前排区域和车内后排区域;
确定车辆前排座椅之间连接的线段为第一线段;
确定车辆前排座椅与所述前排收音设备之间连接的线段为第二线段;
获取所述第一线段与所述第二线段之间的夹角为目标夹角α;
响应于确认所述目标夹角α小于第一夹角阈值180°,所述座椅所处的音区为前排音区;
确定车辆后排座椅之间连接的线段为第三线段;
确定车辆后排座椅与所述后排收音设备之间连接的线段为第四线段;
获取所述第三线段与所述第四线段之间的夹角为目标夹角β;
响应于确认所述目标夹角β小于第二夹角阈值180°,所述座椅所处的音区为后排音区。
8.根据权利要求6所述的方法,其特征在于,所述处理器根据车辆座椅与所述至少一个收音设备之间的相对位置对所述车内空间进行音区划分处理,将所述车内空间划分为至少两个音区,包括:
所述处理器执行下述过程:
响应于确认两个收音设备并列设置在车内顶棚中线前方;
确定两个并列设置的收音设备之间连接的线段为第五线段;
确定车辆座椅与所述两个并列设置的收音设备之间连接的线段为第六线段;
获取所述第五线段与所述第六线段之间的夹角为目标夹角θ;
响应于确认所述目标夹角θ小于预先设定的第三夹角阈值θ1,所述座椅所处的音区为主驾音区;
响应于确认所述目标夹角θ大于等于预先设定的第四夹角阈值θ2,所述座椅所处的音区为副驾音区;
响应于确认所述目标夹角θ大于等于所述第三夹角阈值θ1且小于所述第四夹角阈值θ2,所述座椅所处的音区为后排音区。
9.根据权利要求6所述的方法,其特征在于,所述对所述第一音频信号进行滤波处理,得到所述收音组所处目标音区的目标音频信号,包括:
所述处理器执行下述过程:
通过神经网络算法对所述第一音频信号进行回声消除处理,得到第二音频信号;
通过波束形成和盲源分离相结合对所述第二音频信号进行信号识别处理,确定所述第一音频信号所处目标音区中的第三音频信号;
通过维纳滤波对所述第三音频信号进行噪声抑制处理,并通过唤醒功能对经过噪声抑制处理的所述第三音频信号进行唤醒,得到所述收音组所处目标音区的目标音频信号。
10.一种车辆,其特征在于,包括权利要求1-5所述的拾音系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211204096.4A CN115567810A (zh) | 2022-09-29 | 2022-09-29 | 拾音系统、拾音方法及车辆 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211204096.4A CN115567810A (zh) | 2022-09-29 | 2022-09-29 | 拾音系统、拾音方法及车辆 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115567810A true CN115567810A (zh) | 2023-01-03 |
Family
ID=84743246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211204096.4A Pending CN115567810A (zh) | 2022-09-29 | 2022-09-29 | 拾音系统、拾音方法及车辆 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115567810A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115881125A (zh) * | 2023-01-19 | 2023-03-31 | 小米汽车科技有限公司 | 车载多音区语音交互方法、装置、电子设备和存储介质 |
-
2022
- 2022-09-29 CN CN202211204096.4A patent/CN115567810A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115881125A (zh) * | 2023-01-19 | 2023-03-31 | 小米汽车科技有限公司 | 车载多音区语音交互方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109192203B (zh) | 多音区语音识别方法、装置及存储介质 | |
CN110010126B (zh) | 语音识别方法、装置、设备和存储介质 | |
CN109545230B (zh) | 车辆内的音频信号处理方法和装置 | |
US20160150315A1 (en) | System and method for echo cancellation | |
CN100559461C (zh) | 语音活动检测的装置和方法 | |
CN101064975B (zh) | 车辆通信系统 | |
WO2014063099A1 (en) | Microphone placement for noise cancellation in vehicles | |
CN109273020B (zh) | 音频信号处理方法、装置、设备和存储介质 | |
US20160119712A1 (en) | System and method for in cabin communication | |
CN113270095B (zh) | 语音处理方法、装置、存储介质及电子设备 | |
DE102018118415A1 (de) | Fahrzeugbasiertes akustisches zonierungssystem für smartphones | |
DE102019122541A1 (de) | Verbesserung des fahrzeugbenutzererlebnisses | |
CN106611602A (zh) | 车载声音收集装置以及声音收集方法 | |
CN105575399A (zh) | 用于选择音频过滤方案的系统和方法 | |
CN115567810A (zh) | 拾音系统、拾音方法及车辆 | |
CN111696539A (zh) | 对内部通话主动降噪的语音交互系统及车辆 | |
CN107481733A (zh) | 声信号的选择性放大 | |
CN108574906B (zh) | 用于汽车的声音处理方法、系统和汽车 | |
WO2020120754A1 (en) | Audio processing device, audio processing method and computer program thereof | |
US9390713B2 (en) | Systems and methods for filtering sound in a defined space | |
CN105761532A (zh) | 动态语音提示方法及车载系统 | |
CN211296936U (zh) | 一种应用于车辆上的降噪系统 | |
DE102013019194B4 (de) | Kraftfahrzeug-Mikrofonsystem mit adaptiver Richtcharakteristik | |
CN110875051B (zh) | 语音降噪装置和车辆以及语音降噪方法和存储介质 | |
CN109857360B (zh) | 车内音频设备音量控制系统及控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |