CN115691490A - 动态切换音区的方法、语音交互方法、设备、介质及车辆 - Google Patents

动态切换音区的方法、语音交互方法、设备、介质及车辆 Download PDF

Info

Publication number
CN115691490A
CN115691490A CN202211225606.6A CN202211225606A CN115691490A CN 115691490 A CN115691490 A CN 115691490A CN 202211225606 A CN202211225606 A CN 202211225606A CN 115691490 A CN115691490 A CN 115691490A
Authority
CN
China
Prior art keywords
vehicle
distribution information
personnel
information
sound zone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211225606.6A
Other languages
English (en)
Inventor
吴楠
党晓妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weilai Automobile Technology Anhui Co Ltd
Original Assignee
Weilai Automobile Technology Anhui Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weilai Automobile Technology Anhui Co Ltd filed Critical Weilai Automobile Technology Anhui Co Ltd
Priority to CN202211225606.6A priority Critical patent/CN115691490A/zh
Publication of CN115691490A publication Critical patent/CN115691490A/zh
Priority to PCT/CN2023/123490 priority patent/WO2024078435A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种动态切换车辆内音区的方法、语音交互方法、设备、介质及车辆,涉及智能汽车技术领域,旨在解决对智能汽车语音控制,效果不佳的问题。该动态切换车辆内音区的方法包括:动态获取车辆内人员的人员分布信息;确定与当前人员分布信息匹配的音区布局方式;根据与当前人员分布信息匹配的音区布局方式对车辆内实际的音区布局方式进行切换。通过动态获取车辆内人员的分布信息,动态确定音区布局方式,可以实现在人员分布发生变化时更改音区布局方式,从而提高获取人员的语音准确度,进而提高了对智能汽车语音控制的效果。

Description

动态切换音区的方法、语音交互方法、设备、介质及车辆
技术领域
本发明涉及智能汽车技术领域,具体涉及一种动态切换车辆内音区的方法、语音交互方法、设备、介质及车辆。
背景技术
随着科技的发展,智能汽车走入了人们的生活,越来越多的智能汽车配备了语音控制功能,乘客通过语音即可实现对车辆的控制。
车辆内部通常会划分成多个音区,当某个音区内的乘客使用语音控制功能时车辆可以忽略来自其他音区的声音,以避免来自其他音区的声音对这位乘客使用语音控制功能产生干扰。但是,目前车辆内部的音区布局方式都是固定不变的,当某个音区内的乘客使用语音控制功能时,即使其他音区内没有乘客,这位乘客也无法利用其他音区内的语音交互设备对车辆进行语音控制,以提高语音控制的控制效果。
相应地,本领域需要一种新的技术方案来解决上述问题。
发明内容
为了克服上述缺陷,提出了本发明,以提供解决或至少部分地解决车辆的语音控制效果不佳的问题的动态切换车辆内音区的方法、语音交互方法、设备、介质及车辆。
在第一方面,提供一种动态切换车辆内音区的方法,方法包括:
动态获取车辆内人员的人员分布信息;
确定与当前人员分布信息匹配的音区布局方式;
根据与当前人员分布信息匹配的音区布局方式对车辆内实际的音区布局方式进行切换。
动态获取车辆内人员的人员分布信息;
确定与当前人员分布信息匹配的音区布局方式;
根据与当前人员分布信息匹配的音区布局方式对车辆内实际的音区布局方式进行切换。
在上述动态切换车辆内音区的方法的一个技术方案中,“动态获取车辆内人员的人员分布信息”的步骤具体包括动态地通过下列方式获取车辆内人员的人员分布信息:
获取通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息;
根据通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息,确定最终的人员分布信息。
在上述动态切换车辆内音区的方法的一个技术方案中,“根据通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息,确定最终的人员分布信息”的步骤具体包括:
确定多个不同类型的车内检测信息中优先级最高的车内检测信息;
根据通过优先级最高的车内检测信息检测得到的初始的人员分布信息,确定最终的人员分布信息。
在上述动态切换车辆内音区的方法的一个技术方案中,“根据通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息,确定最终的人员分布信息”的步骤具体包括:
获取数量最多的一种初始的人员分布信息;
根据获取到的初始的人员分布信息,确定最终的人员分布信息。
在上述动态切换车辆内音区的方法的一个技术方案中,“确定与当前人员分布信息匹配的音区布局方式”的步骤具体包括:
根据当前人员分布信息中人员的数量确定车辆内音区的数量,以便为每个人员分别形成一个音区;
根据当前人员分布信息中每个人员的位置分别确定每个人员各自对应的音区的覆盖范围;
根据音区的数量以及每个人员各自对应的音区的覆盖范围,确定与当前人员分布信息匹配的音区布局方式。
在上述动态切换车辆内音区的方法的一个技术方案中,车内检测信息包括图像信息和/或座椅传感器信息和/或雷达信息,方法还包括通过下列方式检测得到初始的人员分布信息:
对图像信息进行人体识别,根据人体识别的结果确定初始的人员分布信息;
和/或,
根据座椅传感器信息判断相应的座椅是否被占用,根据判断的结果确定初始的人员分布信息;
和/或,
根据雷达信息识别车辆内是否存在心跳信号,根据识别的结果确定初始的人员分布信息。
在第二方面,提供一种语音交互方法,方法包括:
采用上述动态切换车辆内音区的方法的技术方案中任一项动态切换车辆内音区的方法对车辆内实际的音区布局方式进行切换;
在接收到车辆内人员针对车辆语音系统发出的语音唤醒指令后,对语音唤醒指令进行声源定位;
根据声源定位的结果确定人员对应的音区,以便通过音区与人员进行语音交互;
在接收到车辆内人员针对车辆语音系统发出的语音唤醒指令后,对语音唤醒指令进行声源定位;
根据声源定位的结果确定人员对应的音区,以便通过音区与人员进行语音交互。
在第三方面,提供一种计算机设备,该计算机设备包括处理器和存储装置,所述存储装置适于存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行上述动态切换车辆内音区方法的技术方案中任一项技术方案所述的动态切换车辆内音区方法。
在第四方面,提供一种计算机可读存储介质,该计算机可读存储介质其中存储有多条程序代码,所述程序代码适于由处理器加载并运行以执行上述动态切换车辆内音区方法的技术方案中任一项技术方案所述的动态切换车辆内音区方法。
在第五方面,提供一种车辆,该车辆包括上述计算机设备技术方案所述的计算机设备。
本发明上述一个或多个技术方案,至少具有如下一种或多种有益效果:
在实施本发明的技术方案中,可以动态获取车辆内人员的人员分布信息,确定与当前人员分布信息匹配的音区布局方式,根据与当前人员分布信息匹配的音区布局方式对车辆内实际的音区布局方式进行切换。通过上述实施方式中,可以保证车辆内实际的音区布局方式与车辆内实际的人员分布信息保持一致,使得每个音区内都会有人,每个人都可以充分利用所在音区内的语音交互设备与车辆进行语音交互,对车辆进行语音控制等,克服了现有技术中当某个音区内的乘客使用语音控制功能时,即使其他音区内没有乘客,这位乘客也无法利用其他音区内的语音交互设备对车辆进行语音控制,降低了语音控制的控制效果的问题。
在动态切换车辆内音区时,通过根据不同类型的车内检测信息得到的初始的人员分布信息,确定最终的人员分布信息,可以将不同类型的车内检测信息结合起来,通过设置优先级或统计数量最多的初始的人员分布信息作为最终的人员分布信息,降低了由于硬件故障带来的错误的车内检测信息的干扰,提高了获取人员分布信息的鲁棒性。
附图说明
参照附图,本发明的公开内容将变得更易理解。本领域技术人员容易理解的是:这些附图仅仅用于说明的目的,而并非意在对本发明的保护范围组成限制。其中:
图1是根据本发明的一个实施例的动态切换车辆内音区的方法的主要步骤流程示意图;
图2是根据本发明的一个实施例的语音交互方法的主要步骤流程示意图。
具体实施方式
下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
在本发明的描述中,“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路,各种合适的感应器,通信端口,存储器,也可以包括软件部分,比如程序代码,也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质,比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合,比如只是A、只是B或者A和B。
在本文中用到的方位术语如“前”、“后”、等均以部件安装至车辆后车辆的前后方向为基准。
下面先结合附图对本发明提供的动态切换车辆内音区的方法的实施例进行说明。
具体地,参阅附图1,图1是根据本发明的一个实施例的动态切换车辆内音区的方法的主要步骤流程示意图。如图1所示,本发明实施例中的动态切换车辆内音区的主要包括下列步骤S101至步骤S103。
步骤S101:动态获取车辆内人员的人员分布信息。
车辆内人员包括司机与乘客。车辆内人员的人员分布信息包括车辆内人员的数量及车辆内人员的位置。动态获取车辆内的人员分布信息可以采用间隔固定时长获取一次,也可以采用在车辆启动后的全部时间内都进行人员分布信息的获取,也可以采用在车辆开启和/或关闭车门时获取人员分布信息,本发明对动态获取车辆内人员的人员分布信息时机不作限定。
步骤S102:确定与当前人员分布信息匹配的音区布局方式。
音区的布局方式包括音区的数量及音区的位置。与人员分布信息匹配即与人员的数量及车辆内人员的位置匹配。音区布局的数量应与人员的数量匹配,音区的布局位置应与人员的位置匹配。
例如,某个车辆当前人员分布信息为主驾驶位有一名司机、副驾驶位有一位乘客,后排无乘客,那么应当为司机与乘客各设置一个音区,后排不设置音区。
步骤S103:根据与当前人员分布信息匹配的音区布局方式对车辆内实际的音区布局方式进行切换。
由于车辆内的人员分布信息随时有可能发生变动,因此需要将车辆内实际的音区布局方式切换为与当前人员分布信息匹配的音区布局方式。
例如,某个车辆当前的音区数量为1,该音区的位置在主驾驶位的司机。而与当前人员分布信息匹配的音区布局方式是为司机与乘客各设置一个音区,后排不设置音区。那么就需要将车辆实际的音区布局方式切换为司机与乘客各设置一个音区,后排不设置音区。
基于上述步骤S101至步骤S103所述的方法,通过动态获取车辆内人员的人员分布信息,可以在车内人员数量变动或位置变动时,第一时间获取到最新的车辆内人员的人员分布信息。通过保证车辆内实际的音区布局方式与车辆内最新的人员分布信息保持一致,车辆可以根据实际需求确定音区的覆盖范围,使得一个音区内可能存在多套语音交互设备,从而使车辆更准确的识别音区内人员发出的语音,进而提高了车辆的语音控制效果。
下面对上述步骤S101至步骤S103分别作进一步说明。
在根据本发明的一个实施例中,“动态获取车辆内人员的人员分布信息”的步骤具体包括动态地通过步骤11至步骤12获取车辆内人员的人员分布信息。
步骤11:获取通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息。
其中不同类型的车内检测信息是通过车内不同的传感器获取的,包括但不限于通过以下方式获取传感信息:通过摄像头获取车内的图像信息、通过座椅传感器获取座椅上的重量信息、通过雷达获取车内的物体信息等。
步骤12:根据通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息,确定最终的人员分布信息。
单个车内传感器仅能片面地反应一种车内检测信息,且单个车内传感器极有可能出现故障,最终造成反馈的车内检测信息错误。通过采用步骤11至步骤12的方法,综合初始的人员分布信息确定最终的人员分布信息,可以避免将单个车内检测信息得到的初始人员分布信息作为最终的人员分布信息造成的误判。
下面对本发明实施例中最终的人员分布信息的方法进行说明。
在根据本发明的一个实施例中,“根据通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息,确定最终的人员分布信息”的步骤具体包括:
步骤21:确定多个不同类型的车内检测信息中优先级最高的车内检测信息。
由于根据不同类型的车内检测信息确定初始的人员分布信息的准确度不同,因此需要为不同类型的车内检测信息设置优先级。其中,车内检测信息检测得到的初始的人员分布信息的可信度越高,车内检测信息的优先级也越高。车内检测信息检测得到的初始的人员分布信息的可信度与车内检测信息的优先级呈现正相关关系。车内检测信息检测得到的初始的人员分布信息的可信度可以通过统计预设次数中初始的人员分布信息与车内实际人员分布信息相同的比例确定。例如,预设次数可以为1000次,根据摄像头采集的图像信息检测得到的初始的人员分布信息共有990次与车内实际人员分布信息相同,可以得到摄像头采集的图像信息的可信度为99%。而根据座椅传感器采集的座椅传感器信息检测得到的初始的人员分布信息共有890次与车内实际人员分布信息相同,可以得到座椅传感器采集的座椅传感器信息的可信度为89%。由于摄像头采集的图像信息可信度高于座椅传感器信息,因此可以确定摄像头采集的图像信息优先级高与座椅传感器信息。当然,也可以采用其他方法确定车内检测信息的可信度,本发明对确定车内检测信息的可信度的方法不作限定。
步骤22:根据通过优先级最高的车内检测信息检测得到的初始的人员分布信息,确定最终的人员分布信息。
若优先级高的车内检测信息检测得到的初始的人员分布信息与优先级低的车内检测信息检测得到的初始的人员分布信息产生冲突,则以优先级高的车内检测信息检测得到的初始的人员分布信息为准,并根据优先级高的车内检测信息检测得到的初始的人员分布信息确定最终的人员分布信息。
例如,若车辆内传感器包括摄像头及座椅传感器,摄像头采集的图像信息优先级高于座椅传感器信息。根据座椅传感器信息确定初始的人员分布信息为车内有两名人员,一名在主驾驶位置,另一名在副驾驶位置。而根据摄像头采集的图像信息确定初始的人员分布信息为车内仅有一名人员在主驾驶位置。此时,根据座椅传感器信息确定的初始的人员分布信息与根据摄像头采集的图像信息确定的初始的人员分布信息发生了冲突。因为摄像头采集的图像信息优先级高于座椅传感器信息,所以确定最终的人员分布信息为车内仅有一名人员在主驾驶位置。
通过根据车内检测信息检测得到的初始的人员分布信息的可信度高低来为不同类型的车内检测信息设置优先级,将车内检测信息检测得到的初始的人员分布信息可信度高的车内检测信息设置为高优先级,将车内检测信息检测得到的初始的人员分布信息可信度低的车内检测信息设置为低优先级,可以保证在根据车内检测信息确定的初始的人员分布信息发生了冲突的情况下,仍然能最大程度上保证人员分布信息的准确性。
除了通过上述根据通过优先级最高的车内检测信息检测得到的初始的人员分布信息,确定最终的人员分布信息的方法,本发明还提供另一种确定最终的人员分布信息的方法。
具体而言,在根据本发明的一个实施例中,“根据通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息,确定最终的人员分布信息”的步骤具体包括:
步骤31:获取数量最多的一种初始的人员分布信息。
例如,有两种车内检测信息确定的初始的人员分布信息为车辆内仅有一名人员在主驾驶位置,只有一种车内检测信息确定初始的人员分布信息为车内有两名人员,一名在主驾驶位置,另一名在副驾驶位置。那么将上述有两种车内检测信息确定的初始的人员分布信息作为数量最多的一类初始的人员分布信息,即车辆内仅有一名人员在主驾驶位置。
步骤32:根据获取到的初始的人员分布信息,确定最终的人员分布信息。
在车辆的初始的人员分布信息不同的情况下,通过采用步骤31至步骤32的方法,可以选择数量最多的一种初始的人员分布信息,确定最终的人员分布信息。通过对不同类型的车内检测信息进行综合,降低了由于车辆内传感器异常造成对最终的人员分布信息误判的概率。
下面对本发明如何检测得到初始的人员分布信息的步骤进行说明。
在根据本发明的一个实施例中,车内检测信息包括图像信息和/或座椅传感器信息和/或雷达信息,根据本发明提供的动态切换车内音区的方法可以通过下列方式检测得到初始的人员分布信息:
对图像信息进行人体识别,根据人体识别的结果确定初始的人员分布信息。
对图像信息进行人体识别可以采用基于神经网络的模型进行识别,也可以采用基于图像几何特征的方法或采用基于特征脸方法的模型进行识别,或者也可以采用其他方法进行人体识别,本发明对进行人体识别的方式不进行限定。其中,人体识别的结果包括人体所在的位置及人体的数量。例如,人体识别的结果为车内存在两个人体,一个在主驾驶位,另一个在副驾驶位,那么根据人体识别的结果,可以确定本次确定初始的人员分布信息为车内有两个人员,他们分别位于主驾驶位与副驾驶位。
根据座椅传感器信息判断相应的座椅是否被占用,根据判断的结果确定初始的人员分布信息。
若座椅传感器信息中,一个座椅上的重量为零,那么认为这个座椅上不存在人员,若一个座椅上的重量不为零,那么认为这个座椅上存在人员。或者设置一个预设重量阈值,若一个座椅上的重量大于等于预设重量阈值,则认为这个座椅上存在人员,若一个座椅上的重量小于预设重量阈值,则认为这个座椅上不存在人员。通过统计存在人员的座椅数量及存在人员的座椅位置,可以确定初始的人员分布信息。
根据雷达信息识别车辆内是否存在心跳信号,根据识别的结果确定初始的人员分布信息。
其中雷达可以选择毫米波雷达。通过毫米波雷达信息可以确定车内产生心跳的对象位置与数量,存在心跳的对象即车内人员。因为普通人的心跳频率一般为0.8-2.0Hz,单次心跳的心脏前向位移为0.1-0.5毫米,后向位移为0.01-0.2毫米,所以通过统计车辆内频率和位移幅度与心脏相同的对象的位置与数量即可确定车内人员的位置与数量,从而得到初始的人员分布信息。当然,也可以通过其他方法根据雷达信息识别车辆内是否存在心跳信号,本发明不对根据雷达信息识别车辆内是否存在心跳信号的方法进行限定。
采用雷达信息与图像信息确定初始的人员分布信息较为准确,但判断的过程较为繁琐,采用座椅传感器判断的过程便捷但可能因座椅上存在非人员的物体产生误判。
下面对确定与当前人员分布信息匹配的音区布局方式的步骤(步骤S102)进行说明。
具体而言,在根据本发明的一个实施例中,“确定与当前人员分布信息匹配的音区布局方式”的步骤具体包括:
步骤41:根据当前人员分布信息中人员的数量确定车辆内音区的数量,以便为每个人员分别形成一个音区。
为了避免人员在语音控制车辆时,车辆内其他人员的声音对当前正在语音控制车辆的人员声音产生干扰,应当为每个人员分别形成一个音区。
步骤42:根据当前人员分布信息中每个人员的位置分别确定每个人员各自对应的音区的覆盖范围。
例如,一个人员在主驾驶位的后排落座,且该排有且仅有上述一个人员,那么可以将上述一个人员所在的整排作为他对应的音区覆盖范围。若有两个人员在主驾驶位的后排左右落座,那么可以将主驾驶位的后排划分为左右两个音区,与上述两个人员对应。落座在主驾驶位后排左侧人员对应的音区范围为后排的左半部分,落座在主驾驶位后排右侧人员对应的音区范围为后排的右半部分。
步骤43:根据音区的数量以及每个人员各自对应的音区的覆盖范围,确定与当前人员分布信息匹配的音区布局方式。
通过根据人员位置与数量确定音区的覆盖范围,实现了音区的大小动态调节。当主驾驶位的后排座椅上只有一个人员时,可以将整个后排座椅设置为一个音区,使更多的麦克风设备收集后排座椅上的人员发出的语音,改善了对语音识别的准确性,提高了对车辆进行语音控制的效果。
下面对本发明提供的语音交互方法的实施例进行说明。
具体地,参阅附图2,图2是根据本发明的一个实施例的语音交互方法的主要步骤流程示意图。如图2所示,本发明实施例中的语音交互方法的主要包括下列步骤S201至步骤S203。
步骤S201:采用前述所述实施例所述的动态切换车辆内音区的方法对车辆内实际的音区布局方式进行切换。
对车辆内时间的音区布局方式进行切换,即将音区的数量、位置与音区覆盖范围切换为最新的确定的。
步骤S202:在接收到车辆内人员针对车辆语音系统发出的语音唤醒指令后,对语音唤醒指令进行声源定位。
为了接收车辆内人员发出的声音,在车辆主驾驶位、副驾驶位及后排乘客位布置有多套语音交互设备,每套语音交互设备包含麦克风。由于车辆内人员距离麦克风的远近不同,所以车辆内人员发出的声音传播至不同的麦克风存在时延差。在进行声源定位时可以采用基于到达时延差(Time Difference ofArrival,TDOA)估计的定位方法。又由于声音在传播的过程中存在能量衰减少,所以车辆内人员发出的声音传播至不同的麦克风时的能量不同。在进行声源定位时可以采用基于最大输出功率的可控波束成形的定位方法。由于前述两种声源定位为本领域技术人员熟知,此处不再赘述。当然,本领域技术人员也可以采用其他方法进行声源定位,本发明不作具体限定。
步骤S203:根据声源定位的结果确定人员对应的音区,以便通过音区与人员进行语音交互。
在确定发出语音唤醒指令的人员对应的音区后,可以忽略来自其他音区的声音,从而避免其他音区的声音对语音交互的干扰。
采用上述步骤S201至S203的语音交互方法,可以实现在人员位置或人员数量发生变动时及时更改音区的布局方式,车辆可以根据实际需求确定音区的覆盖范围,使得一个音区内可能存在多套语音交互设备,提高了收集到的语音的准确度,改善了车内人员对车辆进行语音控制的效果。在对语音唤醒指令进行声源定位后,可以确定声源位于哪个音区,从而可以忽略来自其他音区的声音,以避免这些声音对声源的干扰,提高了车辆的语音控制效果。
需要指出的是,尽管上述实施例中将各个步骤按照特定的先后顺序进行了描述,但是本领域技术人员可以理解,为了实现本发明的效果,不同的步骤之间并非必须按照这样的顺序执行,其可以同时(并行)执行或以其他顺序执行,这些变化都在本发明的保护范围之内。
本领域技术人员能够理解的是,本发明实现上述一实施例的方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
进一步,本发明还提供了一种计算机设备。在根据本发明的一个计算机设备的实施例中,计算机设备包括处理器和存储装置,存储装置可以被配置成存储执行上述方法实施例的动态切换车辆内音区的方法或语音交互方法的程序,处理器可以被配置成执行存储装置中的程序,该程序包括但不限于执行上述方法实施例的动态切换车辆内音区的方法或语音交互方法的程序。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机设备可以是包括各种电子设备形成的控制装置设备。
进一步,本发明还提供了一种计算机可读存储介质。
在根据本发明的一个计算机可读存储介质的实施例中,计算机可读存储介质可以被配置成存储执行上述方法实施例的动态切换车辆内音区的方法或语音交互方法的程序,该程序可以由处理器加载并运行以实现上述动态切换车辆内音区的方法或语音交互方法。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机可读存储介质可以是包括各种电子设备形成的存储装置设备,可选的,本发明实施例中计算机可读存储介质是非暂时性的计算机可读存储介质。
进一步,本发明还提供了一种车辆。在根据本发明的一个车辆实施例中,车辆可以包括上述计算机设备实施例所述的计算机设备。在本实施例中车辆可以是自动驾驶车辆、无人车等车辆。此外,按照动力源类型划分,本实施例中车辆可以是燃油车、电动车、电能与燃油混合的混动车或使用其他新能源的车辆等。
至此,已经结合附图所示的一个实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (10)

1.一种动态切换车辆内音区的方法,其特征在于,所述方法包括:
动态获取所述车辆内人员的人员分布信息;
确定与当前人员分布信息匹配的音区布局方式;
根据所述与当前人员分布信息匹配的音区布局方式对所述车辆内实际的音区布局方式进行切换。
2.根据权利要求1所述的动态切换车辆内音区的方法,其特征在于,“动态获取所述车辆内人员的人员分布信息”的步骤具体包括动态地通过下列方式获取所述车辆内人员的人员分布信息:
获取通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息;
根据所述通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息,确定最终的人员分布信息。
3.根据权利要求2所述的动态切换车辆内音区的方法,其特征在于,“根据所述通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息,确定最终的人员分布信息”的步骤具体包括:
确定所述多个不同类型的车内检测信息中优先级最高的车内检测信息;
根据通过所述优先级最高的车内检测信息检测得到的初始的人员分布信息,确定所述最终的人员分布信息。
4.根据权利要求2所述的动态切换车辆内音区的方法,其特征在于,“根据所述通过多个不同类型的车内检测信息分别检测得到的初始的人员分布信息,确定最终的人员分布信息”的步骤具体包括:
获取数量最多的一种所述初始的人员分布信息;
根据获取到的所述初始的人员分布信息,确定最终的人员分布信息。
5.根据权利要求1所述的动态切换车辆内音区的方法,其特征在于,“确定与当前人员分布信息匹配的音区布局方式”的步骤具体包括:
根据所述当前人员分布信息中人员的数量确定所述车辆内音区的数量,以便为每个所述人员分别形成一个音区;
根据所述当前人员分布信息中每个所述人员的位置分别确定每个所述人员各自对应的音区的覆盖范围;
根据所述音区的数量以及每个所述人员各自对应的音区的覆盖范围,确定与所述当前人员分布信息匹配的音区布局方式。
6.根据权利要求2所述的动态切换车辆内音区的方法,其特征在于,所述车内检测信息包括图像信息和/或座椅传感器信息和/或雷达信息,所述方法还包括通过下列方式检测得到所述初始的人员分布信息:
对所述图像信息进行人体识别,根据人体识别的结果确定所述初始的人员分布信息;
和/或,
根据所述座椅传感器信息判断相应的座椅是否被占用,根据判断的结果确定所述初始的人员分布信息;
和/或,
根据所述雷达信息识别所述车辆内是否存在心跳信号,根据识别的结果确定所述初始的人员分布信息。
7.一种语音交互方法,其特征在于,所述方法包括:
采用权利要求1至6中任一项所述的动态切换车辆内音区的方法对所述车辆内实际的音区布局方式进行切换;
在接收到所述车辆内人员针对车辆语音系统发出的语音唤醒指令后,对所述语音唤醒指令进行声源定位;
根据声源定位的结果确定所述人员对应的音区,以便通过所述音区与所述人员进行语音交互。
8.一种计算机设备,包括处理器和存储装置,所述存储装置适于存储多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行权利要求1至6中任一项所述的动态切换车辆内音区的方法或权利要求7所述的语音交互方法。
9.一种计算机可读存储介质,其中存储有多条程序代码,其特征在于,所述程序代码适于由处理器加载并运行以执行权利要求1至6中任一项所述的动态切换车辆内音区的方法或权利要求7所述的语音交互方法。
10.一种车辆,其特征在于,所述车辆包括权利要求8所述的计算机设备。
CN202211225606.6A 2022-10-09 2022-10-09 动态切换音区的方法、语音交互方法、设备、介质及车辆 Pending CN115691490A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211225606.6A CN115691490A (zh) 2022-10-09 2022-10-09 动态切换音区的方法、语音交互方法、设备、介质及车辆
PCT/CN2023/123490 WO2024078435A1 (zh) 2022-10-09 2023-10-09 动态切换音区的方法、语音交互方法、设备、介质及车辆

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211225606.6A CN115691490A (zh) 2022-10-09 2022-10-09 动态切换音区的方法、语音交互方法、设备、介质及车辆

Publications (1)

Publication Number Publication Date
CN115691490A true CN115691490A (zh) 2023-02-03

Family

ID=85064192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211225606.6A Pending CN115691490A (zh) 2022-10-09 2022-10-09 动态切换音区的方法、语音交互方法、设备、介质及车辆

Country Status (2)

Country Link
CN (1) CN115691490A (zh)
WO (1) WO2024078435A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117636858A (zh) * 2024-01-25 2024-03-01 深圳市一么么科技有限公司 一种智能家具控制器及控制方法
WO2024078435A1 (zh) * 2022-10-09 2024-04-18 蔚来汽车科技(安徽)有限公司 动态切换音区的方法、语音交互方法、设备、介质及车辆

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017193207A (ja) * 2016-04-18 2017-10-26 アイシン精機株式会社 車室内会話支援装置
CN110010126B (zh) * 2019-03-11 2021-10-08 百度国际科技(深圳)有限公司 语音识别方法、装置、设备和存储介质
CN111688580B (zh) * 2020-05-29 2023-03-14 阿波罗智联(北京)科技有限公司 智能后视镜进行拾音的方法以及装置
CN111816189B (zh) * 2020-07-03 2023-12-26 斑马网络技术有限公司 一种车辆用多音区语音交互方法及电子设备
KR20220091146A (ko) * 2020-12-23 2022-06-30 현대자동차주식회사 차량용 음향 제어 장치 및 그 제어 방법
WO2022227028A1 (zh) * 2021-04-30 2022-11-03 华为技术有限公司 车载显示装置的控制方法、控制装置、电子设备、车辆
CN114885273A (zh) * 2022-03-15 2022-08-09 科大讯飞股份有限公司 音区调整方法及相关装置、设备、系统和介质
CN115691490A (zh) * 2022-10-09 2023-02-03 蔚来汽车科技(安徽)有限公司 动态切换音区的方法、语音交互方法、设备、介质及车辆

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024078435A1 (zh) * 2022-10-09 2024-04-18 蔚来汽车科技(安徽)有限公司 动态切换音区的方法、语音交互方法、设备、介质及车辆
CN117636858A (zh) * 2024-01-25 2024-03-01 深圳市一么么科技有限公司 一种智能家具控制器及控制方法
CN117636858B (zh) * 2024-01-25 2024-03-29 深圳市一么么科技有限公司 一种智能家具控制器及控制方法

Also Published As

Publication number Publication date
WO2024078435A1 (zh) 2024-04-18

Similar Documents

Publication Publication Date Title
CN115691490A (zh) 动态切换音区的方法、语音交互方法、设备、介质及车辆
CN109545230B (zh) 车辆内的音频信号处理方法和装置
CN107924632B (zh) 信息处理设备、信息处理方法和程序
CN110010126B (zh) 语音识别方法、装置、设备和存储介质
US11815614B2 (en) Method and apparatus for vehicle occupant location detection
CN109920405A (zh) 多路语音识别方法、装置、设备及可读存储介质
CN108597508B (zh) 用户识别方法、用户识别装置和电子设备
CN109584871B (zh) 一种车辆中语音指令的用户身份识别方法、装置
CN113270095B (zh) 语音处理方法、装置、存储介质及电子设备
US20210300272A1 (en) Presentation device, presentation method, and program
US10475342B2 (en) Parking lot evaluation apparatus, parking lot information supply method, and data structure of parking lot information
CN112124232A (zh) 一种自动调节车辆座椅的方法
CN108382352A (zh) 安全提醒方法和装置
CN113548062A (zh) 汽车的交互控制方法、装置及计算机存储介质
US20210379990A1 (en) Vehicle Access System and Methods for Providing Zone-Determination Based Features Therewith
CN109741367A (zh) 车辆跟随的目标轨迹识别方法
CN109215648A (zh) 车载语音识别系统及方法
CN110070740A (zh) 报告系统和存储介质
CN113829994B (zh) 基于车外鸣笛声的预警方法、装置、汽车及介质
CN111640324B (zh) 运行控制装置以及车辆
JP7238630B2 (ja) 生体情報検知システム
WO2018217205A1 (en) Vehicle seat operation
CN115831141A (zh) 车载语音的降噪方法、装置、车辆及存储介质
JP2019214249A (ja) 検知装置、コンピュータプログラム、検知方法及び学習モデル
US20240177545A1 (en) Determining a Location of a Squeak or Rattle Associated with a Vehicle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination