CN115101070A

CN115101070A - 车辆控制方法、装置、车辆及电子设备

Info

Publication number: CN115101070A
Application number: CN202210943242.9A
Authority: CN
Inventors: 张亚林; 赵博闻; 邱铭杰
Original assignee: Jidu Technology Co ltd
Current assignee: Beijing Jidu Technology Co Ltd
Priority date: 2022-08-08
Filing date: 2022-08-08
Publication date: 2022-09-23

Abstract

本申请公开了一种车辆控制方法、装置、车辆及电子设备，属于车辆技术领域，该车辆控制方法包括：接收目标用户的第一语音信息；在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像；分别对所述N个手势图像中的每个手势图像进行手势识别，得到所述N个手势图像中的每个手势图像对应的手势；在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作。本申请提供的车辆控制方法，使得位于车舱外的用户无需额外携带实体设备即可较为安全的对车辆进行控制，可以在保证车辆控制的安全性的同时提高车辆控制的便捷性。

Description

车辆控制方法、装置、车辆及电子设备

技术领域

本申请属于车辆技术领域，具体涉及一种车辆控制方法、装置、车辆及电子设备。

背景技术

随着通信技术的不断发展，在用户位于车辆车舱外部的情况下，为了方便用户操作，越来越多车辆支持用户通过移动终端(例如，手机、平板电脑或智能手表等)进行控制，例如，通过移动终端作为车钥匙来解锁车辆、控制车内的相关设备(例如，空调、音响设备等)等。然而在移动终端无法使用(例如，未携带移动终端、移动终端故障、没电关机等)的情况下，若用户位于车辆外部，且用户未携带实体钥匙，则无法进入车辆，进而也无法控制车内的相关设备。

可见，现有技术中存在车辆控制受限于用户携带相关实体设备(移动终端和实体钥匙等)，导致车辆的控制操作较为不便。

发明内容

本申请提供了一种车辆控制方法、装置、车辆及电子设备。

根据本申请的第一方面，提供了一种车辆控制方法，包括：

接收目标用户的第一语音信息，其中，所述目标用户位于车辆车舱的外部；

在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像，N为大于1的整数；

分别对所述N个手势图像中的每个手势图像进行手势识别，得到所述N个手势图像中的每个手势图像对应的手势；

在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，其中，所述目标手势序列为所述N个手势图像对应的手势按照所述N个手势图像采集的先后顺序排列得到的手势序列。

根据本申请的第二方面，提供了一种车辆控制装置，包括：

第一接收模块，用于接收目标用户的第一语音信息；其中，所述目标用户位于车辆车舱的外部；

第一采集模块，用于在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像，N为大于1的整数；

手势识别模块，用于分别对所述N个手势图像中的每个手势图像进行手势识别，得到所述N个手势图像中的每个手势图像对应的手势；

第一执行模块，用于在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，其中，所述目标手势序列为所述N个手势图像对应的手势按照所述N个手势图像采集的先后顺序排列得到的手势序列。

根据本申请的第三方面，提供了一种车辆，所述车辆包括车舱，所述车舱包括侧门板和侧门玻璃，包括：

图像采集装置，用于采集目标用户的手部图像；其中，所述目标用户位于车辆车舱的外部；

显示装置，所述显示装置与所述图像采集装置通信连接，所述显示装置的显示区域用于显示第二信息，其中，当通过所述图像采集装置采集所述目标用户的手部图像时，所述显示区域位于所述目标用户的视线经过所述侧门玻璃的可视区域，所述第二信息包括所述手部图像和与所述手部图像相关的信息中的至少一项；

控制器，所述控制器分别与所述图像采集装置和所述显示装置通信连接，用于对所述手部图像进行处理，并根据处理结果确定是否对所述车辆执行目标操作。

根据本申请的第四方面，提供了一种电子设备，包括：

至少一个处理器；以及

与至少一个处理器通信连接的存储器；其中，

存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器能够执行第一方面的方法。

根据本申请的第五方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行第一方面的方法。

根据本申请的第六方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现第一方面的方法。

根据本申请实施例的技术，通过接收目标用户的第一语音信息，其中，所述目标用户位于车辆车舱的外部；在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像，N为大于1的整数；分别对所述N个手势图像中的每个手势图像进行手势识别，得到所述N个手势图像中的每个手势图像对应的手势；在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，其中，所述目标手势序列为所述N个手势图像对应的手势按照所述N个手势图像采集的先后顺序排列得到的手势序列，这样使得位于车舱外的用户无需额外携带实体设备即可较为安全的对车辆进行控制，可以在保证车辆控制的安全性的同时提高车辆控制的便捷性。此外，由于用于手势识别的手势图像的采集对于图像采集装置的要求并不高，这样可以节省硬件成本。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是本申请实施例提供的车辆控制方法的流程图之一；

图2是本申请实施例提供的显示装置的显示界面的示意图；

图3是本申请实施例提供的设置手势密码的流程图；

图4是本申请实施例可应用的车辆架构的示意图；

图5是本申请实施例提供的车辆控制方法的流程图之二；

图6是本申请实施例提供的车辆控制装置的结构图；

图7是本申请实施例提供的车辆的示意图之一；

图8是本申请实施例提供的车辆的示意图之二；

图9是本申请实施例提供的目标用户车外控制车辆的示意图；

图10是本申请实施例提供的电子设备的结构图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

如图1所示，本申请实施例提供一种车辆控制方法，包括如下步骤：

步骤101、接收目标用户的第一语音信息，其中，所述目标用户位于车辆车舱的外部。

本实施例中，上述车辆具有可封闭的车舱，该车舱可供驾驶员、乘客等人员乘坐。需要说明的是，上述车辆的车舱处于封闭状态，包括车门上锁、车窗关闭等，这时目标用户不能够进入车舱。上述目标用户可以是任意位于车舱外的人。示例性的，可以通过设置在车辆外部的语音采集设备(例如，麦克风)采集车舱外处于站立状态的目标用户的第一语音信息，例如，上述语音采集设备可以设置于车辆的B柱、车辆的后视镜、车辆底盘等位置。在一些可选的的实施例中，上述语音采集设备可以包括设置于车辆的左侧后视镜底部的第一麦克风和设置于车辆的右侧后视镜底部的第二麦克风。

步骤102、在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像，N为大于1的整数。

上述声纹特征可以包括但不限于声学特征、词法特征、韵律特征、语种、方言和口音信息等中的至少一项。示例性的，上述声学特征可以包括快速傅里叶变换(Fast FourierTransmit，FFT)特征、梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient，MFCC)特征或基于滤波器组(Filter bank，Fbank)特征等。示例性的，上述词法特征可以包括通过n-gram(N元语法模型)描述的词、通过n-gram描述的音素等。示例性的，上述韵律特征可以包括通过n-gram描述的基音等。

在一些可选的实施例中，在接收到第一语音信息的情况下，可以对第一语音信息进行预处理，例如，降噪处理、唤醒检测等。其中，上述唤醒检测用于检测第一语音信息是否包括预设的唤醒词；并对预处理后的第一语音信息进行声纹特征提取。

示例性的，上述第一语音信息的声纹特征与预设声纹特征匹配，可以包括上述第一语音信息的声纹特征与预设声纹特征的相识度大于第一预设值，其中，上述第一预设值可以根据需求进行合理设置，例如，60％、75％或80％等。

上述图像采集装置可以设置于车辆车舱的外部，例如，可以设置于车辆的A柱、B柱、车辆的后视镜、车辆前轮翼子板上部等位置。

上述N的取值根据预设手势序列包括的预设手势的数量确定，具体的，上述N的取值为预设手势序列包括的预设手势的数量。

步骤103、分别对所述N个手势图像中的每个手势图像进行手势识别，得到所述N个手势图像中的每个手势图像对应的手势。

步骤104、在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，其中，所述目标手势序列为所述N个手势图像对应的手势按照所述N个手势图像采集的先后顺序排列得到的手势序列。

上述预设手势序列也可以称为手势密码，可以包括N个按序排序的预设手势。上述目标手势序列与预设手势序列匹配可以包括上述目标手势序列中的每个手势均与预设手势序列中对应的预设手势相匹配。其中，上述手势与对应的预设手势相匹配，可以包括上述手势与对应的预设手势的相似度大于第二预设值，其中，上述第二预设值可以根据需求进行合理设置，例如，80％、90％等。

示例性的，可以将上述目标手势序列中的每个手势分别与预设手势序列中对应的预设手势进行对比，例如，将上述目标手势序列中的第一个手势与预设手势序列中的第一个预设手势进行对比，将上述目标手势序列中的第二个手势与预设手势序列中的第二个预设手势进行对比，以此类推，在上述目标手势序列中的每个手势均与预设手势序列中对应的预设手势匹配的情况下，通过车辆的车身域控制器(BGM)控制所述车辆执行目标操作。

需要说明的是，在一些可选的的实施例中，可以在每采集一张手势图像的情况下，对该手势图像进行手势识别，得到该手势图像对应的手势，将该手势图像对应的手势与上述预设手势序列中对应的预设手势进行对比，并在该手势图像对应的手势与上述预设手势序列中对应的预设手势匹配的情况下，采集下一张手势图像，以此类推，直至完成与上述预设手势序列中最后一个预设手势的对比。在一些可选的实施例中，可以在完成N个手势图像采集之后，分别对N个手势图像中的每个进行手势识别，得到目标手势序列，再将目标手势序列与预设手势序列进行对比。

上述目标操作可以包括但不限于解锁车辆、启动车辆、打开车辆的空调、打开车辆的车窗以及打开车辆的音响设备等中的一项或多项。

本申请实施例提供的车辆控制方法，通过接收目标用户的第一语音信息，其中，所述目标用户位于车辆车舱的外部；在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像，N为大于1的整数；分别对所述N个手势图像中的每个手势图像进行手势识别，得到所述N个手势图像中的每个手势图像对应的手势；在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，其中，所述目标手势序列为所述N个手势图像对应的手势按照所述N个手势图像采集的先后顺序排列得到的手势序列，使得位于车舱外的用户无需额外携带实体设备即可较为安全的对车辆进行控制，可以在保证车辆控制的安全性的同时提高车辆控制的便捷性。此外，由于用于手势识别的手势图像的采集对于图像采集装置的要求并不高，这样可以节省硬件成本。

可选地，所述方法还包括：

在所述车辆的显示装置的显示区域实时显示第一信息，其中，所述第一信息包括所述图像采集装置采集的手势图像和与所述手势图像相关的信息中的至少一项。

本实施例中，上述显示装置可以包括显示屏或者投影设备等。需要说明的是，当显示装置是投影设备时，所述显示装置的显示区域指的是所述投影设备的投影区域。上述显示装置的安装应使得其显示区域尽量设置于方便用户在车外查看显示内容的位置。在一些可选的实施例中，上述显示装置可以设置于车辆车舱的内部，例如，上述显示装置可以设置于车辆的仪表台，且上述显示装置朝向主驾区域或者朝向副驾区域，方便用户查看。在一些可选的实施例中，上述显示装置是显示屏，其可以设置于车辆的仪表台上，并从主驾区域延伸到副驾区域。在一些可选的实施例中，所述显示屏的横向宽度占据车舱的横向宽度的70％以上。

上述手势图像相关的信息可以包括基于手势图像识别到的手势或手部特征信息等。示例性的，可以在所述显示装置的第一显示区域实时显示所述图像采集装置采集的手势图像，并在识别到所述图像采集装置采集的手势图像对应的手势或者所述图像采集装置采集的手势图像对应的手势与对应的预设手势匹配的情况下，在所述显示装置的第二显示区域显示所述图像采集装置采集的手势图像对应的手势。示例性的，如图2所示，在显示装置20的第一显示区域21实时显示摄像头采集的手势图像，并可以每识别成功或匹配成功一个手势，在第二显示区域22识别成功或者匹配成功的手势。

在一些可选的实施例中，可以在预设时长内未能成功识别到所述图像采集装置采集的手势图像对应的手势或者所述图像采集装置采集的手势图像对应的手势与对应的预设手势不匹配的情况下，在所述显示装置的第三显示区域显示第一提示信息，所述第一提示信息用于提示手势识别失败或者手势匹配失败，以便于提醒用户调整手部姿势，以完成手势识别。

本实施例通过在所述车辆的显示装置的显示区域实时显示所述图像采集装置采集的手势图像和与所述手势图像相关的信息中的至少一项，这样方便用户基于显示的手势图像调整手部姿势，提高手势识别的成功率。

可选地，所述图像采集装置设置于所述车辆的左侧后视镜或者所述车辆的左侧前车轮的翼子板上，所述显示装置设置于所述车辆的仪表台，且所述显示装置的至少部分区域位于所述仪表台中对应主驾驶位的区域；

或者

所述图像采集装置设置于所述车辆的右侧后视镜或者所述车辆的右侧前车轮的翼子板上，所述显示装置设置于所述车辆的仪表台，且所述显示装置的至少部分区域位于所述仪表台中对应副驾驶位的区域。

示例性的，上述图像采集装置可以设置于左侧后视镜的底部，或者可以设置于左侧前车轮的翼子板的外侧面，上述显示装置20可以设置于仪表台中对应主驾驶位的区域，这样用户站在主驾驶位的车窗外、处于自然站立状态时即可较为方便的展示手势图像并查看手势识别情况；或者上述图像采集装置可以设置于右侧后视镜的底部，或者可以设置于右侧前车轮的翼子板的外侧面，上述显示装置20可以设置于仪表台中对应副驾驶位的区域，这样用户站在副驾驶位的车窗外、处于自然站立状态时即可较为方便的展示手势并查看手势识别情况。

在一些可选的实施例中，上述显示屏可以自仪表台的中心区域一直延伸至仪表台的左侧边缘区域，或者，上述显示屏可以自仪表台的中心区域一直延伸至仪表台的右侧边缘区域，或者，上述显示屏可以自仪表台的左侧区域一直延伸至仪表台的右侧边缘区域。

在一些可选的实施例中，所述图像采集装置和所述显示装置可以复用所述车辆中已有的部件，从而可以降低用户使用本实施例的方法的学习障碍和成本，例如，上述显示装置可以是车辆的车机显示屏，上述图像采集装置可以是车辆的后视摄像头。

在一实施例中，所述图像采集装置设置于所述车辆的左侧后视镜或者左侧前车轮的翼子板上部，所述显示装置的至少部分显示区域位于所述仪表台中对应主驾驶位的区域，不仅方便用户在主驾驶位的车窗外、在直立状态下自然地展示手势图像并查看手势识别情况，还可以减少对车辆外观的影响。在另一实施例中，所述图像采集装置设置于所述车辆的右侧后视镜或者右侧前车轮的翼子板上部，所述显示装置的至少部分显示区域位于所述仪表台中对应副驾驶位的区域，不仅方便用户在副驾驶位的车窗外、在直立状态下自然地展示手势并查看手势识别情况，还可以减少对车辆外观的影响。

可选的，所述在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，包括：

在所述目标手势序列与所述预设手势序列匹配的情况下，分别将所述N个手势图像中的每个手势图像与N个预设手势图像中对应的预设手势图像进行比对；

在所述N个手势图像中的至少一个手势图像与所述N个预设手势图像中对应的预设手势图像匹配的情况下，控制所述车辆执行目标操作。

本实施例中，上述预设手势图像可以是预先采集的用户的手势图像，示例性的，可以在用户设置预设手势序列的过程中，分别采集用户的对应于预设手势序列中各个预设手势的手势图像并进行存储。

实际情况中，同一用户对于同一手势，往往摆出的手部姿势较为接近，而不同的用户对于同一手势，往往摆出的手势姿势会具有一定的差异性。因此，通过将采集的手势图像与预设手势图像进行对比，可以进一步提高基于手势识别解锁车辆的安全性。

在一些可选的实施例中，上述N个手势图像中的至少一个手势图像与所述N个预设手势图像中对应的预设手势图像匹配，可以包括上述N个手势图像中的任一个手势图像与所述N个预设手势图像中对应的预设手势图像匹配，这样可以减少因手势图像匹配失败导致的解锁失败的情况发生。其中，上述手势图像与对应的预设手势图像匹配，可以包括上述手势图像与对应的预设手势图像的相似度大于第三预设值，其中，上述第三预设值可以根据实际需求进行合理设置，例如，50％或60％等。

本实施例通过在所述目标手势序列与所述预设手势序列匹配的情况下，分别将所述N个手势图像中的每个手势图像与N个预设手势图像中对应的预设手势图像进行比对；在所述N个手势图像中的至少一个手势图像与所述N个预设手势图像中对应的预设手势图像匹配的情况下，控制所述车辆执行目标操作，这样可以进一步提高基于手势识别控制车辆的安全性。

可选地，所述在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，包括：

在所述目标手势序列与所述预设手势序列匹配的情况下，分别提取所述N个手势图像中的每个手势图像的手部特征信息；

在所述N个手势图像中的至少一个手势图像的手部特征信息与预设手部特征信息匹配的情况下，控制所述车辆执行目标操作。

本实施例中，上述预设手部特征信息可以是基于预先采集的用户的多张手势图像提取手部特征信息，例如，可以包括手部肤色特征信息、手部纹理特征信息等。

在一些可选的实施例中，上述N个手势图像中的至少一个手势图像的手部特征信息与预设手部特征信息匹配，可以包括上述N个手势图像中的任一个手势图像的手部特征信息与预设手部特征信息匹配，这样可以减少因手部特征信息匹配失败导致的解锁失败的情况发生。其中，上述手部特征信息与预设手部特征信息匹配，可以包括上述手部特征信息与预设手部特征信息的相似度大于第四预设值，其中，上述第四预设值可以根据实际情况进行合理设置，例如，50％或60％等。

本实施例通过在所述目标手势序列与所述预设手势序列匹配的情况下，分别提取所述N个手势图像中的每个手势图像的手部特征信息；在所述N个手势图像中的至少一个手势图像的手部特征信息与预设手部特征信息匹配的情况下，控制所述车辆执行目标操作，这样可以进一步提高基于手势识别控制车辆的安全性。

可选地，所述接收第一语音信息之前，所述方法还包括：

接收用户选择的所述预设手势序列；

采集与所述预设手势序列中的第i个预设手势对应的目标手势图像，i为正整数且i的取值范围为[1，N]；

对所述目标手势图像进行手势识别，得到所述目标手势图像对应的手势；

在所述目标手势图像对应的手势和所述第i个预设手势匹配的情况下，将所述目标手势图像确定为预设手势图像，或，将从所述目标手势图像提取的手部特征信息确定为预设手部特征信息。

本实施例中，在接收用户选择的所述预设手势序列之后，可以分别采集与上述预设手势序列中的各个预设手势对应的手势图像，在每个手势图像识别到的手势与对应的预设手势匹配的情况下，可以将该手势图像确定为对应预设手势对应的预设手势图像，或者，可以从该手势图像提取手部特征信息并作为预设手部特征信息。

以下结合图3对本实施例进行举例说明，如图3所示，包括如下步骤：

步骤301、通过车内显示屏接收用户启用手势密码控制车辆功能的第一输入。

该步骤中，上述车内显示屏可以是上述显示装置。上述手势密码控制车辆功能可以包括基于手势密码解锁车辆、启动车辆、打开车辆的空调、打开车辆的车窗以及打开车辆的音响设备等中的一项或多项。

示例性的，可以在上述车内显示屏中显示用户启动手势密码控制车辆功能的控件，上述第一输入可以是针对该控件的点击输入、按压输入或滑动输入等。

步骤302、校验用户身份。

该步骤中，可以响应于上述第一输入，校验用户身份，例如，可以通过采集用户的人脸图像，对用户进行人脸识别，并在人脸识别通过的情况下确定用户身份校验通过，否则确定用户身份校验不通过。

步骤303、在用户身份校验通过的情况下，通过车内显示屏和语音向用户介绍上述功能启用流程。

该步骤中，可以通过车内显示屏显示启用上述手势密码控制车辆功能的流程的示意图，并通过语音向用户播报上述手势密码控制车辆功能的流程。

示例性的，上述启用上述手势密码解锁车辆功能的流程可以包括但不限于：关联语音识别，设置手势密码，手势动作训练等。

在一些可选的实施例中，可以在介绍完上述功能启用流程之后，显示是否启用关联语音识别的设置界面。

步骤304、接收用户是否启用关联语音识别的第二输入。

示例性的，上述第二输入可以是针对车内显示屏显示的第一选项或第二选项的选择输入，其中，上述第一选项对应于启用关联语音识别的控件，上述第二选项对应于不启用关联语音识别。

步骤305、在确定关联语音识别的情况下，引导用户说出一段文字，获取声纹特征。

该步骤中，在根据第二输入确定关联语音识别的情况下，可以提示用户说出一段文字，例如，可以提示用户说出“启动手势识别”，并可以录制用户说的语音信息，提取该语音信息中的声纹特征。

步骤306、引导用户设置手势密码。

示例性的，可以在车内显示屏显示手势密码设置界面，该手势密码设置界面可以包括可供选项的多个手势，例如，食指向上、双指向上、三指向上、五指向上、Ok手势、拇指向上、握拳等手势。

步骤307、接收用户设置的手势密码。

该步骤中，可以根据用户选择的多个手势和多个手势选择的先后顺序，确定手势密码，也即上述的预设手势序列。

步骤308、提醒用户到车外进行手势训练。

示例性的，可以通过车内显示屏输出提示信息，以提示用户到车外进行手势训练；或者可以通过语音提示用户到车外进行手势训练。

步骤309、启用手势识别功能。

在手势识别功能启动后，可以对采集的手势图像进行手势识别。

步骤310、采集用户的第k个手势图像。

该步骤中，可以通过上述图像采集装置采集用户的第k手势图像。其中，k的初始值为1。

步骤311、在手势识别成功且与对应预设手势匹配的情况下，提取并记录用户手部特性信息或记录手势图像。

该步骤中，在上述第k个手势图像手势识别成功且与对应预设手势匹配的情况下，可以从该手势图像中提取用户的手部特征信息，并记录该手部特征信息，或者可以记录该手势图像，并将该手势图像作为预设手势图像。

步骤312、判断是否已完成设置手势密码的全部手势的采集。

该步骤中，在已完成设置手势密码的全部手势的采集的情况下，可以执行步骤314，否则可以执行步骤313。

步骤313、k的值加1。

步骤314、告知用户功能已启用。

示例性的，可以通过车内显示屏输出提示信息，以提示用户上述手势密码解锁车辆功能已启用；或者可以通过语音提示用户上述手势密码解锁车辆功能已启用。

本实施例通过接收用户选择的所述预设手势序列；采集与所述预设手势序列中的第i个预设手势对应的目标手势图像；对所述目标手势图像进行手势识别，得到所述目标手势图像对应的手势；在所述目标手势图像对应的手势和所述第i个预设手势匹配的情况下，将所述目标手势图像确定为预设手势图像，或，将从所述目标手势图像提取的手部特征信息确定为预设手部特征信息，这样不仅可以较为方便的确定预设手势图像或预设手部特征信息，还便于用户熟悉各个预设手势对应的手部动作，有利于用户后续准确、快速的摆出对应的手部动作。

可选地，所述在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像之前，所述方法还包括：

对所述第一语音信息进行语音识别，得到所述第一语音信息对应的文本信息；

若所述第一语音信息对应的文字与预设文字匹配的情况下，唤醒所述车辆的第一设备，其中，所述第一设备包括与手势识别相关的设备；

或者

在接收到对唤醒开关的目标输入的情况下，唤醒所述车辆的第一设备，其中，所述第一设备包括与手势识别相关的设备，所述唤醒开关设置于所述车辆的外部。

在一实施方式中，可通过语音唤醒车辆与手势识别相关的设备。示例性的，可以预先设置唤醒词(即上述预设文字)，例如，上述唤醒词可以为启动手势识别；在第一语音信息对应的文字与上述唤醒词匹配的情况下，可以唤醒上述显示屏、座舱域控制器(CockpitDomain Controller，CDC)等，其中，上述CDC可以用于驱动上述图像采集装置采集手势图像、识别手势图像对应的手势、手势匹配等，以及对麦克风采集的语音信息进行语音识别、声纹特征提取、声纹特征匹配等。需要说明的是，在该实施方式中，语音采集设备需要保持处于工作状态。

在另一实施方式中，可通过车辆上设置的唤醒开关唤醒车辆与手势识别相关的设备。上述唤醒开关可以设置于车辆的A柱或B柱等位置。上述目标输入可以是针对唤醒开关的按压输入。示例性的，可以在接收到用户对上述唤醒开关的按压输入的情况下，唤醒上述显示屏、上述语音采集设备、CDC等。

本实施例可以支持通过语音或唤醒开关唤醒车辆与手势识别相关的设备，相比于与手势识别相关的设备一直保持工作状态，这样可以在保证上述手势密码解锁车辆功能可以正常使用的同时，节省电量。

可选地，所述方法还包括如下至少一项：

接收第二设备发送的第一配置信息，其中，所述第一配置信息包括所述预设手势序列和所述预设声纹特征，所述第二设备包括云端服务器或移动终端；

在基于手势密码控制车辆功能控制所述车辆失败的次数超过预设次数的情况下，禁止通过所述手势密码控制车辆功能控制所述车辆，并向第二设备发送告警信息，其中，所述第二设备包括云端服务器和移动终端中的至少一项。

在一些实施例中，可以通过移动终端配置预设手势序列和预设声纹特征，方便用户操作。示例性的，用户可以基于移动终端上显示的手势密码控制车辆功能的相关配置界面进行上述预设手势序列和所述预设声纹特征的配置。上述手势密码控制车辆功能，可以包括基于手势密码解锁车辆、启动车辆、打开车辆的空调、打开车辆的车窗以及打开车辆的音响设备等中的一项或多项。

以下结合举例进行说明：

移动终端可以在接收到手势密码设置的启动指令的情况下，引导用户说出一段唤醒词，例如，“启动手势识别”，并进行录制得到目标语音信息，将目标语音信息发送给云端服务器。云端服务器对上述目标语音信息进行降噪、特征提取、语义识别等处理，若识别出的文字与“启动手势识别”一致，则提取上述目标语音信息中的声纹特征，并将提取的声纹特征确定为预设声纹特征。

需要说明的是，移动终端在录制得到上述目标语音信息之后，也可以直接对上述目标语音信息进行降噪、特征提取、语义识别等处理，若识别出的文字与“启动手势识别”一致，则提取上述目标语音信息中的声纹特征，并将提取的声纹特征确定为预设声纹特征，并将预设声纹特征发生给云端服务器，以通过云端服务器发送给车辆。

进一步的，移动终端还可以显示手势密码设置界面，该手势密码设置界面可以包括可供选项的多个手势，接收用户选择的预设手势序列，并引导用户在摄像头前依次摆出各个预设手势对应的手势，并通过摄像头采集各个预设手势对应的手势图像。需要说明的是，移动终端可以实时显示摄像头采集的手势图像，并可以每识别成功或匹配成功一个手势，显示识别成功或者匹配成功的手势，直至完成所有手势的匹配。在完成所有手势匹配的情况下，移动终端可以向云端服务器发送上述预设手势序列，以通过云端服务器发送给车辆。

在一些可选的实施例中，移动终端可以直接向车辆发生上述预设声纹特征和预设手势序列。

在一些实施例中，在基于手势密码控制车辆功能控制所述车辆失败的次数超过预设次数的情况下，可以禁止通过所述手势密码控制车辆功能控制所述车辆，并向第二设备发送告警信息，这样可以提高基于手势密码控制车辆功能解锁所述车辆的安全性。其中，上述预设次数可以根据实际需求进行合理设置，例如，2次或3次等。

在一些可选的实施例中，在所述控制所述车辆执行目标操作之后，所述方法还可以包括：将所述预设手势序列进行P次循环移位，得到更新后的所述预设手势序列。其中，P为正整数，上述循环移位可以包括循环左移位或循环右移位。

以预设手势序列包括4个预设手势、P的取值为1、上述循环移位为循环右移位为例进行说明：上述预设手势序列如下：预设手势a1、预设手势a2、预设手势a3、预设手势a4；将上述预设手势序列进行1次循环右移位后为：预设手势a4、预设手势a1、预设手势a2、预设手势a3。需要说明的是，在得到更新后的预设手势序列之后，需要基于更新后的预设手势序列中各个预设手势的先后顺序进行手势对比，示例性的，若预设手势序列为：预设手势a4、预设手势a1、预设手势a2、预设手势a3，则需要将采集的第一个手势图像对应的手势与预设手势a4进行对比，将采集的第二个手势图像对应的手势与预设手势a1进行对比，将采集的第三个手势图像对应的手势与预设手势a2进行对比，将采集的第四个手势图像对应的手势与预设手势a3进行对比。

本实施例通过将所述预设手势序列进行P次循环移位，得到更新后的预设手势序列，通过这种自动更新预设手势序列的方式，可以减少因其他人员偷录用户手势密码控制所述车辆的视频进行车辆控制的安全问题，进一步提高基于手势识别控制车辆的安全性。

可选地，所述在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集N个手势图像，包括：

在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置采集第j个手势图像，其中，j为正整数且j的取值范围为[1，N]；

在所述第j个手势图像的亮度值低于预设亮度值的情况下，控制所述图像采集装置的补光灯进行补光，并通过所述图像采集装置重新采集第j个手势图像。

本实施例中可以在每采集一张手势图像的情况下，计算所采集的手势图像的亮度值，在采集的手势图像的亮度值低于预设亮度值的情况下，控制所述图像采集装置的补光灯进行补光，并通过重新采集手势图像，这样可以减少在夜晚或光线较暗等场景因采集图像质量较差导致的手势识别失败或匹配失败的情况发生。

以下结合图4和图5对本申请实施例进行举例说明：

如图4所示，车辆1上分别设置有图像采集装置10、显示装置20、多媒体域控制器(CDC)31、车身域控制器(BGM)32、语音采集设备40、扬声装置50、补光灯60和唤醒开关70，其中，图像采集装置10、显示装置20、语音采集设备40和扬声装置50均与多媒体域控制器31连接，补光灯60和唤醒开关70均与车身域控制器32，车身域控制器32与多媒体域控制器31连接。需要说明的是，上述BGM32和CDC31之间可以采用以太网和CAN总线的方式通信。

其中，上述图像采集装置10可以设置于车辆的左后视镜底部，可以用于采集用户的手势图像。上述显示装置20可以设置于车辆的仪表台的左侧区域，可以用于实时显示图像采集装置10采集的手势图像，以辅助用户调整手势和姿态，并可显示手势密码识别进度。上述CDC31可以用于驱动上述图像采集装置10采集手势图像、识别手势图像对应的手势、手势匹配等，以及对麦克风采集的语音信息进行语音识别、声纹特征提取、声纹特征匹配等。上述扬声装置50可以包括设置于车辆的大灯下侧的第一扬声器和设置于车辆的翼子板下侧的第二扬声器，可以用于手势识别过程进行语音指导和结果告知等。语音采集设备40可以包括设置于左侧后视镜底部的第一麦克风和设置于右侧后视镜底部的第二麦克风，用于用户声音采集及上述手势密码解锁车辆功能唤醒等。补光灯60可以用于光线暗时补充光源，提高图像质量。唤醒开关70可以设置于车辆的B柱，可以用于上述手势密码解锁车辆功能唤醒。上述BGM32可以用于控制补光灯60进行补光以及车辆解锁等控制执行。需要说明的是，上述BGM和CDC之间可以采用以太网和CAN总线的方式通信。

如图5所示，本实施例提供的车辆控制方法包括如下步骤：

步骤501、采集用户的语音信息，并基于用户的语音信息唤醒车辆。

该步骤，可以在目标用户位于车舱外部的情况下，通过语音采集设备40采集目标用户的语音信息，并可以通过CDC31将语音信息对应的文字与预设文字进行对比，在在语音信息对应的文字与预设文字匹配的情况，唤醒车辆。

需要说明的是，本实施例的用户即为上述目标用户。

步骤502、判断是否设置关联语音识别。

该步骤中，可以通过上述CDC31判断是否设置关联语音识别。具体的，若设置了关联语音识别，则执行步骤503，否则可以直接执行步骤507，或者结束流程。

步骤503、从用户的语音信息中提取声纹特征。

该步骤中，可以通过上述CDC31从用户的语音信息中提取声纹特征。

步骤504、判断提取的声纹特征与预设声纹特征的相识度是否大于第一预设值。

该步骤中，可以通过上述CDC31判断提取的声纹特征与预设声纹特征的相识度是否大于第一预设值。

上述第一预设值可以根据需求进行合理设置，示例性的，上述第一预设值可以是50％。

步骤505、提示用户需要重新采集语音。

该步骤中，可以通过上述扬声装置50输出语音，以提示用户需要重新采集语音。

步骤506、重新采集用户的语音信息。

该步骤中，可以通过上述语音采集设备40重新采集用户的语音信息。

步骤507、提示用户摆出第y个手势。

上述y的初始值可以为1。

该步骤中，可以通过上述扬声装置50输出语音，以提示用户摆出第y个手势。

步骤508、采集用户的第y个手势图像。

该步骤中，可以通过上述图像采集装置10采集用户的手势图像。

步骤509、判断是否手势识别成功且匹配成功。

该步骤中，可以通过上述CDC31判断是否手势识别成功且匹配成功。若是，则执行步骤510，否则返回执行步骤507。

步骤510、判断是否完成所有手势密码识别。

该步骤中，可以通过上述CDC31判断是否完成所有手势密码识别，若是，则执行步骤512，否则可以执行步骤511。

步骤511、y的取值加1。

步骤512、提示用户手势识别完成，并驱动BGM解锁车辆。

该步骤中，可以通过上述扬声装置50输出语音，以提示用户需要重新采集语音，并可以通过上述CDC31生成第一控制信号并发送给BGM31，以通过BGM31控制解锁车辆。

如图6所示，本申请实施例提供一种车辆控制装置600，包括：

第一接收模块601，用于接收目标用户的第一语音信息；其中，所述目标用户位于车辆车舱的外部；

第一采集模块602，用于在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像，N为大于1的整数；

手势识别模块603，用于分别对所述N个手势图像中的每个手势图像进行手势识别，得到所述N个手势图像中的每个手势图像对应的手势；

第一执行模块604，用于在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，其中，所述目标手势序列为所述N个手势图像对应的手势按照所述N个手势图像采集的先后顺序排列得到的手势序列。

可选地，所述装置还包括如下至少一项：

第一显示模块，用于在所述车辆的显示装置的显示区域实时显示第一信息，其中，所述第一信息包括所述图像采集装置采集的手势图像和与所述手势图像相关的信息中的至少一项。

可选地，所述图像采集装置设置于所述车辆的左侧后视镜，所述显示装置设置于所述车辆的仪表台，且所述显示装置的至少部分区域位于所述仪表台中对应主驾驶位的区域；

或者

所述图像采集装置设置于所述车辆的右侧后视镜，所述显示装置设置于所述车辆的仪表台，且所述显示装置的至少部分区域位于所述仪表台中对应副驾驶位的区域。

可选地，所述第一执行模块具体用于：

可选地，所述装置还包括：

第二接收模块，用于所述接收第一语音信息之前，接收用户选择的所述预设手势序列；

第二采集模块，用于采集与所述预设手势序列中的第i个预设手势对应的目标手势图像；

第一识别模块，用于对所述目标手势图像进行手势识别，得到所述目标手势图像对应的手势，i为正整数且i的取值范围为[1,N]；

确定模块，用于在所述目标手势图像对应的手势和所述第i个预设手势匹配的情况下，将所述目标手势图像确定为预设手势图像，或，将从所述目标手势图像提取的手部特征信息确定为预设手部特征信息。

可选地，所述装置还包括：

第二识别模块，用于所述在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像之前，对所述第一语音信息进行语音识别，得到所述第一语音信息对应的文本信息；

第一唤醒模块，用于若所述第一语音信息对应的文字与预设文字匹配的情况下，唤醒所述车辆的第一设备，其中，所述第一设备包括与手势识别相关的设备；

或者

第二唤醒模块，用于在接收到对唤醒开关的目标输入的情况下，唤醒所述车辆的第一设备，其中，所述第一设备包括与手势识别相关的设备，所述唤醒开关设置于所述车辆车舱的外部。

可选地，所述装置还包括如下至少一项：

第三接收模块，用于接收第二设备发送的第一配置信息，其中，所述第一配置信息包括所述预设手势序列和所述预设声纹特征，所述第二设备包括云端服务器或移动终端；

禁止模块，用于在基于手势密码控制车辆功能控制所述车辆失败的次数超过预设次数的情况下，禁止通过所述手势密码控制车辆功能控制所述车辆，并向第二设备发送告警信息，其中，所述第二设备包括云端服务器和移动终端中的至少一项。

可选地，所述装置还包括：

移动模块，用于所述控制所述车辆执行目标操作之后，将所述预设手势序列进行P次循环移位，得到更新后的所述预设手势序列，P为正整数。

可选地，所述第一采集模块具体用于：

本申请提供的车辆控制装置能够实现车辆控制方法实施例实现的各个过程，且能够达到相同的有益效果，为避免重复，这里不再赘述。

如图7所示，本申请实施例还提供一种车辆，该车辆包括车舱，所述车舱包括侧门板和侧门玻璃，该车辆1还包括：

图像采集装置10，用于采集目标用户的手部图像；其中，所述目标用户位于所述车舱的外部；

显示装置20，所述显示装置20与所述图像采集装置10通信连接，所述显示装置20的显示区域用于显示第二信息，其中，当通过所述图像采集装置10采集所述目标用户的手部图像时，所述显示区域位于所述目标用户的视线经过所述侧门玻璃的可视区域，所述第二信息包括所述图像采集装置10采集的手部图像和与所述手部图像相关的信息中的至少一项；

控制器30，所述控制器30分别与所述图像采集装置10和所述显示装置20通信连接，用于对所述手部图像进行处理，并根据处理结果确定是否对所述车辆执行目标操作。

本实施中，上述车舱可供驾驶员、乘客等人员乘坐。上述目标用户可以是任意位于车舱外的人。上述侧门玻璃可以包括车辆的前侧车门的车窗玻璃或后侧车门的车窗玻璃等。

上述图像采集装置10可以包括一个或多个摄像头。示例性的，上述图像采集装置10可以设置于车辆车舱的外部，例如，可以设置于车辆的A柱、B柱、车辆的后视镜、车辆的车轮翼子板上等位置。上述手部图像可以包括手臂区域的图像和/或手掌区域的图像等。

上述显示装置20可以包括显示屏或者投影设备等。需要说明的是，当所述显示装置是投影设备时，所述显示装置的显示区域指的是所述投影设备的投影区域。其中，上述显示装置20和图像采集装置10之间满足如下位置关系：当通过图像采集装置10采集所述目标用户的手部图像时，上述显示区域位于所述目标用户的视线经过所述侧门玻璃的可视区域，这样方便用户在车外、处于直立状态时自然地查看显示内容的位置。在一些可选的实施例中，上述显示装置20可以设置于车辆车舱的内部，例如，上述显示装置20可以设置于车辆的仪表台，且上述显示装置20朝向主驾区域或者朝向副驾区域，方便用户查看。在一些可选的实施例中，上述显示装置20是显示屏，其可以设置于车辆的仪表台上，并从主驾区域延伸到副驾区域。在一些可选的实施例中，所述显示屏的横向宽度占据车舱的横向宽度的70％以上。

对于上述与所述手部图像相关的信息，示例性的，可以包括基于手部图像识别到的手势或者手臂姿态或者手部特征信息等。

对于上述控制器30对所述手部图像进行处理，示例性的，上述控制器30对所述手部图像进行处理可以包括但不限于如下至少一项：对手部图像进行手势识别并将识别到的手势与预设手势进行对比，从上述手部图像提取手部特征信息并将提取的手部特征信息与预设手部特征信息进行对比，将上述手部图像与预设手部图像进行对比。相应的，控制器30可以在确定满足如下至少一项的情况下，确定对所述车辆执行目标操作：识别到的手势与预设手势相匹配，提取的手部特征信息与预设手部特征信息相匹配，上述手部图像与预设手部图像相匹配。

需要说明的是，上述图像采集装置10和显示装置20通信连接，可以包括上述图像采集装置10和显示装置20直接通信连接，例如，上述图像采集装置10和显示装置20之间直接连接，也可以包括上述图像采集装置10和显示装置20间接通信连接，例如，上述图像采集装置10和显示装置20分别与控制器30连接，通过控制器30实现上述图像采集装置10和显示装置20之间的通信。

以下结合图2，以上述手部图像为手势图像为例进行说明：

在目标用户需要在车外控制车辆的情况下，可以通过图像采集装置10采集目标用户的手势图像，并将图像采集装置10采集的手势图像实时显示在显示装置20的第一显示区域21，控制器30可以对图像采集装置10采集的手势图像进行手势识别和手势匹配，并可以每识别成功或匹配成功一个手势，在显示装置20的第二显示区域22显示识别成功或匹配成功的手势，直至完成所有手势的匹配，在该情况下，控制器30控制车辆执行目标操作，例如，控制车辆解锁。由于在显示装置20的第二显示区域22实时显示采集的手势图像以及识别成功或匹配成功的手势，这样目标用户可以基于显示装置20显示的内容不仅可以较为方便的调整拍摄的姿势或角度等，还有利于目标用户获知手势匹配的进度。

根据本申请实施例提供的车辆，在目标用户位于车舱外的情况下，图像采集装置可以采集目标用户的手部图像，控制器可以对图像采集装置采集的手部图像进行处理，并根据处理结果确定是否对所述车辆执行目标操作，这样使得位于车舱外的用户无需额外携带实体设备即可对车辆进行控制，可以提高车辆控制的便捷性；此外，当通过图像采集装置采集目标用户的手部图像时，目标用户可以实时查看显示装置所显示的手部图像和与手部图像相关的信息中的至少一项，便于目标用户进行拍摄姿势、拍照角度等调整，有利于提高用户在车外控制车辆的成功率。

在一些可选的实施例中，所述图像采集装置10设置于所述车舱的外部，所述显示装置20设置于所述车舱的内部。

本实施例中，上述图像采集装置设置于车舱的外部，相比于设置于车舱内部，有利于采集到较为清晰的图像。上述显示装置设置于车舱的内部，可以减少显示装置对车辆外观的影响。在一些可选的实施例中，上述显示装置可以复用车内的车机显示屏，这样可以减少成本。

在一些可选的实施例中，所述图像采集装置10和所述显示装置20的显示区域之间的相对位置使得所述图像采集装置采集所述手部图像时，所述显示区域位于所述目标用户处于直立状态时的可视区域内。这样目标用户在直立状态下不仅可以自然地查看显示装置20所显示的手部图像和与手部图像相关的信息中的至少一项，便于目标用户进行姿势、角度等调整，还可以在站立状态下自然的展示手部姿势。

在一些可选的实施例中，所述图像采集装置10设置于所述车辆的左侧后视镜或者所述车辆的左侧前车轮的翼子板上，所述显示装置20设置于所述车辆的仪表台，且所述显示装置20的至少部分显示区域位于所述仪表台中对应主驾驶位的区域；

或者

所述图像采集装置10设置于所述车辆的右侧后视镜或者所述车辆的右侧前车轮的翼子板上，所述显示装置20设置于所述车辆的仪表台，且所述显示装置的至少部分显示区域位于所述仪表台中对应副驾驶位的区域。

示例性的，上述图像采集装置10可以设置于左侧后视镜的底部，或者可以设置于左侧前车轮的翼子板的外侧面，上述显示装置20可以设置于仪表台中对应主驾驶位的区域，这样目标用户站在主驾驶位的车窗外、处于直立状态时可以自然地、较为方便的展示手势图像并查看手势识别情况；或者上述图像采集装置10可以设置于右侧后视镜的底部，或者可以设置于右侧前车轮的翼子板的外侧面，上述显示装置20可以设置于仪表台中对应副驾驶位的区域，这样目标用户站在副驾驶位的车窗外、处于直立状态时可以自然地、较为方便的展示手势图像并查看手势识别情况。

在一些可选的实施例中，所述图像采集装置10和所述显示装置20可以复用所述车辆中已有的部件，从而可以降低用户使用本实施例的方法的学习障碍和成本，例如，上述图像采集装置可以是车辆的车机显示屏，上述图像采集装置可以是车辆的后视摄像头。

在一实施例中，图像采集装置10设置于所述车辆的左侧后视镜或者左侧前车轮的翼子板上部，显示装置20设置于所述车辆的仪表台，且所述显示装置的至少部分区域位于所述仪表台中对应主驾驶位的区域，不仅方便目标用户在主驾驶位的车窗外、直立状态时自然地展示手势图像并查看手势识别情况，还可以减少对车辆外观的影响。在另一实施例中，图像采集装置10设置于所述车辆的右侧后视镜或者右侧前车轮的翼子板上部，显示装置20设置于所述车辆的仪表台，且所述显示装置的至少部分区域位于所述仪表台中对应副驾驶位的区域，不仅方便用户在副驾驶位的车窗外、直立状态时自然地展示手势图像并查看手势识别情况，还可以减少对车辆外观的影响。

在一些可选的实施例中，所述车辆还包括语音采集设备，所述语音采集设备40与所述控制器30通信连接，用于采集所述目标用户的第一语音信息；

其中，所述控制器30还用于提取所述第一语音信息的声纹特征，并将所述第一语音信息的声纹特征与预设声纹特征进行对比，在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下控制所述图像采集装置10采集所述目标用户的手部图像。

本实施例中，上述语音采集设备可以包括一个或多个麦克风。示例性的，上述语音采集设备可以设置于车辆的B柱、车辆的后视镜等位置。

在一些可选的实施例中，控制器30在接收到第一语音信息的情况下，可以对第一语音信息进行预处理，例如，降噪处理、唤醒检测等。其中，上述唤醒检测用于检测第一语音信息是否包括预设的唤醒词；并对预处理后的第一语音信息进行声纹特征提取。示例性的，上述第一语音信息的声纹特征与预设声纹特征匹配，可以包括上述第一语音信息的声纹特征与预设声纹特征的相识度大于第一预设值，其中，上述第一预设值可以根据需求进行合理设置，例如，60％、75％或80％等。

在一些可选的实施例中，控制器30可以在第一语音信息的声纹特征与预设声纹特征匹配的情况下唤醒图像采集装置10和显示装置20，这样图像采集装置10可以采集所述目标用户的手部图像，显示装置20可以显示手部图像和与目标图像相关的信息中的至少一项，这样不仅可以提高目标用户车外控制车辆的安全性，还可以减少耗电。

在一些可选的实施例中，所述语音采集设备包括第一麦克风和第二麦克风，其中，所述第一麦克风设置于所述车辆的左侧后视镜，所述第二麦克风设置于所述车辆的右侧后视镜。

示例性的，上述第一麦克风可以设置在左侧后视镜的底部，上述第二麦克风可以设置于右侧后视镜的底部，这样不仅方便目标用户在车外通过第一麦克风或第二麦克风采集语音信息，还可以减少第一麦克风和第二麦克风的设置对车辆外观的影响。

在一些可选的实施例中，所述车辆还包括扬声装置，所述扬声装置与所述控制器通信连接。

上述扬声装置可以包括一个或多个扬声器，此外，上述扬声装置可以设置于车舱内部，也可以设置于车舱外部，本实施例对此不做限定。

实际应用中，上述扬声装置可以用于对目标用户在车外控制车辆过程中进行语音指导、结果告知等，例如，在语音采集设备采集的语音信息的语音特征与预设语音特征不匹配的情况下，通过上述扬声装置语音提示用户需要重新采集语音，在采集的手部图像对应的手势与预设手势不匹配的情况下，通过上述扬声装置语音提示用户需要重新采集手部图像等，在采集的手部图像对应的手势与预设手势匹配的情况下，通过上述扬声装置语音提示用户手势识别成功。

本实施例可以通过上述扬声装置对目标用户在车外控制车辆过程中进行语音指导、结果告知等，方便用户快速执行对应动作，有利于提高车外控制车辆的效率。

在一些可选的实施例中，所述扬声装置包括第一扬声器和第二扬声器，所述第一扬声器设置于所述车辆的大灯底部，所述第二扬声器设置于所述车辆的翼子板。

示例性的，上述第一扬声器可以设置于所述车辆的左侧大灯底部或者右侧大灯底部。示例性的，上述第二扬声器可以设置于车辆的左前翼子板、左后翼子板、右前翼子板或右后翼子板等。

在一些可选的实施例中，上述第一扬声器和第二扬声器可以对应于上述图像采集装置设置的位置进行设置，例如，若上述图像采集装置设置于车辆的左侧区域，例如，左侧后视镜，则上述第一扬声器可以设置于左侧大灯底部，上述第二扬声器可以设置于左后翼子板；若上述图像采集装置设置于车辆的右侧区域，例如，右侧后视镜，则上述第一扬声器可以设置于右侧大灯底部，上述第二扬声器可以设置于右后翼子板，这样便于目标用户可以较为清晰的听到第一扬声器和第二扬声器播放的语音内容。

在一些可选的实施例中，所述车辆还包括唤醒开关，所述唤醒开关与所述控制器通信连接，在所述唤醒开关被触发的情况下唤醒所述图像采集装置和所述显示装置；其中，所述唤醒开关设置于所述车辆的A柱或B柱。

本实施例中，上述唤醒开关被触发可以理解为接收到针对唤醒开关的按压输。实际应用中，目标用户在需要车外控制车辆的情况下，可以按压上述唤醒开关，以唤醒图像采集装置和显示装置，进而可以通过图像采集装置采集目标用户的手部图像，并通过显示装置显示手部图像和与手部图像相关的信息等中的至少一项。

本实施例可以支持通过唤醒开关唤醒所述图像采集装置和所述显示装置，相比于图像采集装置和显示装置一直保持工作状态，这样可以在保证用户车外控制车辆的功能可以正常使用的同时，节省电量。

在一些可选的实施例中，所述图像采集装置集成有补光灯，所述补光灯与所述控制器通信连接；

其中，所述控制器还用于在所述图像采集装置采集的手部图像的亮度值低于预设亮度值的情况下，控制所述补光灯进行补光。

本实施例中可以在每采集一张目标用户的手部图像的情况下，计算所采集的手部图像的亮度值，在采集的手部图像的亮度值低于预设亮度值的情况下，控制所述图像采集装置的补光灯进行补光，并通过重新采集手部图像，这样可以减少在夜晚或光线较暗等场景因采集图像质量较差导致的图像识别失败或匹配失败的情况发生。

在一些可选的实施例中，所述控制器包括：

多媒体域控制器，所述多媒体域控制器分别与所述图像采集装置和所述显示装置通信连接，用于对所述手部图像进行处理，并在根据处理结果确定对所述车辆执行目标操作的情况下生成第一控制信号，其中，所述目标操作为针对所述车辆车身的操作；

车身域控制器，所述车身域控制器与所述多媒体域控制器通信连接，用于根据所述第一控制信号对所述车辆执行所述目标操作。

本实施例中，上述多媒体域控制器也可以称为CDC。示例性的，上述多媒体域控制器可以用于对语音采集设备采集的语音信息进行语音识别、声纹特征提取、声纹特征匹配等，以及驱动上述图像采集装置采集手势图像、识别手势图像对应的手势、手势匹配等，并可以根据手势匹配结果生成对应的控制信号并发送给车身域控制器。上述车身域控制器可以根据上述多媒体域控制器发送的控制信号控制车辆，例如，解锁车辆、打开车窗、打开车灯等。

本实施例通过多媒体域控制器对采集的手部图像进行处理并生成对应的控制信号，通过车身域控制器控制车辆执行控制信号对应的操作，由于划分不同域控制器对车辆进行控制，这样可以提高车辆控制的安全性。

以下结合图8至图9进行对本申请实施例进行说明：

如图8所示，车辆1上分别设置有图像采集装置10、显示装置20、多媒体域控制器(CDC)31、车身域控制器(BGM)32、语音采集设备40、扬声装置50、补光灯60和唤醒开关70，其中，图像采集装置10、显示装置20、语音采集设备40和扬声装置50均与多媒体域控制器31连接，补光灯60和唤醒开关70均与车身域控制器32，车身域控制器32与多媒体域控制器31连接。需要说明的是，上述BGM32和CDC31之间可以采用以太网和CAN总线的方式通信。

示例性的，如图9所示，目标用户2站在车辆1左前侧车门处，在目标用户需要在车外控制车辆的情况下，可以通过语音采集设备40采集目标用户的第一语音信息，通过CDC31提取采集的第一语音信息的声纹特征并与预设声纹特征进行匹配，在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置10采集所述目标用户的手部图像，通过显示装置20显示采集的手部图像，通过CDC31对上述手部图像进行处理，在确定第一信息满足预设条件的情况下生成第一控制信号并发送给BGM32，BGM32根据第一控制信号控制所述车辆执行目标操作，其中，所述第一信息包括所述手部图像和与所述手部图像相关的信息中的至少一项。

在一些可选的实施例中，所述手部图像包括手势图像，所述第一信息包括所述手势图像识别到的手势，相应的，图像采集装置10用于依次采集所述目标用户的N个手势图像，N为大于1的整数；CDC31用于在确定目标手势序列与预设手势序列匹配的情况下，生成第一控制信号，其中，所述目标手势序列为所述N个手势图像对应的手势按照所述N个手势图像采集的先后顺序排列得到的手势序列。上述N的取值根据预设手势序列包括的预设手势的数量确定，具体的，上述N的取值为预设手势序列包括的预设手势的数量。

在一些可选的实施例中，上述CDC31具体可以用于：在所述目标手势序列与所述预设手势序列匹配的情况下，分别将所述N个手势图像中的每个手势图像与N个预设手势图像中对应的预设手势图像进行比对；在所述N个手势图像中的至少一个手势图像与所述N个预设手势图像中对应的预设手势图像匹配的情况下，生成第一控制信号。

在一些可选的实施例中，上述CDC31具体可以用于：在所述目标手势序列与所述预设手势序列匹配的情况下，分别提取所述N个手势图像中的每个手势图像的手部特征信息；在所述N个手势图像中的至少一个手势图像的手部特征信息与预设手部特征信息匹配的情况下，生成第一控制信号。

需要说明的是，本实施例提供的车辆可以实现上述车辆控制方法实施例的各个过程，并达到相应的技术效果，在此不做赘述。

本申请的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

本申请实施例还提供一种车辆，包括上述任一实施例的车辆控制装置。

根据本申请的实施例，本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图10示出了可以用来实施本申请的实施例的示例电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图10所示，电子设备1000包括计算单元1001，其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序，来执行各种适当的动作和处理。在RAM1003中，还可存储设备1000操作所需的各种程序和数据。计算单元1001、ROM1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。

设备1000中的多个部件连接至I/O接口1005，包括：输入单元1006，例如键盘、鼠标等；输出单元1007，例如各种类型的显示器、扬声器等；存储单元1008，例如磁盘、光盘等；以及通信单元1009，例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理，例如车辆控制方法。例如，在一些实施例中，车辆控制方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1008。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM 1003并由计算单元1001执行时，可以执行上文描述的车辆控制方法的一个或多个步骤。备选地，在其他实施例中，计算单元1001可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行车辆控制方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网、以太网和CAN总线。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种车辆控制方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述图像采集装置设置于所述车辆的左侧后视镜或者所述车辆的左侧前车轮的翼子板上，所述显示装置设置于所述车辆的仪表台，且所述显示装置的至少部分显示区域位于所述仪表台中对应主驾驶位的区域；

或者

所述图像采集装置设置于所述车辆的右侧后视镜或者所述车辆的右侧前车轮的翼子板上，所述显示装置设置于所述车辆的仪表台，且所述显示装置的至少部分显示区域位于所述仪表台中对应副驾驶位的区域。

4.根据权利要求1所述的方法，其特征在于，所述在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，包括：

5.根据权利要求1所述的方法，其特征在于，所述在目标手势序列与预设手势序列匹配的情况下，控制所述车辆执行目标操作，包括：

6.根据权利要求4或5所述的方法，其特征在于，所述接收目标用户的第一语音信息之前，所述方法还包括：

接收用户选择的所述预设手势序列；

采集与所述预设手势序列中的第i个预设手势对应的目标手势图像；

对所述目标手势图像进行手势识别，得到所述目标手势图像对应的手势，i为正整数且i的取值范围为[1，N]；

7.根据权利要求1所述的方法，其特征在于，所述在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集所述目标用户的N个手势图像之前，所述方法还包括：

或者

在接收到对唤醒开关的目标输入的情况下，唤醒所述车辆的第一设备，其中，所述第一设备包括与手势识别相关的设备，所述唤醒开关设置于所述车辆车舱的外部。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括如下至少一项：

9.根据权利要求1所述的方法，其特征在于，所述控制所述车辆执行目标操作之后，所述方法还包括：

将所述预设手势序列进行P次循环移位，得到更新后的所述预设手势序列，P为正整数。

10.根据权利要求1所述的方法，其特征在于，所述在所述第一语音信息的声纹特征与预设声纹特征匹配的情况下，通过图像采集装置依次采集N个手势图像，包括：

11.一种车辆，所述车辆包括车舱，所述车舱包括侧门板和侧门玻璃，其特征在于，包括：

图像采集装置，用于采集目标用户的手部图像；其中，所述目标用户位于所述车舱的外部；

12.一种车辆控制装置，其特征在于，所述装置包括：

13.一种车辆，其特征在于，包括权利要求12所述的车辆控制装置。

14.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。

15.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。

16.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。