CN111098859A

CN111098859A - 车载数字辅助认证

Info

Publication number: CN111098859A
Application number: CN201911019693.8A
Authority: CN
Inventors: 纳夫勒斯·卡亚; 格伦·门罗·格林
Original assignee: Ford Global Technologies LLC
Current assignee: Ford Global Technologies LLC
Priority date: 2018-10-26
Filing date: 2019-10-24
Publication date: 2020-05-05
Also published as: US10861457B2; US20200135190A1; DE102019128797A1

Abstract

本公开提供了“车载数字辅助认证”。一种车辆包括控制器，所述控制器被编程为：响应于经由传声器检测到来自用户的语音命令和所述用户在所述车辆内部的位置，使用对由摄像机捕获的所述用户的所述位置的图像的面部识别来认证所述用户的身份；并且响应于成功的认证，执行所述语音命令。

Description

车载数字辅助认证

技术领域

本公开总体涉及车辆认证系统。更具体地，本公开涉及用于语音命令的车辆认证系统。

背景技术

许多车辆设置有支持语音命令输入的信息娱乐系统。车辆用户可使用语音命令(诸如设定导航目的地和调节温度)执行各种特征。当前，存在许多不支持用户的身份认证的语音命令系统。不同的用户(例如，车辆所有者和乘客)已被给予相同的语音命令授权。

发明内容

在本公开的一个或多个说明性实施例中，一种车辆包括控制器，所述控制器被编程为：响应于经由传声器检测到来自用户的语音命令和所述用户在所述车辆内部的位置，使用对由摄像机捕获的所述用户的所述位置的图像的面部识别来认证所述用户的身份；并且响应于成功的认证，执行所述语音命令。

在本公开的一个或多个说明性实施例中，一种车辆包括控制器，所述控制器被编程为：响应于检测到车门打开或关闭事件，经由摄像机检测所述车辆的占用情况，并且经由对经由所述摄像机捕获的图像的面部识别来认证第一用户的身份和第二用户的身份；响应于经由传声器接收到来自第一用户的语音命令，分析所述语音命令以基于预定义规则来检测所述语音命令是否依赖于占用情况；并且响应于检测到所述语音命令依赖于占用情况，通过所述第二用户的所述身份来验证是否满足预定义的依赖于占用情况的条件。

在本公开的一个或多个说明性实施例中，一种用于车辆的方法包括：响应于接收到指示即将到来的语音命令的输入，激活全向传声器和摄像机；经由所述传声器接收来自用户的语音命令；检测经由所述传声器接收所述语音命令的方向；经由所述摄像机捕获车厢内部的图像；通过基于从所述传声器接收的所述方向对所述图像的面部识别来认证所述用户的身份；并且响应于成功的认证，执行所述语音命令。

附图说明

为了更好地理解本发明并示出可如何执行本发明，现在将参考附图仅通过非限制性示例来描述其实施例，在附图中：

图1示出本公开的一个实施例的车辆系统的示例性框式拓扑；

图2示出用于本公开的一个实施例的过程的示例性流程图；并且

图3示出用于本公开的另一个实施例的过程的示例性流程图。

具体实施方式

按照需要，本文公开了本发明的详细实施例；然而，应当理解，所公开的实施方案仅仅是可体现为各种形式和替代形式的本发明的示例。附图不一定按比例绘制；一些特征可能会被放大或最小化以示出特定部件的细节。因此，本文中公开的具体结构细节和功能细节不应被解释为是限制性的，而是仅仅作为教导本领域技术人员以不同方式采用本发明的代表性基础。

本公开总体提供多个电路或其他电气装置。所有对电路和其他电气装置以及各自提供的功能的引用均不意图受限于仅涵盖本文所示出和描述的内容。虽然可将特定的标签分配给各种电路或其他电气装置，但是基于所期望的特定类型的电气实现方式，此类电路和其他电气装置可以任何方式彼此组合和/或分开。应认识到，本文所公开的任何电路或其他电气装置可包括任何数量的微处理器、集成电路、存储器装置(例如，闪存、随机存取存储器(RAM)、只读存储器(ROM)、电可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、或上述存储器的其他合适的变体)以及软件，上述各者彼此协作来执行本文所公开的一个或多个操作。此外，电气装置中的任何一个或多个可被配置来执行体现在非暂时性计算机可读介质中的计算机程序，所述计算机程序被编程来执行任何数量的所公开的功能。

本公开除了其他之外还提出了一种车辆语音命令授权系统。更具体地，本公开提出了一种使用图像识别技术的车辆语音命令授权系统。

参见图1，示出了本公开的一个实施例的车辆系统100的示例性框式拓扑。载具(vehicle)102可包括各种类型的汽车、跨界多功能车(CUV)、运动型多功能车(SUV)、卡车、休闲车(RV)、船、飞机或用于运输人员或货物的其他移动机器。在许多情况下，车辆102可由内燃发动机提供动力。作为另一种可能性，载具(vehicle)102可以是电池电动车辆(BEV)；由内燃发动机和一个或多个电动马达提供动力的混合动力电动车辆(HEV)，诸如串联式混合动力电动车辆(SHEV)、并联式混合动力电动车辆(PHEV)或混联式混合动力电动车辆(PSHEV)；船；飞机或用于运输人员或货物的其他移动机器。作为示例，系统100可包括由密歇根州迪尔伯恩市的福特汽车公司(Ford Motor Company)制造的SYNC系统。应当注意，所示出的系统100仅为示例，并且可使用更多、更少和/或以不同方式定位的元件。

如图1中所示，计算平台104可包括一个或多个处理器112，所述一个或多个处理器112被配置为执行指令、命令和其他程序以支持本文所述的过程。例如，计算平台104可被配置为执行车辆应用程序108的指令以提供诸如导航、警报和无线通信的特征。可使用多种类型的计算机可读存储介质106以非易失性方式保存此类指令和其他数据。计算机可读介质106(也称为处理器可读介质或存储装置)包括参与提供可由计算平台104的处理器112读取的指令或其他数据的任何非暂时性介质(例如，有形介质)。计算机可执行指令可由使用多种编程语言和/或技术创建的计算机程序来编译或解译，所述编程语言和/或技术单独地或组合地包括但不限于：Java、C、C++、C#、Objective C、Fortran、Pascal、Java Script、Python、Perl和PL/SQL。

计算平台104可设置有允许车辆乘员/用户与计算平台104交互的各种特征。例如，计算平台104可从人机界面(HMI)控件120接收输入，所述控件被配置为提供乘员与车辆102的交互。作为示例，计算平台104可与被配置为调用计算平台104上的功能的一个或多个按钮(未示出)或其他HMI控件(例如，方向盘音频按钮、通话按钮、仪表板控件等)进行交互。

计算平台104还可驱动一个或多个显示器116或以其他方式与其通信，所述一个或多个显示器116被配置为通过视频控制器114向车辆乘员提供视觉输出。在一些情况下，显示器116可以是进一步被配置为经由视频控制器114接收用户触摸输入的触摸屏，而在其他情况下，显示器116可以仅是显示器，而没有触摸输入能力。计算平台104还可驱动一个或多个内部摄像机118或以其他方式与其通信，所述一个或多个内部摄像机118被配置为通过视频控制器114捕获车厢内部的车辆乘员的视频图像。例如，内部摄像机118可面向后地定位在挡风玻璃上，被配置为捕获车辆102的乘员的面部图像。摄像机118可通过被配置为允许摄像机118移动/旋转并聚焦于车厢的具体部分的马达等进一步设置有可移动特征。另外或可替代地，在车辆102是诸如三排SUV的大型车辆的情况下，可使用多个摄像机来捕获不同排中的乘员的面部图像。

计算平台104还可驱动一个或多个扬声器124和传声器126或以其他方式与其通信，所述一个或多个扬声器124和传声器126被配置为通过音频控制器122向车辆乘员提供音频输出并提供来自车辆乘员的音频输入。传声器126可设置有方向检测特征，以用于检测音频输入的方向和/或位置。作为示例，可经由布置在一个或多个传声器总成中的多个声音传感器来实现方向检测特征，所述多个声音传感器被配置为使用音量差和时间延迟来计算声源的方向。例如，响应于检测到用户正在经由传声器126向计算平台104发出语音命令，生成方向信号，所述方向信号被发送到计算平台104以确定用户在车厢内部的位置(例如，驾驶员座椅、右后乘客座椅等)。传声器126可以是单个传声器总成，其位于车厢内部(诸如车厢的中间部分)，以更好地检测语音命令的方向。可替代地，传声器126可包括位于车厢内部不同位置处的多个传声器总成输入传感器。在此情况下，音频控制器122可进一步被配置为处理来自多个传感器的语音输入，并且诸如经由音量等来计算源的方向或位置。

计算平台104可被配置为经由无线连接190与车辆用户/乘员的移动装置140无线通信。移动装置140可以是各种类型的便携式计算装置中的任一种，诸如蜂窝电话、平板电脑、可穿戴装置、智能手表、膝上型计算机、便携式音乐播放器或能够与计算平台104通信的其他装置。无线收发器132可与WiFi控制器128、蓝牙控制器130、射频识别(RFID)控制器134、近场通信(NFC)控制器136以及诸如Zigbee收发器、红外数据协会(IrDA)收发器的其他控制器(未示出)进行通信，并且被配置为与移动装置140的可兼容无线收发器152通信。

移动装置140可设置有处理器148，所述处理器148被配置为执行指令、命令和其他程序以支持诸如导航、电话、无线通信和多媒体处理的过程。移动装置140可设置有无线收发器152，所述无线收发器152与WiFi控制器150、蓝牙控制器154、RFID控制器156、NFC控制器158以及其他控制器(未示出)进行通信，被配置为与计算平台104的无线收发器132通信。

计算平台104可进一步被配置为经由一个或多个车载网络170与各种车辆部件通信。作为一些示例，车载网络170可包括但不限于控制器局域网(CAN)、以太网网络和媒体导向系统传输(MOST)中的一者或多者。

计算平台104可被配置为与远程信息处理控制单元(TCU)174通信，所述远程信息处理控制单元(TCU)174被配置为使用调制解调器172通过无线连接192来控制车辆102与通信网络188之间的远程通信。通信网络188可以是实现远程服务器186与计算平台104之间的通信的任何类型的无线网络，诸如蜂窝网络。应当注意，在整个本公开内容中，远程服务器186被用作通用术语并可以是指涉及多个服务器、计算机、装置等的任何基于云的服务。计算平台104可进一步被配置为与一个或多个座椅传感器176通信，所述一个或多个座椅传感器176被配置为感测和测量一个或多个车辆座椅的占用情况。座椅传感器176可设置有重量测量特征，所述重量测量特征允许计算平台104确定或估计座椅上的乘客的类型(例如，儿童或成人)。座椅传感器176可另外接收安全带信息，诸如安全带是否扣紧或者安全带的延伸长度。座椅传感器176还可接收指示汽车座椅是否附接到闩锁夹具的信息或指示儿童汽车座椅在就座位置中的放置情况的其他信息。另外或可替代地，座椅传感器176可经由被配置为在不利用座椅的情况下(例如，针对公共汽车的站立乘客)检测车辆102内部或附近的一个或多个车辆用户的存在的任何电动/机械传感器来实现。

参见图2，示出了用于本公开的一个实施例的过程200的流程图。继续参考图1，在操作202处，计算平台104检测指示由用户输入的语音命令的输入。可经由与HMI控件120相关联的一个或多个按钮(未示出)来接收输入。另外或可替代地，输入可以是预定义的短语(诸如“语音命令”)，并且使用语音识别技术经由传声器126主动接收。响应于接收到输入，在操作204处，计算平台104激活内部摄像机118和传声器126以从用户接收音频和视频输入。在操作206处，计算平台104接收从用户发出的语音命令并捕获车辆102的车厢的一个或多个图像。如上文所讨论的，传声器126可设置有方向检测特征，并且在操作208处，计算平台104使用来自传声器126和/或音频控制器122的方向信息来检测并确定发出语音命令的方向或位置。在摄像机118为可移动的情况下，计算平台可进一步在语音命令源的方向上移动摄像机118或聚焦于语音命令源的位置以捕获图像。

响应于检测到语音命令的源的位置/方向，在操作210处，计算平台104使用源的位置/方向来对在车厢内部捕获的图像执行面部识别。摄像机可响应于检测到语音命令而在车厢内部捕获车辆的多个用户/乘员的一个或多个图片。使用语音命令的源的位置/方向，计算平台104可以能够聚焦于车厢的具体位置以执行面部识别。授权用户的面部图像先前可例如作为车辆数据110的一部分记录并存储在存储装置106中。通过使用图像处理和面部识别技术将经由内部摄像机118捕获的面部图像与先前存储的图像进行比较，计算平台104可确定发出语音命令的用户是否被授权。另外或可替代地，在操作212处，计算平台104对经由传声器126接收的语音命令进一步执行声纹识别分析，以进一步确定用户的身份。授权用户的声纹可预录并存储在存储装置106中。在操作214处，如果计算平台104通过面部识别和/或声纹识别确定语音命令来自未授权用户，则过程前进到操作216，并且计算平台拒绝语音命令。可向车辆用户提供通知拒绝语音命令的反馈。反之，如果计算平台104检测到语音命令来自诸如先前注册的车辆所有者的授权用户，则过程前进到操作218，并且计算平台104执行语音命令并向用户提供反馈。

过程200的操作可应用于各种情况。例如，多个乘员/用户可共乘车辆102。在这些用户中，坐在驾驶员座椅上的驾驶员可以是某些语音命令(诸如播放消息或加载电子邮件)的授权用户，而坐在右后座椅处的乘客是此类命令的未授权用户。例如，当计算平台104检测到诸如“播放我的消息”的语音命令时，重要的是确定发出此类命令的用户的源/身份，并且出于隐私和安全方面的考虑在执行所述命令之前验证用户是否被授权这样做。

当车厢中存在多个用户时，出于识别的目的，仅面部识别可能不足够，因为可能仍不清楚哪个用户发出了语音命令。因此，在这种情况下，了解发出语音命令的用户的位置可能会有所帮助。响应于确定发出语音命令的用户坐在车厢内部的位置，计算平台104可聚焦于该具体位置以执行面部识别。例如，如果“播放我的消息”语音命令是由坐在右后座椅上的未授权乘客发出的，则计算平台104可经由传声器126检测他/她的位置，并且仅对右后座椅乘客的图像执行面部识别。在这种情况下，即使此类语音命令的授权驾驶员也在经由摄像机118捕获的图像中，计算平台104也可响应于认证失败而拒绝执行语音命令。然而，如果命令是由驾驶员发出的，则根据相同原理认证将成功，并且计算平台104可继续执行语音命令。

另外或可替代地，根据相同原理，过程200可应用于不同场景。例如，车辆102可设置有多区供暖、通风和空气调节(暖通空调(HVAC))系统，所述HVAC系统被配置为允许不同座椅上的用户单独调整温度。响应于接收到诸如“将温度设定到70”的语音命令，计算平台104可识别是哪个用户发出了此类语音命令，并且响应于成功的认证而仅将温度调整到这个用户所位于的具体温度区。这个特征在诸如以下情况下可能特别有用：父母可能不允许儿童乘客将温度设定为低于一定程度(例如，70华氏度)。父母可预先配置计算平台104以将最低温度与儿童乘客相关联，而不管儿童在哪个座椅中。因此，即使儿童乘客在乘车过程中更换座椅并发出语音命令，计算平台104仍可识别儿童并相应地控制温度设定。

参见图3，示出了本公开的另一个实施例的过程300。在操作302处，计算平台104检测车辆102的占用情况，包括关于车辆中有多少乘员以及每个乘员的位置的信息。每当一个或多个乘员进入或离开车辆102并且/或者车辆102开始行驶时，就可执行这项操作。可经由各种手段执行检测，所述手段包括但不限于来自一个或多个座椅传感器176的信号、来自传声器126的语音方向信号和/或经由内部摄像机118捕获的图像。响应于检测到车辆102的占用情况，在操作304处，计算平台104识别在车辆102的车厢内检测到的每个乘员。可利用面部识别技术经由通过内部摄像机118捕获的图像来执行识别。另外，计算平台104可经由与经由无线连接190连接到计算平台104的移动装置140相关联的用户配置文件来识别车辆102的一个或多个乘员。如上文所讨论的，移动装置140可先前向与特定用户相关联的计算平台104进行注册，从而创建例如分别作为车辆数据110和/或移动数据146的一部分存储在存储装置106和/或移动存储装置142中的用户配置文件。另外或替代地，可通过向服务器186发送用户信息(例如，用户面部图像和/或用户配置文件)以及从服务器186接收识别信息来执行识别。

在操作306处，计算平台104经由传声器126从车辆102的用户接收语音命令。作为响应，计算平台104在操作308处分析语音命令以获得各种信息，诸如命令的源的位置/方向、语音命令的内容、语音命令是否需要授权和/或语音命令是否依赖于占用情况。另外，计算平台104可进一步分析语音命令的源的声纹以确定源的真实性。例如，计算平台104可被配置为允许针对不同语音命令的不同级别的授权。诸如“当前时间是什么”的语音命令可被设定为通用级别的授权，使得不需要授权。另一方面，如上文所讨论的诸如“播放消息”的语音命令可能需要一定级别的授权。

在操作310处，响应于检测到语音命令需要授权，过程前进到操作312。反之，如果不需要授权，则过程前进到操作320以直接执行语音命令。在操作312处，计算平台104使用由操作304造成的识别确定是否已针对此类具体语音命令对发出语音命令的用户进行授权。如果用户未被授权，则过程前进到操作318，并且计算平台104拒绝语音命令。反之，如果用户已被授权，则过程从操作312前进到操作314，以进一步确定该具体授权用户的具体命令是否依赖于占用情况。作为示例，父母车辆所有者可仅在父母存在于车辆中时授权儿童乘客收听一些具体的无线电频道或播放一些预定义的视频/音频。并且父母可以此方式预配置计算平台104。在这种情况下，操作314对于做出此类确定变得有用。如果操作314的答案为“否”，则过程前进到操作320。反之，响应于检测到用户的语音命令依赖于占用情况，过程前进到操作316，并且计算平台104检测是否满足语音命令的占用条件。遵循以上示例，如果计算平台104检测到父母在车辆102内部，则满足占用条件，并且过程前进到操作320以进行执行。反之，过程前进到操作318以拒绝语音命令。

虽然上文描述了示例性实施例，但并不意图使这些实施例描述本发明的所有可能的形式。相反，本说明书中所使用的措词是描述性而非限制性的措词，并且应当理解，可在不脱离本发明的精神和范围的情况下做出各种改变。另外，可组合各种实现实施例的特征以形成本发明的另外实施例。

根据本发明的一个实施例，所述控制器进一步被编程为：控制一个或多个摄像机以捕获车厢的一个或多个图像；并且利用对由所述一个或多个摄像机捕获的所述一个或多个图像的面部识别来认证所述第二车辆用户的所述身份。

根据一个实施例，所述控制器进一步被编程为：通过经由TCU向服务器发送所述第二车辆用户的用户配置文件来认证所述第二车辆用户的所述身份。

根据一个实施例，所述控制器进一步被编程为：通过经由TCU向服务器发送所述用户配置文件以及从所述服务器接收认证来认证所述第二用户的所述身份。

根据一个实施例，本发明的进一步特征在于：响应于基于预定义规则检测到所述语音命令依赖于占用情况，通过对所述图像的面部识别来认证第二用户的身份；并且执行所述语音命令。

根据一个实施例，上述发明的进一步特征在于：通过对所接收到的所述语音命令的声纹分析来认证所述用户的所述身份。

Claims

1.一种车辆，其包括：

控制器，所述控制器被编程为

响应于经由传声器检测到来自用户的语音命令和所述用户在所述车辆内部的位置，使用对由摄像机捕获的所述用户的所述位置的图像的面部识别来认证所述用户的身份；并且

响应于成功的认证，执行所述语音命令。

2.如权利要求1所述的车辆，其中所述控制器进一步被编程为使用对所接收到的所述语音命令的声纹分析来认证所述用户的所述身份。

3.如权利要求1所述的车辆，其中所述控制器进一步被编程为使用来自座椅传感器的信号来检测所述用户的所述位置。

4.如权利要求1所述的车辆，其中所述控制器进一步被编程为经由无线连接到所述车辆且具有所述用户的用户配置文件的移动装置来认证所述用户的所述身份。

5.如权利要求1所述的车辆，其中所述控制器进一步被编程为：通过远程信息处理控制单元(TCU)经由通信网络向服务器发送所述用户的所述图像，并且作为响应从所述服务器接收所述用户的认证。

6.如权利要求1所述的车辆，其中所述控制器进一步被编程为分析所述语音命令以检测是否需要认证。

7.如权利要求1所述的车辆，其中所述控制器进一步被编程为基于所述语音命令和所述用户的所述身份检测所述语音命令是否依赖于占用情况。

8.如权利要求7所述的车辆，其中所述控制器进一步被编程为

响应于检测到所述语音命令依赖于占用情况，认证第二车辆用户的身份以确认能够执行所述语音命令；

控制一个或多个摄像机以捕获车厢的一个或多个图像；

利用对由所述一个或多个摄像机捕获的所述一个或多个图像的面部识别来认证所述第二车辆用户的所述身份；并且

通过经由TCU向服务器发送所述第二车辆用户的用户配置文件来认证所述第二车辆用户的所述身份。

9.如权利要求1所述的车辆，其中所述控制器进一步被编程为朝向发出所述语音命令的所述用户的所述位置移动所述摄像机。

10.一种车辆，其包括：

控制器，所述控制器被编程为

响应于检测到车门打开或关闭事件，经由摄像机检测所述车辆的占用情况，并且通过对经由所述摄像机捕获的图像的面部识别来认证第一用户的身份和第二用户的身份；

响应于经由传声器接收到来自第一用户的语音命令，分析所述语音命令以基于预定义规则来检测所述语音命令是否依赖于占用情况；并且

响应于检测到所述语音命令依赖于占用情况，通过所述第二用户的所述身份来验证是否满足预定义的依赖于占用情况的条件。

11.如权利要求10所述的车辆，其中所述控制器进一步被编程为经由座椅传感器检测所述车辆的所述占用情况。

12.如权利要求10所述的车辆，其中所述控制器进一步被编程为

利用无线连接到所述车辆的用户配置文件经由移动装置来认证所述第二用户的所述身份；并且

通过经由TCU向服务器发送所述用户配置文件以及从所述服务器接收认证来认证所述第二用户的所述身份。

13.如权利要求10所述的车辆，其中所述控制器进一步被编程为：经由从设置有全向特征的所述传声器发送的位置信号在所述第一用户和所述第二用户中识别发出所述语音命令的源用户。

14.一种用于车辆的方法，其包括：

响应于接收到指示即将到来的语音命令的输入，激活全向传声器和摄像机；

经由所述传声器接收来自用户的语音命令；

检测经由所述传声器接收所述语音命令的方向；

经由所述摄像机捕获车厢内部的图像；

通过基于从所述传声器接收的所述方向对所述图像的面部识别来认证所述用户的身份；并且

响应于成功的认证，执行所述语音命令。

15.如权利要求14所述的方法，其还包括：

旋转所述摄像机以聚焦于从所述传声器接收的所述方向；

响应于基于预定义规则检测到所述语音命令依赖于占用情况，通过对所述图像的面部识别来认证第二用户的身份；

通过对所接收到的所述语音命令的声纹分析来认证所述用户的所述身份；并且

执行所述语音命令。