CN116597830A

CN116597830A - 车辆及其控制方法

Info

Publication number: CN116597830A
Application number: CN202211599501.7A
Authority: CN
Inventors: 崔瑞桓
Original assignee: Hyundai Motor Co; Kia Corp
Current assignee: Hyundai Motor Co; Kia Corp
Priority date: 2022-02-14
Filing date: 2022-12-12
Publication date: 2023-08-15
Also published as: KR20230122427A; US20230260511A1; DE102022213058A1

Abstract

本公开涉及一种车辆及其控制方法，该车辆包括：麦克风，用户的语音命令被输入到该麦克风；通信模块，被配置为从移动设备接收联系人数据和联系历史数据；至少一个存储器，被配置为存储基于从移动设备接收的联系历史数据而获得的第一语音识别数据库和基于从移动设备接收的联系人数据而获得的第二语音识别数据库；以及至少一个处理器，被配置为当用于呼叫或发短信的语音命令被输入到麦克风时，基于语音命令中包括的接收者信息、存储的第一语音识别数据库和存储的第二语音识别数据库来确定最终接收者或生成接收者候选列表。

Description

车辆及其控制方法

技术领域

本公开涉及一种可通过用户语音命令进行呼叫的车辆及其控制方法。

背景技术

语音识别系统能够从用户的语音中识别用户的意图，并提供与识别出的用户意图相对应的服务。

语音识别系统与特定的设备相连，以控制设备并根据用户的意图提供特定信息。

最近，由于在车辆中设置了语音识别系统，用户可以简单地通过用户的话语来控制车辆，并且还可以通过与车辆的对话获得所需的信息或所需的服务。

在根据用户语音命令可在车辆中执行的功能中，存在向特定方拨打电话或发送短信消息的功能。然而，当用户的语音命令被错误地识别或者联系人列表中存储有相似的名称时，可能执行呼叫或发短信给非预期的接收者。

本公开背景技术部分中所包括的信息仅用于增强对本公开的总体背景的理解，不能被视为对该信息形成本领域技术人员已知的现有技术的承认或任何形式的暗示。

发明内容

本公开的各方面旨在提供一种车辆及其控制方法，该车辆及其控制方法可以在同时考虑呼叫历史数据、短信历史数据以及联系人数据的情况下通过识别用户语音来明确呼叫或短信的接收者，从而防止呼叫或发短信给非预期的接收者。

本公开的其他方面部分地将在下面的描述中被阐述，并且部分地将从描述中显而易见，或者可以通过本公开的实践获知。

根据本公开的一方面，提供一种车辆，包括：麦克风，用户的语音命令被输入到该麦克风；通信模块，被配置为从移动设备接收联系人数据和联系历史数据；至少一个存储器，被配置为存储基于从移动设备接收的联系历史数据而获得的第一语音识别数据库和基于从移动设备接收的联系人数据而获得的第二语音识别数据库；以及至少一个处理器，被配置为当用于呼叫或发短信的语音命令被输入到麦克风时，基于语音命令中包括的接收者信息、存储的第一语音识别数据库和存储的第二语音识别数据库来确定最终接收者或生成接收者候选列表。

至少一个处理器被配置为：执行第一搜索，该第一搜索为在第一语音识别数据库中搜索与语音命令中包括的接收者信息相对应的数据；并执行第二搜索，该第二搜索为在第二语音识别数据库中搜索与语音命令中包括的接收者信息相对应的数据。

在上述段落中，至少一个处理器被配置为基于第一搜索的结果和第二搜索的结果来确定最终接收者或生成接收者候选列表。

在上述段落中，当第一搜索的结果和第二搜索的结果中均包括的数据为单个数据时，至少一个处理器被配置为将单个数据确定为最终接收者。

在上述段落中，当第一搜索的结果和第二搜索的结果中均包括的数据为两个或更多个数据时，至少一个处理器被配置为生成包括该两个或更多个数据的接收者候选列表。

在上述段落中，当不存在包括在第一搜索的结果和第二搜索的结果中的数据时，至少一个处理器被配置为生成包括第一搜索的结果以及第二搜索的结果的接收者候选列表。

在上述段落中，至少一个处理器被配置为将第一搜索的对象限制为第一语音识别数据库中从当前时间点开始的预定时间段内记录的数据。

在上述段落中，至少一个处理器被配置为从用户的语音命令中获得与联系时间相关的附加信息，并基于获得的附加信息执行第一搜索。

在上述段落中，至少一个处理器被配置为呼叫或发短信给确定的最终接收者。

在上述段落中，车辆进一步包括：显示器；以及扬声器，其中至少一个处理器被配置为通过显示器或扬声器输出生成的接收者候选列表。

根据本公开的一方面，提供一种控制车辆的方法，该控制方法包括：从移动设备接收联系人数据和联系历史数据；基于从移动设备接收的联系历史数据生成并存储第一语音识别数据库；基于从移动设备接收的联系人数据生成并存储第二语音识别数据库；以及当用于呼叫或发短信的语音命令被输入到麦克风时，基于语音命令中包括的接收者信息、存储的第一语音识别数据库和存储的第二语音识别数据库来确定最终接收者或生成接收者候选列表。

确定最终接收者或生成接收者候选列表包括：执行第一搜索，该第一搜索为在第一语音识别数据库中搜索与语音命令中包括的接收者信息相对应的数据；以及执行第二搜索，该第二搜索为在第二语音识别数据库中搜索与在语音命令中包括的接收者信息相对应的数据。

在上述段落中，确定最终接收者或生成接收者候选列表包括基于第一搜索的结果和第二搜索的结果确定最终接收者或者生成接收者候选列表。

在上述段落中，当第一搜索的结果和第二搜索的结果中均包括的数据为单个数据时，确定最终接收者或生成接收者候选列表包括将单个数据确定为最终接收者。

在上述段落中，当第一搜索的结果和第二搜索的结果中均包括的数据为两个或更多个数据时，确定最终接收者或生成接收者候选列表包括生成包括该两个或更多个数据的接收者候选列表。

在上述段落中，当不存在包括在第一搜索的结果和第二搜索的结果中的数据时，确定最终接收者或生成接收者候选列表包括生成包括第一搜索的结果和第二搜索的结果的接收者候选列表。

在上述段落中，将第一搜索的对象限制为第一语音识别数据库中从当前时间点开始的预定时间段内记录的数据。

在上述段落中，确定最终接收者或生成接收者候选列表包括从用户的语音命令获得与联系时间相关的附加信息，并基于获得的附加信息执行第一搜索。

在上述段落中，控制方法进一步包括呼叫或发短信给确定的最终接收者。

在上述段落中，控制方法进一步包括通过车辆中设置的显示器或扬声器输出生成的接收者候选列表。

本公开的方法和装置具有其他特征和优点，这些特征和优点将在并入本文的附图以及以下描述中显而易见或被更加详细地阐述，这些附图与以下描述一起用于解释本公开的某些原理。

附图说明

图1和图2是示出由车辆识别用户的语音并进行呼叫的操作的示图；

图3是示出根据本公开的示例性实施例的车辆的框图；

图4是示出根据本公开的示例性实施例的车辆中包括的语音识别模块的操作的框图；

图5是示出根据本公开的示例性实施例的在控制车辆的方法中从移动设备接收数据并生成语音识别数据库的操作的流程图；

图6是示出根据本公开的示例性实施例的车辆从移动设备接收联系人数据的操作的示图；

图7是示出根据本公开的示例性实施例的车辆使用联系人数据生成语音识别数据库的操作的示图；

图8是示出根据本公开的示例性实施例的车辆从移动设备接收联系历史数据的操作的示图；

图9是示出根据本公开的示例性实施例的车辆使用联系历史数据生成语音识别数据库的操作的示图；

图10是示出根据本公开的示例性实施例的在控制车辆的方法中当输入用户的语音命令时确定接收者的操作的流程图；

图11、图12和图13是示出根据本公开的示例性实施例的在控制车辆的方法中当输入用户的语音命令时确定接收者的操作的示例的示图；并且

图14是示出由图13的示例输出的接收者候选列表的示例的示图。

可以理解的是，附图不一定按比例绘制，呈现了说明本公开的基本原理的各种特征的某种程度简化的表示。如本文所公开的本公开的包括例如具体尺寸、取向、位置和形状的具体设计特征将部分地由具体预期的应用和使用环境确定。

在附图中，附图标记在附图中的几幅图中始终指代本公开的相同或等同部件。

具体实施方式

现在将详细参照本公开的各种实施例，本公开的各种实施例的示例在附图中示出并在下面描述。尽管将结合本公开的示例性实施例来描述本公开，但将理解的是，本描述并不旨在将本公开限制于那些示例性实施例。另一方面，本公开旨在不仅涵盖本公开的示例性实施例，而且还涵盖可以包括在如所附权利要求所限定的本公开的精神和范围内的各种替换、修改、等同形式和其他实施例。

本文阐述的和在本公开的配置中示出的示例性实施例仅为本公开的示例性实施例，因此应当理解的是，在本公开中可以用各种等同和修改方案替换这些示例性实施例。

本文使用的术语仅用于描述各种示例性实施例，并不旨在限制本公开。应当理解的是，除非在上下文中另有明确说明，否则单数形式也包括复数形式。将进一步理解的是，当在本说明书中使用时，术语“包括”、“包含”和/或“具有”等指定存在所述特征、数量、步骤、操作、元件和/或部件，但不排除存在或添加一个或多个其他特征、数量、步骤、操作、元件、部件或其组合。

此外，诸如“～部”、“～设备”、“～块”、“～构件”、“～模块”等术语可以指处理至少一个功能或动作的单元。例如，这些术语可以指由诸如现场可编程门阵列(FPGA)/专用集成电路(ASIC)的至少一个硬件、存储在存储器中的软件或处理器处理的至少一个过程。

应理解的是，尽管本文可使用术语第一、第二等来描述各种元件，但这些元件不应受到这些术语的限制。

用于方法步骤的附图标记仅出于解释的方便性，而不限制步骤的顺序。因此，除非上下文另有明确说明，否则阐述的命令也可以采用其他方式实施。

本文使用的术语“至少一个”包括相关联的所列项目的任意和所有组合。例如，应当理解的是，术语“a、b或c中的至少一个”可以包括仅a、仅b、仅c、a和b两者、a和c两者、b和c两者，或者a、b和c全部。

另一方面，实施例可以以存储计算机可运行指令的记录介质的形式来实施。指令可以以程序代码的形式被存储，并且当指令由处理器执行时，指令可以执行本公开的所公开的示例性实施例的操作。记录介质可以被实施为计算机可读记录介质。

计算机可读记录介质包括存储可由计算机解码的指令的各种记录介质，例如只读存储器(ROM)、随机存取存储器(RAM)、磁带、磁盘、闪速存储器、光学记录介质等。

在下文中，参照附图详细描述车辆及其控制方法的实施例。

图1和图2是示出由车辆识别用户的语音并进行呼叫的操作的示图。

如图1所示，设置有语音识别装置的车辆可以识别用户的语音命令“呼叫洪杰东”，并将“洪杰东”确定为呼叫的接收者。

当确定了呼叫的接收者时，车辆可以输出例如“将呼叫‘洪杰东’”的系统响应，并且可以呼叫与“洪杰东”相对应的联系号码。因此，用户可以方便且安全地呼叫预期的接收者，而无需使用用户的手按压按钮等。

然而，在车内环境中，由于用户语音命令中包括的噪声，语音识别可能出现错误。当用户的联系人列表中存储有相似的名称时，可能发生这种语音识别错误，从而导致呼叫非预期的接收者。

例如，如图2所示，即使用户说“呼叫洪杰东”，但车辆的语音识别装置也可能将呼叫的接收者识别为“洪杰道”，并呼叫与“洪杰道”相对应的联系号码。

根据本公开的各种示例性实施例的车辆及其控制方法可以考虑诸如呼叫历史和短信历史的联系历史来明确呼叫的接收者，以克服此类缺点。在下文中，参照附图详细描述根据示例性实施例的车辆及其控制方法。

图3是示出根据本公开的示例性实施例的车辆的框图。

识别用户语音的语音识别装置可以设置在通过无线通信与车辆连接的外部服务器中，或者安装在车辆的车身中。车辆的语音识别装置的位置不受限制，但在下面描述的实施例中描述了语音识别装置安装在车辆中。

参照图3，根据本公开的示例性实施例的车辆1包括输入用户语音的麦克风110、语音识别模块130、通信模块120、数据生成模块150、存储装置140、控制器160、扬声器170、显示器180和输入器190。此处，语音识别模块130识别输入到麦克风110的用户语音，通信模块120执行与诸如服务器2或移动设备3的外部设备的通信。数据生成模块150基于从移动设备3接收的数据生成语音识别数据库，存储装置140存储所生成的语音识别数据库，控制器160被配置为控制车辆1的全部操作。扬声器170、显示器180和输入器190对应于用户接口。

与车辆1的驱动相关的组成元件以及诸如空调设备、照明设备等其他组成元件是众所周知的，因此在此省略对这些组成元件的描述。详细描述与本公开的各种示例性实施例相关的组成元件及其操作。

麦克风110可以设置在车辆1内。麦克风110可以被设置在能够接收用户的语音的位置，并且例如设置在方向盘、中央仪表板、顶棚、后视镜、遮阳板、组合仪表等上。

此处，用户可以包括驾驶员或乘客。可以仅设置一个麦克风110，或者可以在不同位置设置两个或更多个麦克风210以去除噪声或接收乘客的语音。

除了用户的语音之外，麦克风110周围产生的各种音频可以被输入到麦克风110。麦克风110可以输出与输入到麦克风110的音频相对应的音频信号，并且输出的音频信号可以由语音识别模块130处理或通过通信模块120传输到外部服务器2。

除了麦克风110之外，车辆1还可以包括用于手动接收用户命令的输入器190。输入器190可以包括在中央仪表板上的设置音频、视频、导航(AVN)的区域、设置变速箱的区域或方向盘上设置为按钮、旋钮或触摸板形式的输入器。

另外，为了接收与乘客座椅相关的控制命令，输入器190可以包括设置在车辆1的每个车门上的输入器，以及设置在前扶手或后扶手上的输入器。

此外，输入器190可以包括与显示器180一体设置的触摸板，例如触摸屏。

显示器180设置在车辆1内部，并且可以可视地输出执行用户期望的功能所需的信息。

显示器180可以包括设置在车辆1的中央仪表板上的AVN显示器、组合仪表显示器或平视显示器(HUD)。可选地，显示器180可以包括设置在前排座椅的头枕的背面上的后排座椅显示器，使得后排乘客可以看到后排座椅显示器。当车辆1是多座位车辆时，显示器180可以包括安装在车辆1的顶棚上的显示器。

显示器180可以设置在车辆1内的用户可以看到显示器180的任意位置，并且显示器180的位置或数量不受限制。

扬声器170设置在车辆1内部，例如设置在车辆1的车门、仪表嵌板、中央仪表板等处，以便以听觉方式输出执行用户期望的功能所需的信息。

通信模块120可以执行与诸如外部服务器2或移动设备3等的其他电子设备的通信，以向其他设备发送信息并从其他设备接收信息。

例如，通信模块120可以使用诸如Wi-Fi、Zigbee、蓝牙、直接Wi-Fi、低功率蓝牙或近场通信(NFC)等短距离通信技术执行与位于车辆1中的移动设备3的通信。

另外，通信模块120可以通过与USB端子、AUX端子等连接的电缆向移动设备3发送信息并从移动设备3接收信息。

移动设备3可以包括智能手机、个人数字助理(PDA)、平板电脑、笔记本电脑或诸如智能手表或智能眼镜等的可穿戴设备中的至少一种。除了上述示例之外，在本公开的示例性实施例中，被配置为执行呼叫功能、存储诸如联系号码、呼叫历史等信息以及与车辆1的通信来提供诸如联系号码、呼叫历史等的信息的任意设备都可以包括在移动设备3中。

此外，通信模块120可以使用诸如4G、5G、Wi-Fi等的各种通信技术执行与外部服务器2的通信。外部服务器2可以是包括搜索引擎的服务器、提供诸如音乐或电影的多媒体内容的服务器或提供语音识别服务的服务器。

此外，通信模块120可以从连接到车辆1的移动设备3下载联系人数据以及包括呼叫历史和短信历史的联系历史数据。此处，连接到车辆1的移动设备3可以指通过完成与车辆1的蓝牙配对而处于可通信状态的移动设备3，或者通过电缆连接到车辆1的移动设备3。

数据生成模块150可以基于下载的联系人数据和联系历史数据生成可用于语音识别的语音识别数据库。上述过程被称为数据生成(DP)，稍后对此详细描述。

数据生成模块150中生成的语音识别数据库可存储在存储装置140中，并在语音识别模块130识别输入到麦克风110的语音时使用。

存储装置140可以包括主存储器设备和辅助存储器设备中的至少一个。主存储器设备可以使用诸如只读存储器(ROM)和/或随机存取存储器(RAM)的半导体存储介质来实施。例如，ROM可以包括可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)和/或掩模ROM等。例如，RAM可以包括静态随机存取存储器(S-RAM)和/或动态随机存取存储器(D-RAM)等。

辅助存储器设备可以使用诸如闪存设备、安全数字(SD卡)、固态驱动器(SDD)、硬盘驱动器(HDD)、磁鼓、光盘、激光盘、磁带、磁光盘和/或软盘等的至少一种存储介质来实施。

控制器160可以控制车辆1的全部操作。例如，控制器160可以包括在车辆1的头部单元中，处理通过输入器190输入的用户输入，并执行与用户输入相对应的控制。另外，控制器160可以在执行控制的同时控制扬声器170或显示器180以听觉方式或视觉方式输出所需的信息。

此外，当输入用于呼叫或发短信的用户语音命令时，控制器160可以根据下面描述的操作确定最终接收者或生成接收者候选列表。

语音识别模块130、数据生成模块150和控制器160可以包括至少一个记录介质和至少一个处理器，该记录介质存储执行上述操作或稍后将描述的操作的程序，该处理器实施存储的程序。

存储程序的至少一个记录介质是计算机可读介质，并且可以包括诸如以下的被配置为存储响应于计算机等的调用而运行的特定程序的各种类型的硬件设备：诸如硬盘或软盘的磁盘存储介质，磁带，诸如光盘(CD)或数字多功能光盘(DVD)的光学介质，诸如软盘的磁光介质，诸如只读存储器(ROM)、随机存取存储器(RAM)或闪速存储器的半导体存储介质等。

另一方面，车辆1的上述组成元件基于其功能被划分，而不一定在物理相互分离。例如，数据生成模块150、语音识别模块130或控制器160中的至少一个可以共享记录介质或处理器。此处，记录介质可以包括与存储装置140共享的至少一个存储器。

图4是示出根据本公开的示例性实施例的车辆中包括的语音识别模块的操作的框图。

参照图4，语音识别模块130可以包括语音检测器131、特征提取器132和语音识别器133。

从麦克风110接收的音频信号包括表示用户语音的语音部分，以及非语音部分。语音检测器131可以从从麦克风110接收的音频信号中检测语音部分，从而使语音识别模块130仅对语音部分执行语音识别。

特征提取器132可以从语音信号中提取特征向量。例如，特征提取器132可以使用诸如线性预测系数(LPC)、倒谱(Cepstrum)、梅尔频率倒谱系数(MFCC)、滤波器组能量等特征向量提取技术从语音信号中提取特征向量。

语音识别器133可以将所提取的特征向量与预定义模式进行比较，并基于特征向量和预定义模式之间的相似度来判断是否匹配。可以使用声学模型来比较特征向量和预定义模式，并且预定义模式可存储在稍后描述的语音识别数据库中。

可以针对从移动设备3接收的联系人数据、联系历史数据、预定义命令和常用词生成语音识别数据库。

语音识别器133可以使用动态时间扭曲(DTW)、隐马尔可夫模型、矢量量化(VQ)或人工神经网络(ANN)等将特征向量与预定义模式进行比较。

在本公开的示例性实施例中，当用户向麦克风110输入用于呼叫或发短信的语音命令时，语音识别模块130识别语音命令，识别用户期望的功能是进行呼叫或发送短信，并确定呼叫或短信的接收者。当确定接收者时，从移动设备3下载的联系人数据和联系历史数据可以一起使用，稍后对此进行详细描述。

图5是示出根据本公开的示例性实施例的在控制车辆的方法中从移动设备接收数据并生成语音识别数据库的操作的流程图。图6是示出根据本公开的示例性实施例的车辆从移动设备接收联系人数据的操作的示图。图7是示出根据本公开的示例性实施例的车辆使用联系人数据生成语音识别数据库的操作的示图。图8是示出根据本公开的示例性实施例的车辆从移动设备接收联系历史数据的操作的示图。图9是示出根据本公开的示例性实施例的车辆使用联系历史数据生成语音识别数据库的操作的示图。

根据本公开的示例性实施例的车辆1通过根据本公开的示例性实施方式的车辆控制方法来控制。因此，根据本公开的各种示例性实施例的控制车辆的方法可以由车辆1执行，尽管在下文中没有具体描述，但对车辆1的描述适用于控制车辆的方法。相反，尽管在下文中没有具体描述，但对控制车辆的方法的描述也可以应用于车辆1。

参照图5，车辆1确认车辆1是否连接到移动设备3(1100)。车辆1和移动设备3之间可以使用蓝牙通信无线地进行连接，或者通过使用电缆有线地进行连接。

当车辆1连接到移动设备3(操作1100中为“是”)时，通信模块120从移动设备3接收联系人数据(1200)。

在这种情况下，可以运行获取用户同意的过程。例如，可以通过显示器180或扬声器170输出用于询问是否从移动设备3接收联系人数据的消息，并且当从用户输入同意的响应时，可以从移动设备3接收联系人数据。可选地，可以在移动设备3中运行上述过程。

一起参照图5和图6，联系人数据可以包括名称字段和分配给相应名称的联系字段。名称字段中的数据可以包括用于识别联系号码属于谁的标识符，例如名字、姓氏、企业名称、头衔等。联系字段中的数据可以包括联系号码，例如电话号码等。

数据生成模块150使用接收到的联系人数据生成并存储用于语音识别的联系人数据库(1300)。

当通信模块120接收到联系人数据时，如图7所示，数据生成模块150可以通过数据生成(DP)过程生成用于语音识别的联系人数据库141。

例如，数据生成模块150可以通过使用字素到音素(G2P)技术生成与接收到的联系人数据的字符串相对应的发音字符串(发音/发音序列)。数据生成模块150可以生成与联系人数据的名称字段中的数据相对应的发音字符串。另外，生成的发音字符串可以以树状结构存储以生成词汇树。生成的发音字符串或生成的词汇树可以存储在存储装置140中。

此外，与命令相对应的发音字符串可以存储在存储装置140中。例如，对应于与拨打电话、查找路线、播放广播、播放音乐等功能相关的命令的发音字符串可以被存储。

此外，执行用户通过语音命令可控制的功能所需的每个单词也可以以发音字符串存储在存储装置140中。例如，诸如用于具体说明日期的单词、用于具体说明时间的单词、用于具体说明位置的单词、用于指示数字的单词等的单词的发音字符串可以存储在存储装置140中。

通信模块120可以从移动设备3接收联系历史数据(1400)。与接收联系人数据时类似，可以在获得用户同意之后将联系历史数据下载到车辆1。

参照图5和图8，联系历史数据可以包括呼叫历史数据和短信历史数据。

呼叫历史数据可以包括名称字段、分配给相应名称的联系字段、呼叫类型字段(呼入/呼出/未接)和呼叫时间字段(日期和时间)。联系时间可以包括与执行呼叫的日期和时间相关的信息。

短信历史数据可以包括名称字段、分配给相应名称的联系字段、短信类型字段(传入/传出)和短信时间字段(日期和时间)。短信时间可以包括与接收或发送短信消息时的日期和时间相关的信息。

从移动设备3接收的联系历史数据可以是预定时间段内的数据。例如，可以从移动设备3接收从当前时间点开始的预定时间段内记录的联系历史数据。另外，用户可以设置或改变从移动设备3接收的联系历史数据的时间范围。

数据生成模块150使用接收到的联系历史数据生成并存储用于语音识别的联系历史数据库(1500)。

当通信模块120接收到联系历史数据时，如图9所示，数据生成模块150可以通过DP过程生成用于语音识别的联系历史数据库(142：142a和142b)。

例如，数据生成模块150可以通过使用G2P技术生成与接收的联系历史数据的字符串相对应的发音字符串。数据生成模块150可以生成与呼叫历史数据的名称字段中的数据相对应的发音字符串，并将作为生成的发音字符串的集合的用于语音识别的呼叫历史数据库142a存储在存储装置140中。另外，生成的发音字符串可以以树状结构存储以生成词汇树。

另外，数据生成模块150可以生成与短信历史数据的名称字段中的数据相对应的发音字符串，并将作为生成的发音字符串的集合的用于语音识别的短信历史数据库142b存储在存储装置140中。另外，生成的发音字符串可以以树状结构存储以生成词汇树。

用于语音识别的联系历史数据库142可以仅包括名称字段和与名称字段相对应的发音字符串的数据，或者通过将发音字符串字段添加到从移动设备3接收的呼叫历史数据或短信历史数据中而构成。可选地，用于语音识别的联系历史数据库142可以仅包括呼叫历史数据或短信历史数据的一部分字段。

尽管为了解释的方便性，在描述了从移动设备3接收联系人数据并生成用于语音识别的联系人数据库的操作之后描述了从移动设备3接收联系历史数据并生成用于语音识别的联系历史数据库的操作，然而根据本公开的车辆及其控制方法的实施例不限于此。联系人数据和联系历史数据两者可以一起接收，或者可以首先接收联系历史数据。另外，数据生成的顺序不受限制。

此外，除了存储用于语音识别的数据库141和142之外，存储装置140还可以存储从移动设备3接收的联系人数据和联系历史数据本身。

此外，可以为每个移动设备3存储用于语音识别的数据库141和142、联系人数据和联系历史数据。也就是说，可以将上述数据分配到被配置为识别移动设备3的、诸如媒体访问控制(MAC)地址等的标识符并被存储。在这种情况下，当同一移动设备3以后再次被连接时，可以省略用于语音识别的数据下载过程或数据生成过程的全部或部分过程。

图10是示出根据本公开的示例性实施例的在控制车辆的方法中当输入用户的语音命令时确定接收者的操作的流程图。

参照图10，当输入用于呼叫或发短信的语音命令(操作2100中为“是”)时，麦克风110可以输出与输入的语音命令相对应的音频信号，并且语音识别模块130可以从音频信号中检测语音部分并生成语音信号。

语音识别模块130可以从语音信号中提取特征向量(2200)，并通过将提取的特征向量与先前存储的模式进行比较来执行语音识别。

首先，语音识别模块130可以从语音信号中获得与联系时间相关的附加信息(2300)。

例如，当输入用户语音命令为“呼叫昨天通话的洪杰东”时，可能会获得[呼叫类型：呼入/呼出，时间：昨天]的附加信息。可选地，当输入的用户语音命令为“呼叫今天早上错过电话的洪杰东”时，可以获得[呼叫类型：未接，时间：今天早上]的附加信息。可选地，当输入的用户语音命令为“呼叫今天给我发短信的洪杰东”时，可以获得[短信类型：传入，时间：今天]的附加信息。

语音识别模块130可以基于获得附加信息的结果执行第一搜索(2400)。

第一搜索包括在第一语音识别数据库中搜索与语音信号中包括的接收者信息相对应的数据。此处，第一语音识别数据库包括用于语音识别的联系历史数据库。

语音识别模块130可以通过将从语音信号中提取的特征向量与存储在第一语音识别数据库中的发音字符串进行比较来搜索与语音信号中包括的接收者信息相对应的名称。在这种情况下，包括大于或等于参考值的相似度的数据可以被确定为与接收者信息匹配的数据。

当从语音信号获得与联系时间相关的附加信息时，语音识别模块130可以基于与联系时间相关的附加信息执行第一搜索。例如，当与联系时间相关的附加信息是“今天”时，搜索范围可以被限制为第一语音识别数据库中联系时间为“今天”的数据，当与联系时间相关的附加信息是“昨天”时，搜索范围可以被限制为第一语音识别数据库中联系时间为“昨天”的数据。

当没有获得与联系时间相关的附加信息时，搜索范围可以不限制为预定时间段内的数据。例如，搜索范围可以被限制为第一语音识别数据库中从当前时间点开始的预定时间段内记录的数据。

可选地，当从移动设备3接收的联系人数据是从当前时间点开始的预定时间段内记录的数据时，可以在整个第一语音识别数据库中执行第一搜索，而不限制搜索范围。

语音识别模块130执行第二搜索(2500)。

第二搜索包括在第二语音识别数据库中搜索与语音信号中包括的接收者信息相对应的数据。此处，第二语音识别数据库包括用于语音识别的联系人数据库。

语音识别模块130可以通过将从语音信号中提取的特征向量与存储在第二语音识别数据库中的发音字符串进行比较来搜索与语音信号中包括的接收者信息相对应的名称。在这种情况下，包括具有大于或等于参考值的相似度的数据可以被确定为与接收者信息匹配的数据。

控制器160可基于第一搜索的结果和第二搜索的结果来确定最终接收者或生成接收者候选列表(2600)。

例如，当第一搜索的结果和第二搜索的结果中均包括的数据为单个数据时，控制器160可以将相应的数据确定为最终接收者。然而，当第一搜索的结果和第二搜索的结果两者中均包括的数据为两个或更多个数据时，控制器160可以生成包括两个或更多个数据的接收者候选列表。

可选地，当不存在包括在第一搜索的结果和第二搜索的结果中的数据时，控制器160可以生成包括第一搜索的结果与第二搜索的结果的接收者候选列表。

然而，当包括在接收者候选列表中的数据数量超过参考数量N(N是大于或等于2的整数)时，接收者候选列表仅可包括基于相似度的前N个数据。

当确定了最终接收者时，控制器160可以呼叫或发送短信到分配

给最终接收者的存储的电话号码。当生成了接收者候选列表时，控制5器160可以通过显示器180或扬声器170输出接收者候选列表。

根据本公开的示例性实施例，可以通过考虑联系历史数据以及联系人数据来确定最终接收者，因此可以优先考虑最近联系的联系人，并且可以降低呼叫非预期接收者的可能性。在下文中，将描述详细的示例。

0图11、图12和图13是示出根据本公开的示例性实施例的在控制车

辆的方法中当输入用户的语音命令时确定接收者的过程的示例的示图。图14是示出由图13的示例输出的接收者候选列表的示例的示图。

参照图11，当用户向麦克风110输入“呼叫洪杰东”的语音命令时，麦克风110输出与输入的语音命令相对应的音频信号。

5从麦克风110输出的音频信号被输入到语音识别模块130，语音识

别模块120从音频信号中提取语音部分。

语音识别模块130从与语音部分相对应的语音信号中提取特征向量，并获得与联系时间相关的附加信息。在该示例中，不存在包括在语音命令中的附加信息。

0在不存在附加信息的状态下，语音识别模块130执行第一搜索。

也就是说，语音识别模块130可以在用于语音识别的联系历史数据库142中搜索与从语音信号中提取的特征向量相匹配的数据，即，与语音命令中包括的接收者信息相对应的数据。

在该示例中，用于语音识别的联系历史数据库142中存在“洪杰5东”。也就是说，最近通话或发送或接收短信的人中存在“洪杰东”。

因此，“洪杰东”可以通过第一搜索被搜索到。

语音识别模块130执行第二搜索。也就是说，语音识别模块130可以在用于语音识别的联系人数据库中141搜索与从语音信号中提取的特征向量相匹配的数据，即，与语音命令中包括的接收者信息相匹配的数据。

在该示例中，用于语音识别的联系人数据库141中存在“洪杰东”和“洪杰道”。当用户输入语音命令时，语音识别性能可能因车辆中的噪声等而下降，或者相似的名称可能不容易相互准确区分。在该示例中，作为与特征向量的比较的结果，包括具有大于或等于参考值的相似度的所有数据可以被包括在搜索结果中。因此，“洪杰东”和“洪杰道”可以通过第二搜索被搜索到。

第一搜索的结果中包括“洪杰东”，第二搜索的结果中包括“洪杰东”和“洪杰道”。也就是说，第一搜索和第二搜索两者的结果中都包括的数据是“洪杰东”。因此，控制器160可以将“洪杰东”确定为最终接收者，输出将呼叫“洪杰东”的引导消息并呼叫“洪杰东”。

当仅搜索联系人数据而不考虑联系历史数据时，可以呼叫“洪杰道”，或输出确认是否呼叫“洪杰东”或“洪杰道”的消息。然而，通过在考虑联系历史数据的情况下对最近的联系人进行优先级排序，可以降低呼叫非预期接收者的风险，而不需要用户的额外输入。

参照图12，当用户向麦克风110输入“呼叫昨天通话的“洪杰东”的语音命令时，麦克风110输出与输入的语音命令相对应的音频信号。

从麦克风110输出的音频信号被输入到语音识别模块130，语音识别模块120从音频信号中提取语音部分。

语音识别模块130从与语音部分相对应的语音信号中提取特征向量，并获得与联系时间相关的附加信息。在该示例中，可以获得[联系类型：通话，联系时间：昨天]的附加信息。

语音识别模块130基于附加信息执行第一搜索。语音识别模块130可以将搜索范围限定为用于语音识别的呼叫历史数据库142a中昨天进行通话的那些人，并且在限定的搜索范围内搜索与语音命令中包括的接收者信息相对应的数据。

在该示例中，用于语音识别的呼叫历史数据库142a中存在“洪杰东”。也就是说，“洪杰东”存在于昨天进行通话的那些人中。因此，“洪杰东”可以通过第一搜索被搜索到。

语音识别模块130执行第二搜索。也就是说，语音识别模块130可以在用于语音识别的联系人数据库141中搜索与从语音信号中提取的特征向量匹配的数据，即，与语音命令中包括的接收者信息匹配的数据。

在该示例中，用于语音识别的联系人数据库141中存在“洪杰东和“洪杰道”。作为与特征向量的比较结果，具有大于或等于参考值的相似度的所有数据都可以包括在搜索结果中。因此，“洪杰东”和“洪杰道”可以通过第二搜索被搜索到。

第一搜索的结果中包括“洪杰东”，第二搜索的结果中包括“洪杰东”和“洪杰道”。也就是说，第一搜索和第二搜索的结果两者中都包括的数据是“洪杰东”。因此，控制器160可以将“洪杰东”确定为最终接收者，输出将呼叫“洪杰东”的引导消息并呼叫“洪杰东”。

参照图13，当用户向麦克风110输入“呼叫洪杰东”的语音命令时，麦克风110输出与输入的语音命令相对应的音频信号。

从麦克风110输出的音频信号被输入到语音识别模块130，语音识别模块130从音频信号中提取语音部分。

在不存在附加信息的状态下，语音识别模块130执行第一搜索。在该示例中，“洪杰东”和“洪吉东”存在于用于语音识别的联系历史数据库142中。也就是说，“洪杰东”和“洪吉东”都存在于最近通话的那些人中。因此，“洪杰东和“洪吉东”都可以通过第一搜索被搜索到。

在该示例中，用于语音识别的联系人数据库141中存在“洪杰东”以及与“洪杰东”相似的“洪吉东”和“洪杰道”。在该示例中，作为与特征向量的比较的结果，具有大于或等于参考值的相似度的所有数据都可以包括在搜索结果中。因此，“洪杰东”、“洪吉东”和“洪杰道”全部都可以通过第二搜索被搜索到。

第一搜索的结果中包括“洪杰东”和“洪吉东”，第二搜索的结果中包括“洪吉东”、“洪杰道”和“洪杰东”。也就是说，第一搜索和第二搜索的结果中都包括的数据是“洪杰东”和“洪吉东”。因此，控制器160可以生成包括“洪杰东”和“洪吉东”的接收者候选列表，而不确定最终接收者。

如图14所示，生成的接收者候选列表可以显示在显示器180上。可选地，生成的接收者候选列表可以通过扬声器170以听觉方式输出。

可选地，根据第一搜索和第二搜索的结果总数，可以通过包括第一搜索和第二搜索的所有结果来生成接收者候选列表。例如，在将第一搜索和第二搜索的结果基于相似性显示前三条数据的示例中，“洪杰东”、“洪吉东”和“洪杰道”全部都可以包括在接收者候选列表中。

可选地，即使存在包括在第一搜索和第二搜索两者的结果中的两个或更多个数据，也可以计算每条数据的分数，并根据计算的分数确定最终接收者。

例如，随着最近联系次数的增加，可以赋予更高的分数。另外，随着在与当前时间相同或相似的时间段内进行联系的次数增加，可以赋予更高的分数。

在该示例中，即使“洪杰东”和“洪吉东”都存在于最近的联系历史中，但是当用户最近更频繁地呼叫“洪杰东”，或者当用户在与当前时间相同的时间段内更频繁地呼叫“洪杰道”时，可以基于根据上述标准计算的分数将“洪杰东”确定为最终接收者。

“可以将“洪杰东”确定为最终接收者，并且可以输出将呼叫“洪杰东”的引导消息并呼叫“洪杰东”。

从上文可以明显看出，根据本公开的示例性实施例，车辆及其控制方法可以通过同时考虑呼叫历史数据、短信历史数据以及联系人数据，识别用户语音来明确呼叫或短信的接收者，从而防止呼叫或发短信给非预期的接收者。

在本公开的各种示例性实施例中，上述每个操作可以由控制设备执行，并且控制设备可以由多个控制设备或集成的单个控制设备来配置。

在本公开的各种示例性实施例中，本公开的范围包括软件或机器可运行命令(例如，操作系统、应用程序、硬件、程序等)以及非暂时性计算机可读介质，该软件或机器可运行命令便于根据本公开的各种实施例的方法的操作在装置或计算机上运行，该非暂时性计算机可读介质包括存储在其上并在装置或计算机上可运行的此类软件或命令。

在本公开的各种示例性实施例中，控制设备可以以硬件或软件的形式实施，或者可以以硬件和软件的组合来实施。

此外，说明书中包括的“单元”、“模块”等术语是指用于处理至少一个功能或操作的单元，其可以通过硬件、软件或者软件和硬件的组合来实施。

为了方便说明并准确限定所附权利要求书，术语“上”、“下”、“内”、“外”、“上部”、“下部”、“向上”、“向下”、“前”、“后”、“背面”、“内部”、“外部”、“向内”、“向外”、“内侧”、“外侧”、“里面”、“外面”、“前方”和“后方”用于参照示例性实施例的特征在附图中示出的位置来描述这些特征。将进一步理解的是，术语“连接”或其派生词既指直接连接也指间接连接。

本公开的特定示例性实施例的前述描述为了说明和描述的目的而被呈现。前述描述并不旨在穷举本公开或将本公开限制于公开的精确形式，并且显然可以根据上述教导进行许多修改和变型。所选择和描述的示例性实施例是为了解释本公开的某些原理及其实际应用，以使本领域技术人员能实施和利用本公开的各种示例性实施例以及其各种替换方案和修改方案。本公开的范围旨在由所附权利要求及其等同方案限定。

Claims

1.一种车辆，包括：

麦克风，用户的语音命令被输入到所述麦克风；

通信模块，从移动设备接收联系人数据和联系历史数据；

至少一个存储器，存储基于从所述移动设备接收的联系历史数据而获得的第一语音识别数据库和基于从所述移动设备接收的联系人数据而获得的第二语音识别数据库；以及

至少一个处理器，可操作地连接到所述麦克风、所述通信模块和所述至少一个存储器，并且当用于呼叫或发短信的语音命令被输入到所述麦克风时，基于所述语音命令中包括的接收者信息、存储的第一语音识别数据库以及存储的第二语音识别数据库来确定最终接收者或者生成接收者候选列表。

2.根据权利要求1所述的车辆，其中，所述至少一个处理器：执行第一搜索，所述第一搜索为在所述第一语音识别数据库中搜索与所述语音命令中包括的接收者信息相对应的数据，并且

执行第二搜索，所述第二搜索为在所述第二语音识别数据库中搜索与所述语音命令中包括的接收者信息相对应的数据。

3.根据权利要求2所述的车辆，其中，所述至少一个处理器基于所述第一搜索的结果和所述第二搜索的结果来确定所述最终接收者或生成所述接收者候选列表。

4.根据权利要求2所述的车辆，其中，当所述第一搜索的结果和所述第二搜索的结果中均包括的数据为单个数据时，所述至少一个处理器将所述单个数据确定为所述最终接收者。

5.根据权利要求2所述的车辆，其中，当所述第一搜索的结果和所述第二搜索的结果中均包括的数据为两个或更多个数据时，所述至少一个处理器生成包括所述两个或更多个数据的接收者候选列表。

6.根据权利要求2所述的车辆，其中，当不存在包括在所述第一

搜索的结果和所述第二搜索的结果中的数据时，所述至少一个处理器生成包括所述第一搜索的结果和所述第二搜索的结果的所述接收者候选列表。

7.根据权利要求2所述的车辆，其中，所述至少一个处理器将所述第一搜索的对象限制为所述第一语音识别数据库中从当前时间点开始的预定时间段内记录的数据。

8.根据权利要求2所述的车辆，其中，所述至少一个处理器从所述用户的语音命令获得与联系时间相关的附加信息，并基于获得的附加信息执行所述第一搜索。

9.根据权利要求1所述的车辆，其中，所述至少一个处理器呼叫或发短信给确定的最终接收者。

10.根据权利要求1所述的车辆，进一步包括：

显示器；以及

扬声器，

其中，所述至少一个处理器可操作地连接到所述显示器和所述扬声器并且通过所述显示器或所述扬声器输出生成的接收者候选列表。

11.一种控制车辆的方法，所述方法包括：

从移动设备接收联系人数据和联系历史数据；

基于从所述移动设备接收的联系历史数据生成并存储第一语音识别数据库；

基于从所述移动设备接收的联系人数据生成并存储第二语音识别数据库；以及

当用于呼叫或发短信的语音命令被输入到麦克风时，由至少一个处理器基于所述语音命令中包括的接收者信息、存储的第一语音识别数据库和存储的第二语音识别数据库来确定最终接收者或由所述至少一个处理器生成接收者候选列表。

12.根据权利要求11所述的方法，其中，确定所述最终接收者或生成所述接收者候选列表包括：

执行第一搜索，所述第一搜索为在所述第一语音识别数据库中搜索与所述语音命令中包括的接收者信息相对应的数据，以及

13.根据权利要求12所述的方法，其中，确定所述最终接收者或生成所述接收者候选列表包括基于所述第一搜索的结果和所述第二搜索的结果来确定所述最终接收者或生成所述接收者候选列表。

14.根据权利要求12所述的方法，其中，当所述第一搜索的结果和所述第二搜索的结果中均包括的数据为单个数据时，确定所述最终接收者或生成所述接收者候选列表包括将所述单个数据确定为所述最终接收者。

15.根据权利要求12所述的方法，其中，当所述第一搜索的结果和所述第二搜索的结果中均包括的数据为两个或更多个数据时，确定所述最终接收者或生成所述接收者候选列表包括生成包括所述两个或更多个数据的接收者候选列表。

16.根据权利要求12所述的方法，其中，当不存在包括在所述第一搜索的结果和所述第二搜索的结果中的数据时，确定所述最终接收者或生成所述接收者候选列表包括生成包括所述第一搜索的结果和所述第二搜索的结果的接收者候选列表。

17.根据权利要求12所述的方法，其中，将所述第一搜索的对象限制在所述第一语音识别数据库中从当前时间点开始的预定时间段内记录的数据。

18.根据权利要求12所述的方法，其中，确定所述最终接收者或生成所述接收者候选列表包括从用户的语音命令获得与联系时间相关的附加信息，并且基于获得的附加信息执行所述第一搜索。

19.根据权利要求11所述的方法，进一步包括由所述至少一个处理器呼叫或发短信给确定的最终接收者。

20.根据权利要求11所述的方法，进一步包括由可操作地连接到显示器或扬声器的所述至少一个处理器通过设置在所述车辆中的所述显示器或所述扬声器输出生成的接收者候选列表。