CN106469556A - 语音识别装置、具有语音识别装置的车辆、控制车辆方法 - Google Patents
语音识别装置、具有语音识别装置的车辆、控制车辆方法 Download PDFInfo
- Publication number
- CN106469556A CN106469556A CN201510900180.3A CN201510900180A CN106469556A CN 106469556 A CN106469556 A CN 106469556A CN 201510900180 A CN201510900180 A CN 201510900180A CN 106469556 A CN106469556 A CN 106469556A
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- result
- speech recognition
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004891 communication Methods 0.000 claims abstract description 38
- 230000008569 process Effects 0.000 claims abstract description 28
- 230000004913 activation Effects 0.000 claims description 11
- 235000013399 edible fruits Nutrition 0.000 claims description 7
- 230000003213 activating effect Effects 0.000 claims description 3
- 230000000052 comparative effect Effects 0.000 abstract description 7
- 238000004378 air conditioning Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3664—Details of the user input interface, e.g. buttons, knobs or sliders, including those provided on a touch screen; remote controllers; input using gestures
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/3822—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving specially adapted for use in vehicles
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Mechanical Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Navigation (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
Abstract
本文中公开了一种语音识别装置、具有语音识别装置的车辆、以及控制车辆的方法。根据一个方面,语音识别装置包括:语音输入单元,被配置为接收来自用户语音命令;通信单元,被配置为接收位于用户附近的至少一个用户终端获得的语音识别的处理结果;以及控制器,被配置为将从语音输入单元接收的语音命令获得的语音识别的处理结果与至少一个用户终端获得的语音识别的处理结果进行比较,因此根据比较结果处理语音命令。
Description
技术领域
本公开的方式涉及通过语音识别模块处理用户的语音命令的语音识别装置,以及包括语音识别装置的车辆。
背景技术
该部分中的陈述仅是提供与本公开有关的背景信息,并且可能不构成现有技术。
近来,很多车辆都包括影音导航(AVN)终端。通常,除了提供有关到目的地的路线的信息以外,AVN终端显示用于控制安装在车辆中的各种设备的控制画面或者执行能够在AVN终端上执行的附加功能的画面。
用户能够通过具有触摸屏的显示器或飞梭轮控制器操纵AVN终端以控制车辆中的各种设备,或者能够将语音命令输入至语音识别模块以控制车辆中各种设备。然而,当车辆中存在多个乘客时,由于其他乘客的语音很难准确地识别用户在封闭的狭小空间中发出的语音。因此,对提高车辆中语音识别准确性的技术进行研究。
发明内容
本公开的其他方面将部分地在下面的描述中进行阐述并且部分地从该描述中是显而易见的或者可以通过对本公开的实践获悉。
根据本公开的一个方面,语音识别装置包括:语音输入单元,被配置为接收来自用户的语音命令;通信单元,被配置为接收针对位于用户附近的至少一个用户终端获得的语音识别的处理结果;以及控制器,被配置为将针对从语音输入单元接收的语音命令获得的语音识别的处理结果针对该至少一个用户终端获得的语音识别的处理结果进行比较,并且根据比较结果处理语音命令。
当接收来自用户的语音命令时,通信单元可以请求激活位于用户附近的至少一个用户终端的语音识别模块。
控制器可以将从语音输入单元接收的语音命令获得的语音波形与至少一个用户终端获得的语音波形进行比较,并且将从语音输入单元接收的语音命令获得的语音识别结果与从至少一个用户终端获得的语音识别结果进行比较,从而根据比较结果处理语音命令。
如果控制器确定从语音输入单元接收的语音命令获得的语音波形与从至少一个用户终端获得的语音波形不同,并且从语音输入单元接收的语音命令获得的语音识别结果的数量为一个,则控制器可以根据从语音命令获得的语音识别结果控制车辆中的设备。
如果控制器确定从语音输入单元接收的语音命令获得的语音波形与从至少一个用户终端获得的语音波形不同,从语音输入单元接收的语音命令获得的语音识别结果的数量为一个,并且所获得的语音识别结果与至少一个用户终端获得的语音识别结果相同,控制器可以请求用户再次输入语音命令。
如果控制器确定从语音输入单元接收的语音命令获得的语音波形与至少一个用户终端获得的语音波形不同,并且从语音输入单元接收的语音命令获得多个语音识别结果,控制器可以从多个语音识别结果中排除至少一个用户终端获得的语音识别结果。
控制器可以控制车辆中的设备以提供语音识别结果列表,在语音识别结果列表中,从多个语音识别结果中排除至少一个用户终端获得的语音识别结果。
根据本公开的另一方面,一种车辆,包括:语音识别模块,被配置为识别用户发出的语音;通信单元,被配置为接收针对位于车辆附近的至少一个用户终端获得的语音识别的处理结果;以及控制器,被配置为将针对语音识别模块获得的语音识别的处理结果与针对用户终端获得的语音识别的处理结果进行比较,并且根据比较结果控制车辆中的设备。
当激活语音识别模块时,通信单元可以请求激活位于用户附近的至少一个用户终端的语音识别模块。
控制器被可以将用户发出的语音的波形与至少一个用户终端获得的语音波形进行比较,将语音识别模块获得的语音识别结果与至少一个用户终端获得的语音识别结果进行比较,并且根据比较结果控制车辆中的设备。
如果控制器确定从用户发出的语音的波形与至少一个用户终端获得的语音波形不同,并且语音识别模块获得的语音识别结果的数量为一个,控制器可以根据语音识别模块获得的语音识别结果控制车辆中的设备。
如果控制器确定从用户发出的语音的波形与至少一个用户终端获得的语音波形不同,并且语音输入模块获得的语音识别结果的数量为一个,并且获得的语音识别结果与至少一个用户终端获得的语音识别结果相同,控制器可以请求用户再次输入语音。
如果控制器确定从用户发出的语音的波形与至少一个用户终端获得的语音波形不同,并且语音识别模块获得多个语音识别结果,控制控制器可以从多个语音识别结果中排除至少一个用户终端获得的语音识别结果。
控制器可以控制车辆中的设备以提供语音识别结果列表,在语音识别结果列表中,从多个语音识别结果中排除至少一个用户终端获得的语音识别结果。
根据本公开的另一方面,一种控制车辆的方法,包括:识别从用户发出的语音;接收由位于车辆附近的至少一个用户终端获得的语音识别的处理结果;以及将语音识别模块获得的语音识别的处理结果与至少一个用户终端获得的语音识别的处理结果进行比较,并且根据比较结果控制车辆中的设备。
接收语音识别的处理结果可以进一步包括:当激活语音识别模块时,要求激活位于用户附近的至少一个用户终端的语音识别模块。
控制车辆中的设备可以包括:将从用户发出的语音的波形与至少一个用户终端获得的语音波形进行比较,将语音识别模块获得的语音识别结果与至少一个用户终端获得的语音识别结果进行比较,并且根据比较结果控制车辆中的设备。
控制车辆中的设备可以包括:如果确定从用户发出的语音的波形与至少一个用户终端获得的语音波形不同,并且语音识别模块获得的语音识别结果的数量为一个,根据语音识别模块获得的语音识别结果控制车辆中的设备。
控制车辆中的设备可以包括:如果确定从用户发出的语音的波形与至少一个用户终端的获得的语音波形不同,语音识别模块获得的语音识别的结果的数量为一个,并且所获得的语音识别的结果与至少一个用户终端获得的语音识别结果相同,要求用户再次输入语音。
控制车辆中的设备可以包括:如果确定从用户发出的语音的波形与至少一个用户终端获得的语音波形不同,并且由语音识别模块获得多个语音识别结果,从多个语音识别结果中排除至少一个用户终端获得的语音识别结果。
控制车辆中的设备可以包括控制车辆中的设备以提供语音识别结果列表,在语音识别结果列表中,从多个语音识别结果中排除至少一个用户终端获得的语音识别结果。
从本文所提供的描述进一步的应用领域将变得显而易见。应当理解描述和具体实例旨在仅仅用于举例说明,而并非旨在限制本公开的范围。
附图说明
从以下结合附图对方式的描述中,本公开内容的这些方面和/或其他方面将变得更加显而易见并且更易于理解,附图中:
图1是示出车辆的外观的立体图;
图2示出了车辆的内部;
图3是识别多个用户的语音以处理语音命令的车辆的控制框图;
图4是示出了车辆、通过车辆的通信单元连接至车辆的语音识别服务器、以及多个用户终端的框图;
图5是示出了车辆识别多个用户的语音以处理语音命令的方法的流程图;
图6示出了多个用户坐在车辆内的座椅中的情况;
图7是示出了当存在多个用户时语音识别装置处理用户的语音命令的方法的流程图;
图8是示出了语音识别装置基于多个终端获得的处理结果识别用户的语音命令并且处理用户的语音命令的方法的流程图;
图9示出了通过显示单元请求用户输入语音命令的画面;以及
图10示出了根据对语音命令的处理结果显示到目的地的路线的画面。
本文中描述的附图是仅出于说明性目的并不旨在以任何方式限制本公开的范围。
具体实施方式
现将详细参考本公开的方式,这些方式的实例在附图中示出,其中,贯穿全文,相同的参考标号指代相同的元件。
图1是示出车辆外观的立体图,图2示出了车辆的内部,以及图3是识别多个用户的语音以处理语音命令的车辆的控制框图。在下文中,为了避免重复描述将一起参考图1、图2、以及图3。
参考图1,车辆1可以包括构成车辆1的外观的车身80,以及使车辆1移动的多个车轮93和94。车身80可以包括引擎罩81、多个前挡泥板82、多个车门84、后备箱盖85、以及多个侧围板86。
车身80可以包括前窗87,前窗安装在车身80的前部以提供车辆1的前方视野;多个侧窗88,以提供车辆1的侧面的视野;多个侧视镜91和92,以提供车辆1的后方和侧面的视野;以及后窗90,安装在车身80的后部中以提供车辆1的后方的视野。在下文中,将详细地描述车辆1的内部。
车辆1可以包括空调。空调是自动地或者根据用户的控制命令控制空调环境的设备,空调环境包括车辆1的室内/室外的环境条件、进气/排气、空气循环、以及空调状态。例如,车辆1可以包括既能够执行加热又能够执行制冷的空调以通过排气孔153排放加热的或冷却的空气从而控制车辆1的内部温度。
同时,可以在车辆1内部设置语音识别装置100。语音识别装置100可以识别接收来自用户的语音命令,并且执行与识别结果对应的处理。此外,除了为用户提供有关去往目的地的信息的导航功能之外,语音识别装置100可以提供音频以及视频功能。
语音识别装置100可以通过显示单元101选择性地显示音频画面、视频画面以及导航画面中的至少一个,并且可以显示与车辆1的控制相关的各种控制画面或者与能够在AVN终端100上执行的附加功能有关的画面。根据一种方式,语音识别装置100可以是影音导航(AVN)终端。然而,语音识别装置100不限于AVN终端,并且可以是能够识别用户的语音命令并且执行与用户的语音命令对应的处理的任何设备。语音识别装置100还可以称为导航终端,或者本领域中的技术人员通常使用的另一个名字。根据一种方式,语音识别装置100可以与上述空调交互以通过显示单元101显示与空调的控制有关的各种控制画面。另外,语音识别装置100可以控制空调的运行状态以调整车辆1内部的空调环境。此外,尽管不限于此,语音识别装置100可以通过显示单元101显示去往目的地的路线的地图。
同时,显示单元101可以设置在中央仪表盘11中,中央仪表盘11是仪表板10的中央区域。根据一种方式,显示单元101可以是液晶显示器(LCD)、发光二极管(LED)显示器、等离子体显示板(PDP)显示器、有机发光二极管(OLED)显示器,或阴极射线管(CRT)显示器,但不限于这些。
在车辆1的内部中,可以设置扬声器143以输出声音。因此,车辆1可以通过扬声器143输出执行音频功能、视频功能、导航功能、以及其他附加功能所需的声音。例如,车辆1可以通过扬声器143为驾驶员提供有关去往目的地的信息,虽然不限于此。
导航输入单元102可以位于中央仪表盘11(其是仪表板10的中央区域)中。驾驶员可以操纵导航输入单元102以输入各种控制命令或有关目的地的信息。
同时,导航输入单元102可以位于接近显示单元101,并且实现为硬键式。如果显示单元101实现为触摸屏,除了显示功能以外,显示单元101可以执行导航输入单元102的功能。
同时,中央操纵台40可以包括飞梭轮或硬件式的中央输入单元43。中央操纵台40可以设置在驾驶员座椅21与乘客座椅22之间,并且包括齿轮变速杆41和托盘42。中央输入单元43可以执行导航输入单元102的全部或部分功能。
此外,在车辆1的内部可以设置集群144。集群144还称为仪表盘。在下面的描述中,为了说明方便,集群144将称为“集群”。集群144可以显示车辆1的行驶速度、发动机的每分钟转数(RPM)、油量等。此外,集群144可以与语音识别装置100交互以显示行驶路线,并且还显示道路的环境信息,诸如,限速信息。
此外,参考图3,车辆1可以包括输入单元110、语音输入单元120、通信单元130、以及控制器140。本文中,通信单元130和控制器140可以集成到安装于车辆1中的至少一个片上系统(System On Chip,SOC)中,并且可以由处理器操作。然而,如果车辆1包括多个SOC,通信单元130和控制器140可以集成到多个SOC中。
输入单元110可以实现为导航输入单元102和中央输入单元43。如果显示单元101实现为触摸屏,显示单元110可以执行输入单元110的功能。输入单元110可以接收来自驾驶员或乘客的各种控制命令(在下文中,驾驶员或乘客将称为用户)。例如,输入单元110可以接收执行语音识别功能的命令,以及执行车辆1中的特定设备的功能的命令,诸如,音乐查找命令、目的地查找命令等。
语音输入单元120可以接收用户的语音命令。例如,语音输入单元120可以是麦克风。语音输入单元120可以通过麦克风接收驾驶员发出的语音命令,并且将语音命令转换成电信号。
根据一种方式,如在图2中示出的,语音输入单元188可以安装在顶蓬13上。然而,语音输入单元188可以安装在仪表板10上、方向盘12上或者能够有效接收驾驶用户的语音的任何合适的位置上。
同时,车辆1可以包括通信单元130通信单元130可以通过有线/无线通信网络向外部设备发送数据/从外部设备接收数据。无线通信网络使设备能够以无线方式向另一设备发送包含数据的信号/从另一设备接收包含数据的信号。例如,无线通信网络可以包括第3代(3G)通信网络、第4代(4G)通信网络、以及蓝牙通信网络,但不限于这些。
此外,有线通信网络使设备能够以有线方式向另一设备发送包含数据的信号/从另一设备接收包含数据的信号。例如,有线通信网络可以包括外围组件互连(PCI)、PCI-express、以及通用串行总线(USB),但不限于这些。
参考图4,通信单元130可以通过通信网络向语音识别服务器300发送用户的语音命令或者对用户的语音命令进行分析的结果,并且从语音识别服务器300接收对用户的语音命令进行处理的结果或分析结果。例如,通信单元130可以将所接收的语音命令发送至语音识别服务器300,或者将对所接收的语音命令进行分析的结果(例如,波形、现象顺序等)发送至语音识别服务器300。然后,语音识别服务器300可以基于分析结果识别用户的语音命令,并且将语音识别结果发送至通信单元130。
此外,通信单元130可以通过通信网络向用户终端发送数据/从用户终端接收数据。本文中,用户终端可以是具有通信模块以通过通信网络向外部终端发送数据/从外部终端接收数据并且能够通过处理器处理数据的任何终端。此外,用户终端可以是具有麦克风以接收语音命令并且能够识别且处理语音命令的任何终端。根据一种方式,用户终端可以是膝上计算机、台式计算机、平板个人电脑(PC)、移动终端(诸如,智能手机)以及个人数字助理(PDA),或者能够戴在用户的身体部分上的可佩带的终端,诸如,可佩带的手表和可佩带的眼镜,但不限于这些。
如在图4中示出的,通信单元130可以向第一用户终端201至第N用户终端202发送各种数据/从第一用户终端201至第N用户终端202接收各种数据。通信单元130可以从个人用户终端201至202接收语音识别的处理结果。语音识别的处理结果可以包括由安装在语音识别服务器300和用户终端201至202中的语音识别模块对用户的语音进行分析的结果。例如,语音识别的处理结果可以包括由用户终端201至202的输入单元接收的用户的语音的波形、识别结果等,但不限于这些。
控制器140可以是执行各种操作和控制过程的处理器,诸如,安装在语音识别装置100中的处理器,或者可以是相关技术中众所周知的各种处理器之一。
此外,控制器140可以控制车辆1的总体操作。更具体地,控制器140可以控制安装在车辆1中的所有部件(例如,显示单元101和扬声器143)以及安装在语音识别装置100中的各种模块(诸如,语音识别模块)的操作。控制器140可以生成用于控制车辆1的组件的控制信号以控制独立部件的操作。
例如,控制器140可以使用控制信号来控制空调的操作或控制显示单元101的操作以显示各种信息,但不限于这些。此外,控制器140可以使用控制信号来控制各种显示设备(诸如,显示单元101)或控制扬声器143以为用户提供各种信息。
此外,控制器140可以将从由语音输入单元120接收的用户的语音命令中获得的语音处理结果与由至少一个用户终端获得的语音处理结果进行比较以处理用户的语音命令。
例如,控制器140可以通过通信单元130从语音识别服务器300接收对用户的语音命令进行处理的结果,如上所述。此外,用户终端201至202可以向语音识别服务器300发送对由语音输入单元接收的用户的语音命令进行分析的结果,并且从语音识别服务器300接收对用户的语音命令进行处理的结果。然后,用户终端201至202可以通过通信网络将对用户的语音命令进行处理的结果发送至通信单元130。
因此,控制器140可以将从语音输入单元120接收的语音命令获得的语音波形与至少一个用户终端获得的语音波形进行比较,并且将从语音输入单元120接收的语音命令获得的语音识别结果与至少一个用户终端获得的语音识别结果进行比较,从而,根据比较结果处理用户的语音命令。
例如,如果控制器140确定从语音输入单元120接收的用户的语音命令获得的语音波形与至少一个用户终端获得的语音波形相似,控制器140可以确定用户的语音命令被输入到了用户周围存在的用户终端。
因此,控制器140可以确定虽然该用户周围存在的其他用户的语音相当于噪声,但这些语音对语音识别没有影响。因此,控制器140可以控制车辆1中的设备以执行与从语音输入单元120接收的语音命令中获得的语音识别结果对应的处理。例如,如果获得的语音识别的结果的数量是一个,控制器140可以控制车辆1中的设备以执行与语音识别结果对应的服务。根据一种方式,如果确定语音识别结果是用户执行目的地搜索服务,则控制器140可以控制导航模块以在显示单元101上显示目的地搜索画面。
根据另一种方式,如果获得多个语音识别结果,则控制器140可以在显示单元101上显示包括多个语音识别结果的语音识别结果列表,以便允许用户在多个语音识别结果中选择一个。例如,如果确定语音识别结果是用户说出“音乐”,控制器140可以控制显示单元101显示画面用于允许用户在打开收音机的服务、打开CD播放机的服务、以及执行存储在存储器中的音乐文件的服务中选择一个服务。
同时,如果控制器140确定从语音输入单元120接收的语音命令中获得的语音波形的形状不同于至少一个用户终端获得的语音波形的形状,则控制器140可以确定其他用户的语音或另一声源充当噪声从而引起识别语音命令的问题。因此,控制器140可以对语音识别结果执行后处理,从而更准确地识别用户的语音命令。
当控制器140确定获得的语音波形的形状以预定水平或更高水平彼此相同时,则控制器140可以确定语音波形彼此相似。由于语音在被输入到语音输入单元120或用户终端时增加了一些噪声水平,所以如果语音波形的形状以预定水平或更高的水平彼此相同,控制器140可以确定语音波形是相同的。
例如,如果控制器140确定从语音输入单元120接收的语音命令中获得的语音波形的形状与至少一个用户终端获得的语音波形的形状不同,并且从语音输入单元120接收的语音命令中获得的语音识别结果的数量为一个,则控制器140可以确定语音识别结果是否包含在用户终端获得的语音识别结果中。如果控制器140确定语音识别结果未包含在用户终端获得的语音识别结果中,控制器140可以确定语音识别结果是准确的,并且控制车辆1中的设备执行与语音识别结果对应的处理。
然而,如果控制器140确定语音识别结果包含在用户终端获得的语音识别结果中,则控制器140可以确定语音识别结果源自另一用户的话语,并且可以请求用户再次输入语音命令。即,可以确定语音输入单元120和用户终端获得相同的语音识别结果是另一人而不是用户发出的语音被输入到语音输入单元120和用户终端两者。因此,控制器140可以确定语音识别结果不是从用户的语音命令获得的结果,并且请求用户再次输入语音命令。
根据另一实例,如果控制器140确定从语音输入单元120接收的语音命令获得的语音波形的形状与至少一个用户终端获得的语音波形的形状不同,并且从语音输入单元120接收的语音命令中获得多个语音识别结果,则控制器140可以确定多个语音识别结果中的任一个是否包含在用户终端获得的语音识别结果中。然后,控制器140可以从语音识别结果列表中排除用户终端获得的语音识别结果中包含的语音识别结果。
即,虽然从两个设备(即,语音输入单元120和用户终端)获得不同的语音波形源自另一对象或外围对象产生的噪声而非用户的语音命令,但从这两个设备(即,语音输入单元120和用户终端)获得相同的语音识别结果的可能性很大。因此,控制器140可以从语音识别结果列表中删除两个设备共同包含的语音识别结果,从而更准确地提供语音识别结果列表。
本文中,语音识别结果是指与语音命令对应的服务。语音识别结果可以包括车辆1能够提供的所有服务。例如,当接收来自用户的特定语音命令时,与特定语音命令有关的所有服务都可以包括在从特定语音命令获得的语音识别结果中。根据一种方式,语音识别结果可以是目的地搜索服务、音乐搜索服务、数字多媒体广播(DMB)服务、或蓝牙服务,其可以控制车辆1中的设备中的一个或者执行安装在车辆1中的各种模块中的一个。
因此,语音识别结果列表可以是通过对用户的语音命令的分析,预计用户想要执行的服务的列表。根据一种方式,语音识别结果列表可以包括转换成空调控制画面的服务、执行目的地搜索的服务、以及执行DMB的服务。即,语音识别结果列表可以包括通过车辆1中的设备能够提供的所有的服务。控制器140可以通过显示单元101显示语音识别结果列表,并且执行用户从语音识别结果列表中选择的服务。
同时,当从语音识别结果列表中删除两个设备共同接收的语音识别结果使得语音识别结果列表仅包括一个语音识别结果时,控制器140可以在不显示语音识别结果列表的情况下执行与语音识别结果对应的服务。即,由于存在一个语音识别结果,控制器140可以在不用引导用户选择语音识别结果的情况下执行与语音识别结果对应的服务,以便提高用户的便利性。
在下文中,将描述车辆的运转流程的实例。
图5是示出了车辆识别多个用户的语音以处理语音命令的方法的流程图。
参考图5,在操作500中,车辆可以接收用户的语音命令。例如,车辆可以通过上述语音输入单元接收来自用户的语音识别的执行指令。然后,车辆可以激活语音识别模块。
这时,除了用户的语音命令之外,车辆可能通过语音输入单元接收另一感测的语音。因此,车辆需要准确地识别用户的语音命令。因此,车辆可以通过外部服务器激活位于车辆中或在车辆附近的用户终端的语音识别模块。当车辆通过语音输入单元接收用户的语音命令时,位于车辆中或在车辆附近的用户终端也可以接收从其周围感测的语音。同时,存在车辆和用户终端通过它们的语音识别模块执行语音识别的各种方法。
在操作510中,车辆可以从位于车辆中或在车辆附近的用户终端接收语音识别的处理结果。车辆可以使用所接收的语音识别的处理结果来更准确地识别用户的语音命令。
在操作520中,车辆可以将车辆获得的语音识别的处理结果与用户终端获得的语音识别的处理结果进行比较以处理用户的语音命令。例如,车辆可以将从用户的语音命令获得的语音波形的形状与用户终端获得的语音波形的形状进行比较。如果车辆确定从用户的语音命令获得的语音波形的形状与用户终端获得的语音波形的形状形似,车辆可以确定用户的语音命令被输入到用户终端以及车辆。然后,车辆可以基于车辆获得的语音识别的处理结果控制车辆中的设备以提供服务。
在下文中,将描述当车辆的语音输入单元获得的语音波形的形状与用户终端获得的语音波形的形状不同时,车辆的运行。
例如,当车辆接收用户的语音时,车辆可以确定噪声是另一人产生的或由于某个原因。在这种情况下,车辆可以使用从用户终端接收的语音处理结果以对车辆处理的语音结果执行后处理。后处理方式是指从车辆获得的语音识别结果中过滤出确定不是从用户的语音中获得的语音识别结果的处理。
如果车辆已获得一个语音识别结果,则车辆可以确定获得的语音识别结果是否包括在用户终端获得的语音识别的结果中。即,当从车辆和用户终端获得不同的语音波形时,如果车辆和用户终端都获得相同的语音识别结果,则车辆可以确定语音识别结果的结果源自外围噪声而不是用户的语音。然后,车辆可以请求车辆中的设备以请求用户再次输入语音。例如,车辆可以控制显示设备(诸如,显示器或集群)以显示请求用户再次输入语音的弹出消息,或者可以控制扬声器以输出请求用户再次输入语音的声音。
此外,如果车辆已获得一个语音识别结果,并且语音识别结果不包括在用户终端获得的语音识别结果中,则车辆可以确定获得的语音识别结果对应于从用户的语音获得的语音识别结果,并且提供与语音识别结果对应的服务。
同时,如果车辆已获得多个语音识别结果,则车辆可以从包括多个语音识别结果的语音识别结果列表中删除用户终端获得的语音识别结果。即,车辆可以确定,当从车辆和用户终端获得不同的语音波形时,从车辆和用户终端两者获得的相同的语音识别结果是噪声并且从语音识别结果列表中删除该语音识别结果。
如果即使在从语音识别结果列表中删除相同的语音识别结果之后,语音识别结果列表中仍存在多个语音识别结果,则车辆可以显示语音识别结果列表以便允许用户从语音识别结果列表中选择期望的服务。即,车辆可以将最终选择留给用户从而防止不可避免地执行了用户不想执行的服务带来的任何不便。然而,如果语音识别结果列表中留有一个语音识别结果,则车辆可以在不引导用户选择语音识别结果的情况下执行与语音识别结果对应的服务。
图6示出了多个用户坐在车辆内的座椅中的情况,以及图7是示出了当存在多个用户时语音识别装置处理用户的语音命令的方法的流程图。
参考图6,多个用户(即,用户U、第一用户U1、第二用户U2、以及第三用户U3)可以坐在车辆的座椅中。第一用户U1、第二用户U2、以及第三用户U3可拥有他们自己的终端。例如,第一用户U1可以拥有膝上型电脑D1,第二用户U2可以拥有智能电话D2,以及第三用户U3可以拥有平板电脑D3。
当用户U发出语音时,车辆中的其他用户U1、U2、以及U3也可能发出语音。由于车辆内部是封闭的狭小空间,其他用户U1、U2、和U3的语音连通用户U的语音也可能输入到车辆的语音输入单元。在这种情况下,车辆需要确定除了用户U的语音之外其他用户U1、U2、和U3的语音是噪声并且排除其他用户U1、U2、和U3的语音,以便准确地识别用户U的语音。然而,很难从其他用户U1、U2、和U3的语音中准确地识别用户U的语音。
因此,根据当前方式的车辆可以激活位于车辆中的用户终端D1、D2、以及D3的语音识别模块,并且使用通过语音识别模块获得的语音识别结果和语音波形以更准确地识别用户U的语音。在以下描述中,将描述当第一用户U1通过语音识别装置100输入语音命令时,车辆的运作流程。然而,第一用户U1、第二用户U2、第一用户终端D1、第二用户终端D2不限于上述实例。
参考图7,在操作700中,第一用户U1可以请求安装在车辆中的语音识别装置100以激活语音识别模块。例如,第一用户U1可以通过输入单元110(参考图3)将用于启动语音识别模块的命令输入至语音识别装置100。
在操作705中,语音识别装置100可以将激活请求发送至语音识别服务器300。然后,在操作710中,语音识别服务器300可以将激活请求发送至在语音识别装置100周围感测的第一用户终端D1和第二用户终端D2。然后,第一用户终端D1和第二用户终端D2可以分别激活他们的语音识别模块。
根据一种方式,语音识别装置100可以将通过定位传感器(诸如,全球定位系统(GPS)或差分全球定位系统(DGPS))估计的车辆的位置信息发送至语音识别服务器300,并且语音识别服务器300可以将激活请求发送至基于车辆的位置信息确定位于车辆上或在车辆附近的第一用户终端D1和第二用户终端D2。根据另一种方式,语音识别装置100可以基于能够识别用户终端的各种信息(诸如,通用唯一标识符(UUID)或用户终端的地址)识别通过蓝牙通信网络连接的用户终端,并且激活所识别的用户终端的语音识别模块。然而,语音识别装置100可以使用任何其他方法激活位于车辆中的至少一个用户终端的语音识别模块。
如果第一用户终端D1和第二用户终端D2的语音识别模块被激活使得第一用户终端D1和第二用户终端D2转换成其可以接收语音的状态,则在操作715和720中,第一用户终端D1和第二用户终端D2可以将指示其准备好接收语音的信息发送至语音识别服务器300。然后,在操作725中,语音识别装置100可以从语音识别服务器300接收启动请求,并且在操作730中请求第一用户U1输入语音。例如,语音识别装置100可以通过扬声器输出嘟嘟声或者语音“请讲”。或者,语音识别装置100可以通过显示单元101显示包括文本“请讲”的弹出消息。然后,在操作735中,第一用户U1可以将语音命令输入至语音识别装置100。
在操作740中,存在车辆中坐着的第二用户U2发出语音的情况。在这种情况下,由于第一用户终端D1和第二用户终端D2的语音识别模块已被激活,从第二用户D2发出的语音可以输入至语音识别装置100、第一用户终端D1、以及第二用户终端D2。因此,由于除了第一用户U1的语音之外第二用户U2的语音也被输入至语音识别装置100,所以很难准确地识别第一用、户U1的语音。因此,根据当前方式的语音识别装置100可以使用另一用户的终端获得的语音波形和语音识别结果识别从第一用户U1发出的语音。
例如,在操作745中,语音识别装置100可以对所接收的语音执行语音识别处理,并且在操作750和755中,第一用户终端D1和第二用户终端D2也可以对所接收的语音执行语音识别处理。然后,在操作760和765中,第一用户终端D1和第二用户终端D2可以将所接收的语音或对所接收的语音的分析结果发送至语音识别服务器300以请求语音识别服务器300发送语音识别的处理结果。然后,在操作770中,语音识别装置100可以从语音识别服务器300接收语音识别的处理结果。
例如,在操作775中,语音识别装置100可以将语音识别装置100获得的语音识别的处理结果与第一用户终端D1和第二用户终端D2获得的语音识别的处理结果进行比较,从而确定是否照现在的样子使用语音识别装置100获得的语音识别的处理结果,并且确定是否从语音识别装置100获得的语音识别的处理结果中排除被确定为噪声的结果。下面将参考图8详细地描述该操作。
图8是示出了语音识别装置从多个用户终端获得的处理结果识别用户的语音命令并且处理用户的语音命令的方法的流程图,图9示出了通过显示单元请求用户输入语音命令的画面,以及图10示出了根据语音命令的处理结果显示去往目的地的路线的画面。
在操作800中,语音识别装置可以执行语音识别。更具体地,语音识别装置可以激活语音识别模块,并且与语音识别服务器交互以激活位于语音识别装置周围的至少一个用户终端的语音识别模块。这时,如上所述,语音识别装置可以使用位置信息识别位于语音识别装置周围的用户终端。作为另一实例,语音识别装置可以激活通过蓝牙通信网络连接的至少一个用户终端的语音识别模块。
语音识别装置和至少一个用户终端可以分别通过它们的语音输入单元接收语音。因此,语音识别装置可以从语音识别服务器接收用户终端获得的语音波形和语音识别结果。
根据一种方式,语音识别装置可以通过显示单元显示要求用户输入语音的弹出消息。参考图9,语音识别装置可以通过显示单元显示包括文本“请讲”的弹出消息400。
在操作805中,语音识别装置可以将语音识别装置获得的语音波形与用户终端获得的语音波形进行比较。更具体地,在操作810中,语音识别装置可以确定语音识别装置获得的语音波形的形状是否与用户终端获得的语音波形的形状相似。如果语音识别装置确定语音识别装置获得的语音波形的形状与用户终端获得的语音波形的形状相似,在操作815中,语音识别装置可以确定由其自身获得的语音识别结果的数量为一个。如果语音识别装置确定由其自身获得的语音识别结果的数量为一个,在操作820和825中,语音识别装置可以确定获得的语音识别结果是否包括在用户终端获得的语音识别结果中。如果语音识别装置确定语音识别结果与用户终端获得的语音识别结果匹配,在操作830中,语音识别装置可以确定用户的语音识别失败,并且要求用户再次输入语音。
同时,如果语音识别装置确定语音识别装置获得的语音波形的形状与用户终端获得的语音波形的形状不同,并且获得了多个语音识别结果,在操作835中,语音识别装置可以创建包括从用户的语音获得的多个语音识别结果的列表。例如,语音识别装置可以通过显示单元显示列表以引导用户从列表中选择一个语音识别结果。根据一种方式,如果从用户的语音获得的语音识别结果是“庆州”,则语音识别装置可以显示包括与庆州有关的各种服务的列表,诸如,与庆州有关的目的地搜索服务、与庆州有关的天气搜索服务、以及与庆州有关的当地信息服务。
同时,如果语音识别装置确定由其自身获得的语音识别结果的数量为一个,并且语音识别结果不包括在从用户终端获得的语音识别结果中,则语音识别装置可以确定获得的语音识别结果是准确的,并且在操作840中输出语音识别结果。例如,语音识别装置可以通过显示单元显示语音识别结果或通过扬声器输出语音识别结果。此外,语音识别装置可以控制车辆中的设备执行与语音识别结果对应的服务。
然而,如果语音识别装置确定由其自身获得的语音波形的形状与用户终端获得的语音波形的形状不同,并且语音识别装置获得多个语音识别结果,则在操作845中语音识别装置可以将两个设备(即,语音识别装置和用户终端)获得的语音识别结果彼此进行比较。然后,语音识别装置可以确定两个设备共同获得的语音识别结果为噪声,并且在操作850中从列表中删除语音识别结果。然后,在操作855中,语音识别装置可以确定是否还有任何语音识别结果。如果语音识别装置确定还有语音识别结果,则在操作860中语音识别装置可以输出语音识别结果。
可以用程序指令的方式概括根据上述实施方式的方法,程序指令可以通过各种计算机装置来执行,并且可以写在计算机可读记录介质中。计算机可读记录介质可以包括程序指令、数据文件、数据结构、以及它们的组合。存储在存储介质中的程序指令可以针对示例性实施方式而具体地设计和配置并且可以是公开已知的并且适用于计算机软件领域的技术人员。计算机可读记录介质的实例可以包括磁性介质,诸如,硬盘、软盘、以及磁带;光介质,诸如CD-ROM和DVD;磁性光盘介质,诸如,光磁软盘;以及硬件装置,诸如,ROM、RAM和闪存,它们具体地被配置为存储并且运行程序指令。
程序指令的实例既包括诸如编译器产生的机器代码又包括可以使用解释器在计算机上执行的高级语言代码。硬件装置可被配置为起到一个或多个软件模块的作用以便执行上述实施方式的操作,或者反之亦然。
尽管已通过具体实例和附图描述了实施方式,本领域普通技术人员应理解根据以上说明可以进行各种调整和修改。例如,尽管以不同是顺序执行所描述的技术,和/或所描述的系统、架构、设备、或电路部件以不同的方式耦合或结合或用另一部件或等同物取代/替换,可以实现良好效果。
因此,其他实现方式、其他实施方式、以及等同物在下述的权利要求的范围内。
Claims (20)
1.一种语音识别装置,包括:
语音输入单元,被配置为接收来自用户的语音命令;
通信单元,被配置为接收位于所述用户附近的至少一个用户终端获得的语音识别的处理结果;以及
控制器,被配置为将从所述语音命令获得的语音识别的处理结果与所述至少一个用户终端获得的语音识别的处理结果进行比较,并且根据比较处理所述语音命令。
2.根据权利要求1所述的语音识别装置,其中,当从所述用户接收所述语音命令时,所述通信单元被配置为要求激活位于所述用户附近的所述至少一个用户终端的语音识别模块。
3.根据权利要求1所述的语音识别装置,其中,所述控制器被进一步配置为将从所述语音输入单元接收的所述语音命令获得的语音波形与所述至少一个用户终端获得的语音波形进行比较,并且基于所述语音波形的比较处理所述语音命令。
4.根据权利要求1所述的语音识别装置,其中,如果所述控制器确定从所述语音输入单元接收的所述语音命令获得的语音波形与所述至少一个用户终端获得的语音波形不同,并且从所述语音输入单元接收的所述语音命令获得的语音识别结果的数量为一个,所述控制器被配置为基于从所述语音命令获得的语音识别结果控制车辆中的设备。
5.根据权利要求3所述的语音识别装置,其中,如果所述控制器确定从所述语音输入单元接收的所述语音命令获得的所述语音波形与所述至少一个用户终端获得的所述语音波形不同,从所述语音输入单元接收的所述语音命令获得的语音识别结果的数量为一个,并且获得的语音识别结果与所述至少一个用户终端获得的语音识别结果相同,所述控制器被配置为要求所述用户再次输入语音命令。
6.根据权利要求1所述的语音识别装置,其中,如果所述控制器确定从所述语音输入单元接收的所述语音命令获得的语音波形与所述至少一个用户终端获得的语音波形不同,并且从所述语音输入单元接收的所述语音命令获得多个语音识别结果,所述控制器被配置为从所述多个语音识别结果中排除所述至少一个用户终端获得的语音识别结果。
7.根据权利要求6所述的语音识别装置,其中,所述控制器被配置为控制车辆中的设备以提供语音识别结果列表,在所述语音识别结果列表中,从所述多个语音识别结果中排除所述至少一个用户终端获得的语音识别结果。
8.一种车辆,包括:
语音识别模块,被配置为识别用户发出的语音;
通信单元,被配置为接收位于所述车辆附近的至少一个用户终端获得的语音识别的处理结果;以及
控制器,被配置为将所述语音识别模块获得的语音识别的处理结果与所述用户终端获得的语音识别的处理结果进行比较,并且基于比较控制所述车辆中的设备。
9.根据权利要求8所述的车辆,其中,当激活所述语音识别模块时,所述通信单元被配置为要求激活位于所述用户附近的所述至少一个用户终端的语音识别模块。
10.根据权利要求8所述的车辆,其中,所述控制器被进一步配置为将所述用户发出的所述语音的语音波形与所述至少一个用户终端获得的语音波形进行比较,并且基于所述语音波形的比较控制所述车辆中的设备。
11.根据权利要求8所述的车辆,其中,如果所述控制器确定从所述用户发出的所述语音的语音波形与所述至少一个用户终端获得的语音波形不同,并且所述语音识别模块获得的语音识别结果的数量为一个,所述控制器被配置为基于所述语音识别模块获得的所述语音识别结果控制所述车辆中的所述设备。
12.根据权利要求8所述的车辆,其中,如果所述控制器确定从所述用户发出的所述语音的语音波形与所述至少一个用户终端获得的语音波形不同,所述语音输入模块获得的语音识别结果的数量为一个,并且获得的语音识别结果与所述至少一个用户终端获得的语音识别结果相同,所述控制器被配置为要求所述用户再次输入语音。
13.根据权利要求8所述的车辆,其中,如果所述控制器确定从所述用户发出的所述语音的语音波形与所述至少一个用户终端获得的语音波形不同,并且所述语音识别模块获得多个语音识别结果,所述控制器被配置为从所述多个语音识别结果中排除所述至少一个用户终端获得的所述语音识别结果。
14.根据权利要求13所述的车辆,其中,所述控制器被配置为控制所述车辆中的所述设备以提供语音识别结果列表,在所述语音识别结果列表中,从所述多个语音识别结果中排除从所述至少一个用户终端获得的所述语音识别结果。
15.一种控制车辆的方法,包括:
由语音识别模块识别从用户发出的语音;
接收由位于所述车辆附近的至少一个用户终端获得的语音识别的处理结果;以及
将所述语音识别模块获得的语音识别的处理结果与所述至少一个用户终端获得的语音识别的处理结果进行比较,并且基于比较结果控制所述车辆中的设备。
16.根据权利要求15所述的方法,其中,接收语音识别的处理结果进一步包括要求激活位于所述用户附近的所述至少一个用户终端的语音识别模块。
17.根据权利要求15所述的方法,其中,控制所述车辆中的设备包括将从所述用户发出的所述语音的语音波形与所述至少一个用户终端获得的语音波形进行比较,并且基于所述语音波形的比较控制所述车辆中的所述设备。
18.根据权利要求15所述的方法,其中,控制所述车辆中的设备包括:如果从所述用户发出的所述语音的语音波形与所述至少一个用户终端获得的语音波形不同,并且所述语音识别模块获得的所述语音识别结果的数量为一个,基于所述语音识别模块获得的语音识别结果控制所述车辆中的所述设备。
19.根据权利要求15所述的方法,其中,控制所述车辆中的设备包括:如果确定从用户发出的所述语音的语音波形与所述至少一个用户终端获得的语音波形不同,所述语音识别模块获得的语音识别结果的数量为一个,并且获得的语音识别结果与所述至少一个用户终端获得的语音识别结果相同,要求所述用户再次输入语音。
20.根据权利要求15所述的方法,其中,控制所述车辆中的设备包括:如果确定从所述用户发出的所述语音的语音波形与所述至少一个用户终端获得的语音波形不同,并且由所述语音识别模块获得多个语音识别结果,则从所述多个语音识别结果中排除所述至少一个用户终端获得的语音识别结果。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150117151A KR101736109B1 (ko) | 2015-08-20 | 2015-08-20 | 음성인식 장치, 이를 포함하는 차량, 및 그 제어방법 |
KR10-2015-0117151 | 2015-08-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106469556A true CN106469556A (zh) | 2017-03-01 |
CN106469556B CN106469556B (zh) | 2021-10-08 |
Family
ID=58158557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510900180.3A Expired - Fee Related CN106469556B (zh) | 2015-08-20 | 2015-12-08 | 语音识别装置、具有语音识别装置的车辆、控制车辆方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9704487B2 (zh) |
KR (1) | KR101736109B1 (zh) |
CN (1) | CN106469556B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107680592A (zh) * | 2017-09-30 | 2018-02-09 | 惠州Tcl移动通信有限公司 | 一种移动终端语音识别方法、及移动终端及存储介质 |
CN108806682A (zh) * | 2018-06-12 | 2018-11-13 | 奇瑞汽车股份有限公司 | 获取天气信息的方法和装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10937421B2 (en) * | 2016-12-23 | 2021-03-02 | Spectrum Brands, Inc. | Electronic faucet with smart features |
US11176932B2 (en) * | 2016-12-23 | 2021-11-16 | Spectrum Brands, Inc. | Electronic faucet with smart features |
CN106601257B (zh) * | 2016-12-31 | 2020-05-26 | 联想(北京)有限公司 | 一种声音识别方法、设备和第一电子设备 |
CN107733762B (zh) * | 2017-11-20 | 2020-07-24 | 宁波向往智能科技有限公司 | 一种智能家居的语音控制方法及装置、系统 |
KR102695306B1 (ko) * | 2018-06-27 | 2024-08-16 | 현대자동차주식회사 | 대화 시스템, 그를 가지는 차량 및 차량의 제어 방법 |
CN112218412A (zh) * | 2019-07-10 | 2021-01-12 | 上汽通用汽车有限公司 | 基于语音识别的车内氛围灯控制系统和控制方法 |
KR20190099167A (ko) * | 2019-08-06 | 2019-08-26 | 엘지전자 주식회사 | 음성 인식을 수행하는 인공 지능 기기 |
CN112825256B (zh) * | 2019-11-20 | 2024-07-09 | 百度在线网络技术(北京)有限公司 | 录制语音包功能的引导方法、装置、设备和计算机存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060287860A1 (en) * | 2005-06-20 | 2006-12-21 | International Business Machines Corporation | Printing to a text-to-speech output device |
US20070082706A1 (en) * | 2003-10-21 | 2007-04-12 | Johnson Controls Technology Company | System and method for selecting a user speech profile for a device in a vehicle |
CN101201972A (zh) * | 2006-12-13 | 2008-06-18 | 英业达股份有限公司 | 双向语音遥控系统 |
CN101630448A (zh) * | 2008-07-15 | 2010-01-20 | 上海启态网络科技有限公司 | 语言学习客户端及系统 |
US20100169075A1 (en) * | 2008-12-31 | 2010-07-01 | Giuseppe Raffa | Adjustment of temporal acoustical characteristics |
CN102110438A (zh) * | 2010-12-15 | 2011-06-29 | 方正国际软件有限公司 | 一种基于语音的身份认证方法及系统 |
CN102800315A (zh) * | 2012-07-13 | 2012-11-28 | 上海博泰悦臻电子设备制造有限公司 | 车载语音控制方法及系统 |
US20130073293A1 (en) * | 2011-09-20 | 2013-03-21 | Lg Electronics Inc. | Electronic device and method for controlling the same |
CN103000173A (zh) * | 2012-12-11 | 2013-03-27 | 优视科技有限公司 | 一种语音交互方法及装置 |
CN103188541A (zh) * | 2011-12-30 | 2013-07-03 | 三星电子株式会社 | 电子设备和控制电子设备的方法 |
CN103632666A (zh) * | 2013-11-14 | 2014-03-12 | 华为技术有限公司 | 语音识别方法、语音识别设备和电子设备 |
CN103650034A (zh) * | 2011-07-05 | 2014-03-19 | 三菱电机株式会社 | 语音识别装置及导航装置 |
CN103700368A (zh) * | 2014-01-13 | 2014-04-02 | 联想(北京)有限公司 | 用于语音识别的方法、语音识别装置和电子设备 |
WO2014165837A1 (en) * | 2013-04-04 | 2014-10-09 | Waterhouse Jonathan | Displaying an action vignette while text of a passage is correctly read aloud |
CN104240700A (zh) * | 2014-08-26 | 2014-12-24 | 智歌科技(北京)有限公司 | 一种面向车载终端设备的全局语音交互方法及系统 |
CN104536978A (zh) * | 2014-12-05 | 2015-04-22 | 奇瑞汽车股份有限公司 | 识别语音数据的方法和装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001075594A (ja) * | 1999-08-31 | 2001-03-23 | Pioneer Electronic Corp | 音声認識システム |
US6219645B1 (en) * | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
US6230138B1 (en) * | 2000-06-28 | 2001-05-08 | Visteon Global Technologies, Inc. | Method and apparatus for controlling multiple speech engines in an in-vehicle speech recognition system |
JP2002116796A (ja) * | 2000-10-11 | 2002-04-19 | Canon Inc | 音声処理装置、音声処理方法及び記憶媒体 |
JP4457221B2 (ja) | 2003-08-29 | 2010-04-28 | 学校法人早稲田大学 | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム |
US8589156B2 (en) * | 2004-07-12 | 2013-11-19 | Hewlett-Packard Development Company, L.P. | Allocation of speech recognition tasks and combination of results thereof |
US20120253823A1 (en) * | 2004-09-10 | 2012-10-04 | Thomas Barton Schalk | Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing |
KR100728620B1 (ko) | 2005-02-07 | 2007-06-14 | 한국정보통신대학교 산학협력단 | 집합적 음성인식 시스템 및 그 시스템에서의 음성인식 방법 |
US7904300B2 (en) * | 2005-08-10 | 2011-03-08 | Nuance Communications, Inc. | Supporting multiple speech enabled user interface consoles within a motor vehicle |
JP4829184B2 (ja) | 2007-07-23 | 2011-12-07 | クラリオン株式会社 | 車載装置および音声認識方法 |
US20090055180A1 (en) * | 2007-08-23 | 2009-02-26 | Coon Bradley S | System and method for optimizing speech recognition in a vehicle |
JPWO2011121978A1 (ja) * | 2010-03-29 | 2013-07-04 | 日本電気株式会社 | 音声認識システム、装置、方法、およびプログラム |
KR20130011464A (ko) | 2011-07-21 | 2013-01-30 | 김쌍규 | 차량용 음성인식 핸즈프리 장치 |
-
2015
- 2015-08-20 KR KR1020150117151A patent/KR101736109B1/ko active IP Right Grant
- 2015-11-30 US US14/954,399 patent/US9704487B2/en not_active Expired - Fee Related
- 2015-12-08 CN CN201510900180.3A patent/CN106469556B/zh not_active Expired - Fee Related
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070082706A1 (en) * | 2003-10-21 | 2007-04-12 | Johnson Controls Technology Company | System and method for selecting a user speech profile for a device in a vehicle |
US20060287860A1 (en) * | 2005-06-20 | 2006-12-21 | International Business Machines Corporation | Printing to a text-to-speech output device |
CN101201972A (zh) * | 2006-12-13 | 2008-06-18 | 英业达股份有限公司 | 双向语音遥控系统 |
CN101630448A (zh) * | 2008-07-15 | 2010-01-20 | 上海启态网络科技有限公司 | 语言学习客户端及系统 |
US20100169075A1 (en) * | 2008-12-31 | 2010-07-01 | Giuseppe Raffa | Adjustment of temporal acoustical characteristics |
CN102110438A (zh) * | 2010-12-15 | 2011-06-29 | 方正国际软件有限公司 | 一种基于语音的身份认证方法及系统 |
CN103650034A (zh) * | 2011-07-05 | 2014-03-19 | 三菱电机株式会社 | 语音识别装置及导航装置 |
US20130073293A1 (en) * | 2011-09-20 | 2013-03-21 | Lg Electronics Inc. | Electronic device and method for controlling the same |
CN103188541A (zh) * | 2011-12-30 | 2013-07-03 | 三星电子株式会社 | 电子设备和控制电子设备的方法 |
CN102800315A (zh) * | 2012-07-13 | 2012-11-28 | 上海博泰悦臻电子设备制造有限公司 | 车载语音控制方法及系统 |
CN103000173A (zh) * | 2012-12-11 | 2013-03-27 | 优视科技有限公司 | 一种语音交互方法及装置 |
WO2014165837A1 (en) * | 2013-04-04 | 2014-10-09 | Waterhouse Jonathan | Displaying an action vignette while text of a passage is correctly read aloud |
CN103632666A (zh) * | 2013-11-14 | 2014-03-12 | 华为技术有限公司 | 语音识别方法、语音识别设备和电子设备 |
CN103700368A (zh) * | 2014-01-13 | 2014-04-02 | 联想(北京)有限公司 | 用于语音识别的方法、语音识别装置和电子设备 |
CN104240700A (zh) * | 2014-08-26 | 2014-12-24 | 智歌科技(北京)有限公司 | 一种面向车载终端设备的全局语音交互方法及系统 |
CN104536978A (zh) * | 2014-12-05 | 2015-04-22 | 奇瑞汽车股份有限公司 | 识别语音数据的方法和装置 |
Non-Patent Citations (2)
Title |
---|
K.SATYA PRASAD: ""Improve Speech Enhancement Using Weiner Filtering"", 《GLOBAL JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY》 * |
李燕花: ""基于特征提取的智能轮椅语音识别控制技术的研究与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107680592A (zh) * | 2017-09-30 | 2018-02-09 | 惠州Tcl移动通信有限公司 | 一种移动终端语音识别方法、及移动终端及存储介质 |
CN107680592B (zh) * | 2017-09-30 | 2020-09-22 | 惠州Tcl移动通信有限公司 | 一种移动终端语音识别方法、及移动终端及存储介质 |
CN108806682A (zh) * | 2018-06-12 | 2018-11-13 | 奇瑞汽车股份有限公司 | 获取天气信息的方法和装置 |
CN108806682B (zh) * | 2018-06-12 | 2020-12-01 | 奇瑞汽车股份有限公司 | 获取天气信息的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US9704487B2 (en) | 2017-07-11 |
US20170053651A1 (en) | 2017-02-23 |
KR20170022330A (ko) | 2017-03-02 |
CN106469556B (zh) | 2021-10-08 |
KR101736109B1 (ko) | 2017-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106469556A (zh) | 语音识别装置、具有语音识别装置的车辆、控制车辆方法 | |
KR102562227B1 (ko) | 대화 시스템, 그를 가지는 차량 및 차량의 제어 방법 | |
EP3482344B1 (en) | Portable personalization | |
KR102338990B1 (ko) | 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법 | |
US9666189B2 (en) | Vehicle and method of controlling the same | |
CN111661068B (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
US10160413B2 (en) | Vehicle and control method thereof | |
CN106847277A (zh) | 一种带方言识别的话音控制系统 | |
US10083003B2 (en) | Audio video navigation (AVN) apparatus, vehicle, and control method of AVN apparatus | |
US20140244069A1 (en) | Vehicle component control | |
CN112309380B (zh) | 一种语音控制方法、系统、设备及汽车 | |
US20200320997A1 (en) | Agent apparatus, agent apparatus control method, and storage medium | |
CN111667824A (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
JP7211856B2 (ja) | エージェント装置、エージェントシステム、サーバ装置、エージェント装置の制御方法、およびプログラム | |
US11518398B2 (en) | Agent system, agent server, method of controlling agent server, and storage medium | |
CN112988990B (zh) | 信息提供装置、信息提供方法及存储介质 | |
JP7288781B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
JP7239359B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
US20160123762A1 (en) | Navigation device, vehicle having the same, and method for controlling vehicle | |
JP7252029B2 (ja) | サーバ装置、情報提供方法、およびプログラム | |
KR20230090510A (ko) | 단말기 및 차량 | |
US20200301654A1 (en) | On-vehicle device, method of controlling on-vehicle device, and storage medium | |
KR102372033B1 (ko) | 개선된 텔레메틱스 서비스를 제공하는 방법 및 이를 이용한 텔레메틱스 서버 | |
KR20190036018A (ko) | 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법 | |
KR102594310B1 (ko) | 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211008 |
|
CF01 | Termination of patent right due to non-payment of annual fee |