CN106153065A - 音频视频导航设备、车辆及控制音频视频导航设备的方法 - Google Patents
音频视频导航设备、车辆及控制音频视频导航设备的方法 Download PDFInfo
- Publication number
- CN106153065A CN106153065A CN201510187798.XA CN201510187798A CN106153065A CN 106153065 A CN106153065 A CN 106153065A CN 201510187798 A CN201510187798 A CN 201510187798A CN 106153065 A CN106153065 A CN 106153065A
- Authority
- CN
- China
- Prior art keywords
- threshold value
- user
- audio frequency
- speech recognition
- help
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000004891 communication Methods 0.000 claims description 21
- 230000004044 response Effects 0.000 description 27
- 230000002093 peripheral effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3664—Details of the user input interface, e.g. buttons, knobs or sliders, including those provided on a touch screen; remote controllers; input using gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/453—Help systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Navigation (AREA)
- Telephone Function (AREA)
Abstract
音频视频导航(AVN)设备,包括:语音接收器,其用于在语音识别模式中从用户接收命令;存储器,其用于存储帮助;以及控制器,在语音识别模式中如果相同型式已经出现的次数等于或大于阈值,其用于为用户提供帮助。
Description
技术领域
本发明涉及控制音频视频导航(AVN)设备、车辆以及用于控制AVN设备的方法。
背景技术
车辆主要在道路上行驶,但也提供各种便利用户的功能,诸如音频播放、视频播放、导航、空调(AC)和通风、座椅控制、照明控制等等。
为了执行功能,在车辆中装备音频视频导航(AVN)系统(或AVN设备),用以提供包括无线电收听、光盘(CD)播放等等的音频服务、包括例如数字通用光盘(Digital Versatile Disk,DVD)播放的视频服务以及用于辅助导航的导航服务,其中该音频视频导航(AVN)系统(或AVN设备)中集成了多媒体设备和导航系统。
AVN设备响应于用户的操纵输出各种画面,以提供无线电收听服务、音频服务、视频服务和导航服务。对于导航服务,AVN设备响应于用户的操纵输出各种画面,包括用于寻找到达目的地的路线的画面。
此外,AVN设备还可用各种语音识别画面,不仅响应于用户的操纵,还响应于来自用户的语音命令,提供语音识别服务。
发明内容
本发明的目的在于提供音频视频导航(AVN)设备、车辆以及用于控制AVN设备的方法,其在提供语音识别服务的同时提供帮助。
本发明的一个方面,提供一种音频视频导航(AVN)设备。AVN设备包括语音接收器,其用于在语音识别模式中从用户接收命令;存储器,其用于存储帮助;以及控制器,在语音识别模式中如果相同型式已经出现的次数等于或大于阈值,其用于为用户提供帮助。
如果已经接收相同命令的次数等于或大于阈值,则控制器可被配置成提供帮助。
AVN设备还可包括显示单元,其用于在接收命令之前输出预定画面。
如果已经输出预定画面的次数等于或大于阈值,则控制器可被配置成提供帮助。
如果已经出现相同型式的次数等于或大于阈值,则显示单元可为用户输出帮助。
显示单元可在输出帮助之后输出操纵提示画面,以提示用户的操纵。
AVN设备还可包括声音单元,其用于在接收命令之前输出预定声音。
如果已经输出预定声音的次数等于或大于阈值,则控制器可被配置成提供帮助。
如果已经出现相同型式的次数等于或大于阈值,则声音单元可为用户输出帮助。
AVN设备还可包括显示单元,其用于在声音单元输出帮助之后输出操纵提示画面,以提示用户的操纵。
AVN设备还可包括通信单元,其用于经由网络访问另一设备,其中如果相同型式已经出现的次数等于或大于阈值,则控制器可被配置成确定它是否正常地连接到网络。
如果相同型式已经出现的次数等于或大于阈值,则控制器可被配置成确定是否已经执行了AVN设备和其他设备之间的同步。
如果还未执行同步,则控制器可被配置成提供通知用户需要同步的帮助。
如果相同型式已经出现的次数等于或大于阈值,则控制器可被配置成使AVN设备与另一设备同步。
如果相同型式已经出现的次数等于或大于阈值,则控制器可被配置成进入另一模式。
在本发明的另一个方面,提供一种车辆。该车辆包括语音接收器,其用于在语音识别模式中从用户接收命令;存储器,其用于存储帮助;以及控制器,在语音识别模式中如果相同型式已经出现的次数等于或大于阈值,其用于为用户提供帮助。
在本发明的另一个方面,提供一种用于控制音频视频导航(AVN)设备的方法。该方法包括:在语音识别模式中从用户接收命令;在语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值;以及如果相同型式已经出现的次数等于或大于阈值,则为用户提供帮助。
在语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值可包括,确定已经接收相同命令的次数是否等于或大于阈值。
该方法还可包括,在接收命令之前输出预定画面,其中在语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值可包括,确定已经输出预定画面的次数是否等于或大于阈值。
该方法还可包括,在接收命令之前输出预定声音,其中在语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值可包括,确定已经输出预定声音的次数是否等于或大于阈值。
在语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值可包括,确定是否正常地连接到网络。
本发明的其他方面、优点及突出特征从以下结合附图公开本发明的示例性实施例的详细描述中将对本领域技术人员变得显而易见。
附图说明
本发明的以上及其他特征和优点将通过参考附图详细描述其示例性实施例而变得更加显而易见,其中:
图1示出装备有音频视频导航(AVN)设备的车辆;
图2和图3示出装备有AVN设备的车辆的内部;
图4为根据本发明实施例的AVN设备的控制方框图;
图5示出通过语音识别服务的类型分类的示例性命令;
图6示出通过命令分类的示例性帮助内容;
图7示出响应于用户的语音的语音识别画面输出;
图8示出根据本发明实施例的经由短距离通信网络连接到外部设备的AVN设备;
图9到图11示出包括在语音识别模式中声音单元的声音输出中的示例性文字;以及
图12和图13为示出根据本发明实施例的用于控制AVN设备的方法的流程图。
所有附图中,相同的附图标记应被理解为指代相同的零件、部件和结构。
具体实施方式
现将参考附图更完整地描述本发明,其中示出了本发明的示例性实施例。
然而,本发明可用许多不同形式实施,并且不应被解释为局限于本文所提出的实施例;相反,提供这些实施例用以使本发明更透彻和完整,并且将本发明的概念完整地传递给本领域技术人员。附图中的相同附图标记指示相同的元件,并且因此将省略它们的描述。
在本发明的描述中,如果确定与本发明的实施例相关的惯用术语或结构的详细描述将不必要地使本发明的主题晦涩,则将省略该详细描述。
应当理解,尽管术语第一、第二、第三等等可在本文中用于描述各种元件、部件、区域、层和/或部分,但这些元件、部件、区域、层和/或部分不应被这些术语限制。这些术语仅用于将一个元件、部件、区域、层和/或部分与另一个区域、层或部分区分开。
现在将参考图1描述车辆10和音频视频导航(AVN)100(或称为AVN设备)。图1示出装备有AVN设备100的车辆的外部,并且图2和图3示出装备有AVN设备100的车辆的内部。
参考图1,车辆10包括主体1,用于移动车辆10的车轮51和52,用于旋转车轮51和52的驱动系统60,用于将车辆10内部从外侧遮蔽的门71和72(更多信息参考图3),驾驶者可通过其看到前方景象的风挡(或前窗)31,以及用于帮助驾驶者看到车辆10的后方以及侧面区域的侧后视镜81和82。
车轮51和52包括前车轮51和后车轮52,并且驱动系统60将转动力传递到前车轮51或后车轮52,以向前或向后移动车辆10。驱动系统60可采用由电功率产生转动力的电机或者燃烧燃料以生成转动力的内燃机(未示出),其中电功率由蓄电池(未示出)供应。
门71和72附接到主体1的左侧和右侧,并被打开用于进出车辆10以及被关闭用于从外侧遮蔽车辆10的内部。
风挡31又被称为挡风玻璃,其置于主体1的顶端前侧上,用以为驾驶者确保前方景象。
侧后视镜81和82包括左侧后视镜81和右侧后视镜82,其被分别置于主体1的左侧和右侧,用以帮助驾驶者获得车辆10后方以及侧面的景象。
另外,车辆10可包括近距离传感器,用以检测车辆10后方或侧面的障碍物或其他汽车,以及雨量传感器,用以检测降水以及是否正在下雨等等。
在本发明的实施例中,车辆10包括AVN设备100。
AVN设备为其中将车辆10的音频和多媒体设备以及导航系统集成在一起的系统,用以为驾驶者提供无线电调谐服务,以调谐和收听从地面无线电台中的一个提供的无线电频道,用于播放例如光盘(CD)的音频服务,用于播放例如数字通用光盘(DVD)的视频服务,用于帮助驾驶者导航到达目的地的道路的导航服务,用于控制是否接收插入到车辆10的移动终端的来电的电话服务等等。另外,AVN设备100还可提供用于接收除了用户的操纵以外的语音命令的语音识别服务,以提供无线电、音频、视频、导航和电话服务。
此外,AVN设备100可具有例如连接到便携式多媒体设备,例如便携式多媒体播放器(PMP)、音频动态压缩第三层(MPEG AudioLayer-3,MP3)播放器、个人数字助理,等等的通用串行总线(USB)接口,用以重新产生音频和视频文件。
AVN设备100可以可移动地或可拆卸地联接到车辆10,如图2所示,或者可固定到车辆10,如图3所示。
可通过AVN设备100向用户提供有无线电、音频、视频和/或导航服务。
现将结合图3和图4描述AVN设备100的配置和控制。图4为根据本发明实施例的AVN设备100的控制方框图。
参考图3和图4,AVN设备100包括语音接收器110,用以接收用户的语音;存储器120,用以根据AVN设备100的使用存储数据;显示单元130,用以显示不同的画面;输入单元140,用以接收用户的操纵;通信单元,用以访问网络;声音单元160,用以输出声音;以及控制器170,用以控制AVN设备100的一般操作。
术语“操纵”是指按压或触摸输入单元140的按钮,以选择对象或标签(tab),或者执行显示单元130上所显示的所需项目。
语音接收器110通过接收来自用户的语音来生成电信号。语音可包括各种声音,包括人类语音。语音可用具有频率和振幅的声波表示。
语音接收器110在语音识别模式中操作。
语音接收器110可用例如麦克风实施。麦克风包括碳式(carbon)麦克风、水晶(crystal)麦克风、动圈式(moving-coil)麦克风、带式(ribbon)麦克风、电容式(condenser)麦克风和/或半导体(semiconductor)麦克风。然而,麦克风的类型不局限于此,并且可用不同类型的麦克风实施。
存储器120包括用于存储用于AVN设备100的功能操作的程序的程序段121,以及用于存储在AVN设备100的使用中生成的数据的数据段122。在数据段122中,存储与提供给用户的语音识别服务相关的帮助(或帮助内容)122-1以及确定用户的语音所需的命令(122-2)。
帮助122-1是指用于引导用户说语音命令的说明或指示。如果在语音识别模式中重复相同的型式,则帮助122-1在控制器170的控制下被在视觉上或听觉上呈现给用户。稍后将结合图7至图10更详细地描述语音识别模式。
命令122-2指由控制器170使用的数据单元,用以响应于用户所说的内容控制操作,如稍后将描述的。可通过在语音识别模式中提供的语音识别服务的类型对命令122-2进行分类。
图5示出由语音识别服务的类型进行分类的示例性命令。
参考图5,语音识别服务可被分类为例如电话簿查找服务、呼叫日志查找服务、导航服务和无线电/音频服务。
存储器120可为每种语音识别服务存储命令。
可如图5所示以表格的形式在存储器120中存储不同类型的语音识别服务和相应命令。
例如,存储器120可将“呼叫<某人>”、“先前画面”、“是/否”存储为用于电话簿查找服务的命令;将“在<月><日>查找”、“先前画面”、“是/否”存储为用于呼叫日志查找服务的命令;将“搜索周围区域”、“我的家”、“<兴趣区域>”、“<商店名称>”、“推荐路线”、“先前画面”、“是/否”存储为用于导航服务的命令;以及将"FM"、"AM"、"第<n>"、“播放”、“先前画面”、“是/否”存储为用于无线电/音频服务的命令。
此外,存储器120可为每个命令存储帮助。
图6示出由命令分类的示例性帮助内容。
存储器120可如图6中所示以表格的形式存储命令和相应帮助内容。
例如,存储器120可将“检查电话簿是否已经更新”存储为命令“呼叫<某人>”的帮助内容;将“检查呼叫日志是否已经更新”存储为命令“在<月><日>查找”的帮助内容;将“在设置目的地之后重试”存储为命令“推荐路线”的帮助内容;将“在设置我的家之后重试”存储为命令“我的家”的帮助内容;将“退出语音识别模式并进入导航模式”存储为命令“否”或“先前画面”的帮助内容;以及将“检查蓝牙连接”存储为命令“同步”的帮助内容。
存储器120可存储命令的各种其他短语。例如,存储器120可将“是否要呼叫<某人>?”存储为命令“呼叫<某人>”的短语;将“说命令”存储为命令“否”或“先前画面”的短语;将“说商店名称”存储为命令“搜索周围区域”的短语;以及将“这些是<商店名称>的搜索结果”存储为命令“<商店名称>”的短语。
此外,存储器120可存储在AVN设备100的使用中会出现的各种数据。例如,存储器120可提前接收并存储对应于命令“我的家”的地址。
此外,存储器120可存储为用户提供电话簿查找和呼叫日志查找服务所需的电话簿和最近的呼叫日志。
如稍后将描述的,从连接到通信单元150的外部设备发送电话簿和最近的呼叫日志,并使它们与外部设备同步。稍后将关于通信单元150描述关于同步的更多信息。
参考图4,尽管示出控制器170包括只读存储器(ROM)173,其存储用于控制AVN设备100的控制程序,以及随机存取存储器(RAM)172,其用于存储从AVN设备100的外部接收的信号或数据或者被用作用于由AVN设备100执行的各种任务的存储段,存储器120包括该种ROM和RAM也是可能的。
此外,存储器120可与控制器170分离地实施或者可与RAM和ROM并入到控制器170中。在后者的情况下,存储器120可通过与组成控制器170的部件组合被实施在板上或设备中。
如图3所示,显示单元130可被安装在中心仪表板中,即车辆10的仪表板32的中心区域,并输出用于提示用户的操纵的画面或者用于请求用户的语音命令的画面。
下文中,用于提示用户的操纵的画面被称作操纵提示画面,并且用于请求用户的语音命令的画面被称作语音识别画面。
图7示出响应于用户的语音的语音识别画面输出。
参考图7,在语音识别模式中,显示单元130输出第一语音识别画面,用以接收语音命令。
第一语音识别画面可包括例如类似“说命令”的短语。
接下来,响应于来自用户的语音命令,显示单元130输出第二语音识别画面。在这种情况下,第二语音识别画面包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“呼叫John Kim”,则显示单元130上的第二语音识别画面输出可包括对应于命令“呼叫<某人>”的短语“是否要呼叫<某人>?”。
在这种情况下,<某人>为控制器170基于用户所说的<某人>确定的结果,并且根据AVN设备100的语音识别性能,包括在第二语音识别画面中的<某人>可能或可能不对应于用户所说的<某人>。
因此,显示单元130可基于控制器170的确定输出第二语音识别画面,其包括“呼叫John Kim”或“呼叫Tom Lee”。
接下来,响应于来自用户的语音命令,显示单元130输出第三语音识别画面。第三语音识别画面也包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“否”或“先前画面”,则显示单元130上的第三语音识别画面输出可包括对应于命令“否”或“先前画面”的短语“说命令”。
接下来,响应于来自用户的语音命令,显示单元130输出第四语音识别画面。第四语音识别画面也包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“呼叫John Kim”,则显示单元130上的第四语音识别画面输出可包括对应于命令“呼叫<某人>”的短语“是否要呼叫<某人>?”。
在这种情况下,<某人>为控制器170基于用户所说的<某人>确定的结果,并且根据AVN设备100的语音识别性能,包括在第四语音识别画面中的<某人>可能或可能不对应于用户所说的<某人>。
因此,显示单元130可基于控制器170的确定输出第四语音识别画面,其包括“呼叫John Kim”或“呼叫Tom Lee”。
接下来,响应于来自用户的语音命令,显示单元130输出第五语音识别画面。第五语音识别画面也包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“否”或“先前画面”,则尽管图7中未示出,显示单元130上的第五语音识别画面输出可包括对应于命令“否”或“先前画面”的短语“说命令”。
如此,显示单元130根据用户的语音命令输出不同的语音识别画面。每个语音识别画面包括对应于来自用户的语音命令的短语。
然而,语音识别画面不局限于图7中所示的第一到第五语音识别画面中的任一个,并且可以用各种形式输出。
同时,如果在语音识别模式中重复相同的型式,则显示单元130可输出包括帮助的语音识别画面。
具体地,当发生以下情况时确定重复了相同的型式:(i)当已经接收诸如图7的(b)的相同命令的次数等于或大于阈值时;(ii)当已经输出包括诸如图7的(c)的相同短语的语音识别画面的次数等于或大于阈值时;(iii)当已经输出包括相同短语的声音的次数等于或大于阈值时;(iv)当已经接收相同命令的次数等于或大于阈值以及当已经输出包括相同短语的语音识别画面的次数等于或大于阈值时;或者(v)当已经接收相同命令的次数等于或大于阈值以及当已经输出包括相同短语的声音的次数等于或大于阈值时。
参考图7的(b),如果命令“否”或“先前画面”已经被接收N次或更多次(N为阈值,例如为2),则显示单元130在语音识别画面中呈现帮助。
参考图7的(c),如果包括短语“是否要呼叫Tom Lee?”的语音识别画面已经被输出N次或更多次(N为阈值,例如为2),则显示单元130在从用户接收语音命令之后在语音识别画面中呈现帮助。在这种情况下,来自用户的语音命令可为“否”或“先前画面”。
参考图7的(a)和(c),如果命令“呼叫<某人>”已经被接收N次或更多次(N为阈值,例如为2)并且包括短语“是否要呼叫Tom Lee?”的语音识别画面已经被输出N次或更多次,则显示单元130在从用户接收语音命令之后在语音识别画面中呈现帮助。在这种情况下,来自用户的语音命令可为“否”或“先前画面”。
参考图7的(b)和(c),如果包括短语“是否要呼叫Tom Lee?”的语音识别画面已经被输出N次或更多次并且命令“否”或“先前画面”已经被接收N次或更多次,则显示单元130可在语音识别画面上呈现帮助。
此外,如果在语音识别模式中重复了相同的型式,则显示单元130可在包括帮助的语音识别画面之后输出操纵提示画面。
稍后将结合声音单元160描述已经输出包括相同短语的声音的次数等于或大于阈值的情况。
显示器130可使用等离子显示面板(PDP)、发光二极管(LED)、液晶显示屏(LCD)等等实施。
显示器130还可以是用于呈现立体图象的三维(3D)显示器。
显示单元130还可包括触摸屏设备。在显示器130包括触摸屏设备的情况下,显示器130还可作为输入单元140。触摸屏设备可使用电阻式触摸屏面板或电容式触摸屏面板实施。可选地,触摸屏设备可使用超声波或红外线触摸屏面板实施。
返回到图4,输入单元140可允许用户为AVN设备100输入各种控制命令。具体地,输入单元140为用户提供多个画面以输入控制命令,同时观看在显示单元130上呈现的画面,其中画面为AVN画面或语音识别画面。
用户可通过输入单元140操纵AVN画面上所显示的各种标签。
输入单元140可不唯一地包括该种触摸屏设备,而是还可包括按钮输入或远程控制,其与显示单元130分离地实施。
通信单元150可具有例如连接到诸如PMP、MP3播放器、PDA等等的外部设备的通用串行总线(USB)端口、蓝牙模块等等,用以重新产生音频和视频文件。
图8示出根据本发明实施例的经由短距离通信网络连接到外部设备300的AVN设备100。
参考图8,通信单元150可包括例如经由网络连接到外部设备300的蓝牙模块。
外部设备300包括便携式终端。便携式终端可以是保证便携性和移动性的设备,包括个人通信系统(PCS)、全球移动通信系统(GSM)、个人数字蜂窝(PDC)、个人手持电话系统(PHS)、个人数字助理(PDA)、国际移动电信(IMT)-2000设备、码分多址(CDMA)-2000设备、W-CDMA设备、无线宽带因特网(WiBro)终端、便携式多媒体播放器(PMP)终端、智能电话、平板个人计算机(PC)、平板计算机,或任何其他基于手持的设备。
通信单元150可从外部设备300接收电话簿和最近的呼叫日志。下文中,通信单元150从外部设备300接收电话簿和最近的呼叫日志的过程将被称为AVN设备100和外部设备300之间的“同步”。
可以以特定间隔执行AVN设备100和外部设备300之间的同步。
利用AVN设备100和外部设备300之间的同步,将更新的电话簿和最近的呼叫日志存储在AVN设备100的存储器120中。
如果还未执行同步,则包括在外部设备300中的电话簿和最近的呼叫日志可不同于包括在AVN设备100的存储器120中的电话簿和最近的呼叫日志。
通过AVN设备100和外部设备300之间的同步,存储在存储器120中的电话簿和最近的呼叫日志对应于外部设备300的电话簿和最近的呼叫日志。
返回到图4,通信单元150可包括用于访问有线网络的有线通信模块151、用于访问无线网络的无线通信模块152以及短距离通信模块153中的一个或它们的组合。
有线通信模块151可包括有线以太网连接模块、广域网(WAN)连接模块、增值网(VAN)连接模块和控制器局域网(CAN)连接模块。
无线通信模块152可在安装访问点(AP)的位置处访问无线网络,并且可因此连接到AP。无线通信模块152支持IEEE的WLAN标准,例如IEEE 802.11x。
短距离通信模块153可包括蓝牙模块、蓝牙低能量模块、红外线数据关联(IrDA)模块、Wi-Fi模块、超宽带(UWB)和近场通信(NFC)模块、Zigbee模块等等。
如下面将描述,声音单元160在控制器170的控制下重新产生并为用户输出声音。
现将结合图9到图11描述通过声音单元160输出声音的方法。图9到图11示出语音识别模式中包括在声音单元160输出的声音中的示例性文字。
参考图9,在语音识别模式中,声音单元160输出第一声音,用以接收语音命令。
第一声音可包括例如类似“说命令”的短语。
接下来,响应于来自用户的语音命令,声音单元160输出第二声音。在这种情况下,第二声音包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“呼叫John Kim”,则声音单元160输出的第二声音可包括对应于命令“呼叫<某人>”的短语“是否要呼叫<某人>?”。
在这种情况下,<某人>为控制器170基于用户所说的<某人>确定的结果,并且根据AVN设备100的语音识别性能,包括在第二声音中的<某人>可能或可能不对应于用户所说的<某人>。
因此,声音单元160可基于控制器170的确定输出第二声音,其包括“呼叫John Kim”或“呼叫Tom Lee”。
接下来,响应于来自用户的语音命令,声音单元160输出第三声音。第三声音包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“否”或“先前画面”,则声音单元160输出的第三声音可包括对应于命令“否”或“先前画面”的短语“说命令”。
接下来,响应于来自用户的语音命令,声音单元160输出第四声音。第四声音包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“呼叫John Kim”,则声音单元160输出的第四声音可包括对应于命令“呼叫<某人>”的短语“是否要呼叫<某人>?”。
在这种情况下,<某人>为控制器170基于用户所说的<某人>确定的结果,并且根据AVN设备100的语音识别性能,包括在第四声音中的<某人>可能或可能不对应于用户所说的<某人>。
因此,声音单元160可基于控制器170的确定输出第四声音,其包括“呼叫John Kim”或“呼叫Tom Lee”。
接下来,响应于来自用户的语音命令,声音单元160输出第五声音。第五声音包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“否”或“先前画面”,则声音单元160输出的第五声音可包括对应于命令“否”或“先前画面”的短语“说命令”。
同时,如果在语音识别模式中重复了相同的型式,则声音单元160可输出包括帮助的声音。
例如,如果包括短语“是否要呼叫Tom Lee?”的声音已经被输出N次或更多次(N为阈值,例如为2)(图9的1和2),则声音单元160在从用户接收语音命令之后可输出包括帮助的声音。在这种情况下,如果从用户接收了图9的语音命令“否”或“先前画面”3,则可输出包括帮助内容“检查电话簿是否已经更新”的声音。
尽管未示出,显示单元130可在声音单元160输出包括帮助的声音之后输出操纵提示画面。
可选地,在输出包括帮助的声音之后,声音单元130可再次输出第一声音(图9的“说命令”)以从用户接受语音命令。
在图10中所示的另一个实施例中,声音单元160输出第一声音,以在语音识别模式中接收语音命令。
第一声音可包括例如类似“说命令”的短语。
接下来,响应于来自用户的语音命令,声音单元160输出第二声音。在这种情况下,第二声音包括对应于来自用户的语音命令的短语。
例如,如果接收了语音命令“我的家”,则声音单元160可输出对应于语音命令“我的家”第二声音。
在这种情况下,声音单元160可基于控制器170的确定输出第二声音。
例如,如果在存储器120中不存在对应于命令“我的家”的地址,则控制器170可确定命令对应于“搜索周围区域”,然后声音单元160可输出第二声音,其包括对应于命令“搜索周围区域”的短语,诸如如图10中所示的“是否要搜索‘我的家’?”。
另一方面,如果在存储器120中存在对应于命令“我的家”的地址,则控制器170可按本意确定命令,即,“我的家“,然后声音单元160可输出第二声音,其包括对应于命令“我的家”的短语,诸如“引导到我的家的道路”。
接下来,响应于来自用户的语音命令,声音单元160输出第三声音。第三声音包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“否”或“先前画面”,则声音单元160输出的第三声音可包括对应于命令“否”或“先前画面”的短语“说命令”。
接下来,响应于来自用户的语音命令,声音单元160输出第四声音。第四声音包括对应于来自用户的语音命令的短语。
例如,如果接收了语音命令“我的家”,则声音单元160可输出对应于语音命令“我的家”的第四声音。
即使在这种情况下,声音单元160可基于控制器170的确定输出第四声音。
同时,如果在语音识别模式中重复了相同的型式,则声音单元160可输出包括帮助的声音。
例如,在存储器120中不存在对应于命令“我的家”的地址的情况下,如果如图10中所示(1和2),语音命令“我的家”已经被接收了N次或更多次(N为阈值,例如为2),则可输出包括帮助(例如,“请在设置“我的家”后重试”)的声音。
即使在这种情况下,尽管未示出,显示单元130可在声音单元160输出包括帮助的声音之后输出操纵提示画面。
可选地,在输出包括帮助的声音之后,声音单元130可再次输出第一声音(图9的“说命令”),以从用户接收语音命令。
在如图11所示的另一个实施例中,声音单元160输出第一声音以在语音识别模式中接收语音命令。
第一声音可包括例如类似“说命令”的短语。
接下来,响应于来自用户的语音命令,声音单元160输出第二声音。在这种情况下,第二声音包括对应于来自用户的语音命令的短语。
例如,如果接收了语音命令“搜索周围区域”,则声音单元160可输出对应于语音命令“搜索周围区域”第二声音。
例如,第二声音可包括短语,以提示用户说下一个语音命令,诸如“说商店名称”。
接下来,响应于来自用户的语音命令,声音单元160输出第三声音。第三声音包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“麦当劳”,则声音单元160输出的第三声音可包括对应于语音命令“<商店名称>”的短语“这些是<商店名称>的搜索结果”。
在这种情况下,<商店名称>为控制器170基于用户所说的<商店名称>确定的结果,并且根据AVN设备100的语音识别性能,包括在第三声音中的<商店名称>可能或可能不对应于用户所说的<商店名称>。
因此,声音单元160可基于控制器170的确定输出第三声音,其包括“这些是麦当劳的搜索结果”或者“这些是易买得(E-mart)的搜索结果”。
接下来,响应于来自用户的语音命令,声音单元160输出第四声音。第四声音包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“否”或“先前画面”,则声音单元160输出的第四声音可包括对应于命令“否”或“先前画面”的短语“说命令”。
接下来,响应于来自用户的语音命令,声音单元160输出第五声音。第五声音包括对应于来自用户的语音命令的短语。
例如,如果语音接收器110已经接收了语音命令“麦当劳”,则声音单元160输出的第五声音可包括对应于语音命令“<商店名称>”的短语“这些是<商店名称>的搜索结果”。
即使在这种情况下,<商店名称>为控制器170基于用户所说的<商店名称>确定的结果,并且根据AVN设备100的语音识别性能,包括在第五声音中的<商店名称>可能或可能不对应于用户所说的<商店名称>。
因此,声音单元160可基于控制器170的确定输出第五声音,其包括“这些是麦当劳的搜索结果”或者“这些是易买得的搜索结果”。
接下来,响应于来自用户的语音命令,声音单元160输出第六声音。第六声音包括对应于来自用户的语音命令的短语。
例如,如果接收了语音命令“否”或“先前画面”,则声音单元160可输出对应于语音命令“否”或“先前画面”的第六声音。
同时,如果在语音识别模式中重复了相同的型式,则声音单元160可输出包括帮助的声音。
尽管未示出,显示单元130可在声音单元160输出包括帮助的声音之后输出操纵提示画面。
例如,如果如图11所示(1和2),语音命令“否”或“先前画面”已经被接收了N次或更多次(N为阈值,例如为2),则声音单元160可输出包括帮助的声音,诸如“请退出语音识别模式并进入导航模式”。然后,在导航模式中,显示单元130可输出操纵提示画面。
如此,如果在语音识别模式中重复了相同的型式,则AVN设备100可通过显示单元130或声音单元160为用户输出帮助。
然而,声音中的帮助不局限于如图9到图11所示的上述短语,而是可以用各种形式输出。
此外,声音单元160可通知用户AVN设备100是否准备好接收语音命令。
例如,声音单元160可通过在显示单元130上输出语音识别画面之后紧接嘟嘟声来通知用户AVN设备100准备好接收语音命令。
声音单元160可被实施为扬声器或扩音器。
返回到图4,控制器170根据其中预存储的控制程序或用户的输入来控制AVN设备100的操作。
在实施例中,控制器170激活语音识别模式、用于为用户提供导航服务的导航模式、用于提供无线电收听服务的无线电模式、用于提供音频服务的音频模式或用于提供视频服务的视频模式。
当激活语音识别模式时,控制器170确定从用户接收的语音命令。基于对语音命令的确定,控制器170提供给用户存储在存储器120中的短语。可在语音识别画面或在声音中提供存储在存储器120中的短语。
例如,如果确定从用户接收了命令“呼叫<某人>”,则控制器170可将短语“是否要呼叫<某人>”提供给用户。
在这种情况下,用户所期望的语音命令可不同于控制器170所确定的语音命令。
例如,用户所期望的<某人>可不同于控制器170所确定的<某人>。
此外,控制器170可确定是否在语音识别模式中重复了相同的型式。
具体地,当发生以下情况时确定重复了相同的型式:(i)当已经接收相同命令的次数等于或大于阈值时;(ii)当已经输出包括相同短语的语音识别画面的次数等于或大于阈值时;(iii)当已经输出包括相同短语的声音的次数等于或大于阈值时;(iv)当已经接收相同命令的次数等于或大于阈值以及当已经输出包括相同短语的语音识别画面的次数等于或大于阈值时;或者(v)当已经接收相同命令的次数等于或大于阈值以及当已经输出包括相同短语的声音的次数等于或大于阈值时。
如果确定重复了相同的型式,则控制器170基于所确定的语音命令提供给用户存储在存储器120中的帮助。可在语音识别画面或在声音中提供存储在存储器120中的帮助。
可选地,如果确定重复了相同的型式,则控制器170可基于从用户接收的语音命令作出模式改变。例如,如果重复了相同的型式,并且从用户接收了语音命令“搜索周围区域”,则控制器170可将模式改变到导航模式。
此外,如果确定重复了相同的型式,则控制器170可基于从用户接收的语音命令确定是否已经在预定的一段时间内执行了AVN设备100和外部设备300之间的同步。例如,如果重复了相同的型式并且从用户接收了命令“呼叫<某人>”或“<在<月><日>查找>”,则控制器170可确定是否已经在一周内执行了AVN设备100和外部设备300之间的同步。
如果未在预定的一段时间内执行同步,则控制器170可提供通知用户需要同步的帮助。
在为用户提供帮助之后,控制器170可通过执行AVN设备100和外部设备300之间的同步来更新存储在存储器120中的电话簿和呼叫日志。本文的更新是指从外部设备300接收和存储数据。
另外,如果重复了相同的型式,则控制器170可确定其是否正常地连接到网络。例如,如果语音命令“同步”已经被接收两次或更多次,则控制器170可确定到网络的连接状态。如果确定网络连接异常,则控制器170可将例如“检查蓝牙连接”的帮助提供给用户。
再次,控制器170可包括处理器171、用于存储控制程序以控制AVN设备100的ROM 173,以及RAM 172,其用于存储来自外部的信号或数据输入或者用作由AVN设备100执行的各种任务的内存空间。
可选地,处理器171、RAM 172和ROM 173可被并入到与控制器170电分离的图形处理板(未示出)。
处理器171、ROM 172和RAM 173可经由内部总线互连。
术语“控制器”可指包括处理器171、RAM 172和ROM 173的部件。
其还可指包括处理器171、RAM 172、ROM 173和处理板(未示出)的部件。
现将结合图12和图13描述用于控制AVN设备100的方法的实施例。图12和图13为示出用于根据本发明实施例的控制AVN设备100的方法的流程图。
参考图12的实施例,在操作S1110中,AVN设备100根据来自用户的输入或控制程序激活语音识别模式。
AVN设备100在操作S1120中输入语音识别画面或声音,并在操作S1130中从用户接收语音。语音可包括命令。
AVN设备100可在接收语音之前输出预定声音。预定声音可为嘟嘟声。
接下来,在操作S1140中,AVN设备100确定已经接收相同命令的次数是否等于或大于阈值。
如果已经接收相同命令的次数等于或大于阈值,则AVN设备100在操作1150中输出包括帮助的语音识别画面或声音。帮助具有对应于一个或多个命令的短语,并被提前存储在AVN设备100中。
在输出包括帮助的语音识别画面或声音之后,AVN设备100可在操作S1160中输出操纵提示画面。
此外,在输出包括帮助的语音识别画面或声音之后,AVN设备100可响应于用户的语音作出模式改变,或者通过执行AVN设备100和外部设备之间的同步来更新存储在存储器120中的电话簿以及呼叫日志。
在输出包括帮助的语音识别画面或声音之前,AVN设备100可确定其是否正常地连接到网络,或者是否已经执行AVN设备100和外部设备之间的同步。
如果其未正常地连接到网络,则AVN设备100提供通知用户异常网络连接状态的帮助,并且如果还未执行AVN设备100和外部设备之间的同步,则AVN设备100可提供通知用户需要同步的帮助。
如果已经接收相同命令的次数小于阈值,则AVN设备100在操作1120中响应于用户的语音输出随后的语音识别画面或随后的声音。重复操作S1130和S1140。
参考图13的另一个实施例,AVN设备100在操作S1210中根据来自用户的输入或控制程序激活语音识别模式。
AVN设备100在操作S1220中输出语音识别画面或声音,并在操作S1230中从用户接收语音。语音可包括命令。
AVN设备100可在接收语音之前输出预定声音。预定声音可为嘟嘟声。
在操作S1240中,AVN设备100确定已经输出相同语音识别画面的次数是否等于或大于阈值,或者已经输出相同声音的次数是否等于或大于阈值。
在操作S1240中,如果已经输出相同语音识别画面的次数等于或大于阈值或者如果已经输出相同声音的次数等于或大于阈值,则AVN设备100在S1250中确定已经接收相同命令的次数是否等于或大于阈值。
在操作S1240中,如果已经输出相同语音识别画面的次数等于或大于阈值或者如果已经输出相同声音的次数等于或大于阈值,并且在操作S1250中,如果已经接收相同命令的次数等于或大于阈值,则AVN设备100在操作S1260中输出包括帮助的语音识别画面或声音。帮助具有对应于一个或多个命令的短语,并被提前存储在AVN设备100中。
在输出包括帮助的语音识别画面或声音之后,AVN设备100可在操作S1270中输出操纵提示画面。
此外,在输出包括帮助的语音识别画面或声音之后,AVN设备100可响应于用户的语音作出模式改变,或者通过执行AVN设备100和外部设备之间的同步来更新存储在存储器120中的电话簿以及呼叫日志。
在输出包括帮助的语音识别画面或声音之前,AVN设备100可确定其是否正常地连接到网络,或者是否已经执行AVN设备100和外部设备之间的同步。
如果AVN设备100未正常地连接到网络,则AVN设备100可提供通知用户网络连接状态的帮助,并且如果还未执行AVN设备100和外部设备之间的同步,则AVN设备100可提供通知用户需要同步的帮助。
另一方面,在操作S1240中,如果已经输出相同语音识别画面的次数小于阈值或者如果已经输出相同声音的次数小于阈值,则AVN设备100在操作S1220中响应于用户的语音命令输出随后的语音识别画面或随后的声音。重复操作S1230和S1240。
在操作S1240中,如果已经输出相同语音识别画面的次数等于或大于阈值,或者如果已经输出相同声音的次数等于或大于阈值,但在操作S1250中如果已经接收相同命令的次数小于阈值,则AVN设备100在操作S1220中响应于用户的语音命令输出随后的语音识别画面或随后的声音,并重复操作S1230和S1240。
在上述实施例中,AVN设备100的一些部件可被实施为模块类型。术语“模块”可指软件模块、现场可编程门阵列(FPGA)或提供功能的诸如专用集成电路(ASIC)的硬件部件。然而,模块不局限于软件或硬件。模块可被配置成存储在可寻址存储器介质中,或者被配置成执行一个或多个处理器。
例如,模块可包括诸如软件部件、面向对象的软件部件、类部件和任务部件的部件,进程,功能,属性,程序,子程序,程序代码段,驱动器,固件,微代码,电路,数据,数据库,数据结构,表格,阵列和变量。部件和模块所提供的功能可被组合到更少数目的部件和模块中,或者进一步被划分为更多数目的部件和模块。此外,部件和模块可执行一个或多个处理器,诸如设备内的中央处理单元(CPU)。
可以用存储在计算机可读记录介质上的计算机可读代码实施AVN设备100以及用于控制AVN设备100的方法。计算机可读记录介质包括其上存储有数据的任何类型的记录介质,该数据可通过计算机系统随后读取。例如,其可为ROM、RAM、磁带、磁盘、闪存、光学数据存储设备等等。计算机可读记录介质还可分布于联网的计算机系统,以便以分布式方式存储并执行代码。
根据AVN设备、车辆以及用于控制AVN设备的方法的实施例,如果相同的型式出现若干次,则为用户提供帮助以迅速地处理相关情况。
以上已经描述了若干实施例,但本领域技术人员应理解的是,在不脱离本发明的范围的情况下,可做出各种修改。因此,对于本领域技术人员将显而易见的是,本发明不局限于所描述的实施例,其仅用于说明的目的被提供。
Claims (21)
1.一种音频视频导航设备,其包括:
语音接收器,其用于在语音识别模式中从用户接收命令;
存储器,其用于存储帮助;以及
控制器,在所述语音识别模式中如果相同型式已经出现的次数等于或大于阈值,其用于为所述用户提供所述帮助。
2.根据权利要求1所述的音频视频导航设备,其中如果已经接收相同命令的次数等于或大于所述阈值,则所述控制器被配置成提供所述帮助。
3.根据权利要求1所述的音频视频导航设备,还包括显示单元,其用于在接收所述命令之前输出预定画面。
4.根据权利要求3所述的音频视频导航设备,其中如果已经输出所述预定画面的次数等于或大于所述阈值,则所述控制器被配置成提供所述帮助。
5.根据权利要求3所述的音频视频导航设备,其中如果所述相同型式已经出现的次数等于或大于所述阈值,则所述显示单元为所述用户输出所述帮助。
6.根据权利要求5所述的音频视频导航设备,其中所述显示单元在输出所述帮助之后,输出操纵提示画面,以提示所述用户的操纵。
7.根据权利要求1所述的音频视频导航设备,还包括声音单元,其用于在接收所述命令之前输出预定声音。
8.根据权利要求7所述的音频视频导航设备,其中如果已经输出所述预定声音的次数等于或大于所述阈值,则所述控制器被配置成提供所述帮助。
9.根据权利要求7所述的音频视频导航设备,其中如果所述相同型式已经出现的次数等于或大于所述阈值,则所述声音单元为所述用户输出所述帮助。
10.根据权利要求9所述的音频视频导航设备,还包括显示单元,其用于在所述声音单元输出所述帮助之后,输出操纵提示画面以提示所述用户的操纵。
11.根据权利要求1所述的音频视频导航设备,还包括通信单元,其用于经由网络访问另一设备,
其中如果所述相同型式已经出现的次数等于或大于所述阈值,则所述控制器被配置成确定其是否正常地连接到所述网络。
12.根据权利要求11所述的音频视频导航设备,其中如果所述相同型式已经出现的次数等于或大于所述阈值,则所述控制器被配置成确定是否已经执行所述音频视频导航设备和所述另一设备之间的同步。
13.根据权利要求12所述的音频视频导航设备,其中如果还未执行所述同步,则所述控制器被配置成提供通知所述用户需要同步的帮助。
14.根据权利要求1所述的音频视频导航设备,其中如果所述相同型式已经出现的次数等于或大于所述阈值,则所述控制器被配置成使所述音频视频导航设备与另一设备同步。
15.根据权利要求1所述的音频视频导航设备,其中如果所述相同型式已经出现的次数等于或大于所述阈值,则所述控制器被配置成进入另一模式。
16.一种车辆,其包括:
语音接收器,其用于在语音识别模式中从用户接收命令;
存储器,其用于存储帮助;以及
控制器,在所述语音识别模式中如果相同型式已经出现的次数等于或大于阈值,其用于为所述用户提供所述帮助。
17.一种用于控制音频视频导航设备的方法,所述方法包括以下步骤:
在语音识别模式中从用户接收命令;
在所述语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值;以及
如果所述相同型式已经出现的次数等于或大于所述阈值,则为所述用户提供帮助。
18.根据权利要求17所述的方法,其中在所述语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值的步骤包括:
确定已经接收相同命令的次数是否等于或大于所述阈值。
19.根据权利要求17所述的方法,还包括在接收所述命令之前输出预定画面的步骤,
其中在所述语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值的步骤包括,确定已经输出所述预定画面的次数是否等于或大于所述阈值。
20.根据权利要求17所述的方法,还包括在接收所述命令之前输出预定声音的步骤,
其中在所述语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值的步骤包括,确定已经输出所述预定声音的次数是否等于或大于所述阈值。
21.根据权利要求17所述的方法,其中在所述语音识别模式中确定相同型式已经出现的次数是否等于或大于阈值的步骤包括:
确定是否正常地连接到网络。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140140736A KR20160045353A (ko) | 2014-10-17 | 2014-10-17 | 에이브이엔 장치, 차량, 및 에이브이엔 장치의 제어방법 |
KR10-2014-0140736 | 2014-10-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106153065A true CN106153065A (zh) | 2016-11-23 |
Family
ID=55749537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510187798.XA Pending CN106153065A (zh) | 2014-10-17 | 2015-04-20 | 音频视频导航设备、车辆及控制音频视频导航设备的方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9899023B2 (zh) |
KR (1) | KR20160045353A (zh) |
CN (1) | CN106153065A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106531158A (zh) * | 2016-11-30 | 2017-03-22 | 北京理工大学 | 一种应答语音的识别方法及装置 |
CN106653065A (zh) * | 2017-03-01 | 2017-05-10 | 奇瑞汽车股份有限公司 | 基于车载音响系统的运行方法 |
CN107831763A (zh) * | 2017-10-18 | 2018-03-23 | 广州小鹏汽车科技有限公司 | 一种基于大数据学习的车载控制方法及系统 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160165690A1 (en) * | 2014-12-05 | 2016-06-09 | Stages Pcs, Llc | Customized audio display system |
US10609475B2 (en) | 2014-12-05 | 2020-03-31 | Stages Llc | Active noise control and customized audio system |
US9654868B2 (en) | 2014-12-05 | 2017-05-16 | Stages Llc | Multi-channel multi-domain source identification and tracking |
US9980042B1 (en) | 2016-11-18 | 2018-05-22 | Stages Llc | Beamformer direction of arrival and orientation analysis system |
US10945080B2 (en) | 2016-11-18 | 2021-03-09 | Stages Llc | Audio analysis and processing system |
US9980075B1 (en) | 2016-11-18 | 2018-05-22 | Stages Llc | Audio source spatialization relative to orientation sensor and output |
US10573291B2 (en) | 2016-12-09 | 2020-02-25 | The Research Foundation For The State University Of New York | Acoustic metamaterial |
CN109102801A (zh) | 2017-06-20 | 2018-12-28 | 京东方科技集团股份有限公司 | 语音识别方法和语音识别装置 |
US10492013B2 (en) * | 2017-09-14 | 2019-11-26 | GM Global Technology Operations LLC | Testing of vehicle system module using audio recognition |
JP7347217B2 (ja) * | 2018-02-09 | 2023-09-20 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
CN110322876A (zh) * | 2018-03-30 | 2019-10-11 | 中华映管股份有限公司 | 语音应用系统及其方法 |
CN109612498B (zh) * | 2018-12-27 | 2019-11-26 | 乐清市华尊电气有限公司 | 一种基于gps的语音导航定位系统 |
CN110910872B (zh) * | 2019-09-30 | 2023-06-02 | 华为终端有限公司 | 语音交互方法及装置 |
CN111326149A (zh) * | 2020-02-25 | 2020-06-23 | 青岛海尔空调器有限总公司 | 一种提高语音辨识率的优化方法及系统 |
CN111735472A (zh) * | 2020-05-22 | 2020-10-02 | 百度在线网络技术(北京)有限公司 | 一种导航音频的播放方法、装置、设备和计算机存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040006480A1 (en) * | 2002-07-05 | 2004-01-08 | Patrick Ehlen | System and method of handling problematic input during context-sensitive help for multi-modal dialog systems |
CN1555481A (zh) * | 2002-03-15 | 2004-12-15 | 三菱电机株式会社 | 车辆用导航装置 |
CN1712900A (zh) * | 2004-06-25 | 2005-12-28 | 株式会社电装 | 汽车导航装置 |
CN102087111A (zh) * | 2009-12-07 | 2011-06-08 | 厦门雅迅网络股份有限公司 | 一种车辆导航方法 |
KR20120019003A (ko) * | 2010-08-24 | 2012-03-06 | 현대모비스 주식회사 | 음성 인식 안내 시스템 및 방법 |
WO2013038440A1 (ja) * | 2011-09-13 | 2013-03-21 | 三菱電機株式会社 | ナビゲーション装置 |
KR20140051630A (ko) * | 2012-10-23 | 2014-05-02 | 현대모비스 주식회사 | 차량용 avn 시스템의 음성 인식 처리 기능 제어 방법 |
US20140188803A1 (en) * | 2012-12-31 | 2014-07-03 | Martyn Roland James | Systems and methods for automatic synchronization of recently modified data |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3624064B2 (ja) | 1996-12-11 | 2005-02-23 | キヤノン株式会社 | 情報処理方法及び装置及び記憶媒体 |
US20030120493A1 (en) * | 2001-12-21 | 2003-06-26 | Gupta Sunil K. | Method and system for updating and customizing recognition vocabulary |
JP2007052397A (ja) * | 2005-07-21 | 2007-03-01 | Denso Corp | 操作装置 |
JP4832097B2 (ja) | 2006-02-13 | 2011-12-07 | 富士通テン株式会社 | 音声対話システム |
JP5173895B2 (ja) | 2009-03-09 | 2013-04-03 | トヨタ自動車株式会社 | 音声認識装置 |
CN103038818B (zh) * | 2010-06-24 | 2016-10-12 | 本田技研工业株式会社 | 在车载语音识别系统与车外语音识别系统之间的通信系统和方法 |
JP5158174B2 (ja) | 2010-10-25 | 2013-03-06 | 株式会社デンソー | 音声認識装置 |
US20150199965A1 (en) * | 2014-01-16 | 2015-07-16 | CloudCar Inc. | System and method for recognition and automatic correction of voice commands |
-
2014
- 2014-10-17 KR KR1020140140736A patent/KR20160045353A/ko active Search and Examination
-
2015
- 2015-03-27 US US14/671,990 patent/US9899023B2/en active Active
- 2015-04-20 CN CN201510187798.XA patent/CN106153065A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1555481A (zh) * | 2002-03-15 | 2004-12-15 | 三菱电机株式会社 | 车辆用导航装置 |
US20040006480A1 (en) * | 2002-07-05 | 2004-01-08 | Patrick Ehlen | System and method of handling problematic input during context-sensitive help for multi-modal dialog systems |
CN1712900A (zh) * | 2004-06-25 | 2005-12-28 | 株式会社电装 | 汽车导航装置 |
CN102087111A (zh) * | 2009-12-07 | 2011-06-08 | 厦门雅迅网络股份有限公司 | 一种车辆导航方法 |
KR20120019003A (ko) * | 2010-08-24 | 2012-03-06 | 현대모비스 주식회사 | 음성 인식 안내 시스템 및 방법 |
WO2013038440A1 (ja) * | 2011-09-13 | 2013-03-21 | 三菱電機株式会社 | ナビゲーション装置 |
KR20140051630A (ko) * | 2012-10-23 | 2014-05-02 | 현대모비스 주식회사 | 차량용 avn 시스템의 음성 인식 처리 기능 제어 방법 |
US20140188803A1 (en) * | 2012-12-31 | 2014-07-03 | Martyn Roland James | Systems and methods for automatic synchronization of recently modified data |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106531158A (zh) * | 2016-11-30 | 2017-03-22 | 北京理工大学 | 一种应答语音的识别方法及装置 |
CN106653065A (zh) * | 2017-03-01 | 2017-05-10 | 奇瑞汽车股份有限公司 | 基于车载音响系统的运行方法 |
CN107831763A (zh) * | 2017-10-18 | 2018-03-23 | 广州小鹏汽车科技有限公司 | 一种基于大数据学习的车载控制方法及系统 |
CN107831763B (zh) * | 2017-10-18 | 2021-10-12 | 广州小鹏汽车科技有限公司 | 一种基于大数据学习的车载控制方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
KR20160045353A (ko) | 2016-04-27 |
US20160111088A1 (en) | 2016-04-21 |
US9899023B2 (en) | 2018-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106153065A (zh) | 音频视频导航设备、车辆及控制音频视频导航设备的方法 | |
US20220253278A1 (en) | Information processing device, information processing method, information processing program, and terminal device | |
US9578668B2 (en) | Bluetooth pairing system and method | |
JP5331710B2 (ja) | 無線ネットワーク選択 | |
US10083003B2 (en) | Audio video navigation (AVN) apparatus, vehicle, and control method of AVN apparatus | |
CN106775562A (zh) | 音频参数处理的方法及装置 | |
CN107430524B (zh) | 一种定位声音发出位置的方法和终端设备 | |
US10951557B2 (en) | Information interaction method and terminal | |
US20190122661A1 (en) | System and method to detect cues in conversational speech | |
US10559304B2 (en) | Vehicle-mounted voice recognition device, vehicle including the same, vehicle-mounted voice recognition system, and method for controlling the same | |
CN104218969A (zh) | 用于与车辆和车辆中的装置进行交互的设备和系统 | |
CN104842904A (zh) | 用于识别驾驶员装置的系统 | |
US10282316B2 (en) | Information-sharing device, method, and terminal device for sharing application information | |
CN110286745A (zh) | 对话处理系统、具有对话处理系统的车辆及对话处理方法 | |
US20130064385A1 (en) | Method and apparatus for providing audio content, user terminal and computer readable recording medium | |
CN113314120B (zh) | 处理方法、处理设备及存储介质 | |
CN106469509A (zh) | 一种交通辅助方法及系统 | |
KR20190051215A (ko) | 단말기 및 차량 | |
CN105608095A (zh) | 多媒体播放方法、装置及移动终端 | |
KR20140055302A (ko) | 이동 단말기 및 그 제어 방법 | |
KR20100050322A (ko) | 내비게이션 장치 및 그 방법 | |
KR20160075976A (ko) | 컨텐츠 공유를 위한 단말기 및 그 동작 방법 | |
JP2014036441A (ja) | 手持装置 | |
JP2021177636A (ja) | 端末装置 | |
KR102461351B1 (ko) | 차량 및 그 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161123 |