CN104903846A - 语音识别装置、语音识别程序和语音识别方法 - Google Patents
语音识别装置、语音识别程序和语音识别方法 Download PDFInfo
- Publication number
- CN104903846A CN104903846A CN201380069575.2A CN201380069575A CN104903846A CN 104903846 A CN104903846 A CN 104903846A CN 201380069575 A CN201380069575 A CN 201380069575A CN 104903846 A CN104903846 A CN 104903846A
- Authority
- CN
- China
- Prior art keywords
- option
- picture
- voice
- instruction
- receiving portion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 41
- 238000003860 storage Methods 0.000 claims abstract description 13
- 238000012216 screening Methods 0.000 claims description 38
- 230000033228 biological regulation Effects 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 25
- 230000033458 reproduction Effects 0.000 description 19
- 230000005055 memory storage Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 108010085603 SFLLRNPND Proteins 0.000 description 5
- 230000009471 action Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000006855 networking Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013316 zoning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/041—Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
- G06F3/0412—Digitisers structurally integrated in a display
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3626—Details of the output of route guidance instructions
- G01C21/3629—Guidance using speech or audio output, e.g. text-to-speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Automation & Control Theory (AREA)
- Computational Linguistics (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明的目的在于,提供一种便利性更高的语音识别装置的技术。本发明的语音识别装置的特征在于,具备:存储部,其存储使画面与该画面中的选项对应的画面定义信息和确定每个选项曾被选择的次数的选择履历信息;接触指示接受部,其通过接触的操作接受指示;语音指示接受部,其通过语音的操作接受指示;和选项朗读部,当在规定画面中限制接触指示接受部接受指示时,该选项朗读部将规定画面中的选项以与曾被选择的次数相应的顺序语音输出,语音指示接受部对通过选项朗读部输出的选项中的任一项接受指示。
Description
技术领域
本发明涉及语音识别装置的技术。本发明主张在2013年1月8日申请的日本国专利的申请号码2013-1373的优先权,对于承认基于文献的参照的引入的指定国,该申请所记载的内容通过参照引用于本申请中。
背景技术
目前,公开了一种电子设备的技术,该电子设备具有:检测与电子设备相关的状态的检测单元;和基于检测到的状态的至少一部分判定(也称为“判断”)是否开始语音识别或是否结束语音识别的判定单元,基于判定结果决定语音识别的开始或结束,进行语音识别,基于其识别结果进行规定的动作。专利文献1中记载有这样的装置的技术。
现有技术文献
专利文献
专利文献1:(日本)特开2003-195891号公报
发明内容
发明所要解决的课题
在上述那样的装置中,即使开始语音识别之后,例如,在用户忘记或不正确地记忆指示对象的名称等的情况下,发出的语音的指示不能形成恰当的指示,存在不能如打算的那样进行操作的情况。
本发明的目的在于,提供一种便利性更高的语音识别装置的技术。
用于解决课题的手段
为了解决所述课题,本发明的语音识别装置的特征在于,具备:存储部,其存储使画面与该画面中的选项对应的画面定义信息和确定每个所述选项被选择的次数的选择履历信息;接触指示接受部,其通过接触的操作接受指示;语音指示接受部,其通过语音的操作接受指示;和选项朗读部,当在规定画面中限制所述接触指示接受部接受指示时,该选项朗读部将所述规定画面中的选项以与所述被选择的次数相应的顺序语音输出,所述语音指示接受部对通过所述选项朗读部输出的所述选项中的任一项接受指示。
另外,也可以为,所述语音识别装置的特征在于,所述选项朗读部,在由所述语音指示接受部接受到的所述选项是指定用于筛选从所述规定画面跳转的跳转目的画面的选项的筛选条件的选项的情况下,进一步语音输出所述跳转目的画面的根据所述筛选条件筛选得到的选项。
另外,也可以为,所述语音识别装置的特征在于:所述选项朗读部,在由所述语音指示接受部接受到的所述选项是指定作为规定处理的处理对象而决定的决定条件的选项的情况下,对根据所述决定条件确定的所述处理对象进行所述规定的处理。
另外,也可以为,所述语音识别装置的特征在于:所述选项朗读部将所述规定画面的选项中的已显示完成的选项排除在外地进行语音输出。
另外,也可以为,所述语音识别装置的特征在于:所述规定画面中的各个所述选项确定规定的乐曲文件,所述选项朗读部通过按照每个所述乐曲文件将该乐曲文件的乐曲的至少一部分再现而进行所述选项的语音输出。
另外,也可以为,所述语音识别装置的特征在于:具备履历生成部,该履历生成部对所述接触指示接受部和所述语音指示接受部接受到指示的选项,更新所述选择履历信息的被选择的次数。
另外,也可以为,所述语音识别装置的特征在于:所述语音识别装置搭载于移动体,还具备输入接受切换部,当所述移动体以规定速度以上的速度开始移动时,该输入接受切换部限制所述接触指示接受部接受指示。
另外,本发明提供一种语音识别程序,其使计算机执行语音识别工序,该语音识别程序的特征在于:使所述计算机作为如下各个单元发挥作用:控制单元;通过接触的操作接受指示的接触指示接受单元;通过语音的操作接受指示的语音指示接受单元;和存储单元,该存储单元存储使画面与该画面中的选项对应的画面定义信息和确定每个所述选项被选择的次数的选择履历信息,当在规定画面中限制所述接触指示接受单元接受指示时,使所述控制单元执行将所述规定画面中的选项以与所述被选择的次数相应的顺序语音输出的选项朗读工序,在所述语音指示接受单元中,对在所述选项朗读工序中输出的所述选项的任一项接受指示。
另外,本发明提供一种语音识别方法,其是语音识别装置进行的语音识别方法,该语音识别方法的特征在于:所述语音识别装置具备:存储部,其存储使画面与该画面中的选项对应的画面定义信息和确定每个所述选项被选择的次数的选择履历信息;接触指示接受部,其通过接触的操作接受指示;和语音指示接受部,其通过语音的操作接受指示;所述语音识别方法实施如下步骤:选项朗读步骤,当在规定画面中限制所述接触指示接受部接受指示时,将所述规定画面中的选项以与所述被选择的次数相应的顺序语音输出;和通过所述语音指示接受部,对在所述选项朗读工序中输出的所述选项的任一项接受指示的步骤。
发明效果
根据本愿发明,能够提供便利性更高的语音识别装置的技术。
附图说明
图1是导航装置的概略结构图。
图2是表示链表的结构的图。
图3是表示画面定义表的结构的图。
图4是表示选择履历表的结构例的图。
图5是表示画面跳转(也称为“迁移”)的结构例的图。
图6是导航装置的运算处理部的功能结构图。
图7是语音操作交接处理的流程图。
图8是表示选择对象为筛选条件的情况下的触摸操作画面的输出画面例的图。
图9是表示选择对象为筛选条件的情况下的触摸操作禁止画面的输出画面例的图。
图10是表示选择对象为决定条件的情况下的触摸操作画面的输出画面例的图。
图11是表示选择对象为决定条件的情况下的触摸操作禁止画面的输出画面例的图。
图12是表示选择对象为筛选条件的情况下的触摸操作画面的输出画面例的图。
图13表示是选择对象为筛选条件的情况下的触摸操作禁止画面的输出画面例的图。
图14是表示选择对象为决定条件的情况下的触摸操作画面的输出画面例的图。
图15是表示选择对象为决定条件的情况下的触摸操作禁止画面的输出画面例的图。
具体实施方式
以下,参照附图对本发明的导航装置100进行说明。
图1中表示导航装置100的整体结构图。导航装置100是,能够显示地图信息,且展现表示导航装置100的当前所在地(也称为“当前位置”)的地点和对至所设定的目的地的路径进行引导的信息的所谓的导航装置。
导航装置100具备:运算处理部1、显示屏2、存储装置3、语音输入输出装置4(具备作为语音输入装置的麦克风41、作为语音输出装置的扬声器42)、输入装置5、ROM(Read Only Memory:只读存储器)装置6、车速传感器7、陀螺仪传感器8、GPS(Global PositioningSystem:全球定位系统)接收装置9、FM复用广播接收装置(也称为“FM多重广播接收装置”)10、信标(beacon)接收装置11、和车载网络通信装置12。
运算处理部1是进行各种处理的中心的单元。例如基于从各种传感器7、8、GPS接收装置9、FM复用广播接收装置10等输出的信息计算当前所在地。另外,基于得到的当前所在地的信息,将进行显示所需要的地图数据从存储装置3或ROM装置6读出。
另外,运算处理部1将读出的地图数据进行图形展开,且将在其中表示当前所在地的标记重叠显示在显示屏2上。另外,使用存储装置3或ROM装置6中存储的地图数据等,对作为连结当前所在地或由用户指示的出发地和目的地(或中转地或停靠地)的最佳路径的推荐路径进行搜索(也称为“检索”)。另外,使用扬声器42和/或显示屏2引导用户。
导航装置100的运算处理部1是利用总线25将各器件之间连接的结构。运算处理部1具有:执行数值运算及控制各器件这样的各种处理的CPU(Central Processing Unit:中央处理器)21;储存从存储装置3读出的地图数据、运算数据等的RAM(Random Access Memory:随机存取存储器)22;储存程序和/或数据的ROM23;和用于将各种硬件与运算处理部1连接的I/F(接口)24。
显示屏2是显示由运算处理部1等生成的图形信息的单元。显示屏2由液晶显示屏、有机EL显示屏等构成。
存储装置3由HDD(Hard Disk Drive:硬盘驱动器)或非易失性存储卡之类的、至少能够读写的存储介质构成。
该存储介质中存储有:作为通常的路径搜索装置所需要的地图数据(包括构成地图上的道路的链(也称为“链接”)的链数据)的链表200;作为在导航装置100中显示的画面的定义信息的画面定义表300;和以画面单位使实际选择成为各画面中选择的候选的选项的选择次数与每个选项相对应的选择履历表400。另外,存储装置3的存储介质中存储有:一个或两个以上的乐曲(也称为“歌曲”)文件、以及有关规定对作为再现对象的乐曲文件进行识别的识别信息和该多个乐曲文件的再现顺序的播放列表的信息等。此外,各乐曲文件中,作为元信息含有:确定乐曲的艺术家的信息、作曲家、种类、收纳该乐曲的唱片名等属性信息。
图2是表示链表200的结构的图。链表200包含按照每个作为地图上被区划的区域的网眼(mesh,也称为“网格”)的识别代码(网眼ID)201,构成该网眼区域所包含的道路的各链的链数据202。
链数据202按每个作为链的标识符的链ID211含有:构成链的两个节点(开始节点,结束节点)的坐标信息222、表示包含链的道路的类别的道路类别223、表示链长度的链长224、预先存储的链旅行时间225、开始连接链及结束连接链226、表示包含链的道路的限制速度的限制速度227等。此外,开始连接链及结束连接链226是对作为与该链的开始节点连接的链的开始连接链和作为与该链的结束节点连接的链的结束连接链进行确定的信息。
此外,在此通过对构成链的两个节点区别开始节点和结束节点,将相同道路的上行方向和下行方向分别作为不同的链进行管理,但不限于此。例如,也可以对构成链的两个节点不区别为开始节点和结束节点。
图3是表示画面定义表300的结构的图。画面定义表300含有使画面ID301、画面层次(也称为“画面阶层”)302、上层次画面303、画面内页ID304、下层次画面305、可否进行语音操作交接306相对应的信息。
画面ID301是确定画面的信息。画面层次302是在画面跳转体系中对根据画面ID301确定的画面所处的层次进行确定的信息。上层次画面303是对根据画面ID301确定的画面的正上面层次的画面进行确定的信息。画面内页ID304是在根据画面ID301确定的画面为选项的量增加时将显示分成多页的结构的情况下,确定所分的页的信息。下层次画面305是对根据画面ID301确定的画面的正下方层次的画面进行确定的信息。可否进行语音操作交接(“交接”在此也可称为“接交”)306是在根据画面ID301确定的画面正在显示期间变得不能受理(即,接受)手动操作的情况下,确定是否为将输入方法交接(即,接任)给语音操作的页的信息。
图4是表示选择履历表400的结构的图。选择履历表400包含使画面ID401、选项402、选择次数403相对应的信息。
画面ID401是确定画面的信息。选项402是确定在根据画面ID401确定的画面中显示的选项的信息。其中,选项402中包含:用于确定最终进行操作的对象的决定条件、例如对要再现的乐曲文件的文件名和/或要作为目的地设定的设施的设施名等进行确定的信息。另外,选项402中还包含:筛选条件,该筛选条件不是决定条件,而是用于筛选决定条件的条件,例如对要再现的乐曲文件的艺术家和/或作为目的地设定的设施的类别进行确定的信息。另外,选项402还包含用于接受“返回”或“OK”、“删除”按钮等手动操作的信息。
选择次数403是关于选项402确定实际被选择的次数的信息。例如,假定在一个画面中选项之一过去被选择过5次,则在该选项的选择次数403中储存确定选择的次数为“5次”的信息。
返回图1进行说明。语音输入输出装置4具备作为语音输入装置的麦克风41和作为语音输出装置的扬声器42。麦克风41取得用户和/或其他乘客发出的声音等导航装置100的外部语音,接受语音操作。
扬声器42将运算处理部1中生成的发送给用户的消息作为语音进行输出。麦克风41和扬声器42在车辆的规定部位分别配置。但是,也可以收纳于一体的筐体。导航装置100能够分别具备多个麦克风41及扬声器42。
输入装置5是经由用户的手动操作而接受(即,受理)来自用户的指示的装置。输入装置5由触摸面板51、拨号开关52、作为其他硬开关(未图示)的上下移动键(scroll key)、比例尺变更键等构成。另外,输入装置5中包含能够远遥控地对导航装置100进行操作指示的遥控器。遥控器具备拨号开关、移动键、比例尺变更键等,能够将操作了各键、开关的信息发送到导航装置100。
触摸面板51搭载于显示屏2的显示面侧,能够透视显示画面。触摸面板51对与在显示屏2中显示的图像的XY坐标对应的进行了手动操作的触摸位置进行确定,将触摸位置转换成坐标后输出。触摸面板51由感压式或静电式的输入检测元件等构成。此外,触摸面板51也可以是能够实现能够同时检测多个触摸位置的多点触控(也称为“多重触控”)的面板。
拨号开关52能够沿顺时针方向及逆时针方向旋转,按每规定角度的旋转产生脉冲信号,输出至运算处理部1。运算处理部1中,根据脉冲信号的数量求取旋转角度。
ROM装置6由CD-ROM、DVD-ROM等ROM、或IC(IntegratedCircuit:集成电路)卡之类的至少能够读取的存储介质构成。该存储介质中存储有例如活动图像(即,视频)数据和/或语音数据等。
车速传感器7、陀螺仪传感器8及GPS接收装置9用于使用导航装置100检测当前所在地(例如,汽车位置)。车速传感器7是输出用于计算车速的值的传感器。陀螺仪传感器8由光纤陀螺仪或振动陀螺仪等构成,检测移动体的旋转的角速度。GPS接收装置9通过接收来自GPS卫星的信号并对3个以上的卫星测量移动体和GPS卫星间的距离以及距离的变化率,测量(也称为“测定”)移动体的当前所在地、前进速度及前进方位。
FM复用广播接收装置10接收从FM广播局播出的FM复用广播信号。FM复用广播中包含:VICS(Vehicle Information CommunicationSystem(车辆信息通信系统):注册商标)信息的概略现状交通信息、限制信息、SA/PA(服务区/停车区域)信息、停车场信息、天气信息等和/或作为FM复用一般信息由无线广播电台提供的文字信息等。
信标接收装置11接收:VICS信息等概略现状交通信息、限制信息、SA/PA(服务区/停车区域)信息、停车场信息、天气信息、紧急警告(即,紧急警报)等。例如,是通过光进行通信的光信标、通过电波进行通信的电波信标等的接收装置。
车载网络通信装置12是,使导航装置100连接于与作为未图示的车辆的控制网络标准的CAN(Controller Area Network:控制器区域网络)等对应的网络,与作为连接于网络的其它车辆控制装置的ECU(Electronic control unit:电子控制单元)交换CAN消息,从而进行通信的装置。
图5是表示本实施方式中的与操作画面相关的画面跳转的结构例的图。本实施方式中,画面跳转以层次构造表示,更深的层次的画面与更浅的层次即上位层次的画面相比,作为承担具体的信息的输入输出的画面或表示处理结果的画面进行设计。其中,不具有直接的跳转关系的画面彼此也可以在具体化的程度上存在差异。例如,经由选择艺术家的画面进行了筛选的乐曲选择画面和未进行筛选的乐曲选择画面,均是选择乐曲的画面,但画面跳转上的层次也可以不同。另外,各画面中,在未由输入限制部105限制手动操作的状态下,能够接受手动操作和语音操作中的任一操作,在由输入限制部105限制手动操作的状态下,能够接受语音操作。
如图5所例示的那样,在本实施方式中,成为最上位的第0层次501中存在菜单画面511,接受从菜单画面511向成为下位层次的第一层次502的艺术家选择画面521、播放列表选择画面522和唱片选择画面523中的任一画面进行跳转(也称为“转变”)的指示的按钮等作为选项被设置。
在此,艺术家选择画面521是接受在储存于存储装置3或ROM装置6中的乐曲文件所包含的元信息中包含确定与该乐曲相关的艺术家的信息的情况下,用于将该艺术家的乐曲与其他艺术家的乐曲区别而筛选的筛选条件的输入的画面。另外,艺术家选择画面521中显示对进行乐曲演奏等的艺术家进行确定的选项。即使在任意艺术家的选项被选择的情况下,也向成为下位层次的第二层次503的艺术家乐曲选择画面531跳转(也称为“迁移”)。
另外,播放列表选择画面522是,在存储装置3或ROM装置6中包含对储存于该存储装置3等中的乐曲文件的再现顺序进行确定的播放列表信息的情况下,接受再现该播放列表的乐曲的指示、即接受决定条件的输入的画面。
唱片选择画面523是,在储存于存储装置3或ROM装置6中的乐曲文件所包含的元信息中包含确定唱片的信息的情况下,接受用于将该唱片的乐曲与其它唱片的乐曲区别而筛选的筛选条件的输入的画面。另外,唱片选择画面523中显示对作为将乐曲以一个或多个按照规定的顺序一并管理的单位的唱片进行确定的选项,但即使在任意唱片的选项被选择的情况下,也向成为下位层次的第二层次503的唱片乐曲选择画面533进行跳转。
从艺术家选择画面521跳转的艺术家乐曲选择画面531是,以可选择的方式提示筛选为所选择的艺术家的乐曲,接受确定乐曲文件的决定条件的输入的画面。另外,艺术家乐曲选择画面531中显示确定乐曲的选项。即使在任意乐曲的选项被选择的情况下,也向成为下位层次的第三层次504的乐曲再现画面541跳转。另外,在艺术家乐曲选择画面531中显示的乐曲的选项多到没能完全显示的情况下,作为用于将艺术家乐曲选择画面531分割显示成多个页的画面,追加艺术家乐曲选择(页2)532,艺术家乐曲选择画面(页1)531和艺术家乐曲选择画面(页2)相互可进退地显示。此外,关于页间的显示范围的变更操作,既可以切换变更前后的页,也可以通过上下移动等操作使各页所包含的选项连续变化而变更显示范围。
从唱片选择画面523跳转的唱片乐曲选择画面533是,可选择地提示筛选为所选择的唱片的乐曲,接受确定乐曲文件的决定条件的输入的画面。另外,唱片乐曲选择画面533中显示确定乐曲的选项。即使在任意乐曲的选项被选择的情况下,也向成为下位层次的第三层次504的乐曲再现画面542跳转。此外,对于唱片乐曲选择画面533中显示的乐曲的选项多到未能完全显示的情况下的页追加,与上述艺术家乐曲选择画面531、532一样。
从艺术家乐曲选择画面(页1)531或艺术家乐曲选择画面(页2)532跳转的乐曲再现画面541是,提示与被输入了决定条件的乐曲文件相关的信息的画面。例如,乐曲再现画面541中显示:与乐曲文件的再现相关的活动图像和/或静止图像的显示;利用指示器表示相对于乐曲长度的再现完成部分的长度的显示;和乐曲的再现、停止、暂时停止、快进、倒退、输出音量的调整等操作面板等的显示等。
从唱片乐曲选择画面533跳转的乐曲再现画面542是,提示与被输入了决定条件的乐曲文件相关的信息的画面。例如,乐曲再现画面542中显示:与乐曲文件相关的活动图像和/或静止图像的显示;利用指示器表示相对于乐曲长度的再现完成部分的长度的显示;和乐曲的再现、停止、暂时停止、快进、倒退、输出音量的调整等操作面板等的显示等。
图6是运算处理部1的功能块图。如图示,运算处理部1包含:基本控制部101、输入接受部102、输出处理部103、操作履历生成部104、输入限制部105、输入接受切换部106、和选项朗读部107。
基本控制部101是进行各种处理的中心的功能部,根据处理内容控制其它功能部的动作。另外,取得各种传感器、GPS接收装置9等的信息,进行地图匹配处理等,确定当前所在地。另外,随时使行驶的日期及时刻和位置相对应,按照每个链将行驶履历存储于存储装置3。另外,根据来自各处理部的要求(即,请求),输出当前时刻。
另外,基本控制部101对作为连接当前所在地或由用户指示的出发地和目的地(或,中转地、停留地)的最佳路径的推荐路径进行搜索。在该路径搜索中,使用代克思托演算法(Dijkstra's algorithm)等路径搜索算法,基于对道路的规定的区间(链)预先设定的链成本,搜索链成本最小的路径。
另外,基本控制部101显示推荐路径,同时使用扬声器42和/或显示屏2引导用户,以使得当前所在地不脱离推荐路径。
输入接受部102接受经由输入装置5或麦克风41输入的来自用户的手动操作或语音操作,将作为与该语音操作相关的信息的触摸的坐标位置与语音信息一起传递到基本控制部101,以使得执行与请求内容对应的处理。例如,在用户请求推荐路径的搜索时,将该请求指示向基本控制部101进行请求。即,能够说输入接受部102是通过伴随接触的手动操作接受指示的接触指示接受部。另外,也能够说输入接受部102是通过基于语音进行的操作(语音操作)接受指示的语音指示接受部。
输出处理部103接收例如多边形信息等构成显示的画面的信息,转换成用于在显示屏2上描画的信号而对显示屏2进行描画的指示。
操作履历生成部(也称为“操作履历制作部”)104对乐曲文件的执行、目的地的设定等导航装置100中的规定处理,生成接受的筛选条件或决定条件的输入的履历。具体而言,操作履历生成部104对作为在乐曲文件的执行(再现)时或路径搜索的目的地设定时接受了输入的筛选条件或决定条件的各个选项,计算被执行(指示选择输入)的次数,作为选择履历表400的选择次数403储存于存储装置3中。
输入限制部105根据搭载有导航装置100的车辆等的状态,决定限制输入。具体而言,输入限制部105在车辆停车期间,接受对经由触摸面板51或拨号开关52对输入接受部102进行的手动操作、和经由麦克风41对输入接受部102进行的语音操作中的任一项的操作,但在一定速度以上的行驶期间,决定限制经由触摸面板51或拨号开关52对输入接受部102进行的手动操作。另外,输入限制部105在使车辆移动的齿轮被选择的情况下,即在停车齿轮未被选择的情况下等,决定限制经由触摸面板51或拨号开关52对输入接受部102进行的手动操作。
输入接受切换部106接受输入限制部105的决定,对输出处理部103指示显示“行驶中”等规定画面操作无效化的消息,对输入接受部102指示限制经由触摸面板51或拨号开关52的手动操作,并接受经由语音输入输出装置4的语音操作,切换输入方法。
当由输入接受切换部106切换输入方法时,选项朗读部107将在切换的时刻显示在画面上的选项及其以后的跳转画面上的选项,按照与其被选择的次数相应的顺序经由扬声器42等通过语音输出。即,能够说,当在规定画面中通过输入限制部105限制手动操作的接受时,选项朗读部107按照与规定画面中的选项被选择的次数相应的顺序进行语音输出。
另外,在该选项的语音输出处理中,选项朗读部107按每个选项设置作为接受语音操作的规定期间的语音操作接受期间,在该期间中接受通过输入接受部102进行的语音操作。在接受到规定的语音操作(例如,代表肯定的“是”、“OK”或“Yes”等语音操作)的情况下,选项朗读部107看作该语音操作接受期间的选项已被选择输入,确定跳转目的画面(下层次画面等)的选项,开始所确定的选项的朗读及选择输入的接受。
在未接受到规定的语音操作的情况下(例如,无反应的情况、无声的情况或接受到意味着否定的“不是”、“其次”,“下一个”、“不”等语音操作的情况下),选项朗读部107将下一个选项经由扬声器42等通过语音输出,设置规定的语音操作接受期间,在该期间接受通过输入接受部102进行的语音操作。
另外,选项朗读部107在通过语音操作接受到的选项为指定用于筛选从规定画面跳转的跳转目的画面的选项的筛选条件的选项的情况下,进一步语音输出根据跳转目的画面的筛选条件筛选后的选项。
另外,选项朗读部107在通过语音操作接受到的选项为指定作为规定处理的处理对象而决定的决定条件的选项的情况下,对根据决定条件确定的处理对象进行规定的处理。
另外,选项朗读部107除去规定画面的选项中已显示完成的选项而进行语音输出。
上述的运算处理部1的各功能部即基本控制部101、输入接受部102、输出处理部103、操作履历生成部104、输入限制部105、输入接受切换部106、选项朗读部107,通过CPU21读入执行规定的程序而构成。为此,RAM22中存储有用于实现各功能部的处理的程序。
此外,上述的各构成要素是为了使得容易理解而将导航装置100的结构根据主要的处理内容进行分类而得到的。因此,本发明不被构成要素的分类的方式或其名称所限制。导航装置100的结构也可以根据处理内容分类成更多的构成要素。另外,也可以按照一个构成要素执行更多的处理的方式进行分类。
另外,各功能部也可以利用硬件(ASIC,GPU等)构成。另外,各功能部的处理既可以由一个硬件执行,也可以由多个硬件执行。
[动作的说明]
接着,对导航装置100实施的语音操作交接处理的动作进行说明。图7是表示导航装置100实施的语音操作交接处理的流程图。在启动导航装置100后,在搭载有导航装置100的车辆开始行驶的情况等下通过输入限制部105决定了手动操作的限制的情况下,利用输入接受切换部106将输入方法从接受手动操作和语音操作的任意操作的输入方法向限制手动操作的接受而接受语音操作的输入方法切换时,实施上述流程。
首先,选项朗读部107确定操作限制时的画面ID(步骤S001)。具体而言,选项朗读部107在由输入限制部105限制了手动操作的状态下显示的画面为从菜单画面启动的规定功能的画面显示的情况下,确定对于该功能显示的画面ID。
然后,选项朗读部107确定该画面中的选择候选(步骤S002)。具体而言,选项朗读部107将由通过步骤S001确定的画面ID确定的画面中可选择地显示的选项确定为选择候选。其中,选项朗读部107对于该画面在参照可否进行语音操作交接306不能进行交接的情况下,也可以结束语音操作交接处理的动作。
然后,选项朗读部107按照每个选择候选确定过去的选择次数(步骤S003)。具体而言,选项朗读部107对作为在步骤S002中确定的选择候选的各个选项,读出在选择履历表400中相对应的选择次数403,确定选择次数。
然后,选项朗读部107在操作限制时确定显示中的画面内页ID(步骤S004)。具体而言,选项朗读部107在成为由输入限制部105限制手动操作的状态的状况下显示的画面中实施了页间的显示范围的变更操作的情况下,确定已经结束参照的页即显示后从显示范围排除在外的页。此外,选项朗读部107在利用输入限制部105限制输入的状态下显示的画面中通过上下移动等实施了页间的显示范围的变更操作的情况下,确定已经结束参照的页即显示后从显示范围排除在外的选项。
然后,选项朗读部107从选择候选(也称为“选择候补”)提取显示中的画面内的以后的页所包含的候选(步骤S005)。具体而言,选项朗读部107通过将在步骤S002中确定的选择候选中的、在步骤S004中确定的结束参照的页所包含的选择候选(或在上下移动的情况下,从显示范围排除在外的选择候选)排除在外,进行选择候选的提取。
然后,选项朗读部107针对提取的选择候选按照过去的选择次数从多到少的顺序发出介绍语音或候选朗读(步骤S006)。具体而言,选项朗读部107对于步骤S005中提取的选择候选,按照步骤S003中确定的选择次数从多到少的顺序进行分类,进行选择次数较多的选择候选的朗读。在进行该朗读的处理时,选项朗读部107在选择候选为决定条件的情况下,开始在该选择候选接受到决定条件的情况下执行的处理的一部分,在选择候选为筛选条件的情况下以语音输出选项的名称等。例如,在选择候选为乐曲的情况下,符合决定条件,选项朗读部107从乐曲开头再现规定时间(例如3秒)并输出语音。还例如,在选择候选为艺术家的情况下,符合筛选条件,选项朗读部107通过TS(Text to Speech:从文本转语音)等语音输出艺术家的名称。
然后,选项朗读部107判定是否接受到指示选择的语音操作(步骤S007)。具体而言,选项朗读部107判定输入接受部102对于步骤S006中进行朗读的候选是否接受到指示肯定或否定的选择的语音操作。在未接受到指示选择的语音操作的情况下,选项朗读部107在规定的语音操作接受期间内(例如,开始选项朗读后,结束选项朗读后2秒以内)反复地判定是否接受到指示选择的语音操作。
在接受到指示选择的语音操作的情况下(步骤S007中“是”的情况下),选项朗读部107接受在识别出指示选择的语音的时刻输出的候选的选择(步骤S008)。具体而言,如果指示选择的语音是表示肯定的语音,则选项朗读部107确定在步骤S006中朗读的选项,将该选项作为被选择输入的选项进行接受。在指示选择的语音不是表示肯定的语音的情况下,选项朗读部107忽视该语音,对还未进行朗读的选项中选择次数第二多的选项执行步骤S006的处理。
然后,选项朗读部107使显示跳转到跳转目的画面,执行接受了选择的文件(步骤S009)。具体而言,选项朗读部107确定关于被选择输入的选项的下层次画面305,如果该选项为决定条件,则执行该选项的文件。即,选项朗读部107在接受到乐曲被选择输入的情况下,开始该乐曲的再现。如果该选项为筛选条件,则选项朗读部107确定关于被选择输入的选项的下层次画面305,作为在该下层次画面显示时进行了操作限制的处理,实施语音操作交接处理。
以上是语音操作交接处理的处理流程。根据语音操作交接处理,在手动操作中或语音操作中实施了手动操作的限制的情况下,能够继续通过语音操作进行输入。
图8是表示选择对象为筛选条件的情况下的触摸操作画面的输出画面例的图。具体而言,是表示在导航装置100中显示的作为接受艺术家选择的输入的画面的艺术家选择画面521的示例画面600的图。
示例画面600中包含:接受用于返回至上层次的指示的后退(BACK)按钮区域600A;和接受艺术家的选择输入的艺术家选择按钮区域600B,在艺术家选择按钮区域600B显示的各个艺术家(Artist)名相当于固有地接受该艺术家名的选择输入的选项。
图9是表示选择对象为筛选条件的情况下的触摸操作禁止画面的输出画面例的图。具体而言,是表示在导航装置100显示的作为接受艺术家选择的输入的画面的艺术家选择画面521中、进行了手动操作的限制的情况下的示例画面600的图。
示例画面600中,将以不能手动操作选项的方式显示选项的后退按钮区域600A和以不能手动操作选项的方式显示选项的艺术家选择按钮区域600B变暗显示。另外,将表示由于正在行驶因此限制手动操作的意思的消息区域610显示在示例画面600中,在示例画面600中显示有“正在行驶”的消息。在正在显示该画面的情况下,导航装置100成为不接受输入装置5的手动操作的状态。另外,在显示该画面的同时,将语音提示620语音输出。
语音提示620中,首先通过语音朗读选择次数最多的选项“艺术家-0005”,接着通过语音朗读“开始再现吗?”这样催促指示的消息。在此,当进行肯定的语音操作时,与“艺术家-0005”相关的筛选条件被确定,作为选择该艺术家的乐曲的下一画面的艺术家乐曲选择画面531的选项同样通过语音被朗读(参照图11)。在未进行肯定的语音操作的情况下,进一步通过语音朗读再现次数第二多的“艺术家-0033”。而且,在未进行肯定的语音操作的情况下,通过语音朗读再现次数第三多的“艺术家-0084”。
图10是表示选择对象为决定条件的情况下的触摸操作画面的输出画面例的图。具体而言,是表示在导航装置100中显示的作为接受乐曲选择的输入的画面的艺术家乐曲选择画面531的示例画面700的图。
示例画面700中包含:接受用于返回上层次的指示的后退按钮区域700A;和接受乐曲的选择输入的艺术家乐曲选择按钮区域700B,在艺术家选择按钮区域700B中显示的各个乐曲名相当于固有地接受该乐曲的选择输入的选项。
图11是表示选择对象为决定条件的情况下的触摸操作禁止画面的输出画面例的图。具体而言,是表示在导航装置100中显示的作为接受艺术家乐曲选择的输入的画面的艺术家乐曲选择画面531中,进行手动操作的限制时的示例画面700的图。
示例画面700中,将以不能手动操作选项的方式显示选项的后退按钮区域700A和以不能手动操作选项的方式显示选项的艺术家乐曲选择按钮区域700B变暗显示。另外,将表示由于正在行驶因此限制手动操作的意思的消息区域710显示在示例画面700中,在示例画面700中显示有“正在行驶”的消息。在正在显示该画面的情况下,导航装置100成为不接受输入装置5的手动操作的状态。另外,在显示该画面的同时,将语音提示720语音输出。
语音提示720中,首先再现(介绍再现)再现次数最多的选项“歌曲-0005”的开头部分(例如,开头的3秒钟或前奏部分)的语音。并且,语音输出作为该选项的曲名,然后通过语音朗读“开始再现吗?”这样的催促指示的消息。在此,当进行肯定的语音操作时,与“歌曲-0005”相关的决定条件被确定,显示在该乐曲再现时表现详细信息的乐曲再现画面541,再现该乐曲并进行语音输出。在未进行肯定的语音操作的情况下,进一步将再现次数第二多“歌曲-0001”的开头部分的语音再现。而且,在未进行肯定的语音操作的情况下,将再现次数第三多的“歌曲-0012”的开头部分的语音再现。
图12是表示选择对象为筛选条件的情况下的触摸操作画面的另一输出画面例的图。具体而言,是表示在导航装置100中显示的接受目的地选择的输入的示例画面800的图。
示例画面800中包含:接受用于返回上层次的指示的后退按钮区域800A;和接受种类(Genre)的选择输入的种类选择按钮区域800B,在种类选择按钮区域800B中显示的各个种类名相当于固有地接受种类的选择输入的选项。
图13是表示选择对象为筛选条件的情况下的触摸操作禁止画面的另一输出画面例的图。具体而言,是表示在导航装置100中显示的作为接受种类选择的输入的画面的种类选择画面内手动操作被限制的情况下的示例画面800的图。
示例画面800中,将以不能手动操作选项的方式显示选项的后退按钮区域800A和以不能进行手动操作选项的方式显示选项的种类选择按钮区域800B变暗显示。另外,将表示由于正在行驶因此限制手动操作的意思的消息区域810显示在示例画面800中,在示例画面800中显示有“正在行驶”的消息。在正在显示该画面的情况下,导航装置100成为不接受输入装置5的手动操作的状态。另外,在显示该画面的同时,将语音提示(guidance)820语音输出。
语音提示820中,首先通过语音朗读作为选择次数最多的选项的“种类-0007”,接着通过语音朗读“开始选择吗?”这样的催促指示的消息。在此,当进行肯定的语音操作时,与“种类-0007”相关的筛选条件被确定,选择该种类的设施的下一画面的选项同样通过语音被朗读(参照图15)。在未进行肯定的语音操作的情况下,进一步通过语音朗读选择次数第二多的“种类-0021”。而且,在未进行肯定的语音操作的情况下,通过语音朗读选择次数第三多的“种类-0077”。
图14是表示选择对象为决定条件的情况下的触摸操作画面的输出画面例的图。具体而言,是表示在导航装置100中显示的接受设施选择的输入的示例画面900的图。
示例画面900中包含:接受用于返回上层次的指示的后退按钮区域900A;和接受设施的选择输入的设施选择按钮区域900B,在设施选择按钮区域900B中显示的各个设施名相当于固有地接受设施的选择输入的选项。
图15是表示选择对象为决定条件的情况下的触摸操作禁止画面的输出画面例的图。具体而言,是表示在导航装置100中显示的作为接受设施选择的输入的画面的设施选择画面中限制手动操作的情况下的示例画面900的图。
示例画面900中,将以不能手动操作选项的方式显示选项的后退按钮区域900A和以不能手动操作选项的方式显示选项的设施选择按钮区域900B变暗显示。另外,将表示由于正在行驶因此限制手动操作的意思的消息区域910显示在示例画面900中,在示例画面900中显示有“正在行驶”的消息。在正在显示该画面的情况下,导航装置100成为不接受输入装置5的手动操作的状态。另外,在显示该画面的同时,将语音提示(guidance)920语音输出。
语音提示920中,首先通过语音朗读选择次数最多的选项“设施-0090”,接着通过语音朗读“选择吗?”这样催促指示的消息。在此,当进行肯定的语音操作时,与“设施-0090”相关的决定条件被确定,显示以该设施为目的地的路径显示画面,将该路径作为推荐路径设定。在未进行肯定的语音操作的情况下,进一步通过语音朗读选择次数第二多的“设施-0038”。而且,在未进行肯定的语音操作的情况下,通过语音朗读选择次数第三多的“设施-0002”。
以上,对本发明的实施方式进行了说明。根据本发明的上述实施方式,能够提供便利性更高的语音识别装置。
本发明不限制于上述的实施方式。上述实施方式能够在本发明的技术思想的范围内进行各种变形。例如,上述实施方式中,假定画面跳转以层次构造表示,更深层次的画面与更浅的层次即上位层次的画面相比,作为承担具体的信息的输入输出的画面或表示处理结果的画面进行设计,但不限于此。
例如,在包含输入项目非常多的画面等的情况下,也可以构成为输入画面伴随多个画面的跳转这样的构造。即,能够说,即使在已经进行了输入操作的画面处于跳转内的情况下,根据上述实施方式,也能够恰当地进行语音的输入。
还例如,上述实施方式中,在选择筛选条件的选项时限制手动操作的情况下,通过语音操作接受筛选条件的选项的输入,但不限于此。例如,也可以在接受到确定作为决定条件的乐曲的语音的输入时进行该乐曲的再现。还例如,也可以在接受“经常的”等规定的预定词语的语音操作时,根据在跳转前的画面中已经接受的筛选条件筛选乐曲,并按照再现次数从多到少的顺序开始介绍再现。通过这样变形,能够进一步提高便利性。
还例如,也可以将上述实施方式中的选择履历表400根据利用者经由网络设置于可存取的存储区域,从导航装置100经由通信取得选择次数。通过这样,能够在多个导航装置100间共有选择履历。
以上,以实施方式为中心说明了本发明。此外,上述实施方式想定的是能够搭载于汽车上的导航装置100,但不限于此,能够适用于所有移动体的导航装置或所有移动体的装置。
附图标记的说明
1 运算处理部; 2 显示屏; 3 存储装置;
4 语音输入输出装置; 5 输入装置;
6 ROM装置; 7 车速传感器; 8 陀螺仪传感器
9 GPS接收装置; 10 FM复用广播接收装置;
11 信标接收装置; 12 车载网络通信装置;
21 CPU; 22 RAM; 23 ROM; 24 I/F;
25 总线(bus,也称为“母线”); 41 麦克风;
42 扬声器; 51 触摸面板; 52 拨号开关;
100 导航装置; 101 基本控制部; 102 输入接受部
103 输出处理部; 104 操作履历生成部;
105 输入限制部; 106 输入接受切换部;
107 选项朗读部; 200 链表;
300 画面定义表; 400 选择履历表。
Claims (9)
1.一种语音识别装置,其特征在于,具备:
存储部,其存储使画面与该画面中的选项对应的画面定义信息和确定每个所述选项曾被选择的次数的选择履历信息;
接触指示接受部,其通过接触的操作接受指示;
语音指示接受部,其通过语音的操作接受指示;和
选项朗读部,当在规定画面中限制所述接触指示接受部接受指示时,该选项朗读部将所述规定画面中的选项以与所述曾被选择的次数相应的顺序语音输出,
所述语音指示接受部对通过所述选项朗读部输出的所述选项中的任一项接受指示。
2.根据权利要求1所述的语音识别装置,其特征在于:
所述选项朗读部,在由所述语音指示接受部接受到的所述选项是指定用于筛选从所述规定画面跳转的跳转目的画面的选项的筛选条件的选项的情况下,进一步语音输出所述跳转目的画面的根据所述筛选条件筛选得到的选项。
3.根据权利要求1或2所述的语音识别装置,其特征在于:
所述选项朗读部,在由所述语音指示接受部接受到的所述选项是指定作为规定处理的处理对象而决定的决定条件的选项的情况下,对根据所述决定条件确定的所述处理对象进行所述规定的处理。
4.根据权利要求1~3中任一项所述的语音识别装置,其特征在于:
所述选项朗读部将所述规定画面的选项中的已显示完成的选项排除在外地进行语音输出。
5.根据权利要求1~4中任一项所述的语音识别装置,其特征在于:
所述规定画面中的各个所述选项确定规定的乐曲文件,
所述选项朗读部通过按照每个所述乐曲文件将该乐曲文件的乐曲的至少一部分再现而进行所述选项的语音输出。
6.根据权利要求1~5中任一项所述的语音识别装置,其特征在于:
具备履历生成部,其对所述接触指示接受部和所述语音指示接受部接受到指示的选项,更新所述选择履历信息的曾被选择的次数。
7.根据权利要求1~6中任一项所述的语音识别装置,其特征在于:
搭载于移动体,
还具备输入接受切换部,当所述移动体以规定速度以上的速度开始移动时,该输入接受切换部限制所述接触指示接受部接受指示。
8.一种语音识别程序,其使计算机执行语音识别工序,该语音识别程序的特征在于:
使所述计算机作为如下各个单元发挥作用:控制单元;通过接触的操作接受指示的接触指示接受单元;通过语音的操作接受指示的语音指示接受单元;和存储单元,该存储单元存储使画面与该画面中的选项对应的画面定义信息和确定每个所述选项曾被选择的次数的选择履历信息,
当在规定画面中限制所述接触指示接受单元接受指示时,使所述控制单元执行将所述规定画面中的选项以与所述曾被选择的次数相应的顺序语音输出的选项朗读工序,
在所述语音指示接受单元中,对在所述选项朗读工序中输出的所述选项的任一项接受指示。
9.一种语音识别方法,其是语音识别装置进行的语音识别方法,该语音识别方法的特征在于:
所述语音识别装置具备:
存储部,其存储使画面与该画面中的选项对应的画面定义信息和确定每个所述选项曾被选择的次数的选择履历信息;
接触指示接受部,其通过接触的操作接受指示;和
语音指示接受部,其通过语音的操作接受指示;
所述语音识别方法实施如下步骤:
选项朗读步骤,当在规定画面中限制所述接触指示接受部接受指示时,将所述规定画面中的选项以与所述曾被选择的次数相应的顺序语音输出;和
通过所述语音指示接受部,对在所述选项朗读工序中输出的所述选项的任一项接受指示的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013001373 | 2013-01-08 | ||
JP2013-001373 | 2013-01-28 | ||
PCT/JP2013/078498 WO2014109104A1 (ja) | 2013-01-08 | 2013-10-21 | 音声認識装置、音声認識プログラム及び音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104903846A true CN104903846A (zh) | 2015-09-09 |
CN104903846B CN104903846B (zh) | 2017-07-28 |
Family
ID=51166769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380069575.2A Active CN104903846B (zh) | 2013-01-08 | 2013-10-21 | 语音识别装置和语音识别方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150348555A1 (zh) |
EP (1) | EP2945052B1 (zh) |
JP (1) | JPWO2014109104A1 (zh) |
CN (1) | CN104903846B (zh) |
WO (1) | WO2014109104A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106814909A (zh) * | 2015-11-27 | 2017-06-09 | 泰勒斯公司 | 使用包括语音识别单元的用于飞行器的人机界面装置的方法 |
CN107342082A (zh) * | 2017-06-29 | 2017-11-10 | 北京小米移动软件有限公司 | 基于语音交互的音频处理方法、装置及音频播放设备 |
CN109905556A (zh) * | 2017-11-29 | 2019-06-18 | 京瓷办公信息系统株式会社 | 显示装置、图像处理装置、通知方法和处理执行方法 |
Families Citing this family (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
EP4138075A1 (en) | 2013-02-07 | 2023-02-22 | Apple Inc. | Voice trigger for a digital assistant |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10791216B2 (en) | 2013-08-06 | 2020-09-29 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
JP2017062300A (ja) * | 2015-09-24 | 2017-03-30 | セイコーエプソン株式会社 | 半導体装置、システム、電子機器、及び、音声認識方法 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770411A1 (en) * | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US11099540B2 (en) | 2017-09-15 | 2021-08-24 | Kohler Co. | User identity in household appliances |
US11093554B2 (en) | 2017-09-15 | 2021-08-17 | Kohler Co. | Feedback for water consuming appliance |
US10448762B2 (en) | 2017-09-15 | 2019-10-22 | Kohler Co. | Mirror |
US10887125B2 (en) | 2017-09-15 | 2021-01-05 | Kohler Co. | Bathroom speaker |
US11314215B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Apparatus controlling bathroom appliance lighting based on user identity |
CN111801249A (zh) * | 2018-02-22 | 2020-10-20 | 三菱电机株式会社 | 操作限制控制装置以及操作限制控制方法 |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11231848B2 (en) * | 2018-06-28 | 2022-01-25 | Hewlett-Packard Development Company, L.P. | Non-positive index values of panel input sources |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
CN112802474A (zh) * | 2019-10-28 | 2021-05-14 | 中国移动通信有限公司研究院 | 语音识别方法、装置、设备及存储介质 |
US11043220B1 (en) | 2020-05-11 | 2021-06-22 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11756544B2 (en) * | 2020-12-15 | 2023-09-12 | Google Llc | Selectively providing enhanced clarification prompts in automated assistant interactions |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001125766A (ja) * | 1999-10-28 | 2001-05-11 | Sumitomo Electric Ind Ltd | 車両に搭載される機器の制御装置および方法 |
JP2002311986A (ja) * | 2001-04-17 | 2002-10-25 | Alpine Electronics Inc | ナビゲーション装置 |
JP2005053331A (ja) * | 2003-08-04 | 2005-03-03 | Nissan Motor Co Ltd | 車載機器用情報提示装置 |
CN1864204A (zh) * | 2002-09-06 | 2006-11-15 | 语音信号技术有限公司 | 用来完成语音识别的方法、系统和程序 |
US20120278765A1 (en) * | 2011-04-28 | 2012-11-01 | Kazuki Kuwahara | Image display apparatus and menu screen displaying method |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3951705B2 (ja) | 2001-12-27 | 2007-08-01 | 株式会社デンソー | 電子機器 |
CA2644943A1 (en) * | 2005-03-04 | 2006-09-14 | Musicip Corporation | Scan shuffle for building playlists |
US7870142B2 (en) * | 2006-04-04 | 2011-01-11 | Johnson Controls Technology Company | Text to grammar enhancements for media files |
US8811938B2 (en) * | 2011-12-16 | 2014-08-19 | Microsoft Corporation | Providing a user interface experience based on inferred vehicle state |
-
2013
- 2013-10-21 WO PCT/JP2013/078498 patent/WO2014109104A1/ja active Application Filing
- 2013-10-21 CN CN201380069575.2A patent/CN104903846B/zh active Active
- 2013-10-21 EP EP13870530.6A patent/EP2945052B1/en active Active
- 2013-10-21 JP JP2014556325A patent/JPWO2014109104A1/ja active Pending
- 2013-10-21 US US14/759,537 patent/US20150348555A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001125766A (ja) * | 1999-10-28 | 2001-05-11 | Sumitomo Electric Ind Ltd | 車両に搭載される機器の制御装置および方法 |
JP2002311986A (ja) * | 2001-04-17 | 2002-10-25 | Alpine Electronics Inc | ナビゲーション装置 |
CN1864204A (zh) * | 2002-09-06 | 2006-11-15 | 语音信号技术有限公司 | 用来完成语音识别的方法、系统和程序 |
JP2005053331A (ja) * | 2003-08-04 | 2005-03-03 | Nissan Motor Co Ltd | 車載機器用情報提示装置 |
US20120278765A1 (en) * | 2011-04-28 | 2012-11-01 | Kazuki Kuwahara | Image display apparatus and menu screen displaying method |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106814909A (zh) * | 2015-11-27 | 2017-06-09 | 泰勒斯公司 | 使用包括语音识别单元的用于飞行器的人机界面装置的方法 |
CN107342082A (zh) * | 2017-06-29 | 2017-11-10 | 北京小米移动软件有限公司 | 基于语音交互的音频处理方法、装置及音频播放设备 |
CN109905556A (zh) * | 2017-11-29 | 2019-06-18 | 京瓷办公信息系统株式会社 | 显示装置、图像处理装置、通知方法和处理执行方法 |
CN109905556B (zh) * | 2017-11-29 | 2020-10-27 | 京瓷办公信息系统株式会社 | 显示装置、图像处理装置、通知方法和处理执行方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2945052A1 (en) | 2015-11-18 |
EP2945052B1 (en) | 2017-12-20 |
WO2014109104A1 (ja) | 2014-07-17 |
JPWO2014109104A1 (ja) | 2017-01-19 |
CN104903846B (zh) | 2017-07-28 |
EP2945052A4 (en) | 2016-08-10 |
US20150348555A1 (en) | 2015-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104903846A (zh) | 语音识别装置、语音识别程序和语音识别方法 | |
CN101371103B (zh) | 用于接收及播放声音样本的导航装置及方法 | |
CN107315749B (zh) | 媒体处理方法、装置、设备和系统 | |
CN101141153A (zh) | 电子设备和电子设备操作控制方法 | |
CN102564444A (zh) | 路径引导装置、路径引导方法以及计算机程序 | |
CN101548155A (zh) | 导航装置 | |
CN108885116B (zh) | 通信终端、服务器装置、移动引导系统以及计算机程序 | |
CN112346621A (zh) | 一种虚拟功能按钮显示方法及装置 | |
JP2008039573A (ja) | 思い出情報提示システム | |
JP2009092428A (ja) | 情報提供装置 | |
JP2004294262A (ja) | 車載情報機器、経路楽曲情報データベース作成方法、楽曲情報検索方法、情報処理方法及びコンピュータプログラム | |
JP2007219097A (ja) | 車載画像表示制御装置および車載画像表示制御用プログラム | |
JP2006080579A (ja) | 情報端末装置 | |
JP2007303981A (ja) | ナビゲーション装置 | |
JP4779545B2 (ja) | 車載用情報提供装置 | |
JP2008122495A (ja) | オーディオ連携経路案内システム及びオーディオ連携経路案内方法 | |
JP7100466B2 (ja) | コンテンツ再生装置、コンテンツ再生方法 | |
JP2008224508A (ja) | ナビゲーション装置 | |
JP2021032857A (ja) | 情報処理装置、情報処理方法、音声出力システム、プログラム | |
WO2019012684A1 (ja) | 再生リスト作成装置および再生リスト作成方法 | |
JP2006103520A (ja) | オーディオ再生機能付きナビゲーション装置及び情報端末、オーディオデータ再生方法、及びオーディオデータ再生設定方法 | |
JP2006023171A (ja) | 車載情報端末 | |
JP2010085201A (ja) | ナビゲーション装置 | |
JP2023143320A (ja) | 楽曲提供装置、楽曲提供方法、およびプログラム | |
JP2023125038A (ja) | 映像作成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |