CN115720654A - 信息处理装置和信息处理方法 - Google Patents
信息处理装置和信息处理方法 Download PDFInfo
- Publication number
- CN115720654A CN115720654A CN202080102506.7A CN202080102506A CN115720654A CN 115720654 A CN115720654 A CN 115720654A CN 202080102506 A CN202080102506 A CN 202080102506A CN 115720654 A CN115720654 A CN 115720654A
- Authority
- CN
- China
- Prior art keywords
- voice data
- user
- control
- information processing
- notification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 42
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000004590 computer program Methods 0.000 title description 2
- 238000004378 air conditioning Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 16
- 239000000725 suspension Substances 0.000 description 16
- 238000000034 method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000008054 signal transmission Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
信息处理装置(1)具备:语音数据输入装置(麦克风(11)),其被输入语音数据;用户数据输入装置(输入装置(10)),其被用户输入用户数据;以及控制器(20)。控制器(20)识别输入到语音数据输入装置(麦克风(11))的第一语音数据,基于对第一语音数据进行识别得到的结果来输出表示对规定设备进行控制的第二语音数据,在第二语音数据的通知完成之后,基于对识别得到的结果来控制规定设备,另一方面,当在通知第二语音数据的期间内输入了表示中止对规定设备的控制的用户数据的情况下,中止对规定设备的控制。
Description
技术领域
本发明涉及一种信息处理装置和信息处理方法。
背景技术
以往,已知有通过用户的语音来控制遥控器等设备的发明(专利文献1)。专利文献1所记载的发明识别用户的语音,并将与用户的指令对应的控制内容显示在遥控器上。用户对遥控器所显示的控制内容进行确认,通过由用户对控制内容进行核准来执行控制。
现有技术文献
专利文献
专利文献1:日本特开2007-286174号公报
发明内容
发明要解决的问题
然而,专利文献1所记载的发明使用户确认控制内容,并且需要核准,因此存在到实际执行控制为止需要时间这一问题。
本发明是鉴于上述问题而完成的,其目的在于提供一种只在必要的情况下中止控制且只要没有中止指示就迅速且自动地执行控制的信息处理装置和信息处理方法。
用于解决问题的方案
本发明的一个方式所涉及的信息处理装置识别输入到语音数据输入装置的第一语音数据,基于对第一语音数据进行识别得到的结果来输出表示对规定设备进行控制的第二语音数据,在第二语音数据的通知完成之后,基于识别得到的结果来控制规定设备,另一方面,当在通知第二语音数据的期间内输入了表示中止对规定设备的控制的用户数据的情况下,中止对规定设备的控制。
发明的效果
根据本发明,只在必要的情况下中止控制且只要没有中止指示就迅速且自动地执行控制。
附图说明
图1是本发明的实施方式所涉及的信息处理装置1的结构图。
图2是对本发明的实施方式所涉及的信息处理装置1的一个动作例进行说明的时序图。
图3是对显示器12的显示例进行说明的图。
图4是示出语音识别功能已启动的图。
图5是正在从扬声器31通知反馈用的语音数据的期间的显示例。
图6是对用户为了中止由控制器20进行的控制而进行的操作的一例进行说明的图。
图7是对用户为了中止由控制器20进行的控制而进行的操作的其它例进行说明的图。
图8是对用户为了中止由控制器20进行的控制而进行的操作的其它例进行说明的图。
图9是对用户为了中止由控制器20进行的控制而进行的操作的其它例进行说明的图。
图10是本发明的变形例所涉及的信息处理装置2的结构图。
图11是对本发明的变形例所涉及的信息处理装置2的一个动作例进行说明的时序图。
图12是对本发明的变形例所涉及的信息处理装置2的一个动作例进行说明的时序图。
具体实施方式
下面参照附图来对本发明的实施方式进行说明。在附图的记载中,对相同部分标注相同的附图标记并省略说明。
参照图1来对本实施方式所涉及的信息处理装置1的结构例进行说明。作为一个例子,信息处理装置1被搭载于车辆。如图1所示,信息处理装置1具备输入装置10、控制器20、数据库30以及扬声器31。
输入装置10是受理来自乘坐车辆的用户的数据的设备的统称。如图1所示,输入装置10包括麦克风11、触摸面板12、开关13以及摄像机14。麦克风11被输入用户的语音数据。麦克风11的设置位置例如是驾驶席的附近。触摸面板12受理由用户的触摸操作进行的输入。触摸面板12主要被用作导航装置的显示器。开关13设置于方向盘,受理用户的输入(开关接通)。摄像机14例如设置在驾驶席的附近,拍摄用户的姿势、手势等。输入到输入装置10的数据被发送到控制器20。
控制器20是具备CPU(Central Processing Unit:中央处理单元)、存储器、存储装置、输入输出部等的通用的计算机。控制器20处理从输入装置10获取到的数据。具体地说,CPU将存储在存储装置中的各种程序读取到存储器,并执行程序中包含的各种命令。由此,控制器20作为信息处理装置1具备的多个信息处理电路发挥功能。控制器20作为多个信息处理电路,具备语音识别部21、语音输出部22、通知结束判定部23以及控制信号发送部24。
语音识别部21识别输入到麦克风11的用户的语音数据。语音识别使用频率分析等公知的技术。语音识别部21将识别得到的结果输出到语音输出部22。
语音输出部22参照数据库30来获取与语音识别部21的识别结果对应的反馈用的语音数据。反馈用的语音数据与此后要实施的对规定设备的控制有关,用于敦促用户进行确认。例如在用户的语音数据被识别为“开驾驶席的车窗”的情况下,与之对应的反馈用的语音数据是“打开驾驶席的车窗”。反馈用的语音数据预备有多个且保存在数据库30中。此外,在本实施方式中,设为数据库30被存储在与控制器20的存储装置不同的存储装置中来进行了说明,但是不限定于此。数据库30也可以存储在控制器20的存储装置中。
语音输出部22通过扬声器31向用户通知反馈用的语音数据。此外,语音输出部22也可以基于语音识别部21的识别结果,每次都生成反馈用的语音数据。作为生成方法,只要以生成对用户的语音数据进行复读那样的语音数据的方式进行编程即可。
语音输出部22在开始了反馈用的语音数据的输出的情况下,向通知结束判定部23发送表示已开始的信号。另外,语音输出部22在反馈用的语音数据的输出已结束的情况下,向通知结束判定部23发送表示已结束的信号。在下面,有时将表示已开始的信号简称为开始信号。同样地,有时将表示已结束的信号简称为结束信号。
通知结束判定部23判定由语音输出部22进行的通知是否已结束。具体地说,在从语音输出部22接收到开始信号之后接收到结束信号的情况下,通知结束判定部23判定为由语音输出部22进行的通知已结束。另一方面,在从语音输出部22接收到开始信号但之后没有接收到结束信号的情况下,通知结束判定部23判定为由语音输出部22进行的通知没有结束。通知结束判定部23在判定为由语音输出部22进行的通知已结束的情况下,向控制信号发送部24发送表示通知已结束的信号。
在从通知结束判定部23接收到表示通知已结束的信号的情况下,控制信号发送部24基于根据语音识别部21的识别结果得到的用户的指示(语音数据)来控制规定设备。规定设备是搭载于车辆的设备,如图1所示,包括电动车窗32、空调装置33、天窗34、遮阳板35、电动尾门36、电动后备箱37、导航装置38、音频装置39等。作为一个例子,在用户的指示是“开驾驶席的车窗”的情况下,控制信号发送部24对驾驶席的电动车窗32发送用于打开车窗的信号。电动车窗32基于接收到的信号自动地打开车窗。此外,规定设备也可以包括进行自动驾驶等行驶控制的设备。
接着,参照图2~图9来对信息处理装置1的一个动作例进行说明。
在图2所示的步骤S101中,乘坐车辆的用户使语音识别功能启动。在本实施方式中,语音识别功能不是始终启动着的。语音识别功能根据用户的指示而启动。参照图3来对语音识别功能的启动方法的一例进行说明。如图3所示,在行驶中,在触摸面板12上显示由导航装置38进行的路径引导。在触摸面板12上显示有表示发言的图标50。通过用户对该图标50进行触摸操作来启动语音识别功能。作为其它启动方法,也可以使设置于方向盘的开关13具有启动的触发功能,也可以将识别到用户关于规定的关键词的发言作为触发来使语音识别功能启动。
当语音识别功能启动时,触摸面板12的显示切换为图4所示的内容。如图4所示,在启动了语音识别功能之后的触摸面板12上显示图标51、图标52、以及能够通过语音进行指示的设备。此外,在图4中,作为能够通过语音进行指示的设备,显示有空调装置、电动车窗、导航装置、音频装置,但这是一个例子。
图4所示的图标52是表示能够进行语音识别的图标。用户在确认了图标52显示在触摸面板12上之后,通过语音来输入用于使规定设备动作的指示。即,如图2的步骤S103所示,用户朝向麦克风11输入语音数据。在图2中,用户的指示是“开驾驶席的车窗”。
处理进入步骤S105,获取到用户的语音数据的语音识别部21对语音数据进行识别。处理进入步骤S107,语音输出部22参照数据库30来获取与语音识别部21的识别结果对应的反馈用的语音数据。用户的指示被识别为“开驾驶席的车窗”,因此作为反馈用的语音数据而选择“打开驾驶席的车窗”。语音输出部22通过扬声器31来向用户通知反馈用的语音数据。在开始了反馈用的语音数据的通知时,即,在开始从扬声器31进行反馈用的语音数据的输出时,触摸面板12的显示切换为图5所示的内容。
处理进入步骤S109,通知结束判定部23判定由语音输出部22进行的通知是否已结束。在从语音输出部22接收到开始信号之后接收到结束信号的情况下,通知结束判定部23判定为由语音输出部22进行的通知已结束。在图2中,由语音输出部22进行的通知已结束的意思是,“打开驾驶席的车窗”这一语音数据的输出已结束。
在从语音输出部22接收到开始信号但之后没有接收到结束信号的情况下,通知结束判定部23判定为由语音输出部22进行的通知没有结束。换而言之,在从语音输出部22接收到开始信号但之后没有接收到结束信号的情况下,通知结束判定部23判定为正在从扬声器31通知反馈用的语音数据。
在判定为由语音输出部22进行的通知已结束的情况下(步骤S109:“否”),处理进入步骤S111。在步骤S111中,通知结束判定部23向控制信号发送部24发送表示通知已结束的信号。接收到该信号的控制信号发送部24对驾驶席的电动车窗32发送用于打开车窗的控制信号。处理进入步骤S113,接收到控制信号的电动车窗32自动地打开车窗(步骤S115)。
另一方面,在判定为由语音输出部22进行的通知没有结束的情况下(步骤S109:“是”),处理进入步骤S119。
在步骤S119中,当在从扬声器31通知反馈用的语音数据的期间内从用户处接收到表示中止控制的信号的情况下(步骤S119:“是”),控制器20中止对规定设备的控制(步骤S121)。在此,对表示中止控制的信号(下面有时简称为中止信号)进行说明。中止信号是在用户进行了规定的操作的情况下向控制器20发送的信号。在用户通过语音指示了“开驾驶席的车窗”的情况下,用户通过扬声器31收到“打开驾驶席的车窗”这一反馈。此时,假设在语音识别存在错误的情况下,作为用户的期望,能够设想到中止控制。在图2所示的例中,准确地识别了用户的语音指示,但也可能存在例如“打开副驾驶席的车窗”之类的没有准确地识别用户的语音指示的情况。在这种情况下,作为用户的期望,能够设想到中止控制。
在本实施方式中,只要处于从扬声器31通知反馈用的语音数据的期间,用户就能够通过多个方法向控制器20发送中止信号,从而能够中止由控制器20进行的控制。另一方面,在由语音输出部22进行的通知已结束的情况下,用户不再能够向控制器20发送中止信号,或者即使能够发送,控制器20也不受理中止信号。因而,用户为了中止由控制器20进行的控制,需要在从扬声器31通知反馈用的语音数据的期间内进行规定的操作。此外,从扬声器31通知反馈用的语音数据的期间被定义为从通知结束判定部23从语音输出部22接收到开始信号到接收到结束信号为止的期间。
参照图6~图9来对用户为了中止由控制器20进行的控制而进行的规定的操作进行说明。
如图6所示,用户能够通过触摸触摸面板12所显示的图标51来中止由控制器20进行的控制。具体地说,当在从扬声器31通知反馈用的语音数据的期间用户触摸图标51时,中止信号被发送到控制器20。接收到中止信号的控制器20不对电动车窗32发送用于打开车窗的控制信号。由此,由控制器20进行的控制被中止。此外,图标51是所谓表示返回(return)的图标。
另外,如图7所示,用户能够通过触摸触摸面板12所显示的图标54来中止由控制器20进行的控制。具体地说,当在从扬声器31通知反馈用的语音数据的期间用户触摸图标54时,中止信号被发送到控制器20。此外,图标54中显示“中止”的文字。
或者,如图8所示,用户能够通过对触摸面板12进行滑屏来中止由控制器20进行的控制。滑屏是指在触碰触摸面板12的状态下滑动手指的操作。当在从扬声器31通知反馈用的语音数据的期间用户对触摸面板12进行滑屏时,中止信号被发送到控制器20。在图8所示的例中,从左向右进行滑屏,但是不限定于此。用户也可以从上向下进行滑屏,也可以从右向左进行滑屏。与滑屏的方向无关,只要在从扬声器31通知反馈用的语音数据的期间内进行了滑屏,中止信号就被发送到控制器20。
或者,如图9所示,用户能够通过按下设置于方向盘60的开关13中的特定的开关(图9中的开关61)来中止由控制器20进行的控制。具体地说,当在从扬声器31通知反馈用的语音数据的期间用户按下开关61时,中止信号被发送到控制器20。此外,开关61是所谓表示返回(return)的开关。
或者,用户能够使用语音来中止由控制器20进行的控制。具体地说,当在从扬声器31通知反馈用的语音数据的期间内用户朝向麦克风11通过语音指示了“中止”的情况下,由控制器20进行的控制被中止。当在从扬声器31通知反馈用的语音数据的期间内输入了语音数据的情况下,语音识别部21对所输入的语音数据进行识别。在识别得到的语音数据是表示中止控制的语音数据时,控制器20中止控制。在该情况下,在从扬声器31通知反馈用的语音数据的期间内输入的语音数据成为中止信号。
另外,作为别的例子,用户能够使用手势来中止由控制器20进行的控制。具体地说,当在从扬声器31通知反馈用的语音数据的期间内用户在摄像机14前进行了表示中止的手势的情况下,中止信号被发送到控制器20。作为一个例子,表示中止的手势是用手遮挡在摄像机14前的手势。当在从扬声器31通知反馈用的语音数据的期间内从摄像机14输入了图像数据的情况下,控制器20对图像数据进行解析。在从图像数据中检测到表示中止的手势的情况下,控制器20中止控制。在该情况下,在从扬声器31通知反馈用的语音数据的期间内输入的图像数据成为中止信号。
此外,中止控制的因素不限定于语音数据的误识别。例如也可能存在用户希望取消指示的情况。即,也存在以下情况:用户虽然通过语音指示了“开驾驶席的车窗”,但单纯地希望取消该指示。在这种情况下也与上述同样地,在从扬声器31通知反馈用的语音数据的期间内用户进行规定的操作即可。
回到图2。在步骤S117中,在从扬声器31通知反馈用的语音数据的期间内用户进行了用于发送中止信号的操作的情况下,中止信号被发送到控制器20。对步骤S119、121已进行了说明。图2所示的例子是发送中止信号的情况,但当然也存在不发送中止信号的情况。在从扬声器31通知反馈用的语音数据的期间内用户什么也不做的情况下,当然不发送中止信号。在该情况下,在通知已结束之后,迅速地打开车窗。
在图2的步骤S109中,由语音输出部22进行的通知已结束的意思是,在从扬声器31通知反馈用的语音数据的期间内没有从用户发送中止信号而通知结束。
此外,设为在由语音输出部22进行的通知已结束的情况下用户不再能够向控制器20发送中止信号来进行了说明,对此进行补充。在由语音输出部22进行的通知已结束的情况下,触摸面板12的显示从图5所示的内容切换为图3所示的内容。因此在由语音输出部22进行的通知已结束的情况下,用户不再能够使用触摸面板12来发送中止信号。
(作用效果)
如上面说明的那样,根据本实施方式所涉及的信息处理装置1,能够得到下面的作用效果。
信息处理装置1具备:语音数据输入装置(麦克风11),其被输入乘坐车辆的用户的语音数据;用户数据输入装置(麦克风11、触摸面板12、开关13、摄像机14),其被用户输入用户数据;以及控制器20。控制器20识别输入到语音数据输入装置的第一语音数据。第一语音数据是表示用于使规定设备动作的指示的语音数据,一个例子是上述的“开驾驶席的车窗”。控制器20基于第一语音数据的识别结果来从扬声器31输出表示对规定设备进行控制的第二语音数据。第二语音数据的一个例子是上述的“打开驾驶席的车窗”。
在第二语音数据的通知完成之后,控制器20基于识别结果来控制规定设备,另一方面,当在通知第二语音数据的期间内输入了表示中止对规定设备的控制的用户数据的情况下,中止对规定设备的控制。表示中止控制的用户数据是上述的中止信号。根据具备这样的结构的信息处理装置1,在向用户反馈后,只要没有用户的中止指示就迅速且自动地执行控制。另外,用户能够根据需要来中止控制。
规定设备是搭载于车辆的设备。规定设备至少包括电动车窗32、空调装置33、天窗34、遮阳板35、电动尾门36、电动后备箱37、导航装置38、音频装置39中的任一者。
基于第二语音数据的通知是表示对规定设备进行控制的通知。作为一个例子,基于第二语音数据的通知是表示打开电动车窗32的车窗的通知。
在没有输入表示中止对规定设备的控制的用户数据而基于第二语音数据的通知结束的情况下,控制器20执行对规定设备的控制。由此,在向用户反馈后,只要没有用户的中止指示就迅速且自动地执行控制。另外,在没有输入表示中止对规定设备的控制的用户数据而基于第二语音数据的通知结束的情况下,控制器20不受理其它用户数据的输入而执行对规定设备的控制。
用户数据是表示用户操作了触摸面板12的数据、拍摄用户的姿势得到的图像数据、表示用户操作了设置于方向盘上的开关61的数据、或者向语音数据输入装置输入的语音数据。
第二语音数据的通知完成之后被定义为第二语音数据的输出结束之后,通知第二语音数据的期间被定义为从第二语音数据的输出开始到结束为止的期间。
(变形例)
接着,参照图10来对本实施方式的变形例进行说明。
变形例所涉及的信息处理装置2与信息处理装置1相比,还具备确定部25和待机时间设定部26。对于与信息处理装置1重复的结构,引用附图标记并省略其说明。下面,以不同点为中心进行说明。
确定部25从输入装置10中确定用户能够利用的装置。在此所说的能够利用的装置的意思是能够被利用于中止由控制器20进行的控制的装置。即,能够利用的装置的意思是在从扬声器31通知反馈用的语音数据的期间内能够利用的装置。
在图10中,作为输入装置10示出了麦克风11、触摸面板12、开关13、摄像机14,但这些未必全部随时都能够利用。也可能存在由于故障等原因而不能够利用的情况。或者也可能存在由于某种限制而不能够利用的情况。作为确定是否能够利用的方法,能够通过有无表示正在正常工作的信号来确定。
确定部25在从麦克风11、触摸面板12、开关13、摄像机14接收到表示正在正常工作的信号的情况下,能够确定为该装置在从扬声器31通知反馈用的语音数据的期间内能够利用。确定部25将表示确定结果的信号发送到待机时间设定部26。
待机时间设定部26基于从确定部25接收到的信号来设定待机时间。待机时间是由语音输出部22进行的通知已结束之后受理来自用户的中止信号的时间。在上述的实施方式中,设为在由语音输出部22进行的通知已结束的情况下控制器20不受理中止信号来进行了说明,但在变形例中,即使是由语音输出部22进行的通知已结束之后,也在所设定的待机时间内受理中止信号。例如在由语音输出部22进行的通知为2秒且通过待机时间设定部26设定的待机时间为3秒的情况下,在变形例中用户能够发送中止信号的时间为5秒(2秒+3秒)。
接着,对待机时间的设定方法进行说明。根据由确定部25确定的能够利用的装置来设定待机时间。例如假设被确定为能够利用的装置只有摄像机14。在该情况下,待机时间设定得比确定到其它装置的情况更长。理由是,用户需要为了发送中止信号而用手遮挡在摄像机14前,而这是为了确保该动作所需的时间。该待机时间称为第一待机时间。
接着,假设被确定为能够利用的装置只有麦克风11。在该情况下,待机时间设定得比确定到摄像机14的情况短。这是由于与用手遮挡在摄像机14前的动作相比,发言所需的时间短。该待机时间称为第二待机时间。
接着,假设被确定为能够利用的装置只有触摸面板12。在该情况下,待机时间设定得比确定到摄像机14的情况短。这是由于与用手遮挡在摄像机14前的动作相比,触摸面板12的操作所需的时间短。该待机时间称为第三待机时间。
接着,假设被确定为能够利用的装置只有开关13(开关61)。在该情况下,待机时间设定得比确定到摄像机14的情况短。这是由于与用手遮挡在摄像机14前的动作相比,开关61的操作所需的时间短。该待机时间称为第四待机时间。
第一至第四待机时间的关系是,第一待机时间>第二待机时间>第三待机时间>第四待机时间。
接着,参照图11~图12来对信息处理装置2的一个动作例进行说明。其中,步骤S201~205、211、215~225的处理与图2所示的步骤S101~105、107、111~121中表示的处理相同,因此省略说明。
在步骤S207中,确定部25从麦克风11、触摸面板12、开关13、摄像机14接收表示正在正常工作的信号。在接收到信号的情况下,确定部25确定为该装置是能够利用的。确定部25将表示确定结果的信号发送到待机时间设定部26。
在步骤S209中,待机时间设定部26基于从确定部25接收到的信号来设定待机时间。
在步骤S213中,通知结束判定部23判定待机时间是否已结束。通知结束判定部23在从语音输出部22接收到开始信号之后从待机时间设定部26接收到表示待机时间已结束的信号的情况下,判定为待机时间已结束。举一个例子,在由语音输出部22进行的通知为2秒且通过待机时间设定部26设定的待机时间为3秒的情况下,在由语音输出部22进行的通知开始之后经过5秒的时间点判定为待机时间已结束。此外,在步骤S213中,待机时间已结束的意思是,没有从用户发送中止信号而待机时间结束。
(作用效果)
用户数据包含多个类别。具体地说,能够发送中止信号的设备包含多个类别(麦克风11、触摸面板12、开关13、摄像机14)。控制器20根据用户数据的类别来变更受理表示中止对规定设备的控制的用户数据的时间(待机时间)。根据具备这样的结构的信息处理装置2,在向用户反馈后,只要没有用户的中止指示就等待经过待机时间后迅速且自动地执行控制。另外,在待机时间的设定中使用用户数据的类别,因此能够进行适合用户接口的设定。
设为根据由确定部25确定的能够利用的装置设定待机时间来进行了说明,但是不限定于此。也可以根据与用户的指示对应的设备来设定待机时间。在像上述那样用户的指示是“开驾驶席的车窗”的情况下,与用户的指示对应的设备为电动车窗32。在其它例中,在用户的指示是“播放无线电广播”的情况下,与用户的指示对应的设备为音频装置39。也可以是,将与用户的指示对应的设备是如电动车窗32、天窗34、电动尾门36、电动后备箱37等那样可能发生夹入的设备的情况下的待机时间设定得比与用户的指示对应的设备是不会发生夹入的设备的情况下的待机时间长。由此,能够确保用户判断是否中止指示所使用的时间。
另外,也可以是,将与用户的指示对应的设备是进行自动驾驶等行驶控制的设备的情况下的待机时间设定得比与用户的指示对应的设备不是进行行驶控制的设备的情况下的待机时间长。这是由于行驶环境时时刻刻地变化,因此判断是否中止与行驶控制有关的指示有时花费时间。
另外,也可以根据车辆是行驶中还是停止中来设定待机时间。具体地说,也可以是,将车辆为行驶中的情况下的待机时间设定得比车辆为停止中的情况下的待机时间长。这是由于能够设想到在车辆为行驶中的情况下用户的反应与停止中的情况相比变慢。
上述的实施方式中记载的各功能能够通过一个或多个处理电路来实现。处理电路包括包含电路的处理装置等编程得到的处理装置。另外,处理电路包括以执行所记载的功能的方式配置的专用集成电路(ASIC)、电路部件等装置。
像上述的那样对本发明的实施方式进行了记载,但不应理解为构成本公开的一部分的论述和附图用于限定本发明。对于本领域技术人员而言,根据公开,各种代替实施方式、实施例以及运用技术应该会变得明了。
例如,存在以下情况:在从扬声器31通知反馈用的语音数据的期间内从用户处输入与中止信号不同的信号。控制器20也可以具有判定在从扬声器31通知反馈用的语音数据的期间内输入的信号是否为中止信号的功能。
也可以是,仅在规定设备是机械地动作的装置或控制车内环境的装置的情况下,控制器20受理表示中止对规定设备的控制的用户数据。机械地动作的装置是电动车窗32、天窗34、电动尾门36、电动后备箱37。控制车内环境的装置是空调装置33。由此,用户能够通过动作来中止对可能发生夹入的设备、会对驾驶造成影响的设备的控制。
近年的导航装置除路径引导以外具有多种功能。例如,这些功能包括提供天气信息、提供新闻等。因而,向麦克风11输入的用户的指示包含请求天气信息、新闻等的指示。
此外,对于请求天气信息和新闻的指示,控制器20也可以不受理中止信号。这是由于天气信息和新闻的提供不包含对机械的动作、驾驶造成影响的动作。
麦克风11不限定于设置于车辆的麦克风。也可以代用便携式终端(例如智能手机)的麦克风。在该情况下,便携式终端与控制器20以能够进行通信的方式连接。
附图标记说明
1、2:信息处理装置;10:输入装置;11:麦克风;12:触摸面板;13:开关;14:摄像机;20:控制器;21:语音识别部;22:语音输出部;23:通知结束判定部;24:控制信号发送部;25:确定部;26:待机时间设定部;30:数据库;31:扬声器。
Claims (11)
1.一种信息处理装置,其特征在于,具备:
语音数据输入装置,其被输入语音数据;
用户数据输入装置,其被用户输入用户数据;以及
控制器,
其中,所述控制器执行以下处理:
识别输入到所述语音数据输入装置的第一语音数据,
基于对所述第一语音数据进行识别得到的结果来输出表示对规定设备进行控制的第二语音数据,
在所述第二语音数据的通知完成之后,基于所述识别得到的结果来控制所述规定设备,另一方面,当在通知所述第二语音数据的期间内输入了表示中止对所述规定设备的控制的用户数据的情况下,中止对所述规定设备的控制。
2.根据权利要求1所述的信息处理装置,其特征在于,
所述规定设备是搭载于车辆的设备。
3.根据权利要求2所述的信息处理装置,其特征在于,
所述规定设备至少包括电动车窗、空调装置、天窗、遮阳板、电动尾门、电动后备箱、导航装置以及音频装置中的任一者。
4.根据权利要求1~3中的任一项所述的信息处理装置,其特征在于,
基于所述第二语音数据的通知是表示对所述规定设备进行控制的通知。
5.根据权利要求1~4中的任一项所述的信息处理装置,其特征在于,
在没有输入表示中止对所述规定设备的控制的用户数据而基于所述第二语音数据的通知结束的情况下,所述控制器执行对所述规定设备的控制。
6.根据权利要求1~4中的任一项所述的信息处理装置,其特征在于,
在没有输入表示中止对所述规定设备的控制的用户数据而基于所述第二语音数据的通知结束的情况下,所述控制器不受理其它的所述用户数据的输入而执行对所述规定设备的控制。
7.根据权利要求1~6中的任一项所述的信息处理装置,其特征在于,
所述用户数据是表示所述用户操作了触摸面板的数据、拍摄所述用户的姿势得到的图像数据、表示所述用户操作了设置在方向盘上的开关的数据、或者向所述语音数据输入装置输入的语音数据。
8.根据权利要求1~7中的任一项所述的信息处理装置,其特征在于,
所述第二语音数据的通知完成之后被定义为所述第二语音数据的输出结束之后,
通知所述第二语音数据的期间被定义为从所述第二语音数据的输出开始到结束为止的期间。
9.根据权利要求7所述的信息处理装置,其特征在于,
所述用户数据包含多个类别,
所述控制器根据所述用户数据的类别来变更受理表示中止对所述规定设备的控制的用户数据的时间。
10.根据权利要求1~9中的任一项所述的信息处理装置,其特征在于,
仅在所述规定设备是机械地动作的装置或控制车内环境的装置的情况下,所述控制器受理表示中止对所述规定设备的控制的用户数据。
11.一种信息处理方法,其特征在于,
识别输入到语音数据输入装置的第一语音数据,
基于对所述第一语音数据进行识别得到的结果来输出表示对规定设备进行控制的第二语音数据,
在所述第二语音数据的通知完成之后,基于所述识别得到的结果来控制所述规定设备,另一方面,当在通知所述第二语音数据的期间内输入了表示中止对所述规定设备的控制的用户数据的情况下,中止对所述规定设备的控制。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/025659 WO2022003822A1 (ja) | 2020-06-30 | 2020-06-30 | 情報処理装置及び情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115720654A true CN115720654A (zh) | 2023-02-28 |
Family
ID=79315778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080102506.7A Pending CN115720654A (zh) | 2020-06-30 | 2020-06-30 | 信息处理装置和信息处理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230290334A1 (zh) |
EP (1) | EP4174636A4 (zh) |
JP (2) | JP7396490B2 (zh) |
CN (1) | CN115720654A (zh) |
WO (1) | WO2022003822A1 (zh) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001216130A (ja) * | 2000-02-03 | 2001-08-10 | Denso Corp | 音声入力装置 |
JP3892302B2 (ja) * | 2002-01-11 | 2007-03-14 | 松下電器産業株式会社 | 音声対話方法および装置 |
JP4470803B2 (ja) | 2005-04-20 | 2010-06-02 | トヨタ自動車株式会社 | 車載装置 |
JP2007286174A (ja) | 2006-04-13 | 2007-11-01 | Funai Electric Co Ltd | 電子機器 |
JP2009069202A (ja) * | 2007-09-10 | 2009-04-02 | Teac Corp | 音声処理装置 |
JP5408810B2 (ja) * | 2011-06-24 | 2014-02-05 | アイシン・エィ・ダブリュ株式会社 | 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム |
KR20180084392A (ko) * | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
JP7087919B2 (ja) * | 2018-10-31 | 2022-06-21 | トヨタ自動車株式会社 | 運転支援装置、車両、運転支援方法およびプログラム |
-
2020
- 2020-06-30 WO PCT/JP2020/025659 patent/WO2022003822A1/ja unknown
- 2020-06-30 JP JP2022532885A patent/JP7396490B2/ja active Active
- 2020-06-30 EP EP20942468.8A patent/EP4174636A4/en active Pending
- 2020-06-30 US US18/003,765 patent/US20230290334A1/en active Pending
- 2020-06-30 CN CN202080102506.7A patent/CN115720654A/zh active Pending
-
2023
- 2023-11-29 JP JP2023201655A patent/JP2024026216A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230290334A1 (en) | 2023-09-14 |
JP7396490B2 (ja) | 2023-12-12 |
EP4174636A4 (en) | 2023-07-26 |
WO2022003822A1 (ja) | 2022-01-06 |
JPWO2022003822A1 (zh) | 2022-01-06 |
EP4174636A1 (en) | 2023-05-03 |
JP2024026216A (ja) | 2024-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106992009B (zh) | 车载语音交互方法、系统及计算机可读存储介质 | |
EP1082671B1 (en) | Handwritten and voice control of vehicle appliance | |
KR101601985B1 (ko) | 지원 기능을 갖춘 차량 시스템 및 차량 시스템 작동 방법 | |
US9965169B2 (en) | Systems, methods, and apparatus for controlling gesture initiation and termination | |
JP4363076B2 (ja) | 音声制御装置 | |
EP3168839A1 (en) | Voice recognition device and voice recognition system | |
CN110770693A (zh) | 手势操作装置及手势操作方法 | |
CN111506230B (zh) | 一种交互方法、装置和车辆 | |
US20140168064A1 (en) | System and method for manipulating user interface by 2d camera | |
CN111717136A (zh) | 车载多媒体设备及其控制方法和汽车 | |
CN106379262B (zh) | 一种带语音识别控制的车载蓝牙麦克风 | |
CN115720654A (zh) | 信息处理装置和信息处理方法 | |
CN115649109B (zh) | 基于智能汽车手环的汽车控制方法、系统及存储介质 | |
EP4369185A1 (en) | Execution instruction determination method and apparatus, device, and storage medium | |
KR20140079025A (ko) | 차량 내 다리 제스처 인식을 이용한 사용자 인터페이스 조작 방법 | |
CN115830724A (zh) | 基于多模态识别的车载识别交互方法及系统 | |
KR20170061453A (ko) | 운전 보조 장치 및 방법 | |
JP2005208798A (ja) | 情報提供端末、および情報提供方法 | |
JP4487298B2 (ja) | 音声認識装置 | |
JP2001216130A (ja) | 音声入力装置 | |
CN118205506A (zh) | 一种汽车座舱手势控制系统 | |
US20240300532A1 (en) | Driving support device and driving support method | |
EP4198711A1 (en) | System and method for time management in voice control applications | |
KR20150061807A (ko) | 수동 조작에 기반한 음성인식 명령어 안내 장치 및 방법 | |
JP2019175405A (ja) | 入力装置及び音声出力システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |