CN108376057A - 车载信息终端和存储信息搜索程序的计算机可读存储介质 - Google Patents

车载信息终端和存储信息搜索程序的计算机可读存储介质 Download PDF

Info

Publication number
CN108376057A
CN108376057A CN201810067905.9A CN201810067905A CN108376057A CN 108376057 A CN108376057 A CN 108376057A CN 201810067905 A CN201810067905 A CN 201810067905A CN 108376057 A CN108376057 A CN 108376057A
Authority
CN
China
Prior art keywords
search
voice
vehicle
information
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810067905.9A
Other languages
English (en)
Inventor
山下大树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Publication of CN108376057A publication Critical patent/CN108376057A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R11/00Arrangements for holding or mounting articles, not otherwise provided for
    • B60R11/02Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mechanical Engineering (AREA)
  • Signal Processing (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公开了一种车载信息终端和存储信息搜索程序的计算机可读存储介质。车载信息终端包括:识别处理单元,其被配置成识别输入的语音;以及搜索处理单元,其被配置成基于由识别处理单元识别的语音的内容来执行对信息的搜索。搜索处理单元被配置成:当车辆的速度高于或等于预定阈值时,在语音输入之后自动开始对信息的搜索,并且被配置成:当车辆的速度低于预定阈值时,在语音输入之后通过输入操作单元进行了开始搜索的操作的条件下,开始对信息的搜索。

Description

车载信息终端和存储信息搜索程序的计算机可读存储介质
技术领域
本发明涉及车载信息终端和存储信息搜索程序的计算机可读存储介质。
背景技术
通常,广为人知的是基于通过语音输入的关键字来执行对信息的搜索的信息终端。例如,日本专利申请公开第2004-265217号(JP 2004-265217A)中描述的信息终端通过语音识别功能将通过语音输入的数据转换成文本数据,并且根据所转换的文本数据生成搜索关键字。然后,信息终端将所生成的关键字发送至网络搜索服务器,然后将从网络搜索服务器接收到的搜索结果信息显示在显示单元上。因此,用户能够利用这种简单的方法自动获取搜索结果信息,使得用户只需向信息终端说出用户想要执行搜索的关键字即可。
信息终端一旦将通过语音输入的关键字显示在显示单元上,则用户根据需要基于所显示的关键字来校正关键字。然后,信息终端将关键字发送至网络搜索服务器。因此,与用户的意图不同的关键字难以被发送至网络搜索服务器,所以可以增加搜索信息的准确度。
发明内容
然而,如果将JP 2004-265217A中描述的信息终端安装在车辆上,则驾驶员可能难以检查通过语音输入的显示的关键字并根据车辆的行驶状况来校正关键字。亦即,在兼顾车辆的驾驶操作的可操作性和基于语音输入的信息搜索的可操作性中仍然存在改进的空间。
本发明提供了一种能够兼顾车辆的驾驶操作的可操作性和基于语音输入的信息搜索的可操作性的车载信息终端和存储信息搜索程序的计算机可读存储介质。
本发明的第一方面提供了一种车载信息终端。该车载信息终端被安装在车辆上。车载信息终端被配置成基于输入的语音来执行对信息的搜索。车载信息终端包括:识别处理单元,其被配置成识别输入的语音;以及搜索处理单元,其被配置成基于由识别处理单元识别的语音的内容来执行对信息的搜索。搜索处理单元被配置成:当车辆的速度高于或等于预定阈值时,在语音输入之后自动开始对信息的搜索。搜索处理单元被配置成:当车辆的速度低于预定阈值时,在语音输入之后通过输入操作单元进行了开始搜索的操作的条件下,开始对信息的搜索。
本发明的第二方面提供了一种存储信息搜索程序的计算机可读存储介质。信息搜索程序使计算机执行:语音识别处理,其识别通过安装在车辆上的语音输入单元输入的语音;以及搜索处理,其基于通过语音识别处理识别的语音的内容来执行对信息的搜索。在搜索处理中,当车辆的速度高于或等于预定阈值时,自动开始对信息的搜索;而当车辆的速度低于预定阈值时,在语音输入之后通过输入操作单元进行了开始搜索的操作的条件下,开始对信息的搜索。
利用上述配置,当车辆的速度相对高时,认为车辆的驾驶员没有富余时间(allowance)通过输入操作单元进行开始搜索信息的操作,因此无论是否存在开始搜索的操作,都基于输入的语音来自动开始对信息的搜索。另一方面,当车辆的速度相对低时,认为车辆的驾驶员有富余时间通过输入操作单元进行开始搜索信息的操作,因此在进行了开始搜索的操作的条件下基于输入的语音来开始对信息的搜索。亦即,是否基于输入的语音来自动开始对信息的搜索取决于车辆的行驶状况。因此,可以兼顾车辆的驾驶操作的可操作性和基于语音输入的信息搜索的可操作性。
在车载信息终端中,搜索处理单元可以被配置成:当车辆的速度高于或等于预定阈值时,在语音输入之后经过了待机时间的条件下,基于由识别处理单元识别的语音的内容自动开始对信息的搜索。
利用上述配置,即使当车辆的速度相对高时,也确保了在自动开始对信息的搜索之前的时间处驾驶员能够检查输入的语音的内容的待机时间。因此,可以减少基于与驾驶员的意图不一致的语音的内容来开始对信息的搜索的情况。
在车载信息终端中,搜索处理单元可以被配置成:当在从语音输入起经过待机时间之前车辆的速度从低于预定阈值的值改变成高于或等于预定阈值的值时,在从车辆的速度改变起经过了待机时间时自动开始对信息的搜索。
在从语音输入起经过待机时间之前,当车辆的行驶状况随着车辆的速度增加的趋势而显著改变时,例如当车辆在交叉路口处开始移动时,认为驾驶员失去了在路上进行开始搜索信息的操作的富余时间。因此,在上述配置中,在这种情况下,虽然从驾驶员失去富余时间时起确保了驾驶员能够检查输入的语音的内容的待机时间,但是无论是否存在通过输入操作单元开始搜索的操作,都基于输入的语音来开始对信息的搜索。因此,考虑了在语音输入之后车辆的行驶状况的改变,同时可以适当地兼顾车辆的驾驶操作的可操作性和基于语音输入的信息搜索的可操作性。
在车载信息终端中,搜索处理单元可以被配置成:当车辆的速度低于预定阈值时并且当在从语音输入起经过待机时间之前没有通过输入操作单元进行开始搜索的操作时,丢弃由识别处理单元识别的语音的数据。
利用上述配置,尽管车辆的驾驶员有富余时间通过输入操作单元进行开始搜索信息的操作,但是即使当从语音输入起经过了一定时间时,也没有来自驾驶员的意图的声明,因此丢弃所识别语音的数据,并且确保输入新语音的机会。因此,可以进一步改进基于与驾驶员的意图一致的语音输入的信息搜索的可操作性。
在车载信息终端中,搜索处理单元可以被配置成:当在语音输入之后经过待机时间之前车辆的速度从高于或等于预定阈值的值改变成低于预定阈值的值时并且当在从车辆的速度改变起经过待机时间之前没有通过输入操作单元进行开始搜索的操作时,丢弃由识别处理单元识别的语音的数据。
在从语音输入起经过待机时间之前,当车辆的行驶状况随着车辆的速度减小的趋势而显著改变时,例如当车辆在交叉路口处停止时,认为驾驶员获得了在半路上进行开始搜索信息的操作的富余时间。因此,在上述配置中,在即使当从驾驶员确保富余时间时起经过了一定时间时也不存在来自驾驶员的意图的声明的情况下,丢弃所识别的语音的数据,并且确保输入新语音的机会。因此,在考虑到在语音输入之后车辆的行驶状况的改变的同时,可以进一步改进基于与驾驶员的意图一致的语音输入的信息搜索的可操作性。
在车载信息终端中,预定阈值可以是作为关于车辆的行驶状况是行驶状态还是停止状态的确定准则的车辆的速度。通常,车辆的驾驶员通过输入操作单元进行开始搜索信息的操作的富余时间的程度根据车辆的行驶状况是行驶状态还是停止状态而显著变化。在这方面,在上述配置中,响应于车辆的行驶状况是行驶状态还是停止状态来切换是否自动开始对信息的搜索。因此,可以进一步适当地兼顾车辆的驾驶操作的可操作性和基于语音输入的信息搜索的可操作性。
附图说明
下面将参照附图来描述本发明的示例性实施方式的特征、优点以及技术和工业意义,在附图中,相同的附图标记表示相同的元件,并且其中:
图1是示出根据实施方式的车载信息终端的示意性配置的框图;
图2是用于示出搜索信息的处理的示意图;
图3是示出由根据实施方式的车载信息终端执行的信息搜索处理的详细过程的流程图;以及
图4是示出车辆的行驶状况与开始搜索信息的时刻之间的对应关系的示意图。
具体实施方式
根据实施方式的车载信息终端基于从车辆的驾驶员输入的语音来执行对信息的搜索。在该车载信息终端中,基于车辆的速度来确定车辆的行驶状况,并且当确定车辆在行驶时,在语音输入之后自动开始搜索信息。另一方面,当车载信息终端确定车辆停止时,在语音输入之后,在车辆的驾驶员进行了开始搜索的操作的条件下,车载信息终端开始搜索信息。当车载信息终端开始搜索信息时,车载信息终端基于从车辆的驾驶员输入的语音来生成作为搜索目标的关键字,并且将所生成的关键字发送至外部服务器。此后,当车载信息终端从外部服务器接收到搜索结果信息时,车载信息终端将接收到的搜索结果信息输出至显示装置,并且将搜索结果信息显示给车辆的驾驶员。
具体地,如图1所示,其上安装有根据本实施方式的车载信息终端100的车辆包括麦克风10、车辆速度传感器20、输入操作单元30、显示装置200和无线通信单元210。这些部件电连接至车载信息终端100。
车载信息终端100包括识别处理单元110。驾驶员发出的语音的信号通过设置在车辆中的麦克风10输入至识别处理单元110。例如,识别处理单元110将从麦克风10输入的语音划分成均具有一定时间宽度的多个区间(section),并且通过动态编程(DP)匹配等将所划分的每个区间中包括的语音的特征向量与预先准备的语音模式的特征向量进行比较。识别处理单元110将特征向量具有最高相似度的语音模式识别为在该区间中发出的语音的内容,并且将所识别的语音内容转换成文本数据。识别处理单元110将所转换的文本数据输出至搜索处理单元140。
车载信息终端100包括行驶状况确定单元120。行驶状况确定单元120基于从车辆速度传感器20输入的车辆的速度来确定车辆的行驶状况。行驶状况确定单元120在车辆的速度高于或等于预定阈值时确定车辆在行驶,而在车辆的速度低于预定阈值时确定车辆停止。即,预定阈值被设置成作为关于车辆的行驶状况是行驶状态还是停止状态的确定准则的车辆的速度。行驶状况确定单元120将关于车辆的行驶状况的确定结果输出至搜索模式设置单元130。
搜索模式设置单元130基于从行驶状况确定单元120输入的车辆的行驶状况来设置信息搜索模式。信息搜索模式是搜索处理单元140执行对信息的搜索的模式。更具体地,搜索模式设置单元130在车辆行驶时将自动搜索模式设置为信息搜索模式。在自动搜索模式下,在语音输入之后自动开始搜索信息。搜索模式设置单元130在车辆停止时将手动搜索模式设置为信息搜索模式。在手动搜索模式下,在语音输入之后,在车辆的驾驶员进行了开始搜索的操作的条件下开始搜索信息。搜索模式设置单元130将设置的信息搜索模式输出至搜索处理单元140。
搜索处理单元140基于从搜索模式设置单元130输入的信息搜索模式、通过使用从识别处理单元110输入的文本数据作为搜索关键字来执行对信息的搜索。即使当信息搜索模式是自动搜索模式和手动搜索模式中的任何一种时,搜索处理单元140都将从识别处理单元110输入的文本数据输出至显示装置200并且显示该文本数据。
当正在执行自动搜索模式时,从从识别处理单元110输入了文本数据时起到车辆的驾驶员通过输入操作单元30进行开始搜索信息的操作时或者直到经过了第一待机时间,搜索处理单元140进行等待。在经过第一待机时间之前的时间期间,搜索处理单元140通过启动网络浏览器向显示装置200输出用于执行对信息的搜索的浏览器页面,并且将该浏览器页面显示在显示装置200上。搜索处理单元140在将从识别处理单元110输入的文本数据显示在搜索框中的同时,通过输入操作单元30接收校正文本数据的操作,该搜索框用于在显示装置200上显示的浏览器页面上显示搜索目标。当进行了校正文本数据的操作时,搜索处理单元140将经校正的文本数据输出至显示装置200,并且将经校正的文本数据显示在显示装置200上。校正文本数据的操作可以以这样的方式来进行:驾驶员通过输入操作单元30手动选择文本数据的校正部分。替选地,校正文本数据的操作可以以这样的方式来进行:驾驶员通过输入操作单元30进行开始校正的操作,然后通过麦克风10重新输入语音。
当在经过第一待机时间之前进行了开始搜索信息的操作时,搜索处理单元140在进行了开始搜索信息的操作时开始搜索信息。另一方面,即使当在经过第一待机时间之前没有进行开始搜索信息的操作时,搜索处理单元140也在自从识别处理单元110输入了文本数据起经过了第一待机时间时开始搜索信息。
当正在执行手动搜索模式时,自从识别处理单元110输入了文本数据时起到车辆的驾驶员通过输入操作单元30进行开始搜索信息的操作时或者直到经过了第二待机时间,搜索处理单元140进行等待。在本实施方式中,第二待机时间被设置成比第一待机时间长。在直到经过了第二待机时间的时间期间,搜索处理单元140在将文本数据显示在显示装置200上的同时,通过输入操作单元30接收校正文本数据的操作。当进行了校正文本数据的操作时,搜索处理单元140将经校正的文本数据输出至显示装置200,并且将经校正的文本数据显示在显示装置200上。当在经过第二待机时间之前进行了开始搜索信息的操作时,搜索处理单元140在进行了开始搜索信息的操作时开始搜索信息。另一方面,即使当在经过第二待机时间之前没有进行开始搜索信息的操作时,搜索处理单元140也不开始搜索信息。搜索处理单元140丢弃从识别处理单元110输入的文本数据,然后从识别处理单元110接收新文本数据的输入。
在正在执行自动搜索模式的情况下,当在经过第一待机时间之前车辆停止时,从行驶状况确定单元120向搜索模式设置单元130输入车辆的行驶状况的改变。因此,搜索模式设置单元130将信息搜索模式的设置从自动搜索模式切换到手动搜索模式。当从搜索模式设置单元130输入的信息搜索模式已被切换时,搜索处理单元140将第一待机时间的计数重置为零,并且开始第二待机时间的计数。当在经过第二待机时间之前进行了开始搜索信息的操作时,搜索处理单元140在进行了开始搜索信息的操作时开始搜索信息。另一方面,当在经过第二待机时间之前没有进行开始搜索信息的操作时,搜索处理单元140不开始搜索信息。在这种情况下,搜索处理单元140丢弃从识别处理单元110输入的文本数据,然后从识别处理单元110接收新文本数据的输入。
在正在执行手动搜索模式的情况下,当在经过第二待机时间之前车辆开始行驶时,从行驶状况确定单元120向搜索模式设置单元130输入车辆的行驶状况的改变。因此,搜索模式设置单元130将信息搜索模式的设置从手动搜索模式切换到自动搜索模式。当从搜索模式设置单元130输入的信息搜索模式已被切换时,搜索处理单元140将第二待机时间的计数重置为零,并且开始第一待机时间的计数。当在经过第一待机时间之前进行了开始搜索信息的操作时,搜索处理单元140在进行了开始搜索信息的操作时开始搜索信息。另一方面,即使当在经过第一待机时间之前没有进行开始搜索信息的操作时,搜索处理单元140也在经过了第一待机时间时开始搜索信息。
此后,当搜索处理单元140开始搜索信息时,搜索处理单元140通过无线通信单元210将从识别处理单元110输入的文本数据作为搜索关键字发送至外部服务器300。另一方面,当外部服务器300从搜索处理单元140接收到搜索关键字时,外部服务器300通过使用接收到的关键字作为输入来使搜索引擎进行操作,并且获取搜索结果信息。外部服务器300经由无线通信单元210将从搜索引擎获取的搜索结果发送至搜索处理单元140。搜索处理单元140将从外部服务器300接收到的搜索结果信息输出至显示装置200,并且将搜索结果信息显示在显示装置200上。
接下来,将参照图2来描述车载信息终端100基于来自驾驶员的语音输入来执行对信息的搜索的处理中要显示在显示装置200上的视图的示例。在该示例中,显示装置200由触摸面板构成,并且显示装置200的显示屏用作输入操作单元30。当驾驶员用手指触摸显示装置200上显示的操作按钮时,执行各种操作。
如图2的(a)所示,车载信息终端100最初向显示装置200输出用于执行对信息的搜索的浏览器页面DP,并且将该浏览器页面DP显示在显示装置200上。在该图所示的示例中,在开始语音输入时使用的输入开始按钮B1与搜索框C1并排显示在浏览器页面DP上的左上位置处。
如图2的(b)所示,当输入开始按钮B1被驾驶员触摸时,车载信息终端100将浏览器页面DP切换到提示驾驶员输入语音的页面。
随后,如图2的(c)所示,当驾驶员通过语音输入关键字时,车载信息终端100将输入的关键字显示在浏览器页面DP上的搜索框C1中。在该图所示的示例中,指示关于车辆的行驶位置附近的银行的询问的关键字被显示在浏览器页面DP上的搜索框C1中。
在这种情况下,当车辆在行驶时,车载信息终端100等待,直到从驾驶员通过语音输入了关键字起经过了第一待机时间。在此期间,车载信息终端100在浏览器页面DP上的搜索框C1中持续显示驾驶员通过语音输入的关键字。车载信息终端100在从驾驶员通过语音输入关键字起经过了第一待机时间时开始搜索信息。
另一方面,当车辆停止时,车载信息终端100等待,直到从驾驶员通过语音输入了关键字起经过了第二待机时间。在此期间,如图2的(d)所示,车载信息终端100在浏览器页面DP上的搜索框C1中持续显示驾驶员通过语音输入的关键字。当开始搜索信息时使用的搜索开始按钮B2被驾驶员触摸时,车载信息终端100开始搜索信息。在该图所示的示例中,在开始搜索信息时使用的搜索开始按钮B2被显示在浏览器页面DP上的右下位置处。
如图2的(e)所示,当车载信息终端100从外部服务器300获取搜索结果信息时,车载信息终端100将所获取的搜索结果信息输出至显示装置200,并且将所获取的搜索结果信息显示在显示装置200上。在该图所示的示例中,车载信息终端100按距车辆的行驶位置的距离从小到大的顺序依次排列银行,并且将银行与距车辆的行驶位置的距离一起列出。
接下来,将描述根据本实施方式的车载信息终端100基于信息搜索程序来执行的信息搜索处理的具体过程。车载信息终端100以预定间隔执行图3所示的信息搜索处理。
首先,如图3所示,车载信息终端100等待,直到通过麦克风10从车辆的驾驶员输入语音(步骤S10)。当输入了语音(在步骤S10中为“是”)时,车载信息终端100通过识别处理单元110识别输入的语音,并且将输入的语音转换成文本数据(步骤S11)。
随后,车载信息终端100通过行驶状况确定单元120基于从车辆速度传感器20获取的车辆的速度是否高于或等于预定阈值来确定车辆是否在行驶(步骤S12)。
当车载信息终端100确定车辆在行驶(在步骤S12中为“是”)时,车载信息终端100通过搜索模式设置单元130将自动搜索模式设置为信息搜索模式。
随后,车载信息终端100通过搜索处理单元140确定搜索开始按钮B2是否已被操作(步骤S14)。当搜索开始按钮B2未被操作(在步骤S14中为“否”)时并且当尚未经过第一待机时间(在步骤S15中为“否”)时,车载信息终端100将处理返回到步骤S12。
另一方面,当在经过第一待机时间之前操作了搜索开始按钮B2(在步骤S14中为“是”)时,车载信息终端100将处理进行到步骤S20。当经过了第一待机时间而没有操作搜索开始按钮B2(在步骤S15中为“是”)时,车载信息终端100将处理进行到步骤S20。
当车载信息终端100在步骤S12中确定车辆停止(在步骤S12中为“否”)时,车载信息终端100通过搜索模式设置单元130将手动搜索模式设置为信息搜索模式。
随后,车载信息终端100通过搜索处理单元140确定搜索开始按钮B2是否已被操作(步骤S17)。当搜索开始按钮B2未被操作(在步骤S17中为“否”)时并且当尚未经过第二待机时间(在步骤S18中为“否”)时,车载信息终端100将处理返回到步骤S12。
另一方面,当在经过第二待机时间之前操作了搜索开始按钮B2(步骤S17中为“是”)时,车载信息终端100将处理进行到步骤S20。当经过了第二待机时间而没有操作搜索开始按钮B2(在步骤S18中为“是”)时,车载信息终端100丢弃在步骤S11中识别的语音的文本数据(步骤S19)。车载信息终端100将处理返回到步骤S10,并且等待通过麦克风10的新语音的输入。
随后,在步骤S20中,车载信息终端100通过使用在步骤S11中识别的语音的文本数据作为搜索关键字,通过搜索处理单元140要求外部服务器300搜索信息(步骤S20)。
此后,车载信息终端100等待,直到车载信息终端100通过搜索处理单元140从外部服务器300获取搜索结果信息(步骤S21)。当车载信息终端100从外部服务器300获取了搜索结果信息(在步骤S21中为“是”)时,车载信息终端100将所获取的搜索结果信息从搜索处理单元140输出至显示装置200,并且将所获取的搜索结果信息显示在显示装置200上(步骤S22),然后结束图3所示的信息搜索处理。
接下来,将描述根据本实施方式的车载信息终端100的操作。如图4的(a)所示,当车辆行驶时,自动搜索模式被设置为信息搜索模式;而当车辆停止时,手动搜索模式被设置为信息搜索模式。
如图4的(b)所示,当车辆在行驶的同时从驾驶员输入了语音时,即使当没有进行开始搜索信息的操作时,也在从语音输入起经过了第一待机时间时开始搜索信息。亦即,当车辆在行驶时,无论是否存在开始搜索信息的操作,都基于来自驾驶员的语音输入来自动开始搜索信息。这是因为:即使当在从语音输入起经过第一待机时间之前没有进行开始搜索信息的操作时,驾驶员也没有富余时间来执行操作,并且输入的语音的内容可能与驾驶员的意图一致。
特别地,在本实施方式中,当在车辆行驶的同时来自驾驶员的语音被输入时,不立即开始搜索信息,而是等待,直到经过了第一待机时间才搜索信息。亦即,即使当车辆在行驶时,在自动开始搜索信息之前,也确保驾驶员能够检查输入的语音的内容的待机时间。当输入的语音的内容与驾驶员的意图不一致时,驾驶员能够根据需要校正语音的内容。
如图4的(c)所示,当在车辆停止的情况下输入了来自驾驶员的语音时,并且当在从语音输入起经过第二待机时间之前进行了开始搜索信息的操作时,开始搜索信息。另一方面,如图4的(d)所示,当在从语音输入起经过第二待机时间之前没有进行开始搜索信息的操作时,不执行对信息的搜索。亦即,当车辆停止并且认为车辆的驾驶员有富余时间时,仅当进行了开始搜索信息的操作时才开始基于来自驾驶员的语音输入来搜索信息。这是因为,在驾驶员有富余时间的状态下,当车辆的驾驶员在经过第二待机时间之前没有进行开始搜索信息的操作时,输入的语音的内容很可能与驾驶员的意图不一致。
如图4的(e)和(f)所示,当在车辆行驶时输入了来自驾驶员的语音但是在经过第一待机时间之前车辆停止时,例如当车辆在交叉路口处停止时,在车辆停止时开始第二待机时间的计数。如图4的(e)所示,在经过第二待机时间之前没有进行开始搜索信息的操作时,不执行对信息的搜索。另一方面,如图4的(f)所示,当在经过第二待机时间之前进行了开始搜索信息的操作时,开始搜索信息。亦即,当车辆的行驶状况从行驶状态转换到停止状态并且认为车辆的驾驶员有富余时间时,仅当存在开始搜索信息的操作时,才开始基于来自驾驶员的语音输入来搜索信息。这是因为,在驾驶员有富余时间的状态下,在经过第二待机时间之前是否存在开始搜索信息的操作很可能恰好反映了驾驶员的意图。
如图4的(g)所示,当在车辆停止时输入了来自驾驶员的语音但是在经过第二待机时间之前车辆开始行驶时,例如当车辆在交叉路口处开始移动时,在车辆开始行驶时开始第一待机时间的计数。即使在经过第一待机时间之前没有进行开始搜索信息的操作时,也自动开始基于来自驾驶员的语音输入来搜索信息。亦即,当车辆的行驶状况从停止状态转变为行驶状态并且认为车辆的驾驶员没有富余时间时,无论是否存在开始搜索信息的操作,都开始基于来自驾驶员的语音输入来搜索信息。这是因为,在驾驶员没有富余时间的状态下,在经过第一待机时间之前是否存在开始搜索信息的操作可能并不恰好反映驾驶员的意图。
如上所述,根据上述实施方式,获得了以下有益效果。
(1)响应于车辆的行驶状况来切换是否基于输入的语音自动开始搜索信息。因此,可以兼顾车辆的驾驶操作的可操作性和基于语音输入的信息搜索的可操作性。
(2)即使当车辆的速度相对高时,在自动开始搜索信息之前,也确保驾驶员能够检查输入的语音的内容的待机时间。因此,可以减少基于与驾驶员的意图不一致的语音的内容来开始搜索信息的情况。
(3)当从语音输入起直到经过了待机时间车辆的行驶状况随着车辆速度增加的趋势而显著改变时,确保驾驶员能够检查输入的语音的内容的待机时间,而无论是否存在开始搜索信息的操作,都开始基于输入的语音来搜索信息。因此,考虑了在语音输入之后车辆的行驶状况的改变,同时可以适当地兼顾车辆的驾驶操作的可操作性和基于语音输入的信息搜索的可操作性。
(4)虽然车辆的驾驶员有富余时间进行开始搜索信息的操作,但是在即使当从语音输入起经过了一定时间时驾驶员也没有表达任何意图的声明的情况下,丢弃所识别语音的数据,并且确保输入新语音的机会。因此,可以进一步改进基于与驾驶员的意图一致的语音输入的信息搜索的可操作性。
(5)当从语音输入起直到经过了第一待机时间车辆的行驶状况随着车辆的速度减小的趋势而显著改变时,并且在即使当从车辆的行驶状况改变起经过了一定时间时也没有来自驾驶员的意图的声明的情况下,丢弃所识别语音的数据,并且确保输入新语音的机会。因此,在考虑在语音输入之后车辆的行驶状况的改变的同时可以进一步改进基于与驾驶员的意图一致的语音输入的信息搜索的可操作性。
(6)响应于车辆的行驶状况是行驶状态还是停止状态来切换是否自动开始搜索信息。因此,可以进一步适当地兼顾车辆的驾驶操作的可操作性和基于语音输入的信息搜索的可操作性。
上述实施方式可以以下述模式来实现。
在上述实施方式中,在车辆行驶时从驾驶员输入语音,并且当在经过第一待机时间之前车辆停止时,在车辆停止时开始第二待机时间的计数。然而,在车辆停止时开始计数的待机时间不一定与手动搜索模式下的待机时间相同。在车辆停止时开始计数的待机时间可以比手动搜索模式下的待机时间长,或者可以比手动搜索模式下的待机时间短。当车辆停止时,第一待机时间的计数可以不被重置为零,但是在此后经过了第一待机时间时,可以丢弃输入的语音的文本数据。输入的语音的文本数据可以在车辆停止时立即丢弃。
在上述实施方式中,在车辆停止时输入来自驾驶员的语音,但是当在经过第二待机时间之前车辆开始行驶时,在车辆开始行驶时开始第一待机时间的计数。然而,在车辆开始行驶时开始计数的待机时间不一定与自动搜索模式下的待机时间相同。在车辆开始行驶时开始计数的待机时间可以比自动搜索模式下的待机时间长,或者可以比自动搜索模式下的待机时间短。当车辆开始行驶时,第二待机时间的计数可以不被重置为零,但是在此后经过了第二待机时间时,可以自动开始搜索信息。信息搜索可以在车辆开始行驶时立即开始。
在上述实施方式中,以第二待机时间被设置为长于第一待机时间的情况为例描述了第二待机时间。然而,第二待机时间可以被设置为短于第一待机时间,或者这些待机时间可以是相同的。
在上述实施方式中,当在车辆停止时输入了来自驾驶员的语音时,并且当在从语音输入起经过第二待机时间之前没有进行开始搜索信息的操作时,输入的语音的文本数据被丢弃。相反,当在车辆停止时输入了来自驾驶员的语音时,无论从语音输入起经过了多少时间,都可以等待直到由驾驶员进行开始搜索信息的操作才搜索信息。
在上述实施方式中,当在车辆行驶时输入了来自驾驶员的语音时,即使当没有进行开始搜索信息的操作时,也在从语音输入起经过了第一待机时间时自动开始搜索信息。相反,当在车辆行驶时输入了来自驾驶员的语音时,可以在输入语音之后立即自动开始搜索信息,而不需要提供用于进行开始搜索信息的操作的待机时间。
在上述实施方式中,作为示例描述了作为关于车辆是在行驶还是停止的确定准则的车辆的速度被用作预定阈值的情况。然而,只要车辆的速度是驾驶员的富余时间的程度指标,则预定阈值可以是当车辆的速度被划分成低速范围和高速范围时的边界处的车辆速度。
在上述实施方式中,作为开始搜索信息的操作,作为示例描述了在显示装置200的显示页面上触摸搜索开始按钮B2的情况。然而,开始搜索信息的操作可能不一定是与物理接触有关的操作。开始搜索信息的操作可以通过例如通过图像识别来检测驾驶员视线的移动或者通过语音识别来检测来自驾驶员的语音输入来进行。

Claims (9)

1.一种安装在车辆上的车载信息终端,所述车载信息终端被配置成基于输入的语音来执行对信息的搜索,所述车载信息终端的特征在于包括:
识别处理单元,其被配置成识别输入的语音;以及
搜索处理单元,其被配置成基于由所述识别处理单元识别的语音的内容来执行对信息的搜索,其中,
所述搜索处理单元被配置成:当所述车辆的速度高于或等于预定阈值时,在语音输入之后自动开始对所述信息的搜索,并且所述搜索处理单元被配置成:当所述车辆的速度低于所述预定阈值时,在语音输入之后通过输入操作单元进行了开始搜索的操作的条件下,开始对所述信息的搜索。
2.根据权利要求1所述的车载信息终端,其特征在于,
所述搜索处理单元被配置成:当所述车辆的速度高于或等于所述预定阈值时,在语音输入之后经过了待机时间的条件下,基于由所述识别处理单元识别的语音的内容自动开始对所述信息的搜索。
3.根据权利要求1或2所述的车载信息终端,其特征在于,
所述搜索处理单元被配置成:当在从语音输入起经过待机时间之前所述车辆的速度从低于所述预定阈值的值改变成高于或等于所述预定阈值的值时,在从所述车辆的速度改变起经过了待机时间时自动开始对所述信息的搜索。
4.根据权利要求1至3中任一项所述的车载信息终端,其特征在于,
所述搜索处理单元被配置成:当所述车辆的速度低于所述预定阈值时并且当在从语音输入起经过待机时间之前没有通过所述输入操作单元进行开始搜索的操作时,丢弃由所述识别处理单元识别的语音的数据。
5.根据权利要求1至4中任一项所述的车载信息终端,其特征在于,
所述搜索处理单元被配置成:当所述车辆的速度低于所述预定阈值时,在从语音输入起经过待机时间之前通过所述输入操作单元进行了开始搜索的操作的条件下,基于由所述识别处理单元识别的语音的内容来开始对所述信息的搜索。
6.根据权利要求1至5中任一项所述的车载信息终端,其特征在于,
所述搜索处理单元被配置成:当在从语音输入起经过待机时间之前所述车辆的速度从高于或等于所述预定阈值的值改变成低于所述预定阈值的值时并且当在从所述车辆的速度改变起经过待机时间之前没有通过所述输入操作单元进行开始搜索的操作时,丢弃由所述识别处理单元识别的语音的数据。
7.根据权利要求1至6中任一项所述的车载信息终端,其特征在于,
所述搜索处理单元被配置成:当在从语音输入起经过待机时间之前所述车辆的速度从高于或等于所述预定阈值的值改变成低于所述预定阈值的值时,在从所述车辆的速度改变起经过待机时间之前通过所述输入操作单元进行了开始搜索的操作的条件下,基于由所述识别处理单元识别的语音的内容来开始对所述信息的搜索。
8.根据权利要求1至7中任一项所述的车载信息终端,其特征在于,
所述预定阈值是作为关于所述车辆的行驶状况是行驶状态还是停止状态的确定准则的所述车辆的速度。
9.一种存储信息搜索程序的计算机可读存储介质,所述信息搜索程序使计算机执行:
语音识别处理,其识别通过安装在车辆上的语音输入单元输入的语音;以及
搜索处理,其基于通过所述语音识别处理识别的语音的内容来执行对信息的搜索,其特征在于:
在所述搜索处理中,当所述车辆的速度高于或等于预定阈值时,自动开始对所述信息的搜索;而当所述车辆的速度低于所述预定阈值时,在语音输入之后通过输入操作单元进行了开始搜索的操作的条件下,开始对所述信息的搜索。
CN201810067905.9A 2017-02-01 2018-01-24 车载信息终端和存储信息搜索程序的计算机可读存储介质 Pending CN108376057A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-016625 2017-02-01
JP2017016625A JP2018124805A (ja) 2017-02-01 2017-02-01 車載情報端末及び情報検索プログラム

Publications (1)

Publication Number Publication Date
CN108376057A true CN108376057A (zh) 2018-08-07

Family

ID=62843523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810067905.9A Pending CN108376057A (zh) 2017-02-01 2018-01-24 车载信息终端和存储信息搜索程序的计算机可读存储介质

Country Status (5)

Country Link
US (1) US20180218047A1 (zh)
JP (1) JP2018124805A (zh)
KR (1) KR20190044473A (zh)
CN (1) CN108376057A (zh)
DE (1) DE102018101567A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6574028B1 (ja) 2018-06-29 2019-09-11 株式会社片岡製作所 細胞処理装置および細胞のレーザ処理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11142178A (ja) * 1997-11-06 1999-05-28 Denso Corp ナビゲーション装置
JP2004341724A (ja) * 2003-05-14 2004-12-02 Honda Motor Co Ltd 対話型情報検索システム
CN101038176A (zh) * 2002-03-15 2007-09-19 三菱电机株式会社 车辆用导航装置
JP2010078354A (ja) * 2008-09-24 2010-04-08 Nissan Motor Co Ltd 車載機器の操作装置及び車載機器の操作方法
US20110173002A1 (en) * 2010-01-12 2011-07-14 Denso Corporation In-vehicle device and method for modifying display mode of icon indicated on the same
CN103226548A (zh) * 2012-01-30 2013-07-31 北京四维图新科技股份有限公司 一种互联网地图的搜索服务方法、装置和系统
JP2016018078A (ja) * 2014-07-08 2016-02-01 トヨタ自動車株式会社 音声認識装置及び音声認識システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004265217A (ja) 2003-03-03 2004-09-24 Nec Corp 音声認識機能を有する移動通信端末とその端末を利用したキーワード検索方法
US20130096771A1 (en) * 2011-10-12 2013-04-18 Continental Automotive Systems, Inc. Apparatus and method for control of presentation of media to users of a vehicle
CN113470640B (zh) * 2013-02-07 2022-04-26 苹果公司 数字助理的语音触发器
US10152969B2 (en) * 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11142178A (ja) * 1997-11-06 1999-05-28 Denso Corp ナビゲーション装置
CN101038176A (zh) * 2002-03-15 2007-09-19 三菱电机株式会社 车辆用导航装置
JP2004341724A (ja) * 2003-05-14 2004-12-02 Honda Motor Co Ltd 対話型情報検索システム
JP2010078354A (ja) * 2008-09-24 2010-04-08 Nissan Motor Co Ltd 車載機器の操作装置及び車載機器の操作方法
US20110173002A1 (en) * 2010-01-12 2011-07-14 Denso Corporation In-vehicle device and method for modifying display mode of icon indicated on the same
CN103226548A (zh) * 2012-01-30 2013-07-31 北京四维图新科技股份有限公司 一种互联网地图的搜索服务方法、装置和系统
JP2016018078A (ja) * 2014-07-08 2016-02-01 トヨタ自動車株式会社 音声認識装置及び音声認識システム

Also Published As

Publication number Publication date
KR20190044473A (ko) 2019-04-30
DE102018101567A1 (de) 2018-08-02
US20180218047A1 (en) 2018-08-02
JP2018124805A (ja) 2018-08-09

Similar Documents

Publication Publication Date Title
US9349045B2 (en) Motor vehicle having an input device for handwriting recognition
KR101978687B1 (ko) 터치스크린 단말기에서 문자 입력 방법 및 장치
US8538756B2 (en) In-vehicle device and method for modifying display mode of icon indicated on the same
JP3920097B2 (ja) 車載機器用音声認識装置
CN105579319B (zh) 用于识别车载信息系统中的手写手势的系统和方法
US8713464B2 (en) System and method for text input with a multi-touch screen
KR20120011010A (ko) 수기 인식 방법 및 장치
CN104765487A (zh) 输入装置
JP4466379B2 (ja) 車載音声認識装置
US20110060588A1 (en) Method and System for Automatic Speech Recognition with Multiple Contexts
CN109119079A (zh) 语音输入处理方法和装置
CN101673329B (zh) 生物特征数据建立方法、电子装置及计算机程序产品
JP2007145106A (ja) 車載情報端末
CN104077105B (zh) 一种信息处理方法以及一种电子设备
US20130013310A1 (en) Speech recognition system
CN108376057A (zh) 车载信息终端和存储信息搜索程序的计算机可读存储介质
US9563337B2 (en) Information processing device, method for controlling an information processing device, and program
US9128517B2 (en) Vehicular terminal with input switching
US9594951B2 (en) Motor vehicle having a handwriting recognition system
US11164578B2 (en) Voice recognition apparatus, voice recognition method, and non-transitory computer-readable storage medium storing program
JP2010128666A (ja) 情報処理装置
JP2012173965A (ja) 文字入力装置、文字入力方法、及びプログラム
US20160283446A1 (en) Input assistance device, input assistance method and storage medium
US20140080105A1 (en) Learning support device, learning support method and storage medium containing learning support program
JP2010113656A (ja) 手書き入力機能を有する情報処理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180807

WD01 Invention patent application deemed withdrawn after publication