CN111989660A - 信息处理装置、信息处理方法和程序 - Google Patents
信息处理装置、信息处理方法和程序 Download PDFInfo
- Publication number
- CN111989660A CN111989660A CN201980026257.5A CN201980026257A CN111989660A CN 111989660 A CN111989660 A CN 111989660A CN 201980026257 A CN201980026257 A CN 201980026257A CN 111989660 A CN111989660 A CN 111989660A
- Authority
- CN
- China
- Prior art keywords
- information
- score
- control unit
- information processing
- itemized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/41—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
Abstract
提供了一种信息处理装置,包含控制部,用于当存在与多个属性信息实例所关联的规定词汇用语相对应的多个信息实例作为搜索结果候选时,执行用于进行通知每个信息实例的控制,其中针对每个词汇用语计算的指标可识别。
Description
技术领域
本公开涉及信息处理设备、信息处理方法和程序。
背景技术
提出了被称为代理的电子装置,其根据声音请求提供信息(例如,参考PTL 1)。
[引文列表]
[专利文献]
[PTL 1]
JP2008-90545A
发明内容
[技术问题]
在这种领域中,如果当用户发出的话语含糊时,用户能够识别出对与含糊话语相对应的信息进行确定所基于的指标(标准),则可用性提高。
本公开的目的是提供信息处理设备、信息处理方法和程序,例如,当存在基于搜索结果的多条信息时,通过使与每条信息对应的指标可识别来通知多条信息。
[问题的解决方案]
本公开例如是信息处理设备,包括:控制单元,被配置为当存在与已经与多条属性信息相关联的预定用语相对应的多条信息作为搜索结果的候选时,执行控制以通过使针对每一个用语计算的指标可识别来通知每条信息。
本公开例如是信息处理方法,包括:当存在与已经与多条属性信息相关联的预定用语相对应的多条信息作为搜索结果的候选时,控制单元执行控制以通过使针对每一个用语计算的指标可识别来通知每条信息。
本公开例如是使计算机执行信息处理方法的程序,信息处理方法包括:当存在与已经与多条属性信息相关联的预定用语相对应的多条信息作为搜索结果的候选时,控制单元执行控制以通过使针对每一个用语计算的指标可识别来通知每条信息。
[发明的有利效果]
根据本公开的至少一个实施例,当通知多条信息时,用户可以识别与多条信息相对应的指标。应当注意,上述有利效果不一定是限制性的,并且可以应用本公开中描述的任何有利效果。此外,应当理解,本公开的内容不应以限制的方式根据示例的有利效果来解释。
附图说明
[图1]图1是示出根据实施例的代理的配置示例的框图。
[图2]图2是用于说明根据第一实施例的控制单元的功能的图示。
[图3]图3是示出根据第一实施例的存储在数据库中的信息的示例的图示。
[图4]图4是示出根据第一实施例的准确度评分和分项评分的示例的图示。
[图5]图5是用于说明在用户和代理之间发生的通信的示例的图示。
[图6]图6是用于说明在用户和代理之间发生的通信的示例的图示。
[图7]图7是用于说明在用户和代理之间发生的通信的示例的图示。
[图8]图8是用于说明在用户和代理之间发生的通信的示例的图示。
[图9]图9是用于说明在用户和代理之间发生的通信的示例的图示。
[图10]图10是用于说明在用户和代理之间发生的通信的示例的图示。
[图11]图11是用于说明在用户和代理之间发生的通信的示例的图示。
[图12]图12是示出在第一实施例中执行的处理的流程的流程图。
[图13]图13是示出在第一实施例中执行的处理的流程的流程图。
[图14]图14是用于说明根据第二实施例的控制单元的功能的图示。
[图15]图15是用于说明根据第二实施例的存储在数据库中的信息的具体示例的图示。
[图16]图16是示出根据第二实施例的准确度评分和分项评分的示例的图示。
[图17]图17是用于说明根据第三实施例的控制单元的功能的图示。
[图18]图18是示出根据第三实施例的存储在数据库中的信息的示例的图示。
[图19]图19是示出根据第三实施例的准确度评分和分项评分的示例的图示。
[图20]图20是用于说明变形例的图示。
具体实施方式
在下文中,将参考附图描述本公开的实施例等。将按以下顺序给出说明。
<第一实施例>
<第二实施例>
<第三实施例>
<变形>
应当理解,下面描述的实施例等是本公开的优选特定示例,并且本公开的内容不限于这样的实施例等。
<第一实施例>
[代理的配置示例]
在本实施例中,将代理描述为信息处理设备的示例。根据实施例的代理表示例如大小或多或少是便携式的语音输入/输出设备,或者与用户的口头对话功能包括在这样的设备中。这样的代理也可以称为智能扬声器等。毋庸置疑,代理不限于智能扬声器,并且可以是机器人等,或者代理本身可以不是独立的,并且可以内置于各种电子装置中,诸如智能电话、车载设备或家用电器。
图1是示出根据第一实施例的代理(代理1)的配置示例的框图。代理1具有例如控制单元10、传感器单元11、图像输入单元12、操作输入单元13、通信单元14、语音输入/输出单元15、显示器16和数据库17。
控制单元10由CPU(中央处理单元)等构成,并控制代理1的各个单元。控制单元10具有存储程序的ROM(只读存储器)和当控制单元10执行程序时用作工作存储器的RAM(随机存取存储器)(应当注意,未示出ROM和RAM)。当存在与已经与多条属性信息相关联的预定用语相对应的多条信息作为搜索结果的候选时,控制单元10执行控制以通过使针对每一个用语计算的指标可识别来通知每条信息。稍后将描述由控制单元10执行的控制的具体示例。
传感器单元11例如是能够获取代理1的用户的生物信息的传感器设备。生物信息的示例包括指纹、血压、脉搏、汗腺(汗腺的位置或来自汗腺的出汗程度可能足够高)以及用户的体温。毋庸置疑,可选地,传感器单元11可以是获取生物信息之外的信息的传感器设备(例如,GPS(全球定位系统)传感器或重力传感器)。由传感器单元11获得的传感器信息被输入到控制单元10。
图像输入单元12是接受从外部输入的图像数据(可以是静止图像数据或运动图像数据)的接口。例如,图像数据从不同于代理1的成像设备等输入到图像输入单元12。输入到图像输入单元12的图像数据被输入到控制单元10。可替换地,可以经由通信单元14将图像数据输入到代理1,在这种情况下,不需要提供图像输入单元12。
操作输入单元13接受来自用户的操作输入。操作输入单元13的示例包括按钮、操纵杆、开关、触摸面板、麦克风和眼睛注视跟踪装置。操作输入单元13根据对操作输入单元13自身的输入来生成操作信号,并将该操作信号提供给控制单元10。控制单元10根据操作信号执行处理。
通信单元14与经由诸如因特网的网络连接的其他设备通信。通信单元14具有对应于通信标准的部件,诸如调制/解调电路和天线。由通信单元14执行的通信可以是有线通信或无线通信。无线通信的示例包括LAN(局域网)、蓝牙(注册商标)、Wi-Fi(注册商标)和WUSB(无线USB)。代理1能够从通信单元14的连接目的地获取各种信息。
语音输入/输出单元15是向代理1输入语音的组件和向用户输出语音的组件。向代理1输入语音的组件的示例是麦克风。此外,向用户输出语音的组件的示例是扬声器设备。例如,用户的话语被输入到语音输入/输出单元15。输入到语音输入/输出单元15的话语作为话语信息被提供给控制单元10。另外,根据控制单元10的控制,语音输入/输出单元15再现关于用户的预定语音。当代理1是便携式的时,携带代理1使得能够在任何位置输入和输出语音。
显示器16是显示静止图像和运动图像的组件。显示器16的示例包括LCD(液晶显示器)、有机EL(电致发光显示器)和投影仪。根据实施例的显示器16被配置为触摸屏并且通过与显示器16接触(或靠近)来启用操作输入。
数据库17是存储各种信息的存储单元。数据库17的示例包括诸如HDD(硬盘驱动器)的磁存储装置、半导体存储装置、光存储装置和磁光存储装置。控制单元10搜索存储在数据库17中的信息中的预定信息,并将其搜索结果呈现给用户。
代理1可以被配置为基于从商业电源供应的电力来驱动,或者可以被配置为基于从可充电和可放电的锂离子二次电池等供应的电力来驱动。
虽然上面已经描述了代理1的配置示例,但是可以根据需要适当地更改代理1的配置。换言之,代理1的配置可以不包括所示组件的一部分或者可以与所示配置不同。
[代理的功能]
接下来,将参照图2描述代理1的功能,更具体地,描述控制单元10的功能的示例。作为其功能,例如,控制单元10具有评分计算数据存储单元10a、评分计算单元10b和搜索结果输出单元10c。
(评分计算数据存储单元)
评分计算数据存储单元10a将信息存储在数据库17中。如图2所示,评分计算数据存储单元10a基于经由传感器单元11获得的生物信息的感测结果,针对从图像输入单元12输入的照片等的图像数据的图像分析结果、语音识别结果等来检测情感。此外,评分计算数据存储单元10a对经由语音输入/输出单元15输入的话语信息执行语音识别和词法分析,将其结果与情感检测的结果等相关联,并将相关联的结果作为历史存储在数据库17中。
根据评分计算数据存储单元10a执行的语音识别和词法分析的结果,例如获得以下:预定用语(例如,名词);与该用语相关的用词(例如,与该用语通格的名词、变形该用语的形容词,以及关于该用语的动词);话语中包括的当日时间信息(可以是当日时间本身或相当于当日时间的信息);话语中包括的定位信息(例如,地理名称、地址、经纬度);以及识别评分(根据语音识别的识别似然的评分值)。
图3示出了由评分计算数据存储单元10a存储在数据库17中的信息的示例。数据库17存储与多条属性信息相关联的预定用语。在图3中,作为属性信息的示例示出了“ID”、“当日时间”、“定位”、“同格用词”、“情感”、“关联语”和“识别准确度”。
例如,话语“我们上周(2017年8月24日)在日式餐馆A吃过的食物很可口”被输入到语音输入/输出单元15。
在这种情况下,评分计算数据存储单元10a将“日式餐馆A”设置为与ID:1对应的用语;并且将基于话语信息获得的属性信息与“日式餐馆A”相关联地存储。例如,相对于“日式餐馆A”,评分计算数据存储单元10a关联并存储“2017年8月24日”作为当日时间、“在东京”作为定位、“可口”作为情感,以及“80”作为识别准确度。当在话语信息中不包括定位时,例如,代理1在2017年8月24日获取定位信息的日志(例如,存储在智能电话等中的日志),并将所获取的定位信息登记为定位。识别准确度是根据语音识别时的噪声等的大小而设定的值。
例如,话语“我听说我在上个月告诉过您的新型号已经到了自行车店B(2017年7月)”被输入到语音输入/输出单元15。
在这种情况下,评分计算数据存储单元10a提取包括在话语信息中的“自行车店B”和“新型号”、设置与每个用语对应的属性信息,并将用语和设置的属性信息存储在数据库17中。在图3中,ID:2表示用语“自行车店B”和对应于该用语的属性信息的示例,以及ID:3表示用语“新型号”和对应于该用语的属性信息的示例。例如,代理1控制通信单元14并访问自行车店B的网站、获取其详细定位(在图3所示的示例中,“新宿”),并将所获取的定位信息登记为对应于“自行车店B”的定位。
ID:4表示基于话语信息“我在我们上个月去的海鲜餐馆C遇到了A(2017年5月)”存储在数据库17中的用语和与该用语对应的属性信息的示例。
ID:5表示基于话语信息“我们在夏天去过的大崎的持锅餐馆D重新开张”存储在数据库17中的用语和与该用语对应的属性信息的示例。如在本示例中,还存在基于话语信息获取作为定位信息的“定位”的情况。
ID:6表示基于话语信息“我想找到去九州旅行时喝过的很赞的烧酒”存储在数据库17中的用语和与该用语对应的属性信息的示例。作为情感,也存储了重复“很赞的”事实。
ID:7表示基于话语信息“我还想去我们八月初去过的那家日式餐馆E,那里的食物真是很可口”存储在数据库17中的用语和与该用语对应的属性信息的示例。作为情感,还存储了用语“真是”这个词以强调“可口”的事实。
毋庸置疑,图3所示的数据库17的内容仅仅是示例,数据库17并不局限于此。其它信息也可用作属性信息。
(评分计算单元)
评分计算单元10b计算作为关于存储在数据库17中的信息的指标的评分。根据本实施例的评分包括为每一条属性信息计算的分项评分和对分项评分进行综合的综合评分。综合评分例如是分项评分的简单相加或加权相加。在以下描述中,根据需要将综合评分称为准确度评分。
如图2所示,例如,当经由语音输入/输出单元15输入话语信息时,控制单元10总是对话语信息执行语音识别和词法分析。另外,当输入包括具有歧义的用语的话语信息时,控制单元10计算与存储在数据库17中的每一个用语的话语信息相对应的准确度评分和分项评分。具有歧义的用语是涉及某物的用语,但不可能唯一地准确标识该用语指的是什么。具有歧义的用语的具体示例包括诸如那个和它的指示代词、包括诸如最近的时间歧义的用语,以及包括诸如P站附近或周围的定位歧义的用语。使用例如与上下文相关的元信息来提取具有歧义的用语。
例如,让我们考虑来自用户的请求“预订我最近去过且食物很可口的那家餐馆”是2017年9月10日在大崎站通过语音输入到代理1的情况。
由于话语信息包括具有歧义的用语(在本示例中,以用语“最近”为例),所以评分计算单元10b计算准确度评分和分项评分。此外,能够适当地设定准确度评分和分项评分的上限值、下限值等。
图4是示出准确度评分和分项评分的示例的图示。由于话语信息的内容是“食物可口的餐馆”,所以不包括除了餐馆(在图4所示的示例中,与ID:2和ID:3对应的多条信息)之外的其他地方的信息。在这种情况下,可以不计算关于ID:2和ID:3的准确度评分,或者关于ID:2和ID:3的准确度评分可以设置为0。
例如,如下计算每条属性信息的分项评分。
·在“当日时间”的情况下,给予更接近于“当日时间”且范围较窄的属性信息(与话语信息中指定的当日时间偏差较小的属性信息)较高的评分。
·类似地,在“定位”的情况下,给予更靠近定位且范围较窄的属性信息(与话语信息中指定的定位具有较小偏差的属性信息)较高的评分。
·在“情感”的情况下,当存在指示关于情感的积极性/消极性的信息的用语时,给出基本分值,并且当存在进一步强调情感(例如,“真的”)的用语时,或者当重复情感时,计算分值以增加基本分值的绝对值。
·“识别准确度”是基于存储在数据库17中时的识别准确度计算的。
·即使没有登记属性信息,也在没有免除属性信息的情况下分配定值。例如,即使未登记对应于ID:6的当日时间,由于不清楚对应于ID:6的当日时间是接近还是远离在话语信息中指定的当日时间时,给出一定值(例如,20)。
例如,评分计算单元10b通过简单地累加分项评分来计算准确度评分。将使用对应于ID:1的信息给出具体描述。由于与ID:1对应的用语是“日式餐馆A”,所以该用语成为搜索结果的候选。对于属性信息“当日时间”,由于属性信息“当日时间”接近话语信息中包括的当日时间(2017年9月10日),因此给出高评分(例如,90)。对于属性信息“定位”,尽管包括在话语信息中的大崎站在东京,但是由于也假设偏差大的情况,所以分配中间值(例如,50)。对于属性信息“情感”,由于属性信息“情感”与包括在话语信息中的情感表达“可口”高度一致,因此给出高评分(例如,100)。关于识别准确度,将其值用作分项评分。通过简单相加各个分项评分获得的值320是对应于用语“日式餐馆A”的准确度评分。针对与其他ID相对应的多条信息类似地计算准确度评分和分项评分。
应当注意,在本实施例中,对于通常未分配的多条属性信息(同格用语、关联语等),不计算分项评分。因此,能够简化处理。毋庸置疑,可替换地,可以针对所有的属性信息来计算分项评分。
(搜索结果输出单元)
搜索结果输出单元10c根据评分计算单元10b的评分计算结果输出搜索结果。当输入包括具有歧义的用语的话语信息时,搜索结果输出单元10c向用户通知搜索结果。搜索结果输出单元10c以四种模式(模式P1、P2、P3和P4)输出搜索结果。将使用图4所示的示例来描述这四个模式。虽然为了便于在下面的描述中理解每个模式,对应于各个模式的条件可以彼此重叠,但是实际上,条件被适当地设置为不彼此重叠。
[搜索结果的输出示例]
(模式P1)
模式P1是在清楚地确定仅有一条信息(选项)对应于话语信息的情况下执行的搜索结果的输出模式。清楚地确定仅存在一个选项的情况是例如对应于给定ID的信息的准确度评分超过阈值并且存在准确度评分超过阈值的一条信息的情况。
图5是示出在模式P1的情况下在用户U和代理1之间发生的通信的示例的图示。如在上述示例中,用户U向代理1发出“预订我最近去过的那家食物可口的餐馆”的话语。作为计算准确度评分和分项评分的结果,因为“日式餐馆E”的准确度评分超过阈值(例如,330)并且“日式餐馆E”是超过该阈值的唯一用语,所以代理1在模式P1中输出作为搜索结果的“日式餐馆E”。
在模式P1的情况下,当代理1向用户U通知一个且唯一的候选时,代理1基于话语执行处理,而不询问该候选是否正确。代理1的控制单元10执行生成说出“你是指日式餐馆E。那我现在预订。”的语音数据的控制以及从语音输入/输出单元15再现语音。另外,通过控制通信单元14、代理1的控制单元10访问“日式餐馆E”的网站等以执行适当的预订处理。
(模式P2)
模式P2是在确定仅有一条信息(选项)对应于话语信息并且确定该条信息(选项)的正确性在一定程度左右(例如,90%左右)的情况下执行的搜索结果的输出模式。例如,当对应于给定ID的信息的准确度评分超过阈值时(例如,300),存在准确度评分超过阈值的一条信息,并且准确度评分与阈值之间的差值在预定范围内,确定90%的正确性。
图6是示出在模式P2的情况下在用户U和代理1之间发生的通信的示例的图示。如在上述示例中,用户U向代理1发出“预订我最近去过的食物可口的餐馆”的话语。作为计算准确度评分和分项评分的结果,因为“日式餐馆E”的准确度评分超过阈值(例如,330),并且尽管“日式餐馆E”是超过阈值的唯一用语,但是因为准确度评分和阈值之间的差值在预定范围内(例如,40或更低),所以代理1在模式P2输出作为搜索结果的“日式餐馆E”。
在模式P2的情况下,由于代理1向用户U通知一个且唯一的候选,因此代理1执行用于确认候选是否正确的交互。对于用户U的话语,代理1的控制单元10执行生成说“你是指日式餐馆E吗?的语音数据的控制以及再现来自语音输入/输出单元15的语音。此时,当用户U以回答“对的”等的形式获得确认时,代理1的控制单元10通过控制通信单元14访问“日式餐馆E”的网站等来执行适当的预订处理。当用户U的意图不是“日式餐馆E”时,可以通知对应于下一个最高准确度评分的信息。
(模式P3)
模式P3是在如下情况下执行的搜索结果的输出模式:当与话语信息相对应的信息(选项)的准确度评分足够时,确定该评分接近次高或后续候选的准确度评分时,存在准确度评分超过阈值的多条信息(选项),等等。在模式P3的情况下,输出多个候选作为搜索结果。可以设想,输出搜索结果的方法包括使用视频的方法和使用语音的方法。首先,将描述使用视频的方法。
(模式P3:多个搜索结果的视频输出示例)
图7是示出在模式P3的情况下在用户U和代理1之间发生的通信的示例的图示。根据用户U的话语,控制单元10的评分计算单元10b计算准确度评分和分项评分。参照图4所示的示例,最高准确度评分是354(对应于ID:7的一条信息),存在两条信息(与ID:1和ID:4对应的多条信息),其中准确度评分的差值在阈值内(例如,150)。在这种情况下,控制单元10输出与ID:1、4和7对应的信息作为搜索结果的输出。例如,如图7所示,搜索结果与说出“存在几个候选,哪一个是正确的?”的语音一起被输出。在本示例中,在显示器16上显示与多个候选相对应的静止图像。可以经由通信单元14获取或者可以由用户U经由图像输入单元12输入对应于多个候选的静止图像。
如图7所示,在显示器16上显示示出“日式餐馆A”的图像IM1、示出“海鲜餐馆C”的图像IM2和示出“日式餐馆E”的图像IM3。在这种情况下,图像IM1至IM3是与预定用语对应的多条信息的示例。此外,与对应于每个图像的准确度评分和分项评分相关联地显示每个图像,或者更具体地,与对应于具有ID:1、4或7的每个用语的准确度评分和分项评分相关联地显示每个图像。换句话说,以这样的方式通知图像IM1至IM3,即,使得已经关于与图像IM1至IM3相对应的用语计算的准确度评分和分项评分是可识别的。
具体地,在示出“日式餐馆A”的图像IMI下显示针对“日式餐馆A”计算出的准确度评分“320”。另外,与准确度评分并行地显示与属性信息“当日时间”相关的分项评分“90”和与属性信息“定位”相关的分项评分“50”。换言之,在图像IMI下方显示评分SCI读数“320/90/50”。
在示出“海鲜餐馆C”的图像IM2下显示针对“海鲜餐馆C”计算出的准确度评分“215”。另外,与准确度评分并行地显示与属性信息“当日时间”相关的分项评分“50”和与属性信息“定位”相关的分项评分“100”。换言之,在图像IM2下方显示评分SC2读数“215/50/100”。
在示出“日式餐馆E”的图像IM3下显示针对“日式餐馆E”计算出的准确度评分“354”。另外,与准确度评分并行地显示与属性信息“当日时间”相关的分项评分“70”和与属性信息“定位”相关的分项评分“85”。换言之,在图像IM3下方显示评分SC3读数“354/70/85”。
以此方式,通过至少显示准确度评分,当存在搜索结果的多个候选时,用户可以识别哪个候选被确定为具有高准确度。此外,提供数值而不是文本使得能够缩小显示空间,甚至能够适应小的显示器16。
应当注意,可以通过如图7所示的指示光标、通过语音指定诸如“日式餐馆A”的对象名称,或者通过语音指定显示位置来执行对多个候选的指定。此外,当指定“日式餐馆A”时,可以通过诸如“具有评分320的餐馆”的语音指定准确度评分来选择候选。可以通过用语音指定分项评分来选择候选。
可以根据准确度评分来更改显示。例如,可以按照准确度评分的升序增加显示尺寸。在图7所示的示例中,以最大尺寸显图示像IM3、以次大尺寸显图示像IM1,并且以最小尺寸显图示像IM2。可以根据准确度评分的大小来更改图像IM1至IM3中的每一者的显示的顺序、灰度级、框颜色等。例如,适当地设定显示顺序等,使得具有高准确度评分的图像变得突出。可以通过组合这些更改显示的方法来显示图像IM1至IM3。此外,可以根据显示空间来设置要显示的准确度评分的上限值或下限值、要显示的分项评分的数量等。
如图7所示,在本实施例中,除了准确度评分之外,还显示至少一个分项评分。然而,不是所有的分项评分都要被显示,而是仅显示其一部分。根据本显示,在显示多个候选时,能够防止由于显示大量的分项评分而导致的可视性下降。另一方面,可能存在与所显示的分项评分相对应的属性信息不同于用户U想要的属性信息的情况。因此,在本实施例中,进一步允许将分项评分的显示切换到另一显示。
将参照图8描述分项评分的显示切换到另一显示。如上所述,假设图像IM1至IM3被显示在代理1的显示器16上。在这种情况下,假设用户U说出“显示“情感”的分项评分”。经由语音输入/输出单元15将用户U的话语信息提供给控制单元10,并且由控制单元10执行语音识别。控制单元10检索数据库17,并读取分别与图像IM1至IM3,或者换句话说,ID:1、4和7对应的分项评分。另外,如图8所示,控制单元10在每个图像下方显示“情感”的分项评分。具体地,在图像IM1下方显示已经添加了“情感”的分项评分的评分SC1a读数“320/90/50/100”。在图像IM2的下方显示了已经添加了“情感”的分项评分的评分SC2a读取“215/50/100/0”。在图像IM3的下方显示了已经添加了“情感”的分项评分的评分SC3a读数“354/70/85/120”。
根据显示,用户U可以找到与期望属性信息相对应的分项评分。另外,如图8所示,也可以显示仅包含与所指定的属性信息对应的准确度评分和分项评分的评分SC1b至SC3b。另外,可以高亮显示与指定的属性信息相对应的分项评分以使得用户U可以更好地识别该分项评分。例如,可以将与所指定的属性信息相对应的分项评分的颜色与其他分项评分的颜色区分开,或者可以使与所指定的属性信息相对应的分项评分闪烁。此外,当通过话语指定预定属性信息时,当已经显示与属性信息对应的分项评分时,可以根据话语高亮显示分项评分。
可能存在用户U对所显示的搜索结果不满意或感觉不便的情况。例如,在图8所示的示例中,尽管用户U回想起他/她觉得“日式餐馆E”的食物很可口味,然而可能存在用户U感觉“日式餐馆E”的准确性评分与“日式餐馆A”的准确性评分之间的差异不及预期大的情况。为了适应这种情况,在本实施例中,用户U可以通过指定要强调的属性信息来改变用于计算准确度评分的权重。更具体地,通过对与用户U期望强调的属性信息相对应的分项评分赋予附加权重(增加权重)来重新计算准确度评分。
将参照图9描述具体示例。让我们假设已经观看了图像IM1至IM3的用户U说出“强调“情感”的分项评分”。用户U的话语信息经由语音输入/输出单元15被输入到控制单元10,并且由控制单元10执行语音识别。控制单元10的评分计算单元10b例如通过将关于作为指定属性信息的“情感”的分项评分的权重加倍来重新计算准确度评分。
此外,如图9所示,重新计算的准确度评分和根据改变的权重重新计算的分项评分在显示器16上显示为评分SC1d至SC3d。具体地,最初为“100”的“日式餐馆A”的“情感”的分项评分被重新计算为“200”。“日式餐馆A”的准确度评分变为“420”,其表示增加了分项评分的增加量(100)。表示准确度评分和“情感”的分项评分的“420/200”被显示在图像IM1下方作为评分SC1d。最初为“0”的“海鲜餐馆C”的“情感”分项评分也被重新计算为“0”。因此,将表示没有变化的“海鲜餐馆C”的准确度评分和“情感”的分项评分的“215/0”显示在图像IM2下方作为评分SC2d。最初为“120”的“日式餐馆E”的“情感”分项评分被重新计算为“240”。“日式餐馆E”的准确度评分变为“474”,其表示增加了分项评分的增加量(120)。表示准确度评分和“情感”的分项评分的“474/240”在图像IM3下方显示为评分SC3d。已经查看了重新计算之后的准确度评分和分项评分的用户U可以认识到,“日式餐馆A”和“日式餐馆E”之间的准确度评分的差值已经增加并且可以在用户U先前已经觉得“日式餐馆E”的食物可口的事实中体验到满意的感觉。
(模式P3:多个搜索结果的语音输出示例)
接下来,将描述多个搜索结果的语音输出示例。图10是用于说明多个搜索结果的语音输出示例的图示。用户U说出包括具有歧义的用语的话语。例如,用户U发出“预订我最近去过的那家食物可口的餐馆”。话语信息输入至的控制单元10与该话语信息相对应地生成多个候选的语音数据,并且从语音输入/输出单元15再现该语音数据。
例如,作为搜索结果的多个候选被顺序地再现为语音。在图10所示的示例中,以“日式餐馆A”、“海鲜餐馆C”和“日式餐馆E”的顺序通过语音来通知候选。在这种情况下,对应于每个餐馆名称的语音是对应于预定用语的一条信息的示例。此外,通过用户U在被通知“日式餐馆E”时的响应(例如,通过语音说出“就是这家”的指定)来选择“日式餐馆E”,并且代理1执行“日式餐馆E”的预订处理。
当通过语音通知多个候选时,可以按照准确度评分的降序通知候选。另外,当通过语音通知多个候选时,可以与候选名称一起连续地通知准确度评分和分项评分。由于存在诸如准确度评分之类的数值可能被用户U遗漏的风险,因此当读出精度评分等时,可以添加音效、BGM(背景音乐)等。尽管可以适当地设置音效的类型等,但是例如,当准确性评分高时,在再现与该准确性评分相对应的候选名称时再现欢快的音效,而当准确性评分低时,在再现与该准确性评分相对应的候选名称时再现忧郁的音效。
(模式P4)
模式P4是当不存在满足开始标准的准确度评分时执行的搜索结果的输出模式。在这种情况下,代理1直接询问用户有关内容。图11是示出在模式P4的情况下在用户U和代理1之间发生的通信的示例的图示。
用户U说出包括具有歧义的用语的话语(例如,“预订我最近去过的食物可口的那家餐馆”)。当根据话语信息检索数据库17导致没有合适的候选时,例如,代理1输出说出“你指哪个餐馆?”的语音以直接向用户U询问具体的餐馆名称。
假设用户U通过说“日式餐馆E”来响应代理1的查询。根据该响应,代理1执行用于在日式餐馆E预定的处理。
如上所述,基于例示的模式P1至P4从代理1输出搜索结果。当输出搜索结果时,可以组合使用利用视频的方法和利用语音的方法。另外,当根据模式P1、P2和P4输出搜索结果时,可以使用视频,或者可以一起使用利用视频和语音的方法。
[处理流程]
将描述根据第一实施例由代理1执行的处理的流程。与下面描述的处理相关的控制由控制单元10执行,除非有明确的相反说明。
图12是示出主要由控制单元10的评分计算单元10b执行的处理的流程的流程图。在步骤ST11中,用户说出话语。在接下来的步骤ST12中,伴随话语的语音作为话语信息经由语音输入/输出单元15被输入到控制单元10。随后,处理前进到步骤ST13。
在步骤ST13以及其后的步骤ST14和ST15中,控制单元10针对话语信息执行诸如语音识别、词法分析和词分解的语音处理,并且检测具有歧义的用语(词语)。随后,处理前进到步骤ST16。
在步骤ST16中,作为步骤ST13至ST15的处理的结果,确定用户的话语信息是否包括具有歧义的用语。当话语信息不包括具有歧义的用语时,处理返回到步骤ST11。当话语信息包括具有歧义的用语时,处理前进到步骤ST17。
在步骤ST17中,控制单元10的评分计算单元10b执行评分计算处理。具体地,控制单元10的评分计算单元10b计算与话语信息相对应的分项评分。另外,控制单元10的评分计算单元10b基于计算出的分项评分来计算准确度评分。
在图12的流程图所示的处理之后,执行图13的流程图所示的处理。应当注意,图12和图13的流程图中所示的“AA”的描述指示处理的连续性,而不指示特定的处理步骤。
图13的流程图所示的处理是主要由控制单元10的搜索结果输出单元10c进行的处理。在步骤ST18中,确定是否仅存在对应于该话语信息的一个候选,并且该候选处于可以被断定该候选对应于用户的话语的水平(下文中,在适当的时候称为可断定水平)。当搜索结果的准确度处于可断定水平(例如,99%左右的准确度)时,处理前进至步骤ST19。
在步骤ST19中,通过上述模式P1通知作为搜索结果的候选。例如,控制单元10基于在步骤ST11中发出的用户的话语执行处理,同时通知一个且唯一的候选的候选名称。
当搜索结果的准确度不在可断定水平时,处理前进到步骤ST20。在步骤ST20中,确定是否仅有一个候选与话语信息相对应,并且该候选处于可以几乎断定该候选与用户的话语相对应的水平(以下,在适当时称为接近可断定水平)。当搜索结果的准确度处于接近可断定水平(例如,约90%的准确度)时,处理前进至步骤ST21。
在步骤ST21中,通过上述模式P2通知作为搜索结果的候选。例如,控制单元10通知一个且唯一候选的候选名称,并且当确认候选名称是用户期望的候选时,控制单元10基于在步骤ST11中说出的用户话语执行处理。
当搜索结果的准确度不在接近可断定水平时,处理前进到步骤ST22。在步骤ST22中,确定是否存在作为搜索结果的若干候选。当不存在对应于话语信息的候选时,处理前进到步骤ST23。
在步骤ST23中,执行与上述的模式P4对应的处理。换言之,执行代理1直接向用户询问候选的名称的处理。
在步骤ST22中,当存在作为搜索结果的多个候选时,处理前进到步骤ST24。在步骤ST24中,执行与上述模式P3对应的处理,并且向用户通知作为搜索结果的多个候选。多个候选可以通过语音来通知、通过视频来通知,或者通过语音和视频的组合来通知。随后,处理前进到步骤ST25。
在步骤ST25中,确定是否已经选择了多个通知的候选中的任何一者。可以通过语音、通过使用操作输入单元13的输入等来执行候选的选择。当已经选择了任一个候选时,处理前进到步骤ST26。
在步骤ST26中,控制单元10针对所选择的候选执行在用户的话语中指示的内容的处理。随后,处理结束。
在步骤ST25中,在未选择所通知的多个候选中的任一者的情况下,处理进行至步骤ST27。在步骤ST27中,确定是否存在改变内容的指令。用于改变内容的指令例如是用于改变每条属性信息的权重的指令,或者更具体地,是用于强调预定的属性信息的指令。在步骤ST27中,当没有改变内容的指令时,处理前进到步骤ST28。
在步骤ST28中,确定用户是否已经发出了用于停止(中止)该系列处理步骤的指令。当已经发出停止该系列处理步骤的指令时,处理结束。当没有发出停止一系列处理步骤的指令时,处理返回到步骤ST24,并且继续通知候选。
在步骤ST27中,当存在改变内容的指令时,处理前进到步骤ST29。在步骤ST29中,根据在步骤ST27中发出的指令重新计算准确度评分和分项评分。处理然后前进至步骤ST24,并且基于重新计算之后的准确度评分和分项评分进行通知。
如上所述,根据本实施例,基于客观指标(例如,准确度评分),用户可以理解代理如何确定具有歧义的用语。此外,用户可以改变指标(例如,分项评分)对应的属性信息的内容。此外,由于代理可以基于先前词语的存储来进行确定,因此改进了代理确定的准确性。此外,还导入生物信息、摄像视频等,来代替仅仅导入文字,使得代理能够以更高的准确度进行确定。此外,代理的确定准确度的改进使代理与用户(人)之间的交互更加自然,并且防止用户感到不适。
<第二实施例>
接着,描述第二实施例。在以下说明中,对与第一实施例的部件相同或相似的部件赋予相同的附图标记,并省略多余的说明。此外,在第一实施例中描述的内容也可以应用于第二实施例,除非有相反的具体说明。
第二实施例表示将代理应用于移动体或者更具体地应用于车载设备的示例。虽然在本实施例中移动体被描述为车辆,但是移动体可以是诸如火车、自行车或飞机的任何物体。
根据第二实施例的代理(以下,在适当时称为代理1A)具有提供与代理1的控制单元10类似的功能的控制单元10A。如图14所示,作为其功能,例如,控制单元10A具有评分计算数据存储单元10Aa、评分计算单元10Ab和搜索结果输出单元10Ac。控制单元10A与控制单元10在结构上的不同之处在于评分计算数据存储单元10Aa。应用于车载设备的代理1A使用GPS、陀螺仪传感器等执行定位感测,并将其结果作为移动历史存储在数据库17中。该移动历史被存储为时间序列数据。另外,也存储在车辆中发出的话语中包含的用语(词语)。
图15是用于说明根据第二实施例的存储在数据库17中的信息的具体示例的图示(地图)。例如,2017年11月4日(周六)行进的路线R1作为移动历史存储在数据库17中。“日式餐馆C1”和“家具商店F1”存在于沿路线R1的预定位置处,而寿司餐馆D1存在于略微远离路线R1的位置处。在数据库17中还存储有在“日式餐馆C1”附近发出的话语(例如,说出“这里的食物很棒”的话语)或者在行驶于“家具店F1”附近时发出的话语(例如,说出“这里的员工很棒”的话语)。
另外,例如,2017年11月6日(周一)、2017年11月8日(周二)、2017年11月10日(周五)行进的路线R2作为移动历史存储在数据库17中。“商店A1”、“日式餐馆B1”和“日式餐馆E1”存在于沿路线R2的预定位置处。在数据库17中还存储有在行驶于“日式餐馆B1”附近时发出的话语(例如,说“这个地方好极了”的话语)。另外,在数据库17中登记了沿着每条路线存在的或者在距每条路线预定范围内存在的商店或餐馆的名称作为用语。在这种情况下,用语可以基于话语或者可以从地图数据中读取。
例如,在所例示的信息被存储在数据库17中的状态下,由用户对代理1A发出“请预订平日经过的P站附近的那个日式餐馆”的话语。由于话语信息包括具有歧义的用语“那个”,因此代理1A的控制单元10A以与第一实施例类似的方式为与该用语对应的每条属性信息计算分项评分,并基于所计算的分项评分计算准确度评分。
图16示出了计算的准确度评分和分项评分的示例。作为属性信息,例如,“ID”、“定位准确度”、“日期-时间准确度”、“关于日式餐馆的准确度”和“个人评价”与每个用语相关联。
在下文中,将描述与分项评分的计算有关的设置。
位置准确度:因为话语信息包括读为“P站附近”的用语,所以计算分项评分使得距离P站的距离越短,分项评分就越高。
日期时间准确性:由于话语信息包括读为“平日”的词语,因此计算分项评分,使得沿着在平日经常行进的路线R2存在的餐馆的分项评分为高,而沿着在周末和假日行进的路线R1存在的餐馆的分项评分为低。
关于“日式餐馆”的准确性:由于话语信息包括读为“那个日式餐馆”的用语,因此计算分项评分,以便向符合日式餐馆的描述的餐馆给予较高分项评分。
个人评价:这是根据先前存储的在车辆内部发出的话语导出的评估值。话语越积极,分项评分越高。
基于上述设置计算的分项评分如图16所示。此外,计算表示分项评分的总和的值作为准确度评分。应当注意,可以以与第一实施例类似的方式通过各个分项评分的加权相加来计算准确度评分。
基于如上所述计算的准确度评分向用户通知候选。基于模式P1至P4中的任一者,以与第一实施例类似的方式执行候选的通知。例如,在将多个候选通知为搜索结果的模式P3的情况下,至少能够识别准确度评分来进行通知。可以通过使分项评分可识别或者通过使得用户指示的分项评分可识别来执行通知,如第一实施例中所述。
当代理1A用作车载设备时,可以在代理1A对用户响应期间执行以下处理。
当用户在驾驶车辆时询问代理1A时,代理1A可以在检测到车辆已经停止之后做出响应(包括通知多个候选)。在视频的情况下,在车辆停止之后显示视频,并且在语音的情况下,在车辆停止之后类似地提供响应的语音。因此,能够防止用户的驾驶集中注意力变差。另外,代理1A能够基于由车速传感器取得的传感器信息来确定车辆是否停止。在该配置中,传感器单元11包括车速传感器。
另外,当代理1A在通过视频或语音的通知期间检测到车辆已经开始移动时,代理1A暂停通过视频或语音的通知。此外,基于车辆速度传感器的传感器信息,当一定水平或更高的车辆速度持续一定时间段或更长的时间时,代理1A确定车辆正在高速公路上行驶。当预期在用户对代理1A做出查询之后车辆将一定时间段或更长时间不会停止时,诸如当如上所述在高速公路上行驶时,可以取消查询。可以通过语音等向用户通知查询已被取消的事实、错误消息等。可以针对由坐在乘客座位上的用户对代理1A做出的查询,提供响应。可以通过应用例如被称为波束成形的技术来实现使代理1A仅接受来自坐在乘客座位上的用户的输入。
上述第二实施例也可以产生与第一实施例类似的效果。
<第三实施例>
接着,将描述第三实施例。在以下说明中,对与第一实施例和第二实施例的部件相同或相似的部件赋予相同的附图标记,并省略多余的说明。此外,在第一实施例和第二实施例中描述的内容也可以应用于第三实施例,除非有相反的具体说明。第三实施例表示将代理应用于家用电器或更具体地应用于冰箱的示例。
根据第三实施例的代理(以下,在适当时称为代理1B)具有提供与代理1的控制单元10类似的功能的控制单元10B。如图17所示,作为其功能,例如,控制单元10B具有评分计算数据存储单元10Ba、评分计算单元10Bb和搜索结果输出单元10Bc。
控制单元10B与控制单元10的不同之处在于评分计算数据存储单元10Ba的结构。代理1B例如包括作为传感器单元11的两个传感器系统。传感器之一是“用于识别物体的传感器”,其示例包括成像设备和红外传感器。另一个传感器是“用于测量重量的传感器”,其示例包括重力传感器。利用这两个系统的感测结果,评分计算数据存储单元10Ba存储关于冰箱内部的物体的类型和重量的数据。
图18示出了由评分计算数据存储单元10Ba存储在数据库17中的信息的示例。图18中的“物体”对应于通过视频感测已经感测到的冰箱中的“物体”。“改变日期/时间”表示伴随将物体放置在冰箱内或从冰箱取出的物体所发生的改变的日期和时间。关于时间信息,可以采用在传感器单元11中包括时间测量单元的配置,在这种情况下,可以由控制单元10B从时间测量单元获得时间信息,或者控制单元10B可以从控制单元10B自身中包括的RTC(实时时钟)获得时间信息。
“数量改变/数量”表示在上述改变日期/时间已经发生改变的冰箱内的物体的数量,以及改变后的物体的数量。基于例如成像设备等的感测结果来获得数量变化。“重量变化/重量”表示在上述改变日期/时间已经改变的重量(量),以及变化后的重量。应当注意,在一些情况下,即使数量没有变化,重量也会变化。例如,即使数量不变化,有时重量也会变化,例如在图18中的ID:24和ID:31所示的“苹果汁”的情况。这表明苹果汁已经被消耗。
现在让我们考虑这样一种情况,例如,用户询问代理1B“哪种蔬菜要吃完了?”这种检查必要性的思路经常发生在在室外购物时。因此,用户可在家外购物期间与智能电话交谈,且话语信息可经由网络从智能电话传输到代理1B。对用户查询的响应经由网络从代理1B发送,并且通过显示器、语音等从用户的智能电话通知该响应。毋庸置疑,考虑到近年来使用因特网等购物的日益普及,还期望考虑在室内(在家里)发生检查必要性的情况。在这种情况下,可以将用户的查询直接输入到代理1B。
代理1B对用户的输入话语信息执行语音识别。由于话语信息包括具有歧义的用语“哪种蔬菜”,因此控制单元10B计算准确度评分和分项评分。
首先,控制单元10B的评分计算单元10Bb从图18所示的数据库17的信息中读取最近(最新)的改变日期/时间和在每个“物体”的改变日期/时间发生的数量的变化或重量的变化。此外,评分计算单元10Bb基于读取的结果计算每个“物体”的准确度评分和分项评分。
图19示出了计算的准确度评分和分项评分的示例。在本实施例中,将“物体评分”和“重量评分”设置为分项评分。毋庸置疑,如第一实施例所述,还可以提供根据物体等的识别准确度的评分。
在下文中,将描述与每个分项评分相关的设置。
物体评分:由于话语信息包括用语“哪种蔬菜”,因此就蔬菜给出高评分,而就水果也给出一定评分。在图19所示的示例中,例如,作为蔬菜的胡萝卜和洋葱被给予较高的评分,而猕猴桃也被给予一定的评分。相反,对非蔬菜(例如蛋)的评分较低。
重量评分:给出基于最近变化量和当前重量确定的评分。因为话语信息包括用语(句子)“将要用尽”,所以当变化量为“负(-)”并且变化后的重量较小时,给予较高的评分。例如,对变化量为“负(-)”并且变化后的重量较小的洋葱给予高分。
基于所计算的分项评分来计算准确度评分。在图19所示的示例中,通过将各个分项评分相加来计算准确度评分。毋庸置疑,可以通过各个分项评分的加权相加来计算准确度评分。
基于如上所述计算的准确度评分向用户通知候选。基于模式P1至P4中的任一者,以与第一实施例类似的方式执行候选的通知。例如,在将多个候选通知为搜索结果的模式P3的情况下,至少能够识别准确度评分来进行通知。可以通过使评分项评分可识别或者通过使得用户指示的分项评分如第一实施例中所述可识别来执行通知。
第三实施例也能够产生与第一实施例同样的效果。
<变形>
虽然上面具体描述了本公开的多个实施例,但是应当理解,本公开的内容不限于上述实施例,并且可以基于本公开的技术构思进行各种变形。在下文中,将描述变形。
根据上述实施例的代理的处理的一部分可以由服务器设备执行。例如,如图20所示,在代理1和服务器设备2之间执行通信。服务器设备2具有例如服务器控制单元21、服务器通信单元22和数据库23。
服务器控制单元21控制服务器设备2的各个单元。例如,服务器控制单元21具有先前描述的评分计算数据存储单元10a和评分计算单元10b。服务器通信单元22是用于与代理1通信的组件,并且具有与通信标准相对应的组件,诸如调制/解调电路和天线。数据库23存储与数据库17类似的信息。
从代理1向服务器设备2发送语音数据和感测数据。语音数据等经由服务器通信单元22提供给服务器控制单元21。服务器控制单元21以与控制单元10类似的方式将用于评分计算的数据存储在数据库23中。此外,当从代理1提供的语音数据包括具有歧义的用语时,服务器控制单元21计算准确度评分等,并将与用户的话语信息相对应的搜索结果发送到代理1。代理1通过先前描述的模式P1至P4中的任一者向用户通知搜索结果。或者,可以由服务器设备2指定通知模式。在这种情况下,在从服务器设备2发送到代理1的数据中描述指定的通知模式。
现在将描述其他变形。在上述实施例中,要输入到代理的语音不限于在代理周围发生的对话,而是还可以包括在家外记录的对话等、通过电话的会话等。
在上述实施例中,显示准确度评分等的位置不限于图像下方,并且可以适当地改变到诸如图像上方。
在上述实施例中,对应于话语信息的处理不限于预定餐馆,并且可以是诸如购买物品或预定门票的任何类型的处理。
在上述第三实施例中,读取物体的使用日期的传感器(例如,读取附着到物体的RFID(射频标识符)的传感器)可以用作传感器单元,在这种情况下,当使用日期到期时,权重可以被设置为0。以此方式,可以适当地改变传感器单元的配置。
在上述实施例中呈现的配置仅仅是示例,并不限于此。毋庸置疑,在不脱离本公开的精神和范围的情况下,可以添加、删除部件等。本公开还可以以诸如设备、方法、程序和系统的任何形式来实现。该程序可以存储在例如包括在该控制单元中的存储器或合适的存储介质中。
本公开还可以采用以下配置。
(1)一种信息处理设备,包括:
控制单元,被配置为当存在与已经与多条属性信息相关联的预定用语相对应的多条信息作为搜索结果的候选时,执行控制以通过使针对每一个用语计算的指标可识别来通知每条信息。
(2)根据(1)的信息处理设备,其中
属性信息包括基于话语信息获得的定位信息。
(3)根据(1)或(2)的信息处理设备,其中
控制单元被配置为在输入包括具有歧义的用语的话语信息时通知搜索结果。
(4)根据(1)至(3)中任一项的信息处理设备,其中
指标包括针对每条属性信息计算的分项评分以及对多个分项评分进行综合的综合评分,并且
控制单元被配置成至少通知综合评分以便可识别。
(5)根据(4)的信息处理设备,其中
综合评分是分项评分的加权相加。
(6)根据(5)的信息处理设备,其中
控制单元被配置成根据话语信息来改变在加权相加中使用的权重。
(7)根据(4)至(6)中任一项的信息处理设备,其中
控制单元被配置成通知至少一个分项评分以便可识别。
(8)根据(1)至(7)中任一项的信息处理设备,其中
控制单元被配置为与对应于每条信息的指标相关联地显示多条信息。
(9)根据(8)的信息处理设备,其中
控制单元被配置为根据与每条信息对应的指标来以显示的大小、灰度级和排列顺序中的至少一者不同的方式显示每条信息。
(10)根据(8)的信息处理设备,其中
指标包括针对每条属性信息计算的分项评分以及对多个分项评分进行综合的综合评分,并且
控制单元被配置成显示已经通过预定输入指示的分项评分。
(11)根据(1)至(10)中任一项的信息处理设备,其中
控制单元被配置成用于通过与对应于每条信息的指标相关联的语音来输出多条信息。
(12)根据(11)的信息处理设备,其中
控制单元被配置成连续地输出预定信息以及与信息相对应的指标。
(13)根据(11)的信息处理设备,其中
控制单元被配置成通过基于与预定的信息相对应的指标添加声音效果来输出该预定的信息。
(14)根据(1)至(13)中任一项的信息处理设备,其中
属性信息包括与基于在移动体的移动期间发出的话语的评估相关的信息。
(15)一种信息处理方法,包括:
控制单元,当存在与已经与多条属性信息相关联的预定用语相对应的多条信息作为搜索结果的候选时,执行控制以通过使针对每一个用语计算的指标可识别来通知每条信息。
(16)一种使计算机执行信息处理方法的程序,包括:
控制单元,当存在与已经与多条属性信息相关联的预定用语相对应的多条信息作为搜索结果的候选时,执行控制以通过使针对每一个用语计算的指标可识别来通知每条信息。
参考符号列表
1、1A、1B 代理
10、10A、10B 控制单元
11 传感器单元
15 语音输入单元
16 显示器
Claims (16)
1.一种信息处理设备,包括:
控制单元,被配置为当存在与预定用语相对应的多条信息作为搜索结果的候选时,执行控制以通过使针对每个用语计算的指标能识别来通知每条信息,其中,所述预定用语与多条属性信息相关联。
2.根据权利要求1所述的信息处理设备,其中:
所述属性信息包括基于话语信息获得的定位信息。
3.根据权利要求1所述的信息处理设备,其中:
所述控制单元被配置为在输入包括具有歧义的用语的话语信息时通知所述搜索结果。
4.根据权利要求1所述的信息处理设备,其中:
所述指标包括针对每条属性信息计算的分项评分以及对多个分项评分进行综合的综合评分,并且
所述控制单元被配置成至少通知能够识别的所述综合评分。
5.根据权利要求4所述的信息处理设备,其中:
所述综合评分是所述分项评分的加权相加。
6.根据权利要求5所述的信息处理设备,其中:
所述控制单元被配置成根据话语信息来改变在加权相加中使用的权重。
7.根据权利要求4所述的信息处理设备,其中:
所述控制单元被配置成通知能够识别的至少一个分项评分。
8.根据权利要求1所述的信息处理设备,其中
所述控制单元被配置为与对应于每条信息的指标相关联地显示多条信息。
9.根据权利要求8所述的信息处理设备,其中
所述控制单元被配置为根据与每条信息对应的指标来以每条信息的显示的大小、灰度级和排列顺序中的至少一者不同进行显示。
10.根据权利要求8所述的信息处理设备,其中
所述指标包括针对每条属性信息计算的分项评分以及对多个分项评分进行综合的综合评分,并且
所述控制单元被配置成显示已经通过预定输入指示的分项评分。
11.根据权利要求1所述的信息处理设备,其中
所述控制单元被配置成用于通过与对应于每条信息的指标相关联的语音来输出多条信息。
12.根据权利要求11所述的信息处理设备,其中
所述控制单元被配置成连续地输出预定信息以及与所述预定信息相对应的指标。
13.根据权利要求11所述的信息处理设备,其中
所述控制单元被配置成通过基于与预定信息相对应的指标添加声音效果来输出所述预定信息。
14.根据权利要求1所述的信息处理设备,其中
所述属性信息包括与基于在移动体的移动期间发出的话语的评价相关的信息。
15.一种信息处理方法,包含:
当存在与预定用语相对应的多条信息作为搜索结果的候选时,控制单元执行控制以通过使针对每个用语计算的指标能够识别来通知每条信息,所述预定用语与多条属性信息相关联。
16.一种使计算机执行信息处理方法的程序,所述信息处理方法包括:
当存在与已经与多条属性信息相关联的预定用语相对应的多条信息作为搜索结果的候选时,控制单元执行控制以通过使针对每个用语计算的指标能够识别来通知每条信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018083863 | 2018-04-25 | ||
JP2018-083863 | 2018-04-25 | ||
PCT/JP2019/005519 WO2019207918A1 (ja) | 2018-04-25 | 2019-02-15 | 情報処理装置、情報処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111989660A true CN111989660A (zh) | 2020-11-24 |
Family
ID=68294429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980026257.5A Withdrawn CN111989660A (zh) | 2018-04-25 | 2019-02-15 | 信息处理装置、信息处理方法和程序 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210165825A1 (zh) |
JP (1) | JPWO2019207918A1 (zh) |
CN (1) | CN111989660A (zh) |
WO (1) | WO2019207918A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023272502A1 (zh) * | 2021-06-29 | 2023-01-05 | 华为技术有限公司 | 一种人机交互方法及装置、设备及车辆 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4946187B2 (ja) * | 2006-06-09 | 2012-06-06 | 富士ゼロックス株式会社 | 関連語表示装置、検索装置、その方法及びプログラム |
US9318108B2 (en) * | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
JP2011179917A (ja) * | 2010-02-26 | 2011-09-15 | Pioneer Electronic Corp | 情報記録装置、情報記録方法、情報記録プログラムおよび記録媒体 |
JP5621681B2 (ja) * | 2011-03-29 | 2014-11-12 | 株式会社デンソー | 車載用情報提示装置 |
US9127950B2 (en) * | 2012-05-03 | 2015-09-08 | Honda Motor Co., Ltd. | Landmark-based location belief tracking for voice-controlled navigation system |
US20140358887A1 (en) * | 2013-05-29 | 2014-12-04 | Microsoft Corporation | Application content search management |
JP6571053B2 (ja) * | 2016-08-15 | 2019-09-04 | 株式会社トヨタマップマスター | 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体 |
US11221823B2 (en) * | 2017-05-22 | 2022-01-11 | Samsung Electronics Co., Ltd. | System and method for context-based interaction for electronic devices |
-
2019
- 2019-02-15 CN CN201980026257.5A patent/CN111989660A/zh not_active Withdrawn
- 2019-02-15 WO PCT/JP2019/005519 patent/WO2019207918A1/ja active Application Filing
- 2019-02-15 US US17/048,537 patent/US20210165825A1/en not_active Abandoned
- 2019-02-15 JP JP2020516055A patent/JPWO2019207918A1/ja not_active Ceased
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023272502A1 (zh) * | 2021-06-29 | 2023-01-05 | 华为技术有限公司 | 一种人机交互方法及装置、设备及车辆 |
Also Published As
Publication number | Publication date |
---|---|
WO2019207918A1 (ja) | 2019-10-31 |
US20210165825A1 (en) | 2021-06-03 |
JPWO2019207918A1 (ja) | 2021-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210407318A1 (en) | User training by intelligent digital assistant | |
JP7247271B2 (ja) | 非要請型コンテンツの人間対コンピュータダイアログ内へのプロアクティブな組込み | |
CN108352006B (zh) | 即时消息环境中的智能自动化助理 | |
US11092454B2 (en) | Device and method for providing content to user | |
US8103510B2 (en) | Device control device, speech recognition device, agent device, on-vehicle device control device, navigation device, audio device, device control method, speech recognition method, agent processing method, on-vehicle device control method, navigation method, and audio device control method, and program | |
US10755711B2 (en) | Information presentation device, information presentation system, and terminal device | |
Livingstone-Lee et al. | Transit apps for people with brain injury and other cognitive disabilities: the state of the art | |
JP4497528B2 (ja) | カーナビゲーション装置、カーナビゲーション方法及びプログラム | |
US11328716B2 (en) | Information processing device, information processing system, and information processing method, and program | |
JP4952750B2 (ja) | カーナビゲーション装置、カーナビゲーション方法及びプログラム | |
WO2023018908A1 (en) | Conversational artificial intelligence system in a virtual reality space | |
WO2012132464A1 (ja) | 携帯装置、アプリケーション起動方法、および、プログラム | |
WO2020116026A1 (ja) | 応答処理装置、応答処理方法及び応答処理プログラム | |
JP4793480B2 (ja) | カーナビゲーション装置、カーナビゲーション方法及びプログラム | |
CN111989660A (zh) | 信息处理装置、信息处理方法和程序 | |
JP2009300451A (ja) | カーナビゲーション装置、カーナビゲーション方法及びプログラム | |
JP6482703B1 (ja) | 推定装置、推定方法および推定プログラム | |
US20170287046A1 (en) | Navigation server, navigation client and navigation system | |
JP7046326B2 (ja) | 表示装置、表示プログラム、表示システム及び表示装置の制御方法 | |
EP3605527A2 (en) | Visually presenting information relevant to a natural language conversation | |
JP2019061302A (ja) | 情報制御装置、情報制御システム、情報制御方法及び情報制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201124 |
|
WW01 | Invention patent application withdrawn after publication |