CN102622399A - 搜索装置、搜索方法和程序 - Google Patents
搜索装置、搜索方法和程序 Download PDFInfo
- Publication number
- CN102622399A CN102622399A CN2012100045785A CN201210004578A CN102622399A CN 102622399 A CN102622399 A CN 102622399A CN 2012100045785 A CN2012100045785 A CN 2012100045785A CN 201210004578 A CN201210004578 A CN 201210004578A CN 102622399 A CN102622399 A CN 102622399A
- Authority
- CN
- China
- Prior art keywords
- search
- subjective
- threshold value
- proportion threshold
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90324—Query formulation using system suggestions
- G06F16/90328—Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种搜索装置、搜索方法和程序。公开了用于基于包括至少一个或多个主观元素和一个或多个对象元素的搜索查询来执行搜索的技术。可基于搜索查询的一个或多个对象元素来执行对内容的第一搜索。可确定从第一搜索返回的结果的数值特征的分布,其中数值特征的分布对应于搜索查询的主观元素中的一个。可确定对于主观元素的一个或多个比例阈值,并且可通过对分布应用一个或多个比例阈值来选择数值特征的范围。可基于所选择的数值特征的范围来执行对内容的第二搜索。
Description
技术领域
本发明涉及搜索装置、搜索方法和程序。
背景技术
近年来,例如使用互联网对各种信息搜索的可能性增加。例如,对交通工具的换乘信息、到达目的地的路径信息等的搜索正被经常执行。此外,利用诸如便携式电话或个人数字助理等的便携式设备对街道上的商店信息或者票或优惠券信息的搜索也正被经常执行。因此,近年来,信息搜索的几率迅速增加。此外,随着信息搜索服务的用户增加,已经提供了信息搜索系统的基础设施。结果,近年来,能够例如利用便携设备即时搜索各种信息。
假设使用难以输入搜索条件的便携设备,已经设计了能够通过语音输入搜索条件的语音搜索服务。此外,还已经设计了能够以自然语句“给我看在银座便宜的寿司餐厅”的形式来输入搜索条件的信息搜索服务。结果,能够迅速并且简单地输入搜索条件,从而极大地提高可用性。然而,在大量的信息搜索服务中,即使当搜索条件中包含主观表达“便宜”和“好”时,也只有包含用语“便宜”和“好”的信息被抽取。
例如,即使当使用自然语句“给我看在银座便宜的寿司餐厅”作为搜索条件时,只有含有关键词“便宜”的寿司餐厅信息被抽取并且一些低价的寿司餐厅可能不一定被抽取。因此,想要得到关于便宜的寿司餐厅信息的用户必须使用含有他们认为便宜的价格范围的搜索条件来执行搜索,或者必须一条一条的确认所抽取的寿司餐厅信息并找到便宜的寿司餐厅。作为这样的问题的解决方案,在日本专利特许公开No.2002-24212中公开了如下方法,其中预先准备与数值范围相关联的主观表达数据库,并且自动地将包含在作为搜索条件输入的自然语句中的主观表达转换为数值范围来执行搜索。
发明内容
如果应用在日本专利特许公开No.2002-24212中公开的方法,肯定希望利用与用户使用主观表达所指定的期望的搜索条件近似的条件来执行搜索,并且抽取反映用户的意图的搜索结果。然而,在该方法中,如果除了主观表达以外的搜索条件改变,则没有考虑用户使用主观表达所指定的期望的数值范围的变化。例如,由搜索条件“给我看在银座便宜的寿司餐厅”中的“便宜”所指示的价格范围,与由搜索条件“给我看在银座便宜的荞麦面餐馆”中的“便宜”所指示的价格范围不同。然而,在该方法中,以相同的数值范围来取代在两个搜索条件中所包含的主观表达“便宜”。因此,用户需要参考搜索结果、再次执行指定搜索条件的操作。
本公开被做出,以提供新颖的且改进的、并且能够根据含有主观表达的自然语句的内容将主观表达转换为适合用户意图的数值范围的搜索装置、搜索方法和程序。
一些实施例涉及一种装置,其包括:至少一个处理器;以及至少一个存储器,其存储处理器可执行指令,处理器可执行指令被配置为使得至少一个处理器进行以下动作:接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询;基于一个或多个对象元素执行对内容的第一搜索;确定从第一搜索返回的结果的数值特征的分布,数值特征对应于一个或多个主观元素中的第一主观元素;确定对于第一主观元素的一个或多个比例阈值;通过对分布应用一个或多个比例阈值来选择数值特征的范围;以及基于所选择的数值特征的范围来执行对内容的第二搜索。
一些实施例涉及一种方法,该方法包括以下步骤:接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询;基于一个或多个对象元素执行对内容的第一搜索;利用至少一个处理器来确定从第一搜索返回的结果的数值特征的分布,所述数值特征对应于一个或多个主观元素中的第一主观元素;确定对于第一主观元素的一个或多个比例阈值;通过对分布应用一个或多个比例阈值来选择数值特征的范围;以及基于所选择的数值特征的范围来执行对内容的第二搜索。
一些实施例涉及编码有所述计算机可执行指令的至少一个计算机可读存储介质,其中当计算机可执行指令被执行时,实现包括以下步骤的方法:接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询;基于一个或多个对象元素执行对内容的第一搜索;确定从第一搜索返回的结果的数值特征的分布,数值特征对应于一个或多个主观元素中的第一主观元素;确定对于第一主观元素的一个或多个比例阈值;通过对分布应用一个或多个比例阈值来选择所述数值特征的范围;以及基于所选择的数值特征的范围来执行对内容的第二搜索。
一些实施例涉及一种装置,其包括:用于接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询的设备;用于基于一个或多个对象元素执行对内容的第一搜索的设备;用于确定从第一搜索返回的结果的数值特征的分布的设备,数值特征对应于一个或多个主观元素中的第一主观元素;用于确定对于第一主观元素的一个或多个比例阈值的设备;用于通过对分布应用一个或多个比例阈值来选择数值特征的范围的设备;以及用于基于所选择的数值特征的范围来执行对内容的第二搜索的设备。
一些实施例涉及一种装置,其包括:至少一个处理器;以及至少一个存储器,其存储处理器可执行指令,处理器可执行指令被配置为使得至少一个处理器进行以下动作:接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询;显示从基于一个或多个对象元素的对内容的第一搜索返回的结果的数值特征的范围,数值特征对应于一个或多个主观元素中的第一主观元素;接收用于修改数值特征的范围的用户输入;以及显示基于修改后的数值特征的范围的、对内容的第二搜索的结果。
附图说明
图1是图示了根据本公开的实施例的信息搜索方法的概述的说明图。
图2是图示了一般信息搜索系统的问题(课题1:如果对主观表达指派了数值范围,实际上不能得到即时搜索结果)的说明图。
图3是图示了一般信息搜索系统的问题(课题2:如果用数据库管理详细的组合,则数据库变得超出实际得大)的说明图。
图4是图示了能够实现根据实施例的信息搜索方法的搜索装置的功能配置的说明图。
图5是图示了在根据实施例的信息搜索方法中使用的查询生成词典数据库的结构的说明图。
图6是图示了在根据实施例的信息搜索方法中使用的标准相对值数据库的结构的说明图。
图7是图示了在根据实施例的信息搜索方法中使用的个人相对值数据库的结构的说明图。
图8是图示了在根据实施例的信息搜索方法中包括的使主观表达数值化的方法的说明图。
图9是图示了在根据实施例的信息搜索方法中包括的使主观表达数值化的方法的说明图。
图10是图示了在根据实施例的信息搜索方法中使用的内容元数据数据库的结构的说明图。
图11是图示了在根据实施例的信息搜索方法中包括的、在搜索条件修改步骤中使用的条件修改屏幕的显示配置的说明图。
图12是图示了为实现根据实施例的信息搜索方法而执行的处理的流程的说明图。
图13是图示了为实现根据实施例的信息搜索方法而执行的处理的流程的说明图。
图14是图示了能够实现根据实施例的第一变形例的信息搜索方法的信息搜索装置的功能配置的说明图。
图15是图示了在根据实施例的第一变形例的信息搜索方法中使用的语义概念词典数据库的配置的说明图。
图16是图示了为实现根据实施例的第一变形例的信息搜索方法而执行的处理的流程的说明图。
图17是图示了为实现根据实施例的第一变形例的信息搜索方法而执行的处理的流程的说明图。
图18是图示了能够实现根据实施例的第二变形例的信息搜索方法的信息搜索装置的功能配置的说明图。
图19是图示了为实现根据实施例的第二变形例的信息搜索方法而执行的处理的流程的说明图。
图20是图示了为实现根据实施例的第二变形例的信息搜索方法而执行的处理的流程的说明图。
图21是说明了能够实现根据实施例的搜索装置的功能的信息处理装置的硬件配置的说明图。
具体实施方式
下文,将参考附图详细描述本公开的优选实施例。注意,在本说明书和附图中,利用相同的附图标记来指示具有相同功能和结构的结构元件,并且省略这些结构元件的重复说明。
【说明流程】
这里,将简要地描述下文中所描述的本公开的实施例的说明流程。首先,将参考图1描述根据本实施例的信息搜索方法的概述。其次,将参考图2和图3描述一般信息搜索系统的问题。
然后,将参考图4描述能够实现根据本实施例的信息搜索方法的搜索装置100的功能配置。在该描述中,将参考图5至图11详细描述在根据本实施例的信息搜索方法中使用的各种数据库的结构、将主观表达数据化的方法或者修改搜索条件的方法。此外,将参考图12和图13描述为实现根据本实施例的信息搜索方法、由搜索装置100执行的处理的流程。
接下来,将参考图14和图15描述根据本实施例的第一变形例的搜索装置130的功能配置。此外,将参考图16和图17描述为实现根据本实施例的第一变形例的信息搜索方法、由搜索装置130执行的处理的流程。然后,将参考图18描述根据本实施例的第二变形例的搜索装置150的功能配置。此外,将参考图19和图20描述为实现根据本实施例的第二变形例的信息搜索方法、由搜索装置150执行的处理的流程。
接下来,将参考图21描述能够实现搜索装置100、130和150的功能的信息处理装置的硬件配置。最后,将总结本实施例的技术精神,并简要地描述能够从本实施例的技术精神得到的效果。
(说明项目)
1:简介
1-1:实施例的概述
1-2:信息搜索系统的主题
2:实施例
2-1:搜索装置100的功能配置
2-2:信息搜索方法(搜索装置100的操作)
3:第一变形例
3-1:搜索装置130的功能配置
3-2:信息搜索方法(搜索装置130的操作)
4:第二变形例
4-1:搜索装置150的功能配置
4-2:信息搜索方法(搜索装置150的操作)
5:硬件配置
6:总结
<1.简介>
在详细描述描述根据本公开的实施例之前,将简要说明根据实施例的技术概述以及一般信息搜索系统的问题。
[1-1:实施例的概述]
将参考图1描述根据本实施例的技术的概述。根据本实施例的技术涉及信息搜索系统。具体而言,根据本实施例的技术涉及,当自然语句被作为搜索条件输入时、基于搜索条件输出适合于用户意图的搜索结果的方法。此外,根据本实施例的技术涉及,在含有将被转换为数值范围的主观表达的自然语句被输入的情况下、用于将主观表达转换为适当的数值范围并且有效地利用含有数值范围的搜索条件来执行搜索的机制。
例如,将考虑如图1所示、自然语言查询“给我看在银座便宜并且美味的寿司餐厅”被输入的情况。在这种情况下,“便宜”和“美味”是将被转换为数值范围的主观表达。在一般信息搜索系统中,主观表达被识别为单纯的关键词,并且含有用语“便宜”或“美味”的信息被作为搜索结果输出。然而,在根据本实施例的技术中,“便宜”被转换为适当的价格范围并且“美味”被转换为适当的评价值范围。通过主观表达被转换为价格范围或评价值范围的搜索条件来搜索信息。
此外,根据本实施例的技术包括用于使用户能够确认或修改与主观表达对应的数值范围的机制。例如,如图1所示,如果主观表达“便宜”被转换为数值范围“预算:0到5000日圆”,则将该数值范围呈现给用户,使得用户可改变该数值范围。类似地,如果主观表达“美味”被转换为数值范围“评价值:2.5到5.0”,则将该数值范围呈现给用户,使得用户能够修改该数值范围。此外,搜索条件的一部分可以被删除或者每个搜索条件可以被加重。
此外,根据本实施例的技术包括,用于使某个搜索结果的数值范围的修改能够被反映到另一个搜索结果的机制。例如,在以自然语句“给我看在银座便宜并且美味的寿司餐厅”的输入作为搜索条件的搜索结果中,如果针对主观表达“便宜”的数值范围“预算:0至5000日圆”被修改,则修改内容也被反映在以自然语句“给我看在银座便宜的荞麦面餐厅”的输入作为搜索条件的搜索结果上。即,根据本实施例的技术具有用于使用户能够消除在用户的“便宜”的概念或用户所认为的“便宜”的感觉与搜索结果所包含的“便宜”的概念或感觉之间的差别的机制。
因此,根据本实施例的技术涉及这样的信息搜索系统,其用于将主观表达转换为适当的数值范围以产生搜索条件并且基于该搜索条件有效地执行搜索。此外,根据本实施例的技术提供了能够在不使用庞大的数据库的条件下、根据搜索条件将主观表达转换为适当的数值范围的机制。此外,根据本实施例的技术使用户能够修改用于将主观表达转换为数值范围的信息,并且调整由主观表达所表示的概念或感觉。根据本实施例的技术使得搜索机制能够基于主观表达个人化。
已经简要地描述了根据本实施例的技术的概述。稍后将描述根据本实施例的信息搜索方法或将主观表达数值化的方法。
[1-2:信息搜索系统的问题]
下面,将简要地描述一般信息搜索系统的问题。大多数一般信息搜索系统将包含在自然语句中的主观表达识别为关键字,并且输出含有关键字的信息作为搜索结果。然而,含有主观表达的信息可能不一定是反映主观表达的意图的信息。因此,这样的信息搜索系统的大多数搜索结果没有反映用户的意图。已经发明了只有与数值范围相关联的主观表达的数据库并且利用数据库将主观表达转换为数值范围以重构搜索条件的方法。
在该方法的情况下,例如,如图2所示,即使当输入自然语句“给我看在银座便宜的寿司餐厅”时或输入自然语句“给我看在涩谷便宜的寿司餐厅”时,以相同的数值范围(在图2的示例中,“预算:0到5000日圆”)取代与主观表达“便宜”对应的数值范围。现在,假定在银座寿司的市场价格是8000日圆并且假设在涩谷寿司的市场价格是4000日圆。在该示例中,响应于自然语句“给我看在银座便宜的寿司餐厅”的输入,在银座与“预算:0到5000日圆”对应的寿司餐厅的信息被作为搜索结果输出。即,实际上输出了在银座“便宜”的寿司餐厅的信息。
同时,响应于自然语句“给我看在涩谷便宜的寿司餐厅”的输入,在涩谷与“预算:0到5000日圆”对应的寿司餐厅的信息也被作为搜索结果输出。即,与“预算:4000到5000日圆”对应的寿司餐厅信息也被作为搜索结果输出。因此,实际上,也输出了在涩谷具有“昂贵”的寿司的寿司餐厅的信息。此外,当输入“给我看在银座便宜的荞麦面餐厅”时,同样得到不适当的搜索结果。为了防止这样的不适当的输出,需要持有其中地点或目标元素(影响主观表达的分析的元素)以及主观表达和数值范围相关联的数据库,如图3所示。
然而,从图3所示的数据库的示例中可见,存在大量对主观表达的分析有影响的数据以及大量与各个主观表达保持相关的记录。结果,由于找到想要的记录需要时间,因此降低了搜索效率。此外,由于需要具有大存储容量的存储器来保持大量数据,因此成本大大增加。此外,由于很难将庞大的数据库提供给各个用户,因此很难使得主观表达与数值范围之间的关联关系个人化。
因此,利用主观表达与数值范围相关联的数据库来重构搜索条件的方法涉及如上上述问题。本发明人已经发明了用于解决该问题并且提高以含有主观表达的自然语句为搜索条件的搜索的效率的机制。下文,将详细描述该机制。
<2:实施例>
将描述本公开的实施例。本公开涉及在不使用庞大的数据库的情况下、将主观表达转换为适当的数值范围以执行搜索的信息搜索方法。
[2-1:搜索装置100的功能配置]
首先,将参考图4描述能够实现根据本实施例的信息搜索方法的搜索装置100的功能配置。图4是图示了根据本实施例的搜索装置100的功能配置的说明图。
如图4所示,搜索装置100包括语音识别单元101、自然语言分析单元102、语言分析词典数据库103、查询生成单元104以及查询生成词典数据库105。此外,搜索装置100还包括内容搜索单元106、内容元数据数据库107、数值化单元108、标准相对值数据库109以及个人相对值数据库110。此外,搜索装置100包括搜索信息输出单元111、搜索条件修改单元112和相对值反向计算单元113。
然而,假设语言分析词典数据库103、查询生成词典数据库105、内容元数据数据库107、标准相对值数据库109以及个人相对值数据库110被存储在未示出的存储设备中。或者,语言分析词典数据库103、查询生成词典数据库105、内容元数据数据库107、标准相对值数据库109以及个人相对值数据库110可以设置在搜索装置100的外部。此外,搜索装置100可具有未示出的输入设备和输出设备。
输入设备包括例如键盘、鼠标、开关、触摸屏、触摸板或麦克风。此外,输出设备包括例如显示器或扬声器。在下文中,虽然将以示例的方式描述通过语音输入搜索条件的方法,但是输入搜索条件的方法根据包括在搜索装置100中的输入设备的类型适当地改变。此外,虽然为了说明假设了显示并输出搜索结果或搜索条件的方法,但是显示并输出搜索结果或搜索条件的方法可根据包括在搜索装置100中的输出设备的类型改变为例如语音输出。应该明白,这样的改变包括在本实施例的技术范围内。
在下文中,将以从通过语音的搜索条件输入到搜索结果输出的流程来描述搜索装置100的功能和操作。
首先,由用户利用输入设备输入语音。在这种情况下,用户像对朋友说话一样输入搜索条件。例如,用户通过语音输入自然语言查询“给我看在银座便宜的寿司餐厅”作为搜索条件。如果输入了语音,则语音信号从输入设备中输出并且被输入到语音识别单元101。如果输入了语音信号,则语音识别单元101将语音信号转换为文本。语音识别单元101将通过转换语音信号获得的文本输入到自然语言分析单元102。
如果输入了文本,则自然语言分析单元102执行诸如形态分析之类的自然语言分析,以将被输入的文本转换为诸如词类、属性、短语和从属关系等的信息。例如,自然语言分析单元102将自然语句“给我看在银座便宜的寿司餐厅”分成短语“在银座/便宜的/寿司餐厅/给我看”。自然语言分析单元102输出诸如“银座:专有名词,地点名称”“寿司:名词,食物名称”(“词表示:词类,属性”)之类的分析结果。当执行这些自然语言分析时,自然语言分析单元102使用语言分析词典数据库103。
例如,将词与概念连接的信息或者指示词的分类或使用的信息存储在语言分析词典数据库103中。在后面的说明中,将由自然语言分析单元102分开的单独的短语(例如,一个或多个词)称作元素。
由自然语言分析单元102从自然语句抽取的元素被输入到查询生成单元104。如果输入了构成自然语句的元素,则查询生成单元104利用除了与将被转换为数值范围的主观表达对应的那些元素以外的元素、产生用于执行暂定搜索的查询(下文成为暂定查询)。首先,查询生成单元104抽取被包含在搜索条件中的自然语句的元素。例如,如果搜索餐厅信息,则查询生成单元104抽取诸如“地点”、“类型”和“预算”之类的适合于搜索条件的自然语句的元素。
在这种情况下,查询生成单元104考虑预先在查询生成词典数据库105(例如,见图5)中登记的“词表示,词类,属性”情况、从属关系等的映射信息,抽取适合于搜索条件的自然语句的元素。例如,如果自然语句“给我看在银座便宜的寿司餐厅”被输入为搜索条件,则查询生成单元104抽取“银座”作为适合于搜索条件“地点”的元素,并且抽取“寿司”作为适合于搜索条件“类型”的元素。此外,查询生成单元104抽取“便宜”作为适合于搜索条件“预算”的元素。在这样的情况下,查询生成单元104确认主观元素“便宜”是将被转换为数值范围的主观表达。
如果抽取了适合各个搜索条件的元素,查询生成单元104将除了主观表达以外的元素组合以产生暂定查询。例如,查询生成单元104以客观元素“地点:银座”和“类型:寿司”为搜索条件来产生暂定查询。由查询生成单元104产生的暂定查询被输入到内容搜索单元106。如果输入了暂定查询,内容搜索单元106从内容元数据数据库107(例如,见图10)抽取适合于被输入的暂定查询的信息。例如,如果暂定查询使用“地点:银座”和“类型:寿司”作为搜索条件,则内容搜索单元106可以抽取如图9所示的搜索结果。图9示出了基于暂定查询和数值化方法的搜索结果的示例。
利用暂定查询由内容搜索单元106抽取的搜索结果被输入到数值化单元108。此外,将被转换为数值范围的主观表达被从查询生成单元104输入到数值化单元108。如果输入了基于暂定查询的搜索结果和主观表达,则数值化单元108基于所输入搜索结果、将所输入的主观表达转换为数值范围。在这种情况下,数值化单元108利用存储在标准相对值数据库109或个人相对值数据库110中的信息、将主观表达转换为数值范围。由数值化单元108从主观表达转换来的数值范围被输入到查询生成单元104。
这里,将更详细地描述将主观表达转换为数值范围的方法。
首先,将参考图6和图7描述标准相对值数据库109和个人相对值数据库110的配置。如图6所示,标准相对值数据库109是以主观表达与相对值相关联的数据库。此外,标准相对值数据库109的记录被假设为预先设置。例如,主观表达“便宜”与相对值0%至30%相关联。此外,如图7所示,个人相对值数据库110是指示各个不同用户的主观表达与相对值之间的关联关系的数据库。此外,如果相对值被用户修改,则个人相对值数据库110的记录被增加或修改。
相对值表示用户利用主观表达想要表达的感觉(例如,合理价格的感觉)。例如,与主观表达“便宜”对应的相对值0%至30%,意味着用户感觉在一定条件下抽取的价格范围的列表中较低的0至30百分位的价格范围是“便宜”。即,标准相对值数据库109和个人相对值数据库110利用相对值定量地表示主观表达的用户感觉。如果使用该相对值,则即使在对于相同主观表达的用户感觉根据搜索条件发生变化时,主观表达也能被转换为适合于用户感觉的数值范围。
图8示出了利用相对值和分布使主观表达数值化的方法:相对值[0%,10%]的情况。具体而言,如图8所示,执行了基于暂定查询从搜索结果获取数值特征(在图8的示例中,价格范围)的分布、并且从该分布中确定适合于相对值的数值范围的处理。例如,如果自然语句中包含主观表达“非常便宜”,则数值化单元108从标准相对值数据库109(见图6)中抽取与该主观表达对应的相对值(0至10%)。接下来,数值化单元108基于暂定查询从搜索结果获取价格范围的分布。如果获取了价格范围的分布,则数值化单元108确定与在所获取的价格范围分布中从便宜的一个顺次累加的搜索结果的数目达到10%处的界限对应的价格(在图8的示例中,3200日圆)。通过对分布应用10%比例阈值,数值化单元108确定与主观表达对应的数值范围是从0到3200日圆。
因此,数值化单元108基于暂定查询、利用搜索结果和相对值来确定与主观表达对应的数值范围。数值化单元108将主观表达转换为数值范围。虽然这里示出了使用标准相对值数据库109的示例,但是如果对应于主观表达的记录在个人相对值数据库110中,则使用个人相对值数据库110。
现在,如果通过数值化数据库108将对应于主观表达数值范围输入到查询生成单元104,则查询生成单元104产生将所输入的数值范围添加到搜索条件的最终查询。即,最终查询包含与搜索条件对应的数值范围以及包含在暂定查询中的主观表达。由查询生成单元104产生的最终查询被输入到内容搜索单元106中。如果输入了最终查询,则内容搜索单元106基于所输入的最终查询搜索内容元数据数据库107的信息。内容搜索单元106将基于最终查询的搜索结果和搜索条件输入到搜索信息输出单元111中。
如果输入了基于最终查询的搜索结果和搜索条件,则搜索信息输出单元111输出所输入的搜索结果和搜索条件。例如,搜索信息输出单元111显示基于最终查询的搜索结果,如图1所示。如果在输出了基于最终查询的搜索结果以后、用户指示转换到搜索条件修改屏幕,则搜索信息输出单元111显示搜索条件。具体而言,搜索信息输出单元111显示与主观表达对应的数值范围。此外,搜索信息输出单元111显示用于操作的操作对象,使得与主观表达对应的数值范围可被修改,如图11所示。
在图11的示例中,显示了三个区域A1、A2和A3。在区域A1中显示作为搜索条件输入的自然语句“银座车站附近便宜的寿司餐厅”。此外,在区域A1中显示用于基于修改后的搜索条件执行重新搜索的按钮Obj1。如果用户在修改搜索条件后按压该按键Obj1,则可基于修改后的搜索条件执行搜索。
此外,在区域A2和区域A3中显示,用于修改作为主观表达的对象的短语、与主观表达对应的数值范围以及搜索条件的对象Obj2和Obj3。对象Obj2是用于切换搜索条件的有效/无效的复选框。例如,如果在区域A2中的对象Obj2未选中,则在区域A2中显示的搜索条件变为无效。同时,对象Obj3是用于修改数值范围的滑动条。例如,如果滑动在区域A2中的对象Obj3的条,则数值范围“距离”改变。或者,对象Obj2和Obj3可以分别不是复选框和滑动条。
如果利用这样的用户界面修改了搜索条件,则修改的内容被输入到搜索条件修改单元112。例如,如果与主观表达对应的数值范围被修改,则搜索条件修改单元112将修改后的数值范围输入到相对值反向计算单元113。如果输入了修改后的数值范围,则相对值反向计算单元113从数值化数据库108获取从基于暂定查询的搜索结果获取的数值范围的分布,并且基于所获取的分布计算与修改后的数值范围对应的相对值。例如,如果在图8的示例中确定的0到3200日圆的数值范围被修改为0至2500日圆,则相对值反向计算单元113计算在分布中价格对应于0至2500日圆的搜索结果的数目的百分比,并且基于该百分比计算相对值。从而,将上限从3200日圆变为2500日圆的用户输入将与“便宜”相关联的比例阈值从一个相对值(例如,百分比)改变到另一个。
虽然这里所述的示例示出了修改数值范围的上限,但是也可以修改数值范围的下限。或者,数值范围的上限和下限都可以被修改。例如,用户可以将0至3200日圆的数值范围修改为1500至3000日圆。在这种情况下,相对值反向计算单元113计算在分布中价格对应0至1500日圆的搜索结果的数目的百分比Q1,以及在分布中价格对应0至3000日圆的搜索结果的数目的百分比Q2,并且确定相对值Q1和Q2。因此,可以由用户修改和/或指定多个比例阈值,并且可任意地扩大或缩小搜索条件的数值范围。
如果基于修改后的数值范围计算了相对值,则相对值反向计算单元113利用所计算的相对值更新个人相对值数据库110的记录。然而,在个人相对值数据库110中没有对应于所计算的相对值的主观表达的记录,则相对值反向计算单元113将该记录添加到个人相对值数据库110中。在这种情况下,相对值反向计算单元113基于用户ID单独地识别用户并且添加或更新记录,如图7所示。此外,如果用户指示重新搜索,则基于存储在个人相对值数据库110中的更新后的记录、通过数值范围再次产生最终查询,并且基于最终查询搜索信息。
已经以从搜索条件输入到搜索结果输出的处理的流程、描述了搜索装置100的功能和操作。如上所述,搜索装置100基于相对值将主观表达转换为数值范围。结果,可得到适当地考虑了随搜索条件变化的主观表达的分析的搜索结果。此外,由于通过相对值代表主观表达,因此数据库的大小较小并且用于将主观表达转换为数值范围的信息可切实地个性化。
(补充说明1:产生暂定查询的方法)
在说明中,已经介绍了将除了主观表达以外的自然语句的元素组合以产生暂定查询的方法。然而,如果在自然语句中包含多个主观表达,则可利用下面的方法产生暂定查询。例如,考虑如下方法,其中如图6所示准备用于针对主观表达的暂定查询的数值范围,并且用于暂定查询的该数值范围包含在构成暂定查询的搜索条件中。如果使用该方法,则通过排出认为不必要的搜索结果,可抑制基于暂定查询的搜索结果的数目。结果,提高了当基于暂定查询从搜索结果获取分布时的处理效率。作为利用用于暂定查询的数值范围来选择主观表达的方法,例如,可以考虑优选选择后面将描述的具有较低权重的主观表达。
(补充说明2:权重设置方法)
此外,上面已经讨论了将用户的修改动作反映到搜索结果的方法。然而,将频繁修改的搜索条件认为是对用户具有相对较高的重要性的搜索条件。同时,将无效的搜索条件认为是对用户具有相对较低的重要性的搜索条件。随着将搜索条件的重要性反映在搜索结果中,预期可实现更精确的搜索。将介绍当添加或修改个人相对值数据库110的记录时、根据用户的修改动作来分配权重的方法。
例如,如果基于暂定查询的搜索结果的数目大于给定数目,则用户试图通过调整搜索条件来限制搜索结果的数目。在这种情况下,认为用户改变具有相对较高的重要性的搜索条件。即,认为被改变以减小搜索结果的数目的搜索条件是具有相对较高的重要性的搜索条件。例如,认为被改变以减小数值范围的宽度的搜索条件是具有相对较高的重要性的搜索条件。因此,将这样的搜索条件的权重设定为较大值。
另一方面,如果基于暂定查询的搜索结果的数目小于给定数目,则用户试图通过调整搜索条件或使搜索条件中的一些作废、来增大搜索结果的数目。在这种情况下,认为用户改变或废止具有相对较低重要性的搜索条件。例如,用户试图通过扩大搜索条件的数值范围或使搜索条件作废来去除限制。这样的搜索条件的改变可以说是用户对条件的宽松妥协的结果。即,被改变以增大搜索结果的数目的搜索条件可以说是那些被认为用户允许妥协的搜索条件。因此,将这样的搜索条件的权重设定为较小值。
此外,认为具有较高变化频率的搜索条件是被用户注意的搜索条件。因此,将具有较高变化频率的搜索条件的权重设定为相对较大值,或者修改为具有较大值。此外,认为具有较大改变量的搜索条件是对用户具有相对较低重要性的搜索条件。即,可以认为可被极大地改变的搜索条件是用户不太强烈需要的搜索条件。因此,将具有较大改变量的搜索条件的权重设定为相对较小值或修改为具有较小值。从而,根据用户改变搜索条件的方法来设置与各个搜索条件对应的权重。
该权重被认为是当执行搜索时各个搜索条件的重量。结果,能够得到对用户重要的极大地考虑了搜索条件的搜索结果。权重设置方法不限于此,而是可使用各种设置方法,只要将权重设置为反映用户所认为的重要性即可。
(补充说明3:更新相对值的方法)
在上述说明中,已经介绍了直接在个人相对值数据库110中登记由相对值反向计算单元113计算出的相对值的方法。然而,如果相对值由于用户对数值范围的修改而极大地改变,在个人相对值数据库110中登记的相对值可能受到限制。即,由于认为主观表达的分析不会突然极大地改变,因此,相对值的极端变化没有反映在个人相对值数据库110中。例如,可以累积给定数量的日志,并且计算日志的平均值并将其登记在个人相对值数据库110中。
此外,由用户输入搜索满意度,并且基于所输入的搜索满意度、经过权重平均的相对值可登记在个人相对值数据库110中。例如,如果第一次改变后的相对值是0%至23%(搜索满意度是50),第二次改变后的相对值是5%至23%(搜索满意度是70),并且第三次改变后的相对值是5%至30%(搜索满意度是80),则权重的平均值是(0*50+5*70+5*80)/200-(23*50+23*70+30*80)/200。该值被登记在个人相对值数据库110中,从而防止相对值被极大地改变。
此外,搜索满意度可由用户手动地输入,或可基于例如屏幕保留时间自动地计算。作为用户手动输入搜索满意度的方法,考虑了将搜索满意度作为数值输入的方法,以及使得指示用户对单个搜索结果是否满意的复选框被选中并且根据选中结果计算搜索满意度的方法。此外,作为屏幕保留时间,例如考虑详细的搜索内容已被参考的时间,或者诸如电影或音乐等内容已被使用的数据。通过使用这样的方法可以得到搜索满意度。
上面已经描述了根据本实施例的搜索装置100的功能配置。
[2-2:信息搜索方法(搜索装置100的操作)]
下面,将参考图12和图13描述根据本实施例的信息搜索方法。图12和图13是示出了为实现根据本实施例的信息搜索方法而执行的处理的流程的流程图。
首先,参考图12。如图12所示,首先,由用户通过语音输入搜索条件(S101)。如果搜索条件由用户通过语音输入,则搜索装置100利用语音识别单元101的功能将所输入的语音转换为文本(S102)。搜索装置100然后利用自然语言分析单元102的功能分析被转换为文本的搜索条件(例如,自然语句查询)(S103)。搜索装置100然后利用查询生成单元104的功能、组合由步骤S103中的分析得到的自然语句的元素以产生暂定查询(S104)。在这种情况下,查询生成单元104组合除了将被转换为数值范围的主观表达以外的自然语句的元素(例如,对象元素),以产生暂定查询。
接下来,搜索装置100利用内容搜索单元106的功能,基于暂定查询执行搜索,并且基于暂定查询获取搜索结果。搜索装置100然后利用数值化单元108的功能、确认与将被转换为数值范围的主观表达对应的记录是否已登记在个人相对值数据库110中(S105)。如果该记录已经登记在个人相对值数据库110中,则在搜索装置100中的处理前进到步骤S106中。另一方面,如果该记录还没有登记在个人相对值数据库110中,则在搜索装置100中的处理前进到步骤S107。
如果处理前进到步骤S106,则搜索装置100从个人相对值数据库110获取对应于主观表达的相对值(S106)。另一方面,如果处理前进到步骤S107,则搜索装置100从标准相对值数据库109获取对应于主观表达的相对值(S107)。已经获取了相对值的搜索装置100利用数值化单元108的功能、从基于暂定查询的搜索结果获取数值特征的分布,并且基于该分布确定对应于相对值的数值范围(例如,通过应用基于相对值相对于分布的一个或多个比例阈值)。搜索装置100利用查询生成单元104的功能、产生将所确定的数值范围添加到搜索条件的最终查询(S108),并且处理前进到步骤A。
下面,参考图13。如图13所示,其中处理已经前进到步骤A的搜索装置100利用内容搜索单元106的功能基于在步骤S108中产生的最终查询执行搜索(S109)。搜索装置100然后利用搜索信息输出单元111的功能输出基于最终查询的搜索结果(S110)。此外,搜索装置100利用搜索信息输出单元111的功能、显示最终查询所包含的搜索条件以及用于修改搜索条件的界面,并且接收诸如用户操作等的用户输入(S111)。搜索装置100然后判断搜索条件是否已被用户修改(S112)。
如果搜索条件已经被修改,则在搜索装置100中的处理前进到步骤S113。另一方面,如果搜索条件还没有被修改,则搜索装置100结束一系列处理。如果处理前进到步骤S113,则搜索装置100利用相对值反向计算单元113的功能、从修改后的数值范围计算相对值(S113)。在这种情况下,相对值反向计算单元113利用从基于暂定查询的搜索结果获取的分布计算相对值。
接下来,搜索装置100使用相对值反向计算单元113的功能、利用在步骤S113中计算的相对值来更新个人相对值数据库110(S114)。然而,如果在个人相对值数据库110中没有对应的记录,则相对值反向计算单元113将与所计算的相对值对应的主观表达的记录添加到个人相对值数据库110中。
在搜索装置100结束步骤S114的处理以后,处理前进到步骤B。即,搜索装置100中的处理返回到图12所示的步骤S108,并且再次从步骤S108执行处理。搜索装置100反复地执行步骤S108到S114,直到由用户进行的搜索条件修改完成为止,并且在搜索条件修改结束以后结束一系列处理。此外,如果在作为搜索条件输入的自然语句中含有多个主观元素,则对每个主观表达执行步骤S104以后的处理。
上面已经描述了根据本实施例的信息搜索方法。
<3:第一变形例>
下面,将描述本实施例的第一变形例。本变形例涉及在搜索结果上反映用户的精细条件的方法。
<3-1:搜索装置130的功能配置>
首先,将参考图14描述本变形例的搜索装置130的功能配置。图14是图示了根据本变形例的搜索装置130的功能配置的说明图。与搜索装置100的那些具有基本相同的功能的组件被分配了相同的附图标记并且将省略其详细描述。
如图14所示,搜索装置130包括语音识别单元101、自然语言分析单元102、语言分析词典数据库103、查询生成单元104和查询生成词典数据库105。此外,搜索装置130包括内容搜索单元106、内容元数据数据库107、数值化单元131、标准相对值数据库109和个人相对值数据库110。此外,搜索装置130包括搜索信息输出单元111、搜索条件修改单元112、相对值反向计算单元113和语义概念词典数据库132。
与搜索装置100的区别是数值化单元131的功能以及语义概念词典数据库132的出现。将仅详细描述数值化单元131和语义概念词典数据库132的配置。
如上所述,本变形例的目的是在搜索结果上反映用户的精细条件。例如,假设某个用户认为“对于寿司味道重要而对于酒馆低价格重要”。假设用户已经输入了自然语句“给我看在银座便宜并且美味的寿司餐厅”作为搜索条件,并且已经得到了通常的搜索结果。此外,如果基于搜索结果修改了搜索条件,则可认为与主观表达“便宜”和“美味”对应的相对值是基于“寿司餐厅”的条件被修改的。然后,如果自然语句“给我看在银座便宜并且美味的酒馆”被输入并且执行了搜索,则搜索是基于反映了针对“寿司餐厅”的条件的相对值来执行的。
因此,如果存在用户的精细条件,则可能不能得到适合于用户的主观表达的分析的搜索结果。当然,如果修改搜索条件,则可以获得适当的搜索结果,但是一个一个地修改搜索条件是很复杂的。在本变形例中,提出了通过群集(cluster)主观表达的对象(自然语句的元素)而在搜索结果上反映这样的用户条件的方法。用于实现该方法的组件是数值化单元131和语义概念词典数据库132。
数值化单元131利用具有如图15所示的结构(数据结构的概念图)的语义概念词典数据库132来群集对象,并且根据对象识别概念的区别(主观表达的分析)。首先,数值化单元131利用从属性分析来从自然语句中识别对象。例如,对于自然语句“给我看在银座便宜并且美味的寿司餐厅”,数值化单元131识别出“寿司餐厅”是对象。接下来,数值化单元131在个人相对值数据库110中存储对象、主观表达和相对值的组合。在该示例中,具有寿司餐厅、便宜和0至35%的组合的记录被存储在个人相对值数据库110中。
然后,如果自然语句“给我看在涩谷便宜并且美味的酒馆”被用户作为搜索条件输入,假设基于该搜索条件执行搜索。在这种情况下,数值化单元131通过参考存储在个人相对值数据库110中的具有寿司餐厅、便宜和0至35%的组合的记录、利用与主观表达“便宜”对应的相对值0至35%、将主观表达转换为相对值。然后,如果相对值被用户极大地修改(例如,相对值被修改为0至20%),则数值化单元131在个人相对值数据库110中存储具有酒馆、便宜和0至20%的记录。
相反,如果相对值没有被用户极大地修改(例如,相对值被修改为0至32%),则利用语义概念词典数据库132的树状结构、使用以寿司餐厅和酒馆两者为子节点的父节点的词来更新关于存储在个人相对值数据库110中的“寿司餐厅”的记录。例如,数值化单元131利用与“寿司餐厅”和“酒馆”的父节点对应的词“餐馆”、用具有餐馆、便宜和0至33.5%的组合的记录来更新原来的记录。数值33.5%是35%和32%的平均值。
此外,如果对于一个主观表达存在如上所述的多个记录(例如“酒馆、便宜和0至20%”和“寿司餐厅、便宜和0至35%”),假设以另一个搜索条件(例如,自然语句“给我看在六本木便宜的酒吧”)。在这种情况下,数值化单元131使用记录“酒馆、便宜和0至20%”。这是因为,基于语义概念词典数据库132判断“酒馆”和“酒吧”比“寿司餐厅”和“酒吧”更接近。该判断是基于到作为主题的两个词共同的节点(父节点)的距离来作出的。在该示例的情况下,如果“酒馆”和“酒吧”被对象“饮酒的店”结合在一起,则它们可被判断为比“寿司餐厅”和“酒吧”更接近。
因此,数值化单元131利用语义概念词典数据库132来群集对主观表达的分析有影响的对象,或者管理对象或群集单元的相对值。该配置能够实现不依赖于对象的自适应搜索和依赖于对象的具体搜索,从而实现反映用户条件的搜索。
上面已经描述了根据本实施例的第一变形例的搜索装置130的功能配置。
[3-2:信息搜索方法(搜索装置130的操作)]
下面,将参考图16和图17描述根据本实施例的第一变形例的信息搜索方法。图16和图17是示出了为实现根据本实施例的第一变形例的信息搜索方法而执行的处理的流程的流程图。
首先,参考图16。首先,如图16所示,由用户通过语音输入搜索条件(S131)。如果搜索条件由用户通过语音输入,则搜索装置130利用语音识别单元101的功能将所输入的语音转换为文本(S132)。搜索装置130然后利用自然语言分析单元102的功能分析被转换为文本的搜索条件(自然语句)(S133)。搜索装置130然后利用查询生成单元104的功能、组合由步骤S133中的分析得到的自然语句的元素以产生暂定查询(S134)。在这种情况下,查询生成单元104组合除了将被转换为数值范围的主观表达以外的自然语句的元素,以产生暂定查询。
接下来,搜索装置130利用内容搜索单元106的功能,基于暂定查询执行搜索,并且基于暂定查询获取搜索结果。搜索装置130然后利用数值化单元131的功能、确认与将被转换为数值范围的主观表达对应的记录是否已登记在个人相对值数据库110中(S135)。如果该记录已经登记在个人相对值数据库110中,则在搜索装置130中的处理前进到步骤S136中。另一方面,如果该记录还没有登记在个人相对值数据库110中,则在搜索装置130中的处理前进到步骤S137。
如果处理前进到步骤S136,则搜索装置130从个人相对值数据库110获取对应于主观表达的相对值(S136)利用数值化单元131的功能、通过参考语义概念词典数据库132、从个人相对值数据库110获取含有与包含在搜索条件中的对象最接近的词的记录中所记录的相对值。另一方面,如果处理前进到步骤S137,则搜索装置130从标准相对值数据库109获取对应于主观表达的相对值(S137)。已经获取了相对值的搜索装置130利用数值化单元131的功能、从基于暂定查询的搜索结果获取数值范围的分布,并且基于该分布确定对应于相对值的数值范围。搜索装置130利用查询生成单元104的功能、产生将所确定的数值范围添加到搜索条件的最终查询(S138),并且处理前进到步骤A。
下面,参考图17。如图17所示,其中处理已经前进到步骤A的搜索装置130利用内容搜索单元106的功能基于在步骤S138中产生的最终查询执行搜索(S139)。接下来,搜索装置130基于最终查询、利用搜索信息输出单元111的功能输出搜索结果(S140)。此外,搜索装置130利用搜索信息输出单元111的功能、显示最终查询所包含的搜索条件以及用于修改搜索条件的界面,并且接收用户操作(S141)。接下来,搜索装置130判断搜索条件是否已被用户修改(S142)。
如果搜索条件已经被修改,则在搜索装置130中的处理前进到步骤S143。另一方面,如果搜索条件还没有被修改,则搜索装置130结束一系列处理。如果处理前进到步骤S143,则搜索装置130利用相对值反向计算单元113的功能、从修改后的数值范围计算相对值(S143)。在这种情况下,相对值反向计算单元113利用从基于暂定查询的搜索结果获取的分布计算相对值。接下来,搜索装置130利用数值化单元131的功能判断相对值的修改宽度是否小于给定值(S144)。如果相对值的修改宽度小于给定值,则搜索装置130中的处理前进到S145。另一方面,如果相对值的修改宽度大于给定值,则搜索装置130中的处理前进到S146。
如果处理前进到步骤S145,则搜索装置130利用数值化单元131的功能、通过参考语义概念词典数据库132产生结合有对象的记录(S145)。另一方面,如果处理前进到步骤S146,则搜索装置130利用数值化单元131的功能产生分开地登记对象的记录(S146)。处理已经前进到步骤S147的搜索装置130使用数值化单元131的功能、利用在步骤S145或步骤S146中产生的记录来更新个人相对值数据库110。
已经结束了步骤S147的处理的搜索装置130中的处理,前进到步骤B。即,在搜索装置130中的处理返回到图16所示的步骤S138,并且再次从步骤S138执行处理。搜索装置130反复地执行步骤S138到S147,直到由用户进行的搜索条件修改完成为止,并且在搜索条件修改结束以后结束一系列处理。此外,如果在作为搜索条件输入的自然语句中含有多个主观表达,则对每个主观表达执行从步骤S134开始的处理。
上面已经描述了根据本实施例的第一变形例的信息搜索方法。
<4:第二变形例>
下面,将描述本实施例的第二变形例。本变形例涉及如果搜索结果的数量太大或太小,则基于搜索条件的权重自动地调整针对主观表达的搜索条件的方法。
[4-1:搜索装置150的功能配置]
首先,将参考图18描述本变形例的搜索装置150的功能配置。图18是图示了根据本变形例的搜索装置150的功能配置的说明图。与搜索装置100的那些具有基本相同的功能的组件被分配了相同的附图标记并且将省略其详细描述。
如图18所示,搜索装置150包括语音识别单元101、自然语言分析单元102、语言分析词典数据库103、查询生成单元104和查询生成词典数据库105。此外,搜索装置150还包括内容搜索单元106、内容元数据数据库107、数值化单元151、标准相对值数据库109和个人相对值数据库110。搜索装置150还包括搜索信息输出单元111、搜索条件修改单元112和相对值反向计算单元113。
与搜索装置100的区别在于数值化单元151。将仅详细描述数值化单元151的配置。
如上所述,本变形例的目的是当搜索结果的数目太大或太小时、考虑由用户所保持的概念的权重(分配给各个主观表达的权重;见图7)来确定要改变的搜索条件和改变量。例如,如果自然语句“在银座小于等于2000日圆的美味的寿司餐厅”被作为搜索条件输入,则由于包含小于等于2000日圆的严格限制,因此可能不能得到足够数目的搜索结果。
同时,如果自然语句“在涩谷的酒馆”被作为搜索条件输入,则由于存在较小数目的元素来减小搜索结果的数目,因此,很有可能得到用户不能全部选择的很大数目的搜索结果。因此,如果搜索结果的数目太大或太小,则重新审查搜索条件。本变形例提供了自动地执行这样的搜索条件的重新审查的机制。
如图7所示,主观表达的权重被存储在个人相对值数据库110中。数值化单元151通过参考个人相对值数据库110,将与具有较小权重的主观表达对应的相对值调整得较大,或者使与这些主观表达对应的搜索条件无效。
例如,考虑严格地考虑地点并且粗略地考虑预算的用户。此外,假设用户将“地点”的权重设置为160并且将“预算”的权重设置为75。如果不能充分地得到对于某个自然语句的输入的搜索结果,则用户可以改变“地点”的数值范围或“预算”的数值范围。
如上所述,用户严格地考虑地点。因此,用户可能不会极大地改变地点的数值范围。另一方面,由于用户粗略地考虑预算,因此,可允许对预算的数值范围的较大的变化。为此,数值化单元151例如基于下面的算法来更新相对值。
//前提条件
“便宜”的权重:0.75
“便宜”的相对值Y:较低的30个百分点;
当前点击数目a:5
适当的点击数目范围b:10到50(给定值)
//用于参数调整的变量Z的计算(适用于所有搜索条件)
Z=f(a,b)=f(5,[10:50])
=-100*(10-5)/10
=-50
Z’=F(X,Z)=F(0.75,-50)
=-50/0.75
=-67
//修改后的“便宜”的相对值Y的计算(对于“预算”)
因数=(100-Z’)/100
=1.67
Y’=30*1.67
=较低的50.1个百分点
已经描述了根据本实施例的第二变形例的搜索装置150的功能配置。
[4-2:信息搜索方法(搜索装置150的操作)]
下面,将参考图19和图20描述根据本实施例的第二变形例的信息搜索方法。图19和图20是示出了在根据本实施例的第二变形例的信息搜索方法的处理的流程的流程图。
首先,参考图19。如图19所示,首先,输入用于识别用户的标识符(用户ID)(S151)。下面,由用户通过语音输入搜索条件(S152)。如果搜索条件由用户通过语音输入,则搜索装置150利用语音识别单元101的功能将所输入的语音转换为文本(S153)。搜索装置150然后利用自然语言分析单元102的功能分析被转换为文本的搜索条件(自然语句)(S154)。搜索装置150然后利用查询生成单元104的功能、组合由步骤S154的分析得到的自然语句的元素以产生暂定查询(S155)。在这种情况下,查询生成单元104组合除了将被转换为数值范围的主观表达以外的自然语句的元素,以产生暂定查询。
接下来,搜索装置150利用内容搜索单元106的功能,基于暂定查询执行搜索,并且基于暂定查询获取搜索结果。搜索装置150然后利用数值化单元151的功能、确认标识符是否已经在个人相对值数据库110中注册(S156)。如果标识符已经被注册,则在搜索装置150中的处理前进到步骤S157中。另一方面,如果标识符还没有被注册,则在搜索装置150中的处理前进到步骤S159。
如果处理前进到步骤S157,则搜索装置150利用数值化单元151的功能、确认与将被转换为数值范围的主观表达对应的记录是否已经登记在个人相对值数据库110中(S157)。如果该记录已经登记在个人相对值数据库110中,则搜索装置150中的处理前进到步骤S158。另一方面,如果该记录还没有登记在个人相对值数据库110中,则搜索装置150中的处理前进到步骤S159。
如果处理前进到步骤S158,则搜索装置150利用数值化单元151的功能从个人相对值数据库110获取相对值(S158)。同时,如果处理前进到步骤S159,则搜索装置150利用数值化单元151的功能从标准相对值数据库109获取与主观表达对应的相对值(S159)。已经获取了相对值的搜索装置150利用数值化单元151的功能、从基于暂定查询的搜索结果获取数值范围的分布,并且基于该分布确定对应于相对值的数值范围。搜索装置150利用查询生成单元104的功能、产生将所确定的数值范围添加到搜索条件的最终查询(S160),并且处理前进到步骤A。
下面,参考图20。如图20所示,其中处理已经前进到步骤A的搜索装置150利用内容搜索单元106的功能、基于在步骤S160中产生的最终查询执行搜索(S161)。搜索装置150然后利用数值化单元151的功能判断搜索结果的数目是否适合(S162)。如果搜索结果的数目适合,则搜索装置150中的处理前进到步骤S163。另一方面,如果搜索结果的数目不适合,则搜索装置150中的处理前进到步骤S164。
如果处理前进到步骤S163,则搜索装置150利用数值化单元151的功能给搜索结果评分(步骤S163),并且处理前进到步骤S165。同时,如果处理前进到步骤S164,则搜索装置150利用数值化单元151的功能、基于权重来调整相对值并且更新个人相对值数据库110(S164)。已经结束了步骤S164的处理的搜索装置150中的处理前进到步骤B。即,搜索装置150中的处理返回到图19所示的步骤S160,并且搜索装置150再次从步骤S160执行处理。
其中处理已经前进到步骤S165的搜索装置150,利用搜索信息输出单元111的功能输出基于基于最终查询的搜索结果(S165)。此外,搜索装置150利用搜索信息输出单元111的功能、显示最终查询所包含的搜索条件以及用于修改搜索条件的界面,并且接收用户操作(S166)。搜索装置150然后判断搜索条件是否已被用户修改(S167)。
如果搜索条件已经被修改,则在搜索装置150中的处理前进到步骤S168。另一方面,如果搜索条件还没有被修改,则搜索装置150结束一系列处理。如果处理前进到步骤S168,则搜索装置150利用相对值反向计算单元113的功能、从修改后的数值范围计算相对值(S168)。在这种情况下,相对值反向计算单元113利用从基于暂定查询的搜索结果获取的分布计算相对值。搜索装置150然后使用相对值反向计算单元113的功能、利用在步骤S168中计算的相对值来更新个人相对值数据库110(S169)。
已经结束了在步骤S169中的处理的搜索装置150的处理,前进到步骤B。即,搜索装置150中的处理返回到图19所示的步骤S160,并且再次从步骤S160执行处理。搜索装置150反复地执行步骤S160到S169,直到由用户进行的搜索条件修改完成为止,并且在搜索条件修改结束以后结束一系列处理。此外,如果在作为搜索条件输入的自然语句中含有多个主观元素,则对每个主观表达执行步骤S155以后的处理。
上面已经描述了根据本实施例的第二变形例的信息搜索方法。
<5:第三变形例>
在某些情况下,在由用户输入的搜索结果中的主观表达可能是不明确的,并且搜索装置可执行处理以消除预期的搜索条件的歧义。例如,用户的主观表达“便宜”可以意味着“不贵”或者“低质量”。在某些实施例中,搜索装置可以使用词库或者词或关联的其他数据库来确定用户的主观表达是不明确的。在这种情况下,搜索装置可以提示用户消除搜索条件的歧义。例如,在某些情况下搜索装置可以呈现给用户多个选项(例如,“不贵”和“低质量”),并且允许用户来选择最好地对应主观表达的预期含义的一个。
<6:硬件配置>
上述搜索装置100、130和150的各个结构元件的功能可通过使用例如图21所示的信息处理装置的硬件配置来执行。即,各个结构元件的功能可通过利用计算机程序来控制图21所示的硬件来实现。此外,该硬件的模式是任意的,并且可以是个人计算机、诸如移动电话、PHS或PDA、等的移动信息终端、游戏机或者其他类型的信息。此外,PHS是个人手持电话的所写。此外,PDA是个人数字助理的缩写。
如图21所示,该硬件主要包括诸如CPU 902等的至少一个处理器、ROM 904、RAM 906、主机总线908和桥接器910。此外,该硬件包括外部总线912、接口914、输入单元916、输出单元918、存储单元920、驱动器922、连接端口924和通信单元926。而且,CPU是中央处理器的缩写。此外,ROM是只读存储器的缩写。此外,RAM是随机存储器的缩写。
CPU 902例如用作运算处理单元或控制单元,并且基于记录在ROM904、RAM 906、存储单元920或可移除记录介质928中的各种程序来控制各个结构元件的全部操作或一部分操作。ROM 904是用于存储例如被下载到CPU 902上的程序或在运算操作中使用的数据等的装置。RAM906临时或永久地存储例如下载到CPU 902上的程序或者在程序的执行中任意改变的各种参数。
这些结构元件通过例如能够执行高速数据传输的主机总线908相互连接。就其本身而言,例如,主机总线908通过桥接器910连接到数据传输速度相对较慢的外部总线912。此外,输入单元916例如是鼠标、键盘、触摸屏、按钮、开关或控制杆。此外,输入单元916可以是利用红外线或其他无线电波来传输控制信号的远程控制器。
输出单元918例如是能够可视地或听觉上通知用户所获取的信息的、诸如CRT、LCD、PDP或ELD等的显示设备、诸如扬声器或耳机等声音输出设备、打印机、移动电话或传真机。而且,CRT是阴极射线管的缩写。LCD是液晶显示器的缩写。PDP是等离子显示板的缩写。此外,ELD是电子发光显示器的缩写。
存储单元920是用于存储各种数据的设备。存储单元920例如是诸如硬盘驱动器(HDD)等的磁存储设备、半导体存储设备、光学存储设备或磁光存储设备。HDD是硬盘驱动器的缩写。
驱动器922是读取记录在诸如磁盘、光盘、磁光盘或半导体记忆体等的可移除记录介质928上的信息,或者将信息写入可移除记录介质928的设备。可移除记录介质928例如是DVD介质、蓝光介质、HD-DVD介质、各种类型的半导体存储介质等。当然,可移除记录介质928可以是例如其上安装了非接触IC的电子设备或IC卡。IC是集成电路的缩写。
连接端口924是诸如USB端口、IEEE1394端口、SCSI、RS-232C端口或诸如光纤音频端子等的用于连接外部连接设备930的端口之类的端口。外部连接设备930例如是打印机、移动音乐播放器、数码相机、数码摄像机或IC录音机。而且,USB是通用串行总线的缩写。此外,SCSI是小型计算机系统接口的缩写。
通信单元926是连接到网络932的通信设备,并且例如是用于有线或无线LAN的通信卡、蓝牙(注册商标)、或WUSB、光通信路由器、ADSL路由器,或用于不同类型的通信的调制解调器。连接到通信单元926的网络932由有线连接或无线连接的网络构成,并且例如是互联网、家用LAN、红外通信、可见光通信、广播或卫星通信。而且,LAN是局域网的缩写。此外,WUSB是无线USB的缩写。此外,ADSL是非对称数字用户线路的缩写。
某些实施例可包括编码有一个或多个程序的计算机可读存储介质(或多个计算机可读介质)(例如,计算机存储器、一个或多个软盘、光碟(CD)、光盘、数字视频光盘(DVD)、磁带、闪存、在现场可编程门阵列电路或其他半导体器件中的电路配置,或其他有形的计算机存储介质),其中当所述一个或多个程序在一个或多个计算机或其他处理器上执行时,执行实现上面所讨论的各种实施例的方法。从前面的示例中可以清楚,计算机可读存储介质可以保留信息足够的时间来以非暂时性的形式提供计算机可读指令。这样的计算机可读介质或媒介是可传输的,使得存储在其上的一个或多个程序能够被下载到一个或多个不同的计算机或其他处理器、以实现如上所讨论的本发明的各个方面。如这里所使用的,术语“计算机可读存储介质”仅包括能够被认为是产品(即,制品)或机器的计算机可读介质。替换地或额外地,本发明可实施为诸如传播信号等的除了计算机可读存储介质之以外的计算机可读介质。
<7:总结>
最后,将简要地总结根据本公开的实施例的技术内容。这里所述的技术内容可应用于例如诸如PC、便携电话、便携式游戏设备、个人数字助理、信息设备和汽车导航系统等的若跟信息处理装置。
信息处理装置的功能配置可表示如下。信息处理装置包括下面的暂定搜索单元、分布获取单元、数值范围选择单元和当前搜索单元。如果输入了含有将被转换为数值范围的主观表达的自然语句,则暂定搜索单元使用构成自然语句的元素当中的除主观表达以外的元素作为搜索条件、来执行搜索。例如,如果输入了自然语句“给我看在银座便宜并且美味的寿司餐厅”,将被转换为数值范围的主观表达是指示价格范围的元素“便宜”。
仅基于主观表达很难唯一地确定用户试图通过这样的主观表达来表达的数字范围。即,很难判断由主观表达“便宜”所指示的价格范围是0至3000日圆还是0至6000日圆。暂定查询利用自然语句的除该主观表达以外的元素暂定地搜索信息。利用该暂定搜索,可收集指示被用户认为是先决条件的条件的信息。例如,可收集关于“在银座的寿司餐厅”的信息。利用该信息,例如,可预测用户的市场展望。
分布获取单元基于相对于暂定搜索单元的搜索结果、获取对应于主观表达的数值范围。基于上述示例,该分布获取单元从关于“在银座的寿司餐厅”收集的信息、获取价格范围的分布。如果能够获取价格范围的分布,则可识别“在银座的寿司餐厅”当中的“贵的寿司餐厅”和“便宜的寿司餐厅”。例如,与从低价格顺次X%对应的“寿司餐厅”可被判断为“便宜的寿司餐厅”。然而,X是由用户预先确定的值。此外,如果可识别出“便宜的寿司餐厅”,则可逆向地得到“不贵的寿司餐厅”的价格范围。
数值范围选择单元基于预先与主观表达相关联的相对值、从由分布获取单元获取的数值的分布中选择数值范围。该相对值是与X对应的数值。如上所述,由于数值的分布可从由暂定搜索得到的信息获得,因此由利用数值的分布和相对值来选择由主观表达所指示的数值范围。例如,该数值范围选择单元可选择在“在银座的寿司餐厅”当中的对应于从低价格范围向上X%的“寿司餐厅”所对顶的价格范围(例如,0至5000日圆)。这里所选择的价格范围是反映“在银座的寿司餐厅”的市场价格的一个,并且满足用户所认为的“便宜”(X%)标准。
本搜索单元利用构成自然语句的元素当中的除主观表达以外的元素、以及由数值范围选择单元所选择的数值范围作为搜索条件来执行搜索。由于如上所述主观表达被自动地转换为数值范围,因此可正确地得到适合于数值范围的搜索结果。
此外,由于当选择数值范围时使用了相对值,例如,因此,适合于“在银座的寿司餐厅”的市场价格的价格范围被用作搜索条件并且得到用户所期望的适当的搜索结果。如果搜索条件修改为“在涩谷的便宜的寿司餐厅”,则适合于“在涩谷的便宜的寿司餐厅”的市场价格的价格范围被用作搜索条件。因此,如果使用信息处理装置,则可自动地产生已经反映了被用户假设为先决条件的情况的搜索条件,并且基于该搜索条件得到适当的搜索结果。
此外,在主观表达“便宜”与数值范围“0至6000日圆”相关联并且以数值范围代替包含在自然语句中的主观表达来执行搜索的一般的信息搜索系统的情况下,偶然地得到对于“在银座便宜的寿司餐厅”的适当的搜索结果,但是不能得到对于“在涩谷便宜的寿司餐厅”的适当的搜索结果。信息处理装置能够适当地解决这样的问题。此外,信息处理装置能够自适应地应付作为主观表达的对象的任何元素之间的区别,以及地点差别。例如,已经反映了“在银座的寿司餐厅”的市场价格的价格范围是用于输入“在银座便宜的寿司餐厅”的搜索条件,而已经反映了“在银座的牛排馆”的市场价格的价格范围是用于输入“在银座便宜的牛排馆”的搜索条件。
因此,如果应用根据本实施例的技术,则在由自然语句的除主观表达以外的元素确定的情形中、能够以适当的数值范围代替主观表达。结果,可以适当地反映随着在搜索条件中的情况变化的用户的主观性,并且可以提供用户期望的搜索结果。
此外,由于诸如“银座”和“寿司餐厅”等的作为主观表达的对象的各个元素的组合以及各个主观表达不需要单独地与数值范围相关联,并且主观表达与相对值相关联,因此信息处理装置所持有的信息量较小。此外,由于作为搜索目标的信息量较小,因此提高了搜索效率。这样的效果不是通过应用暂定搜索单元、分布获取单元、数值范围选择单元和目前搜索单元的功能得到的。
(备注)
查询生成单元104和内容搜索单元106是暂定搜索单元和当前搜索单元的示例。数值化单元108、131和151是分布获取单元和数值范围选择单元的示例。搜索信息输出单元111是输出单元的示例。个人相对值数据库110是相对值保持单元和元素特有的相对值保持单元的示例。语音识别单元101是语音/文本转换单元的示例。查询生成单元104是主观表达抽取单元的示例。数值化单元131是群集单元的示例。数值化单元151是权重设置单元和相对值调整单元的示例。
本领域的技术人员应该明白,只要在所附权利要求或其等同物的范围内,根据设计需求和其他因素可发生各种修改、组合、子组合和变形例。
例如,本技术可采用如下配置。
(1)一种搜索装置包括:
暂定搜索单元,其用于如果含有主观表达的自然语句被输入,则利用构成自然语句的元素当中除了将被转换为数值范围的主观表达以外的元素来执行搜索;
分布获取单元,其用于相对于暂定搜索单元的搜索结果、获取与主观表达对应的数值的分布;
数值范围选择单元,其用于基于预先与主观表达相关联的相对值、从由分布获取单元获取的数值的分布中选择数值范围;
当前搜索单元,其用于利用构成自然语句的元素当中除了主观表达以外的元素以及由数值范围选择单元选择的数值范围作为搜索条件来执行搜索。
(2)根据(1)所述的搜索装置,还包括:
输出单元,其用于至少输出由数值范围选择单元选择的数值范围;以及
输入单元,其用于改变包含在由当前搜索单元进行的搜索的条件中的数值范围。
(3)根据(2)所述的搜索装置,还包括:
相对值反向计算单元,其用于如果数值范围通过输入单元被改变,则基于由分布获取单元获取的数值的分布计算与改变后的数值范围对应的相对值;以及
相对值保持单元,其用于保持将被与主观表达相关联的、由相对值反向计算单元计算的相对值。
(4)根据(3)所述的搜索装置,其中数值范围选择单元确认与主观表达对应的相对值是否已经被相对值保持单元保持,并且如果与主观表达对应的相对值已经被保持,则基于相对值保持单元所保持的相对值来选择数值范围。
(5)根据(1)至(4)中的任一项所述的搜索装置,还包括:
语音输入单元,其用于通过语音输入自然语句;以及
语音/文本转换单元,其用于将输入到语音输入单元的语音转换为文本。
(6)根据(1)至(5)中的任一项所述的搜索装置,还包括:
自然语言分析单元,其用于通过自然语音分析来抽取构成自然语句的各个元素;以及
主观表达抽取单元,其用于将由自然语言分析单元抽取的各个元素与给定的主观表达相比较,并且抽取在自然语句中所包含的主观表达,
其中暂定搜索单元和当前搜索单元利用由自然语言分析单元抽取的元素和由主观表达抽取单元抽取的主观表达来设置搜索的条件。
(7)根据(2)至(6)中的任一项所述的搜索装置,还包括:
元素特定相对值保持单元,用于如果数字范围通过输入单元被改变,则从构成自然语句的元素当中抽取作为主观表达的对象的元素,并且保持将被与相对值反向计算单元所计算的相对值相关联的所抽取的元素;以及
群集单元,其用于群集相对于由元素特定相对值保持单元保持的元素具有相似的概念的元素,并且将各个群集与相对值相关联,
其中数值范围选择单元从构成自然语句的元素中抽取作为主观表达的对象的元素,并且基于与所抽取的元素具有相似概念的群集所对应的相对值来选择数值范围。
(8)根据(1)至(7)中的任一项所述的搜索装置,还包括:
权重设置单元,其用于根据数值范围的改变频率来设置与数值范围对应的主观表达的权重;以及
相对值调整单元,其用于如果由当前搜索单元得到的搜索结果的数目小于第一给定数目或大于第二给定数目,则基于由权重设置单元设置的权重、来调整包含在由当前搜索单元进行的搜索的条件中的数值范围所对应的相对值。
(9)一种在搜索装置中的搜索方法,该方法包括以下步骤:
如果输入了含有主观表达的自然语句,则利用构成自然语句的元素当中除了将被转换为数值范围的主观表达以外的元素来执行搜索;
相对于暂定搜索单元的搜索结果、获取与主观表达对应的数值的分布;
基于预先与主观表达相关联的相对值、从在分布获取步骤中获取的数值的分布中选择数值范围;以及
利用构成自然语句的元素当中除了主观表达以外的元素以及在数值范围选择步骤中选择的数值范围作为搜索条件来执行搜索。
(10)一种用于使计算机实现以下功能的程序:
暂定搜索功能,该功能在含有主观表达的自然语句被输入的情况下,利用构成自然语句的元素当中除了将被转换为数值范围的主观表达以外的元素来执行搜索;
分布获取功能,该功能相对于通过暂定搜索功能的搜索的结果、获取与主观表达对应的数值的分布;
数值范围选择功能,该功能基于预先与主观表达相关联的相对值、从通过分布获取功能获取的数值的分布中选择数值范围;
当前搜索功能,该功能利用构成自然语句的元素当中除了主观表达以外的元素以及由数值范围选择功能选择的数值范围作为搜索条件来执行搜索。
在权利要求中、为修改要求保护的元件的诸如“第一”、“第二”、“第三”等序词的使用,本身并不意味着任何优先权、优先级、或一个要求保护的元件相对于另一个的顺序或者执行方法的动作的时间顺序。这些术语仅用作将具有某个名称的一个要求保护的元件与具有相同名称(但除了序词的使用以外)的另一个元件区分开,以区别要求保护的元件。
此外,这里使用的用语和术语是为了说明的目的并且不应该视为限制。这里的“包括”、“包含”或“具有”、“含有”、“涉及”及其变形例等使用意在包括其后所列的项目及其等同物以及其他的项目。
本公开包含涉及在于2011年1月11日在日本专利局提交的日本优先专利申请JP 2011-003005中公开的主题,该申请的全部内容通过引用结合于此。
Claims (20)
1.一种装置,包括:
至少一个处理器;以及
至少一个存储器,其存储处理器可执行指令,所述处理器可执行指令被配置为使得所述至少一个处理器执行以下处理:
接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询;
基于所述一个或多个对象元素执行对内容的第一搜索;
确定从所述第一搜索返回的结果的数值特征的分布,所述数值特征对应于所述一个或多个主观元素中的第一主观元素;
确定对于所述第一主观元素的一个或多个比例阈值;
通过对所述分布应用所述一个或多个比例阈值来选择数值特征的范围;以及
基于所选择的数值特征的范围来执行对内容的第二搜索。
2.根据权利要求1所述的装置,其中,确定所述一个或多个比例阈值包括访问将所述一个或多个比例阈值与所述第一主观元素关联起来的数据库。
3.根据权利要求1所述的装置,其中,确定所述一个或多个比例阈值包括接收对于所述第一主观元素指定所述一个或多个比例阈值的用户输入。
4.根据权利要求3所述的装置,其中,所述处理器可执行指令还被配置为使得所述至少一个处理器将由所述用户指定的所述一个或多个比例阈值存储在与所述用户相关联的比例阈值的数据库中。
5.根据权利要求1所述的装置,其中,所述处理器可执行指令还被配置为使得所述至少一个处理器执行以下处理:
接收用于修改所选择的数值特征的范围的用户输入;以及
基于修改后的数值特征的范围来执行对内容的第三搜索。
6.根据权利要求1所述的装置,其中,所述搜索查询包括由用户提供的自然语言查询,并且其中,所述第一主观元素包括所述自然语言查询中的一个或多个词。
7.一种方法,包括:
接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询;
基于所述一个或多个对象元素执行对内容的第一搜索;
利用至少一个处理器来确定从所述第一搜索返回的结果的数值特征的分布,所述数值特征对应于所述一个或多个主观元素中的第一主观元素;
确定对于所述第一主观元素的一个或多个比例阈值;
通过对所述分布应用所述一个或多个比例阈值来选择数值特征的范围;以及
基于所选择的数值特征的范围来执行对内容的第二搜索。
8.根据权利要求7所述的方法,其中,确定所述一个或多个比例阈值包括访问将所述一个或多个比例阈值与所述第一主观元素相关联的数据库。
9.根据权利要求7所述的方法,其中,确定所述一个或多个比例阈值包括接收对于所述第一主观元素指定所述一个或多个比例阈值的用户输入。
10.根据权利要求9所述的方法,还包括将由所述用户指定的所述一个或多个比例阈值存储在与所述用户相关联的比例阈值的数据库中。
11.根据权利要求7所述的方法,还包括:
接收用于修改所选择的数值特征的范围的用户输入;以及
基于修改后的数值特征的范围来执行对内容的第三搜索。
12.根据权利要求7所述的方法,其中,所述搜索查询包括由用户提供的自然语言查询,并且其中,所述第一主观元素包括所述自然语言查询中的一个或多个词。
13.编码有计算机可执行指令的至少一个计算机可读存储介质,所述计算机可执行指令被执行时,实现包括以下步骤的方法:
接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询;
基于所述一个或多个对象元素执行对内容的第一搜索;
确定从所述第一搜索返回的结果的数值特征的分布,所述数值特征对应于所述一个或多个主观元素中的第一主观元素;
确定对于所述第一主观元素的一个或多个比例阈值;
通过对所述分布应用所述一个或多个比例阈值来选择数值特征的范围;以及
基于所选择的数值特征的范围来执行对内容的第二搜索。
14.根据权利要求13所述的至少一个计算机可读存储介质,其中,确定所述一个或多个比例阈值包括访问将所述一个或多个比例阈值与所述第一主观元素相关联的数据库。
15.根据权利要求13所述的至少一个计算机可读存储介质,其中,确定所述一个或多个比例阈值包括接收对于所述第一主观元素指定所述一个或多个比例阈值的用户输入。
16.根据权利要求15所述的至少一个计算机可读存储介质,其中,所述方法还包括将由所述用户指定的所述一个或多个比例阈值存储在与所述用户相关联的比例阈值的数据库中。
17.根据权利要求13所述的至少一个计算机可读存储介质,其中,所述方法还包括:
接收用于修改所选择的数值特征的范围的用户输入;以及
基于修改后的数值特征的范围来执行对内容的第三搜索。
18.根据权利要求13所述的至少一个计算机可读存储介质,其中,所述搜索查询包括由用户提供的自然语言查询,并且其中,所述第一主观元素包括所述自然语言查询中的一个或多个词。
19.一种装置,包括:
用于接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询的装置;
用于基于所述一个或多个对象元素执行对内容的第一搜索的装置;
用于确定从所述第一搜索返回的结果的数值特征的分布的装置,所述数值特征对应于所述一个或多个主观元素中的第一主观元素;
用于确定对于所述第一主观元素的一个或多个比例阈值的装置;
用于通过对所述分布应用所述一个或多个比例阈值来所述数值特征的范围的装置;以及
用于基于所选择的所述数值特征的范围来执行对内容的第二搜索的装置。
20.一种装置,包括:
至少一个处理器;以及
至少一个存储器,其存储处理器可执行指令,所述处理器可执行指令被配置为使得所述至少一个处理器执行以下处理:
接收包括至少一个或多个主观元素和一个或多个对象元素的搜索查询;
显示从基于所述一个或多个对象元素的对内容的第一搜索返回的结果的数值特征的范围,所述数值特征对应于所述一个或多个主观元素中的第一主观元素;
接收用于修改数值特征的范围的用户输入;以及
显示基于修改后的数值特征的范围的、对内容的第二搜索的结果。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011003005A JP5630275B2 (ja) | 2011-01-11 | 2011-01-11 | 検索装置、検索方法、及びプログラム |
JP2011-003005 | 2011-01-11 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102622399A true CN102622399A (zh) | 2012-08-01 |
Family
ID=45557853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012100045785A Pending CN102622399A (zh) | 2011-01-11 | 2012-01-04 | 搜索装置、搜索方法和程序 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8595210B2 (zh) |
EP (1) | EP2479687A3 (zh) |
JP (1) | JP5630275B2 (zh) |
CN (1) | CN102622399A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103000173A (zh) * | 2012-12-11 | 2013-03-27 | 优视科技有限公司 | 一种语音交互方法及装置 |
CN103207917A (zh) * | 2013-04-25 | 2013-07-17 | 百度在线网络技术(北京)有限公司 | 标注多媒体内容的方法、生成推荐内容的方法及系统 |
CN106294367A (zh) * | 2015-05-15 | 2017-01-04 | 常州明石晶电科技有限公司 | 搜索装置及其搜索方法 |
CN106372191A (zh) * | 2016-08-31 | 2017-02-01 | 广东华邦云计算股份有限公司 | 一种数据搜索方法和装置 |
CN106537385A (zh) * | 2014-07-16 | 2017-03-22 | 微软技术许可有限责任公司 | 基于观察的查询解释模型修改 |
CN108701430A (zh) * | 2016-03-28 | 2018-10-23 | Abb瑞士股份有限公司 | 确定用于焊缝点校准的搜索参数的方法、系统和装置 |
CN110232137A (zh) * | 2019-05-10 | 2019-09-13 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN110347910A (zh) * | 2019-05-28 | 2019-10-18 | 成都美美臣科技有限公司 | 一个电子商务网站搜索结果过滤规则 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101361190B1 (ko) | 2007-01-22 | 2014-02-21 | 삼성전자주식회사 | 무선 메쉬 네트워크에서 채널을 할당하기 위한 방법 및이를 이용한 통신 디바이스 |
US10453103B2 (en) | 2013-03-15 | 2019-10-22 | Home Depot Product Authority, Llc | Price estimation system |
US10157175B2 (en) | 2013-03-15 | 2018-12-18 | International Business Machines Corporation | Business intelligence data models with concept identification using language-specific clues |
US10698924B2 (en) | 2014-05-22 | 2020-06-30 | International Business Machines Corporation | Generating partitioned hierarchical groups based on data sets for business intelligence data models |
US9129041B1 (en) | 2014-07-31 | 2015-09-08 | Splunk Inc. | Technique for updating a context that facilitates evaluating qualitative search terms |
US9087090B1 (en) | 2014-07-31 | 2015-07-21 | Splunk Inc. | Facilitating execution of conceptual queries containing qualitative search terms |
US10002179B2 (en) | 2015-01-30 | 2018-06-19 | International Business Machines Corporation | Detection and creation of appropriate row concept during automated model generation |
US9984116B2 (en) | 2015-08-28 | 2018-05-29 | International Business Machines Corporation | Automated management of natural language queries in enterprise business intelligence analytics |
US10296659B2 (en) * | 2016-09-26 | 2019-05-21 | International Business Machines Corporation | Search query intent |
JP6649232B2 (ja) * | 2016-11-18 | 2020-02-19 | 株式会社東芝 | 検索装置、表示装置および検索方法 |
GB201708771D0 (en) * | 2017-06-01 | 2017-07-19 | Upshoot Ltd | Improved search engine |
WO2019160133A1 (ja) * | 2018-02-19 | 2019-08-22 | 日本電信電話株式会社 | 情報管理装置、情報管理方法及び情報管理プログラム |
US11416481B2 (en) * | 2018-05-02 | 2022-08-16 | Sap Se | Search query generation using branching process for database queries |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1410913A (zh) * | 2001-10-04 | 2003-04-16 | 索尼公司 | 信息处理系统,输出、处理装置和方法,记录介质及程序 |
CN1445697A (zh) * | 2002-03-15 | 2003-10-01 | 雅马哈株式会社 | 参考相关应用的信息搜索系统 |
CN1823334A (zh) * | 2003-05-14 | 2006-08-23 | 塞利布罗斯有限公司 | 搜索引擎方法及装置 |
US7216116B1 (en) * | 1996-05-06 | 2007-05-08 | Spotfire Ab | Data analysis system with automated query and visualization environment setup |
CN101331475A (zh) * | 2005-12-14 | 2008-12-24 | 微软公司 | 在线商业意图的自动检测 |
CN101438279A (zh) * | 2004-10-28 | 2009-05-20 | 雅虎公司 | 包括信任网络的集成有用户判断的搜索系统和方法 |
US20090282021A1 (en) * | 2008-05-12 | 2009-11-12 | Bennett James D | Web browser accessible search engine which adapts based on user interaction |
CN101859313A (zh) * | 2009-04-08 | 2010-10-13 | 索尼公司 | 信息处理设备和方法及其程序 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0573317A (ja) * | 1991-09-13 | 1993-03-26 | Nippon Telegr & Teleph Corp <Ntt> | 相対的表現の量の度合い判断処理方法 |
JPH05101107A (ja) * | 1991-10-07 | 1993-04-23 | Hitachi Ltd | 適合率を用いた絞り込みデータ検索装置及び方法 |
JPH10254891A (ja) * | 1997-03-11 | 1998-09-25 | Sharp Corp | 情報検索装置 |
US6578022B1 (en) * | 2000-04-18 | 2003-06-10 | Icplanet Corporation | Interactive intelligent searching with executable suggestions |
JP3949356B2 (ja) | 2000-07-12 | 2007-07-25 | 三菱電機株式会社 | 音声対話システム |
US7194483B1 (en) * | 2001-05-07 | 2007-03-20 | Intelligenxia, Inc. | Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information |
US7536413B1 (en) * | 2001-05-07 | 2009-05-19 | Ixreveal, Inc. | Concept-based categorization of unstructured objects |
US7133864B2 (en) * | 2001-08-23 | 2006-11-07 | Syngenta Participations Ag | System and method for accessing biological data |
JP2003281170A (ja) * | 2002-03-20 | 2003-10-03 | Fujitsu Ltd | 情報検索方法、情報検索プログラムおよびその装置 |
US7246113B2 (en) * | 2002-10-02 | 2007-07-17 | General Electric Company | Systems and methods for selecting a material that best matches a desired set of properties |
EP1695191A4 (en) * | 2003-11-13 | 2007-08-29 | Knowledgeworks | SYSTEM FOR OBTAINING, MANAGING AND PROVIDING EXTRACT CONTENT |
US8812473B1 (en) * | 2005-06-16 | 2014-08-19 | Gere Dev. Applications, LLC | Analysis and reporting of collected search activity data over multiple search engines |
US7844599B2 (en) * | 2005-08-24 | 2010-11-30 | Yahoo! Inc. | Biasing queries to determine suggested queries |
US20070106664A1 (en) * | 2005-11-04 | 2007-05-10 | Minfo, Inc. | Input/query methods and apparatuses |
JP2011003005A (ja) | 2009-06-18 | 2011-01-06 | Canon Inc | 印刷システム、印刷システムの制御方法、及びプログラム |
-
2011
- 2011-01-11 JP JP2011003005A patent/JP5630275B2/ja not_active Expired - Fee Related
-
2012
- 2012-01-04 US US13/343,210 patent/US8595210B2/en not_active Expired - Fee Related
- 2012-01-04 EP EP12150146.4A patent/EP2479687A3/en not_active Withdrawn
- 2012-01-04 CN CN2012100045785A patent/CN102622399A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7216116B1 (en) * | 1996-05-06 | 2007-05-08 | Spotfire Ab | Data analysis system with automated query and visualization environment setup |
CN1410913A (zh) * | 2001-10-04 | 2003-04-16 | 索尼公司 | 信息处理系统,输出、处理装置和方法,记录介质及程序 |
CN1445697A (zh) * | 2002-03-15 | 2003-10-01 | 雅马哈株式会社 | 参考相关应用的信息搜索系统 |
CN1823334A (zh) * | 2003-05-14 | 2006-08-23 | 塞利布罗斯有限公司 | 搜索引擎方法及装置 |
CN101438279A (zh) * | 2004-10-28 | 2009-05-20 | 雅虎公司 | 包括信任网络的集成有用户判断的搜索系统和方法 |
CN101331475A (zh) * | 2005-12-14 | 2008-12-24 | 微软公司 | 在线商业意图的自动检测 |
US20090282021A1 (en) * | 2008-05-12 | 2009-11-12 | Bennett James D | Web browser accessible search engine which adapts based on user interaction |
CN101859313A (zh) * | 2009-04-08 | 2010-10-13 | 索尼公司 | 信息处理设备和方法及其程序 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103000173B (zh) * | 2012-12-11 | 2015-06-17 | 优视科技有限公司 | 一种语音交互方法及装置 |
CN103000173A (zh) * | 2012-12-11 | 2013-03-27 | 优视科技有限公司 | 一种语音交互方法及装置 |
CN103207917A (zh) * | 2013-04-25 | 2013-07-17 | 百度在线网络技术(北京)有限公司 | 标注多媒体内容的方法、生成推荐内容的方法及系统 |
CN106537385B (zh) * | 2014-07-16 | 2019-07-26 | 微软技术许可有限责任公司 | 基于观察的查询解释模型修改 |
US10817554B2 (en) | 2014-07-16 | 2020-10-27 | Microsoft Technology Licensing, Llc | Observation-based query interpretation model modification |
CN106537385A (zh) * | 2014-07-16 | 2017-03-22 | 微软技术许可有限责任公司 | 基于观察的查询解释模型修改 |
CN106294367A (zh) * | 2015-05-15 | 2017-01-04 | 常州明石晶电科技有限公司 | 搜索装置及其搜索方法 |
CN108701430A (zh) * | 2016-03-28 | 2018-10-23 | Abb瑞士股份有限公司 | 确定用于焊缝点校准的搜索参数的方法、系统和装置 |
CN108701430B (zh) * | 2016-03-28 | 2020-12-01 | Abb瑞士股份有限公司 | 确定用于焊缝点校准的搜索参数的方法、系统和装置 |
US11417238B2 (en) | 2016-03-28 | 2022-08-16 | Abb Schweiz Ag | Method, system and apparatus of determining search parameters for welding seam point calibration |
CN106372191A (zh) * | 2016-08-31 | 2017-02-01 | 广东华邦云计算股份有限公司 | 一种数据搜索方法和装置 |
CN110232137A (zh) * | 2019-05-10 | 2019-09-13 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN110232137B (zh) * | 2019-05-10 | 2021-09-03 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN110347910A (zh) * | 2019-05-28 | 2019-10-18 | 成都美美臣科技有限公司 | 一个电子商务网站搜索结果过滤规则 |
Also Published As
Publication number | Publication date |
---|---|
US8595210B2 (en) | 2013-11-26 |
EP2479687A3 (en) | 2015-03-04 |
JP2012146062A (ja) | 2012-08-02 |
EP2479687A2 (en) | 2012-07-25 |
JP5630275B2 (ja) | 2014-11-26 |
US20120179710A1 (en) | 2012-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102622399A (zh) | 搜索装置、搜索方法和程序 | |
CN101923563B (zh) | 信息处理设备、信息处理方法 | |
CN101416179B (zh) | 用来向每个用户提供调整推荐字的系统和方法 | |
US9997157B2 (en) | Knowledge source personalization to improve language models | |
CN102193936B (zh) | 一种数据分类的方法及装置 | |
CN103518187B (zh) | 用于信息建模的方法和系统及其应用 | |
WO2016161976A1 (zh) | 选择数据内容向终端推送的方法和装置 | |
CN102859548B (zh) | 根据多个源进行产品合成 | |
CN102346761A (zh) | 信息处理装置、关连语句提供方法和程序 | |
CN101674458A (zh) | 用于内容推荐的设备、方法和计算机程序以及记录介质 | |
CN107729578B (zh) | 一种音乐推荐方法及装置 | |
CN103116588A (zh) | 一种个性化推荐方法及系统 | |
CN111737418B (zh) | 搜索词和商品的相关性预测方法、设备和存储介质 | |
CN103377443A (zh) | 网络交易平台及其处理方法 | |
CN107870984A (zh) | 识别搜索词的意图的方法和装置 | |
CN106168980A (zh) | 多媒体资源推荐排序方法及装置 | |
KR20190128246A (ko) | 검색 방법 및 장치 및 비-일시적 컴퓨터-판독가능 저장 매체 | |
CN106462632A (zh) | 具有内容规范层的媒体商店 | |
CN109543040A (zh) | 相似账户识别方法及装置 | |
CN106484698A (zh) | 一种搜索关键词的推送方法和装置 | |
CN105681910A (zh) | 一种基于多用户的视频推荐方法及装置 | |
KR20140015653A (ko) | 컨텐츠 추천 시스템 및 방법 | |
CN104854588A (zh) | 用于搜索标记的主要为非文本的项目的系统和方法 | |
CN112529646A (zh) | 一种商品分类方法和装置 | |
CN103294670A (zh) | 一种基于词表的搜索方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120801 |
|
WD01 | Invention patent application deemed withdrawn after publication |