CN101432685A - 数据库搜索查询的扩展 - Google Patents
数据库搜索查询的扩展 Download PDFInfo
- Publication number
- CN101432685A CN101432685A CNA2007800155142A CN200780015514A CN101432685A CN 101432685 A CN101432685 A CN 101432685A CN A2007800155142 A CNA2007800155142 A CN A2007800155142A CN 200780015514 A CN200780015514 A CN 200780015514A CN 101432685 A CN101432685 A CN 101432685A
- Authority
- CN
- China
- Prior art keywords
- word
- expansion
- synonym
- search
- candidate word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
在某些实施例中,一种方法包括接收可用在针对数据库中的数据的搜索查询中的单词。数据库包括由数据串表示的数据项。该方法还包括确定单词的同义候选词。该方法包括响应于确定具有该同义候选词的数据串的数目超过阈值,将该同义候选词作为单词的同义词添加到扩展词典中。
Description
相关申请
本申请要求2006年2月28日递交的题为“Expansion of DatabaseSearch Queries”的美国申请第11/363,679号的优先权,该申请通过引用被结合于此。
技术领域
本申请一般地涉及数据库。更具体地,本申请涉及数据库搜索查询的扩展。
背景技术
搜索引擎是基于可能是由用户输入的数据搜索查询(search query)来识别数据源中的数据项的工具。搜索引擎在搜索查询中使用不同的单词(token)(例如字或短语)来识别用户感兴趣的数据项。有时,分别地,因为数据搜索查询过于广泛或狭窄,所以搜索引擎返回包括过多或不够多的数据项的搜索结果。
附图说明
通过参考以下描述以及示出这样的实施例的附图,可以最佳地理解本发明的实施例。在此包含的附图编号机制是这样的,示图中给定标号的第一个数字与示图编号相关联。例如,系统100可以被定位在图1中。然而,不同附图中那些相同元件的标号是相同的。在附图中:
图1示出根据本发明某些实施例的用于数据库搜索扩展的系统。
图2示出根据本发明某些实施例的包括作为搜索查询的一部分的搜索查询扩展的搜索查询的流程图。
图3示出根据本发明某些实施例的单个和复合语意单元的分词(tokenization)。
图4示出根据本发明某些实施例的用于存储数据库中的数据的树状分级结构(tree hierarchy)。
图5示出根据本发明某些实施例的文脉(contextual)查询扩展的流程图。
图6示出根据本发明某些实施例的确定单词和数据库中的类别之一之间的同义性关联的流程图。
图7示出根据本发明某些实施例的独立于搜索查询操作的搜索查询扩展的流程图。
图8示出根据本发明某些实施例的使用之前经过扩展的单词的搜索查询的流程图。
图9示出根据本发明某些实施例的计算机装置的部件。
具体实施方式
将描述用于数据库搜索查询扩展的方法、装置和系统。在以下描述中,给出了大量具体细节。然而,应理解,可以实践本发明的实施例而无需这些具体细节。在其他情况下,为了使对本描述的理解清楚,没有详细示出公知的电路、结构和技术。
对实施例的该描述分为四个部分。第一部分描述示例系统环境。第二部分描述搜索查询扩展的操作。第三部分描述示例计算机装置。第四部分提供某些通用的注解。
示例系统环境
图1示出根据本发明某些实施例的用于数据库搜索扩展的系统。图1示出具有客户端—服务器体系结构的系统100。以信息存储和取回平台102作为示例形式的平台,经由网络108(例如,因特网)向一个或多个客户端提供服务器一侧的功能。图1例如分别示出在客户端机器106和104上运行的web客户端112(例如,web浏览器)和程序化(programmatic)客户端110。
现具体地转至信息存储和取回平台102,应用程序接口(API)服务器114和web服务器116耦合到一个或多个应用服务器118,并且分别向其提供程序化接口和web接口。应用服务器118可以承载查询控制模块124和扩展模块120。应用服务器118被示出为接着耦合到一个或多个搜索后端服务器126。搜索后端服务器126承载搜索引擎128并且辅助对数据存储器130(其可以存储一个或多个数据库)的访问。
查询控制模块124用作客户端机器104和106以及其他搜索模块(例如,扩展模块120)之间的集线器。出于此目的,查询控制模块124分别经由API服务器114和web服务器116与客户端机器104和106进行通信,并且与其他搜索模块直接进行通信。
虽然在图1中示出的系统100采用客户端—服务器体系结构,但是实施例并不局限于这样的体系结构,并且可能在分布式或者对等体系结构的系统中很好地找到应用。扩展模块120、查询控制模块124和搜索引擎128可以代表硬件、软件或其组合。在某些实施例中,扩展模块120、查询控制模块124和搜索引擎128可以被实现为不一定具有联网能力的独立程序。
web客户端112访问由搜索模块经由web服务器116所支持的web接口而提供的各种服务和功能。类似地,程序化客户端110访问由搜索模块经由API服务器114所提供的程序化接口而提供的各种服务和功能。
搜索查询扩展的操作
该部分描述根据本发明某些实施例的搜索查询扩展的操作。在某些实施例中,通过驻存在机器可读介质上的指令(例如,软件)来执行所述操作,而在其他实施例中,通过硬件或其他逻辑(例如,数字逻辑)来执行各种方法。
在某些实施例中,搜索查询扩展可以作为搜索查询的一部分或者在搜索查询期间被执行。例如,在搜索查询被接收之后并且在数据库中执行搜索查询之前,执行查询扩展。图2和图5示出根据本发明某些实施例的以这样的顺序执行的操作的流程图。可替代地,搜索查询扩展可以独立于搜索查询被执行。换言之,搜索查询扩展被脱机执行(相对于搜索查询)。在某些实施例中,可以基于在前的搜索查询执行扩展。图7到图8示出根据本发明某些实施例的其中搜索查询扩展独立于搜索查询的操作的流程图。
图2示出根据本发明某些实施例的包括作为搜索查询的一部分的搜索查询扩展的搜索查询的流程图。图2示出可以由扩展模块120和搜索引擎128(在图1中示出)执行的操作。流程图200在块202处开始。
在块202处,接收到针对数据库中的数据的、具有单词的搜索查询。参考图1,查询控制模块124可以接收搜索查询。例如,用户可以利用web客户端112来输入搜索查询。Web客户端112可以将查询转发到web服务器116,web服务器116将查询转发到查询控制模块124。搜索查询可能具有一个或多个单词。因此,在某些实施例中,在此关于单词而描述的操作可以针对搜索查询中的一个、多个或所有单词而执行。单词可以包括查询中的不同的字或短语。
搜索查询可以包括句子、短语、单个字等。在某些实施例中,对搜索查询进行分词(tokenize)。分词是指将文字串切分为语意上独立的单词的工作。在某些实施例中,单词根据其语意值被定义并且可能或者是单个语意单元(single-semantic-unit)或者是复合语意单元(compound-semantic-unit)。类似于字的语言学概念的单个语意单元,被定义为象征并传达不可分为更小的、能够独立使用的单元的含义的字符序列。此外,类似于短语的语言学概念的复合语意单元被定义为单个语意单元的序列,因此,最终的单词承载独立的并且与个体语意单元不同的语意值。
在西方欧洲语言的情况下,单个语意单元边界通常由空格或标点符号来标记。然而,这并不是诸如汉语、日文和泰国语之类的亚洲语言的情况,在亚洲语言的情况下,并不存在诸如空格之类的语意单元分隔符,并且标点符号很少被使用。图3示出根据本发明某些实施例的单个和复合语意单元的分词。具体地,图3示出搜索查询302。查询控制模块124将搜索查询302分为多个单片段单元304。例如,查询控制模块124可以用空格替换所有的标点符号。查询控制模块124还可以在可适用的情况下将文字规范化为小写字母。查询控制模块124还可以将所有的空格序列合并到一个单个空格中。查询控制模块124还可以生成多个复合语意单元306。
在某些实施例中,查询控制模块124可以利用基于词典的方法来生成复合语意单元。基于词典的方法可以是从左开始向右进行匹配以匹配最长可能字串的前向最大匹配,或者是从右向左针对最长可能字串进行匹配的后向最大匹配。在某些实施例中,生成覆盖在给定数据库中所使用的单词的最大词汇量的词典。在某些实施例中,使用这样的复合语意单元提取操作,其使用用户查询流来产生一组最可能的复合语意单元。
在某些实施例中,查询控制模块124可以利用统计方法来生成复合语意单元。统计方法基于统计模型,统计模型基于语意单元出现在另一个的附近的频率而建立,所述方法公知为n-grams统计,其中n为2到N。在存在两个语意单元彼此邻近的较低概率的点处可以确定单词切分,因此产生最大语意单元。模型的准确性和复杂度随着字串大小的增大而增大。此外,复合语意单元的最大持续长度可以基于语言被定义。该方法可以扩展到处理亚洲语言。例如,现代汉语使用的复合语意单元通常由2到3个汉字构成。在某些实施例中,可以将方法的不同组合用于生成复合语意单元。现返回到流程图200,流程在块204处继续。
在块204处,确定单词的一个或多个同义候选词(synonymcandidate)。参考图1,扩展模块120可以作出该确定。查询控制模块124可以将特定单词转发到扩展模块120用于处理。流程图200中的后续操作可以针对这些单词的一个或多个来执行。在某些实施例中,如果通过两个单词的每个单词而返回的搜索结果集合指代物品集合中相同的对象、概念或性质,那么这两个单词是同义词。
在某些实施例中,两个单词是基于语法规则的同义词。在某些实施例中,语法规则呈正则表达式形式,以判断两个单词是否是同义词。语法规则可能是基于语言的。例如,对于德语,用“ue”替换“ü”。为了说明这一点,“für”是“fuer”的同义候选词。德语语言的其他示例包括用“ss”替换“β”,用“oe”替换“”,用“ae”替换“”,等等。
在某些实施例中,同义候选词包括单词的复数形式。例如,销售者在在线拍卖时可能一次仅列出一个物品。为了说明这一点,销售者可能在标题中使用单词“bike”。另一方面,针对在线拍卖而搜索数据库的购买者可能作为替代搜索“bikes”。在某些实施例中,同义候选词包括不同的时态。例如,对于单词“buy”,同义候选词包括buying和bought。在某些实施例中,同义候选词包括性别。例如,单词waiter的同义候选词可以是waitress。在某些实施例中,同义候选词包括单词的不同形式,所述形式依赖于该词在句子中的成分。例如,德语中单词soldier的主格(主语)形式是soldat。宾格(直接宾语)形式是soldaten。
在某些实施例中,同义候选词涉及单词的去复合(de-compound)。例如,在诸如德语、荷兰语或瑞典语之类的语言中,单词可以被结合在一起以形成复合词。为了说明这一点,在德语中,Blue Wale被写作“Blauwal”。为了在搜索Wal时产生Blauwal作为搜索结果的一部分,单词被去复合为Blue和Wale。为了说明这一点,在英语中,spiderman可以被去复合为spider man。在某些实施例中,同义候选词涉及字符变换。在欧洲语言中,重音标记和变音符(diacritical)被用于表示语调或者完全不同的字符。这样的单词的示例包括西班牙语中的“cámara”和法语中的“fiance'e”。某些用户可能不使用重音标记和变音符,因为这样的标记需要多次键击以在美式国际英语键盘上进行输入。因此,当搜索查询中的单词不包括标记时,同义候选词可以包括具有重音标记的单词,反之亦然。在某些实施例中,文脉查询扩展被用于确定同义候选词。在以下对图5和图6的描述中,给出对文脉查询扩展的更详细的描述。现返回流程图200,流程在块206处继续。
在块206处,判断是否存在未经处理的同义候选词。参考图1,扩展模块120可以作出该判断。例如,扩展模块120可能接收到单词的一个到多个不同的同义候选词。如果不存在未经处理的同义候选词,那么流程在块220处继续,这将在下文中更详细地描述。否则,流程在块208处继续。
在块208处,判断同义候选词是否超出在表示数据库中的数据的多个数据串和/或多个搜索查询中的最小频率阈值。参考图1,扩展模块120可以作出该判断。数据串可以是物品标题。例如,如果数据库用于存储被买卖的物品,那么数据串可以是由销售者针对给定物品而输入的标题。因此,扩展模块120可以判断在数据库中的至少阈值个物品标题中,同义候选词是否被找到。此外,搜索查询历史可以被存储在机器可读介质(例如数据存储器130)中。扩展模块120可以判断在至少阈值个这些搜索查询中,同义候选词是否被找到。扩展模块120可以检查针对表示数据的数据串和搜索查询二者的阈值。可替代地,扩展模块120可以检查针对表示数据的数据串或者针对搜索查询的阈值。在某些实施例中,阈值是15、20、25、30、100等。利用该阈值可以消除并非真的在物品标题或查询中使用的扩展。因此,更可能的是,同义候选词是实际用于搜索的。如果同义候选词超出最小阈值频率,那么流程在块218处继续,这将在下文中更详细地描述。否则,流程在块210中继续。
在块210处,判断单词和同义候选词是否处于数据库中树状分级结构的某一级的相同类别中。参考图1,扩展模块120可以作出该判断。为了说明这一点,图4是根据本发明某些实施例的用于存储数据库中数据的树状分级结构。图4示出用于在线拍卖(online auction)的数据库的树状分级结构400。树状分级结构包括根。根的孩子节点包括图书和玩具/爱好(这是第一级)。图书的孩子节点包括儿童文学和小说(这是第二级)。玩具/爱好的孩子节点包括活动人偶和字谜(这是第二级)。儿童文学的孩子节点包括睡前读物和传记(这是第三级—树状分级结构的叶子类别)。小说的孩子节点包括名著和恐怖小说(这是第三级—树状分级结构的叶子类别)。活动人偶的孩子节点包括蝙蝠侠和美国步兵Joe(这是第三级—树状分级结构的叶子类别)。字谜的孩子节点包括现代字谜和老式字谜(这是第三级—树状分级结构的叶子类别)。数据项被存储在叶子类别之一中。
在某些实施例中,扩展模块120基于第一级作出该判断。扩展模块120可以根据单词的最大物品频率来确定第一级类别。扩展模块120也可以根据同义候选词的最大物品频率来确定第一级类别。例如,如果单词是“spiderman(蜘蛛人)”,那么扩展模块120判断哪些第一级类别具有通过单词“spiderman”而存储于其下级中(在其叶子类别之一中)的最多的物品。类似地,如果同义候选词是“spider man”,那么扩展模块120判断哪些第一级类别具有通过单词“spider man”而存储于其下级中(在其叶子类别之一中)的最多的物品。扩展模块120然后判断针对单词和同义候选词的这些第一级类别是否相同。因此,如果单词和同义候选词具有相同的第一级类别(如所描述的),那么同义候选词可以被认为是单词的同义词。如果单词和同义候选词是树状分级结构中某一级的相同类别的一部分,那么流程在块218处继续,这将在下文中更详细地描述。否则,流程在块212处继续。
在块212处,确定单词在树状分级结构中的叶子类别上的概率分布。参考图1,扩展模块120可以作出该确定。该操作可以识别单词对之间的同义性,这说明单词在整个数据库上的使用。具体地,考虑单词在叶子类别的整个集合上的使用分布。在某些实施例中,如果两个单词被用在相同的情况下或者相同的情况集合中,那么这两个单词是语意上等价的。因此,在某些实施例中,该操作识别其中单词作为该特定单词的不同意义出现的、树状分级结构的类别结构中的每个叶子类别。因此,在某些实施例中,扩展模块120可以基于概率分布来作出该判断。令LC={11,12,...,1n}作为叶子类别的集合。令单词(w)的概率(Pw,li)用于叶子类别li(i=1,2,...,n)中,其中n是叶子类别的个数。(Pw,li)被估计如下:
其中ifw,li是单词w的物品频率,在类别li中,ifw是数据库中单词w的频率,P(w)是单词w的全局概率,并且W是词的完整词表。因此,概率分布表示特定单词在叶子类别集合上的意义集合。该概率估计还包括滤波成分,其将非零概率指定给单词类别组合。具体地,μ被设定为1用于概率估计。流程在块214处继续。
在块214处,确定同义候选词在树状分级结构中的叶子类别上的概率分布。参考图1,扩展模块120可以作出该确定。扩展模块120可以基于以上在块212处所描述的公式来作出该确定。流程在块216处继续。
在块216处,判断单词和同义候选词的概率分布的交叉熵是否低于阈值。参考图1,扩展模块120可以作出该判断。在某些实施例中,给定一对单词w1,w2在叶子类别集合LC上的两个概率分布函数θw1和θw2,那么扩展模块120可以利用KL散度测度(如下式所示)来确定分布之间的交叉熵:
其中i=1,2,...,n。该交叉熵是两个单词之间相似性的量度,并且因此可以是两个单词w1和w2之间同义性的量度。在某些实施例中,阈值是1、5、10、20等等。因此,如果KL散度低于阈值,那么同义候选词被认为是单词的同义词。如果交叉熵不低于阈值,那么流程在块206处继续。否则,流程在块218处继续。
在块218处,将同义候选词添加到搜索查询。参考图1,扩展模块120将同义候选词添加到搜索查询。流程在块206处继续。
在块220处(如果不再存在未经处理的同义候选词),搜索查询被用于执行针对数据库中数据的搜索。参考图1,搜索引擎128执行针对数据存储器130中的数据的搜索。扩展模块120可以将搜索查询转发到搜索引擎128。搜索引擎128可以将搜索查询的结果返回给查询控制模块124,查询控制模块124通过API服务器114或web服务器116将结果分别返回到程序化客户端110或web客户端112。流程图200的操作完成。
在某些实施例中,如果搜索查询被扩展,那么输入搜索查询的用户被允许在执行搜索之前查看经扩展的搜索查询。虽然描述了在块208、210或216处的任一判断都可能导致同义候选词被添加到搜索查询,但是在某些实施例中,在同义候选词被添加到搜索查询之前,需要针对所有这些判断的“是”的结果。可替代地,需要针对少于所有的所述判断的“是”的结果(例如206和208,206和210,等等)。
现更详细地描述可以执行用于确定同义候选词的操作。参考图2,现在描述的操作可以是除步骤204的操作之外的操作或者是步骤204的操作的替代操作。关于基于给定单词的不同复数形式、时态形式等来确定同义候选词,描述了步骤204的操作。现在所描述的操作可以基于类别树中的类别节点来确定单词的同义候选词。具体地,图5示出根据本发明某些实施例的文脉查询扩展的流程图。图5示出可以由扩展模块120(在图1中示出)执行的操作。流程图500在块502处开始。
在块502处,接收到作为搜索查询的一部分的单词。参考图1,扩展模块120可以接收经过处理的单词。例如,扩展模块120可以接收对搜索查询进行了分词(如上所述)后的单词。流程在块504处继续。
在块504,判断在单词和数据库中的类别之一之间是否存在同义性关联(synonymity association)。参考图1,扩展模块120可以作出该判断。为了说明这一点,搜索查询可以是针对与在线拍卖(购买者和销售者)有关的数据库中的数据的。在用户不熟悉在这样的数据库中的搜索的情况下,购买者倾向于根据概念或想法而非感兴趣的具体物体来键入其查询。例如,购买者可能键入诸如dvd,餐馆设备,二手车等之类的搜索查询。在某些情况下,用户可能没有将这些具体的单词包括在其物品标题中。下表1示出使单词与数据库中的类别相关的某些示例:
单词 | 类别扩展 |
Dvd | DVD&电影>DVD |
图书 | 图书 |
汽车 | eBay机车>客车 |
餐馆设备 | 商业&产业>食品服务零售 |
表1
如所示出的,单词“dvd”和类别“DVD”之间存在同义性关联。单词“图书”和类别“图书”之间存在同义性关联。单词“餐馆设备”和类别“食品服务零售”之间存在同义性关联。在以下图6的流程图600中,更详细地描述对单词和类别之一之间是否存在同义性关联的判断。如果不存在同义性关联,那么流程图500的操作完成。否则,流程在块506处继续。
在块506处,作为具有与该单词的同义性关联的类别的一部分的物品标题中的单词作为同义候选词被添加。参考图1,扩展模块120可以执行该操作。这些同义候选词可以如以上在对图2的流程图200的描述中所描述地那样被处理。
现更详细地描述可以被执行用于判断在单词和数据库中的类别之一之间是否存在同义性关联的操作。参考图5,现在所描述的操作可以是在块504处的操作的一部分。具体地,图6示出根据本发明某些实施例的用于判断单词和数据库中的类别之一之间的同义性关联的流程图。图6示出可以由扩展模块120(在图1中示出)执行的操作。流程图600在块602处开始。
在块602处,确定搜索查询中的单词在数据库中的类别上的分布。参考图1,扩展模块120可以确定该分布。在某些实施例中,扩展模块120可以确定之前用于搜索数据库的搜索查询(包括该单词)和基于被返回给用户的结果而选出的物品之间的关系。具体地,用户可以输入可能返回多个结果(该结果可以是在数据库中存储的各个物品)的搜索查询。用户可以选择一个物品。查询控制模块124可以存储在之前的搜索查询中的单词和所选出的各个物品之间的这种关系。扩展模块120可以取回该数据用于正在被处理的特定单词。扩展模块120可以针对该单词确定数据库中叶子类别的矩形统计图。现返回图4以辅助说明,对于叶子类别“睡前读物”,扩展模块120确定在该叶子类别中存储的、曾在用户的搜索查询(具有该单词)之后被用户选出的物品的个数。例如,对于X个搜索查询(包括该单词),用户可能选出了“睡前读物”叶子类别下的第一物品。对于Y个搜索查询(具有该单词),用户可能选择了“睡前读物”叶子类别下的第二物品。因此,“睡前读物”叶子类别针对该单词将具有X+Y的值。扩展模块120可以针对数据库中每个叶子类别进行确定。
扩展模块120可以沿树状分级结构向上推进这些值。例如,如果“睡前读物”叶子类别具有值50并且“传记”叶子类别具有值100,那么“儿童文学”类别具有值150。扩展模块120可以将这些值向上推进到树状分级结构的第一级。现返回流程图600,流程在块604处继续。
在块604处,判断是否有类别(不包括根)在树状分级结构上具有大于X%的单词总分布。参考图1,扩展模块120可以作出该判断。值X可以基于标准(例如存储于其中的数据类型,数据库大小,等等)个数而改变。在某些实施例中,值X可以是70、80、90、95等等。扩展模块120可以选择树状分级结构中具有大于X%的单词总分布的最低类别。该类别可能处于任一级中。如果没有类别具有大于X%的单词总分布,那么流程图600的操作完成。否则,流程在块606处继续。换言之,如果没有类别具有大于X%的单词总分布,那么没有同义候选词基于单词和类别之间的关系(如上所述)被添加。
在块606处,确定清楚性评分(clarity score)、类别覆盖比和/或益处评分(benefit score)(针对从块604中选出的类别)。参考图1,扩展模块120可以确定这些评分/比率。在某些实施例中,扩展模块120可以确定这些评分/比率的一个、多个或全部。清楚性评分等于类别中包含该单词的物品数除以整个数据库中包含该单词的物品总数。类别覆盖比等于在所选出的类别中的搜索结果个数除以该类别中的物品总数。益处评分等于作为可能的同义候选词被添加的物品(作为所选出的类别的一部分的那些物品)个数除以数据库中搜索查询的个数。流程在块608处继续。
在块608处,判断清楚性评分、类别覆盖比和/或益处评分是否超出阈值级别。在某些实施例中,扩展模块120可以作出该判断。针对清楚性评分、类别覆盖比和益处评分的阈值级别可以基于标准(例如存储于其中的数据类型,数据库大小,等等)个数而改变。扩展模块120可以针对清楚性评分、类别覆盖比和益处评分的一个、多个或者全部来确定阈值等级。因此,在某些实施例中,清楚性评分、类别覆盖比和/或益处评分需要超过其关联的阈值等级。可替代地,评分/比例的一个或某些个需要超过其关联的阈值等级。如果清楚性评分、类别覆盖比和/或益处评分未超过关联的阈值水平,那么流程图600的操作完成。否则,流程在块610处继续。
在块610处,所选出的类别被标记为与单词具有同义性关联。参考图1,扩展模块120可以标记所选出的类别。
现描述根据本发明某些实施例的、其中搜索查询扩展独立于搜索查询的操作的流程图。具体地,图7示出用于扩展的操作,而图8示出利用扩展的操作。
图7示出根据本发明某些实施例的、独立于搜索查询操作的搜索查询扩展的流程图。图7示出可以由扩展模块120和搜索引擎128(在图1中示出)来执行的操作。流程图700在块702处开始。
在块702处,接收到单词。参考图1,扩展模块120可以接收单词。例如,扩展模块120可以从可能是之前的搜索查询的一部分的单词列表中取回单词。例如,之前的搜索查询的历史可以被存储在数据存储器130中。因此,扩展模块120可以在块702处的该操作之前,对搜索查询执行分词(如以上在图2的块202处所描述的那样)。流程在块704处继续。
在块704处,确定单词的一个或多个同义候选词。参考图1,扩展模块120可以作出该确定。以上在图2的块204处描述了扩展模块120的用于作出该确定的操作。流程在块706处继续。
在块706处,判断是否存在未经处理的同义候选词。参考图1,扩展模块120可以作出该判断。例如,扩展模块120可能接收到单词的一个到多个同义候选词。如果不存在未经处理的同义候选词,那么流程图700的操作完成。否则,流程在块708处继续。
在块708处,判断同义候选词是否超出在表示数据库中数据的多个数据串和/或多个搜索查询中的最小频率阈值。参考图1,扩展模块120可以作出该判断。以上在图2的块208处描述了扩展模块120的用于作出该判断的操作。如果同义候选词超出最小频率阈值,那么流程在块718处继续,这将在下文中更详细地描述。否则,流程在块710处继续。
在块710处,判断单词和同义候选词是否处于数据库中树状分级结构的某一级的相同类别中。参考图1,扩展模块120可以作出该判断。以上在图2的块210处描述了扩展模块120的用于作出该判断的操作。如果单词和同义候选词是树状分级结构中某一级的相同类别的一部分,那么流程在块718处继续,这将在下文中更详细地描述。否则,流程在块712处继续。
在块712处,确定单词在树状分级结构中的叶子类别上的概率分布。参考图1,扩展模块120可以作出该确定。以上在图2的块212处描述了扩展模块120的用于作出该确定的操作。流程在块714处继续。
在块714处,确定同义候选词在树状分级结构中的叶子类别上的概率分布。参考图1,扩展模块120可以作出该确定。扩展模块120可以基于以上在图2的块212处描述的公式来作出该确定。流程在块716处继续。
在块716处,判断单词和同义候选词的概率分布的交叉熵是否低于阈值。参考图1,扩展模块120可以作出该判断。以上在图2的块216处描述了扩展模块120的用于作出该判断的操作。如果交叉熵不低于阈值,那么流程在块706处继续。否则,流程在块718处继续。
在块718处,同义候选词被添加到单词的扩展词典中。参考图1,扩展模块120可以将同义候选词添加到单词的扩展词典中。具体地,扩展模块120可以更新数据存储器130中的数据结构(例如表格)以使同义候选词与单词相关联。该同义候选词随后可以用于扩展具有该单词的搜索查询(如以下将在图8的流程图800中所描述的那样)。流程在块706处继续。流程图700的操作可以针对任何个数个单词被执行,并且可以独立于搜索查询操作被执行。
图8示出根据本发明某些实施例的使用之前经过扩展的单词的搜索查询的流程图。图8示出可以由查询控制模块124和搜索引擎128(在图中示出)来执行的操作。流程图800在块802处开始。
在块802处,针对数据库中数据的、具有单词的搜索查询被接收。参考图1,扩展模块120可以接收搜索查询。例如,用户可以利用web客户端112来输入搜索查询。Web客户端112可以将查询转发到web服务器116,web服务器116将查询转发到查询控制模块124。搜索查询可能具有一个或多个单词。因此,在某些实施例中,在此关于单词而描述的操作可以针对搜索查询中的单词的一个、某些或者全部来执行。流程在块804处继续。
在块804处,定位搜索查询中的单词。参考图1,查询控制模块124可以定位搜索查询中的单词。以上在图2的块202处描述了查询控制模块124的用于定位搜索查询中的单词的操作。流程在块806处继续。
在块806处,判断是否任何单词均可扩展。参考图1,查询控制模块124可以作出该判断。具体地,查询控制模块124可以基于扩展词典来判断单词是否可扩展。查询控制模块124可以查询数据存储器130来判断是否任何单词均包括相关联的同义词。如果是,那么单词可扩展。如果不对单词进行扩展,那么流程在块810处继续(这将在下文中更详细地描述)。否则,流程在块808处继续。
在块808处,搜索查询基于经扩展的单词被更新。参考图1,查询控制模块124可以更新搜索查询。查询控制模块124可以将相关联的同义词添加到搜索查询。在某些实施例中,相关联的同义词作为单词的替代物被添加(利用OR运算)。流程在块810处继续。
在块810处,针对数据库中的数据执行搜索查询。参考图1,搜索引擎128执行对数据存储器130中的数据的搜索。查询控制模块124可以将搜索查询转发到搜索引擎128。搜索引擎128可以将搜索查询的结果返回给查询控制模块124,查询控制模块124通过API服务器114或web服务器116将所述结果分别返回到程序化客户端110和web客户端112。流程图800的操作完成。在某些实施例中,如果搜索查询被扩展,那么输入搜索查询的用户被允许在执行搜索之前查看经扩展的搜索查询。
示例计算机装置
图9示出根据本发明某些实施例的计算机装置的部件。具体地,在图9中示出的计算机装置900可以代表客户端机器104/106、API服务器、web服务器116、(一个或多个)应用服务器118和(一个或多个)搜索后端服务器126(在图1中示出)内的体系结构。计算机装置900包括(一个或多个)处理器902。
计算机装置900还包括易失性存储器930、处理器总线922和输入/输出(I/O)控制器集线器(ICH)924。(一个或多个)处理器902、易失性存储器930和ICH 924耦合到处理器总线922。(一个或多个)处理器902可以包括任何适当的处理器体系结构。计算机装置900可以包括一个、两个、三个或多个处理器,所述处理器的任一个都可以根据本发明的实施例执行一组指令。(一个或多个)处理器902可以是不同类型的处理器。例如,第一处理器可以是通用处理器,而第二处理器可以是用于解码和编码音频数据、视频数据等的数字信号处理器。
存储器930可以代表存储数据和/或指令的易失性和/或非易失性存储器,并且可以包括任何适当的存储器,例如动态随机存取存储器(DRAM)等。非易失性存储器可以是静态随机存取存储器(SRAM)、闪存等。非挥发性存储器也可以是可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)等。
计算机装置900可以包括在图1中示出的模块(例如,(一个或多个)应用服务器118的扩展模块120)。这些模块可以代表硬件、固件或其组合。这些模块可以是驻存于存储器930和/或IDE/ATA驱动器908之一中的软件指令,该软件指令可以由(一个或多个)处理器902来执行。
图形控制器904控制信息在显示设备906上的显示。ICH 924向计算机装置900的I/O设备或外围组件提供接口。ICH 924可以包括任何适当的接口控制器以向(一个或多个)处理器902、非易失性存储器930和/或向与ICH 924进行通信的任何适当的设备或组件提供任何适当的通信链路。在某些实施例中,ICH 924提供适当的仲裁并且针对每一接口进行缓冲。
对于本发明的某些实施例,ICH 924向诸如硬盘驱动器(HDD)或紧致盘只读存储器(CD ROM)驱动器之类的次级存储器908(其可以是任何类型的非易失性数据存储器)提供接口,或者通过一个或多个USB端口向适当的通用串行总线(USB)设备提供接口。次级存储器908可以是只读存储器、读/写存储器等。
对于某些实施例,ICH 924还为不同的用户输入设备(麦克风911、键盘912、按钮914等)提供接口。对于某些实施例,ICH 924还提供网络接口920,通过该网络接口920,计算机装置900可以与其他计算机和/或设备进行通信。ICH 924可以向任何数目个端口910提供接口。端口910可以用于提供不同的输入/输出。例如,一个或多个端口910可以耦合到用于音频输出的扬声器。
综述
在本说明书中,为了提供对本发明更全面的理解,提出了许多具体细节,例如逻辑实现方式、操作码、用于指定操作数的装置、资源划分/共享/复制实现方式、系统组件的类型和相互关系以及逻辑划分/集成选择。然而,本领域中的普通技术人员应理解,本发明的这些实施例可以被实践而无需这样的具体细节。在其他情况下,为了使本发明的实施例清楚,没有详细示出控制结构、门级电路和完整的软件指令序列。通过所包括的描述,本领域中的普通技术人员无需不适当的实验就能够实现适当的功能。
本说明书中提到的“一个实施例”、“实施例”、“示例实施例”等指示所描述的实施例可能包括特定特征、结构或特性,然而可能不一定每个实施例都包括所述特定特征、结构或特性。此外,这样的短语不一定指代相同的实施例。此外,当与实施例结合起来描述特定特征、结构或特性时,无论是否明确地描述,都认为本领域中的普通技术人员将理解可以将这样的特征、结构或特性与其他实施例相结合。
多幅示图示出了根据本发明某些实施例的用于数据库搜索查询扩展的系统和装置的框图。多幅示图示出了根据本发明某些实施例的说明数据库搜索查询扩展的操作的流程图。通过参考在框图中示出的系统/装置而描述了流程图的操作。然而,应理解,可以通过不同于参考框图而讨论的那些系统和装置的、实施例的系统和装置来执行流程图的操作,并且通过参考系统/装置而讨论的实施例可以执行不同于参考流程图而讨论的那些操作的操作。
可以通过硬件、固件、软件或其组合来执行在此描述的某些或全部的操作。例如,可以通过硬件、固件、软件或其组合来执行在此描述的不同控制器的操作。一旦阅读并理解了本公开的内容,本领域中的普通技术人员将理解其中软件程序可以从机器可读介质被载入到基于计算机的系统中以执行在软件程序中所定义的功能的方式。本领域中的普通技术人员还应理解,各种编程语言可以用于创建被设计用以实现并执行在此公开的方法的一个或多个软件程序。可以利用诸如Java或C++之类的面向对象的语言,以面向对象的格式来构造程序。可替代地,可以利用诸如汇编或C之类的过程语言,以面向过程的格式来构造程序。软件组件可以利用任何数目个为本领域中技术人员所熟知的机制来进行通信,所述机制例如是应用程序接口或包括远程过程调用的中间过程通信技术。对各个实施例的教导并不局限于任一特定的编程语言或环境。
考虑到对在此描述的实施例的较广范围的重新配置,这些详细的描述意欲仅作为说明性的,并且不应被理解为限制了本发明的范围。因此,本发明所主张的范围是所有的这样的修改,因为这些修改可以落入随附权利要求书和其等价物的精神和范围之内。因此,本说明书及附图被视为说明性的而非限制性的。
Claims (40)
1.一种方法,包括:
接收可用在针对数据库中的数据的搜索查询中的单词,所述数据库包括由数据串表示的数据项;
确定所述单词的同义候选词;并且
响应于确定具有所述同义候选词的数据串的数目超过阈值,将所述同义候选词作为所述单词的同义词添加到扩展词典中。
2.如权利要求1所述的方法,还包括:
从请求者接收针对所述数据库中的数据的、具有所述单词的搜索查询;
将所述搜索查询扩展为包括所述同义词以形成经扩展的搜索查询;
利用所述经扩展的搜索查询来执行针对所述数据库中的数据的搜索;并且
将所述搜索的结果返回给所述请求者。
3.如权利要求2所述的方法,还包括:
将所述经扩展的搜索查询返回给所述请求者;并且
在利用所述经扩展的搜索查询执行所述搜索之前,从所述请求者接收对所述经扩展的搜索查询的批准。
4.如权利要求1所述的方法,其中,响应于确定具有所述同义候选词的、针对所述数据库的搜索查询的数目超过阈值,将所述同义候选词作为所述单词的所述同义词添加到所述扩展词典中。
5.如权利要求1所述的方法,其中,确定所述单词的所述同义候选词包括基于比较所述单词在句子中的角色和所述单次的不同形式在该句子中的角色来确定所述单词的所述不同形式。
6.如权利要求1所述的方法,其中确定所述单词的所述同义候选词包括确定单数形式的所述单词的复数形式。
7.如权利要求1所述的方法,其中所述阈值是15。
8.一种方法,包括:
接收可用在针对数据库中的数据的搜索查询中的单词,所述数据库包括存储在树状分级结构的类别中的数据项;
确定所述单词的同义候选词;并且
响应于确定所述单词和所述同义候选词处于所述树状分级结构的某一级的相同类别中,将所述同义候选词作为所述单词的同义词添加到扩展词典中。
9.如权利要求8所述的方法,其中所述数据库包括由数据串表示的数据项,并且其中将所述同义候选词作为所述单词的所述同义词添加到所述扩展词典中包括响应于确定具有所述同义候选词的数据串的数目超过阈值,将所述同义候选词作为所述单词的同义词添加到所述扩展词典中。
10.如权利要求8所述的方法,还包括:
从请求者接收针对所述数据库中的数据的、具有所述单词的搜索查询;
将所述搜索查询扩展为包括所述同义词以形成经扩展的搜索查询;
利用所述经扩展的搜索查询来执行针对所述数据库中的数据的搜索;
并且
将所述搜索的结果返回给所述请求者。
11.如权利要求10所述的方法,还包括:
将所述经扩展的搜索查询返回给所述请求者;并且
在利用所述经扩展的搜索查询执行所述搜索之前,从所述请求者接收对所述经扩展的搜索查询的批准。
12.如权利要求10所述的方法,其中所述数据库是在线拍卖中用于销售的物品的数据库,其中所述请求者包括所述用于销售的物品的购买者或销售者。
13.如权利要求8所述的方法,其中所述某一级是在所述树状分级结构的根之下的一个级。
14.一种方法,包括:
接收可用在针对数据库中的数据的搜索查询中的单词,所述数据库包括存储在树状分级结构的类别中的数据项;
确定所述单词的同义候选词;
确定所述单词在所述树状分级结构中的叶子类别上的概率分布;
确定所述同义候选词在所述树状分级结构中的叶子类别上的概率分布;并且
响应于确定所述单词的所述概率分布和所述同义候选词的所述概率之间的相似性超出预定等级,将所述同义候选词作为所述单词的同义词添加到扩展词典中。
15.如权利要求14所述的方法,其中所述数据库包括由数据串表示的数据项,并且其中将所述同义候选词作为所述单词的所述同义词添加到所述扩展词典中包括响应于确定具有所述同义候选词的数据串的数目超过阈值,将所述同义候选词作为所述单词的同义词添加到所述扩展词典中。
16.如权利要求15所述的方法,其中将所述同义候选词作为所述单词的所述同义词添加到所述扩展词典中包括响应于确定所述单词和所述同义候选词处于所述树状分级结构的某一级的相同类别中,将所述同义候选词作为所述单词的同义词添加到所述扩展词典中。
17.如权利要求14所述的方法,还包括:
从请求者接收针对所述数据库中的数据的、具有所述单词的搜索查询;
将所述搜索查询扩展为包括所述同义词以形成经扩展的搜索查询;
利用所述经扩展的搜索查询来执行针对所述数据库中的数据的搜索;
并且
将所述搜索的结果返回给所述请求者。
18.如权利要求17所述的方法,还包括:
将所述经扩展的搜索查询返回给所述请求者;并且
在利用所述经扩展的搜索查询执行所述搜索之前,从所述请求者接收对所述经扩展的搜索查询的批准。
19.如权利要求14所述的方法,其中所述数据库是在线拍卖中用于销售的物品的数据库,其中所述请求者包括所述用于销售的物品的购买者或销售者。
20.一种方法,包括:
接收可用在针对数据库中的数据的搜索查询中的单词,所述数据库包括存储在树状分级结构的类别中的数据项;
确定所述单词的同义候选词;
确定所述单词在所述树状分级结构中的叶子类别上的概率分布;
确定所述同义候选词在所述树状分级结构中的叶子类别上的概率分布;
确定所述单词的所述概率分布和所述同义候选词的所述概率的交叉熵;并且
响应于确定交叉熵超出预定等级,将所述同义候选词作为所述单词的同义词添加到扩展词典中。
21.如权利要求20所述的方法,其中所述数据库包括由数据串表示的数据项,并且其中将所述同义候选词作为所述单词的所述同义词添加到所述扩展词典中包括响应于确定具有所述同义候选词的数据串的数目超过阈值,将所述同义候选词作为所述单词的同义词添加到所述扩展词典中。
22.如权利要求21所述的方法,其中将所述同义候选词作为所述单词的所述同义词添加到所述扩展词典中包括响应于确定所述单词和所述同义候选词处于所述树状分级结构的某一级的相同类别中,将所述同义候选词作为所述单词的同义词添加到所述扩展词典中。
23.如权利要求20所述的方法,还包括:
从请求者接收针对所述数据库中的数据的、具有所述单词的搜索查询;
将所述搜索查询扩展为包括所述同义词以形成经扩展的搜索查询;
利用所述经扩展的搜索查询来执行针对所述数据库中的数据的搜索;并且
将所述搜索的结果返回给所述请求者。
24.如权利要求23所述的方法,还包括:
将所述经扩展的搜索查询返回给所述请求者;并且
在利用所述经扩展的搜索查询执行所述搜索之前,从所述请求者接收对所述经扩展的搜索查询的批准。
25.一种方法,包括:
接收可用在针对数据库中的数据的搜索查询中的单词,所述数据库包括存储在树状分级结构的类别中的数据项;
确定所述单词的同义候选词;
确定所述单词在所述树状分级结构中的叶子类别上的概率分布;
确定所述同义候选词在所述树状分级结构中的叶子类别上的概率分布;
确定所述单词的所述概率分布和所述同义候选词的所述概率的KL散度测度;并且
确定所述单词的所述概率分布和所述同义候选词的所述概率的交叉熵;并且
响应于确定KL散度测度低于阈值,将所述同义候选词作为所述单词的同义词添加到扩展词典中。
26.如权利要求25所述的方法,其中所述阈值是5。
27.如权利要求25所述的方法,其中所述数据库包括由数据串表示的数据项,并且其中将所述同义候选词作为所述单词的所述同义词添加到所述扩展词典中包括响应于确定具有所述同义候选词的数据串的数目超过阈值,将所述同义候选词作为所述单词的同义词添加到所述扩展词典中。
28.如权利要求27所述的方法,其中将所述同义候选词作为所述单词的所述同义词添加到所述扩展词典中包括响应于确定所述单词和所述同义候选词处于所述树状分级结构的某一级的相同类别中,将所述同义候选词作为所述单词的同义词添加到所述扩展词典中。
29.如权利要求25所述的方法,还包括:
从请求者接收针对所述数据库中的数据的、具有所述单词的搜索查询;
将所述搜索查询扩展为包括所述同义词以形成经扩展的搜索查询;
利用所述经扩展的搜索查询来执行针对所述数据库中的数据的所述搜索;并且
将所述搜索的结果返回给所述请求者。
30.如权利要求29所述的方法,还包括:
将所述经扩展的搜索查询返回给所述请求者;并且
在利用所述经扩展的搜索查询执行所述搜索之前,从所述请求者接收对所述经扩展的搜索查询的批准。
31.一种系统,包括:
数据存储器,用于存储在线拍卖数据库的拍卖物品,其中所述拍卖物品由数据串表示;以及
扩展模块,用于确定可用在针对所述在线拍卖数据库中的所述拍卖物品的搜索查询中的单词的同义候选词,其中所述扩展模块用于响应于确定具有所述同义候选词的数据串的数目超过阈值,将所述同义候选词作为所述单词的同义词添加到扩展词典中。
32.如权利要求31所述的系统,还包括:
查询控制模块,其用于从请求者接收针对所述在线拍卖数据库中的拍卖物品的、具有所述单词的搜索查询,其中所述查询控制模块用于将所述搜索查询扩展为包括所述同义词以形成经扩展的搜索查询;以及
搜索引擎,其用于利用所述经扩展的搜索查询来执行针对所述在线拍卖数据库中的在线拍卖物品的所述搜索,其中所述查询控制模块用于将所述搜索的结果返回给所述请求者。
33.如权利要求31所述的系统,其中,响应于确定具有所述同义候选词的、针对所述在线拍卖数据库的搜索查询的数目超过阈值,所述扩展模块将所述同义候选词作为所述单词的所述同义词添加到所述扩展词典中。
34.如权利要求33所述的系统,其中所述在线拍卖数据库包括存储在树状分级结构的类别中的拍卖物品,其中所述扩展模块用于响应于确定所述单词和所述同义候选词处于所述树状分级结构的某一级的相同类别中,将所述同义候选词作为所述单词的同义词添加到扩展词典中。
35.如权利要求34所述的系统,其中所述扩展模块用于确定所述单词在所述树状分级结构中的叶子类别上的概率分布,所述扩展模块用于确定所述同义候选词在所述树状分级结构中的叶子类别上的概率分布,并且其中所述扩展模块用于响应于确定所述单词的所述概率分布和所述同义候选词的所述概率之间的相似性超出预定等级,将所述同义候选词作为所述单词的同义词添加到扩展词典中。
36.一种提供指令的机器可读介质,所述指令在被机器执行时导致所述机器执行如权利要求1所述的操作。
37.一种提供指令的机器可读介质,所述指令在被机器执行时导致所述机器执行如权利要求8所述的操作。
38.一种提供指令的机器可读介质,所述指令在被机器执行时导致所述机器执行如权利要求14所述的操作。
39.一种提供指令的机器可读介质,所述指令在被机器执行时导致所述机器执行如权利要求20所述的操作。
40.一种提供指令的机器可读介质,所述指令在被机器执行时导致所述机器执行如权利要求25所述的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510906152.2A CN105512291B (zh) | 2006-02-28 | 2007-02-26 | 用于扩展数据库搜索查询的方法和系统 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/363,679 US8195683B2 (en) | 2006-02-28 | 2006-02-28 | Expansion of database search queries |
US11/363,679 | 2006-02-28 | ||
PCT/US2007/005057 WO2007100812A2 (en) | 2006-02-28 | 2007-02-26 | Expansion of database search queries |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510906152.2A Division CN105512291B (zh) | 2006-02-28 | 2007-02-26 | 用于扩展数据库搜索查询的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101432685A true CN101432685A (zh) | 2009-05-13 |
CN101432685B CN101432685B (zh) | 2016-01-13 |
Family
ID=38445277
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780015514.2A Active CN101432685B (zh) | 2006-02-28 | 2007-02-26 | 用于扩展数据库搜索查询的方法和系统 |
CN201510906152.2A Active CN105512291B (zh) | 2006-02-28 | 2007-02-26 | 用于扩展数据库搜索查询的方法和系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510906152.2A Active CN105512291B (zh) | 2006-02-28 | 2007-02-26 | 用于扩展数据库搜索查询的方法和系统 |
Country Status (4)
Country | Link |
---|---|
US (3) | US8195683B2 (zh) |
EP (1) | EP1999561B1 (zh) |
CN (2) | CN101432685B (zh) |
WO (1) | WO2007100812A2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103136262A (zh) * | 2011-11-30 | 2013-06-05 | 阿里巴巴集团控股有限公司 | 信息检索方法及装置 |
CN106294661A (zh) * | 2016-08-04 | 2017-01-04 | 百度在线网络技术(北京)有限公司 | 一种扩展搜索方法与装置 |
Families Citing this family (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1889181A4 (en) * | 2005-05-16 | 2009-12-02 | Ebay Inc | METHOD AND SYSTEM FOR SEARCHING SEARCH |
US8903810B2 (en) | 2005-12-05 | 2014-12-02 | Collarity, Inc. | Techniques for ranking search results |
US8429184B2 (en) | 2005-12-05 | 2013-04-23 | Collarity Inc. | Generation of refinement terms for search queries |
US8195683B2 (en) | 2006-02-28 | 2012-06-05 | Ebay Inc. | Expansion of database search queries |
US8589869B2 (en) * | 2006-09-07 | 2013-11-19 | Wolfram Alpha Llc | Methods and systems for determining a formula |
US8442972B2 (en) | 2006-10-11 | 2013-05-14 | Collarity, Inc. | Negative associations for search results ranking and refinement |
US8798988B1 (en) * | 2006-10-24 | 2014-08-05 | Google Inc. | Identifying related terms in different languages |
US8037086B1 (en) | 2007-07-10 | 2011-10-11 | Google Inc. | Identifying common co-occurring elements in lists |
CN101159967B (zh) * | 2007-10-29 | 2011-08-31 | 中国移动通信集团设计院有限公司 | 一种将路测数据用于传播模型校正的方法及装置 |
US8725756B1 (en) | 2007-11-12 | 2014-05-13 | Google Inc. | Session-based query suggestions |
US9646078B2 (en) * | 2008-05-12 | 2017-05-09 | Groupon, Inc. | Sentiment extraction from consumer reviews for providing product recommendations |
US8438178B2 (en) | 2008-06-26 | 2013-05-07 | Collarity Inc. | Interactions among online digital identities |
US9092517B2 (en) * | 2008-09-23 | 2015-07-28 | Microsoft Technology Licensing, Llc | Generating synonyms based on query log data |
US8145662B2 (en) * | 2008-12-31 | 2012-03-27 | Ebay Inc. | Methods and apparatus for generating a data dictionary |
US8504582B2 (en) | 2008-12-31 | 2013-08-06 | Ebay, Inc. | System and methods for unit of measurement conversion and search query expansion |
US8463806B2 (en) * | 2009-01-30 | 2013-06-11 | Lexisnexis | Methods and systems for creating and using an adaptive thesaurus |
US8949265B2 (en) | 2009-03-05 | 2015-02-03 | Ebay Inc. | System and method to provide query linguistic service |
US8601015B1 (en) * | 2009-05-15 | 2013-12-03 | Wolfram Alpha Llc | Dynamic example generation for queries |
US8788524B1 (en) | 2009-05-15 | 2014-07-22 | Wolfram Alpha Llc | Method and system for responding to queries in an imprecise syntax |
KR101042500B1 (ko) * | 2009-06-19 | 2011-06-16 | 엔에이치엔(주) | 이전 질의어를 이용한 검색 결과 제공 방법 및 장치 |
US8386406B2 (en) | 2009-07-08 | 2013-02-26 | Ebay Inc. | Systems and methods for making contextual recommendations |
JP2011033680A (ja) * | 2009-07-30 | 2011-02-17 | Sony Corp | 音声処理装置及び方法、並びにプログラム |
US8515731B1 (en) * | 2009-09-28 | 2013-08-20 | Google Inc. | Synonym verification |
US8615509B2 (en) * | 2009-12-11 | 2013-12-24 | Blackberry Limited | Abstracting information from a device |
US8875038B2 (en) | 2010-01-19 | 2014-10-28 | Collarity, Inc. | Anchoring for content synchronization |
US9275033B2 (en) * | 2010-03-25 | 2016-03-01 | Salesforce.Com, Inc. | System, method and computer program product for creating an object within a system, utilizing a template |
US8832079B2 (en) * | 2010-04-05 | 2014-09-09 | Mckesson Financial Holdings | Methods, apparatuses, and computer program products for facilitating searching |
US9600566B2 (en) | 2010-05-14 | 2017-03-21 | Microsoft Technology Licensing, Llc | Identifying entity synonyms |
US8484015B1 (en) | 2010-05-14 | 2013-07-09 | Wolfram Alpha Llc | Entity pages |
US8812298B1 (en) | 2010-07-28 | 2014-08-19 | Wolfram Alpha Llc | Macro replacement of natural language input |
US8577891B2 (en) * | 2010-10-27 | 2013-11-05 | Apple Inc. | Methods for indexing and searching based on language locale |
US20120117102A1 (en) * | 2010-11-04 | 2012-05-10 | Microsoft Corporation | Query suggestions using replacement substitutions and an advanced query syntax |
US8650024B1 (en) * | 2011-04-13 | 2014-02-11 | Google Inc. | Generating address term synonyms |
US8407203B2 (en) * | 2011-05-02 | 2013-03-26 | Elsevier Inc. | Computer system for enhanced taxonomy management |
US20120310954A1 (en) * | 2011-06-03 | 2012-12-06 | Ebay Inc. | Method and system to narrow generic searches using related search terms |
US9069814B2 (en) | 2011-07-27 | 2015-06-30 | Wolfram Alpha Llc | Method and system for using natural language to generate widgets |
US9734252B2 (en) | 2011-09-08 | 2017-08-15 | Wolfram Alpha Llc | Method and system for analyzing data using a query answering system |
US9851950B2 (en) | 2011-11-15 | 2017-12-26 | Wolfram Alpha Llc | Programming in a precise syntax using natural language |
US10032131B2 (en) | 2012-06-20 | 2018-07-24 | Microsoft Technology Licensing, Llc | Data services for enterprises leveraging search system data assets |
US9594831B2 (en) | 2012-06-22 | 2017-03-14 | Microsoft Technology Licensing, Llc | Targeted disambiguation of named entities |
US8756241B1 (en) | 2012-08-06 | 2014-06-17 | Google Inc. | Determining rewrite similarity scores |
US9229924B2 (en) | 2012-08-24 | 2016-01-05 | Microsoft Technology Licensing, Llc | Word detection and domain dictionary recommendation |
US9405424B2 (en) | 2012-08-29 | 2016-08-02 | Wolfram Alpha, Llc | Method and system for distributing and displaying graphical items |
US20150317386A1 (en) * | 2012-12-27 | 2015-11-05 | Abbyy Development Llc | Finding an appropriate meaning of an entry in a text |
US9201945B1 (en) * | 2013-03-08 | 2015-12-01 | Google Inc. | Synonym identification based on categorical contexts |
IN2013CH01237A (zh) * | 2013-03-21 | 2015-08-14 | Infosys Ltd | |
US9772765B2 (en) | 2013-07-06 | 2017-09-26 | International Business Machines Corporation | User interface for recommended alternative search queries |
US9299098B2 (en) * | 2013-08-13 | 2016-03-29 | Ebay Inc. | Systems for generating a global product taxonomy |
US20150213010A1 (en) * | 2014-01-30 | 2015-07-30 | Sage Microelectronics Corp. | Storage system with distributed data searching |
CN105095203B (zh) * | 2014-04-17 | 2018-10-23 | 阿里巴巴集团控股有限公司 | 同义词的确定、搜索方法及服务器 |
US9582543B2 (en) * | 2014-04-24 | 2017-02-28 | International Business Machines Corporation | Temporal proximity query expansion |
WO2015168756A1 (en) * | 2014-05-07 | 2015-11-12 | Silveira Freixo Cristiano | Electronic commercial mediation based on buying intentions |
US9959364B2 (en) * | 2014-05-22 | 2018-05-01 | Oath Inc. | Content recommendations |
US9378204B2 (en) * | 2014-05-22 | 2016-06-28 | International Business Machines Corporation | Context based synonym filtering for natural language processing systems |
US11250450B1 (en) | 2014-06-27 | 2022-02-15 | Groupon, Inc. | Method and system for programmatic generation of survey queries |
US9317566B1 (en) | 2014-06-27 | 2016-04-19 | Groupon, Inc. | Method and system for programmatic analysis of consumer reviews |
KR101661198B1 (ko) * | 2014-07-10 | 2016-10-04 | 네이버 주식회사 | 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 |
US10878017B1 (en) | 2014-07-29 | 2020-12-29 | Groupon, Inc. | System and method for programmatic generation of attribute descriptors |
US10977667B1 (en) | 2014-10-22 | 2021-04-13 | Groupon, Inc. | Method and system for programmatic analysis of consumer sentiment with regard to attribute descriptors |
TWI582624B (zh) * | 2014-11-21 | 2017-05-11 | 財團法人資訊工業策進會 | 用於感知情境並推薦資訊之電子計算裝置、其方法及其電腦程式產品 |
US20170132590A1 (en) * | 2015-09-22 | 2017-05-11 | Joom3D.Com Technologies Incorporated | Systems and methods for providing online access to resources |
US10831800B2 (en) | 2016-08-26 | 2020-11-10 | International Business Machines Corporation | Query expansion |
CN107871259A (zh) * | 2016-09-26 | 2018-04-03 | 阿里巴巴集团控股有限公司 | 一种信息推荐的处理方法、装置及客户端 |
US20180089316A1 (en) | 2016-09-26 | 2018-03-29 | Twiggle Ltd. | Seamless integration of modules for search enhancement |
US10067965B2 (en) | 2016-09-26 | 2018-09-04 | Twiggle Ltd. | Hierarchic model and natural language analyzer |
US10387423B2 (en) * | 2017-01-31 | 2019-08-20 | Splunk Inc. | Interactive development environment for iterative query visualization and exploration |
US11366864B2 (en) * | 2017-02-09 | 2022-06-21 | Microsoft Technology Licensing, Llc | Bot integration in a web-based search engine |
CN107256258B (zh) * | 2017-06-12 | 2019-09-06 | 上海智臻智能网络科技股份有限公司 | 语义表达式生成方法及装置 |
US11580115B2 (en) | 2017-06-29 | 2023-02-14 | Ebay Inc. | Identification of intent and non-intent query portions |
CN107729347B (zh) * | 2017-08-23 | 2021-06-11 | 北京百度网讯科技有限公司 | 同义标签的获取方法、装置、设备及计算机可读存储介质 |
US10956466B2 (en) * | 2018-12-26 | 2021-03-23 | Paypal, Inc. | Machine learning approach to cross-language translation and search |
US11430077B2 (en) * | 2019-02-13 | 2022-08-30 | The Toronto-Dominion Bank | System and method for searching and monitoring assets available for acquisition |
US11238235B2 (en) * | 2019-09-18 | 2022-02-01 | International Business Machines Corporation | Automated novel concept extraction in natural language processing |
US11934402B2 (en) | 2021-08-06 | 2024-03-19 | Bank Of America Corporation | System and method for generating optimized data queries to improve hardware efficiency and utilization |
US20230118171A1 (en) * | 2021-09-30 | 2023-04-20 | Microsoft Technology Licensing, Llc | Generating a product ontology based upon queries in a search engine log |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1898670A (zh) * | 2003-12-30 | 2007-01-17 | Google公司 | 提高搜索质量的系统和方法 |
Family Cites Families (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3266246B2 (ja) * | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
US5278980A (en) | 1991-08-16 | 1994-01-11 | Xerox Corporation | Iterative technique for phrase query formation and an information retrieval system employing same |
US6081744A (en) | 1993-05-28 | 2000-06-27 | Loos; Hendricus G. | Electric fringe field generator for manipulating nervous systems |
US5717973A (en) | 1994-01-14 | 1998-02-10 | Mita Industrial Co., Ltd. | Image-forming machine with toner recycling and toner replenish control |
US5717913A (en) | 1995-01-03 | 1998-02-10 | University Of Central Florida | Method for detecting and extracting text data using database schemas |
EP0743531A3 (en) * | 1995-05-16 | 1997-04-23 | Hewlett Packard Co | Battery holder for exchanging information with a battery mailbox |
US5724571A (en) * | 1995-07-07 | 1998-03-03 | Sun Microsystems, Inc. | Method and apparatus for generating query responses in a computer-based document retrieval system |
US5926811A (en) * | 1996-03-15 | 1999-07-20 | Lexis-Nexis | Statistical thesaurus, method of forming same, and use thereof in query expansion in automated text searching |
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US6055528A (en) | 1997-07-25 | 2000-04-25 | Claritech Corporation | Method for cross-linguistic document retrieval |
US6081774A (en) | 1997-08-22 | 2000-06-27 | Novell, Inc. | Natural language information retrieval system and method |
US7124129B2 (en) * | 1998-03-03 | 2006-10-17 | A9.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
US6006225A (en) | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US6363377B1 (en) | 1998-07-30 | 2002-03-26 | Sarnoff Corporation | Search data processor |
US6453312B1 (en) * | 1998-10-14 | 2002-09-17 | Unisys Corporation | System and method for developing a selectably-expandable concept-based search |
US6411950B1 (en) * | 1998-11-30 | 2002-06-25 | Compaq Information Technologies Group, Lp | Dynamic query expansion |
US6598039B1 (en) * | 1999-06-08 | 2003-07-22 | Albert-Inc. S.A. | Natural language interface for searching database |
US7630986B1 (en) | 1999-10-27 | 2009-12-08 | Pinpoint, Incorporated | Secure data interchange |
US6785671B1 (en) | 1999-12-08 | 2004-08-31 | Amazon.Com, Inc. | System and method for locating web-based product offerings |
IL134893A0 (en) | 2000-03-06 | 2001-05-20 | Joinweb Inc | Method and system for locating internet users having similar navigation patterns |
US20010047353A1 (en) | 2000-03-30 | 2001-11-29 | Iqbal Talib | Methods and systems for enabling efficient search and retrieval of records from a collection of biological data |
US7120574B2 (en) * | 2000-04-03 | 2006-10-10 | Invention Machine Corporation | Synonym extension of search queries with validation |
US6516312B1 (en) | 2000-04-04 | 2003-02-04 | International Business Machine Corporation | System and method for dynamically associating keywords with domain-specific search engine queries |
US8396859B2 (en) | 2000-06-26 | 2013-03-12 | Oracle International Corporation | Subject matter context search engine |
CA2423964A1 (en) * | 2000-09-29 | 2002-04-04 | Gavagai Technology Incorporated | A method and system for describing and identifying concepts in natural language text for information retrieval and processing |
US7308445B2 (en) * | 2000-11-08 | 2007-12-11 | Overture Services, Inc. | Method for estimating coverage of web search engines |
US6925458B2 (en) | 2000-12-20 | 2005-08-02 | Michael A. Scaturro | System and method for providing an activity schedule of a public person over a network |
JP2002288201A (ja) | 2001-03-23 | 2002-10-04 | Fujitsu Ltd | 質問応答処理方法,質問応答処理プログラム,質問応答処理プログラム記録媒体および質問応答処理装置 |
US20040230572A1 (en) | 2001-06-22 | 2004-11-18 | Nosa Omoigui | System and method for semantic knowledge retrieval, management, capture, sharing, discovery, delivery and presentation |
JP2004534324A (ja) * | 2001-07-04 | 2004-11-11 | コギズム・インターメディア・アーゲー | 索引付きの拡張可能な対話的文書検索システム |
US20030014405A1 (en) | 2001-07-09 | 2003-01-16 | Jacob Shapiro | Search engine designed for handling long queries |
US6778979B2 (en) | 2001-08-13 | 2004-08-17 | Xerox Corporation | System for automatically generating queries |
US20050022114A1 (en) | 2001-08-13 | 2005-01-27 | Xerox Corporation | Meta-document management system with personality identifiers |
US7403938B2 (en) * | 2001-09-24 | 2008-07-22 | Iac Search & Media, Inc. | Natural language query processing |
US6854035B2 (en) | 2001-10-05 | 2005-02-08 | International Business Machines Corporation | Storage area network methods and apparatus for display and management of a hierarchical file system extension policy |
US7177935B2 (en) | 2001-10-05 | 2007-02-13 | International Business Machines Corporation | Storage area network methods and apparatus with hierarchical file system extension policy |
US6941293B1 (en) | 2002-02-01 | 2005-09-06 | Google, Inc. | Methods and apparatus for determining equivalent descriptions for an information need |
US7421660B2 (en) | 2003-02-04 | 2008-09-02 | Cataphora, Inc. | Method and apparatus to visually present discussions for data mining purposes |
WO2003067471A1 (fr) * | 2002-02-04 | 2003-08-14 | Celestar Lexico-Sciences, Inc. | Appareil et procede permettant de traiter des connaissances dans des documents |
US7031969B2 (en) * | 2002-02-20 | 2006-04-18 | Lawrence Technologies, Llc | System and method for identifying relationships between database records |
US7693830B2 (en) | 2005-08-10 | 2010-04-06 | Google Inc. | Programmable search engine |
US7437349B2 (en) | 2002-05-10 | 2008-10-14 | International Business Machines Corporation | Adaptive probabilistic query expansion |
US20050050030A1 (en) | 2003-01-30 | 2005-03-03 | Decode Genetics Ehf. | Set definition language for relational data |
US7287025B2 (en) * | 2003-02-12 | 2007-10-23 | Microsoft Corporation | Systems and methods for query expansion |
US6947930B2 (en) | 2003-03-21 | 2005-09-20 | Overture Services, Inc. | Systems and methods for interactive search query refinement |
US7885963B2 (en) | 2003-03-24 | 2011-02-08 | Microsoft Corporation | Free text and attribute searching of electronic program guide (EPG) data |
US20040199491A1 (en) | 2003-04-04 | 2004-10-07 | Nikhil Bhatt | Domain specific search engine |
US7007014B2 (en) | 2003-04-04 | 2006-02-28 | Yahoo! Inc. | Canonicalization of terms in a keyword-based presentation system |
US20050027705A1 (en) | 2003-05-20 | 2005-02-03 | Pasha Sadri | Mapping method and system |
US20040243560A1 (en) * | 2003-05-30 | 2004-12-02 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including an annotation inverted file system facilitating indexing and searching |
US7120637B2 (en) * | 2003-05-30 | 2006-10-10 | Microsoft Corporation | Positional access using a b-tree |
US7139752B2 (en) * | 2003-05-30 | 2006-11-21 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, and providing multiple document views derived from different document tokenizations |
CA2536265C (en) * | 2003-08-21 | 2012-11-13 | Idilia Inc. | System and method for processing a query |
TW200512602A (en) | 2003-09-19 | 2005-04-01 | Hon Hai Prec Ind Co Ltd | Method and system of fuzzy searching |
US7516086B2 (en) | 2003-09-24 | 2009-04-07 | Idearc Media Corp. | Business rating placement heuristic |
US7493322B2 (en) | 2003-10-15 | 2009-02-17 | Xerox Corporation | System and method for computing a measure of similarity between documents |
US20050131872A1 (en) | 2003-12-16 | 2005-06-16 | Microsoft Corporation | Query recognizer |
US20050154713A1 (en) | 2004-01-14 | 2005-07-14 | Nec Laboratories America, Inc. | Systems and methods for determining document relationship and automatic query expansion |
US7711596B2 (en) | 2004-02-14 | 2010-05-04 | Cristol Steven M | Business method for integrating and aligning product development and brand strategy |
US7254774B2 (en) | 2004-03-16 | 2007-08-07 | Microsoft Corporation | Systems and methods for improved spell checking |
US20050210008A1 (en) | 2004-03-18 | 2005-09-22 | Bao Tran | Systems and methods for analyzing documents over a network |
US20060036503A1 (en) * | 2004-08-12 | 2006-02-16 | Rene Schweier | Method for selecting and purchasing a gift |
EP1889181A4 (en) | 2005-05-16 | 2009-12-02 | Ebay Inc | METHOD AND SYSTEM FOR SEARCHING SEARCH |
CN104166677B (zh) | 2005-05-16 | 2018-08-17 | 贝宝公司 | 用于处理数据搜索请求的方法和系统 |
US8266162B2 (en) * | 2005-10-31 | 2012-09-11 | Lycos, Inc. | Automatic identification of related search keywords |
US8195683B2 (en) | 2006-02-28 | 2012-06-05 | Ebay Inc. | Expansion of database search queries |
US7788276B2 (en) | 2007-08-22 | 2010-08-31 | Yahoo! Inc. | Predictive stemming for web search with statistical machine translation models |
-
2006
- 2006-02-28 US US11/363,679 patent/US8195683B2/en active Active
-
2007
- 2007-02-26 EP EP07751791.0A patent/EP1999561B1/en active Active
- 2007-02-26 CN CN200780015514.2A patent/CN101432685B/zh active Active
- 2007-02-26 CN CN201510906152.2A patent/CN105512291B/zh active Active
- 2007-02-26 WO PCT/US2007/005057 patent/WO2007100812A2/en active Application Filing
-
2012
- 2012-04-03 US US13/438,632 patent/US20120191688A1/en not_active Abandoned
-
2016
- 2016-02-17 US US15/045,777 patent/US9916349B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1898670A (zh) * | 2003-12-30 | 2007-01-17 | Google公司 | 提高搜索质量的系统和方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103136262A (zh) * | 2011-11-30 | 2013-06-05 | 阿里巴巴集团控股有限公司 | 信息检索方法及装置 |
CN103136262B (zh) * | 2011-11-30 | 2016-08-24 | 阿里巴巴集团控股有限公司 | 信息检索方法及装置 |
TWI547815B (zh) * | 2011-11-30 | 2016-09-01 | Alibaba Group Holding Ltd | Information retrieval method and device |
CN106294661A (zh) * | 2016-08-04 | 2017-01-04 | 百度在线网络技术(北京)有限公司 | 一种扩展搜索方法与装置 |
CN106294661B (zh) * | 2016-08-04 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 一种扩展搜索方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2007100812A2 (en) | 2007-09-07 |
US9916349B2 (en) | 2018-03-13 |
EP1999561A2 (en) | 2008-12-10 |
CN105512291B (zh) | 2020-05-15 |
WO2007100812A3 (en) | 2008-05-02 |
US20120191688A1 (en) | 2012-07-26 |
US20070203929A1 (en) | 2007-08-30 |
EP1999561B1 (en) | 2016-10-05 |
US20160162545A1 (en) | 2016-06-09 |
CN101432685B (zh) | 2016-01-13 |
US8195683B2 (en) | 2012-06-05 |
CN105512291A (zh) | 2016-04-20 |
EP1999561A4 (en) | 2009-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101432685B (zh) | 用于扩展数据库搜索查询的方法和系统 | |
CN101878476B (zh) | 用于查询扩展的机器翻译 | |
US10606556B2 (en) | Rule-based system and method to associate attributes to text strings | |
JP4676181B2 (ja) | タグ付きデータを有する完全形式レキシコンおよびタグ付きデータを構成し使用する方法 | |
US9646108B2 (en) | Systems and methods for performing geo-search and retrieval of electronic documents using a big index | |
CN102479191B (zh) | 提供多粒度分词结果的方法及其装置 | |
US20070005344A1 (en) | Concept matching system | |
US20130018650A1 (en) | Selection of Language Model Training Data | |
JP5115741B2 (ja) | 検索方法、類似度計算方法、類似度計算及び同一文書照合システムと、そのプログラム | |
CN104252533A (zh) | 搜索方法和搜索装置 | |
Chen et al. | Abstractive snippet generation | |
JP2007133688A (ja) | 文書検索装置、文書検索プログラムおよび文書検索方法 | |
US7555428B1 (en) | System and method for identifying compounds through iterative analysis | |
US10942973B2 (en) | Automatically generating and evaluating candidate terms for trademark clearance | |
Ghosh et al. | A rule based extractive text summarization technique for Bangla news documents | |
JPWO2018070026A1 (ja) | 商品情報表示システム、商品情報表示方法、及びプログラム | |
US9507834B2 (en) | Search suggestions using fuzzy-score matching and entity co-occurrence | |
JP2010092357A (ja) | 施設関連情報検索方法および施設関連情報検索システム | |
US20060184523A1 (en) | Search methods and associated systems | |
WO2002010985A2 (en) | Method of and system for automatic document retrieval, categorization and processing | |
JP2000148754A (ja) | マルチリンガル・システム,マルチリンガル処理方法およびマルチリンガル処理のプログラムを記憶した媒体 | |
CN111414459B (zh) | 人物关系获取方法、装置、电子设备及存储介质 | |
US20240311892A1 (en) | System and Method for Catalog Data Enrichment | |
Buzikashvili | Query topic classification and sociology of web query logs | |
KR20230172835A (ko) | 상품 정보 제공 서비스 방법 및 이를 수행하기 위한 컴퓨팅 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20151022 Address after: American California Applicant after: EBAY INC Address before: American California Applicant before: Electonic Bay |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |