CN101297291A - 基于原始用户输入建议和细分用户输入 - Google Patents
基于原始用户输入建议和细分用户输入 Download PDFInfo
- Publication number
- CN101297291A CN101297291A CNA2006800219402A CN200680021940A CN101297291A CN 101297291 A CN101297291 A CN 101297291A CN A2006800219402 A CNA2006800219402 A CN A2006800219402A CN 200680021940 A CN200680021940 A CN 200680021940A CN 101297291 A CN101297291 A CN 101297291A
- Authority
- CN
- China
- Prior art keywords
- user input
- original
- words
- word
- potential alternative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007670 refining Methods 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 69
- 230000008602 contraction Effects 0.000 claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims abstract description 39
- 239000013598 vector Substances 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 description 46
- 230000008569 process Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 22
- 230000004048 modification Effects 0.000 description 17
- 238000012986 modification Methods 0.000 description 17
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000000605 extraction Methods 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000011524 similarity measure Methods 0.000 description 2
- 241001417524 Pomacanthidae Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000004557 technical material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90324—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
公开了一种基于诸如搜索查询的原始用户输入来生成更改/细分的用户输入的系统和方法。该方法可以针对基于罗马语系的语言和/或诸如汉语的基于非罗马语系的语言来实现。该方法通常可以包括:接收原始用户输入并识别其中的核心词语;通过根据相似矩阵用另一词语替代原始输入中的核心词语和/或通过根据扩展/缩略表用另一个字序列代替原始输入中的字序列来确定潜在可选输入,其中,一个字序列是另一个字序列的子串;计算每个潜在可选输入的似然;以及根据预定标准(例如,可选输入的似然至少是原始输入的似然)来选择最有可能的可选输入。可以提供包含预计算的原始用户输入和相应的可选输入的高速缓冲存储器。
Description
技术领域
本发明总的来说涉及生成可选用户输入。更具体地,公开了基于诸如搜索查询的原始用户输入生成更改和细分的用户输入的系统和方法。
背景技术
在给定的搜索会话(session)期间,许多用户常常,有时重复地,更改或细分其原始搜索查询。例如,用户可以将原始搜索查询更改为更具体的搜索查询、更宽泛的搜索查询、和/或使用可选的查询词语(term)的搜索查询,直到生成期望的搜索结果。用户搜索查询细分通过基于罗马语系语言(例如,英语)的查询、以及通过基于非罗马语系语言(例如,汉语、日语、韩语(CJK)、泰国语等)来产生。当原始搜索查询未产生一组好的搜索结果时(例如,如果搜索查询太具体或太宽泛,或者如果搜索查询使用不合适的词语),用户通常更改或细分他们的搜索查询。例如,当一个或多个搜索词语有多种意思且一些返回文档涉及不同于用户想要的多义搜索词语的一个意思时、和/或用户仅对搜索词语的许多方面中给定搜索词语的一个方面感兴趣时,原始用户搜索查询可能产生许多不相关的结果。当用户仅探究关于所指定搜索词语的概念时,原始用户搜索查询也可能产生很多不相关的结果。
许多搜索引擎提供与用户原始搜索查询相关的一系列建议的搜索查询。例如,如果用户的原始搜索查询是“Amazon”,则搜索引擎可以建议其它相关的搜索查询,例如,“Amazon.com”、“Amazon Rainforest”、以及“Amazon River”。搜索查询建议对于基于非罗马语系语言用户(例如,CJK用户)特别有用。具体地,因为基于非罗马语系语言通常具有一组大量的字符且每个字符可能都需要多次按下使用传统基于罗马语系的键盘的按键,所以基于非罗马语系语言用户可以优选单击或选择全部键入的更改搜索查询中的一个建议的搜索查询。例如,许多汉语用户使用拼音(语音拼写法)来输入汉语字符。典型地,传统拼音输入系统转换拼音输入,并提供用户可以从中选择期望的汉语字符集的一组候选的汉语字符集。明显的是,多步输入处理将是繁重且耗时的。
搜索查询建议也将对基于罗马语系的语言用户有用。许多搜索引擎(例如,Yahoo、Teoma、Alta Vista、Askjeeves、AllTheWeb以及Baidu)都提供例如以相关搜索、查询细分、或查询分簇形式的特征。
发明内容
公开了一种基于原始用户输入(例如,搜索查询)来生成更改或细分的用户输入的系统和方法。应当理解,本发明可以多种方式来实施,这些方式包括诸如处理、设备、系统、装置、方法、或其中的程序指令通过光通信线路或电子通信线路来发送的计算机可读介质(例如,计算机可读存储介质或计算机网络)。术语计算机通常指具有计算能力的任何装置,例如,个人数字助理(PDA)、蜂窝式电话、和网络交换机。以下将描述本发明的几个创造性实施例。
该方法可以被应用于基于非罗马语系语言(例如,汉语)的查询。该方法通常可以包括接收和识别原始用户输入中的核心词语;通过根据相似矩阵用另一词语代替原始输入中的核心词语、和/或根据扩展/缩略表用另一个字序列替代原始输入中的字序列来确定潜在可选的用户输入,其中,一个序列是另一个序列的子串;计算潜在可选的用户输入的似然;以及根据预定标准(例如,每个所选的可选用户输入的似然至少为原始用户输入的似然)来选择最可能的可选用户输入。该方法还可以包括确定原始用户输入是否在所建议的可选用户输入的预计算高速缓冲存储器中,如果在,则输出存储在预计算高速缓冲存储器中的预计算的最可能的可选用户输入。
相似矩阵可以利用语料库生成,且可以具有两个相似词语(包括例如“New York”和“Los Angeles”的短语词)之间的相似值,尽管每个对应词语对(New和Los和York和Angeles)不具有高相似性,但这些短语词可以具有非常高的相似性。在一个实施例中,可以通过构建对于语料库中的字的特征向量并利用他们的特征向量来确定两个字/短语之间的相似值来生成相似矩阵。
可以从用户输入数据库中生成扩展/缩略表,且可以具有与每对词语序列相关的频率值。在一个实施例中,可以通过确定常用的字序列、滤出非短语字序列、以及使计数与每个术语序列相关作为频率值来生成扩展/缩略表。仅为了示出,扩展/缩略表中的项的实例可以为“The United State of America”和“United States”。
可以通过确定以下的至少一项来计算潜在可选用户输入的似然:(a)原始用户输入和潜在可选用户输入之间的关联性,(b)用户将选择潜在可选用户输入的概率,以及(c)潜在可选用户输入的位置分数(score)。具体地,可以使用原始输入和潜在可选用户输入的调整(align)词语之间的相关值来确定原始用户输入和潜在可选用户输入之间的关联性。
在另一实施例中,用于建议可选用户输入的系统通常包括建议/细分服务器,被配置为接收具有至少一个核心词语的原始用户输入;从原始用户输入中识别出核心词语;通过执行以下中的至少一项来确定潜在可选用户输入:(a)根据相似矩阵用另一词语来代替原始用户输入中的至少一个核心词语,该相似矩阵具有两个词语之间的相似值,(b)根据扩展/缩略表用另一个字序列来替代原始用户输入中的字序列,其中,一个序列是另一个序列的子串,该扩展/缩略表具有与每个词语序列相关联的频率值,计算潜在可选用户输入的似然;以及根据预定标准来选择和输出最可能的可选用户输入。
在又一实施例中,用于建议可选用户输入的计算机程序产品和计算机系统一起使用,该计算机程序产品包括在其上存储有在计算机处理器上可执行的指令的计算机可读存储介质。该指令通常可以包括接收和识别原始用户输入中的核心词语;通过根据相似矩阵用另一个词语代替在原始输入中的核心词语、和/或根据扩展/缩略表用另一个字序列代替原始输入中的字序列来确定潜在可选用户输入,一个序列是另一个序列的子串;用潜在可选用户输入计算潜在可选用户输入的似然和可选地计算预测用户满意度;以及根据预定标准(例如,每个所选的可选用户输入的似然至少为原始用户输入的似然)来选择最可能的可选用户输入。
实现系统和方法的应用可以在服务器站点(例如,在搜索引擎上)上实现,或者可以在客户端站点上(例如,用户计算机)被实现(例如,下载),以提出建议的可选输入或与远程服务器(例如,搜索引擎)连接。
下面将通过下列详细描述和附图更详细地呈现本发明的这些和其它特征以及优点,其中,以本发明的实例原理的方式示出了附图。
附图说明
结合附图,通过下面详细的描述,将更好地理解本发明,其中,相同的参考标号表示相同的结构元件。
图1A是用于生成诸如用户搜索查询的建议的更改/细分的用户输入的示例性系统的框图。
图1B是示出用于通过建议-细分服务器的相似字提取器生成相似矩阵的过程的框图。
图1C是示出用于通过建议-细分服务器的扩展/缩略表生成器生成扩展/缩略表的过程的框图。
图1D是示出用于通过建议-细分服务器的会话语法分析器生成初始的更改/细分高速缓冲存储器的过程的框图。
图2A是示出用于生成如可以由图1A所示的系统实现的更改/细分用户输入高速缓冲存储器的示例性过程的流程图。
图2B是示出用于生成如可以由图1A所示的系统实现的诸如用户查询的建议的更改/细分用户输入的示例性过程的流程图。
图3示出了通过对原始用户查询进行语法分析而生成的示例性查询网格。
图4是示出了用于通过代替查询词语来构建在生成建议的更改/细分查询中使用的相似矩阵的示例性过程的流程图。
图5是列出了对于从示例性文本中生成的词语“communities”的特征和对应计数的表。
图6是列出了对于从语料库中生成的词语“communities”的示例性特征和对应计数的表。
图7是用于代替词语以生成建议的更改/细分查询的示例性相似矩阵。
图8是示出用于通过替代查询中的复合字来构建在生成建议的更改/细分查询中使用的复合字对的提取/缩略表的示例性过程的流程图。
图9是示出用于代替查询中的复合字来生成建议的更改/细分查询的扩展/缩略表中的一些示例性项的表格。
图10是示出用于确定建议的更改/细分查询分数的示例性过程的流程图。
图11示出两个查询Q和Q’的词语对准映射的实例。
图12是示出用于生成用于检测的新项的相关值的示例性过程的流程图。
具体实施方式
披露了一种基于原始用户输入(例如,搜索查询)来生成更改或细分的用户输入的系统和方法。应当注意,仅为了清楚,通常以汉语查询输入的词语来表示文中表示的实例。然而,用于建议细分/更改的用户输入的系统和方法可以类似地应用于其它基于非罗马语系的语言(例如,日语、韩语、泰国语等)以及基于罗马语系的语言。此外,用于建议的细分/更改用户输入的系统和方法可以类似地应用于其它非查询用户输入。表示下列描述,以使任何本领域技术人员能够制造和使用本发明。仅提供了特定实施例和应用的描述作为实例,并且各种更改对于本领域技术人员来说是显而易见的。在不背离本发明的精神和范围的情况下,可将文中限定的主要原理应用于其它实施例和应用。因此,本发明应与包括与文中公开的原理和特征相一致的各种改变、更改和等同替换的最宽范围相一致。为了清楚,未对关于与本发明相关的的技术领域中已知的技术资料的细节进行详细描述,以避免对本发明产生不必要的混淆。
该系统和方法基于原始用户输入(例如,查询)、基于用户的查询历史和用户查询词语之间的关系来生成更改或细分的用户输入。该系统和方法可以包括用于提取包括新名称项(例如,适当名称、电影名、歌曲和产品等)的新词语以及词语之间关系的系统和方法。文中描述的系统和方法适用于生成查询(或其它用户输入)细分,并且还将适用于诸如新文章分类、拼写校正、媒体搜索和分段的许多其它应用。对于许多用户,初始搜索查询通常不是最佳搜索查询,因此在给定搜索会话期间,用户有时多次更改或细分搜索查询。
图1A是用于从诸如用户搜索查询22的原始用户输入中生成建议更改/细分的输入26的示例性系统20的框图。系统20通常包括建议/细分服务器24,其使用可以从多个数据源中推导出的概率来生成建议的更改/细分查询26。多个数据源的实例包括可选的建议/细分高速缓冲存储器36,其存储预先计算的查询建议或细分的高速缓冲存储器。首先,可以通过建议/细分服务器24的会话语法分析器24C生成建议/细分高速缓冲存储器36。另一数据源可以是可由建议/细分服务器24的相似字提取器24A生成的相似矩阵38,以及由扩展/缩略表生成器24B生成的扩展/缩略表39。相似矩阵38和扩展/缩略表39通常接近于词语和/或词语序列之间的关系。系统20可以周期性地更新和/或再生相似矩阵38和/或扩展/缩略表39。以下将参照图1B至图1D分别详细描述建议/细分服务器24的相似字提取器24A、扩展/缩略表生成器24B、和会话语法分析器24C。
图1B是示出用于通过相似字提取器24A生成相似矩阵38的过程的框图。如图所示,相似字提取器24A可以利用用于生成相似矩阵38的多种数据源。由相似字提取器24A利用的数据源的实例包括诸如网络语料库30的语料库(例如,新闻、网页、和链接锚文本信息)、查询和相关用户选择(例如,存储在查询日志32中的查询和相关用户选择)、和/或可以包括在每个给定会话中的查询历史的会话数据34。网络语料库30还可以包括链接锚文本信息。例如,查询日志32不仅可以包括用户查询日志,还可以包括由用户进行的搜索结果选择以及在返回搜索结果之前用户停留在所选搜索结果处的持续时间。
图1C是示出用于通过扩展/缩略表生成器24B生成提取/缩略表39的过程的框图。如图所示,扩展/缩略表生成器24B可以将查询日志32和/或会话数据34用作用于生成提取/缩略表39的数据源。图1D是示出用于通过会话语法分析器24C生成初始更改/细分高速缓冲存储器36a的处理的框图。如图所示,会话语法分析器24C将会话数据34用作其用于生成初始更改/细分高速缓冲存储器36a的数据源。
图2A和图2B是示出可以通过建议/细分服务器24来执行示例性过程的流程图。具体地,图2A是示出了用于生成如可以通过图1A示出的系统20实现的更改/细分用户输入高速缓冲存储器的示例性处理40的流程图。在方框41处,可以使用会话语法分析器从会话数据中生成初始更改/细分高速缓冲存储器。注意,会话数据可以包括在每个给定用户输入或查询会话中的查询历史。然后,过程40进入包括方框43~48的循环,该循环针对在方框42中的预定数量的最普通用户输入中的每一个,例如,查询。具体地,在方框43处,过程对高速缓冲存储器中的建议的更改/细分查询执行查找。在方框43处的查找可以生成建议1、2、...M。
更改/细分高速缓冲存储器中的每个用户输入或查询项可以包含一列预定数量N个的建议查询。因此,为生成建议M+1、M+2...N,即,为填补每个查询的建议查询列,还可以执行方框44~47。具体地,在方框44和45处,可以(理论上地)构建扩展查询网格,以生成附加的建议的更改/细分(可选)查询。方框44通常表示词语替代查询更改/细分方法,而方框45通常表示扩展/缩略查询更改/细分方法。具体地,在方框44处,可以使用相似词语的相似矩阵用相似词语替代原始查询中的词语来创建扩展查询网格。词语替代用相似字或词语替代原始查询中的字或词语(包括短语词)。相似词语可包括同义字或近义字(例如,社区和相邻区域)、缩写词、和/或在相同语法/语义类别中的词语(例如,Toyota和Honda、Dell和HP、DVD和数码相机、以及Nokia和Motorola)。
在方框45处,可以通过使用复合字对的扩展/缩略表在原始查询中添加/删除词语来附加地和/或选择性地构建扩展查询网格。具体地,扩展/缩略表中的每一项都是一个复合字对,其中,一个复合字是另一个的子串,例如,T1T2<=>T1T2T3,以及T4T5T6<=>T4T5。汉语复合字对的实例包括上海和上海市以及电视和电视机。复合字对可以包括多义词语和它们明确的上下文(例如,Amazon和Amazon rain forest和/或Amazon.com)、概念及其细分(例如,cell和stem cell和/或cell phone)、词语及其属性(例如,计算机和存储器、硬盘驱动器、和/或DVD驱动器)、以及名称(例如,人名、公司名称等)和他们对应的活动性、工作、产品等(例如,诸如TomHanks和Forrest Gump的演员-电影、诸如Apple和iPod的公司-产品、如Bill Gates和Microsoft或CEO的法人-公司或头衔、作者-书、歌手-歌曲等)。
在构建了包含多种可选路径的扩展查询网格之后,在方框46处,对于扩展查询网格中预定数量的最佳查询的路径和分数被识别为潜在建议的查询。在方框47处,计算原始普通用户查询的分数,使得仅提供其分数至少是那个原始普通用户查询分数的潜在建议的查询,作为建议的更改/细分查询。分数可以表示作为由用户选择或期望的查询的给定查询(原始或潜在建议的查询)的似然。可以仅提供其分数至少是原始普通用户查询分数的查询,作为建议的更改/细分查询来填充更改/细分高速缓冲存储器的建议列表项。可以将生成的建议的查询存储到预计算的更改/细分查询高速缓冲存储器。注意,过程40或包括方框42~49的循环可以周期性重复,以更新更改/细分高速缓冲存储器。
图2B是示出用于生成如可以由图1A所示的系统实现的诸如用户查询的建议的更改/细分用户输入的示例性过程50的流程图。在方框51处,接收诸如用户查询的用户输入。在判断框52处,可以将在方框51接收的原始用户输入与在可选的预计算的更改/细分高速缓冲存储器中的项进行比较。如果在判断框52处确定原始用户查询处于建议/细分高速缓冲存储器中,则在方框53,由来自预计算的更改/细分高速缓冲存储器的多至N个预计算查询建议至少部分地填充大小为N的查询建议列表。如果如在判断框54处确定的建议列表被填满,则过程50完成。注意,建议列表可以具有预定大小N,例如,10个建议或单个最佳建议。可选地,如果如在判断框54处确定的建议列表未被填满,则过程50继续执行方框55和56。类似地,如果在判断框52处原始用户查询确定未处于建议/细分高速缓冲存储器中,则过程也继续执行方框55和56。注意,参照图2A,方框55~58类似于如上所述的过程40的方框44~47。因此,为了清楚,某种程度上它们是相似的描述将不在这里重复。
在方框55和56处,(概念上)构建扩展查询网格来生成建议的更改/细分(可选)查询。在构建包含多个可选路径的扩展查询网格之后,在方框57处,对于扩展查询网格中预定数量的最佳查询的路径和分数被识别为潜在建议查询。在方框58处,计算原始用户查询的分数,使得仅提供其分数至少是原始用户查询的分数的潜在建议查询,作为建议的更改/细分查询。其分数至少是原始用户查询的分数的查询可以被提供给用户,作为建议的更改/细分查询来填充建议列表或建议列表的剩余部分。尽管未示出,可以可选地提供单个最佳查询。此外,可以将原始用户查询和生成的建议查询附加地存储到预计算的更改/细分查询高速缓冲存储器。
下面将更详细地描述如上面参照图2A和图2B示出并描述的用于生成建议的更改/细分用户输入的过程40和50的各个方框。
图3示出示例性的扩展查询网格示意图。如图所示,原始查询可以包括多个核心字或词语T1、T2、T3、T4,以及非核心字或词语s1、s2、s3。例如,在汉语查询“新浪的URL”中,核心词语或项是“新浪”而不是“URL”。非核心术语通常还包括无用字。无用字通常被定义为在诸如网络语料库的语料库中的30个最频繁出现的汉语字或100个最频繁出现的英文字。
在识别原始查询的核心项之后,可以应用一个或多个查询更改或细分方法(例如,词语替代和/或扩展/缩略)来构建扩展查询网格。如上所述注意,词语替代是指替代与核心项类似(例如,同义字或近义字)并可以使用诸如相似矩阵来识别的字和/或词语。仅为了示例性的目的,图3示出可以通过用词语T1’或T1”来替代词语T1和/或用词语T4’替代词语T4来构建扩展查询网格。
同样如上所注意的,扩展/缩略是指利用诸如复合字的扩展/缩略表来将核心项添加到原始查询中和/或从原始查询中删除一些核心项。仅为示例性的目的,复合字的扩展/缩略表可以包括复合字对T1T2和T1T2T5的表项,以使图3的原始查询中的复合字T1T2可以用复合字T1T2T5(即,添加新词语T5)替代,从而进一步构建扩展查询网格。类似地,复合字的扩展/缩略表还可以包括对于复合字对T2T3T4和T3T4的表项,以使图3的原始查询中的复合字T2T3T4可以用复合字T3T4(即,删除核心项T2)替代,从而进一步构建扩展查询网格。
参照图4至图7,更详细地描述用于生成相似词语的相似矩阵的一种示例性的方法。图4是示出用于通过替代查询词语来构建在生成建议的更改/细分查询中使用的相似矩阵的示例性过程60的流程图。相似矩阵可以是在每对字或术语w之间分布字相似性的矩阵。可以通过构建对于在诸如网页的语料库中的每个字w的特征向量、并确定在每个对字的每个字之间的相似性作为其对应特征向量之间角的余弦来获得分布字相似性。字或词语的特征向量可以包括所有出现的字或词语的周围字(surrounding word)。
尽管可以类似地采用各种其它特征向量和相似矩阵构建方法,但参照图4示出了构建特征向量和相似矩阵的一个实例。具体地,在方框62处,语料库(例如,网络语料库)中的每个字/词语的特征向量与特征向量中对于每个特征f的计数一起被构建。字/词语w的特征可以包括在字/词语w之前和之后直到第一个无用字出现的多个字。仅为示例性目的,对于给出的句子“Because communitiesassess at different percentages of fair market value,the only way toimprove tax rates among communities is by using equalized rates,”,在图5的表中列出了特征字communities及其对应的共同出现计数。注意,在具有不同形式的给定字(例如,诸如“community”和“communities”的单数或复数、或诸如“walk”、“walking”、和“walked”的不同时态)的语言中,系统可以将不同形式的字视为单个字,但通常是相似词语。这种不同形式的给定字的处理将与不具有这种区别的语言无关(例如,通常在例如汉语的情况下)。此外,还注意到,具有前缀“L:”或“R:”的特征分别是表示字w的左侧或右侧的字。在该实施例中,在字w的给定情况的左侧和右侧中的每一个上的一个或多个特征的计数和是1。例如,在字“communities”的第一种情况中,左侧和右侧特征中的每一个都被分配为计数1。此外,当在字“communities”附近存在一个或多个无用字(例如,“between”、“is”、和“by”)时,字“communities”的给定情况的每一侧的特征计数可被平分,从而,被计算为小数。在字“communities”的第二种情况中,存在两个左侧特征,使得为每个左侧特征分配计数0.5。类似地,在字“communities”的第二种情况中,存在两个右侧特征,使得为每个右侧特征分配计数0.33。
再次参照图4,在方框64处,特征向量中的每个特征f的值可以被确定为在字w和特征f之间的点态(point-wise)交互信息MI。使用点态交互信息MI的值,这是因为虽然频繁出现的字(例如,无用字)容易具有较高计数,但这种字常常是无意义的。因此,因为特征计数可能不是重要特征较好的指示符,所以字w和特征f之间的点态交互信息MI(w,f)可被用作特征f的值。点态交互信息MI(w,f)可以被定义为w和f的有效联合概率P(w,f)、以及w的期望概率P(w)、和f的期望概率P(f)之间的对数比,如果他们是相互独立的,则共同存在:
其中,可以使用诸如语料库中的其各自概率来确定特征概率P(f)和字概率P(w)(例如,相对频率)。仅作为实例,图6是列出了对于从网络语料库中生成的词语“communities”的示例性特征和相应概率的表。图6中示出的特征向量表列出了字“communities”的特征子集以及特征与字“communities”之间的概率和交互信息。注意,特征向量可能相当大。例如,从语料库中提取的字communities的全部特征集包括大约2000项。
再次参照图4,在方框66处,将使用特征向量中的特征值,将两个字或短语w1和w2之间的相似性测量值或值sim确定为其特征向量之间角的余弦。具体地,两个术语或字w1和w2之间的相似性sim可以被定义为:
其中,w1和w2的特征向量分别由(f11,f12...,f1n)和(f21,f22...,f2n)表示。
然后,在方框68处,根据对于词语的每个字对的相似值构建相似矩阵,并可以通过用相似词语替代查询词语来生成建议的更改/细分查询。具体地,例如,相似值可用于确定潜在建议查询的分数。注意,可周期性地重新计算相似矩阵,和/或可以将词语的相似值(例如,新近识别的那些词语)添加到矩阵。图7是用于代替词语以生成建议的更改/细分查询的示例性的相似矩阵。
现在,将参照图8至图11更详细地描述用于生成在应用现存的词语替代查询更改/细分方法中使用的相似矩阵的示例性方法、用于生成在应用扩展/缩略查询更改/细分方法中使用的复合字对的扩展/缩略表的示例性方法。图8是示出用于构建复合字对的提取/缩略表的示例性过程70的流程图。如上所述注意,扩展/缩略表中的每项都是一对复合字,该复合字对中,一个复合字是另一个的子串,使得如果查询包含扩展/缩略表的项中复合字对中的一个复合字,则该复合字可以被在延伸的网格中的复合字对项中的其它复合字替代。理想地,提取/缩略表中的每个复合字都应当是有意义的短语。仅作为实例,复合字对可以是上海和上海市,或者电视和电视机。如上所注意的,复合字对可以包括,例如,多义词语及其清晰的上下文(例如,Amazon和Amazon rain forest)、人名及其对应的活动、词语的属性、概念的细分、演员、作者、产品、法人地位等。
在方框71处,查询日志(或用户输入的另一数据库)中的查询可以被分割成使查询的全部概率最大化的字序列。具体地,因为汉字并不需要用空格或其它分隔符明确地描述,使得查询可以是没有分隔符的汉语字符串,所以分割器可以用于将字符序列分割成字序列。字序列可以使字概率的积是所有可能字符序列段中的最大序列。显然,不需要对在相邻字之间存在清晰描述的某种语言(例如,英语)执行方框71。
在方框72处,为了识别复合字/短语,识别常用字序列或n元(gram)(n个序列的序列)。同样在方框72处,对字序列中所有相邻字对是常用n元的字序列进行计数,以识别任意长度的常用字序列。注意,常用字序列可以是或者不是复合字。例如,某些常用字序列可以是复合字,而其它字序列可以是非短语或非复合字序列。
在方框73处,通过需要复合字/短语在最少数量查询的开始以及结尾处出现,来识别非短语序列(但在相同的查询中不是必须的)。查询的最小数量可以是大于或等于1的任意数,但通常远大于1,例如,50或100。
在方框74处,对于语料库(例如,网络语料库)中的每个n元特征向量,与对于特征向量中的每个特征f的计数一起构建。在方框75处,特征向量中的每个特征f的值可以被确定为在n元和特征f之间的点态交互信息MI。在方框76处,可以利用特征向量中的特征值,将两个n元之间的相似测量值或值sim确定为其特征向量之间角的余弦。注意,方框74、75、和76分别类似于如参照图4描述的过程60的方框62、64、和66。因此,为了清楚目的,这里将不被重复描述在某种程度上与它们类似的描述。
然后,在方框77处,扩展/缩略表可被构建为复合字对,在该复合字对中,一个复合字是另一个复合字的子串。此外,还可以确定多个复合字的计数并将其存储在扩展/缩略表中。
图9是示出在替代查询中的复合字以生成建议的更改/细分查询中的扩展/缩略表中的一些示例性项的表格。如图所示,扩展/缩略表的每一行都包含两个复合字或字序列,其中,一个复合字是另一个复合字的子串。例如,每个复合字还与一个计数(或其它频率值)相关,该计数可以根据查询日志或一些其它用户输入数据库来确定。计数可被用作取舍点(cut off)以降低数据库的大小,和/或例如,通过使用log(计数)可以至少部分地用来确定词语或复合字的权重。如上所述,参照图2A和2B,一旦通过替换原始查询中的词语和/或通过添加/删除原始查询中的词语来延伸查询网格,则根据扩充网格来确定N个最佳查询的路径和分数,作为潜在建议查询。图10是示出了用于确定建议的更改/细分查询的分数(例如,扩充查询网格中的路径)的示例性过程80的流程图。
查询建议的确定可被视为在当前查询会话中基于在先查询的预测问题。给定当前搜索会话中的查询历史Q1、Q2,...,Qn-1,可以进行关于用户最可能选择的下一查询Qn是什么的预测。建议或预测的下一查询Qn应当不仅与当前会话中的查询历史Q1、Q2,...,Qn-1关联,还应当产生好的搜索结果。例如,搜索结果有多好的测量值可以是单击位置(用户选择的搜索结果的位置)和单击持续时间(用户停留在所选的搜索结果页面多长时间)的函数。
在一个实施例中,每个潜在建议查询的分数可以被确定为目标函数F的值:
F(Q,Q1,...,Qn-1)=Rel(Q,Q1,...,Qn-1)*Click(Q)*Position(Q);
其中,
Rel(Q,Q1,...,Qn-1)是查询历史Q1、Q2,...,Qn-1和候选建议查询Q之间的关联性;
Click(Q)是用户将选择候选建议查询Q的概率;以及
Position(Q)是将要被单击的候选建议查询Q的搜索结果的位置。
如上参照图2所述,一个或多个建议或预测的下一查询Q可以被提供给用户。因此,最佳的N个建议下一查询(例如,扩充查询网格中的路径)是具有最高目标函数值的N个查询,且最佳(例如,最可能的)的建议下一查询可以被表示为使目标函数F的值最大化的查询:
Qn=ArgMax_Q{F(Q,Q1,...,Qn-1)}
在图10的流程图中示出了每个潜在建议或预测的下一查询Q80的分数的确定。在方框82中,利用查询中的调整词语的相关性来确定当前会话中的用户查询历史Q1、Q2,...,Qn-1和预测的查询Q之间的关联性Rel(Q,Q1,...Qn-1)。具体地,为了估计关联函数Rel,识别原始查询Q中的词语或核心项。利用核心项之间的相关性,能够从其核心项的相关性中推导出两个查询Q和Q’之间的关联性Rel(Q,Q’)。具体地,关联性Rel(Q,Q’)可以被表示为:
Rel(Q,Q′)=Max_f Prod_{i=1}^k Cor(Ti,Ti′)*w(Ti)
其中:
调整函数(alignment function)f=f(T1,T2,...Tk,T1’,T2’,...,Tk’)进行与相关查询Q和Q’的词语映射,例如,图11中示出的实例,在{T1,...,Tk,e}和{T1’,...,Tk’,e}之间的映射;
Cor(Ti,Ti’)是词语Ti,Ti’之间的相关性,且是实数向量;
Q=T1,T2,...,Tk(在任意词语Ti都可以是空词语e的查询Q中的核心项);
Q’=T1’,T2’,...Tk’(在任意词语Ti’都可以是空词语e的查询Q’中的核心项);以及
w(Ti)是词语Ti的重要度,例如,Ti的TF/IDF,其中,TF表示词语频率(例如,词语的计数)以及IDF表示反向(inverted)文档频率。
接下来,在方框84处,例如,根据单击持续时间或归一化的单击持续时间来确定用户将选择查询Q的概率Click(Q)。在方框86处,例如,根据单击位置、归一化的单击位置、或反向单击位置来确定预测查询Q的位置的分数Position(Q)。最后,在方框88处,根据如上所述的方框82、方框84、和方框86的结果来确定潜在建议或预测的下一查询Q的目标函数F的值。
参照图12,更详细地描述在确定两个查询之间的关联性中使用的相关值Cor(Ti,Ti’)的确定。具体地,图12是示出用于生成词语对或核心项T、T’之间的相关值的示例性过程90的流程图。在方框92处,可以使用交互信息从语料库(例如,网络语料库)和用户查询中识别出新的核心项。在方框92的一个示意性实施中,如果Motorola是一个项,且“Motorola Announced”、“Motorola cellphone”、和“buy Motorola”以及“Nokia Announced”、“Nokia cellphone”、和“buy Nokia”处于语料库中,则Nokia也被识别为一个项。注意,尽管现用的字典能够提供传统的核心项,但许多新的核心项常常被引入到词汇表中。新核心项的实例包括恰当的名称(例如,人名和公司名),以及多种其它新词和短语(例如,产品模型、电影、和歌曲名等)。
在方框94处,例如,可以使用查询日志、网页和链接锚文本来确定核心项对T、T’之间的相关值。两个核心项T1和T2之间的相关性可以被定义为实数向量的函数:
Cor(T1,T2)=f(w1,w2,...,wn)
其中,w1,w2,...,wn是某些预定关系的权重。预定关系的实例包括(1)同义词、缩写词和反义词,(2)复合短语,例如,上海对应上海市、电视对应电视机,(3)相同语法/语义类中的词语,例如,Toyota和Honda,(4)多义词语及其清楚的上下文,(5)人名及其相应的活动,例如,Oprah和现场访谈主持人,(6)词语的属性,例如,计算机和存储器,(7)概念的细分,例如,Amazon和Amazon River、Amazon Rain Forrest、和Amazon.com,(8)电影-演员、书-作者、公司-产品、人-职位等,例如,Tom Hanks和ForrestGump、以及Bill Gates和CEO。
在方框96中,相关向量Cor(T1,T2)的值可以被归一化为[0-1]。
用于生成更改或细分用户输入的系统和方法可以建议多个查询,该查询可能被用户使用和/或生成用户可能选择的最佳结果。该系统和方法定量地测量两个查询之间的相关性。显然,两个查询不需要具有任何共同的词语或一致的同义词。例如,与原始查询(例如,汉语)有关的查询,对于歌曲“Now and Forever”的mp3文件“‘Now and Forever’mp3”,可以包括例如“CoCo Lee”(歌手)以及相同艺术家的其它歌曲或唱片集。因此,建议的查询可以不是简单的原始查询的扩展而是具有更好搜索结果(例如,用户最可能选择的搜索结果)的查询。在一个实例中,建议的查询可以包括实现消除了查询意义多义性的查询,其中,原始查询是简短且多义的。作为另一个实例,建议的查询可以包括将原始查询分成多个较短查询的查询,其中,原始查询可以是较长和/或包含彼此独立的词语。
虽然本文描述和示出了本发明的多个示例性实施例,但应当理解,仅在不背离本发明的精神和范围内,对其进行示出和更改。因此,本发明的范围将仅根据下列可被修改的权利要求来限定,其中,每个权利要求都与作为本发明的一个实施例的本“具体实施方式”明确相结合。
Claims (29)
1.一种用于建议可选用户输入的方法,包括:
接收原始用户输入,所述输入具有至少一个核心词语;
识别所述原始用户输入中的所述至少一个核心词语;
通过执行以下的至少一项来确定至少一个潜在可选用户输入:(a)根据相似矩阵用另一词语替代所述原始用户输入中的至少一个核心词语,所述相似矩阵具有所述两个词语之间的相似值,以及(b)根据扩展/缩略表用另一个字序列来代替所述原始用户输入中的字序列,一个序列是另一个序列的子串,所述扩展/缩略表具有与词语序列相关的频率值;
计算所述潜在可选用户输入的似然;以及
根据预定标准从所述至少一个潜在可选用户输入中选择一个或多个最可能的可选用户输入。
2.根据权利要求1所述的方法,其中,用于选择所述一个或多个最可能的可选用户输入的所述预定标准包括所述选取的可选用户输入的所述似然至少为所述原始用户输入的所述似然。
3.根据权利要求1所述的方法,其中,所述原始用户输入是原始用户搜索查询。
4.根据权利要求1所述的方法,其中,所述原始用户输入是基于非罗马语系的语言。
5.根据权利要求1所述的方法,还包括:
确定所述原始用户输入是否存在于建议的可选用户输入的预计算高速缓冲存储器中;以及
一旦确定所述原始用户输入存在于所述预计算高速缓冲存储器中,则输出存储在所述预计算高速缓冲存储器中的所述预计算的最可能的可选用户输入中的至少一个。
6.根据权利要求1所述的方法,其中,根据语料库、用户输入日志、以及用户会话数据中的至少一个来生成所述相似矩阵。
7.根据权利要求6所述的方法,其中,通过构建在所述语料库中的字的特征向量以及利用其特征向量确定两个字之间的相似值来生成所述相似矩阵。
8.根据权利要求1所述的方法,其中,根据用户输入日志和用户输入数据库中的至少一个来生成所述扩展/缩略表。
9.根据权利要求8所述的方法,其中,通过确定常用字序列、滤出非短语字序列、以及使计数与词语序列相关以作为频率值来生成所述扩展/缩略表。
10.根据权利要求1所述的方法,其中,计算所述潜在可选用户输入的所述似然包括确定以下中的至少一项:(a)在所述原始用户输入和所述潜在可选用户输入之间的关联性,(b)将由所述用户选择的所述潜在可选用户输入的概率,以及(c)所述潜在可选用户输入的所述位置的分数。
11.根据权利要求10所述的方法,其中,利用所述原始输入和所述潜在可选用户输入的调整词语之间的相关值来确定所述原始用户输入和所述潜在可选用户输入之间的所述关联性。
12.一种用于建议可选用户输入的系统,包括:
建议/细分服务器,被配置为接收具有至少一个核心词语的原始用户输入,识别在所述原始用户输入中的所述至少一个核心词语;用于通过执行以下的至少一项来确定至少一个潜在可选用户输入:(a)根据相似矩阵用另一词语替代所述原始用户输入中的至少一个核心词语,所述相似矩阵具有所述两个词语之间的相似值,以及(b)根据扩展/缩略表用另一个字序列代替所述原始用户输入中的字序列,一个序列是另一个序列的子串,所述扩展/缩略表具有与词语序列相关的频率值,计算所述潜在可选用户输入的似然,以及根据预定标准从所述至少一个潜在可选用户输入中选择和输出一个或多个最可能的可选用户输入。
13.根据权利要求12所述的系统,其中,所述原始用户输入是原始用户搜索查询。
14.根据权利要求12所述的系统,其中,所述原始用户输入是基于非罗马语系的语言。
15.根据权利要求12所述的系统,还包括建议可选用户输入的预计算高速缓冲存储器,其中,所述建议/细分服务器还被配置为确定所述原始用户输入是否存在于所述预计算高速缓冲存储器中,以及一旦确定所述原始用户输入存在于所述预计算高速缓冲存储器中,则输出存储在所述预计算高速缓冲存储器中的预计算的最可能的可选用户输入。
16.根据权利要求12所述的系统,还包括语料库、用户输入日志、以及用户会话数据中的至少一个,其中,使用所述语料库、所述用户输入日志、和用户会话数据中的至少一个来生成所述相似矩阵。
17.根据权利要求16所述的系统,其中,所述建议/细分服务器还被配置为通过构建在所述语料库中的字的特征向量以及利用其特征向量确定两个字之间的相似值来生成所述相似矩阵。
18.根据权利要求12所述的系统,还包括用户输入日志和用户输入数据库中的至少一个,其中,所述建议/细分服务器还被配置为根据所述用户输入日志和所述用户输入数据库中的至少一个来生成所述扩展/缩略表。
19.根据权利要求18所述的系统,其中,所述建议/细分服务器还被配置为通过确定常用字序列、滤出非短语字序列、以及使计数与每个词语序列相关以作为所述频率值来生成所述扩展/缩略表。
20.根据权利要求12所述的系统,其中,所述建议/细分服务器还被配置为通过确定以下中的至少一项来计算所述潜在可选用户输入的所述似然:(a)在所述原始用户输入和所述潜在可选用户输入之间的关联性,(b)将由所述用户选择的所述潜在可选用户输入的概率,以及(c)所述潜在可选用户输入的所述位置的分数。
21.根据权利要求20所述的系统,其中,所述建议/细分服务器还被配置为通过使用所述原始输入和所述潜在可选用户输入的调整词语之间的相关值来确定所述原始用户输入和所述潜在可选用户输入之间的所述关联性。
22.一种用于与计算机系统一起使用的计算机程序产品,所述计算机程序产品包括在其上存储在计算机处理器上可执行的指令的计算机可读存储介质,所述指令包括:
接收原始用户输入,所述输入具有至少一个核心词语;
识别所述原始用户输入中的所述至少一个核心词语;
通过执行以下的至少一项来确定至少一个潜在可选用户输入:(a)根据相似矩阵用另一词语替代所述原始用户输入中的至少一个核心词语,所述相似矩阵具有所述两个词语之间的相似值,以及(b)根据扩展/缩略表用另一个字序列代替所述原始用户输入中的字序列,一个序列是另一个序列的子串,所述扩展/缩略表具有与每个词语序列相关的频率值;
计算所述潜在可选用户输入的似然;以及
根据预定标准从所述至少一个潜在可选用户输入中选择一个或多个最可能的可选用户输入。
23.根据权利要求22所述的计算机程序产品,所述指令还包括:
确定所述原始用户是否存在于建议的可选用户输入的预计算高速缓冲存储器中;以及
一旦确定所述原始用户输入存在于所述预计算高速缓冲存储器中,则输出存储在所述预计算高速缓冲存储器中的预计算的最可能的可选用户输入。
24.根据权利要求22所述的计算机程序产品,其中,根据语料库、用户输入日志、以及用户会话数据中的至少一个生成所述相似矩阵。
25.根据权利要求24所述的计算机程序产品,其中,通过构建在所述语料库中的字的特征向量以及利用其特征向量确定两个字之间的相似值来生成所述相似矩阵。
26.根据权利要求22所述的计算机程序产品,其中,根据用户输入日志和用户输入数据库中的至少一个来生成所述扩展/缩略表。
27.根据权利要求26所述的计算机程序产品,其中,通过确定常用字序列、滤出非短语字序列、以及使计数与每个词语序列相关以作为所述频率值来生成所述扩展/缩略表。
28.根据权利要求22所述的计算机程序产品,其中,计算所述潜在可选用户输入的所述似然包括确定以下中的至少一项:(a)在所述原始用户输入和所述潜在可选用户输入之间的关联性,(b)将由所述用户选择的所述潜在可选用户输入的概率,以及(c)所述潜在可选用户输入的所述位置的分数。
29.根据权利要求28所述的计算机程序产品,其中,使用所述原始输入和所述潜在可选用户输入的调整词语之间的相关值来确定所述原始用户输入和所述潜在可选用户输入之间的所述关联性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210199408.7A CN102945237B (zh) | 2005-05-04 | 2006-05-04 | 基于原始用户输入建议和细分用户输入的系统和方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/122,873 | 2005-05-04 | ||
US11/122,873 US8438142B2 (en) | 2005-05-04 | 2005-05-04 | Suggesting and refining user input based on original user input |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210199408.7A Division CN102945237B (zh) | 2005-05-04 | 2006-05-04 | 基于原始用户输入建议和细分用户输入的系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101297291A true CN101297291A (zh) | 2008-10-29 |
Family
ID=36781555
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210199408.7A Active CN102945237B (zh) | 2005-05-04 | 2006-05-04 | 基于原始用户输入建议和细分用户输入的系统和方法 |
CNA2006800219402A Pending CN101297291A (zh) | 2005-05-04 | 2006-05-04 | 基于原始用户输入建议和细分用户输入 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210199408.7A Active CN102945237B (zh) | 2005-05-04 | 2006-05-04 | 基于原始用户输入建议和细分用户输入的系统和方法 |
Country Status (6)
Country | Link |
---|---|
US (3) | US8438142B2 (zh) |
EP (1) | EP1877939A1 (zh) |
JP (1) | JP5203934B2 (zh) |
KR (1) | KR101389148B1 (zh) |
CN (2) | CN102945237B (zh) |
WO (1) | WO2006121702A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385577A (zh) * | 2010-08-27 | 2012-03-21 | 腾讯科技(深圳)有限公司 | 搜索方法和系统 |
CN102419776A (zh) * | 2011-12-31 | 2012-04-18 | 北京百度网讯科技有限公司 | 一种满足用户多维度搜索需求的方法和设备 |
CN103180849A (zh) * | 2010-10-21 | 2013-06-26 | 惠普发展公司,有限责任合伙企业 | 使用移动计算装置搜索多数据源 |
CN103577401A (zh) * | 2012-07-18 | 2014-02-12 | 腾讯科技(深圳)有限公司 | 一种移动终端搜索方法及系统 |
CN103577416A (zh) * | 2012-07-20 | 2014-02-12 | 阿里巴巴集团控股有限公司 | 扩展查询方法及系统 |
CN103814375A (zh) * | 2011-09-29 | 2014-05-21 | 乐天株式会社 | 信息处理装置、信息处理方法、信息处理装置用程序、以及记录介质 |
CN104246756A (zh) * | 2012-02-22 | 2014-12-24 | 诺基亚公司 | 用于提供用于控制系统的预测的系统和方法 |
CN104246757A (zh) * | 2012-02-22 | 2014-12-24 | 诺基亚公司 | 预测性服务访问 |
CN104462595A (zh) * | 2014-12-29 | 2015-03-25 | 北京奇虎科技有限公司 | 搜索引擎系统及在搜索结果项中嵌入多媒体元素的方法 |
CN106126758A (zh) * | 2016-08-30 | 2016-11-16 | 程传旭 | 用于信息处理和信息评估的云系统 |
Families Citing this family (206)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8590013B2 (en) | 2002-02-25 | 2013-11-19 | C. S. Lee Crawford | Method of managing and communicating data pertaining to software applications for processor-based devices comprising wireless communication circuitry |
US7346839B2 (en) | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US8612208B2 (en) | 2004-04-07 | 2013-12-17 | Oracle Otc Subsidiary Llc | Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query |
US8082264B2 (en) * | 2004-04-07 | 2011-12-20 | Inquira, Inc. | Automated scheme for identifying user intent in real-time |
US7747601B2 (en) | 2006-08-14 | 2010-06-29 | Inquira, Inc. | Method and apparatus for identifying and classifying query intent |
US7865495B1 (en) * | 2004-10-06 | 2011-01-04 | Shopzilla, Inc. | Word deletion for searches |
US8438142B2 (en) | 2005-05-04 | 2013-05-07 | Google Inc. | Suggesting and refining user input based on original user input |
US7647312B2 (en) * | 2005-05-12 | 2010-01-12 | Microsoft Corporation | System and method for automatic generation of suggested inline search terms |
US7634462B2 (en) * | 2005-08-10 | 2009-12-15 | Yahoo! Inc. | System and method for determining alternate search queries |
US7752220B2 (en) * | 2005-08-10 | 2010-07-06 | Yahoo! Inc. | Alternative search query processing in a term bidding system |
US8290810B2 (en) | 2005-09-14 | 2012-10-16 | Jumptap, Inc. | Realtime surveying within mobile sponsored content |
US8195133B2 (en) | 2005-09-14 | 2012-06-05 | Jumptap, Inc. | Mobile dynamic advertisement creation and placement |
US7577665B2 (en) | 2005-09-14 | 2009-08-18 | Jumptap, Inc. | User characteristic influenced search results |
US7676394B2 (en) | 2005-09-14 | 2010-03-09 | Jumptap, Inc. | Dynamic bidding and expected value |
US8819659B2 (en) | 2005-09-14 | 2014-08-26 | Millennial Media, Inc. | Mobile search service instant activation |
US9076175B2 (en) | 2005-09-14 | 2015-07-07 | Millennial Media, Inc. | Mobile comparison shopping |
US7660581B2 (en) | 2005-09-14 | 2010-02-09 | Jumptap, Inc. | Managing sponsored content based on usage history |
US7860871B2 (en) | 2005-09-14 | 2010-12-28 | Jumptap, Inc. | User history influenced search results |
US7752209B2 (en) | 2005-09-14 | 2010-07-06 | Jumptap, Inc. | Presenting sponsored content on a mobile communication facility |
US8156128B2 (en) | 2005-09-14 | 2012-04-10 | Jumptap, Inc. | Contextual mobile content placement on a mobile communication facility |
US8311888B2 (en) | 2005-09-14 | 2012-11-13 | Jumptap, Inc. | Revenue models associated with syndication of a behavioral profile using a monetization platform |
US8615719B2 (en) | 2005-09-14 | 2013-12-24 | Jumptap, Inc. | Managing sponsored content for delivery to mobile communication facilities |
US8364521B2 (en) | 2005-09-14 | 2013-01-29 | Jumptap, Inc. | Rendering targeted advertisement on mobile communication facilities |
US8666376B2 (en) | 2005-09-14 | 2014-03-04 | Millennial Media | Location based mobile shopping affinity program |
US7702318B2 (en) | 2005-09-14 | 2010-04-20 | Jumptap, Inc. | Presentation of sponsored content based on mobile transaction event |
US8688671B2 (en) | 2005-09-14 | 2014-04-01 | Millennial Media | Managing sponsored content based on geographic region |
US8209344B2 (en) | 2005-09-14 | 2012-06-26 | Jumptap, Inc. | Embedding sponsored content in mobile applications |
US10592930B2 (en) | 2005-09-14 | 2020-03-17 | Millenial Media, LLC | Syndication of a behavioral profile using a monetization platform |
US8660891B2 (en) | 2005-11-01 | 2014-02-25 | Millennial Media | Interactive mobile advertisement banners |
US9703892B2 (en) | 2005-09-14 | 2017-07-11 | Millennial Media Llc | Predictive text completion for a mobile communication facility |
US10911894B2 (en) | 2005-09-14 | 2021-02-02 | Verizon Media Inc. | Use of dynamic content generation parameters based on previous performance of those parameters |
US9471925B2 (en) | 2005-09-14 | 2016-10-18 | Millennial Media Llc | Increasing mobile interactivity |
US20110313853A1 (en) | 2005-09-14 | 2011-12-22 | Jorey Ramer | System for targeting advertising content to a plurality of mobile communication facilities |
US10038756B2 (en) | 2005-09-14 | 2018-07-31 | Millenial Media LLC | Managing sponsored content based on device characteristics |
US8229914B2 (en) | 2005-09-14 | 2012-07-24 | Jumptap, Inc. | Mobile content spidering and compatibility determination |
US8532633B2 (en) | 2005-09-14 | 2013-09-10 | Jumptap, Inc. | System for targeting advertising content to a plurality of mobile communication facilities |
US8832100B2 (en) | 2005-09-14 | 2014-09-09 | Millennial Media, Inc. | User transaction history influenced search results |
US20070198485A1 (en) * | 2005-09-14 | 2007-08-23 | Jorey Ramer | Mobile search service discovery |
US7769764B2 (en) | 2005-09-14 | 2010-08-03 | Jumptap, Inc. | Mobile advertisement syndication |
US9201979B2 (en) | 2005-09-14 | 2015-12-01 | Millennial Media, Inc. | Syndication of a behavioral profile associated with an availability condition using a monetization platform |
US8027879B2 (en) | 2005-11-05 | 2011-09-27 | Jumptap, Inc. | Exclusivity bidding for mobile sponsored content |
US8131271B2 (en) | 2005-11-05 | 2012-03-06 | Jumptap, Inc. | Categorization of a mobile user profile based on browse behavior |
US8302030B2 (en) | 2005-09-14 | 2012-10-30 | Jumptap, Inc. | Management of multiple advertising inventories using a monetization platform |
US8103545B2 (en) | 2005-09-14 | 2012-01-24 | Jumptap, Inc. | Managing payment for sponsored content presented to mobile communication facilities |
US9058406B2 (en) | 2005-09-14 | 2015-06-16 | Millennial Media, Inc. | Management of multiple advertising inventories using a monetization platform |
US7912458B2 (en) | 2005-09-14 | 2011-03-22 | Jumptap, Inc. | Interaction analysis and prioritization of mobile content |
US8805339B2 (en) | 2005-09-14 | 2014-08-12 | Millennial Media, Inc. | Categorization of a mobile user profile based on browse and viewing behavior |
US8238888B2 (en) | 2006-09-13 | 2012-08-07 | Jumptap, Inc. | Methods and systems for mobile coupon placement |
US8989718B2 (en) | 2005-09-14 | 2015-03-24 | Millennial Media, Inc. | Idle screen advertising |
US8503995B2 (en) | 2005-09-14 | 2013-08-06 | Jumptap, Inc. | Mobile dynamic advertisement creation and placement |
US8364540B2 (en) | 2005-09-14 | 2013-01-29 | Jumptap, Inc. | Contextual targeting of content using a monetization platform |
US8812526B2 (en) | 2005-09-14 | 2014-08-19 | Millennial Media, Inc. | Mobile content cross-inventory yield optimization |
US8312021B2 (en) * | 2005-09-16 | 2012-11-13 | Palo Alto Research Center Incorporated | Generalized latent semantic analysis |
US8175585B2 (en) | 2005-11-05 | 2012-05-08 | Jumptap, Inc. | System for targeting advertising content to a plurality of mobile communication facilities |
US8571999B2 (en) | 2005-11-14 | 2013-10-29 | C. S. Lee Crawford | Method of conducting operations for a social network application including activity list generation |
US8903810B2 (en) | 2005-12-05 | 2014-12-02 | Collarity, Inc. | Techniques for ranking search results |
US8429184B2 (en) | 2005-12-05 | 2013-04-23 | Collarity Inc. | Generation of refinement terms for search queries |
US20080126079A1 (en) * | 2006-01-20 | 2008-05-29 | Research In Motion Limited | Handheld electronic device with automatic text generation |
US7676460B2 (en) * | 2006-03-03 | 2010-03-09 | International Business Machines Corporation | Techniques for providing suggestions for creating a search query |
US7921099B2 (en) * | 2006-05-10 | 2011-04-05 | Inquira, Inc. | Guided navigation system |
US8781813B2 (en) | 2006-08-14 | 2014-07-15 | Oracle Otc Subsidiary Llc | Intent management tool for identifying concepts associated with a plurality of users' queries |
US7921154B2 (en) * | 2006-08-17 | 2011-04-05 | Flash Widgets, L.L.C. | System and method of live data search on a mobile device |
KR100837750B1 (ko) * | 2006-08-25 | 2008-06-13 | 엔에이치엔(주) | 성조를 이용하여 중국어를 검색하는 방법 및 상기 방법을수행하는 시스템 |
US7747607B2 (en) * | 2006-09-21 | 2010-06-29 | Yahoo! Inc. | Determining logically-related sub-strings of a string |
US9037581B1 (en) * | 2006-09-29 | 2015-05-19 | Google Inc. | Personalized search result ranking |
US8442972B2 (en) | 2006-10-11 | 2013-05-14 | Collarity, Inc. | Negative associations for search results ranking and refinement |
US7739264B2 (en) * | 2006-11-15 | 2010-06-15 | Yahoo! Inc. | System and method for generating substitutable queries on the basis of one or more features |
US8095476B2 (en) * | 2006-11-27 | 2012-01-10 | Inquira, Inc. | Automated support scheme for electronic forms |
US8024319B2 (en) * | 2007-01-25 | 2011-09-20 | Microsoft Corporation | Finite-state model for processing web queries |
US20080228700A1 (en) | 2007-03-16 | 2008-09-18 | Expanse Networks, Inc. | Attribute Combination Discovery |
US7917528B1 (en) * | 2007-04-02 | 2011-03-29 | Google Inc. | Contextual display of query refinements |
US8074234B2 (en) * | 2007-04-16 | 2011-12-06 | Microsoft Corporation | Web service platform for keyword technologies |
KR20080096005A (ko) * | 2007-04-26 | 2008-10-30 | 엔에이치엔(주) | 키워드 제공 범위에 따라 키워드 제공 방법 및 그 시스템 |
JP2009031931A (ja) * | 2007-07-25 | 2009-02-12 | Univ Waseda | 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体 |
US8086441B1 (en) * | 2007-07-27 | 2011-12-27 | Sonicwall, Inc. | Efficient string search |
US20090043752A1 (en) | 2007-08-08 | 2009-02-12 | Expanse Networks, Inc. | Predicting Side Effect Attributes |
US7822732B2 (en) * | 2007-08-13 | 2010-10-26 | Chandra Bodapati | Method and system to enable domain specific search |
CN101159967B (zh) * | 2007-10-29 | 2011-08-31 | 中国移动通信集团设计院有限公司 | 一种将路测数据用于传播模型校正的方法及装置 |
US7945525B2 (en) * | 2007-11-09 | 2011-05-17 | International Business Machines Corporation | Methods for obtaining improved text similarity measures which replace similar characters with a string pattern representation by using a semantic data tree |
US8725756B1 (en) | 2007-11-12 | 2014-05-13 | Google Inc. | Session-based query suggestions |
US8019748B1 (en) | 2007-11-14 | 2011-09-13 | Google Inc. | Web search refinement |
US7953746B1 (en) * | 2007-12-07 | 2011-05-31 | Google Inc. | Contextual query revision |
US10176827B2 (en) | 2008-01-15 | 2019-01-08 | Verint Americas Inc. | Active lab |
US8224845B2 (en) * | 2008-01-21 | 2012-07-17 | International Business Machines Corporation | Transaction prediction modeling method |
US20090187540A1 (en) * | 2008-01-22 | 2009-07-23 | Microsoft Corporation | Prediction of informational interests |
US8122011B1 (en) | 2008-03-12 | 2012-02-21 | Google Inc. | Identifying sibling queries |
US7958136B1 (en) * | 2008-03-18 | 2011-06-07 | Google Inc. | Systems and methods for identifying similar documents |
US8832135B2 (en) * | 2008-05-02 | 2014-09-09 | Verint Systems, Ltd. | Method and system for database query term suggestion |
JP2010003015A (ja) | 2008-06-18 | 2010-01-07 | Hitachi Software Eng Co Ltd | 文書検索システム |
US8438178B2 (en) | 2008-06-26 | 2013-05-07 | Collarity Inc. | Interactions among online digital identities |
US8521731B2 (en) | 2008-07-09 | 2013-08-27 | Yahoo! Inc. | Systems and methods for query expansion in sponsored search |
US8200509B2 (en) | 2008-09-10 | 2012-06-12 | Expanse Networks, Inc. | Masked data record access |
US7917438B2 (en) * | 2008-09-10 | 2011-03-29 | Expanse Networks, Inc. | System for secure mobile healthcare selection |
US9092517B2 (en) * | 2008-09-23 | 2015-07-28 | Microsoft Technology Licensing, Llc | Generating synonyms based on query log data |
US8612202B2 (en) * | 2008-09-25 | 2013-12-17 | Nec Corporation | Correlation of linguistic expressions in electronic documents with time information |
US8156111B2 (en) * | 2008-11-24 | 2012-04-10 | Yahoo! Inc. | Identifying and expanding implicitly temporally qualified queries |
US10489434B2 (en) * | 2008-12-12 | 2019-11-26 | Verint Americas Inc. | Leveraging concepts with information retrieval techniques and knowledge bases |
US20100169262A1 (en) * | 2008-12-30 | 2010-07-01 | Expanse Networks, Inc. | Mobile Device for Pangenetic Web |
US8386519B2 (en) | 2008-12-30 | 2013-02-26 | Expanse Networks, Inc. | Pangenetic web item recommendation system |
US8108406B2 (en) | 2008-12-30 | 2012-01-31 | Expanse Networks, Inc. | Pangenetic web user behavior prediction system |
CN101464897A (zh) * | 2009-01-12 | 2009-06-24 | 阿里巴巴集团控股有限公司 | 一种词匹配及信息查询方法及装置 |
US9659257B2 (en) * | 2009-01-12 | 2017-05-23 | Alphatrac, Inc. | Predictive cueing |
US9330165B2 (en) * | 2009-02-13 | 2016-05-03 | Microsoft Technology Licensing, Llc | Context-aware query suggestion by mining log data |
JP5129194B2 (ja) * | 2009-05-20 | 2013-01-23 | ヤフー株式会社 | 商品検索装置 |
US8943094B2 (en) | 2009-09-22 | 2015-01-27 | Next It Corporation | Apparatus, system, and method for natural language processing |
US8494852B2 (en) | 2010-01-05 | 2013-07-23 | Google Inc. | Word-level correction of speech input |
US8875038B2 (en) | 2010-01-19 | 2014-10-28 | Collarity, Inc. | Anchoring for content synchronization |
WO2011090036A1 (ja) * | 2010-01-19 | 2011-07-28 | 日本電気株式会社 | 動向情報検索装置、動向情報検索方法および記録媒体 |
CN102193939B (zh) * | 2010-03-10 | 2016-04-06 | 阿里巴巴集团控股有限公司 | 信息导航的实现方法、信息导航服务器和信息处理系统 |
US9165065B2 (en) * | 2010-03-26 | 2015-10-20 | Paypal Inc. | Terminology management database |
US20110258212A1 (en) * | 2010-04-14 | 2011-10-20 | Microsoft Corporation | Automatic query suggestion generation using sub-queries |
US9600566B2 (en) | 2010-05-14 | 2017-03-21 | Microsoft Technology Licensing, Llc | Identifying entity synonyms |
US20110314001A1 (en) * | 2010-06-18 | 2011-12-22 | Microsoft Corporation | Performing query expansion based upon statistical analysis of structured data |
US8751520B1 (en) * | 2010-06-23 | 2014-06-10 | Google Inc. | Query suggestions with high utility |
US8560562B2 (en) * | 2010-07-22 | 2013-10-15 | Google Inc. | Predictive query suggestion caching |
EP2423830A1 (de) * | 2010-08-25 | 2012-02-29 | Omikron Data Quality GmbH | Verfahren zum Suchen in einer Vielzahl von Datensätzen und Suchmaschine |
US8838453B2 (en) * | 2010-08-31 | 2014-09-16 | Red Hat, Inc. | Interactive input method |
EP2622457A4 (en) * | 2010-09-27 | 2018-02-21 | Exxonmobil Upstream Research Company | Simultaneous source encoding and source separation as a practical solution for full wavefield inversion |
US9122744B2 (en) | 2010-10-11 | 2015-09-01 | Next It Corporation | System and method for providing distributed intelligent assistance |
US8448089B2 (en) | 2010-10-26 | 2013-05-21 | Microsoft Corporation | Context-aware user input prediction |
US8606565B2 (en) | 2010-11-10 | 2013-12-10 | Rakuten, Inc. | Related-word registration device, information processing device, related-word registration method, program for related-word registration device, and recording medium |
US9098569B1 (en) * | 2010-12-10 | 2015-08-04 | Amazon Technologies, Inc. | Generating suggested search queries |
CN102567408B (zh) | 2010-12-31 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 推荐搜索关键词的方法和装置 |
US20120179705A1 (en) * | 2011-01-11 | 2012-07-12 | Microsoft Corporation | Query reformulation in association with a search box |
US20120185332A1 (en) * | 2011-01-14 | 2012-07-19 | Google Inc. | Serving Advertisements Based on Article Availability |
US20120233140A1 (en) * | 2011-03-09 | 2012-09-13 | Microsoft Corporation | Context-aware query alteration |
US8983995B2 (en) | 2011-04-15 | 2015-03-17 | Microsoft Corporation | Interactive semantic query suggestion for content search |
WO2012143839A1 (en) * | 2011-04-19 | 2012-10-26 | Greyling Abraham Carel | A computerized system and a method for processing and building search strings |
US9646108B2 (en) * | 2011-05-10 | 2017-05-09 | Uber Technologies, Inc. | Systems and methods for performing geo-search and retrieval of electronic documents using a big index |
US8972240B2 (en) * | 2011-05-19 | 2015-03-03 | Microsoft Corporation | User-modifiable word lattice display for editing documents and search queries |
CN103547981A (zh) * | 2011-05-20 | 2014-01-29 | 微软公司 | 显示键拼音 |
CN102262660B (zh) * | 2011-07-15 | 2013-05-29 | 北京百度网讯科技有限公司 | 一种计算机实现的用于获取搜索结果的方法与设备 |
US9058362B2 (en) | 2011-07-26 | 2015-06-16 | 24/7 Customer, Inc. | Method and apparatus for predictive enrichment of search in an enterprise |
CN102306171B (zh) * | 2011-08-22 | 2016-07-06 | 百度在线网络技术(北京)有限公司 | 一种用于提供网络访问建议和网络搜索建议的方法与设备 |
US20130054632A1 (en) * | 2011-08-30 | 2013-02-28 | Google Inc. | Caching Input Suggestions |
US8930393B1 (en) * | 2011-10-05 | 2015-01-06 | Google Inc. | Referent based search suggestions |
US10013152B2 (en) | 2011-10-05 | 2018-07-03 | Google Llc | Content selection disambiguation |
CN102368262B (zh) * | 2011-10-14 | 2013-05-29 | 北京百度网讯科技有限公司 | 一种提供与查询序列相对应的搜索建议的方法与设备 |
US9189550B2 (en) * | 2011-11-17 | 2015-11-17 | Microsoft Technology Licensing, Llc | Query refinement in a browser toolbar |
US9836177B2 (en) | 2011-12-30 | 2017-12-05 | Next IT Innovation Labs, LLC | Providing variable responses in a virtual-assistant environment |
US9152698B1 (en) | 2012-01-03 | 2015-10-06 | Google Inc. | Substitute term identification based on over-represented terms identification |
US9141672B1 (en) | 2012-01-25 | 2015-09-22 | Google Inc. | Click or skip evaluation of query term optionalization rule |
US8745019B2 (en) | 2012-03-05 | 2014-06-03 | Microsoft Corporation | Robust discovery of entity synonyms using query logs |
US20130238636A1 (en) * | 2012-03-06 | 2013-09-12 | Salesforce.Com, Inc. | Suggesting access-controlled related queries |
US9223537B2 (en) | 2012-04-18 | 2015-12-29 | Next It Corporation | Conversation user interface |
US11023520B1 (en) | 2012-06-01 | 2021-06-01 | Google Llc | Background audio identification for query disambiguation |
US10032131B2 (en) | 2012-06-20 | 2018-07-24 | Microsoft Technology Licensing, Llc | Data services for enterprises leveraging search system data assets |
US9594831B2 (en) | 2012-06-22 | 2017-03-14 | Microsoft Technology Licensing, Llc | Targeted disambiguation of named entities |
US9128915B2 (en) * | 2012-08-03 | 2015-09-08 | Oracle International Corporation | System and method for utilizing multiple encodings to identify similar language characters |
US9135912B1 (en) * | 2012-08-15 | 2015-09-15 | Google Inc. | Updating phonetic dictionaries |
US9229924B2 (en) | 2012-08-24 | 2016-01-05 | Microsoft Technology Licensing, Llc | Word detection and domain dictionary recommendation |
US9536049B2 (en) | 2012-09-07 | 2017-01-03 | Next It Corporation | Conversational virtual healthcare assistant |
US9146966B1 (en) | 2012-10-04 | 2015-09-29 | Google Inc. | Click or skip evaluation of proximity rules |
US9471881B2 (en) * | 2013-01-21 | 2016-10-18 | International Business Machines Corporation | Transductive feature selection with maximum-relevancy and minimum-redundancy criteria |
US10102333B2 (en) | 2013-01-21 | 2018-10-16 | International Business Machines Corporation | Feature selection for efficient epistasis modeling for phenotype prediction |
US9218420B1 (en) | 2013-02-26 | 2015-12-22 | Google Inc. | Detecting new businesses with unrecognized query terms |
US9619046B2 (en) | 2013-02-27 | 2017-04-11 | Facebook, Inc. | Determining phrase objects based on received user input context information |
US9122376B1 (en) * | 2013-04-18 | 2015-09-01 | Google Inc. | System for improving autocompletion of text input |
US10445115B2 (en) | 2013-04-18 | 2019-10-15 | Verint Americas Inc. | Virtual assistant focused user interfaces |
KR101332757B1 (ko) * | 2013-05-16 | 2013-11-25 | 주식회사 큐키 | 삭제키 입력 없이 단어 또는 문자열을 수정하는 방법 및 이를 구현한 장치 |
US9256687B2 (en) | 2013-06-28 | 2016-02-09 | International Business Machines Corporation | Augmenting search results with interactive search matrix |
US9342592B2 (en) * | 2013-07-29 | 2016-05-17 | Workday, Inc. | Method for systematic mass normalization of titles |
US9886950B2 (en) * | 2013-09-08 | 2018-02-06 | Intel Corporation | Automatic generation of domain models for virtual personal assistants |
US11210705B1 (en) * | 2013-10-18 | 2021-12-28 | United Services Automobile Association (Usaa) | System and method for transmitting direct advertising information to an augmented reality device |
CA2932401A1 (en) * | 2013-12-02 | 2015-06-11 | Qbase, LLC | Systems and methods for in-memory database search |
US10176256B1 (en) | 2013-12-23 | 2019-01-08 | BroadbandTV, Corp | Title rating and improvement process and system |
US9823811B2 (en) | 2013-12-31 | 2017-11-21 | Next It Corporation | Virtual assistant team identification |
CN104899214B (zh) * | 2014-03-06 | 2018-05-22 | 阿里巴巴集团控股有限公司 | 一种建立输入建议的数据处理方法和系统 |
US10546336B2 (en) * | 2014-03-07 | 2020-01-28 | Rakuten, Inc. | Search device, search method, program, and storage medium |
CN104978314B (zh) * | 2014-04-01 | 2019-05-14 | 深圳市腾讯计算机系统有限公司 | 媒体内容推荐方法及装置 |
WO2015162719A1 (ja) * | 2014-04-23 | 2015-10-29 | 楽天株式会社 | 情報提供装置、情報提供方法、プログラム、及び記録媒体 |
CN104090963A (zh) * | 2014-07-14 | 2014-10-08 | 百度在线网络技术(北京)有限公司 | 查询信息推荐方法和装置 |
US9798801B2 (en) | 2014-07-16 | 2017-10-24 | Microsoft Technology Licensing, Llc | Observation-based query interpretation model modification |
US20160071517A1 (en) | 2014-09-09 | 2016-03-10 | Next It Corporation | Evaluating Conversation Data based on Risk Factors |
CN104361010A (zh) * | 2014-10-11 | 2015-02-18 | 北京中搜网络技术股份有限公司 | 一种纠正新闻分类的自动分类方法 |
US10339165B2 (en) * | 2015-02-27 | 2019-07-02 | Walmart Apollo, Llc | System, method, and non-transitory computer-readable storage media for generating synonyms of a search query |
EP3089159B1 (en) | 2015-04-28 | 2019-08-28 | Google LLC | Correcting voice recognition using selective re-speak |
CN104991656B (zh) * | 2015-06-11 | 2018-12-21 | 浦江开丰广告设计有限公司 | 一种输入汉语词组的方法 |
US11836169B2 (en) * | 2015-10-05 | 2023-12-05 | Yahoo Assets Llc | Methods, systems and techniques for providing search query suggestions based on non-personal data and user personal data according to availability of user personal data |
US11899728B2 (en) | 2015-10-05 | 2024-02-13 | Yahoo Assets Llc | Methods, systems and techniques for ranking personalized and generic search query suggestions |
WO2017091985A1 (zh) * | 2015-12-01 | 2017-06-08 | 华为技术有限公司 | 停用词识别方法与装置 |
US11379538B1 (en) | 2016-05-19 | 2022-07-05 | Artemis Intelligence Llc | Systems and methods for automatically identifying unmet technical needs and/or technical problems |
US10474704B2 (en) | 2016-06-27 | 2019-11-12 | International Business Machines Corporation | Recommending documents sets based on a similar set of correlated features |
US20180068232A1 (en) * | 2016-09-07 | 2018-03-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Expert-assisted online-learning for media similarity |
TWI645303B (zh) * | 2016-12-21 | 2018-12-21 | 財團法人工業技術研究院 | 字串驗證方法、字串擴充方法與驗證模型訓練方法 |
US11392651B1 (en) | 2017-04-14 | 2022-07-19 | Artemis Intelligence Llc | Systems and methods for automatically identifying unmet technical needs and/or technical problems |
GB201713728D0 (en) * | 2017-08-25 | 2017-10-11 | Just Eat Holding Ltd | System and method of language processing |
US11100169B2 (en) | 2017-10-06 | 2021-08-24 | Target Brands, Inc. | Alternative query suggestion in electronic searching |
US11416503B2 (en) | 2018-02-09 | 2022-08-16 | Microsoft Technology Licensing, Llc | Mining data for generating consumable collaboration events |
JP7059727B2 (ja) * | 2018-03-19 | 2022-04-26 | 株式会社リコー | 電子機器、検索方法、および、プログラム |
US11042711B2 (en) | 2018-03-19 | 2021-06-22 | Daniel L. Coffing | Processing natural language arguments and propositions |
US10853332B2 (en) * | 2018-04-19 | 2020-12-01 | Microsoft Technology Licensing, Llc | Discovering schema using anchor attributes |
EP3579125A1 (en) * | 2018-06-05 | 2019-12-11 | Sap Se | System, computer-implemented method and computer program product for information retrieval |
US10860631B1 (en) * | 2018-06-21 | 2020-12-08 | Intuit Inc. | Searching and scoring using phrases and/or multiple words |
US10943059B2 (en) * | 2018-06-27 | 2021-03-09 | Microsoft Technology Licensing, Llc | Document editing models and management |
US11429794B2 (en) | 2018-09-06 | 2022-08-30 | Daniel L. Coffing | System for providing dialogue guidance |
US11568175B2 (en) | 2018-09-07 | 2023-01-31 | Verint Americas Inc. | Dynamic intent classification based on environment variables |
WO2020056409A1 (en) | 2018-09-14 | 2020-03-19 | Coffing Daniel L | Fact management system |
US11232264B2 (en) | 2018-10-19 | 2022-01-25 | Verint Americas Inc. | Natural language processing with non-ontological hierarchy models |
US11196863B2 (en) | 2018-10-24 | 2021-12-07 | Verint Americas Inc. | Method and system for virtual assistant conversations |
US11144560B2 (en) | 2019-08-23 | 2021-10-12 | International Business Machines Corporation | Utilizing unsumbitted user input data for improved task performance |
US11829716B2 (en) | 2019-09-06 | 2023-11-28 | International Business Machines Corporation | Suggestion of an output candidate |
CN111222058B (zh) * | 2020-01-06 | 2021-04-16 | 百度在线网络技术(北京)有限公司 | 查询自动补全的方法、装置、设备和计算机存储介质 |
JP2021192142A (ja) * | 2020-06-05 | 2021-12-16 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
US11762916B1 (en) | 2020-08-17 | 2023-09-19 | Artemis Intelligence Llc | User interface for identifying unmet technical needs and/or technical problems |
US11416554B2 (en) * | 2020-09-10 | 2022-08-16 | Coupang Corp. | Generating context relevant search results |
Family Cites Families (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265065A (en) * | 1991-10-08 | 1993-11-23 | West Publishing Company | Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query |
US5331554A (en) * | 1992-12-10 | 1994-07-19 | Ricoh Corporation | Method and apparatus for semantic pattern matching for text retrieval |
WO1996041281A1 (en) | 1995-06-07 | 1996-12-19 | International Language Engineering Corporation | Machine assisted translation tools |
WO1997008604A2 (en) * | 1995-08-16 | 1997-03-06 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
US6182066B1 (en) * | 1997-11-26 | 2001-01-30 | International Business Machines Corp. | Category processing of query topics and electronic document content topics |
US6345244B1 (en) * | 1998-05-27 | 2002-02-05 | Lionbridge Technologies, Inc. | System, method, and product for dynamically aligning translations in a translation-memory system |
US6006225A (en) * | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US6411950B1 (en) * | 1998-11-30 | 2002-06-25 | Compaq Information Technologies Group, Lp | Dynamic query expansion |
JP2000276493A (ja) * | 1999-01-29 | 2000-10-06 | Canon Inc | 電子的にアクセスできるリソースのブラウジング方法 |
JP2002539528A (ja) * | 1999-03-05 | 2002-11-19 | キヤノン株式会社 | データベース注釈付け及び検索 |
US6510406B1 (en) * | 1999-03-23 | 2003-01-21 | Mathsoft, Inc. | Inverse inference engine for high performance web search |
US6571234B1 (en) * | 1999-05-11 | 2003-05-27 | Prophet Financial Systems, Inc. | System and method for managing online message board |
US6314419B1 (en) | 1999-06-04 | 2001-11-06 | Oracle Corporation | Methods and apparatus for generating query feedback based on co-occurrence patterns |
US6611825B1 (en) * | 1999-06-09 | 2003-08-26 | The Boeing Company | Method and system for text mining using multidimensional subspaces |
US7089236B1 (en) * | 1999-06-24 | 2006-08-08 | Search 123.Com, Inc. | Search engine interface |
AU6200300A (en) | 1999-06-24 | 2001-01-09 | Simpli.Com | Search engine interface |
US6882970B1 (en) * | 1999-10-28 | 2005-04-19 | Canon Kabushiki Kaisha | Language recognition using sequence frequency |
US6757646B2 (en) * | 2000-03-22 | 2004-06-29 | Insightful Corporation | Extended functionality for an inverse inference engine based web search |
GB0011798D0 (en) * | 2000-05-16 | 2000-07-05 | Canon Kk | Database annotation and retrieval |
US6633868B1 (en) * | 2000-07-28 | 2003-10-14 | Shermann Loyall Min | System and method for context-based document retrieval |
DE60017727T2 (de) * | 2000-08-18 | 2005-12-29 | Exalead | Suchwerkzeug und Prozess zum Suchen unter Benutzung von Kategorien und Schlüsselwörtern |
US20030217052A1 (en) * | 2000-08-24 | 2003-11-20 | Celebros Ltd. | Search engine method and apparatus |
US20020103798A1 (en) * | 2001-02-01 | 2002-08-01 | Abrol Mani S. | Adaptive document ranking method based on user behavior |
US7269546B2 (en) * | 2001-05-09 | 2007-09-11 | International Business Machines Corporation | System and method of finding documents related to other documents and of finding related words in response to a query to refine a search |
JP3918531B2 (ja) | 2001-11-29 | 2007-05-23 | 株式会社日立製作所 | 類似文書検索方法およびシステム |
US6961719B1 (en) * | 2002-01-07 | 2005-11-01 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Hybrid neural network and support vector machine method for optimization |
JP4003468B2 (ja) | 2002-02-05 | 2007-11-07 | 株式会社日立製作所 | 適合性フィードバックによる類似データ検索方法および装置 |
WO2003085551A1 (en) * | 2002-04-05 | 2003-10-16 | Hyperwave Software Forschungs- Und Entwicklungs Gmbh | Data visualization system |
US6847966B1 (en) * | 2002-04-24 | 2005-01-25 | Engenium Corporation | Method and system for optimally searching a document database using a representative semantic space |
GB2388940A (en) * | 2002-05-22 | 2003-11-26 | Sharp Kk | Method and apparatus for the correction or improvement of word usage |
EP2109048A1 (en) | 2002-08-30 | 2009-10-14 | Sony Deutschland Gmbh | Methods to create a user profile and to specify a suggestion for a next selection of a user |
US20040086185A1 (en) * | 2002-10-31 | 2004-05-06 | Eastman Kodak Company | Method and system for multiple cue integration |
US7287025B2 (en) | 2003-02-12 | 2007-10-23 | Microsoft Corporation | Systems and methods for query expansion |
US6947930B2 (en) * | 2003-03-21 | 2005-09-20 | Overture Services, Inc. | Systems and methods for interactive search query refinement |
US7563748B2 (en) | 2003-06-23 | 2009-07-21 | Cognis Ip Management Gmbh | Alcohol alkoxylate carriers for pesticide active ingredients |
US8856163B2 (en) * | 2003-07-28 | 2014-10-07 | Google Inc. | System and method for providing a user interface with search query broadening |
US8086619B2 (en) | 2003-09-05 | 2011-12-27 | Google Inc. | System and method for providing search query refinements |
JP4292922B2 (ja) * | 2003-09-09 | 2009-07-08 | 株式会社日立製作所 | 文書検索システムおよび方法 |
US20050076003A1 (en) * | 2003-10-06 | 2005-04-07 | Dubose Paul A. | Method and apparatus for delivering personalized search results |
US7231375B2 (en) * | 2003-10-10 | 2007-06-12 | Microsoft Corporation | Computer aided query to task mapping |
US20050149496A1 (en) * | 2003-12-22 | 2005-07-07 | Verity, Inc. | System and method for dynamic context-sensitive federated search of multiple information repositories |
US7739262B2 (en) * | 2004-03-19 | 2010-06-15 | Microsoft Corporation | Enforcing currency and consistency constraints in database query processing |
US7689585B2 (en) * | 2004-04-15 | 2010-03-30 | Microsoft Corporation | Reinforced clustering of multi-type data objects for search term suggestion |
US7428529B2 (en) | 2004-04-15 | 2008-09-23 | Microsoft Corporation | Term suggestion for multi-sense query |
US20050289463A1 (en) * | 2004-06-23 | 2005-12-29 | Google Inc., A Delaware Corporation | Systems and methods for spell correction of non-roman characters and words |
US20060106769A1 (en) * | 2004-11-12 | 2006-05-18 | Gibbs Kevin A | Method and system for autocompletion for languages having ideographs and phonetic characters |
US20060112091A1 (en) * | 2004-11-24 | 2006-05-25 | Harbinger Associates, Llc | Method and system for obtaining collection of variants of search query subjects |
US7698270B2 (en) * | 2004-12-29 | 2010-04-13 | Baynote, Inc. | Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge |
US7636714B1 (en) * | 2005-03-31 | 2009-12-22 | Google Inc. | Determining query term synonyms within query context |
WO2006113597A2 (en) * | 2005-04-14 | 2006-10-26 | The Regents Of The University Of California | Method for information retrieval |
US8438142B2 (en) | 2005-05-04 | 2013-05-07 | Google Inc. | Suggesting and refining user input based on original user input |
US7627564B2 (en) | 2005-06-21 | 2009-12-01 | Microsoft Corporation | High scale adaptive search systems and methods |
JP4333745B2 (ja) * | 2007-01-15 | 2009-09-16 | 株式会社デンソー | 電子制御装置 |
US7603348B2 (en) | 2007-01-26 | 2009-10-13 | Yahoo! Inc. | System for classifying a search query |
US20080256056A1 (en) | 2007-04-10 | 2008-10-16 | Yahoo! Inc. | System for building a data structure representing a network of users and advertisers |
US8086504B1 (en) | 2007-09-06 | 2011-12-27 | Amazon Technologies, Inc. | Tag suggestions based on item metadata |
US8583670B2 (en) | 2007-10-04 | 2013-11-12 | Microsoft Corporation | Query suggestions for no result web searches |
US8019748B1 (en) | 2007-11-14 | 2011-09-13 | Google Inc. | Web search refinement |
US20090171929A1 (en) | 2007-12-26 | 2009-07-02 | Microsoft Corporation | Toward optimized query suggeston: user interfaces and algorithms |
US20090248510A1 (en) | 2008-03-31 | 2009-10-01 | Yahoo! Inc. | Information retrieval using dynamic guided navigation |
US20090248669A1 (en) | 2008-04-01 | 2009-10-01 | Nitin Mangesh Shetti | Method and system for organizing information |
US20100185644A1 (en) | 2009-01-21 | 2010-07-22 | Microsoft Corporatoin | Automatic search suggestions from client-side, browser, history cache |
US8452794B2 (en) | 2009-02-11 | 2013-05-28 | Microsoft Corporation | Visual and textual query suggestion |
US9330165B2 (en) | 2009-02-13 | 2016-05-03 | Microsoft Technology Licensing, Llc | Context-aware query suggestion by mining log data |
US8275759B2 (en) | 2009-02-24 | 2012-09-25 | Microsoft Corporation | Contextual query suggestion in result pages |
-
2005
- 2005-05-04 US US11/122,873 patent/US8438142B2/en active Active
-
2006
- 2006-05-04 EP EP06769954A patent/EP1877939A1/en not_active Withdrawn
- 2006-05-04 KR KR1020077028339A patent/KR101389148B1/ko active IP Right Grant
- 2006-05-04 CN CN201210199408.7A patent/CN102945237B/zh active Active
- 2006-05-04 WO PCT/US2006/016787 patent/WO2006121702A1/en active Application Filing
- 2006-05-04 CN CNA2006800219402A patent/CN101297291A/zh active Pending
- 2006-05-04 JP JP2008510125A patent/JP5203934B2/ja active Active
-
2012
- 2012-09-13 US US13/615,518 patent/US9020924B2/en active Active
-
2015
- 2015-04-14 US US14/686,555 patent/US9411906B2/en active Active
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385577A (zh) * | 2010-08-27 | 2012-03-21 | 腾讯科技(深圳)有限公司 | 搜索方法和系统 |
CN103180849A (zh) * | 2010-10-21 | 2013-06-26 | 惠普发展公司,有限责任合伙企业 | 使用移动计算装置搜索多数据源 |
CN103814375A (zh) * | 2011-09-29 | 2014-05-21 | 乐天株式会社 | 信息处理装置、信息处理方法、信息处理装置用程序、以及记录介质 |
CN103814375B (zh) * | 2011-09-29 | 2015-04-22 | 乐天株式会社 | 信息处理装置、信息处理方法 |
CN102419776A (zh) * | 2011-12-31 | 2012-04-18 | 北京百度网讯科技有限公司 | 一种满足用户多维度搜索需求的方法和设备 |
US10324916B2 (en) | 2012-02-22 | 2019-06-18 | Nokia Technologies Oy | Predictive service access |
CN104246756A (zh) * | 2012-02-22 | 2014-12-24 | 诺基亚公司 | 用于提供用于控制系统的预测的系统和方法 |
CN104246757A (zh) * | 2012-02-22 | 2014-12-24 | 诺基亚公司 | 预测性服务访问 |
CN104246756B (zh) * | 2012-02-22 | 2019-05-28 | 诺基亚技术有限公司 | 用于提供用于控制系统的预测的系统和方法 |
CN104246757B (zh) * | 2012-02-22 | 2018-11-06 | 诺基亚技术有限公司 | 预测性服务访问 |
US9690264B2 (en) | 2012-02-22 | 2017-06-27 | Nokia Technologies Oy | System, and a method for providing a prediction for controlling a system |
CN103577401A (zh) * | 2012-07-18 | 2014-02-12 | 腾讯科技(深圳)有限公司 | 一种移动终端搜索方法及系统 |
CN103577416B (zh) * | 2012-07-20 | 2017-09-22 | 阿里巴巴集团控股有限公司 | 扩展查询方法及系统 |
CN103577416A (zh) * | 2012-07-20 | 2014-02-12 | 阿里巴巴集团控股有限公司 | 扩展查询方法及系统 |
CN104462595B (zh) * | 2014-12-29 | 2019-03-19 | 北京奇虎科技有限公司 | 搜索引擎系统及在搜索结果项中嵌入多媒体元素的方法 |
CN104462595A (zh) * | 2014-12-29 | 2015-03-25 | 北京奇虎科技有限公司 | 搜索引擎系统及在搜索结果项中嵌入多媒体元素的方法 |
CN106126758A (zh) * | 2016-08-30 | 2016-11-16 | 程传旭 | 用于信息处理和信息评估的云系统 |
Also Published As
Publication number | Publication date |
---|---|
US8438142B2 (en) | 2013-05-07 |
KR101389148B1 (ko) | 2014-04-24 |
CN102945237A (zh) | 2013-02-27 |
KR20080008400A (ko) | 2008-01-23 |
US20150220547A1 (en) | 2015-08-06 |
US9020924B2 (en) | 2015-04-28 |
JP2008541233A (ja) | 2008-11-20 |
US20060253427A1 (en) | 2006-11-09 |
EP1877939A1 (en) | 2008-01-16 |
CN102945237B (zh) | 2016-08-10 |
JP5203934B2 (ja) | 2013-06-05 |
US20130103696A1 (en) | 2013-04-25 |
US9411906B2 (en) | 2016-08-09 |
WO2006121702A1 (en) | 2006-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102945237B (zh) | 基于原始用户输入建议和细分用户输入的系统和方法 | |
US9875299B2 (en) | System and method for identifying relevant search results via an index | |
CN103136352B (zh) | 基于双层语义分析的全文检索系统 | |
Carpineto et al. | A survey of automatic query expansion in information retrieval | |
US8892550B2 (en) | Source expansion for information retrieval and information extraction | |
US20160041986A1 (en) | Smart Search Engine | |
US20070192293A1 (en) | Method for presenting search results | |
EP0597630A1 (en) | Method for resolution of natural-language queries against full-text databases | |
US20100094835A1 (en) | Automatic query concepts identification and drifting for web search | |
Ganguly et al. | Patent query reduction using pseudo relevance feedback | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
Liu et al. | Information retrieval and Web search | |
Zhang et al. | The extraction method of new logining word/term for social media based on statistics and N-increment | |
Reddy et al. | An efficient approach for web document summarization by sentence ranking | |
Li et al. | Complex query recognition based on dynamic learning mechanism | |
Ren et al. | Role-explicit query extraction and utilization for quantifying user intents | |
Gulati et al. | Ontology driven query expansion for better image retrieval | |
Reddy et al. | Cross lingual information retrieval using search engine and data mining | |
Yoo et al. | A Semantic Search Model Using Word Embedding, POS Tagging, and Named Entity Recognition | |
Mehrotra et al. | MPII at TREC CAsT 2019: Incoporating Query Context into a BERT Re-ranker. | |
Bai et al. | Web-scale semantic ranking | |
AU6552399A (en) | Method for resolution of natural-language queries against full-text databases | |
Jothilakshmi et al. | An approach for semantic query expansion based on maximum entropy-hidden Markov model | |
Jiang et al. | automatic segmentation of hierarchy feature without lexicon for Chinese text based on iterative learning | |
Bhatia | Enabling easier information access in online discussion forums |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20081029 |