CN101116072A - 用于分类呈现搜索结果的方法和系统 - Google Patents

用于分类呈现搜索结果的方法和系统 Download PDF

Info

Publication number
CN101116072A
CN101116072A CNA2006800039541A CN200680003954A CN101116072A CN 101116072 A CN101116072 A CN 101116072A CN A2006800039541 A CNA2006800039541 A CN A2006800039541A CN 200680003954 A CN200680003954 A CN 200680003954A CN 101116072 A CN101116072 A CN 101116072A
Authority
CN
China
Prior art keywords
search
classification
user
document
notion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800039541A
Other languages
English (en)
Other versions
CN101116072B (zh
Inventor
西蒙·詹姆斯·凯斯
贝南·阿斯文
崔湛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Telecommunications PLC
Original Assignee
British Telecommunications PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecommunications PLC filed Critical British Telecommunications PLC
Publication of CN101116072A publication Critical patent/CN101116072A/zh
Application granted granted Critical
Publication of CN101116072B publication Critical patent/CN101116072B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及用于分类呈现搜索结果的方法和系统。一种自动地对电子文档库进行搜索的方法,该方法包括以下步骤:控制用户接口以准许(410)用户输入搜索项;利用所述搜索项执行搜索;将由所述搜索返回的文档分类到多个不同类别;以及控制所述用户接口按使特定类别的文档或对其的引用被分组到一起的分组方式,在左手面板(512)中呈现所述多个不同类别,而在右手面板(514)中呈现由所述搜索返回的文档或对其的引用,其中,所述多个类别是根据所述搜索项来选定的。

Description

用于分类呈现搜索结果的方法和系统
技术领域
本发明涉及文档搜索工具和方法。具体地说,本发明涉及旨在用于对存储有大量电子文档的大型电子数据库进行搜索的电子文档搜索工具和方法。
背景技术
存在日益增加的大量的电子地存储的信息。另外,存在针对使得不同数据库的数据为临时搜索者可用的增长的趋势。例如,因为越来越多的数据被写入因特网服务器并且因为越来越多的组织将他们的数据库连接至因特网并由此使这些数据库中包含的信息可经由因特网使用,所以包括大量存储各种信息的不同服务器的因特网在持续扩大。
为了使得用户能够筛选这种大量信息并且在海量无关文档中寻找相关文档,信息技术界内花费了许多努力来研究并开发搜索方法和工具,以解决由此引发的、所谓的“数据超载信息贫乏”问题。
用于在因特网上寻找电子文档的多数搜索工具是基于关键字的搜索,并且这些搜索工具趋于针对包括一个或仅几个关键字(至少它们是相当普通的字)的任何合理普通查询,返回难于处理的大量命中(hit)。甚至更多采用了精细分类文档内容等的高级搜索工具因其基本上趋向于基于关键字的搜索工具,故而针对任何相当普通的查询仍然趋于返回大量“命中”。
这种问题的原因之一仅仅在于计算机能够非常快速地处理大量数据从而生成非常大的命中列表。将典型因特网搜索引擎的性能与人类图书管理员相比,针对诸如“Hercules”的简单查询来说,前者很可能生成数以万计的结果,而后者通常至多生成两个或三个“命中”。然而,在执行“搜索”之前,人类图书管理员将大概检查读者是否意指传说中的希腊英雄或是完全不同的内容(例如,具有该名称的商业组织,计算机程序,等等),并且人类图书管理员将几乎确定地寻找和读者相关的内容。
因此,清楚的是,因为人类图书管理员能够向请求搜索的人询问智能问题并由此排除整个文档“图书馆”中的仅仅基于简单关键字搜索而可能被分类为“命中”的大部分,所以他或她通常可以做得比因特网搜索引擎好。这种能力超出了当前计算机能够成功模仿的能力,因此,需要另选技术方案来在利用计算机的技术实力同时设法克服它们相应的弱点(具体地说,它们缺乏智能)的情况下使得计算机能够提高它们的搜索能力,或者更加精确地说,提高计算机辅助用户/请求者从利用基于简单关键字的搜索通常找到的大量可能文档中寻找和该用户/请求者特别相关或所关注的一个或两个文档的能力。
US专利No.6526440描述了一种根据返回文档被其它文档引用的频率对搜索结果进行重排序的系统。换句话说,这个文献描述了一种基于元信息(即,关于文档的信息)而非简单地依赖文档中包含的信息重排序文档的方法。
Vivisimo已经生产出一种称为“Clusty”的搜索引擎,该搜索引擎目前可从http://clusty.com上获得,在该搜索引擎中将任何特定搜索的结果聚类成相关类别。
由Amazon.com提交的WO 01/46870描述了如下一种系统,该系统用于将搜索结果放入对应类别(每一个结果都已被预指配给特定类别(例如,书、CD等)),并且用于根据多种规则(例如,通过计算特定类别中的结果数与该类别中的项数的比率并且根据关于各类别的该比率的值对多个类别进行排序)确定要向用户呈现不同类别的次序。
US 6385602描述了一种类似于上述Clusty搜索引擎的系统,在该系统中,在执行搜索之后,使所得结果聚类,并基于聚类动态类别对这些结果进行限定且用于将其呈现给用户。
US 2003/0088553描述了这样一种系统,即,在该系统中,第一数据库存储预定类别集,第二数据库存储一组“预期搜索项”和到一个或更多个预定类别的映射,而第三数据库存储类别与各种因特网网站之间的映射(即,将网站预分类到一个或更多个预定义类别)。接着,通过将输入搜索查询指配给一类别并接着检索与输入搜索查询对应的被预分类到相应类别的所有网站(或到这些网站的链接或标题)来进行搜索。要注意的是,这一活动代表了搜索处理的全部,由此,既没有阶段执行关键字类型搜索,接着也没有将这种搜索的结果分类到多个单独的类别,而搜索结果仅仅是分类为属于输入搜索查询匹配的哪个类别的网站的总和。
EP 1217542描述了这样一种系统,即,在该系统中,移动通信装置(例如,移动电话)包括个人化本体(ontology),其用于帮助用户将喜爱的服务(或到这些服务的链接)存储在该个人化本体的对应节点中来标识这些服务。这个描述对于有关怎样精确地执行搜索说得有点不太清楚,但是,该描述给出(尤其从图6中)它是通过如下步骤进行操作的:首先从个人化本体中寻找针对搜索请求的结果,并且如果失败则使用普通搜索引擎来寻找针对该搜索的合适结果(参见第616、618以及620项)。没有讨论如何向用户显示搜索结果,或在向用户显示结果之前是否根据个人化本体对这些结果进行分类。
发明内容
根据本发明第一方面,提供了一种自动地对电子文档库进行搜索以便辅助用户寻找该用户可用的全部文档中的该用户尤为关注(在那时)的小子集的方法,所述方法包括以下步骤:控制用户接口以准许用户输入包括一个或更多个关键字的搜索项;利用所述搜索项执行基于关键字的搜索;将由所述搜索返回的文档分类到多个不同类别;以及控制所述用户接口按使特定类别的文档被分组到一起的分组方式来呈现通过所述搜索返回的文档或对其的引用,其中,所述多个类别是根据搜索查询而选定和/或动态地生成的。
优选的是,所述多个类别是通过处理所述搜索查询以及公用本体或本体集而选定和/或动态地生成的。优选的是,所述公用本体或本体集是根据与用户相关联的偏好而个人化的。
优选的是,所述类别中的至少一个类别或一些类别是通过组合本体中的概念来形成复合类别而根据所述本体动态地生成的。例如,如果本体中的第一概念(例如,概念A)具有和该本体中单独的第二概念(例如,概念B)对应的属性(例如,属性B),该第二概念具有多个子概念或子代(例如,子概念b1、b2、b3),则选定的类别可以包括通过对第二概念中的子概念和第一概念(例如,形成作为A的实例并且具有属性类型b1、b2以及b3的检索文档相应地分类到的类别b1A、b2A以及b3A)进行组合而形成的复合类别。例如,一种本体可能包括具有属性“烹调风格”、“地点”以及“电话号码”的概念“餐馆”,其中,至少“烹调风格”可能是本体中单独的概念,其具有子概念“印度”、“现代欧洲”、“英国”以及“素食”等,在该种情况下,至少可以形成下列复合类别,即,“印度餐馆”、“现代欧洲餐馆”、“英国餐馆”以及“素食餐馆”。要注意的是,如果第三概念也具有“烹调风格”作为属性(例如,概念“烹调书”——或许其本身是概念“书”的子概念),则可以基于该第三概念形成类似的复合类别(例如,“印度烹调书”等)。
优选的是,所述方法还包括以下步骤:选择优选类别,以基于用户的历史行动更突出地呈现给用户;并且动态地调整对用户的类别呈现,以改变基于用户的行动显示类别的突出性。在下面的具体说明中将对其实施例进行更详细的阐述。
根据结果的特性,可以有利地采用很多不同的向用户呈现搜索结果的方法。如果存在结果被视为落入其中的大量不同类别,则恰当的是初始仅向用户显示类别,而非任何实际文档(或对其的引用)。在只存在几个不同类别的情况下,恰当的是显示一些实际文档(或对其的引用),但清楚地指示它们所属的类别等。
优选的是,所述方法还包括如下步骤:结合本体中包含的分级信息利用用户先前行动的存储历史,来生成向该用户呈现的新的类别集,所述新的类别集是通过根据一种类别的属性所引用的本体中概念的存储分级来扩展该属性以生成多个子类别而生成的,并且根据选定属性的值将搜索结果分组成相应的子类别。下面,在具体说明中对其实施例进行阐述。
应清楚的是,这个方法的典型实现将包含安装和执行运行在远程计算机接入的服务器计算机上的计算机程序。由此,控制用户接口以准许用户输入搜索项并且向用户呈现搜索结果的步骤可以通过生成超文本标记语言(HTML)页面并将其发送给用户所在的远程计算机来执行,所述超文本标记语言页面包括到远程计算机可接入(例如,通过因特网)的其它文档的有效链接,并且为了允许用户输入搜索项还包括文本输入字段,该文本输入字段中的内容可以是由远程计算机例如借助于来自远程计算机的包括文本字段的内容的HTML请求向其上正运行实现本发明实施方式的计算机程序的服务器发送的(可以采用预处理方式)。
根据本发明第二方面,提供了一种服务器计算机,该服务器计算机用于辅助用户利用远程装置从存储在连接至服务器和所述远程装置所连接的同一数据网络的装置上的该用户可用的文档集中选择文档子集,所述服务器包括:用于接收来自远程终端的包括一个或更多个关键字的搜索项的装置;用于利用所述搜索项执行基于关键字的搜索的装置;用于将通过所述搜索返回的文档分类到多个不同类别的装置;以及用于向所述远程终端返回输出数据的装置,该装置准许所述远程终端按特定类别的文档被分组到一起的分组方式来向用户呈现通过所述搜索返回的文档或对其的引用,其中,所述多个类别是根据搜索查询来选定的。
本发明的其他方面包括用于执行根据本发明第一方面所述的方法的计算机程序或程序组,并且包括载带这种程序或程序组的载体装置。
附图说明
为了更好地理解本发明,下面将参照附图仅以实施例的方式对本发明的实施方式进行说明,附图中:
图1是实现本发明一实施方式的系统的框图;
图2是图1的搜索服务器的框图,更详细地示出了该搜索服务器;
图3是图1和图2中的搜索服务器内存储的本体的一部分的示意性例示图;
图4是来自接入实现本发明一实施方式的服务器的终端显示器的屏幕快照(screen shot)的示意性例示图;以及
图5是图4的屏幕快照的后续(follow on)屏幕快照的示意性例示图。
具体实施方式
参照图1,所述系统包括经由因特网50连接至搜索服务器20的远程终端10。另外,连接至因特网50的还有多个普通网络服务器30,每一个普通网络服务器30都可以连接至存储有可经由因特网50存取的电子文档的多个数据库41、42、43。
参照图2,搜索服务器20包括多个数据库:用户简档(profile)库21,其存储关于每一个用户的由搜索服务器20提供的搜索服务的详情;本体库22,其存储一个或更多个公用本体以及本体间的映射(如果存在多于一个本体);以及辞典23,其存储计算机可存取的指定单词的不同含义、同义词以及单词之间(或者因为某些单词可以具有多于一种的含义,所以更精确地说是这些单词的不同含义之间)的关系(例如,其专用化、通用化等)的字典(例如,WordNet)。另外,搜索服务器包括多个程序模块:文档定位器和排序模块25,其响应于输入的搜索查询而生成“命中”列表并且将它们排序成用户可能感兴趣的次序;文档分类器模块26,其将输入的文档分类到指定的一个本体或多个本体的概念;以及HTML页面生成器模块27,其响应于从远程装置接收到的HTML请求生成向远程装置发送的HTML页面。
在这些数据库和程序模块中,辞典23与文档定位器和排序模块25可以根据这些组件的任何适合常规实施方式形成(例如,关于怎样形成合适的辞典数据库23的详情参见目前在http://www.cogsci.princeton.edu/~wn/上可获的WordNet的网络站点,并且关于怎样设置合适的文档定位器和排序模块25的详情参见美国专利No.6526440),由此,下面将不再更详细说明这些组件,除非是阐明本实施方式的操作所必需的。在这个实施方式中,我们使用WordNet来提供辞典23,该辞典23除了列举有多个单词意义以外,还列举了同义词、反义词、下位词等,并且阐述了单词分级,例如“狗”是“动物”的子类别等。
在本优选实施方式中,用户简档库21存储有关于先前每一个用户在使用搜索服务器时采取的行动的详情,以及关于用户的详情。该库还可以存储对存储在本体数据库中的对相应用户来说是个人化的所述本体或公用本体(或公用本体集)的修改。下面给出了关于这个可能性以及用户先前行动的格式的详情。
在本实施方式中,所述公用本体或每一个公用本体是利用OWL(网络本体语言)(其详情目前可以在http:www.w3.org/TR/owl-features/找到)在数据库22内表示的,然而,任何本体语言都可以用于这个目的。
如公知的,在信息技术领域中,本体是典型地通过采用树状结构排列在一起的多个节点(这使得典型节点具有一个父系节点和一个或更多个子系节点)来形成的。根节点是没有父系节点的特殊节点(它是本体中的所有其它节点的最终父系),并且叶节点是没有子系的特殊节点。每一个节点都具有标注(指定该节点表示什么的单词或短语),并且具有一个或更多个属性(其中每一个都具有其自己的名称和值或值列表等)。除了遗传分级以外,每一个节点还可以指定其与其它节点的关系,例如,狗和猫不相交。
为了例示本体的这个典型排列,图3示出了本实施方式的公用本体的一小部分。这个公用本体的根节点10被标注为“事物”并且没有属性。然而,它具有五个直接子系(这些是例示出的——很自然,它可以另外包含更多没有例示出的直接子系):“公司”节点312、“产品”节点314、“价格”节点316、“货币”节点318以及“产品特征”节点319。“公司”节点312被例示为具有称为“名称”和“地址”的两个属性。一般来说,属性将一值存储为简单文本串或号等,或者存储为本体内的另一概念。如果存储为后者(即,另一概念),则该属性值可以是属于该属性引用的相应节点/概念的个体。“产品”节点314具有标注为“名称”和“说明书”的两个属性。“价格”节点316具有标注为“量”、“比例因子”以及“货币”的三个例示属性。“产品特征”节点319具有标注为“名称”的一个属性。
“货币”节点318没有被例示为具有任何属性,而是被例示为具有两个属于它的个体,即,US美元和UK英镑。“价格”节点316的“货币”属性是引用本体内另一概念/节点的属性的实施例,并且,在图3中所示部分中,由此将取个体“US$”320或者个体“UK£”322作为其值。“公司”节点312具有作为“公司”概念的子概念的两个子系节点,“电子仪器”324和“服务”326。这些子概念中的每一个都继承了其父系节点312的所有性质,以使这些概念中的任一个的任何个体成员都包括属性“名称”和“地址”以及专用于作为一成员的实际子类的属性。在图3中,子节点324被例示为具有一个指定属性“具有产品”。类似的是,“服务”子节点326被例示为具有“具有服务”属性。“产品”节点314被例示具有“移动电话”子节点328,该子节点328具有子属性“具有特征”。
要注意的是,上述图3部分地例示的本体是公用本体。对于个体用户来说,可以通过对该公用本体中包含的概念加以限制或改变来对该公用本体进行个人化。例如,具有属性“具有特征”(以及具有继承属性“名称”和“说明书”)的子概念“移动电话”328可以被个人化成要求该特征中的一个必须是该电话具有至少2K存储器。根据这种个人化,公用“移动电话”概念中的任何具有小于2K存储器的个体都不被视为属于个人化移动电话概念的个体,而是被简单地分类为用于特定用户的产品。这样,当特定用户引用概念“移动电话”时,意指具有至少2K存储器的移动电话。在本实施方式中,为了使这种个人化本体在筛选特定检索数据项中有效,数据源必需按某些方式(举例来说,如,包括根据指定相关性质的方案以机器可读形式列举(举例来说,如通过以XML文档的形式写入)关于数据项的性质的元标签)恰当地结构化。
要注意的是,除了能够经由万维网(WWW)从普通网络服务器获取信息以外,在另选实施方式中,搜索服务器20还可以位于和用户相同的内联网域内,并由此可以另外(或另选地)从内联网内的数据源获取信息,等等。
当用户想要执行搜索时,该用户访问搜索服务器20的网络主页,然后该页面被显示在用户正从其接入搜索服务器的远程终端10的屏幕上。
图4例示(示意性地)了搜索服务器20的主页怎样被显示在远程终端10的屏幕上。如从图4可以看到,如显示在远程终端10上的主页包括用户可以键入搜索查询的文本输入框410。用户随意将任何文本输入文本输入框410中,并且在用户敲击输入/回车键时,由用户输入到文本输入框中的文本被从远程终端10发送至搜索服务器20。
搜索服务器20假定用户输入的文本是诸如短语或句子的自然语言查询。由此考虑下面的实施例查询:
“Mobile phone with message”
当搜索服务器接收到这个消息时,第一步是将查询“分块”(chunk)成短语。存在许多用于执行这种分块的已知算法。在本实施方式中使用的一种算法是基于文本工程通用架构(GATE)的,该算法是在Sheffield大学开发的并由此通常被称为“Sheffield Gate”系统(详情参见http://gate.ac.uk)。利用这种分块算法,上述查询被转换成两个“块”,即,“Mobile phone”和“message”。(注意,对于其他合适的“分块”算法的实施例,参见待审英国专利申请No.0421754.3中的“Key PhraseExtraction”部分)。
搜索服务器20接着尝试将每一个“块”映射至公用(或个人化)本体内的一个或更多个节点。在本实施方式中,映射处理通过首先寻找相应“块”与本体中的任何节点之间的任何直接匹配来执行。如果成功,则存储所述直接匹配节点并且处理结束。如果没有直接匹配,则将“块”分成单词从而被“词干化”(stem)(关于适合词干化算法的详情再次参见http://gate.ac.uk或待审英国专利申请No.0421754.3),并且该算法寻找词干化的单词与本体中的节点之间的部分匹配(例如,假设在节点标注与词干化单词之间只有一个公用单词或部分单词)。如果以这种方式找到一些匹配,则存储每一个匹配节点,并且处理结束。如果没有找到和词干化单词的匹配,则在辞典中寻找词干化单词的任何同义词(即,具有相同含义的单词)并且用于搜索和本体的节点的匹配,如果找到,则在结束处理之前存储它。如果不能找到任何匹配,则将辞典用于寻找词干化单词的通用化和专业化,并将这些用于寻找本体中的匹配节点。如果以这种方式找到一些匹配,则存储每一个匹配节点,并且处理结束。如果没有找到匹配,则处理结束,并且,在本实施方式中,没有选择类别且搜索按完全常规的方式进行,并且以通过某些相关性测量排序的普通未分类结果列表将搜索结果呈现给用户。
因此,在本实施例中,块“Mobile phone”直接匹配至“移动电话”概念/节点328。本实施方式中的(偏向电信)公用本体中的“message”块没有直接匹配至该公用本体中的任何节点/概念。然而,在对“message”执行单词词干化从而得到“messag”之后,将其部分地映射至单独节点334(“messag”部分地被地映射至标注“short message service(短消息业务)”中的单词“message”)和概念/节点340(“messag”部分地被映射至标注“Instant Messaging Application(即时消息接发应用)”中的单词“message”)。
作为匹配处理的一部分,可以采用一些技术以基于作为整体的输入搜索查询的语境使特定匹配优先于其它匹配。可以使用(单独地或组合地)多个不同技术以便获得这种效果。例如,本体本身可以被用于设法确定某些可能匹配是否比其它匹配更适合。例如,在本实施例的公用本体中,节点328(输入查询的第一块已经和其匹配)具有一属性,即,对节点332的引用,节点332具有作为个体成员的节点334(其是第二块的两个可能映射之一)。另一方面,在节点328与340之间不存在这种链接(第二块的另一可能匹配)。基于此,输入查询的第二块“message”到节点334的可能映射,可以优于到节点340的可能映射(当然,这假定Instant Messaging没有作为移动电话特征表示在公用本体中——如果应当更新包括这种特征开始的移动电话而不是更新本体来对此进行反映,则没有一种映射会优于其它映射)。
有助于使一种匹配优于其他匹配的另一技术可以使用关联单词列表的数据库。这种关联单词列表可以例如利用WordNet的一些特征自动地生成(或者预先生成然后存储,或者匆忙生成)。例如,考虑输入查询“software in java”。这个查询将被分块成“software”和“java”。可以在辞典中查找这两项。针对利用WordNet形成辞典的情况,第一项仅具有一个意义,而“java”返回3个不同意义(一个岛,一种咖啡以及一种面向对象的编程语言);可以生成用于每一个意义的关联单词列表(例如,利用三个意义中的每一个的定义,同样可以根据源自针对每一个意义的直接同义词、上位词以及下位词的定义),并接着使用该关联单词列表,以察看第一块(即,“software”)是否出现在这些列表中的任一个中(在这种情况下,它应当仅呈现在与第三个意义相对应的关联单词列表中),并且如果这样,则可以推断用户可能意指该项的含义。在大型通用本体中,很可能单词java的这三个不同意义中的每一个意义都具有其自己的独立的节点/概念。每一个这种节点都可以明确地链接至通过辞典已知的单词java的意义中的对应一种意义,或者另选的是,可以使用从本体内的父系节点(或其他紧密关联节点)中的关联单词列表中寻找其它匹配单词的处理,以将确定的意义匹配至本体中的对应节点。
如果匹配处理成功找到和本体中的节点的某些匹配,则匹配的节点被用作搜索引擎将尝试把搜索结果放于其中的类别。由此,在本实施方式中,将原始搜索查询(例如,“Mobile phone with message”)输入到文档定位器和排序模块25(如上所述,其是简单的常规搜索引擎)中,结果返回“命中”的排序列表。接着,将该排序“命中”输入到文档分类器模块26,该文档分类器模块26使用一算法以尝试将每一个返回的文档分类到匹配类别中的一个。在本实施方式中,分类器使用的算法简单地包括如下内容:存储与本体的每一个节点有关的关键字列表;并且搜索每一个返回的文档以察看它是否包含列出的关键字。如果该文档至少包含最小数量的列出关键字,则它被分类为属于相应的类别。显然,通过例如具有某些反关键字(它们如果存在将使得文档被分类到相应的类别的可能性更小)等,可以有更复杂的规则。而且,关键短语也可以出现在列表中,并且也可以利用关键字或短语之间的距离(按照单词数)来帮助进行分类等。
要注意的是,如果匹配的概念具有子概念(即,子系节点,例如,在概念328的情况下,“移动电话”可以具有诸如“诺基亚”、“索尼爱立信”等的子概念)。在这种情况下,如果可以将任何文档分类到父系概念或者分类到子系概念,则由于子系文档比父系概念/节点更具体故而将该文档分类到子系文档。
图5例示了怎样将本情况下的搜索结果在远程终端10的屏幕上呈现给用户。如在早先的画面中一样,仍旧有文本输入框410,其中继续显示刚输入的搜索查询并且用户可以在任何时候向其中输入新的搜索查询。在文本输入框的下面是结果显示区510。该结果显示区被分成两个子区,左手面板512显示多种类别(对应于公用或个人化本体中的节点)的分级或可展开树状视图,而右手面板514显示与根据最新搜索的命中(如分类在左手面板512中的当前突出的类别中的)相对应的URL。在任何时候,左手面板中所示类别中的一个将被突出(如图5中通过围绕类别“移动电话”的虚线框518),并且可以由用户在任何时候点击到左手面板中的类别中的另一类别上来改变。在本实施方式中,如果用户点击右手面板514中显示的URL中的一个,则通过浏览器应用打开新的窗口,以显示与点击的URL对应的HTML内容(在另选实施方式中,可以将与点击的URL对应的内容显示在代替新窗口的右手面板内)。
读者应当清楚,左手面板512向用户呈现与通过许多操作系统和其它应用提供的经典目录树状结构视图类似的显示,其中,目录和子目录按分级排列的形式排列。然而,本实施方式的左手面板中的显示具有的一个显著差别在于,显示节点的次序以及节点展开的深度是高度可变且可配置的。这和树沿任何特定一个分支或多个分支扩展的深度可变的标准浏览器形成对比(通常,系统将具有针对应当怎样扩展树的一些默认种类设置——例如,通过除包含特定选定文件或目录的分支以外将树保持为尽可能得不扩展,或者通过记住树在相应的应用上次关闭时的准确状态等,可能用户不考虑任何默认设置而手动地确定扩展哪个分支并且扩展至什么程度)。然而,在任何情况下,节点的实际次序在标准的常规浏览器中都不是可变的(并且通常是按字母表次序简单完成的)。与此相反,在本实施方式中,节点出现在左手面板512的树状视图中的次序按这样的方式改变,即,通常将被认为是用户目前最感兴趣的节点呈现在面板的顶部,通常将格外被认为具有相关性更小的节点呈现在左手面板中的更低处。由于仍旧想要将父系节点相应地呈现为比它们的子系节点更高(在本实施方式中)并且向左缩进,故而多少限制了上述方面可以实现的程度。然而,通过将树状视图放入卷动窗格中,可以一定程度地调解这一问题(即,通过将以上最相关节点的父系节点放置在滑动窗格的“顶部”的当前位置,以使得看不见它们,除非用户向上卷动来察看它们)。
在本实施方式中,使用多个策略来设法确定在左手面板中呈现节点的最佳次序,以实现试图将最相关的节点呈现在面板的顶部处的目的。这种方法的最重要之处在于参照如存储在用户简档库21中的相应用户的过去行动。在本实施方式中,将这些简单地存储为三元组<用户id,类别1,类别2>,其中用户id是所关注的用户的唯一标识符,类别1是观看的类别(即,左手面板512中由用户选定并由此突出的类别),而类别2是用户在观看类别1之后观看的下一个类别。将大到一定数量的这些内容存储(采用先入先出的方式)在设置用户简档库21的数据库中。当用户点击左手面板512中的类别时,搜索用户简档库21来寻找相应用户的点击类别表现为类别1的所有三元组。对于不太常用的后续类别来说,如果这些三元组中的一些示出一个类别与其它任何类别相比更经常地出现为类别2,则试图将该类别拉到树状视图列表中尽可能高处,等等。在存在按照类别出现为类别2的频率纠结的情况下,出于排序的目的,最新的三元组优于较旧的三元组。
如果用户首次突出了一类别(或者,在用户简档库21已经删除了任何这种记录的足够长的时间内至少首次),可以将该历史简单地用作关于用户喜欢的类别的一般引导,并且可以将这些呈现为更高次序。然而,在另选实施方式中,首先可以针对观看当前类别的父系或祖父系等类别并且基于针对任何这种祖先类别等的关联类别2项确定可能的嵌套类别的任何先前历史来执行搜索。
下面,再参照图5,移动电话类别是突出518的类别,右手面板在顶部处显示与涉及移动电话和SMS但没有专用于制造者A至D中的任何特定一个的文档有关的URL列表,越不相关的文档(例如,通常涉及移动电话但未引用SMS的那些文档)的URL显示在列表的逐渐越低处。如果用户点击了专用于特定制造商的类别中的一个,则右手面板将改变成专用于该特定制造商的URL列表,还是将越不相关的文档的URL显示在列表的逐渐越低处。要注意的是,分类到SMS类别的URL将对应于相当概括地讨论SMS而非特别关于任何特定类型的移动电话等的文档。而且,要注意的是,按相关性来排序文档是通过常规文档定位器和排序模块基于如上所述的输入搜索查询来执行的。
如上所述,根据用户的过去行动等在动态基础上自动地重构左手面板518中的节点的排列。在本实施方式中,在自用户突出了新的类别起经过了预定时间量之后,或者在用户点击了右手面板514中的URL之后,完成这种重构,然而,在另选实施方式中可以使用其它触发。
如上所述,当左手面板动态地改变而不输入新的搜索查询时,在可能的情况下,将当前类别和用户历史一起使用,以便确定左手面板512中的类别的次序。然而,如果用户没有历史,则当触发左手面板512中的类别的重排列时,和与本体中定义的概念对应的当前页面类别关联的第一属性的类别(例如,移动电话概念328具有如下属性,即具有移动电话特征,其类型为与概念“移动电话特征”332对应的“移动电话特征”的类型)显示在当前关注的类别的正下方。要注意的是,当完成这个时,该类别在某种意义上将出现两次,因为它可在是其属性的突出类别的正下方获得,并且其还可以单独作为表示全部本体的用户能够差不多和普通树状浏览器一样随意导航的树状结构的一部分。
如果历史搜索成功,则将找到的所有第二类别(按照频率和/或晚近的顺序)显示在跟随有先前显示的分级的当前突出的类别之下。作为一实施例,假定用户关注于“索尼产品”类别,并接着触发对左手面板的动态重排列(例如,通过观看与该类别对应的URL),如果用户历史简档示出在观看索尼产品类别之后他通常转至“零售商”类别,则零售商类别将显示在索尼类别之下。在一变型例中,除了下一类别,还显示下一类别的整个下游分级或其一部分。由此,在零售商类别具有干道商店和在线零售商两个子类别的情况下,将这些也显示在零售商类别之下。在代替子类别(或除了子类别以外)特定类别具有个体的情况下,可以将这些显示在类别下面。
要注意的是,用户可能不总是希望左手面板中的树状视图动态地改变,而在这种情况下,他可以设置一选项以使这个特征无效。此外,因为通过搜索服务器生成新的HTML页面并将其发送给远程装置来执行重排列,所以为了在不同排列之间导航以及如果用户希望返回至早先排列等,他可以使用其网络浏览器上的向前按钮和向后按钮。
在一个实施方式中,代替包括表示整个本体以及任何动态地生成的类别的所有节点(最不相关节点“折叠(collapse)”),可以仅显示相关类别。另选的是,左手面板可以显示两个单独的树(具有单独的根节点),其中一个是整个本体(采用折叠形式,以使你仅看到根节点),而另一个正好包含与相应搜索查询相关的类别。
本实施方式中提供的一附加特征是该系统有时可以预见来确定怎样最佳地在左手面板中显示节点分级。这种预见使用来自用户历史的两个后续类别。例如,考虑其中用户搜索大学系部内的内部学生数据库的情况。在这个数据库中,每一个学生都在其详情中包括该学生所上的课程的详情:
学生
  课程:课程
  年:年
系部提供的课程也以分级形式存储在数据库中:
课程
  AI课程
    推理课程
      演绎
      反绎
信息课程
  数据库
  网络
如果用户的历史示出了他经常遵循学生>课程>学生的路线,则当该用户点击左手面板的学生类别时,系统推断该用户可能对于了解如按所上的课程分类的学生感兴趣。同样,针对学生的搜索获得下面出现在左手面板中的显示:
AI学生
  推理课学生
    演绎课学生
    反绎课学生
  信息课学生
    数据库课学生
    网络课学生
其中,类别学生的最恰当的属性(如根据学生的历史简档确定的)已经根据属性的(即,课程的)关联概念(即,课程)的分级而扩展,从而形成复合类别。
要注意的是,这个实施例还例示了本发明怎样可以应用至搜索诸如结构化数据库(例如,关系数据库)的结构化数据源。具体地说,本发明特别适于包括已经利用基于本体的集成装置(如在下面公布的国际专利申请:WO 02/080026;WO 02/080028;WO/02/080029;以及WO 03/0025中描述的集成装置)集成的大量不同数据源的结构化数据源。在这种情况下,代替将如用户输入的原始搜索查询发送到常规的基于关键字的搜索引擎,在利用公用本体或本体集预处理输入的查询以排除不可能的结构化查询等之后根据输入的查询生成结构化查询。上述专利申请提供了关于怎样将自然语言查询转换成恰当的结构化查询集来接入集成的异种数据源集的更多细节,并且由此在这个方面中通过引用并入本申请。自然地,当利用结构化数据源时,已经按照公用本体恰当地分类了该结果,因此不再需要这个处理。然而,利用改变呈现类别的次序的GUI的左手面板向用户呈现信息的方式不受搜索的数据源的性质影响。

Claims (11)

1.一种自动地对电子文档库进行搜索的方法,该方法包括以下步骤:控制用户接口以准许用户输入搜索项;利用所述搜索项执行搜索;将由所述搜索返回的文档分类到多个不同类别;以及控制所述用户接口按使特定类别的文档被分组到一起的分组方式来呈现由所述搜索返回的文档或对其的引用,其中,所述多个类别是根据所述搜索项来选定的。
2.根据权利要求1所述的方法,其中,所述多个类别是通过将所述搜索项与公用本体或本体集一起进行处理而选定的。
3.根据权利要求1所述的方法,其中,所述多个类别是通过将所述搜索项与个人化本体一起进行处理而选定的。
4.根据权利要求3所述的方法,其中,所述个人化本体是通过针对公用本体或本体集内的概念的特定属性或性质的允许值或值的范围设置限制而形成的。
5.根据权利要求2到4中的任一项所述的方法,该方法还包括如下步骤:结合所述本体或本体集中包含的分级信息利用用户先前搜索行动的存储历史,来生成向该用户呈现的新的子类别集,其中,所述新的子类别集是通过如下操作生成的,即,根据基础类别的引用所述本体或本体集中另一概念的属性所引用的所述本体或本体集中的所述概念的存储分级来扩展该属性,从而生成所述基础类别的子类别,由此,随后可以根据选定属性的值将搜索结果分类到所述新生成的子类别中的相应子类别。
6.根据权利要求2到5中的任一项所述的方法,其中,所述多个类别中的至少一个类别或一些类别是通过组合所述本体中的概念来形成复合类别而根据所述本体动态地生成的。
7.根据前述权利要求中的任一项所述的方法,其中,所述搜索是基于关键字的搜索。
8.根据权利要求1到5中的任一项所述的方法,其中,所述搜索项被转换成用于查询一个或更多个关系数据库的结构化查询。
9.一种服务器计算机,该服务器计算机用于辅助用户利用远程装置在存储于连接至服务器和所述远程装置二者所连接的同一数据网络的装置上的该用户可用的文档集中进行搜索,所述服务器包括:用于接收来自远程终端的搜索项的装置;用于利用所述搜索项执行搜索的装置;用于将由所述搜索返回的文档分类到多个不同类别的装置;以及用于向所述远程终端返回输出数据的装置,该装置准许所述远程终端按特定类别的文档被分组到一起的分组方式来向用户呈现由所述搜索返回的文档或对其的引用,其中,所述多个类别是根据所述搜索项来选定的。
10.一种计算机程序或程序组,该计算机程序或程序组用于使得在执行该计算机程序或程序组期间执行根据权利要求1到7中的任一项所述的方法。
11.一种载体装置,该载体装置载带根据权利要求9所述的计算机程序或程序组。
CN2006800039541A 2005-02-03 2006-02-02 用于分类呈现搜索结果的方法和系统 Active CN101116072B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0502259.5 2005-02-03
GBGB0502259.5A GB0502259D0 (en) 2005-02-03 2005-02-03 Document searching tool and method
PCT/GB2006/000359 WO2006082410A1 (en) 2005-02-03 2006-02-02 Method and system for categorized presentation of search results

Publications (2)

Publication Number Publication Date
CN101116072A true CN101116072A (zh) 2008-01-30
CN101116072B CN101116072B (zh) 2011-06-01

Family

ID=34307937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800039541A Active CN101116072B (zh) 2005-02-03 2006-02-02 用于分类呈现搜索结果的方法和系统

Country Status (5)

Country Link
US (1) US7836077B2 (zh)
EP (1) EP1844410A1 (zh)
CN (1) CN101116072B (zh)
GB (1) GB0502259D0 (zh)
WO (1) WO2006082410A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770481A (zh) * 2008-12-31 2010-07-07 北京联想软件有限公司 搜索终端装置、搜索方法
CN102651031A (zh) * 2012-03-31 2012-08-29 百度在线网络技术(北京)有限公司 一种用于提供搜索结果的方法与设备
CN102725758A (zh) * 2010-02-05 2012-10-10 微软公司 生成和呈现横向概念
CN104462471A (zh) * 2014-12-17 2015-03-25 北京奇虎科技有限公司 提供细分搜索结果的方法和装置
CN107679183A (zh) * 2017-09-29 2018-02-09 百度在线网络技术(北京)有限公司 分类器用训练数据获取方法和装置、服务器及存储介质
CN107908762A (zh) * 2017-11-17 2018-04-13 广州慧睿思通信息科技有限公司 一种自定义关键词串并历史数据的方法及系统
CN112783918A (zh) * 2021-03-15 2021-05-11 北京百度网讯科技有限公司 搜索方法、搜索装置、电子设备、存储介质和程序产品
CN113095423A (zh) * 2021-04-21 2021-07-09 南京大学 一种基于在线反绎学习的流式数据分类方法及其实现装置

Families Citing this family (257)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001013255A2 (en) 1999-08-13 2001-02-22 Pixo, Inc. Displaying and traversing links in character array
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US7669134B1 (en) 2003-05-02 2010-02-23 Apple Inc. Method and apparatus for displaying information during an instant messaging session
US7984175B2 (en) 2003-12-10 2011-07-19 Mcafee, Inc. Method and apparatus for data capture and analysis system
US8656039B2 (en) 2003-12-10 2014-02-18 Mcafee, Inc. Rule parser
US8548170B2 (en) 2003-12-10 2013-10-01 Mcafee, Inc. Document de-registration
US7962591B2 (en) * 2004-06-23 2011-06-14 Mcafee, Inc. Object classification in a capture system
US8560534B2 (en) 2004-08-23 2013-10-15 Mcafee, Inc. Database for a capture system
US7949849B2 (en) 2004-08-24 2011-05-24 Mcafee, Inc. File system for a capture system
US7907608B2 (en) 2005-08-12 2011-03-15 Mcafee, Inc. High speed packet capture
US7818326B2 (en) 2005-08-31 2010-10-19 Mcafee, Inc. System and method for word indexing in a capture system and querying thereof
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US7730011B1 (en) 2005-10-19 2010-06-01 Mcafee, Inc. Attributes of captured objects in a capture system
US8504537B2 (en) 2006-03-24 2013-08-06 Mcafee, Inc. Signature distribution in a document registration system
US7958227B2 (en) 2006-05-22 2011-06-07 Mcafee, Inc. Attributes of captured objects in a capture system
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
CA2601154C (en) * 2007-07-07 2016-09-13 Mathieu Audet Method and system for distinguising elements of information along a plurality of axes on a basis of a commonality
ITFI20070177A1 (it) 2007-07-26 2009-01-27 Riccardo Vieri Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento.
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US20090249446A1 (en) * 2007-10-22 2009-10-01 Paul Thomas Jenkins Method and system for managing enterprise content
US8364694B2 (en) 2007-10-26 2013-01-29 Apple Inc. Search assistant for digital media assets
US20090119264A1 (en) * 2007-11-05 2009-05-07 Chacha Search, Inc Method and system of accessing information
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US8412516B2 (en) * 2007-11-27 2013-04-02 Accenture Global Services Limited Document analysis, commenting, and reporting system
US20090157523A1 (en) * 2007-12-13 2009-06-18 Chacha Search, Inc. Method and system for human assisted referral to providers of products and services
US10002189B2 (en) * 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8327272B2 (en) 2008-01-06 2012-12-04 Apple Inc. Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8289283B2 (en) 2008-03-04 2012-10-16 Apple Inc. Language input interface on a device
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100010912A1 (en) * 2008-07-10 2010-01-14 Chacha Search, Inc. Method and system of facilitating a purchase
US8205242B2 (en) 2008-07-10 2012-06-19 Mcafee, Inc. System and method for data mining and security policy management
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9253154B2 (en) 2008-08-12 2016-02-02 Mcafee, Inc. Configuration management for a capture/registration system
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US20100070304A1 (en) * 2008-09-16 2010-03-18 Stephen Ronald Levinson System and method for recognizing medication side effects in patients
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8352268B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8396714B2 (en) 2008-09-29 2013-03-12 Apple Inc. Systems and methods for concatenation of words in text to speech synthesis
US8352272B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for text to speech synthesis
US8355919B2 (en) 2008-09-29 2013-01-15 Apple Inc. Systems and methods for text normalization for text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20100121790A1 (en) * 2008-11-13 2010-05-13 Dennis Klinkott Method, apparatus and computer program product for categorizing web content
US20100121842A1 (en) * 2008-11-13 2010-05-13 Dennis Klinkott Method, apparatus and computer program product for presenting categorized search results
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8850591B2 (en) * 2009-01-13 2014-09-30 Mcafee, Inc. System and method for concept building
US8706709B2 (en) 2009-01-15 2014-04-22 Mcafee, Inc. System and method for intelligent term grouping
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8473442B1 (en) 2009-02-25 2013-06-25 Mcafee, Inc. System and method for intelligent state management
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US8447722B1 (en) 2009-03-25 2013-05-21 Mcafee, Inc. System and method for data mining and security policy management
US8667121B2 (en) 2009-03-25 2014-03-04 Mcafee, Inc. System and method for managing data and policies
US8626784B2 (en) * 2009-05-11 2014-01-07 Microsoft Corporation Model-based searching
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9002857B2 (en) * 2009-08-13 2015-04-07 Charite-Universitatsmedizin Berlin Methods for searching with semantic similarity scores in one or more ontologies
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20180107940A1 (en) * 2010-04-27 2018-04-19 Jeremy Lieberman Artificial intelligence method and apparatus
EP2577495A4 (en) * 2010-05-26 2015-09-16 Cpa Global Patent Res Ltd RESEARCH USING TAXINOMY
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US9104670B2 (en) * 2010-07-21 2015-08-11 Apple Inc. Customized search or acquisition of digital media assets
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
WO2012059119A1 (en) * 2010-11-01 2012-05-10 Krzysztof Adam Kogut Method and system for generating and presenting search results categorized on the basis of the meaning of the content
US8806615B2 (en) 2010-11-04 2014-08-12 Mcafee, Inc. System and method for protecting specified data combinations
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US8838582B2 (en) 2011-02-08 2014-09-16 Apple Inc. Faceted search results
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9104754B2 (en) * 2011-03-15 2015-08-11 International Business Machines Corporation Object selection based on natural language queries
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120246026A1 (en) * 2011-03-23 2012-09-27 Ebay Inc. Method and system of building store product finders
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9858343B2 (en) 2011-03-31 2018-01-02 Microsoft Technology Licensing Llc Personalization of queries, conversations, and searches
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
EP2691877A4 (en) * 2011-03-31 2015-06-24 Microsoft Technology Licensing Llc LEARNING AND CORRECTION OF A CONVERSATIONAL DIALOGUE
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US9454962B2 (en) 2011-05-12 2016-09-27 Microsoft Technology Licensing, Llc Sentence simplification for spoken language understanding
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
DE102011079034A1 (de) 2011-07-12 2013-01-17 Siemens Aktiengesellschaft Ansteuerung eines technischen Systems
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8914398B2 (en) * 2011-08-31 2014-12-16 Adobe Systems Incorporated Methods and apparatus for automated keyword refinement
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US20130246336A1 (en) 2011-12-27 2013-09-19 Mcafee, Inc. System and method for providing data protection workflows in a network environment
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US20130238627A1 (en) * 2012-03-06 2013-09-12 Microsoft Corporation Integrating searches
CA2873210A1 (en) 2012-04-09 2013-10-17 Vivek Ventures, LLC Clustered information processing and searching with structured-unstructured database bridge
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
WO2013185109A2 (en) 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
CN103793381A (zh) * 2012-10-26 2014-05-14 北京品友互动信息技术有限公司 一种分类筛选的方法和装置
WO2014124332A2 (en) 2013-02-07 2014-08-14 Apple Inc. Voice trigger for a digital assistant
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
KR101904293B1 (ko) 2013-03-15 2018-10-05 애플 인크. 콘텍스트-민감성 방해 처리
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
CN105190607B (zh) 2013-03-15 2018-11-30 苹果公司 通过智能数字助理的用户培训
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
JP6163266B2 (ja) 2013-08-06 2017-07-12 アップル インコーポレイテッド リモート機器からの作動に基づくスマート応答の自動作動
US9348945B2 (en) 2013-08-29 2016-05-24 Google Inc. Modifying search results based on dismissal action associated with one or more of the search results
US9355158B2 (en) 2013-08-29 2016-05-31 Google Inc. Modifying search results based on selection of one of the search results
US20150095013A1 (en) * 2013-09-27 2015-04-02 Sonja Zillner Extending Concept Labels of an Ontology
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
GB2521637A (en) * 2013-12-24 2015-07-01 Ibm Messaging digest
CN104866498A (zh) * 2014-02-24 2015-08-26 华为技术有限公司 一种信息处理方法及装置
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
JP6550215B2 (ja) * 2014-07-29 2019-07-24 シャープ株式会社 表示装置、表示方法、表示プログラム、サーバ、およびネットワークシステム
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10387834B2 (en) * 2015-01-21 2019-08-20 Palantir Technologies Inc. Systems and methods for accessing and storing snapshots of a remote application in a document
RU2596599C2 (ru) * 2015-02-03 2016-09-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Система и способ создания и использования пользовательских онтологических моделей для обработки пользовательского текста на естественном языке
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ131399A0 (en) * 1999-06-30 1999-07-22 Silverbrook Research Pty Ltd A method and apparatus (NPAGE02)
US5857179A (en) * 1996-09-09 1999-01-05 Digital Equipment Corporation Computer method and apparatus for clustering documents and automatic generation of cluster keywords
US6385600B1 (en) * 1997-04-03 2002-05-07 At&T Corp. System and method for searching on a computer using an evidence set
US5924090A (en) * 1997-05-01 1999-07-13 Northern Light Technology Llc Method and apparatus for searching a database of records
US6385602B1 (en) 1998-11-03 2002-05-07 E-Centives, Inc. Presentation of search results using dynamic categorization
WO2001046870A1 (en) 1999-12-08 2001-06-28 Amazon.Com, Inc. System and method for locating and displaying web-based product offerings
AU2001296216A1 (en) * 2000-07-20 2002-02-05 Labvelocity, Inc. Integrated lab management system and product identification system
US20090018891A1 (en) * 2003-12-30 2009-01-15 Jeff Scott Eder Market value matrix
US6961731B2 (en) 2000-11-15 2005-11-01 Kooltorch, L.L.C. Apparatus and method for organizing and/or presenting data
EP1217542A1 (en) 2000-12-21 2002-06-26 Motorola, Inc. Communication system, communication unit and method for personalising communication services
KR20040013097A (ko) * 2001-07-04 2004-02-11 코기줌 인터메디아 아게 카테고리 기반의 확장가능한 대화식 문서 검색 시스템
US20030131070A1 (en) * 2002-01-10 2003-07-10 International Business Machines Corporation Customization of information from web sites
US20030088553A1 (en) 2002-11-23 2003-05-08 Emergency 24, Inc. Method for providing relevant search results based on an initial online search query
US20050154723A1 (en) * 2003-12-29 2005-07-14 Ping Liang Advanced search, file system, and intelligent assistant agent
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770481A (zh) * 2008-12-31 2010-07-07 北京联想软件有限公司 搜索终端装置、搜索方法
CN102725758A (zh) * 2010-02-05 2012-10-10 微软公司 生成和呈现横向概念
CN102725758B (zh) * 2010-02-05 2016-03-02 微软技术许可有限责任公司 生成和呈现横向概念
CN102651031A (zh) * 2012-03-31 2012-08-29 百度在线网络技术(北京)有限公司 一种用于提供搜索结果的方法与设备
CN104462471A (zh) * 2014-12-17 2015-03-25 北京奇虎科技有限公司 提供细分搜索结果的方法和装置
US11238310B2 (en) 2017-09-29 2022-02-01 Baidu Online Network Technology (Beijing) Co., Ltd. Training data acquisition method and device, server and storage medium
CN107679183A (zh) * 2017-09-29 2018-02-09 百度在线网络技术(北京)有限公司 分类器用训练数据获取方法和装置、服务器及存储介质
CN107679183B (zh) * 2017-09-29 2020-11-06 百度在线网络技术(北京)有限公司 分类器用训练数据获取方法和装置、服务器及存储介质
US10936906B2 (en) 2017-09-29 2021-03-02 Baidu Online Network Technology (Beijing) Co., Ltd. Training data acquisition method and device, server and storage medium
CN107908762A (zh) * 2017-11-17 2018-04-13 广州慧睿思通信息科技有限公司 一种自定义关键词串并历史数据的方法及系统
CN112783918A (zh) * 2021-03-15 2021-05-11 北京百度网讯科技有限公司 搜索方法、搜索装置、电子设备、存储介质和程序产品
CN113095423A (zh) * 2021-04-21 2021-07-09 南京大学 一种基于在线反绎学习的流式数据分类方法及其实现装置
CN113095423B (zh) * 2021-04-21 2024-05-28 南京大学 一种基于在线反绎学习的流式数据分类方法及其实现装置

Also Published As

Publication number Publication date
US7836077B2 (en) 2010-11-16
CN101116072B (zh) 2011-06-01
WO2006082410A1 (en) 2006-08-10
EP1844410A1 (en) 2007-10-17
GB0502259D0 (en) 2005-03-09
US20080140657A1 (en) 2008-06-12

Similar Documents

Publication Publication Date Title
CN101116072B (zh) 用于分类呈现搜索结果的方法和系统
JP5546731B2 (ja) 検索方法及び検索システム
US20170177713A1 (en) Systems and Method for Searching an Index
US20170228469A1 (en) Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
US7272595B2 (en) Information search support system, application server, information search method, and program product
CN101124576B (zh) 集成有来自信任网络的用户注释的搜索系统和方法
RU2335013C2 (ru) Способы и системы для улучшения ранжирования поиска с использованием информации о статье
US20130013616A1 (en) Systems and Methods for Natural Language Searching of Structured Data
CN101685444B (zh) 用于实现元数据搜索的系统和方法
US7860857B2 (en) Digital data processing apparatus and methods for improving plant performance
CN101782998A (zh) 一种违规在线产品信息的智能判断方法与系统
KR20100094021A (ko) 이동통신 단말기와 아이피 기반 정보 단말기를 이용한 맞춤, 지능형 심볼, 아이콘 인터넷 정보 검색시스템
CN102902738A (zh) 使用内联上下文查询的搜索系统及方法
CN102063453A (zh) 一种用于基于用户的需求进行搜索的方法和设备
CN1487452A (zh) 在一个或多个网络上进行通用搜索管理的系统
US20070271228A1 (en) Documentary search procedure in a distributed system
CN102722501A (zh) 搜索引擎及其实现方法
TW200928815A (en) System and method for history clustering
CN101164067B (zh) 通过合并用户输入信息来进行搜索的方法和系统
JP4769822B2 (ja) ページグループを用いた情報検索サービス提供サーバー、方法及びシステム
JP2006099341A (ja) 更新履歴生成装置及びプログラム
CN107025261B (zh) 主题网络语料库
CN101866340A (zh) 一种产品情报的在线检索和智能分析方法与系统
JP2004206492A (ja) ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置
WO2002041182A1 (fr) Systeme et procede de distribution de nouvelles interessantes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant