CN110287411A - 用于快速提供信息的方法和设备 - Google Patents

用于快速提供信息的方法和设备 Download PDF

Info

Publication number
CN110287411A
CN110287411A CN201910491582.0A CN201910491582A CN110287411A CN 110287411 A CN110287411 A CN 110287411A CN 201910491582 A CN201910491582 A CN 201910491582A CN 110287411 A CN110287411 A CN 110287411A
Authority
CN
China
Prior art keywords
information
result
search
source
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910491582.0A
Other languages
English (en)
Inventor
埃里克·利安德里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qwant SAS
Original Assignee
Qwant SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qwant SAS filed Critical Qwant SAS
Publication of CN110287411A publication Critical patent/CN110287411A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

公开了一种快速提供相关信息的方法和设备。该方法包括:‑由用户输入多个关键字的步骤;‑根据关键字的输入组合而确定搜索上下文的步骤;‑搜索包括与一个所述关键字相关联的至少一个字的、网络上可访问的页面的步骤(310);‑根据页面内容确定结果上下文的步骤;‑确定从网络上可访问的信息源到所述网络上可访问的另一信息源的信息复制的步骤;‑给所述信息从中被复制的源分配比所述信息的副本被放置的源更高的权重的步骤;‑根据搜索上下文和搜索的每个结果的上下文的对应以及源的权重而将搜索结果按等级排列的步骤(315);以及‑显示按等级排列的结果的步骤(325)。

Description

用于快速提供信息的方法和设备
本申请是2013年3月15日提交的申请号为PCT/FR2013/050536,标题为“用于快速提供信息的方法和装置”的专利申请的分案申请,上述专利申请于2014年11月18日进入中国国家阶段并且相应的申请号为201380026019.7。
技术领域
本发明涉及一种用于快速提供信息的方法和设备。其尤其应用于计算机网络诸如因特网上的搜索引擎。
背景技术
现在,信息的可访问性和可理解性已经成为该信息在计算机网络诸如英特网上可用的主要技术问题。
通过最知名的搜索引擎的关键字搜索,例如文件WO 2007/046830中描述的搜索引擎,给出一系列响应,每个响应采取如下形式:与超链接相关联的标题;通过该链接可访问的页面的摘录,该摘录包括若干个选择的关键字;和可能地日期和URL(统一资源定位符的缩写)地址。然而,该系列响应的顺序取决于由搜索引擎管理者做出的选择,例如由与社交网站竞争的效果或业务关系所指示的选择。因此,在重新复制前,先着手于观点以及以有用的、目标信息或初始信息为代价的多个信息副本。
此外,为了发现可用的信息和对其分配关键字,机器人在几星期的周期内一个接一个地浏览网站。
因此,如此可用的信息通常既不充分新近也不充分相关。
发明内容
本发明的目标是解决这些缺陷。
为此,根据第一方面,本发明设想一种用于快速提供相关信息的方法,该方法包括:
-由用户输入多个关键字的步骤;
-根据关键字的输入组合确定搜索上下文的步骤;
-搜索网络上可访问的且包括与一个所述关键字相关联的至少一个字的页面的步骤;
-根据页面内容确定结果上下文的步骤;
-确定从网络上可访问的信息源到所述网络上可访问的另一信息源的信息复制的步骤;
–对从中所述信息被复制的源分配比所述信息的副本被放置的源更高的权重的步骤;
-根据搜索上下文和搜索的每个结果的上下文的以及源的权重而将搜索结果按等级排列的步骤;以及
-显示按等级排列的结果的步骤。
由于这些规定,
-用户在字具有若干含义时不必指定该字的特定含义;
–对例如社交网络上消息的作者或站点的源自动分派比复制内容的另一作者或站点更高的权重。应当指出,与站点相关联的权重被至少部分地应用于站点的所有页面。类似地,与作者相关联的权重被至少部分地应用于由该作者发出的所有消息。
由于权重和显示等级之间的关联,因此有利于内容的原始来源。
在一些实施方式中,确定信息复制的步骤包括:
-存储信息、与所述信息相关联的时间戳和所述信息的源的步骤,其中从所述源获得对所述信息的访问;以及
-比较所存储的信息以检测信息之间的相似性的步骤,并且如果检测到两个信息之间的相似性,则
–对与最早时间戳相关联的源分配更高的权重的步骤。
在一些实施方式中,在比较步骤中,根据所述信息之间的连续相似字符的数量来检测相似性。
在一些实施方式中,在比较步骤中,根据所述信息之间的相似字的级别来检测相似性。
在一些实施方式中,在比较步骤中,根据所述信息之间的连续相似字符的数量和所述相似字之间的距离来检测相似性。
由于这些规定的每一个,快速检测到信息的副本。
在一些实施方式中,在对从中信息被复制的源分配权重的步骤中,分配给源的权重是副本确定步骤中所确定的信息的副本数量的非常量增函数。
因此,具有许多追随者的内容作者给他们的消息提供比没有或很少追随者的作者更高的权重。
由于这些规定,对例如社交网络上消息的作者或站点的源自动分派比复制内容的另一作者或站点更高的权重。应当指出,与站点相关联的权重被至少部分地应用于站点的所有页面。类似地,与作者相关联的权重被至少部分地应用于由该作者发布的所有消息。
由于权重和显示等级之间的关联,因此有利于内容的原始来源。
在一些实施方式中,作为本发明主题的方法包括:
-创建多组网络上可访问的信息源的步骤;
-由用户输入至少一个主关键字的步骤;
-搜索包括与一个所述主关键字相关联的至少一个字的、所述信息源中的页面的步骤;
-根据从中获得结果的多组信息源而将搜索结果进行分组的步骤;
-根据源的权重,在对应于不同信息源组的每组结果中,将搜索结果按等级排列的步骤;以及
-分别显示每组结果的步骤。
由于这些规定,用户能够并行查看例如来自在线信息站点、在线商业站点、社交网络站点和其他网站的结果。
在一些实施方式中,每组信息源对应于一组相似活动性站点。
在一些实施方式中,创建多组信息源的步骤包括在相关语义索引中存储多组站点的步骤,将结果进行分组的步骤利用索引中所保存的所述组。
在一些实施方式中,多组站点的创建取决于存在于所述站点上的信息,将结果进行分组的步骤利用所述多组站点。
例如,站点上的大量价格的存在允许其与在线商业站点分组在一起。
在一些实施方式中,在选择附加信息的步骤中,用户关于一组结果而选择所述附加信息,并且在将搜索结果按等级排列的第二步骤中,只有所述结果组中的结果才被按等级排列。
由于这些规定,用户选择信息源的类型。此外,该方法是特别快速的,因为第二按等级排列步骤只涉及单组结果中的结果。
在一些实施方式中,在至少一个按等级排列步骤中,利用主关键字的加权。
在一些实施方式中,在至少一个按等级排列步骤中,附加信息与具有比每个主关键字的权重更低权重的至少一个关键字对应。
在一些实施方式中,在选择附加信息的步骤中,用户输入至少一个次级关键字,每个次级关键字在第二按等级排列步骤中具有比每个主关键字更低的权重。
在一些实施方式中,作为本发明主题的方法包括根据搜索步骤的结果页面的内容的分类步骤,并且在选择附加信息的步骤中,用户选择类别,第二按等级排列步骤给予对应于所选类别的页面更高的等级。
在一些实施方式中,作为本发明主题的方法包括根据托管搜索步骤的每个结果页面的服务器的分类步骤,并且在选择附加信息的步骤中,用户选择服务器类别,第二按等级排列步骤给予对应于所选类别的页面更高的等级。
应当指出,每个服务器类别可以被该服务器所在的国家识别。
在一些实施方式中,在选择附加信息的步骤中,用户选择过滤器,并且在第二按等级排列步骤中,不对应于过滤器的页面具有比对应于过滤器的页面更低的权重。
在一些实施方式中,在选择附加信息的步骤中,用户选择搜索结果,该方法包括根据所选结果而确定次级关键字的步骤,并且在第二按等级排列步骤中,每个次级关键字具有比每个主关键字更低的权重。
在一些实施方式中,作为本发明主题的方法包括:
-根据执行搜索处的多组信息源而将搜索结果分组的步骤;
-在与站点的不同组相对应的每组结果中将搜索结果按等级排列的步骤;以及
-分别显示每组结果的步骤。
由于这些规定,用户能够并行查看来自例如在线信息站点、在线商业站点、社交网络站点和其他网站的结果。
在一些实施方式中,每个信息源组对应于相似活动性的一组站点。
在一些实施方式中,作为本发明主题的方法包括根据存在于所述站点上的信息将站点分组的步骤,将结果分组的步骤利用所述多组站点。
例如,站点上大量价格的存在允许其与在线商业站点分组在一起。
根据第二方面,本发明设想了一种用于快速提供相关信息的设备,该设备包括由用户输入多个关键字的装置,其特征在于,该设备还包括:
–用于根据关键字的输入组合确定搜索上下文的装置;
–用于搜索网络上可访问的且包括与一个所述关键字相关联的至少一个字的页面的装置;
–用于根据页面内容确定结果上下文的装置;
–用于确定从网络上可访问的信息源到所述网络上可访问的另一信息源的信息复制的装置;
–用于对从中所述信息被复制的源分配比所述信息的副本被放置的源更高的权重的装置;
–用于根据搜索的上下文和搜索的每个结果的上下文的对应以及源的权重而将搜索结果按等级排列的装置;以及
–用于显示按等级排列的结果的装置。
由于该设备的特定特征、优点和目标与作为本发明的第一方面的主题的方法的特定特征、优点和目标类似,因此这里不再对其重复。
根据第三方面,本发明设想了一种用于快速提供相关信息的方法,该方法包括:
-由用户输入至少一个主关键字的步骤;
-搜索网络上可访问的且包括与一个所述主关键字相关联的至少一个字的页面的步骤;
-将搜索结果按等级排列的第一步骤;
-显示来自所述搜索步骤的、在第一按等级排列步骤中具有高等级的结果的步骤;
-由所述用户选择附加信息的步骤;
-根据所述附加信息将搜索结果按等级排列的第二步骤;以及
-显示来自所述搜索步骤的、在第二按等级排列步骤中具有高等级的结果的步骤。
由于这些规定,用户能够逐渐细化搜索以快速获得他正在搜索的相关信息的显示。
根据特定特征,在至少一个按等级排列步骤中,利用主关键字的加权。
根据特定特征,在至少一个按等级排列步骤中,附加信息对应于具有比每个主关键字的权重更低的权重的至少一个关键字。
根据特定特征,在选择附加信息的步骤中,用户输入至少一个次级关键字,每个次级关键字在第二按等级排列步骤中具有比每个主关键字更低的权重。
根据特定特征,作为本发明主题的方法包括根据搜索步骤的结果页面的内容的分类步骤,并且在选择附加信息的步骤中,用户选择类别,第二按等级排列步骤给予对应于所选类别的页面更高的等级。
根据特定特征,作为本发明主题的方法包括根据托管搜索步骤的每个结果页面的服务器的分类步骤,并且在选择附加信息的步骤中,用户选择服务器类别,第二按等级排列步骤给予对应于所选类别的页面更高的等级。
应当指出,每个服务器类别能够被该服务器所在的国家识别。
根据特定特征,在选择附加信息的步骤中,用户选择过滤器,并且在第二按等级排列步骤中,不对应于过滤器的页面具有比对应于过滤器的页面更低的权重。
根据特定特征,在选择附加信息的步骤中,用户选择搜索结果,该方法包括根据所选结果确定次级关键字的步骤,并且在第二按等级排列步骤中,每个次级关键字具有比每个主关键字更低的权重。
根据第四方面,本发明设想了一种用于快速提供相关信息的设备,该设备包括:
–用于由用户输入至少一个主关键字的装置;
–用于搜索网络上可访问的、且包括与一个所述主关键字相关联的至少一个字的页面的装置;
–用于将搜索结果按等级排列的第一装置;
–用于显示来自搜索的、具有由第一按等级排列装置分配的高等级的结果的装置;
–用于由所述用户选择附加信息的装置;
–用于根据所述附加信息将搜索结果按等级排列的第二装置;以及
–用于显示来自搜索的、具有由第二按等级排列装置分配的高等级的结果的装置。
由于该设备的特定特征、优点和目标与作为本发明第三方面的主题的方法的特定特征、优点和目标类似,所以这里不再对其重复。
根据第五方面,本发明设想了一种用于快速提供相关信息的方法,该方法包括:
-创建网络上可访问的多组信息源的步骤;
-由用户输入至少一个主关键字的步骤;
-搜索所述信息源中的、且包括与一个所述主关键字相关联的至少一个字的页面的步骤;
-根据从中获得结果的多组信息源而将搜索结果进行分组的步骤;
-在与信息源的不同组相对应的每组结果中将搜索结果按等级排列的步骤;以及
-分别显示每组结果的步骤。
由于这些规定,用户能够并行查看例如来自在线信息站点、在线商业站点、社交网络站点和其他网站的结果。
在一些实施方式中,每组信息源对应于相似活动性的一组站点。
在一些实施方式中,创建多组信息源的步骤包括在数据库中存储多组站点的步骤,将结果分组的步骤利用数据库中保存的所述组。
在一些实施方式中,多组站点的创建取决于存在于所述站点上的信息,将结果分组的步骤利用所述多组站点。
例如,站点上大量价格的存在允许其与在线商业站点分组在一起。
根据第六方面,本发明设想了一种用于快速提供相关信息的设备,该设备包括:
–用于创建网络上可访问的多组信息源的装置;
–用于由用户输入至少一个主关键字的装置;
–用于搜索所述信息源中的、且包括与一个所述主关键字相关联的至少一个字的页面的装置;
–用于根据从中获得结果的多组信息源而将搜索结果进行分组的装置;
–用于在与信息源的不同组相对应的每组结果中将搜索结果按等级排列的装置;以及
–用于分别显示每组结果的装置。
由于该设备的特定特征、优点和目标与作为本发明第五方面的主题的方法的特定特征、优点和目标类似,因此这里不再对其重复。
根据第七方面,本发明设想了一种用于快速提供相关信息的方法,该方法包括:
-确定从网络上可访问的信息源到所述网络上可访问的另一信息源的信息复制的步骤;
–对从中所述信息被复制的源分配比所述信息的副本被放置的源更高的权重的步骤;
-搜索网络上可访问的、且包括与一个所述主关键字相关联的至少一个字的页面的步骤;
-利用源的所述权重、将搜索结果按等级排列的步骤;以及
-显示按等级排列的结果的步骤。
由于这些规定,例如社交网络上消息的作者或站点的源被自动分派比复制内容的另一作者或站点更高的权重。应当指出,与站点相关联的权重被至少部分地应用于站点的所有页面。类似地,与作者相关联的权重被至少部分地应用于由该作者发布的所有消息。
由于权重和显示等级之间的关联,因此有利于内容的原始来源。
在一些实施方式中,确定信息复制的步骤包括:
-存储信息,与所述信息相关联的时间戳和从中获得对所述信息的访问的所述信息的源的步骤;以及
-比较所存储的信息以检测信息之间的相似性的步骤,以及如果检测到两个信息之间的相似性,则对与最早时间戳相关联的源分配更高权重的步骤。
在一些实施方式中,在比较步骤中,根据所述信息之间的连续相似字符的数量来检测相似性。
在一些实施方式中,在比较步骤中,根据所述信息之间相似字的级别来检测相似性。
在一些实施方式中,在比较步骤中,根据所述信息之间的连续相似字符的数量和所述相似字之间的距离来检测相似性。
由于这些规定中的每一个,快速检测到信息的副本。
在一些实施方式中,在对从中信息被复制的源分配权重的步骤中,分配给源的权重是在副本确定步骤中所确定的信息的副本数量的非常量增函数。
因此,具有许多追随者的内容作者给他们的消息提供比没有或很少追随者的作者更高的权重。
根据第八方面,本发明设想了一种用于快速提供相关信息的设备,该设备包括:
–用于确定从网络上可访问的信息源到所述网络上可访问的另一信息源的信息复制的装置;
–用于对从中所述信息被复制的源分配比所述信息的副本被放置的源更高的权重的装置;
–用于搜索网络上可访问的、且包括与一个所述主关键字相关联的至少一个字的页面的装置;
–用于利用源的所述权重而将搜索结果按等级排列的装置;以及
–用于显示按等级排列的结果的装置。
由于该设备的特定特征、优点和目标与作为本发明第七方面的主题的方法的特定特征、优点和目标类似,因此这里不再对其重复。
根据第九方面,本发明设想了一种用于快速提供相关信息的方法,该方法包括:
-由用户输入多个关键字的步骤;
-根据关键字的输入组合确定搜索上下文的步骤;
-搜索网络上可访问的、且包括与一个所述关键字相关联的至少一个字的页面的步骤;
-根据页面内容确定结果上下文的步骤;
-根据搜索上下文和搜索的每个结果的上下文的对应而将搜索结果按等级排列的步骤;以及
-显示按等级排列的结果的步骤。
由于这些规定,当字具有若干含义时,用户不必指定该字的特定含义。
根据第十方面,本发明设想了一种用于快速提供相关信息的设备,该设备包括:
–用于由用户输入多个关键字的装置;
–用于根据关键字的输入组合确定搜索上下文的装置;
–用于搜索网络上可访问的、且包括与一个所述关键字相关联的至少一个字的页面的装置;
–用于根据页面内容确定结果上下文的装置;
–用于根据搜索上下文和搜索的每个结果的上下文的对应而将搜索结果按等级排列的装置;以及
–用于显示按等级排列的结果的装置。
由于该设备的特定特征、优点和目标与作为本发明第九方面的主题的方法的特定特征、优点和目标类似,因此这里不再对其重复。
本发明的各个方面的原理或特定特征是本发明的其他方面的特定特征。本发明的各个方面的原理和特定特征优选地被组合以在单个搜索引擎中获得针对这些方面中的每一个而描述的所有优点。
附图说明
参照附图,本发明的其他优点、目标和特定特征在阅读下面作为非限制性示例的描述之后将变得显而易见,其中:
-图1示意性地示出了由作为本发明主题的方法的特定实施方式利用的界面;
-图2示意性地示出了服务器的网络;以及
-图3以逻辑图的形式示出了作为本发明主题的搜索方法的实施方式中所利用的步骤;
-图4以逻辑图的形式示出了在图3所示步骤之一中所利用的步骤。
具体实施方式
图1示出了出现在终端例如个人计算机、智能电话或平板的屏幕上的用户界面105。在该界面中,在顶部,有关联于浏览器的栏110、地址栏115和下拉菜单和/或图标的栏120,其中,在网站上利用浏览器访问界面105,地址栏115表示提供界面105的服务器的电子地址(“URL”)。
在主窗口中,示出了利用来自搜索的响应的链接可访问的页面的斜动态预览125。这些预览是活动的。例如,预览使得能够看到视频或动画是否在每个预览的页面上。术语“斜”在此意为页面被表示为梯形,页面离界面105的中心越远,该梯形就变得横向越窄。
在预览125的中心处是所选页面的动态预览130。通过使指点设备例如鼠标的光标在动态预览之一上经过来选择该页面。以这种方式,用户能够横向滚动通过利用来自搜索的响应的链接可访问的页面。通过在这些页面之一上点击,用户使新的标签或新的窗口打开并且访问所选页面的大版面显示。可替选地,通过在预览页面之一上点击,显示搜索结果的标签被显示所选页面的标签所代替。
在预览130下面,存在用于至少输入主关键字的区域100。在该区域100中,由用户输入一个或更多个关键字。位于区域100下面的矩形按钮(未标号)和键盘的“输入”键允许要开始的搜索。
在预览125的左边,存在显示动态类型和动态国家的窗口140。动态类型通过在对应于主关键字的响应中标识既不罕见也不很常见的字来构成的。例如,类型由除低意义字列表中的字例如“因为”、“有时”等之外的、少于响应的70%中和多于页面的20%中发现的字构成。国家例如是通过采取其中存在托管响应页面的最大数量服务器的九个国家来选择的。
应当指出,类型和国家对应于搜索的内容源的两种类型:
-第一,根据搜索步骤的结果页面的内容执行分类,对于对应于所选类型的页面,等级水平更高;
-第二,根据托管搜索步骤的每个结果页面的服务器执行分类,对于对应于所选类型的页面,等级水平更高。
应当指出,每个服务器类型可以由该服务器所在的国家标识。在变型中,根据站点域名确定国家,其在终端路由器和/或网络上的地址允许在该服务器上托管的内容能够被访问。
当然,当搜索规范被修改时,通过在区域100中替换关键字或通过附加搜索限定,如下所述,国家和类型的列表被自动改变。关键字输入上执行的搜索不仅执行在这些关键字上被执行,还在接近的关键字上被执行,例如限定词的复数或阴性(例如,输入“candidat”也导致在关键字“candidate”、“candidats”和“candidates”上搜索)和相关字(“candidature”)。利用同义字(“applicant”)进行搜索被添加于此。为此,利用包含相关字或同义字和/或字群集的字典,并且其中,利用对由用户执行的搜索的响应来动态地确定字之间的距离。
此外,相对于文本的开始,页面上存在的每个关键字的距离被用作相关性的指标:关键字越接近文本的开始,响应被认为越相关。用相同的方式使用两个关键字之间的距离:它们在页面文本中越接近,该页面被认为越相关。
通过在窗口中显示的国家名或这些类型之一上点击,搜索被改变和/或结果被分类,使得只显示包括由所选类型限定的字或所选国家中托管的页面的响应。
在界面105的右边,滚动条135已知地表示屏幕上显示的界面105的部分。通过选择和移动该滚动条,用户使界面105从顶部到底部竖直滚动。
四个区域145显示四个搜索组并且在响应的四个组160之上。例如,最左边的区域145显示因特网(“网站”)并且指定位于该区域145下面的组160的响应是网站页面。入口区域100左边的区域145显示年表(“长期的”)并且指定位于该区域145下面的组160的响应是报纸站点上公布的最新信息。入口区域100右边的区域145显示社交网络(“社交的”)并且指定位于该区域145下面的组160的响应是社交网络站点上公布的最新信息。优选地,自响应公布以来经过的时间的指示与该响应相关联。最后,最右边的区域145显示购物年表(“购物”)并且指定位于该区域下面的组160的响应是在商业站点上获得的结果。
默认地,至少对于与社交网络和在线报纸相对应的结果的组160,在组160的顶部显示已经更新的响应。根据响应的相关性,尤其通过利用显式输入(通过在区域100或145之一中输入)或隐式输入(如下所述,通过选择类型或国家或通过选择结果)的关键字的加权,可以组织与互联网和在线商业站点相对应的结果的组160。
通过在区域145之一中输入至少一个关键字,在搜索结果之中,用户开始在与该区域145相对应的组160中搜索包括输入的每个新关键字的响应。因此,在入口区域100中输入的每个关键字具有权重,在搜索中,该权重高于区域145中输入的字的权重。应当指出,其他区域145和组160不受在区域145中输入关键字的影响。
因此,在一些实施方式中,在选择附加信息的步骤中,用户选择关于一组结果的附加信息,并且在将搜索结果按等级排列的第二步骤中,优选地只有所述结果组中的结果被按等级排列。
位于入口区域100下面的窗口155显示过滤器的类型,用户可以将该过滤器应用于搜索结果以改进所显示的结果的相关性。例如,这些过滤器是“all(全部)”、“Facebook”(注册商标)、“twitter”(注册商标)、“YouTube”(注册商标)、“Sort(分类)”、“Newest(最新)”、“Oldest(最老)”、“Display(显示)”、“Grid(栅格)”和“Lines(线)”。除了是默认值的“all”之外,这些过滤器执行分类,不分类:
-选择“Facebook”分类过滤器仅导致来自在源于社交网络的结果组中所显示的“Facebook”站点的结果;
-选择“Twitter”分类过滤器仅导致来自在源于社交网络的结果组中所显示的“Twitter”站点的结果;
-选择“YouTube”分类过滤器仅导致来自在源于社交网络的结果组中所显示的“YouTube”站点的结果;
-选择“Sort”分类过滤器允许访问除了窗口155中显示的那些分类过滤器之外的分类过滤器以及其中值可以被改变的分类参数;
-选择“Newest”分类过滤器,即默认值,导致最近更新的页面被显示在搜索结果的组160中;
-选择“Oldest”分类过滤器,即默认值,导致最早更新的页面被显示在搜索结果的组160中;
-选择“Display”分类过滤器允许访问除了界面105中所显示的那些显示类型之外的显示类型以及其中值可以被改变的显示参数;
-选择“Grid”分类过滤器,即默认值,允许结果以栅格形式显示,如图1所示;
-选择“Lines”分类过滤器允许获得的结果如在传统搜索引擎中那样被逐行显示。分类的类型例如适于具有比个人计算机和PC平板相对更小屏幕的智能电话。
因此,在窗口140或155中或在区域145中,用户可以选择增加通过在输入区域100中输入关键字而最初执行的分类。
当以这种方式细化搜索时,或者当搜索结果之一被点击时,所选页面的标题中的重要字自动形成附加关键字,附加关键字具有比在区域145或入口区域100中所输入的关键字更低的权重,并且搜索结果显示被修改以考虑这些权重。
最后,根据由执行相同搜索或类似搜索的先前用户做出的选择以及由用户在社交网络上做出的推荐,利用响应的流行级别。因此,这些推荐影响每一列,因为它们可以涉及因特网站点、在线报纸站点或在线商业站点。类似地,tweet(twitter站点上发送的消息)的副本给予原始tweet权重。因此,该复制的tweet出现在社交网络站点上所获得的结果的组160中。类似地,具有许多追随者的内容作者给他们的消息提供比没有追随者的作者更高的权重。
为了从他们的追随者区分原始作者或“领导者”,信息副本被处理以形成树形结构。该实时处理产生历史记录并且找到副本。因此,其形成树形结构。信息在虚拟世界中出现之后还使得能够将领导者和追随者区分开。由第一发送的消息具有比由第二发出的消息更高的权重。
最后,通过使用作者在职业社交网络例如LinkedIn或Viadeo(注册商标)上的人物简介,可以知道作者的相关性。以这种方式,关键字通过概念(例如,“人”、“公司”、“地理”或“国家”)而被编索引。因此,关于“Victor Hugo”的搜索将给出具有相同名字的作者的结果,并且将排除街名“Victor Hugo”。利用上下文分析以实现该通过概念进行这种分类。因此,页面中一起出现“Victor Hugo”和“Misérables”将概念“人”分配给“Victor Hugo”,而页面中一起出现“Victor Hugo”和“Butcher”将概念“地理”分配给“Victor Hugo”。
图2示出了网络205例如利用互联网协议“IP”链接在一起的互联网、配备有浏览器235的咨询终端230、一组互联网服务器210、一组在线报纸站点服务器215、一组社交网络服务器220和一组在线商业站点225。
当由用户开启搜索时,并行地在组210至225中的每一个上执行该搜索,并且相应结果被显示在图1所示的结果组160中。
剩下的描述给出了作为本发明主题的方法的各种实施方式的其他优点和技术特征。
为了获得以上所描述的结果,智能搜索引擎从其用户学习如下:
-每个新请求被添加到前一个请求并且增加结果的相关性;
-方法可以包括使用用户数据(所有社交网络上宣布的兴趣)以细化其结果并且响应“Where can I go this evening(今晚我能去哪)?”这样的问题。
方法还可以包括实时扫描和对任何数据源编索引:
–Web(网站、新闻、照片、视频等);
-社交网络;
-在线存储空间(Dropbox、SugarSync,注册商标)、硬盘等。
方法还可以包括建立和制造用于用户可用的联网和交换的平台。正如搜索工具是不完美的,“社交网络”也具有其限制:这些限制中最重要限制源自这一事实:大部分互联网用户不分享与其“朋友”相同的当前兴趣(或相同的搜索领域)。另一主要限制在于这些“朋友”经常是他们几乎不知道的个体这一事实。因此,大部分时间,这些“朋友”不能够有助于使当前搜索的结果更相关,而许多个体在可以连接在一起的情况下可以贡献非常相关的结果。
相反地,利用作为本发明主题的方法实现的平台使得无论兴趣和当前搜索领域如何(搜索事件、产品、关于人物的信息、朋友或另一个),都能够识别和连接到世界中的、在所讨论话题中表达出兴趣的任何人。通过处理他们已经在社交网络上关于这些话题所评论的信息,该方法使得能够将搜索结果与分享相同领域兴趣的人连接起来。
图3示出了由用户输入称为“主”关键字的至少一个关键字的步骤305,称为“主”关键字是因为其权重在搜索中是最高的。然后,用户开启搜索。
在步骤310中,搜索站点中的基础搜索引擎执行搜索包括至少一个主关键字的页面。
为此,搜索引擎分别分析不同站点组中的内容,例如:
–互联网(“web”),其中响应是web页面;
-年表(“长期的”),其中响应是报纸站点上公布的最新信息;
-社交网络(“社交”),其中响应是社交网络站点上公布的消息;以及
-商业(“购物),其中响应是在商业站点上获得的。
为了分开这些搜索,利用每个类型中的站点的数据库,或执行上下文分析(例如,价格是商业站点的指标)。
关键字输入上执行的搜索不仅被执行在这些关键字上,还被执行在接近的关键字上,例如限定词的复数或阴性(例如,输入“candidat”也导致在关键字“candidate”、“candidats”和“candidates”上搜索)和相关字(“candidature”)。利用同义字(“applicant”)进行搜索被添加于此。为此,利用包含相关字或同义字和/或字群集的字典,并且其中,利用对由用户执行的搜索的响应来动态地确定字之间的距离。
在步骤315中,对于每组结果,搜索结果被按等级排列。根据基于显式输入的关键字的位置和权重的响应的相关性、它们的相关字(例如,接近或同义字)和隐式关键字,一些组被被按等级排列。相对于文本的开始,页面上存在的每个关键字的距离被用作相关性的指标:关键字越接近文本的开始,响应被认为越相关。用相同的方式使用两个关键字之间的距离:它们在页面文本中越接近,该页面被认为越相关。在按等级排列中,其他组考虑自结果被放在线上所经过的时间,尤其对于“长期”和“社交”组。
根据由执行相同搜索或类似搜索的先前用户执行的选择以及由用户在社交网络上做出的推荐,按等级排列还可以使用响应的流行级别。因此,这些推荐影响每一列,因为它们可以涉及互联网站点、在线报纸站点或在线商业站点。类似地,tweet(twitter站点上发送的消息)的副本给予原始tweet权重。因此,该复制的tweet出现在社交网络站点上所获得的结果的组160中。类似地,具有许多追随者的内容作者给他们的消息提供比没有追随者的作者更高的权重。为了从他们的追随者区分原始作者或“领导者”,信息副本被处理以形成树结构。该实时处理产生历史记录并且找到副本。因此,其形成树结构。信息在虚拟世界中出现之后还使得能够将领导者和追随者区分开。由第一发送的消息具有比由第二发布的消息更高的权重。
最后,通过使用作者在专业社交网络例如LinkedIn或Viadeo(注册商标)上的人物简介,可以知道作者的相关性。
结果的按等级排列还考虑概念(例如,“人”、“公司”、“地理”或“国家”)。主关键字或次级关键字的组合指示期望的结果所属的概念。分析结果还允许概念关联于结果。概念对应于关键字组合的概念的结果被给予比其他结果更高的等级。
在步骤320中,搜索引擎基于搜索结果确定类型和国家。这些动态类型是通过在对应于主关键字的响应中标识既不罕见也不很常见的字来构成的。国家例如是通过采用其中存在托管响应页面的最大数量服务器的九个国家来被选择的。当搜索规范被修改时,通过在区域100中替换关键字或通过附加搜索限定,如下文所述,国家和类型的列表被自动改变。
在步骤325中,显示每组结果中具有最高等级的结果。
在步骤330中,确定用户是否已经选择类型或国家。如果是,则在步骤335中,对应于该标准的结果被给予比其他结果更高的权重,并且返回到步骤315。在变型中,通过在窗口中显示的国家名或这些类型之一上点击,搜索被改变和/或结果被存储,使得只显示包括由所选类型限定的字或所选国家中托管的页面的响应。如果步骤330的结果为否,则返回到步骤340。
在步骤340中,确定用户是否已经在一组结果的顶部、在区域145中输入至少一个次级关键字。如果是,则在步骤345中,每个次级关键字被给予权重,并且对于与所使用区域145相反的单个结果组而返回步骤315。因此,通过在区域145之一中输入至少一个关键字,在搜索结果之中,用户开始在与该区域145相对应的组160中搜索包括输入的每个新关键字的响应。因此,在入口区域100中输入的每个关键字具有权重,在搜索中,该权重高于区域145中输入的字的权重。应当指出,其他区域145和组160不受在区域145中输入关键字的影响。如果步骤340的结果为否,则返回步骤350。
在步骤350中,确定用户是否在窗口155中已经选择过滤器。如果是,则在步骤355中,所选过滤器在步骤315中被应用。以这种方式,用户可以将过滤器应用于搜索结果以改进所显示结果的相关性。如果步骤350的结果为否,则返回步骤360。
在步骤360中,确定用户是否已经在显示的搜索结果上点击。如果是,则在步骤365中,所选页面的标题中的重要字自动形成附加关键字,该附加关键字具有比在区域145或入口区域100中输入的关键字更低的权重,并且返回步骤315。如果否,则返回步骤315。
因此,通过利用本发明的其中一个方面,方法实现了相关信息的快速提供,包括:
-由用户输入至少一个主关键字的步骤;
-搜索包括与一个所述主关键字相关联的至少一个字的、网络上可访问的页面的步骤;
-将搜索结果按等级排列的第一步骤;
-显示在第一按等级排列步骤中具有高等级水平的、来自所述搜索步骤的结果的步骤;
-由所述用户选择附加信息的步骤;
-根据所述附加信息将搜索结果按等级排列的第二步骤;以及
-显示在第二按等级排列步骤中具有高等级水平的、来自所述搜索步骤的结果的步骤。
以这种方式,用户可以逐渐细化搜索以快速获得他正在搜索的相关信息的显示。
优选地,该方法还包括:
-由用户输入至少一个主关键字的步骤;
-搜索包括与一个所述主关键字相关联的至少一个字的。网络上可访问的页面的步骤;
-根据执行搜索的多组信息源,将搜索结果进行分组的步骤;
-在与不同站点组相对应的每组结果中,将搜索结果按等级排列的步骤;以及
-分别显示每组结果的步骤。
因此,用户可以并行查看例如来自在线信息站点、在线商业站点、社交网络站点和其他网站的结果。
在一些实施方式中,每个信息源组对应于相似活动性的一组站点。
应当指出,可以在数据库中预先执行站点分组的步骤,将结果进行分组的步骤利用数据库中保存的所述组。
根据所述站点上存在的信息,还可以执行将站点进行分组的步骤。例如,站点上大量价格的存在允许其与在线商业站点分组在一起。
优选地,该方法还包括:
-确定从网络上可访问的一个信息源到另一信息源的信息复制的步骤;
-给所述信息从中被复制的源分配比所述信息的副本被放置的源更高的权重的步骤;
-搜索包括与一个所述主关键字相关联的至少一个字的、网络上可访问的页面的步骤;
-利用源的所述权重、将搜索结果按等级排列的步骤;以及
-显示按等级排列的结果的步骤。
图4示出了用于快速提供相关信息的方法,该方法首先包括确定从网络上可访问的信息源到所述网络上可访问的另一信息源的信息复制的步骤405。
应当指出,这里所考虑的源可以是站点(例如,twitter)或制造站点上可用信息的作者(由其别名标识的作者)。
在一些实施方式中,确定信息复制的步骤405包括:
-访问至少一个站点上可访问的所有信息的步骤410;
-存储信息的步骤415,获得与所述信息相关联的时间戳和从中访问所述信息的所述信息的源;
-比较存储的信息以检测信息之间的相似性的步骤420,以及如果检测到两个信息之间相似性则在下面详述的分配步骤425中给与最早时间戳相关联的源分配更高的权重的步骤。
在一些实施方式中,在比较步骤420中,根据所述信息之间的连续相似字符的数量来检测相似性。
在一些实施方式中,在比较步骤420中,根据所述信息之间的相似字的级别来检测相似性。
在一些实施方式中,在比较步骤420中,根据所述信息之间的连续相似字符的数量和所述相似字之间的距离来检测相似性。
由于这些规定中的每个规定,快速检测到信息的副本。
然后,执行给所述信息从中被复制的源分配比所述信息副本被放置的源更高的权重的步骤425。
在一些实施方式中,在给信息从中被复制的源分配权重的步骤425中,分配给源的权重是副本确定步骤中所确定的信息副本数量的非常量增函数。
因此,具有许多追随者的内容作者给他们的消息提供比没有或很少追随者的作者更高的权重。
在一些实施方式中,在权重分配步骤425中,已经提供信息副本的源被分配有比没有提供副本的源更低的权重。以这种方式,复制者被劝阻继续进行复制。
在一些实施方式中,在权重分配步骤425中,分配给源的权重取决于检测的副本类型。如果它是与原始信息相同的站点上的副本,则分配的权重将比另一站点上的副本更高,并且如果它是在另一种类、另一组或另一类型的站点上的副本,则分配的权重甚至高于信从中息被复制的站点。
由于这些规定,给例如社交网络上消息作者或站点的源自动分配比复制内容的另一作者或站点更高的权重。应当指出,与站点相关联的权重被至少部分地应用于该站点的所有页面。类似地,与作者相关联的权重被至少部分地应用于由该作者发出的所有消息。
由于权重和显示等级之间的关联,因此有利于内容的原始来源。
因此,给例如社交网络上消息的作者或站点的源自动分配比复制内容的另一作者或站点更高的权重。应当指出,与站点相关联的权重被至少部分地应用于该站点的所有页面。类似地,与作者相关联的权重被至少部分地应用于由该作者发出的所有消息。由于权重和显示等级之间的关联,因此有利于内容的原始来源。
优选地,该方法还包括:
-由用户输入多个关键字的步骤;
-根据关键字的输入组合而确定搜索上下文的步骤;
-搜索包括与一个所述关键字相关联的至少一个字的、网络上可访问的页面的步骤;
-根据页面内容而确定结果上下文的步骤;
-根据搜索上下文和搜索的每个结果的上下文的对应而将搜索结果按等级排列的步骤;以及
-显示按等级排列的结果的步骤。
因此,用户在字具有若干含义时不必指定该字的特定含义。
为了实现作为本发明主题的方法,利用一种用于快速提供相关信息的设备,该设备包括:
–用于由用户输入至少一个主关键字的装置;
–用于搜索包括与一个所述主关键字相关联的至少一个字的、网络上可访问的页面的装置;
–用于将搜索结果按等级排列的第一装置;
–用于显示具有由第一按等级排列装置分配的高等级水平的、来自搜索的结果的装置;
–用于由所述用户选择附加信息的装置;
–用于根据所述附加信息将搜索结果按等级排列的第二装置;
–用于显示具有由第二按等级排列装置分配的高等级水平的、来自搜索的结果的装置;
–用于根据其中搜索被执行的多组信息源而将搜索结果进行分组的装置;
–用于在与不同信息源组相对应的每组结果中将搜索结果按等级排列的装置;
–用于分别显示每组结果的装置;
–用于确定从网络上可访问的一个信息源到另一信息源的信息复制的装置;
–用于给所述信息从中被复制的源分配比所述信息的副本被放置的源更高的权重的装置;
–用于利用源的所述权重而将搜索结果按等级排列的装置;
–用于根据关键字的输入组合而确定搜索上下文的装置;
–用于根据页面内容而确定结果上下文的装置;
–用于根据搜索上下文和搜索的每个结果的上下文的对应而将搜索结果按等级排列的装置;以及
–用于显示按等级排列的结果的装置。
在一些变型中,执行在例如至少五个的多个组中选择由国家组织的信息源的步骤和根据所选组而显示信息的步骤。
在一些变型中,信息组之间的相互作用和等级是通过对结果进行加权而被组织的。
在一些变型中,可以在每组中执行独立的子搜索,同时保持组之间的等级。
在一些变型中,有可能改变由用户(例如由国家)实现的过滤以能够根据不同观点来执行搜索。
在一些变型中,在至少一个按等级排列的步骤中,附加信息对应于根据某些参数例如性别、年龄等的用户类型的人物简介。
在一些变型中,在选择附加信息的步骤中,用户选择搜索结果,该方法包括根据用户的人物简介类型而确定用户偏好的步骤,并且在第二按等级排列的步骤中,每个次级关键字具有比每个主关键字的权重更低的权重。
通过上述描述可知,本发明的实施方式公开了但不限于如下方案:
1.一种快速提供相关信息的方法,所述方法包括由用户输入多个关键字的步骤,其特征在于,还包括:
-根据关键字的输入组合而确定搜索上下文的步骤;
-搜索包括与一个所述关键字相关联的至少一个字的、网络上可访问的页面的步骤(310);
-根据所述页面的内容而确定结果上下文的步骤;
-确定从网络上可访问的信息源到所述网络上可访问的另一信息源的信息复制的步骤(405);
-给所述信息从中被复制的源分配比所述信息的副本被放置的源更高的权重的步骤(425);
-根据以下而将所述搜索的结果按等级排列的步骤(315):
所述搜索的上下文和所述搜索的每个结果的上下文的对应,和
所述源的权重;以及
-显示按等级排列的结果的步骤(325)。
2.如方案1的方法,其中,确定结果上下文的步骤取决于所述结果的页面内容。
3.如方案1或2的方法,其中,确定结果上下文的步骤取决于托管所述结果的页面的服务器。
4.如方案1至3之一的方法,其中,在确定搜索上下文的步骤中,利用主关键字的加权。
5.如方案1至4之一的方法,其中,确定信息复制的步骤(405)包括:
-存储所述信息的步骤(415),获得与所述信息相关联的时间戳和从中访问所述信息的所述信息的源;
-比较所存储的信息以检测所述信息之间的相似性的步骤(420),以及如果检测到两个信息之间的相似性则给与最早时间戳相关联的源分配更高权重的步骤。
6.如方案5的方法,其中,在比较的步骤(420)中,根据所述信息之间的连续相似字符的数量来检测相似性。
7.如方案5或6之一的方法,其中,在比较的步骤(420)中,根据所述信息之间的相似字的级别来检测相似性。
8.如方案5至7之一的方法,其中,在比较的步骤(420)中,根据所述信息之间的连续相似字符的数量和所述相似字之间的距离来检测相似性。
9.如方案1至8之一的方法,其中,在给信息从中被复制的源分配的步骤(425)中,分配给所述源的权重是在副本确定的步骤中所确定的信息的副本数量的非常量增函数。
10.如方案1至9之一的方法,其包括:
-创建网络上可访问的多组信息源的步骤;
-由用户输入至少一个主关键字的步骤(305);
-搜索包括与一个所述主关键字相关联的至少一个字的、所述信息源中的页面的步骤(310);
-根据从中获得结果的多组信息源而将所述搜索的结果进行分组的步骤(325);
-根据所述源的权重、在与不同信息源组对应的每组结果中,将搜索结果按等级排列的步骤(315);以及
-分别显示每组结果的步骤(325)。
11.如方案10的方法,其中,创建站点组的步骤取决于所述站点上存在的信息,将结果进行分组的步骤利用所述站点组。
12.如方案1至11之一的方法,在显示来自所述搜索的步骤的结果的步骤之后,包括:
-由所述用户选择附加信息的步骤;
-根据所述附加信息而将搜索结果按等级排列的第二步骤;以及
-显示来自所述搜索的步骤的、在第二按等级排列步骤中具有高等级水平的结果的步骤。
13.如方案12的方法,其中,在至少一个按等级排列步骤中,所述附加信息对应于具有比每个主关键字的权重更低的权重的至少一个关键字。
14.如方案12或13之一的方法,其中,在选择附加信息的步骤中,所述用户选择搜索结果,所述方法包括根据选择的结果而确定次级关键字的步骤,并且在第二按等级排列步骤中,每个次级关键字具有比每个主关键字更低的权重。
15.如方案1至14之一的方法,其包括:
-根据其中执行搜索的多组信息源而将所述搜索的结果进行分组的步骤;
-在与不同的站点组相对应的每组结果中,将搜索结果按等级排列的步骤;以及
-分别显示每组结果的步骤。
16.如方案15的方法,包括根据所述站点上存在的信息而将站点进行分组的步骤,将结果进行分组的步骤利用所述站点组。
17.一种用于快速提供相关信息的设备,所述设备包括用于由用户输入多个关键字的装置,其特征在于,还包括:
-用于根据关键字的输入组合而确定搜索上下文的装置;
-用于搜索包括与一个所述关键字相关联的至少一个字的、网络上可访问的页面的装置;
-用于根据所述页面的内容而确定结果上下文的装置;
-用于确定从网络上可访问的信息源到所述网络上可访问的另一信息源的信息复制的装置;
-用于给所述信息从中被复制的源分配比所述信息的副本被放置的源更高的权重的装置;
-用于根据如下而将所述搜索的结果按等级排列的装置:
所述搜索的上下文和所述搜索的每个结果的上下文的对应,和
所述源的权重;以及
-用于显示按等级排列的结果的装置。

Claims (18)

1.一种快速提供相关信息的方法,所述方法包括由用户输入多个关键字的步骤,其特征在于,还包括:
-根据关键字的输入组合而确定搜索上下文的步骤;
-创建网络上可访问的信息源的组的步骤;
-由所述用户输入至少一个主关键字的步骤(305);
-搜索所述信息源中的包括与所述至少一个主关键字相关联的至少一个字的页面的步骤(310);
-根据所述页面的内容而确定所述搜索的结果的上下文的步骤;
-根据从中获得所述搜索的结果的信息源的组而对所述结果进行分组的步骤;
-确定从所述网络上可访问的一个信息源到所述网络上可访问的另一信息源的信息复制的步骤(405);
-给所述信息从中被复制的源分配比所述信息的副本被放置的源更高的权重的步骤(425);
-根据以下而将对应于各组信息源的每组搜索结果中的搜索结果按等级排列的步骤(315):
所述搜索上下文和所述搜索的每个结果的上下文的对应,和
所述源的权重,
其中,所述结果在每组搜索结果中被不同地按等级排列;以及
-单独地显示每组按等级排列的结果的步骤(325)。
2.如权利要求1所述的方法,在单独地显示每组按等级排列的结果的步骤(325)之后还包括:
-由所述用户选择附加信息的步骤;
-根据所述附加信息而对所述结果按等级排列的二次按等级排列步骤;和
-显示在所述二次按等级排列步骤中的具有高等级的所述搜索的结果的步骤。
3.如权利要求2所述的方法,其中,在选择附加信息的步骤中,所述用户关于一组结果而选择所述附加信息,并且在所述搜索的结果按等级排列的二次按等级排列步骤中,只对所述一组结果中的结果按等级排列。
4.如权利要求1或2所述的方法,其中,确定所述搜索的结果的上下文的步骤取决于所述结果的页面内容。
5.如权利要求1或2所述的方法,其中,确定所述搜索的结果的上下文的步骤取决于托管所述结果的页面的服务器。
6.如权利要求1或2所述的方法,其中,在确定所述搜索的结果的上下文的步骤中,利用所述至少一个主关键字的加权。
7.如权利要求1或2所述的方法,其中,确定信息复制的步骤(405)包括:
-存储所述信息的步骤(415),其中获得与所述信息相关联的时间戳和从中访问所述信息的所述信息的源;
-比较所存储的信息以检测所述信息之间的相似性的步骤(420),以及如果检测到两个信息之间的相似性则给与最早时间戳相关联的源分配更高权重的步骤。
8.如权利要求7所述的方法,其中,在比较的步骤(420)中,根据所述信息之间的连续相似字符的数量来检测相似性。
9.如权利要求7所述的方法,其中,在比较的步骤(420)中,根据所述信息之间的相似字的级别来检测相似性。
10.如权利要求7所述的方法,其中,在比较的步骤(420)中,根据所述信息之间的连续相似字符的数量和所述相似字之间的距离来检测相似性。
11.如权利要求1或2所述的方法,其中,在给信息从中被复制的源分配更高的权重的步骤(425)中,分配给所述源的权重是在确定所述信息复制的步骤中所确定的信息的副本数量的非常量增函数。
12.如权利要求1或2所述的方法,其包括:
-针对在所述网络上可访问的信息而产生历史记录的步骤;以及
-形成代表针对在所述网络上可访问的信息而产生的所述历史记录的树结构的步骤,所述树结构包含原始信息源并且包含对其复制所述信息的其他信息源。
13.如权利要求1或2所述的方法,还包括创建站点组的步骤,所述创建站点组的步骤取决于所述站点上存在的信息,对所述结果进行分组的步骤利用所述站点组。
14.如权利要求2所述的方法,其中,所述附加信息对应于具有比每个主关键字的权重更低的权重的至少一个关键字。
15.如权利要求2所述的方法,其中,在选择附加信息的步骤中,所述用户选择搜索结果,所述方法包括根据选择的结果而确定次级关键字的步骤,并且在所述二次按等级排列步骤中,每个次级关键字具有比每个主关键字更低的权重。
16.如权利要求13所述的方法,还包括:
-在与不同的站点组相对应的每组结果中,将搜索结果按等级排列的步骤;以及
-单独地显示每组结果的步骤。
17.如权利要求16所述的方法,还包括根据所述站点上存在的信息而将站点进行分组的步骤,对所述结果进行分组的步骤利用所述站点组。
18.一种用于快速提供相关信息的设备,所述设备包括用于由用户输入多个关键字的装置,其特征在于,还包括:
-用于根据关键字的输入组合而确定搜索上下文的装置;
-用于创建在网络上可访问的信息源的组的装置;
-用于由用户输入至少一个主关键字的装置;
-用于搜索所述信息源中的包括与所述至少一个主关键字相关联的至少一个字的的页面的装置;
-用于根据所述页面的内容而确定所述搜索的结果的上下文的装置;
-用于根据从中获得所述搜索的结果的信息源的组而对所述结果进行分组的装置;
-用于确定从所述网络上可访问的一个信息源到所述网络上可访问的另一信息源的信息复制的装置;
-用于给所述信息从中被复制的源分配比所述信息的副本被放置的源更高的权重的装置;
-用于根据如下而将对应于各组信息源的每组搜索结果中的搜索结果按等级排列的装置:
所述搜索上下文和所述搜索的每个结果的上下文的对应,和
所述源的权重,
其中,所述结果在每组搜索结果中被不同地按等级排列;以及
-用于单独地显示每组按等级排列的结果的装置。
CN201910491582.0A 2012-04-04 2013-03-15 用于快速提供信息的方法和设备 Pending CN110287411A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
FR1253085 2012-04-04
FR1253085A FR2989189B1 (fr) 2012-04-04 2012-04-04 Procede et dispositif de fourniture rapide d'information
FR1258011 2012-08-27
FR1258010 2012-08-27
FR1258011A FR2989193B1 (fr) 2012-04-04 2012-08-27 Procede et dispositif de fourniture rapide d'information
FR1258010A FR2989192B1 (fr) 2012-04-04 2012-08-27 Procede et dispositif de fourniture rapide d'information
FR1258009 2012-08-27
FR1258009A FR2989191B1 (fr) 2012-04-04 2012-08-27 Procede et dispositif de fourniture rapide d'information
CN201380026019.7A CN104303182A (zh) 2012-04-04 2013-03-15 用于快速提供信息的方法和装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380026019.7A Division CN104303182A (zh) 2012-04-04 2013-03-15 用于快速提供信息的方法和装置

Publications (1)

Publication Number Publication Date
CN110287411A true CN110287411A (zh) 2019-09-27

Family

ID=46826624

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910491582.0A Pending CN110287411A (zh) 2012-04-04 2013-03-15 用于快速提供信息的方法和设备
CN201380026019.7A Pending CN104303182A (zh) 2012-04-04 2013-03-15 用于快速提供信息的方法和装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201380026019.7A Pending CN104303182A (zh) 2012-04-04 2013-03-15 用于快速提供信息的方法和装置

Country Status (7)

Country Link
US (1) US20150058307A1 (zh)
EP (1) EP2834757B1 (zh)
CN (2) CN110287411A (zh)
BR (1) BR112014024959A8 (zh)
EA (1) EA201491680A1 (zh)
FR (4) FR2989189B1 (zh)
WO (1) WO2013150201A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITUB20152653A1 (it) * 2015-07-30 2017-01-30 Maxfone S R L Apparecchiatura e metodo di acquisizione, analisi e monitoraggio dati
KR20190116257A (ko) * 2016-12-08 2019-10-14 콴트 데이터망에서 액세스 가능한 자원을 검색하기 위한 방법
US11100555B1 (en) * 2018-05-04 2021-08-24 Coupa Software Incorporated Anticipatory and responsive federated database search

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6944612B2 (en) * 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine
US6978419B1 (en) * 2000-11-15 2005-12-20 Justsystem Corporation Method and apparatus for efficient identification of duplicate and near-duplicate documents and text spans using high-discriminability text fragments
US8090717B1 (en) * 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6970419B1 (en) * 1998-08-07 2005-11-29 Nortel Networks Limited Method and apparatus for preserving frame ordering across aggregated links between source and destination nodes
US7567953B2 (en) * 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
GB0309174D0 (en) * 2003-04-23 2003-05-28 Stevenson David W System and method for navigating a web site
US7165119B2 (en) * 2003-10-14 2007-01-16 America Online, Inc. Search enhancement system and method having rankings, explicitly specified by the user, based upon applicability and validity of search parameters in regard to a subject matter
KR100824091B1 (ko) * 2004-03-15 2008-04-21 야후! 인크. 신뢰 네트워크로부터의 사용자 주석들을 통합한 검색시스템 및 방법
US7933900B2 (en) * 2005-10-23 2011-04-26 Google Inc. Search over structured data
US7933890B2 (en) * 2006-03-31 2011-04-26 Google Inc. Propagating useful information among related web pages, such as web pages of a website
US8452793B2 (en) * 2008-09-30 2013-05-28 Yahoo! Inc. Query refinement based on user selections
US20100306249A1 (en) * 2009-05-27 2010-12-02 James Hill Social network systems and methods
WO2012054848A1 (en) * 2010-10-21 2012-04-26 Davidson College System and process for ranking content on social networks such as twitter

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6978419B1 (en) * 2000-11-15 2005-12-20 Justsystem Corporation Method and apparatus for efficient identification of duplicate and near-duplicate documents and text spans using high-discriminability text fragments
US8090717B1 (en) * 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US6944612B2 (en) * 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine

Also Published As

Publication number Publication date
FR2989193B1 (fr) 2015-08-21
EA201491680A1 (ru) 2015-03-31
EP2834757B1 (fr) 2019-05-08
FR2989192A1 (fr) 2013-10-11
US20150058307A1 (en) 2015-02-26
FR2989192B1 (fr) 2015-08-14
FR2989189A1 (fr) 2013-10-11
FR2989193A1 (fr) 2013-10-11
BR112014024959A8 (pt) 2021-02-23
FR2989189B1 (fr) 2017-10-13
CN104303182A (zh) 2015-01-21
FR2989191B1 (fr) 2015-08-21
WO2013150201A1 (fr) 2013-10-10
FR2989191A1 (fr) 2013-10-11
EP2834757A1 (fr) 2015-02-11

Similar Documents

Publication Publication Date Title
Hoque et al. Convis: A visual text analytic system for exploring blog conversations
CN103890761B (zh) 自动生成推荐的方法和装置
US9218414B2 (en) System, method, and user interface for a search engine based on multi-document summarization
CN109983455A (zh) 在在线社交网络上多样化媒体搜索结果
CN105723402A (zh) 用于确定社交数据网络中的影响者的系统和方法
CN106383887A (zh) 一种环保新闻数据采集和推荐展示的方法及系统
CN104008139B (zh) 视频索引表的创建方法和装置,视频的推荐方法和装置
CN106096037A (zh) 基于人工智能的搜索结果聚合方法、装置以及搜索引擎
di Sciascio et al. A study on user-controllable social exploratory search
CN101916274A (zh) 对LinkUGC进行聚合显示的方法和系统
CN111191112A (zh) 一种电子读物数据处理方法、装置及存储介质
CN104102733B (zh) 搜索内容提供方法和搜索引擎
KR20180096341A (ko) 소셜 플랫폼상에서 mooc와 플립드러닝을 지원하는 온톨로지 기반 교육 콘텐츠 소셜 큐레이터 구현 시스템 및 그 방법
KR101122737B1 (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
JP5284064B2 (ja) 商品idサーバ装置、および商品idサーバ装置の制御方法
CN110287411A (zh) 用于快速提供信息的方法和设备
CN101374119A (zh) 提供信息服务的方法和系统以及标识资源的方法
WO2013044647A1 (zh) 一种sns网络中推送关联用户的方法及系统
Gali et al. Extracting representative image from web page
Posea et al. Bringing the social semantic web to the personal learning environment
CN103312584A (zh) 一种在网络社区中发布信息的方法与设备
CN110175289A (zh) 基于余弦相似度协同过滤的混合推荐方法
US20180101615A1 (en) Systems, methods and techniques for customizable domain-based searching
Palme et al. Attention allocation in information-rich environments: the case of news aggregators
Pedro A Collection of Samples for Research in Google: Design and Application of a Sample Selection Method: Results and Problems of Research.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190927

WD01 Invention patent application deemed withdrawn after publication