CN104025085A - 用于提供关于包括在内容页面中的语义实体的信息的系统和方法 - Google Patents

用于提供关于包括在内容页面中的语义实体的信息的系统和方法 Download PDF

Info

Publication number
CN104025085A
CN104025085A CN201280047977.8A CN201280047977A CN104025085A CN 104025085 A CN104025085 A CN 104025085A CN 201280047977 A CN201280047977 A CN 201280047977A CN 104025085 A CN104025085 A CN 104025085A
Authority
CN
China
Prior art keywords
user
semantic
semantic entity
contextual information
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280047977.8A
Other languages
English (en)
Inventor
卡洛斯·博拉
卢多维克·卡布里
杰拉尔德·克罗普缇茨
布莱恩·罗杰斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ji Jin Co Ltd
Kikin Inc
Original Assignee
Ji Jin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ji Jin Co Ltd filed Critical Ji Jin Co Ltd
Publication of CN104025085A publication Critical patent/CN104025085A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Abstract

一种用于提供关于在内容页面上包括的语义实体的上下文信息的方法,包括以下步骤:将包括一个或多个语义实体的内容页面显示给用户;识别所包括的一个或多个语义实体;以及接收来自所述用户的输入,所述输入指示期望接收关于所识别的语义实体中的特定的一个语义实体的上下文信息。

Description

用于提供关于包括在内容页面中的语义实体的信息的系统和方法
相关申请
本申请要求2011年9月9日提交的名称为“SYSTEMS AND METHODS FORPROVIDING INFORMATION REGARDING SEMANTIC ENTITIES INCLUDEDIN A PAGE OF CONTENT”的美国专利申请No.13/229,245的权益和优先权,且要求2011年9月9日提交的名称为“SYSTEMS AND METHODS FOR RICHQUERY CONSTRUCTION”的美国专利申请No.13/229,302的权益和优先权,且要求2011年9月9日提交的名称为“SYSTEMS AND METHODS FORCONTEXTUAL SEARCHING OF SEMANTIC ENTITIES”的美国专利申请No.13/229,311的权益和优先权,这三个美国专利申请都要求2011年7月28日提交的名称为“SYSTEMS AND METHODS FOR CONTEXTUALPERSONALIZED SEARCHING”的美国临时专利申请No.61/512,826的权益和优先权,该美国临时专利申请的全部内容通过引用并入。
技术领域
本发明的实施方式总体涉及搜索互联网和其它内容源(包括但不限于广告流)和计算机化的搜索的领域。尤其是,本文中所描述的系统和方法允许传统的网络内容基于消费者的特征以完全不同的方式进行消费。
发明内容
在一方面中,本发明涉及用于提供关于包括在内容页面中的语义实体的上下文信息的方法。包括一个或多个语义实体的内容页面显示给用户。识别包括在页面中的一个或多个语义实体。从用户接收输入,该输入指示接收关于所识别的语义实体中的特定的一个语义实体的上下文信息的请求。
在另一方面中,本发明涉及提供关于包括在内容页面中的语义实体的上下文信息的系统。该系统包括用于向用户显示包括一个或多个语义实体的内容页面的装置、用于识别包括在页面中的一个或多个语义实体的装置、和用于接收来自用户的输入的装置,该输入指示接收关于所识别的语义实体中的特定的一个语义实体的上下文信息的请求。
附图说明
通过参照结合附图进行的下列描述,本发明的上述的和其它的目的、方面、特征和优点将变得更清楚且更好理解,在附图中:
图1A是根据本发明的实施方式的系统的示意图;
图1B是根据本发明的实施方式的图1的设备的分解图;
图2是根据本发明的实施方式的传输信息的系统的示意图;
图3A是示出根据本发明的实施方式的在上下文模式已被激活之前的网页的屏幕截图的示例性视图;
图3B和图3C是示出根据本发明的一些实施方式的在上下文模式已被激活且各种搜索术语突出显示之后的网页的屏幕截图的示例性视图;
图3D是示出根据本发明的实施方式的在已执行上下文搜索之后的叠加窗口和网页的屏幕截图的示例性视图;
图4是根据本发明的实施方式的方法的流程图;
图5A至图5D是根据本发明的实施方式的方法的更详细的流程图;
图6是根据本发明的实施方式的包括关于样本用户配置文件的信息的数据结构的文本表示;
图7A是示出用户已突出显示搜索实体的网页的屏幕截图的示例性视图;
图7B是根据本发明的实施方式的基于图7A的搜索实体和网页的样本丰富查询的字符串;以及
图7C是根据本发明的实施方式的包括通过已被提供以图7B的丰富查询字符串的服务器所返回的样本文本搜索结果的数据结构的文本表示。
具体实施方式
本发明的各种实施方式提供用于进行上下文搜索的方法或系统。用户观看网页、文档或其它内容。根据一些实施方式,上下文搜索服务接受来自用户的关于一个或多个搜索术语、词语、图像或其它指示感兴趣的话题的信息(下文称为“搜索实体”)的输入。根据一些实施方式,文档中的所有内容都是可搜索的。根据各种实施方式,服务选择与搜索实体相关的额外的输入,以确定搜索实体的上下文,从而进行搜索,该搜索相比于不涉及所述上下文的搜索,而更有可能相关。根据各种其它实施方式,服务使用搜索实体和可与该搜索实体相关的上下文,以进行搜索并获得搜索结果。根据各种实施方式,这些结果呈现给用户。
图1A示出根据一些实施方式的网络化环境101,其中,提供上下文搜索服务。如图1A所示,网络化环境101包括一个或多个客户端机器102A-102N(在本文中通常称为“客户端机器102”或“客户端102”),该客户端机器102A-102N通过网络104与一个或多个服务器106A-106N(在本文中通常称为“服务器机器106”或“服务器106”)通信。在一些实施方式中,客户端机器102可以称为单个客户端机器102或一组客户端机器102,而服务器106可以称为单个服务器106或一组服务器106。尽管在图1A中示出三个客户端机器102和三个服务器机器106,但是任何数量的客户端102可以与任何数量的服务器106进行通信。在一些实施方式中,单个客户端机器102与多于一个服务器106进行通信,而在另一实施方式中,单个服务器106与多于一个客户端机器102进行通信。在另一实施方式中,单个客户端机器102与单个服务器106进行通信。此外,尽管示出将客户端机器102连接至服务器机器106的单个网络104,但应当理解,根据一些实施方式,多个独立的网络将客户端机器102的子集连接至服务器机器106的子集。
在一些实施方式中,计算环境101包括安装在服务器106和客户端机器102之间的装置(在图1A中未示出)。该装置可以管理客户端/服务器连接,且在一些情况下可以将客户端机器102进行的平衡连接加载至服务器机器106。由下列公司(但不限于这些公司)中的任何一个公司制造合适的装置:Citrix Systems公司的应用网络组;加利福尼亚州圣克拉拉的Silver Peak Systems公司;加利福尼亚州旧金山的Riverbed Technology公司;华盛顿州西雅图的F5Networks公司;或加利福尼亚州森尼韦尔的Juniper Networks公司。
客户端102和服务器106可以被设置为计算设备100,在图1B中示出该计算设备100的具体实施方式。系统总线150包括在计算设备100内,该系统总线150与下列部件进行通信:中央处理单元121(“处理器”);提供非暂时性存储的主存储器122;提供非暂时性存储的存储器128;输入/输出(I/O)控制器123;显示设备124A-124N;安装设备116;和网络接口118。在一些实施方式中,存储器128包括:操作系统、软件程序和客户端代理120。在一些实施方式中,I/O控制器123进一步连接至一个或多个输入设备。易失性计算机存储器、非易失性计算机存储器、以及易失性计算机存储器和非易失性计算机存储器的组合包括在非暂时性存储器的范围内。如图1B所示,I/O控制器123连接至摄像机125、键盘126、指向设备127(诸如(但不限于)鼠标)和麦克风129。
计算机器100的各种实施方式包括被下列部件配置中的任何一个所表征的中央处理单元121:对从主存储器单元122获取的指令作出响应并对其进行处理的逻辑电路;微处理器单元,诸如(但不限于):由Intel公司制造的微处理器单元、由Motorola公司制造的微处理器单元、由加利福尼亚州圣克拉拉的Transmeta公司制造的微处理器单元、诸如International Bussiness Machines公司制造的RS/6000处理器、诸如Advanced Micro Devices公司制造的处理器;或逻辑电路的任何其他组合。中央处理单元122的其他实施方式包括下列中的任一个或组合:微处理器、微控制器、具有单处理核的中央处理单元、具有两个处理核的中央处理单元或具有多于一个处理核的中央处理单元。
虽然图1B示出包括单个中央处理单元121的计算设备100,但在一些实施方式中,计算设备100包括一个或多个处理单元121。在这些实施方式中,计算设备100能够存储和执行固件或其它可执行的指令,当该指令被执行时,该指令指示所述一个或多个处理单元121同时执行指令或同时对一个数据段执行指令。在其它实施方式中,计算设备100存储和执行固件或其它可执行的指令,当该指令被执行时,该指令指示所述一个或多个处理单元分别执行一组指令中的一部分。例如,可以指示各个处理单元121执行程序的一部分或程序内的特定模块。
在一些实施方式中,处理单元121包括一个或多个处理核。例如,根据一些实施方式,处理单元121具有两个核、四个核、八个核或任何数量的核。在一些实施方式中,处理单元121包括一个或多个并行的处理核。在一些实施方式中,处理单元121的处理核访问作为全局地址空间的可用存储器,或者在其它实施方式中,计算设备100的存储器被分段且分配给处理单元121内的特定的核。在一些实施方式中,计算设备100中的一个或多个处理核或处理器均可以访问本地存储器。在其它实施方式中,在一个或多个处理器或处理核之间共享计算设备100内的存储器,而其它存储器可被特定的处理器或处理器的子集访问。在计算设备100包括多于一个处理单元的实施方式中,多个处理单元包括在单个集成电路(IC)中。在一些实施方式中,这些多个处理器通过内部高速总线链接在一起,该内部高速总线可以称为元件互连总线。
在计算设备100包括一个或多个处理单元121、或包括一个或多个处理核的处理单元121的实施方式中,在一些实施方式中,处理器可以对多个数据段同时执行单个指令(SIMD),或在其它实施方式中,处理器可以对多个数据段同时执行多个指令(MIMD)。在一些实施方式中,计算设备100包括任何数量的SIMD处理器和MIMD处理器。
在一些实施方式中,计算设备100包括图形处理器或图形处理单元(未示出)。在各种实施方式中,图形处理单元包括软件和硬件的任何组合,且可以进一步输入图形数据和图形指令,显示来自输入的数据和指令的图形、且输出所显示的图形。在一些实施方式中,图形处理单元包括在处理单元121中。在其它实施方式中,计算设备100包括一个或多个处理单元121,使得至少一个处理单元121专用于处理和显示图形。
计算设备100的一些实施方式支持下列安装设备116(但不限于这些设备)中的任一个:CD-ROM驱动器、CD-R/RW驱动器、DVD-ROM驱动器、各种格式的磁带驱动器、USB设备、可引导介质、可引导CD、用于GNU/Linux发行版(如)的可引导CD、硬盘驱动器或适于安装应用程序或软件的任何其它设备。在一些实施方式中,应用程序包括客户端代理120或客户端代理120的任意部分。根据一些实施方式,计算设备100还包括存储设备128,该存储设备128为一个或多个硬盘驱动器、或独立磁盘的一个或多个冗余阵列;其中,存储设备配置成存储操作系统、软件、应用程序或客户端代理120的至少一部分。计算设备100的另一实施方式包括安装设备116,该安装设备116用作存储设备128。
计算设备100的实施方式包括下列I/O设备130A-130N(但不限于这些示例)中的任一种:摄像机125;键盘126;指向设备127;麦克风129;鼠标;触控板;光笔;轨迹球;麦克风;绘图板;视频显示器;扬声器;喷墨打印机;激光打印机;和染料升华打印机;触摸屏;或任何其他能够执行本文所述的方法和系统的输入/输出设备。根据一些实施方式,I/O控制器123连接至多个I/O设备103A-130N,以控制一个或多个I/O设备。根据一些实施方式,I/O设备130A-130N配置成提供存储器或安装介质116。根据其它实施方式,I/O设备130A-130N配置成提供通用串行总线(USB)接口,该通用串行总线接口用于接收USB存储设备(诸如(但不限于)Twintech Industry公司制造的设备的USB闪盘驱动器线)。其它实施方式包括I/O设备130,该I/O设备130是系统总线150和外部通信总线之间的桥接器,外部通信总线诸如(但不限于):USB总线;苹果桌面总线;RS-232串行连接;SCSI总线;火线总线;火线800总线;以太网总线;AppleTalk总线;千兆位以太网总线;异步传输模式总线;HIPPI总线;超级HIPPI总线;SerialPlus总线;SCI/LAMP总线;光纤通道总线;或串行小型计算机系统接口总线。
在一些实施方式中,计算机器100可以执行任何操作系统,而在其它实施方式中,计算机器100可以执行任一下列操作系统:MICROSOFT WINDOWS操作系统的多个版本(诸如WINDOWS3.x;WINDOWS95;WINDOWS98;WINDOWS2000;WINDOWS NT3.51;WINDOWS NT4.0;WINDOWS CE;WINDOWS XP;WINDOWS VISTA;和WINDOWS7);Unix和Linux操作系统的不同版本;由苹果电脑公司制造的MAC OS或iOS的任一版本;由International Business Machines公司制造的OS/2;任何嵌入式操作系统;任何实时操作系统;任何开源操作系统;任何专有操作系统;用于移动计算设备的任何操作系统;或任何其它操作系统。在另一实施方式中,计算机器100可以执行多个操作系统。例如,计算机器100可以执行PARALLELS或另一虚拟化平台,该另一虚拟化平台可以执行或管理执行第一操作系统的虚拟机。而计算机器100可以执行与第一操作系统不同的第二操作系统。
在各种实施方式中,计算机器100嵌入下列计算设备(但不限于这些设备)中的任一设备中:计算工作站;台式电脑;笔记本电脑;服务器;掌上电脑;移动电话;便携式通信设备;媒体播放设备;游戏系统;移动计算设备;上网本;由苹果电脑公司制造的设备中的IPOD系设备;由Sony公司制造的设备中的PLAYSTATION系中的任一种;由Nintendo公司制造的设备中的Nintendo系中的任一种;Microsoft公司制造的设备中的XBOX系中的任一种;或能够通信且具有足够的处理器能力和存储容量以执行本文中描述的方法和系统的任何其它类型和/或形式的计算设备、通信设备或媒体设备。
在其它实施方式中,计算机器100是移动设备,诸如(但不限于)下列移动设备中的任一种:能够支持JAVA的蜂窝电话或个人数字助理(PDA),诸如i55sr、i58sr、i85s、i88s、i90c、i95cl或im l100,所有这些由Motorola公司制造;由Kyocera公司制造的6035或7135;由Samsung Electronics有限公司制造的i300或i330;由Palm公司制造的TREO180、TREO270、TREO600、TREO650、TREO680、TREO700p、TREO700w或TREO750智能手机;任何具有不同的处理器、操作系统、和符合所述设备的输入设备的计算设备;或能够执行本文中描述的方法和系统的任何其它移动计算设备。在其它实施方式中,计算设备100是下列移动计算设备(但不限于这些设备)中的任一种:任一系列的黑莓、或由Research In Motion有限公司制造的其它手持设备;由苹果电脑公司制造的iPhone;Palm Pre;掌上电脑;掌上电脑电话版;或任何其它的手持移动设备。在其它实施方式中,计算设备100是智能手机或平板电脑,例如(但不限于):由加利福尼亚州库比蒂诺的苹果公司制造的iPhone或iPad;由加拿大安大略省滑铁卢的Research In Motion有限公司制造的黑莓设备;华盛顿州的雷德蒙市的Microsoft公司制造的Windows Mobile设备;由伊利诺伊州利伯蒂维尔的Motorola公司制造的Xoom;能够运行由加利福尼亚州山景城的Google公司提供的Android平台的设备;或任何其它类型和形式的便携式计算设备。
在其它实施方式中,计算设备100是虚拟机。在一些实施方式中,虚拟机是任何虚拟机,诸如(但不限于)由XenSolutions、Citrix Systems、IBM、Vmware开发的超级监视器(hypervisor)或任何其它的超级监视器管理的虚拟机。在其它实施方式中,通过在服务器106上执行的超级监视器或在客户端102上执行的超级监视器来管理虚拟机。
在其它实施方式中,计算设备100可以执行、操作或提供应用程序,该应用程序是下列中的任一种:软件;应用程序或程序;可执行的指令;虚拟机;超级监视器;网络浏览器;基于网络的客户端;客户端-服务器应用程序;ActiveX控件;Java小程序;与像软IP电话的网络电话(VoIP)通信相关的软件;用于流式传输视频和/或音频或接收和播放视频流和/或音频流的应用程序;用于促进实时数据通信的应用程序;HTTP客户端;FTP客户端;或任何其他可执行指令的集合。其它实施方式包括客户端设备102,该客户端设备102显示在服务器106或其它远程地定位的机器上远程地执行的应用程序所产生的应用程序输出。在这些实施方式中,客户端设备102可以在应用程序窗口、浏览器或其它输出窗口中显示应用程序输出。
根据各种实施方式,计算设备100还包括网络接口118,该网络接口118通过各种连接而连接至局域网(LAN)、广域网(WAN)、因特网、或任何类型的网络,所述各种连接包括但不限于标准电话线、LAN或WAN链路(例如,802.11、Tl、T3、56kb、X.25、SNA、DECNET)、宽带连接(例如,ISDN、帧中继、ATM、千兆以太网、Sonet上的以太网(Ethernet-over-SONET))、无线连接、或任何或全部上述连接中的一些组合。还可以使用多个通信协议(例如,TCP/IP、IPX、SPX、NetBIOS、以太网、ARCNET、SONET、SDH、光纤分布式数据接口(FDDI)、RS232、RS485、IEEE802.11、IEEE802.11a、IEEE802.11b、IEEE802.11g、CDMA、GSM、WiMax和直接异步连接)来建立连接。在一些实施方式中,网络104包括一个或多个子网络且安装在包括在计算环境101内的客户端102、服务器106、计算机器和计算装置的任何组合之间。在一些实施方式中,网络104是:局域网(LAN);城域网(MAN);广域网(WAN);包括位于客户端机器102和服务器106之间的多个子网络104的主网络104;具有专用子网104的主公共网络104;具有公共子网104的主专用网络104;或具有专用子网104的主专用网络104。根据一些实施方式,网络104的网络拓扑结构在不同的实施方式中是不同的,可行的网络拓扑结构包括:总线型网络拓扑结构;星型网络拓扑结构;环形网络拓扑结构;基于中继器的网络拓扑结构;或层次化星型网络拓扑结构。另外的实施方式包括移动电话网络的网络104,该移动电话网络使用协议,以在移动设备之间进行通信,其中,协议是下列中的任一种:AMPS;TDMA;CDMA;GSM;GPRS UMTS;或可以在移动设备之间传输数据的任何其它协议。
在各种实施方式中,计算环境101包括多于一个服务器106A-106N,使得服务器106A-106N在逻辑上组成服务器群106。在一些实施方式中,服务器群106包括服务器群106中的地理上分散且逻辑上组合在一起的服务器106、服务器群106中的彼此接近且逻辑上组合在一起的服务器106、或在物理服务器上执行的多个虚拟服务器。在一些实施方式中,服务器群106内的地理上分散的服务器106A-106N可以使用WAN、MAN或LAN进行通信,其中,不同的地理区域可以表征为:不同的大洲;大洲的不同区域;不同的国家;不同的州;不同的城市;不同的校区;不同的房间;或者前面的地理位置的任意组合。在一些实施方式中,作为单个实体管理服务器群106,而在其它实施方式中,服务器群106包括多个服务器群106。
现参照图2,根据本发明的各种实施方式,在服务器106和部件202之间传输关于上下文搜索的信息204。根据各种实施方式,部件202是计算机软件。根据其它实施方式,部件202是计算机硬件或电路。根据各种实施方式,部件202是客户端102的一部分或在客户端102上执行。根据一些实施方式,部件202是服务器106的一部分或在服务器106上执行。根据各种实施方式,信息204从部件202传输至服务器106。根据各种实施方式,信息204从服务器106传输至部件。根据各种实施方式,信息204在服务器106和部件202之间来回传输。
图3A至图3D示出根据非限制性的示例性实施方式的上下文搜索服务的用户体验。在图3A中,已使用触摸屏平板设备将用户导航至网络浏览器中的网页。在图3B中,在显示器上,通过在相关的网页上突出显示某些字,已识别某些搜索实体。在图3C中,服务已自动突出显示某些字,以通知用户关于这些术语更多的信息是可用的(尽管在网页上的所有的项目、字和对象是可选择的且可搜索的)。在图3D中,字“New”和“York”被突出显示至叠加窗口的右侧。尽管这两个字在不同的行,但是服务通过将这些字与上下文比较来确定它们相关,然后将它们突出显示在显示器上。进行搜索,其返回在叠加窗口中显示的结果。
在另一实施方式中,系统不需要激活上下文模式,以允许用户执行搜索。在这些实施方式中,用户导航至如图3A所示的网页,且通过网页显示的任何字或字序列可用于用户选择。用户指示搜索关于术语的另外的信息的请求,诸如通过激活特定的鼠标按键或在触摸屏上执行“长按”,且以与图3D示出的方式类似的方式突出显示术语。在这些实施方式中的一些实施方式中,系统将突出显示被识别为可能的搜索术语的实体,而没有来自用户的输入。自动突出显示的术语的选择可以基于通过用户的系统的在先使用(例如,最近该术语已经被多个用户搜索)或可以基于其它考虑(例如,突出显示货币面值以使用户了解这样的术语可以被搜索)。
图4和图5A至图5D示出根据本发明的各种实施方式的用于上下文搜索服务的非限制性方法。参照图4,在步骤S400,根据一些实施方式,在可以执行上下文搜索前,通过部件202激活上下文搜索模式。根据一些实施方式,通过上下文搜索服务接受来自用户的输入、使用计算设备的处理器来激活上下文搜索模式,以实现上下文搜索模式。示例包括(但不限于):以鼠标输入、触摸屏输入、键盘输入、口说命令等形式的用户输入。例如,在非限制性的示例性实施方式中,利用触摸屏设备,通过接收与从屏幕底部的滑动运动对应的输入,来激活上下文搜索模式。又例如,在非限制性的示例性实施方式中,通过接收来自键盘的与用户按压Alt(或特定的元(meta)键)对应的输入来激活上下文搜索模式。根据一些实施方式,一旦激活,则服务使用显示器、音频设备等指示上下文搜索模式已被激活。
在其它实施方式中,上下文模式“始终开启”,即,不需要激活上下文模式以执行上下文搜索。在这些实施方式中,用户通过提供特定的预定义的输入来选择待被搜索的术语,所述输入诸如为激活特定的鼠标按键(例如单击右键)、激活特定的鼠标按键和键盘的特定的键(例如控件单击)、或者通过提供特定的触摸手势(诸如双指按压、三指按压或长按)。在一些实施方式中,用户的手指必须接触屏幕超过500毫秒,以登记长按。在其它实施方式中,用户的手指必须接触屏幕以登记长按的时间长度大于100毫秒、大于300毫秒、大于750毫秒或大于1000毫秒。
根据一些实施方式,当被激活时,使上下文搜索模式是持久的(即,保持激活直到其被关闭),或在一些实施方式中,通过接受指示用户按压热键或另外指示该选项被选择的输入来可选地使上下文搜索模式是持久的。根据其它实施方式,可通过接受指示用户按压热键或另外指示该该选项被选择的输入,来使上下文搜索模式是非持久的(否则其是持久的)。
对于上下文模式被激活的一些实施方式,进入上下文模式涉及暂停网页浏览器、电子邮件客户端或文件阅读器的其它典型的用户界面行为。对于上下文模式“始终开启”的实施方式,上下文搜索的激活暂停页面的正常行为。根据一些实施方式,可以暂停这些软件应用程序接受正常输入的能力,直到服务不再是上下文模式。在该情况下,只有用户输入用于禁用该服务或上下文模式时,服务才将响应于用于这些应用程序的用户输入。在这些实施方式中,与相关页面的用户交互事件被阻止且重定向、或在一些情况下被丢弃。例如,下列JavaScript事件可用于执行阻止用户交互事件:event.stopPropagation()。
在非限制性的示例性实施方式中,计算机监控器可以在浏览器窗口中显示图7A所示的网页,其中,字“JOBS”被超链接。当不在上下文模式时,点击“JOBS”会导致浏览器加载超链接指定的页面。当处于上下文模式,点击“JOBS”不会导致浏览器加载该页面。而是,服务将突出显示“JOBS”,指示“JOBS”是搜索实体。
返回图4,在步骤S410,根据各种实施方式,上下文搜索服务识别至少一个搜索实体。根据一些实施方式,由用户通过上下文搜索服务接受输入,使用计算设备的处理器识别搜索实体(或多个搜索实体),以指示搜索术语。示例包括(但不限于)鼠标输入、触摸屏输入、键盘输入、语音输入等形式的用户输入。根据一些实施方式,服务接受来自鼠标的与用户点击某物对应的输入。根据一些实施方式,服务接受来自触摸屏设备的与用户触摸、指向、保持、释放、进行拖拽移动等对应的输入。在其它实施方式中,用户可以通过提供另外的输入来微调搜索术语的选择。例如,用户可以拖拽用户接口元件的前缘,以指示在其选择中包括紧邻在初始选择的搜索术语之前的一个或多个字的请求。
根据一些实施方式,上下文搜索服务至少部分地通过消歧过程,使用计算设备的处理器来确定搜索实体(或多个搜索实体)。消歧过程本身也涉及确定局部上下文,以自动选择另外的搜索术语或确定搜索实体(或多个搜索实体)的边界。在一些实施方式中,上下文用于确定分别搜索可能的术语的各种组合的频率。然后该频率至少部分地用以确定在用户指示的术语之外选择哪些另外的搜索术语(如果有的话)。根据一些实施方式,相反,在步骤S440期间通过服务器106执行消歧。根据一些实施方式,在步骤S410和步骤S440期间均发生消歧。
例如,根据非限制性的示例性实施方式,在观看关于电影“加勒比海盗(ThePirates of the Caribbean)”的网页的同时,触摸屏计算机用户突出显示字“德普(Depp)”。上下文搜索服务将围绕德普的术语作为输入,该术语是“演员包括约翰尼·德普(Johnny Depp)、凯拉·奈特莉(eira nightley)和奥兰多·布鲁姆(Orlando Bloom)”。例如,服务然后确定“约翰尼·德普”是比“德普、凯拉”搜索得多的术语。服务也确定“约翰尼·德普”是比“德普”更理想的搜索术语。因此,服务选择“约翰尼·德普”作为搜索实体。
根据一些实施方式,上下文搜索服务通过查找接近于用户指示的术语的其它术语、术语的集合等,来确定局部上下文。根据一些实施方式,这样的术语包括(但不限于):邮政地址、电子邮件地址、URL(其可以或可以不与超文本链接对应)、货币、电话号码、地理位置等。在这些实施方式中,正规表达式可以用于确定这些类型的术语的存在。示例性的达正规表达式包括:地址-[{regex:/[\t\r\n]*(.+[,\u00A0]{l,}[A-Z]{2}[\u00A0]?[\d){5})($|[\-\r\n]+)/}、{regex:/(\d+\w*[^\r\n,]+(?:Street|St|Avenue|Ave)(,\d+\w+Floor)?)/}];货币-{code:'USD',symbol:'$',name:'dollars?'},{code:'EUR',symbol:'€',name:'euros?'},{code:'GBP',symbol:'£',name:'pounds?'};Twitter handle-/^[A-Za-z0-9_]+$/;和电话-[{regex:/([\d]{2}[\d]{2}[\d]{2}[\d]{2}[\d]{2})/},{regex:/([\d]{4}[\d]{4})/},regex:/((\+[\d]+)?\(?[\d]{3}\)?[-][\d]{3}[-][\d]{4})/}]。
根据一些实施方式,可以基于术语开始于大写字母、还是全部为大写字母、还是为混合的情况,来选择搜索术语。根据一些实施方式,这样的术语可以从邻近的句子的开头或结尾选择,其中,一些实施方式注意忽略不表示句子的结尾的句点(诸如用于缩写(诸如“U.S.”或“Inc.”)的那些句点)。一些实施方式基于邻近的字“桥”(诸如(但不限于)“the United States of America”中的“of”,用于表示拥有的撇号(“Gerry's”)、&号(“His&Hers”))的存在或不存在选择这样的术语。在许多实施方式中,通过包括常用规则的规则库来提供这种行为。
一些实施方式忽略常用的术语(例如,忽略“更多(more)”)。一些实施方式基于是否利用特殊的标签(例如,粗体、斜体、链接、标题标签(<hl>、<h2>、<h3>)等)来表示周围的HTML标签或其它编码,来选择术语。一些实施方式基于HTML或类似的文件中的母节点是否被标记为微格式标签或特殊语义标签,来选择术语。一些实施方式基于包括多个部分(如地址)的微格式选择术语,对于其它相关的标签扫描周围的区域,以在相同的时间突出显示他们。一些实施方式基于检测到的句子、字典术语、名词等选择术语。各种实施方式基于上述示例的任何组合或其它类似的示例来选择术语。
在其它实施方式中,进行上文描述的每一类型的分析,以识别在显示的页面上现存的搜索术语。在其它实施方式中,可以应用所识别的技术的各种子集。对于客户端机器是资源受限(诸如平板电脑或移动电话)的实施方式,分析受限的区域以节约资源。例如,下列JavaScript可以用于确定设备是否为移动设备:navigator.userAgent.indexOf(!mobile')。规则和技术可以独立于显示页面中的结构边界而应用,例如,处理不会受到从一行到另一行的文本环绕的影响。
在步骤S420中,根据各种实施方式,上下文搜索服务利用处理器通知用户在步骤S410中识别的搜索实体(或多个搜索实体)。根据一些实施方式,该通知是可视的,例如通过计算机装置的显示器。在一些实施方式中,在显示器上的文档中突出显示搜索实体(或多个搜索实体)。在其它实施方式中,所选区域的拷贝被放大,以帮助用户识别所选的实体。在其它实施方式中,文档被用于提高所选实体的对比度的层覆盖,然而,实现该对比度。例如,在图3A至图3D示出的实施方式中,较暗的层用来实现对比度。在其它实施方式中,为了最佳的对比度,所选文本的文本样式被分析并用改变为黑色的颜色再现;在HTML文档中,将分析和再现字体样式、字体系列、字体粗细和文本转换样式。可替选地,可以使用下列JavaScript函数来确定这些样式:node.style.fontFamily。
在一些实施方式中,弹出视窗、文本框等在对比层(如果提供的话)上面显示给用户,该对比层可包括任何搜索实体的列表。根据一些实施方式,所选择的一个搜索实体(或多个搜索实体)与用户所指示的相同,则不进行任何额外的通知。根据一些实施方式,服务关于选择哪一搜索实体而请求来自用户的输入。在一些其他的实施方式中,服务接收来自用户的指示用户选择的输入。在一些实施方式中,输入指的是用户按一键、触摸触摸屏、利用鼠标指向、进行语音命令或者其他指示用户选择的输入。
在一些其他实施方式中,所选择的搜素实体是图像、视频、音频或其他非文字实体。在这些实施方式中,向所选择的实体施加突出显示,并将其带到前景,例如,显示在对比层(如果存在的话)之上。
根据一些实施方式,服务已选择文字或非文字的搜索实体,并请求来自用户的输入以证实用户想要利用该搜索实体进行搜索。
在步骤S430,根据各个实施方式,在选择搜索实体后,即,在登记并释放触摸/点击后,查询以字符串构造并利用处理器发布给服务器。根据各个实施方式,丰富查询字符串是URL编码的,使得其可以包括在HTTP POST请求的主体中。丰富查询既包括搜索实体,又包括上下文信息(下文称为“丰富查询”)。根据一些实施方式,丰富查询包括增大相关搜索的可能性的上下文信息。根据一些非限制性的、示例性的实施方式,上下文信息包括在其上找到实体的页面的标题(可利用JavaScript命令document.title获取)、在其上找到实体的页面的URL(可利用JavaScript命令document.location获取,或在一些实施方式,利用提供的API自源代码读取)、META标签、关于字频率的信息和/或找到搜索实体的网页的类似信息的任意组合。字频率可以在客户端上进行计算,且包括在对于服务器的HTTP POST请求中。根据一些实施方式,上下文信息包括以下内容的任意组合:刚好位于搜索实体之前的文字、刚好位于搜索实体之后的文字、如果超文本标签围绕搜索实体则对应的URL、围绕搜索实体的父级标签内部的信息(例如,属性)、关于围绕搜索实体的语义标签的信息、关于当前正执行的应用程序的信息(诸如,网络浏览器)、与先前的搜索相关的信息、与所访问的网络页面相关的信息、与所选择的超文本链接相关的信息,与用户的配置文件相关的信息和/或类似内容。
关于当前正执行的应用程序的信息可以通过由客户端的操作系统提供的API揭露。在一些特定的实施方式中,系统能够访问窗口的标题或窗口名称,其中,呈现出所选择的实体以及负责显示所选择的实体的可执行的应用程序的名称。某些应用程序可以允许访问其他的信息。例如,电子邮件程序也可以允许访问电子邮件的标题,即“主题”行,文字处理程序可以允许访问所显示的文档的标题或该文档的其它特征,例如字数统计。
通过遍历DOM树以确定在包括所选择的实体的节点前面的节点并提取出该前一节点的内容以及还确定在包含所选择的实体后面的节点并提取出该下一节点的内容,可以获得上下文信息。因此,在接下来的语句中:“Nicolas Sarkozyis the23rd President of the French Republic”(Nicolas Sarkozy是法兰西共和国的第23任总统),其中,23rd President(该第23任总统)已被选择,文字“NicolasSarkozy”也将被提取出并包括在HTTP POST请求中。相似的技术可以用来确定在所选择的实体后的文字,即,在上述语句中,术语“French Republic”(法兰西共和国)也可被提取出并包括在HTTP POST请求中。在一些实施方式中,使用该技术,直到获得所选择的实体之前的25个字符,直到获得所选择的实体之后的25个字符,或者直到上述二者都获得;在其它实施方式中,使用该技术,以获得在所选择的实体之前的50个字符,在所选择的实体之后的50个字符,或者二者都获得;在另外其它实施方式中,使用该技术,以获得在所选择的实体之前的100个字符,在所选择的实体之后的100个字符,或者二者都获得;在另外的其它实施方式中,使用该技术,以获得在所选择的实体之前的250个字符,在所选择的实体之后的250个字符,或者二者都获得。用于从前面的节点提取内容的示例性代码如下:
类似地,用于获得下一节点的内容的示例性代码如下:
在一些实施方式中,所选择的实体是超链接的或链接的一部分。例如,利用以上的示例,当选择“23rd President”(第23任总统)时,用户可以实际上选择下列HTML代码:
如上所述,实体的选择将暂停页面的正常处理。因此,不是遍历文字“23rdPresident”所识别的链接,而是该选择将被拦截并丢弃。则系统将利用“A”HTML标签识别所选择的实体是链接,然后还将从HTML代码提取出来自链接的有帮助的属性,诸如,在上述示例中,HREF属性、ALT属性和TITLE属性。这些所提取出的属性与所选择的实体被包括在HTTP POST请求中。该系统还可使用JavaScript命令“element.getattribute()”以获得标签的属性。
在其它实施方式中,系统可以使用JavaScript命令“document.querySelectorAll('h l,h2,h3,h4,h5,h6,h7.h8')”获得与来自其上出现有所选择的实体的页面的标头相关联的文字。所获得的文字然后被包括在发送给服务器的HTTPPOST请求中。系统还可以搜索网页的DOM以识别META标签。与META标签相关联的文字也可以是有用的。文档中的每个META标签将通过以下命令返回:document.getElementsByTagName('meta');每个返回的标签可以使用以下示例性代码而进行分析:
根据非限制性的、示例性的实施方式,图7A示出简单的网页,图7B示出对应的丰富查询字符串。用户已经突出显示“132Crosby Street,4th Floor NewYork,NY10012”,其用作搜索实体。丰富查询字符串包括服务器的名称(“查询-服务器-beta”(query-server-beta))、数据类型(“JSON”)、所请求的布局类型(“默认”)、返回类型(“javascript”)、语言或文化说明符(“en-US”)以及搜索实体的网页的URL(“http://kikin.com/contact”)。另外地,丰富查询字符串包括在搜索实体的网页上发现的信息,包括地址(“132Crosby Street,4th Floor,New York,NY10012”)、极为靠近地址的文字(“kikin Headquarters”)、电话号码(“646-395-1280”)、凸显的文字(“Contact Us”)、以及META标签中规定的关键字(“kikin、脸谱网(facebook)、推特网(twitter)、社交网络(social networking)、比价网(pricecomparison)、浏览器插件(browser plugin)”)。
在另一实施方式中,关于其上发现所选择的实体的网页的HTML层次的信息可以用来确定内容。在以上示例中,用于将地址显示给用户的HTML代码可以是:
在这些实施方式中,选择“New York”将致使系统遍历用于网页的DOM模型并检测到所选择的实体是ADDRESS标签的和DIV标签的一部分。所提取出的层次信息包括在发送给服务器的HTTP POST请求中。
在其它实施方式中,当可用时,系统可以使用微格式识别实体。微格式是HTML元素的属性,其存储关于标签的、用户不可见的额外信息。例如:
在以上示例中,如果用户选择“Brooklyn”(布鲁克林),则系统将检测性质“itemprop”的存在,并解析DOM树以将该选择标记为地址。如果微格式被识别,则将其保存并包括在对于服务器的HTTP POST请求中。
根据各个实施方式,当制订用于传输至服务器的丰富查询时,与用户的配置文件相关的信息也可被使用。这样的信息包括但不限于以下中的任意组合:用户访问的文档的历史、喜爱的网站或书签、喜爱的网站或书签的类别、共享、之前的搜索、最近的先前搜索、用户涉及当前网页的搜索、保存、兴趣、社交网络、频繁访问的应用程序/文档/网站、体现特定的时间段期间用户访问的所有域的布隆过滤器数据结构、体现用户保存来自其的网页的所有域的布隆过滤器数据结构、体现用户共享其上的网页的所有域的布隆过滤器数据结构等。根据非限制性的、示例性的实施方式,图6示出包含关于简单的用户配置文件的信息的数据结构的文字表示。
由用户进行的之前的搜索被存储且可以用作用户配置文件的一部分。另外地,当用户访问网页时,这些网页的URL被记录且发送给服务器。例如,用户在www.google.com上搜索“新摄像机”,且然后访问关于摄像机的多个网页,该搜索和用户访问的网页将被发送给服务器且用来细化上下文查询以使其更趋向于与摄像机相关的结果。
类似地,用户在网络浏览期间保存的书签被访问且发送给服务器,以用来细化上下文搜索。例如,如果用户已经将google.com、bbc.com/news和cnn.com设定成书签,则服务器可以利用该事实来响应于请求而提供较多相关新闻的站点。
根据各个实施方式,在建立丰富查询后,利用处理器将该丰富查询从部件202发送到服务器106。根据一些实施方式,可以建立并发送多于一个的丰富查询。根据其他的实施方式,丰富查询可以是相同的;在另外的实施方式中,至少一些丰富查询可以至少部分地不同于另一丰富查询。根据各个实施方式,处理器利用联网设备将该丰富查询(或多个丰富查询)发送至(多个)服务器106。根据一些实施方式,丰富查询并没有被发送给服务器,而是在客户端102上通过(多个)部件202处理。可替选地,丰富查询既可以通过客户端发送给服务器106,又可以通过(多个)部件202本地处理。根据其他实施方式,没有建立丰富查询,相反,将用于丰富查询的上下文信息被发送给(多个)服务器106,通过(多个)部件202直接处理,或者既被发送给服务器、又通过部件直接处理。
在步骤S440中,根据各个实施方式,上下文搜索服务利用处理器获得来自从(多个)部件202接收的丰富查询(或多个丰富查询)的上下文。根据一些实施方式,服务预处理存储在丰富查询(或多个丰富查询)中的属性,以识别潜在地对改进搜索结果有用的上下文。根据一些实施方式,服务基于存储在搜索查询(或多个搜索查询)中的上下文信息,对搜索实体(或多个搜索实体)分类。根据一些实施方式,在上下文信息的帮助下,服务对任何引起歧义的术语的意思消除歧义。服务还可运用该服务的其它用户所获得的结果,以进一步细化给予任何特定用户的结果。
对于所选择的实体是图像的实施方式,图像提交给面孔识别服务以识别图片中的人或产品。来自于该转换的结果(其为文字)然后由服务用作所选择的搜索实体。对于所选择的实体是音频的实施方式,音频的数字指纹被提交给音频识别服务,诸如通过Rovi Shazam和IntoNow提供的服务。在一些实施方式中,被提交给音频识别服务的音频指纹通过对包含该文件的PCM数据执行散列而产生。从音频识别服务返回的结果为文字,然后被用作所选择的搜索实体。
对于所选择的实体是文本的实施方式,服务器基于所选择的文字和周围的文字识别最可能的字序列。在一个实施方式中,服务器通过产生n连字(n-word-grams)的列表来完成这一点。在一些实施方式中,用以创建连字的字数为10个字;在其它实施方式中,使用8个字;在另外的其它实施方式中,使用6个字;在又另外的实施方式中,使用4个字;在另外的实施方式中,使用2个字。
作为此的示例,对于句子:
Tunisia,the country where the Arab Spring uprisings began this year,has joinedthe International Criminal court,becoming the first North African country to do so
其中,“International Criminal”是所选择的文字,在使用6个字的实施方式中,这将导致以下的连字(word-grams)的集合:
this year has joined the international
year has joined the international criminal
has joined the international criminal court
joined the international criminal court becoming
the international criminal court becoming the
international criminal court becoming the first
criminal court becoming the first north
year has joined the international
has joined the international criminal
joined the international criminal court
the international criminal court becoming
international criminal court becoming the
criminal court becoming the first
has joined the international
joined the international criminal
the international criminal court
international criminal court becoming
criminal court becoming the
joined the international
the international criminal
international criminal court
criminal court becoming
the international
international criminal
criminal court
international
criminal
在一些实施方式中,产生的每一连字可以用来作为搜索引擎的输入,所述搜索引擎诸如为google.com、bing.com、yahoo.com等。可以查看从这些搜索引擎返回的结果,以确定任意结果是否含有知识管理网站(诸如wikipedia.com)的链接。返回具有知识管理网站的链接的搜索结果的连字然后从最受欢迎到最不受欢迎进行排序。返回最受欢迎的搜索的最长的连字被选择作为目标搜索术语。
然后可以查看所选择的搜索术语,以确定字或字序列是否含有多个意思。在一个实施方式中,通过查阅有歧义的措辞的资料录(诸如由wikipedia.com维持的资料录),来完成这一点。在该实施方式中,如果措辞是有歧义的,则将用户最初选择该文字的网页的该文字与自消歧义页面链接的每一页面上的文字进行比较。选择具有最明显的重叠的页面并基于此调节突出显示的文字。在具体的示例中,对于以下文字:https://www.applebank.com/about.aspx,当用户突出显示“Apple”时,向消歧义页面进行一请求,该消歧义页面例如为http://en.vvikipedia.org/wiki/Apple(disambiguation)。在相关页面上的文字与自以上消歧义页面链接的每一页面进行比较。由于在http://en.wikipedia.org/wiki/Apple_Bank上使用的字比其他页面重叠得更多,所述其他页面例如为1863(该银行组成的年份)、125th(第一分行所位于的街道)、抵押、金融或纽约,苹果银行(Apple Bank)被选择作为未来将使用的消除歧义后的搜索术语。
在步骤S450中,根据各个实施方式,上下文搜索服务利用处理器识别用于查询提交的相关内容源。内容源包括但不限于与因特网相关的源、与具体的贸易相关的源、与旅行相关的源、或与其他服务相关的源、知识源(例如Wikipedia和Wolfram Alpha)、私有源(诸如公司数据库)等。根据各个实施方式,在步骤S440中确定的上下文信息用来确定哪一内容源或哪些内容源是相关的。例如,根据一些非限制性的示例性实施方式,呈现为与旅行目的地(根据搜索实体及其上下文)相关的丰富查询将通过服务而匹配于与因特网相关的和与旅行相关的源。根据一些实施方式,至少部分地基于丰富查询看起来所相关的媒体的类型(例如,视频、相片等),来确定内容源。根据一些实施方式,至少部分地基于丰富查询看起来所相关的本体论范畴,例如,贸易、旅行等,来确定内容源。根据一些实施方式,由用户指示且由服务接收的偏好部分地确定内容源的类型。
更详细地,可以通过搜索内容源的组群(下文称为“垂直类别”),来执行步骤S450。总体上,消除歧义的字或字序列用来返回总体的搜索结果,接着,该总体的搜索结果然后与垂直类别映射资料录相比较,以识别可能相关的内容源。在一些实施方式中,垂直类别可以基于例如上下文特定的偏斜或用户偏好而被选择或指定优先级。
该过程的特定的示例是如何选择内容源用于总体的搜索术语,例如“Hawaii”(夏威夷)。对“Hawaii”(夏威夷)的总体搜索可以返回例如如下结果:
1.www.gohawaii.com
2.www.gohawaii.com/big-island
3.Hawaii的地图(Map of Hawaii)
4.hawaii.gov/
5.www.capitol.hawaii.gov/session2011/
6.Hawaii图像(Images for Hawaii)
7.en.wikipedia.org/wiki/Hawaii
8.www.co.hawaii.hi.us/
9.www.lonelyplanet.com/usa/hawaii
分类索引的URL前缀包括用于“地图->地图”(“Map->Map”)、“图像->图像”(“Images->Images”)、“维基百科->参考”(“Wikipedia->References”)和“寂寞星球->旅行”(“Lonely Planet->Travel”)的分类。基于这些结果,服务选择下列垂直分类:地图、图像、参考和旅行。在一个实施方式中,对于每一域,由用户最频繁访问的垂直类别被追踪。也就是说,例如,如果在lonelyplanet.com上的人碰巧观看的图像比地图多,则对于与lonelyplanet.com相关的未来搜索中的所有用户而言,图像的优先级将高于地图。然而,如果特定的用户观看视频的频率大于一般人群,则将仅对于该用户而引入(或宣传)视频类别。
在步骤S460中,根据各个实施方式,上下文搜索服务利用处理器将丰富查询(或多个丰富查询)转化为标准查询(或多个标准查询)。标准查询是这样的查询:其可接受作为步骤S450中识别的内容源的输入。根据各个实施方式,标准查询包括一个或多个搜索实体。根据各个实施方式,标准查询还包括与搜索实体相关联的上下文信息。根据一些实施方式,如果在步骤S440期间,服务借助上下文信息对任何有歧义的术语的意思消除歧义,则另外的术语可以被包括在标准查询中,这由消除歧义过程确定。根据一些实施方式,布林逻辑应用至标准查询构建。在非限制性的实施方式中,例如,在构建用于接受布林搜索查询的互联网搜索源的标准查询中,使用布林逻辑。
根据一些实施方式,搜索实体中不需要的字不包括在标准查询中。例如,如果搜索实体长,则可以使搜索实体变短来用于标准查询,从而增大结果的多样性。这是因为,过于特定的搜索字符串可返回来自过窄的源的列表的结果。
更详细地,对于所识别的每一垂直源,产生查询字符串,该查询字符串可以由上下文源理解。在一些实施方式中,每一垂直源具有相关的输入和输出映射,其将从客户端接收到的丰富查询转换成用于内容源的特定的指令。例如,为了搜索YouTube,可以产生以下查询指令:
http://gdata.youtu be.com/feeds/api/videos?q={QUERY} &orderby=relevance&safeSe
arch=moderate&max-results=20&format=5&v=2&client=ytapi-kikin-Youtubevideo widg-s7nshfa6-0&lr={LANGUAGE}
占位符{QUERY}和{LANGUAGE}可基于丰富查询而被填充。YouTube结果可以下列方式映射:
feed/entries/title->title
feed/entries/links/href->link
feed/entries/mediaGroup/thumbnails->thumbnail
以返回可以由服务使用的结果。在一些实施方式中,所有的内容源被并行地访问,且每一源的结果被后置过滤和重排序。
在步骤S470中,根据各个实施方式,上下文搜索服务利用处理器获得来自内容源(多个内容源)的结果。根据各个实施方式,通过将在步骤S460中构建的标准查询(或多个标准查询)提交至在步骤S450中识别的内容源(多个内容源)来获得结果,服务接着接受来自所述内容源中的一个或多个内容源的结果。根据各个实施方式,结果被处理。根据一些实施方式,结果被排序以去除重复结果(例如,将结果发送至多个内容源可返回来自一个内容源的与来自另一内容源的一个或多个结果重复的结果)。根据一些实施方式,将结果按照上下文相关性进行排序。根据各个实施方式,结果或处理后的结果通过处理器,使用联网设备而被发送至(多个)部件202。
根据非限制性的、示例性的实施方式,图7C示出包含样本结果的数据结构的文字表示,该样本结果是通过已被提供以图7B的丰富查询字符串的服务器所返回的。搜索实体是“132Crosby Street,4th Floor New York,NY10012”。关于用户的配置文件的信息包括国家代码、IP地址、国家、地区、城市、DMA码、区域、区域码、邮政编码、大陆码、维度和经度。结果包括关于在搜索实体中提供的地址的地图信息(维度、经度和邮政地址)。结果还包括与在搜索实体中提供的地址的位置相关的网站(地方政府网站)。
返回至图4,在步骤S480中,根据各个实施方式,上下文搜索服务利用处理器过滤结果。根据一些实施方式,根据从用户接收到的设置或存储在用户配置文件中的设置,过滤结果。根据一些实施方式,根据部件202的设备的物理限制(例如,设备的屏幕尺寸、时延和/或高速缓存),过滤结果。
更详细地,所有内容源搜索的结果可以基于垂直类别的顺序而合并,合并后的结果可以发送给客户端。在一些实施方式中,结果与客户端侧的查询描述符一起被发送至客户端。在一些特定的实施方式中,搜索结果以JSON编码的结构的形式发送给客户端。
在步骤S490中,根据各个实施方式,上下文搜索服务利用处理器呈现结果。根据各个实施方式,呈现结果涉及将结果显示在显示器上。根据一些实施方式,服务接受来自用户的输入以更新搜索实体,使得可以进行新的搜索。根据一些实施方式,结果显示在弹出视窗、对话框、未打开或打开的标签、叠加层等中。根据一些实施方式,结果以文字的形式和/或丰富媒体的形式显示,该丰富媒体包括图像、视频、地图和/或其它类似媒体。在其它实施方式中,服务器将查询转换提供给客户端,客户端自身执行该查询。
在一些实施方式中,客户端自身可独立地或并行地执行上述的相同系列的步骤。例如,客户端可以执行内容源的并行查询且将这些结果合并成自服务器接收到的结果。对于这些实施方式,客户端遵循上文关于服务器描述的相同的查询逻辑。在一些实施方式中,来自服务器的结果可以用来更新或调节选择的实体。在这些实施方式中,更新后或调节后的选择的实体可以被如上所述的那样搜索。
已描述了用于与软件交互的设备的某些实施方式,对于本领域的技术人员而言,现在应当显而易见的是,可以使用并入本公开的概念的其它实施方式。

Claims (60)

1.一种用于提供关于包括在内容页面中的语义实体的上下文信息的方法,所述方法包括:
将包括一个或多个语义实体的内容页面显示给用户;
通过处理器识别所包括的一个或多个语义实体;以及
接收来自所述用户的输入,所述输入指示接收关于所识别的语义实体中的特定的一个语义实体的上下文信息的请求。
2.根据权利要求1所述的方法,还包括突出显示所识别的语义实体。
3.根据权利要求1所述的方法,其中,所接收的用户输入以触摸屏输入的形式接收。
4.根据权利要求1所述的方法,还包括暂停所显示的页面的用户界面行为。
5.根据权利要求4所述的方法,还包括响应于包括拖曳移动的用户输入,暂停所显示的页面的所述用户界面行为。
6.根据权利要求1所述的方法,其中,识别所包括的一个或多个语义实体包括确定局部上下文,以确定所述实体的边界。
7.根据权利要求1所述的方法,其中,识别所包括的一个或多个语义实体包括确定搜索字组合的频率超过预定的阈值。
8.根据权利要求1所述的方法,其中,识别所述所包括的一个或多个语义实体包括确定搜索第一字和第二字的频率超出搜索第二字和第三字的频率。
9.根据权利要求1所述的方法,其中,识别所包括的一个或多个语义实体包括确定页面中的字的评估总额。
10.根据权利要求1所述的方法,其中,识别所包括的一个或多个语义实体包括确定页面中的HTML标签的存在。
11.一种用于提供关于包括在内容页面中的语义实体的上下文信息的系统,所述方法包括:
用于将包括一个或多个语义实体的内容页面显示给用户的装置;
用于识别所包括的一个或多个语义实体的装置;以及
所述用户的输入的接收装置,所述输入指示接收关于所识别的语义实体中的特定的一个语义实体的上下文信息的请求。
12.根据权利要求11所述的系统,还包括用于突出显示所识别的语义实体的装置。
13.根据权利要求11所述的系统,其中,所述接收装置接收以触摸屏输入的形式的输入。
14.根据权利要求11所述的系统,还包括用于暂停所显示的页面的用户界面行为的装置。
15.根据权利要求11所述的系统,其中,暂停装置响应于包括拖曳移动的用户输入,来暂停所显示的页面的所述用户界面行为。
16.根据权利要求11所述的系统,其中,识别装置通过确定局部上下文以确定所述实体的边界来识别所述所包括的一个或多个语义实体。
17.根据权利要求11所述的系统,其中,识别装置通过确定搜索字组合的频率超出预定的阈值,来识别所包括的一个或多个语义实体。
18.根据权利要求11所述的系统,其中,所述识别装置通过确定搜索第一字和第二字的频率超出搜索第二字和第三字的频率,来识别所包括的一个或多个语义实体。
19.根据权利要求11所述的系统,其中,所述识别装置通过确定页面中的字的评估总额,来识别所包括的一个或多个语义实体。
20.根据权利要求11所述的系统,其中,所述识别装置通过确定页面中的HTML标签的存在来识别所包括的一个或多个语义实体。
21.一种用于从包括在页面中的所选择的语义实体构建丰富查询的方法,所述方法包括:
a.接收识别语义实体的用户输入,对于所述语义实体,期望有上下文信息;
b.识别与所述所选择的语义实体相关联的上下文信息;
c.利用所述语义实体和所识别的上下文信息,编码统一资源定位符URL;以及
d.将所编码的URL发送给搜索服务器。
22.根据权利要求21所述的方法,其中,用户输入通过触摸屏界面接收。
23.根据权利要求21所述的方法,其中,利用包括所述语义实体的页面的
特征,识别上下文信息。
24.根据权利要求23所述的方法,其中,利用下列中的一个来识别上下文信息:网页的标题、识别网页的URL、包括在网页中的META标签、以及识别包括所述语义实体的所述网页的字频率的信息。
25.根据权利要求21所述的方法,其中,利用关于所述用户的浏览历史的信息,来识别上下文信息。
26.根据权利要求25所述的方法,其中,所述关于所述用户的浏览历史的信息包括下列中的一个:所述用户的浏览历史、所述用户的喜爱的网站、所述用户保存的书签、所述用户请求的先前搜索以及频繁访问的网站。
27.根据权利要求21所述的方法,其中,利用所述用户建立的配置文件,识别上下文信息。
28.根据权利要求21所述的方法,其中,利用布隆过滤器识别上下文信息。
29.根据权利要求21所述的方法,还包括利用所述语义实体和第一上下文信息编码第一URL以及利用所述语义实体和第二上下文信息编码第二URL。
30.根据权利要求21所述的方法,其中,利用HTTP POST命令发送编码的URL。
31.一种用于从包括在页面中的所选择的语义实体构建丰富查询的系统,所述方法包括:
用于接收识别语义实体的用户输入的装置,对于所述语义实体,期望有上下文信息;
用于识别与所选择的语义实体相关联的上下文信息的装置;
用于利用所述语义实体和所识别的上下文信息来编码统一资源定位符URL的装置;以及
用于将所编码的URL发送给搜索服务器的装置。
32.根据权利要求31所述的系统,其中,接收装置通过触摸屏界面接收用户输入。
33.根据权利要求31所述的系统,其中,识别装置利用包括所述语义实体的页面的特征识别上下文信息。
34.根据权利要求31所述的系统,其中,所述识别装置利用下列中的一个来识别上下文信息:网页的标题、识别网页的URL、包括在网页中的META标签、以及识别包括所述语义实体的所述网页的字频率的信息。
35.根据权利要求31所述的系统,其中,所述识别装置利用关于用户的浏览历史的信息,识别上下文信息。
36.根据权利要求35所述的系统,其中,所述关于所述用户的浏览历史的信息包括下列中的一个:所述用户的浏览历史、所述用户的喜爱的网站、所述用户保存的书签、所述用户请求的先前搜索以及频繁访问的网站。
37.根据权利要求31所述的系统,其中,识别装置使用所述用户建立的配置文件来识别上下文信息。
38.根据权利要求31所述的系统,其中,所述识别装置利用布隆过滤器识别上下文信息。
39.根据权利要求31所述的系统,其中,编码装置利用所述语义实体和第一上下文信息编码第一URL以及利用所述语义实体和第二上下文信息编码第二URL。
40.根据权利要求31所述的系统,其中,发送装置利用HTTP POST命令发送编码的URL。
41.一种用于语义实体的上下文搜索的方法,包括:
接收丰富查询,所述丰富查询包括待被搜索的语义实体和关于所述语义实体的选择的上下文信息;
接收来自搜索引擎的多个搜索结果,所述多个搜索结果是响应于利用所选择的语义实体提交搜索请求而返回的;
基于所返回的搜索结果,选择待被搜索的多个内容源;
将所接收的丰富查询转换为多个简单查询,所述多个简单查询中的每个简单查询对应于所述多个内容源中的一个内容源;
将所述多个简单查询中的每个简单查询提交给相应的内容源;
接收来自所述多个内容源中的每个内容源的结果;以及
将多个接收到的结果过滤成单一的结果列表,以呈现给用户。
42.根据权利要求41所述的方法,还包括对所述语义实体消除歧义的步骤。
43.根据权利要求42所述的方法,其中,消除歧义的步骤还包括查阅歧义措辞的资料录。
44.根据权利要求42所述的方法,其中,消除歧义的步骤还包括自所述语义实体形成多个连字、接收通过向搜索引擎提交所述连字中的每一连字而获得的搜索结果以及将返回最受欢迎的结果的连字选择作为消除歧义的搜索术语。
45.根据权利要求41所述的方法,其中,选择多个源包括将所返回的搜索结果与识别相关的内容源的垂直类别映射比较。
46.根据权利要求41所述的方法,其中,将所述丰富查询转换成简单查询包括自所述丰富查询产生CGI查询。
47.根据权利要求41所述的方法,其中,所述多个简单查询中的每个简单查询与所述多个简单查询中的其他简单查询基本上同时地提交给相应的内容源。
48.根据权利要求41所述的方法,其中,过滤所述多个接收的结果包括去除重复的结果。
49.根据权利要求41所述的方法,还包括将过滤后的结果发送给客户端以显示给用户。
50.根据权利要求49所述的方法,其中,所述结果以JSON编码的结构发送。
51.一种用于语义实体的上下文搜索的系统,包括:
用于接收丰富查询的装置,所述丰富查询包括待搜索的语义实体以及关于所述语义实体的选择的上下文信息;
用于接收来自搜索引擎的多个搜索结果的装置,所述多个搜索结果是响应于利用所选择的语义实体提交搜索请求而返回的;
用于基于所返回的搜索结果选择待被搜索的多个内容源的装置;
用于将所接收的丰富查询转换为多个简单查询的装置,所述多个简单查询中的每个简单查询对应于所述多个内容源中的一个内容源;
用于将所述多个简单查询中的每个简单查询提交给相应的内容源的装置;
用于接收来自所述多个内容源中的每个内容源的结果的装置;以及
用于将多个接收到的结果过滤成单一的结果列表以呈现给用户的装置。
52.根据权利要求51所述的系统,还包括用于对所述语义实体消除歧义的装置。
53.根据权利要求52所述的系统,其中,消除歧义的装置查阅歧义措辞的资料录。
54.根据权利要求52所述的系统,其中,所述消除歧义的装置自所述语义实体形成多个连字、接收通过向搜索引擎提交所述连字中的每一连字而获得的搜索结果以及将返回最受欢迎的结果的连字选择作为消除歧义的搜索术语。
55.根据权利要求51所述的系统,其中,选择装置将所返回的搜索结果与识别相关的内容源的垂直类别映射比较。
56.根据权利要求51所述的系统,其中,转换装置从所述丰富查询产生CGI查询。
57.根据权利要求51所述的系统,其中,提交装置将所述多个简单查询中的每个简单查询与所述多个简单查询中的其他简单查询基本上同时地提交给相应的内容源。
58.根据权利要求51所述的系统,其中,过滤装置去除重复的结果。
59.根据权利要求51所述的系统,其中,发送装置将过滤后的结果发送给客户端以显示给用户。
60.根据权利要求59所述的系统,其中,所述发送装置将所述过滤后的结果以JSON编码的结构发送给客户端。
CN201280047977.8A 2011-07-28 2012-04-20 用于提供关于包括在内容页面中的语义实体的信息的系统和方法 Pending CN104025085A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201161512826P 2011-07-28 2011-07-28
US61/512,826 2011-07-28
US13/229,302 2011-09-09
US13/229,311 US20130031076A1 (en) 2011-07-28 2011-09-09 Systems and methods for contextual searching of semantic entities
US13/229,245 2011-09-09
US13/229,311 2011-09-09
US13/229,302 US20130031110A1 (en) 2011-07-28 2011-09-09 Systems and methods for rich query construction
US13/229,245 US8898583B2 (en) 2011-07-28 2011-09-09 Systems and methods for providing information regarding semantic entities included in a page of content
PCT/US2012/034476 WO2013015852A1 (en) 2011-07-28 2012-04-20 Systems and methods for providing information regarding semantic entities included in a page of content

Publications (1)

Publication Number Publication Date
CN104025085A true CN104025085A (zh) 2014-09-03

Family

ID=47598114

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280047977.8A Pending CN104025085A (zh) 2011-07-28 2012-04-20 用于提供关于包括在内容页面中的语义实体的信息的系统和方法
CN201280047924.6A Pending CN103842993A (zh) 2011-07-28 2012-07-20 用于上下文个性化搜索的系统和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201280047924.6A Pending CN103842993A (zh) 2011-07-28 2012-07-20 用于上下文个性化搜索的系统和方法

Country Status (4)

Country Link
US (5) US20130031076A1 (zh)
EP (2) EP2737413A1 (zh)
CN (2) CN104025085A (zh)
WO (2) WO2013015852A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677684A (zh) * 2014-11-21 2016-06-15 华东师范大学 一种基于外部数据源对用户生成内容进行语义标注的方法
CN111052124A (zh) * 2017-07-17 2020-04-21 快乐股份有限公司 评估行为干预的遵守保真度
CN113609309A (zh) * 2021-08-16 2021-11-05 脸萌有限公司 知识图谱构建方法、装置、存储介质及电子设备

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9510930B2 (en) * 2008-10-22 2016-12-06 Contego Medical, Llc Angioplasty device with embolic filter
US9707071B2 (en) * 2004-11-24 2017-07-18 Contego Medical Llc Percutaneous transluminal angioplasty device with integral embolic filter
US9443518B1 (en) 2011-08-31 2016-09-13 Google Inc. Text transcript generation from a communication session
US9135344B2 (en) * 2011-12-20 2015-09-15 Bitly, Inc. System and method providing search results based on user interaction with content
US9582592B2 (en) 2011-12-20 2017-02-28 Bitly, Inc. Systems and methods for generating a recommended list of URLs by aggregating a plurality of enumerated lists of URLs, the recommended list of URLs identifying URLs accessed by users that also accessed a submitted URL
US9111211B2 (en) 2011-12-20 2015-08-18 Bitly, Inc. Systems and methods for relevance scoring of a digital resource
US9135211B2 (en) 2011-12-20 2015-09-15 Bitly, Inc. Systems and methods for trending and relevance of phrases for a user
US9619811B2 (en) 2011-12-20 2017-04-11 Bitly, Inc. Systems and methods for influence of a user on content shared via 7 encoded uniform resource locator (URL) link
US9128896B2 (en) 2011-12-20 2015-09-08 Bitly, Inc. Systems and methods for identifying phrases in digital content that are trending
US9098345B2 (en) * 2012-02-01 2015-08-04 Softlayer Technologies, Inc. System and method for portable and flexible deployment of servers
KR20130106519A (ko) * 2012-03-20 2013-09-30 삼성전자주식회사 웹 브라우저의 히스토리 관리 방법 및 장치
US9251133B2 (en) 2012-12-12 2016-02-02 International Business Machines Corporation Approximate named-entity extraction
US20140181096A1 (en) * 2012-12-21 2014-06-26 Microsoft Corporation Entity name disambiguation
US20150006325A1 (en) * 2013-06-27 2015-01-01 Lucy Ma Zhao Product search using user selections in images systems and methods
US10235455B2 (en) * 2013-07-31 2019-03-19 Innography, Inc. Semantic search system interface and method
US9002835B2 (en) 2013-08-15 2015-04-07 Google Inc. Query response using media consumption history
US10055103B1 (en) 2013-10-21 2018-08-21 Google Llc Text entry based on persisting actions
US10175850B2 (en) * 2013-11-23 2019-01-08 Sharp Laboratories Of America Search inquiry method using contextual annotation
KR102146261B1 (ko) 2014-02-14 2020-08-20 삼성전자 주식회사 전자 장치 및 전자 장치의 대화 메시지에서 의미개체 추출 및 이용방법
US20150278860A1 (en) * 2014-03-25 2015-10-01 Google Inc. Dynamically determining a search radius to select online content
US9613145B2 (en) * 2014-06-18 2017-04-04 Google Inc. Generating contextual search presentations
US11120210B2 (en) 2014-07-18 2021-09-14 Microsoft Technology Licensing, Llc Entity recognition for enhanced document productivity
US9710558B2 (en) * 2014-07-22 2017-07-18 Bank Of America Corporation Method and apparatus for navigational searching of a website
US9472009B2 (en) 2015-01-13 2016-10-18 International Business Machines Corporation Display of context based animated content in electronic map
CN105868166B (zh) * 2015-01-22 2020-01-17 阿里巴巴集团控股有限公司 一种正则表达式的生成方法及系统
JP6656258B2 (ja) 2015-01-23 2020-03-04 コンテゴ メディカル エルエルシー 一体型塞栓フィルタを有する介入デバイス及び関連方法
WO2016125820A1 (ja) * 2015-02-03 2016-08-11 日機装株式会社 クランプ装置
US10009297B2 (en) 2015-03-12 2018-06-26 International Business Machines Corporation Entity metadata attached to multi-media surface forms
US11442977B2 (en) 2015-03-24 2022-09-13 International Business Machines Corporation Augmenting search queries based on personalized association patterns
US10324926B2 (en) 2015-05-15 2019-06-18 Microsoft Technology Licensing, Llc System and method for extracting and sharing application-related user data
US11468101B2 (en) * 2015-05-29 2022-10-11 Kuni Ahi LLC Context-rich key framework implementations for global concept management
US10425492B2 (en) 2015-07-07 2019-09-24 Bitly, Inc. Systems and methods for web to mobile app correlation
EP3397173A4 (en) * 2015-10-30 2019-11-06 Ecmotek, LLC DEVICES FOR ENDOVASCULAR ACCESS THROUGH EXTRACORPOREAL SURVIVAL CIRCUITS
US10650007B2 (en) * 2016-04-25 2020-05-12 Microsoft Technology Licensing, Llc Ranking contextual metadata to generate relevant data insights
US10366368B2 (en) * 2016-09-22 2019-07-30 Microsoft Technology Licensing, Llc Search prioritization among users in communication platforms
FR3058044A1 (fr) * 2016-10-27 2018-05-04 Ldr Medical Cage intersomatique expansible
CN108986797B (zh) * 2018-08-06 2021-07-06 中国科学技术大学 一种语音主题识别方法及系统
USD937303S1 (en) * 2020-07-27 2021-11-30 Bytedance Inc. Display screen or portion thereof with a graphical user interface
USD937304S1 (en) * 2020-07-27 2021-11-30 Bytedance Inc. Display screen or portion thereof with an animated graphical user interface
CN113190740A (zh) * 2021-04-30 2021-07-30 百度在线网络技术(北京)有限公司 搜索处理方法、装置、电子设备、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080140619A1 (en) * 2006-12-07 2008-06-12 Divesh Srivastava Method and apparatus for using tag topology
CN101706794A (zh) * 2009-11-24 2010-05-12 上海显智信息科技有限公司 基于语义实体关系模型和可视化推荐的信息浏览检索方法
CN101853292A (zh) * 2010-05-18 2010-10-06 深圳市北科瑞讯信息技术有限公司 商业社会网络构建方法及系统
WO2010149427A1 (fr) * 2009-06-26 2010-12-29 Alcatel Lucent Un assistant-conseiller utilisant l'analyse semantique des echanges communautaires

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050091576A1 (en) * 2003-10-24 2005-04-28 Microsoft Corporation Programming interface for a computer platform
US20020194166A1 (en) 2001-05-01 2002-12-19 Fowler Abraham Michael Mechanism to sift through search results using keywords from the results
US7703040B2 (en) 2005-06-29 2010-04-20 Microsoft Corporation Local search engine user interface
US8364540B2 (en) * 2005-09-14 2013-01-29 Jumptap, Inc. Contextual targeting of content using a monetization platform
US7676455B2 (en) 2006-02-03 2010-03-09 Bloomberg Finance L.P. Identifying and/or extracting data in connection with creating or updating a record in a database
US8725729B2 (en) 2006-04-03 2014-05-13 Steven G. Lisa System, methods and applications for embedded internet searching and result display
US7636779B2 (en) * 2006-04-28 2009-12-22 Yahoo! Inc. Contextual mobile local search based on social network vitality information
US20080065685A1 (en) * 2006-08-04 2008-03-13 Metacarta, Inc. Systems and methods for presenting results of geographic text searches
US8564544B2 (en) * 2006-09-06 2013-10-22 Apple Inc. Touch screen device, method, and graphical user interface for customizing display of content category icons
US8594996B2 (en) 2007-10-17 2013-11-26 Evri Inc. NLP-based entity recognition and disambiguation
US8380731B2 (en) 2007-12-13 2013-02-19 The Boeing Company Methods and apparatus using sets of semantically similar words for text classification
US7933896B2 (en) 2008-02-22 2011-04-26 Tigerlogic Corporation Systems and methods of searching a document for relevant chunks in response to a search request
US8255396B2 (en) * 2008-02-25 2012-08-28 Atigeo Llc Electronic profile development, storage, use, and systems therefor
CN101320382B (zh) * 2008-05-07 2011-12-07 索意互动(北京)信息技术有限公司 基于上下文对搜索结果重新排序的方法和系统
US8145521B2 (en) 2008-07-15 2012-03-27 Google Inc. Geographic and keyword context in embedded applications
US8275759B2 (en) 2009-02-24 2012-09-25 Microsoft Corporation Contextual query suggestion in result pages
US8489390B2 (en) 2009-09-30 2013-07-16 Cisco Technology, Inc. System and method for generating vocabulary from network data
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8346795B2 (en) * 2010-03-10 2013-01-01 Xerox Corporation System and method for guiding entity-based searching
US20110231395A1 (en) * 2010-03-19 2011-09-22 Microsoft Corporation Presenting answers
US8316030B2 (en) * 2010-11-05 2012-11-20 Nextgen Datacom, Inc. Method and system for document classification or search using discrete words

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080140619A1 (en) * 2006-12-07 2008-06-12 Divesh Srivastava Method and apparatus for using tag topology
WO2010149427A1 (fr) * 2009-06-26 2010-12-29 Alcatel Lucent Un assistant-conseiller utilisant l'analyse semantique des echanges communautaires
CN101706794A (zh) * 2009-11-24 2010-05-12 上海显智信息科技有限公司 基于语义实体关系模型和可视化推荐的信息浏览检索方法
CN101853292A (zh) * 2010-05-18 2010-10-06 深圳市北科瑞讯信息技术有限公司 商业社会网络构建方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TAMILIN等: "Context-Driven Semantic Enrichment of Italian News Archive", 《COMPUTER SCIENCE》 *
郑魁等: "网络舆情热点信息自动发现方法", 《计算机工程》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677684A (zh) * 2014-11-21 2016-06-15 华东师范大学 一种基于外部数据源对用户生成内容进行语义标注的方法
CN111052124A (zh) * 2017-07-17 2020-04-21 快乐股份有限公司 评估行为干预的遵守保真度
CN113609309A (zh) * 2021-08-16 2021-11-05 脸萌有限公司 知识图谱构建方法、装置、存储介质及电子设备
CN113609309B (zh) * 2021-08-16 2024-02-06 脸萌有限公司 知识图谱构建方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
WO2013016219A1 (en) 2013-01-31
EP2737413A1 (en) 2014-06-04
WO2013015852A9 (en) 2014-05-01
US20130031500A1 (en) 2013-01-31
EP2737417A1 (en) 2014-06-04
US8898583B2 (en) 2014-11-25
US20130031110A1 (en) 2013-01-31
US20130031076A1 (en) 2013-01-31
US20130031087A1 (en) 2013-01-31
CN103842993A (zh) 2014-06-04
US20140032522A1 (en) 2014-01-30
WO2013015852A1 (en) 2013-01-31

Similar Documents

Publication Publication Date Title
CN104025085A (zh) 用于提供关于包括在内容页面中的语义实体的信息的系统和方法
US20200320086A1 (en) Method and system for content recommendation
US10503829B2 (en) Book analysis and recommendation
US9760569B2 (en) Method and system for providing translated result
US8140438B2 (en) Method, apparatus, and program product for processing product evaluations
US10216831B2 (en) Search results summarized with tokens
Maier et al. Machine translation vs. multilingual dictionaries assessing two strategies for the topic modeling of multilingual text collections
CN107193892B (zh) 一种文档主题确定方法及装置
CN106980664B (zh) 一种双语可比较语料挖掘方法及装置
US20110219299A1 (en) Method and system of providing completion suggestion to a partial linguistic element
CN113961666B (zh) 关键词识别方法、装置、设备、介质及计算机程序产品
Kumar et al. BERT based semi-supervised hybrid approach for aspect and sentiment classification
Müller-Budack et al. Multimodal news analytics using measures of cross-modal entity and context consistency
RU2698405C2 (ru) Способ поиска в базе данных
KR101517674B1 (ko) 복수의 키워드 추출 기법들을 이용하는 광고 노출 방법 및 광고 제공 장치
JP2009223372A (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
Lucas et al. Sentiment analysis and image classification in social networks with zero-shot deep learning: applications in tourism
Benedict et al. Apm bots: An automated presentation maker for tourists/corporates using nlp-assisted web scraping technique
Cai et al. Question recommendation in medical community-based question answering
Nitu et al. Semantic Recommendations of Books Using Recurrent Neural Networks
JP2020042545A (ja) 情報処理装置、情報処理方法、およびプログラム
KR20190017606A (ko) 온라인 소셜 네트워크 서비스 데이터로부터 공간 기반 사회적 행위를 추출하는 방법 및 시스템
KR102625347B1 (ko) 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템
Liang et al. Textual Concept Expansion with Commonsense Knowledge to Improve Dual-Stream Image-Text Matching
KR102141192B1 (ko) 언론사 별 뉴스 공통 문구 수집 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140903

WD01 Invention patent application deemed withdrawn after publication