CN106716411A - 被引用内容索引 - Google Patents

被引用内容索引 Download PDF

Info

Publication number
CN106716411A
CN106716411A CN201580050505.1A CN201580050505A CN106716411A CN 106716411 A CN106716411 A CN 106716411A CN 201580050505 A CN201580050505 A CN 201580050505A CN 106716411 A CN106716411 A CN 106716411A
Authority
CN
China
Prior art keywords
content
search
father
referenced
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580050505.1A
Other languages
English (en)
Inventor
E·M·刘
S·王
E·T·伯格曼
Y-T·郭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN106716411A publication Critical patent/CN106716411A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一个或多个用于索引被引用内容和/或用于深度内容搜索的技术和/或系统。在示例中,父内容(例如,来自朋友的关于名人的即时消息)可以被评估以标识对由内容源托管的被引用内容(例如,通过照片共享服务共享的照片)的引用(例如,URL)。被引用内容可以从内容源获取,并且可以被评估以标识描述被引用内容的搜索项(例如,照片中的名人的名字)。父内容和被引用内容可以使用搜索项被索引到搜索索引中。在示例中,响应于搜索查询对应于父内容和/或搜索项,可以提供父内容和/或被引用内容作为搜索结果。

Description

被引用内容索引
背景技术
很多用户可以使用搜索功能来发现内容。在一个示例中,用户可以使用文件系统搜索界面来定位文件,诸如图像、文档和/或其他本地文件。在另一示例中,用户可以使用社交网络搜索界面来定位社交网络用户简档。在另一示例中,用户可以使用电子邮件搜索界面来定位电子邮件、联系人和/或约会。
发明内容
本发明内容被提供以便以简化的形式介绍将在以下详细描述中进一步描述的概念的选择。本发明内容并非旨在标识所要求保护的主题的关键因素或必要特征,也不旨在用于限制所要求保护的主题的范围。
其中,本文中提供了一个或多个用于索引被引用内容和/或用于深度内容搜索的系统和/或技术。在索引被引用内容的示例中,父内容可以被评估以标识对由内容源托管的被引用内容的引用。被引用内容可以使用引用从内容源获取。被引用内容可以被评估以确定描述被引用内容的搜索项。被引用内容可以使用搜索项与父内容一起被索引到搜索索引中。
当接收到搜索查询时,该搜索查询可以例如针对搜索索引运行。响应于确定搜索查询对应于用于索引父内容和被引用内容的搜索项,父内容和/或被引用内容可以被提供作为搜索查询的搜索结果。
为了实现前述及相关目的,以下描述和附图阐述某些说明性方面和实现方式。这些仅指示可以采用一个或多个方面的各种方式中的几种。当结合附图考虑时,从下面的详细描述中,本公开的其他方面、优点和新颖特征将变得容易理解。
附图说明
图1是示出索引被引用内容的示例性方法的流程图。
图2A是示出用于索引被引用内容的示例性系统的组成框图。
图2B是示出用于索引被引用内容的示例性系统的组成框图。
图2C是示出用于索引被引用内容的示例性系统的组成框图。
图2D是示出用于深度内容搜索的示例性系统的组成框图。
图2E是示出用于深度内容搜索的示例性系统的组成框图。
图3A是示出用于索引实体概要的示例性系统的组成框图。
图3B是示出用于提供实体概要作为搜索结果的示例性系统的组成框图。
图4是其中可以包括被配置成实施本文中阐述的规定中的一个或多个规定的处理器可执行指令的示例性计算机可读介质的图示。
图5示出了其中可以实现本文中阐述的规定中的一个或多个规定的示例性计算环境。
具体实施方式
现在参照附图来描述所要求保护的主题,其中相同的附图标记通常用于指代相同的元件。在下面的描述中,为了解释的目的,阐述了很多具体的细节以提供对所要求保护的主题的理解。然而,显然,可以在没有这些具体细节的情况下实践所要求保护的主题。在其他实例中,以框图形式示出了结构和设备,以便描述所要求保护的主题。
本文中提供了一个或多个用于索引被引用内容和/或用于深度内容搜索的技术和/或系统。与由用户进行的搜索相关的内容可以在一个或多个其他内容源中被引用和/或深入(例如,电子邮件的附件、由通过消息内的URL链接的网站的文章、来自通过文档内的URL链接的社交网络帖子的照片等)。然而,因为这样的内容被引用或嵌套在其他内容内,所以不可以提供这个深度作为搜索结果。因此,如本文中所提供的,由父内容引用的被引用内容(例如,由电子邮件父内容引用的附件被引用内容、由消息父内容引用的文章被引用内容、由文档父内容引用的照片被引用内容)可以与父内容建立索引,从而允许提供被引用内容作为搜索结果。
通过图1的示例性方法100示出了索引被引用内容的实施例。在102,该方法开始。在104,父内容可以被评估以标识对由内容源托管的被引用内容的引用。父内容可以包括任何类型的内容,诸如消息、电子邮件、社交网络帖子、文档、网站和/或可以引用其他内容的任何其他内容。在示例中,被引用内容可以包括由父内容内的URL引用的网站、附加到父内容的附加文件、父内容的本地内容、远离父内容的内容、公开可用的内容、非公开可用的内容(例如,通过公司文件共享服务可访问的公司文件)、图像、文章、社交网络简档、视频和/或可以由父内容引用的任何其他内容。引用可以包括与父内容相关联的指示符,诸如URL链接。例如,社交网络帖子“Hey Jen,what do you link of my wedding photo http://reference_to_photo/56732,regards Jill”可以被标识为父内容。社交网络帖子父内容的与http://reference_to_photo/56732URL链接相对应的照片URL引用可以被标识为对被引用内容的引用,诸如被吉尔(Jill)上传到照片共享服务内容源的婚礼照片被引用内容。
在106,被引用内容可以使用引用从内容源获取。例如,照片URL引用可以被用于从照片共享服务内容源访问婚礼照片被引用内容(例如,使用http://reference_to_photo/56732URL链接)。在示例中,给定用户内容,可以标识由用户(诸如Jill)使用以访问内容源的一组凭证(例如,Jill可能已经提供了对照片共享服务登录凭证的肯定同意,以用于访问照片共享服务内容源,用于索引被引用内容和/或用于提供被引用内容作为来自深度内容搜索的搜索结果)。凭证可以用于与内容源进行认证,使得可以获取(例如,检索、访问等)被引用内容或其中的一部分。
在108,被引用内容可以被评估以确定描述被引用内容的搜索项。可以理解,搜索项并不限于单个术语,而是可以包括任何数量的术语,诸如短语(例如,“婚礼照片”)。在示例中,被引用内容内的项可以被标识为搜索项(例如,可以从婚礼照片被引用内容的标题中提取搜索项“Jill的婚礼2014”)。在示例中,图像处理可以用于标识搜索项(例如,可以基于图像处理来确定搜索项“Jill”,以确定婚礼照片被引用内容描绘Jill)。在示例中,包括链接到被引用内容的锚定项的网站可以被标识。锚定项可以包括用于被引用内容的描述性信息。搜索项可以基于描述性信息和/或锚定项来确定。例如,名人网页可以包括女演员Jill简档网页,该简档网页包括链接到婚礼照片被引用内容的锚定项“婚礼”。锚定项可以用描述性信息描述婚礼照片被引用内容。用于婚礼照片被引用内容的搜索项(例如,搜索项“名人Jill的婚礼照片”)可以基于名人网页上的锚定项和/或锚定项的描述性信息来确定。在示例中,相关性权重可以被分配给搜索项。例如,相对较高的相关性权重可以被分配给搜索项“名人Jill的婚礼照片”,这是因为搜索项“名人Jill的婚礼照片”是从可以提供婚礼照片被引用内容的高度相关的描述性概要的锚定项导出的。
在110,被引用内容可以使用搜索项与父内容一起被索引到搜索索引中。例如,搜索索引可以包括反向表,其中搜索项用于标识父内容和/或被引用内容(例如,父内容和被引用内容之间的关联的标识,使得搜索查询匹配搜索项可以导致父内容和/或被引用内容被返回作为搜索结果)。在示例中,仅被引用内容的一部分(例如,文章的概要或摘要)可以使用搜索项与父内容一起被索引到搜索索引中。以这种方式,可能需要索引少于所有被引用内容(例如,从而节省存储资源)。
在示例中,可以接收搜索查询。例如,用户可以通过搜索界面提交搜索查询“Jill的婚礼”。搜索索引可以使用搜索查询来评估。在示例中,响应于确定搜索查询对应于用于索引父内容和被引用内容的搜索项,可以提供父内容和/或被引用内容作为搜索查询的搜索结果。在示例中,响应于确定搜索查询对应于父内容,可以提供父内容和/或被引用内容作为搜索查询的搜索结果(例如,假定父内容和被引用内容通过搜索项被链接)。在示例中,响应于确定搜索查询对应于被引用内容,可以提供父内容和/或被引用内容作为搜索查询的搜索结果(例如,假定父内容和被引用内容通过搜索项被链接)。在示例中,可以用标识提供内容的来源的注释来注释搜索结果(例如,标识提供父内容的来源的注释和/或标识引用内容的来源的注释)。在112,该方法结束。
图2A至图2E示出了包括用于索引被引用内容的索引部件206和/或用于深度内容搜索的搜索部件262的系统201的示例。图2A示出了索引部件206的示例200,索引部件206标识与由用户从Green Home公司接收的电子邮件相对应的电子邮件父内容202。索引部件206可以评估电子邮件父内容202以标识附件引用216,以电子邮件与附接到电子邮件父内容202的Green Home公司优惠券相对应的附件优惠券被引用内容204。索引部件206可以获取电子邮件附件优惠券被引用内容204(例如,可以从电子邮件父内容202下载、保存和/或打开Green Home公司优惠券)。索引部件206可以评估电子邮件附件优惠券被引用内容204以确定描述电子邮件附件优惠券被引用内容204的一个或多个搜索项。例如,草坪护理搜索项、割草搜索项和草肥料搜索项可以被标识为描述Green Home公司优惠券的搜索项。因此,索引部件206可以通过以下方式来索引电子邮件父内容202与电子邮件附件优惠券被引用内容204:使用草坪护理搜索项创建第一索引项210,使用割草搜索项创建第二索引项212,并且使用草肥料搜索项创建第三索引项214,以包括在搜索索引208内。
图2B示出了索引部件206的示例220,索引部件206标识与由用户从朋友接收的即时消息相对应的即时消息父内容222。索引部件206可以评估即时消息父内容222以标识对通过照片共享社交网络内容源226共享的对应于巴黎照片的照片被引用内容228的URL引用224。索引部件206可以获取照片被引用内容228(例如,可以使用用户用来访问照片共享社交网络内容源226的一组凭证从照片共享社交网络内容源226下载照片被引用内容228)。索引部件206可以对照片被引用内容228执行图像识别,以确定描述照片被引用内容228的一个或多个搜索项。例如,巴黎搜索项和埃菲尔铁塔搜索项可以被标识为描述照片被引用内容228的搜索项。因此,索引部件206可以通过以下方式来索引即时消息父内容222与照片被引用内容228:使用巴黎搜索项创建第四索引项230并且使用埃菲尔铁塔搜索项创建第五索引项232以包括在搜索索引208内。
图2C示出了标识与用户的社交网络朋友的社交网络帖子相对应的社交网络帖子父内容242的索引部件206的示例240。索引部件206可以评估社交网络帖子父内容242以标识对由设备商店网站内容源246提供的洗衣机优惠券被引用内容248的URL引用244。索引部件206可以获取洗衣店优惠券被引用内容248(例如,洗衣机优惠券被引用内容248可从设备商店网站内容源246下载)。索引部件206可以评估洗衣机优惠券被引用内容248(例如,使用文本解析器和/或诸如主题分类器等分类器)以确定描述洗衣机优惠券被引用内容248的一个或多个搜索项。例如,洗衣机搜索项和优惠券搜索项可以被标识为描述洗衣机优惠券被引用内容248的搜索项。因此,索引部件206可以通过以下方式来将社交网络父内容242与洗衣机优惠券被引用内容248索引:使用洗衣机搜索项创建第六索引项250并使用优惠券搜索项创建第七索引项252以包括在搜索索引208内。
图2D示出了搜索部件262的深度内容搜索的示例260。搜索部件262可以被配置成从搜索界面264接收搜索查询(例如,草坪护理搜索查询266)。搜索部件262可以使用草坪护理搜索查询266评估搜索查询208。例如,搜索部件262可以确定与草坪护理搜索项相关联的第一索引项210、与割草搜索项相关联的第二索引项212和与草肥搜索项相关联的第三索引项214对应于草坪护理搜索查询266。因此,搜索部件262可以通过搜索界面264提供与GreenHome公司相关联的电子邮件父内容202和/或Green Home公司优惠券的附件优惠券被引用内容204作为草坪护理搜索查询266的搜索结果268。
图2E示出了搜索部件262的深度内容搜索的示例280。搜索部件262可以被配置成从搜索界面282接收搜索查询(例如,巴黎搜索查询284)。搜索部件262可以使用巴黎搜索查询284评估搜索索引208。例如,搜索部件262可以确定与巴黎搜索项相关联的第四索引项230和与埃菲尔铁塔搜索项232相关联的第五索引项232对应于巴黎搜索查询284。因此,搜索部件262可以通过搜索界面282从照片共享社交网络226提供即时消息父内容222和/或照片被引用内容228作为巴黎搜索查询284的搜索结果286。
图3A和图3B示出了用于索引实体概要和/或提供实体概要作为搜索结果的系统301的示例,系统301包括索引部件206和/或搜索部件262。图3A示出了索引实体概要的示例300。索引部件206可以标识电子邮件父内容302(例如,来自Mary的电子邮件)。索引部件206可以评估电子邮件父内容302,诸如以标识对包括描述杰克船长(Captain Jack)实体的Captain Jack概要文档310的附件被引用内容306的附件引用304。例如,可以基于引用Captain Jack的电子邮件父内容302的文本和/或基于描述Captain Jack的Captain Jack概要文档310来标识Captain Jack实体。索引部件206可以从诸如Captain Jack网站、Captain Jack社交网络简档、Captain Jack文章、照片共享服务等各种远程源312获取Captain Jack实体的描述性信息,诸如电子邮件信息、Captain Jack概要信息、CaptainJack照片、Captain Jack社交网络简档信息等。索引部件206可以基于诸如Captain Jack实体概要314等描述性信息来生成实体的实体概要314。Captain Jack实体概要314可以与电子邮件父内容302一起索引到搜索索引208中作为索引项308。
图3B示出了提供实体概要作为搜索结果的示例350。搜索部件262可以通过搜索界面352接收搜索查询,诸如Captain Jack搜索查询354。搜索部件262可以使用Captain Jack搜索查询354来评估搜索索引208。响应于Captain Jack搜索查询354对应于指示电子邮件父内容302和Captain Jack实体概要314之间的关系的索引项308,可以通过搜索界面352提供电子邮件父内容302、Captain Jack实体的描述性信息和/或Captain Jack实体概要314作为Captain Jack搜索查询354的搜索结果356。
根据本公开的一方面,提供了一种用于索引被引用内容的方法。该方法包括评估父内容以标识对由内容源托管的被引用内容的引用。被引用内容可以使用引用从内容源获取。被引用内容可以被评估以确定描述被引用内容的搜索项。被引用内容可以使用搜索项与父内容一起被索引到搜索索引中。
根据本公开的一方面,提供了一种用于索引被引用内容的系统。该系统包括索引部件。索引部件被配置成标识对由内容源托管的被引用内容的引用。索引部件被配置成使用引用从内容源获取被引用内容。索引部件被配置成评估被引用内容以确定描述被引用内容的搜索项。索引部件被配置成使用搜索项将被引用内容与父内容一起索引到搜索索引中。
根据本公开的一方面,提供了一种包括指令的计算机可读介质,这些指令在被执行时执行用于索引被引用内容的方法。该方法包括评估父内容以标识对由内容源托管的被引用内容的引用。被引用内容可以使用引用从内容源获取。被引用内容可以被评估以确定描述被引用内容的搜索项。被引用内容可以使用搜索项与父内容一起被索引到搜索索引中。
根据本公开的一方面,提供了一种用于索引被引用内容的装置。父内容可以由用于索引的装置来评估以标识对由内容源托管的被引用内容的引用。被引用内容可以由用于索引的装置使用引用来从内容源获取。被引用内容可以由用于索引的装置来评估以确定描述被引用内容的搜索项。被引用内容可以由用于索引的装置使用搜索项与父内容一起被索引到搜索索引中。
又一实施例涉及一种包括被配置成实现本文中给出的一个或多个技术的处理器可执行指令的计算机可读介质。图4中示出了计算机可读介质或计算机可读设备的示例实施例,其中实现400包括计算机可读介质408,诸如CD-R、DVD-R、闪存驱动器、硬盘驱动器的盘等,计算机可读介质408上编码有计算机可读数据406。诸如包括0或1中的至少一个的二进制数据等计算机可读数据406转而包括被配置成根据本文中阐述的一个或多个原理操作的一组计算机指令404。在一些实施例中,处理器可执行计算机指令404被配置成执行方法402,诸如图1的示例性方法100的至少一些。在一些实施例中,处理器可执行指令404被配置成实现系统,诸如图2A至图2E的示例性系统201的至少一些和/或图3A和图3B的示例性系统301的至少一些。本领域普通技术人员设想很多这样的被配置成根据本文中给出的技术来操作的计算机可读介质。
尽管已经以对结构特征和/或方法动作专用的语言描述了主题,但是应当理解,所附权利要求中定义的主题不一定限于上述具体特征或动作。相反,上述具体特征和动作被公开作为实现至少一些权利要求的示例形式。
如在本申请中所使用的,术语“部件”、“模块”、“系统”、“界面”等通常旨在表示计算机相关实体,其可以是硬件、硬件和软件、软件或执行中的软件。例如,部件可以是但不限于在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或计算机。作为说明,在控制器上运行的应用和控制器都可以是部件。一个或多个部件可以驻留在进程和/或执行线程内,并且部件可以位于一个计算机上和/或分布在两个或多个计算机之间。
此外,所要求保护的主题可以被实现为使用标准的编程和/或工程技术来产生软件、固件、硬件或其任何组合以控制计算机实现所公开的主题的方法、装置或制品。如本文所使用的术语“制品”旨在包括从任何计算机可读设备、载体或介质可访问的计算机程序。当然,在不脱离所要求保护的主题的范围或精神的情况下,可以对该配置进行很多修改。
图5和以下讨论提供了用于实现本文中所阐述的一个或多个规定的实施例的合适的计算环境的简要的一般的描述。图5的操作环境仅仅是合适的操作环境的一个示例,而不旨在对操作环境的使用范围或功能提出任何限制。示例计算设备包括但不限于个人计算机、服务器计算机、手持或膝上型设备、移动设备(诸如移动电话、个人数字助理(PDA)、媒体播放器等)、多处理器系统、消费电子产品、迷你计算机、大型计算机、包括任何上述系统或设备的分布式计算环境等。
虽然不是必需的,但是实施例在由一个或多个计算设备执行的“计算机可读指令”的一般上下文中描述。计算机可读指令可以经由计算机可读介质(下面讨论)来分发。计算机可读指令可以被实现为执行特定任务或实现特定抽象数据类型的程序模块,诸如函数、对象、应用程序编程接口(API)、数据结构等。通常,计算机可读指令的功能可以根据需要在各种环境中组合或分布。
图5示出了包括被配置成实现本文中提供的一个或多个实施例的计算设备512的系统500的示例。在一种配置中,计算设备512包括至少一个处理单元516和存储器518。取决于计算设备的确切配置和类型,存储器518可以是易失性的(诸如RAM)、非易失性的(诸如ROM、闪存等)或两者的某种组合。该配置在图5中用虚线514示出。
在其他实施例中,设备512可以包括附加的特征和/或功能。例如,设备512还可以包括附加存储装置(例如,可移除和/或不可移除),包括但不限于磁性存储装置、光学存储装置等。这种附加存储装置在图5中用存储装置520示出。在一个实施例中,用于实现本文中提供的一个或多个实施例的计算机可读指令可以在存储装置520中。存储装置520还可以存储实现操作系统、应用程序等的其他计算机可读指令。例如,计算机可读指令可以被加载到存储器518中以由处理单元516执行。
如本文中所使用的术语“计算机可读介质”包括计算机存储介质。计算机存储介质包括以用于存储诸如计算机可读指令或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。存储器518和存储装置520是计算机存储介质的示例。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字通用盘(DVD)或其他光学存储器、磁带盒、磁带、磁盘存储装置或其他磁存储设备或者可以用于存储期望的信息并且可以由设备512访问的任何其他介质。然而,计算机存储介质不包括传播的信号。相反,计算机存储介质排除传播的信号。任何这样的计算机存储介质可以是设备512的部分。
设备512还可以包括使得设备512能够与其他设备通信的通信连接526。通信连接526可以包括但不限于调制解调器、网络接口卡(NIC)、集成网络接口、射频传输器/接收器、红外端口、USB连接或者用于将计算设备512连接到其他计算设备的其他接口。通信连接526可以包括有线连接或无线连接。通信连接526可以传输和/或接收通信介质。
术语“计算机可读介质”可以包括通信介质。通信介质通常在诸如载波或其它传输机制等“调制数据信号”中实施计算机可读指令或其他数据,并且包括任何信息传递介质。术语“调制数据信号”可以包括其特性中的一个或多个特性以使得能够在信号中编码信息的方式设置或改变的信号。
设备512可以包括输入设备524,诸如键盘、鼠标、笔、语音输入设备、触摸输入设备、红外摄像机、视频输入设备和/或任何其它输入设备。在设备512中也可以包括输出设备522,诸如一个或多个显示器、扬声器、打印机和/或任何其它输出设备。输入设备524和输出设备522可以经由有线连接、无线连接或其任何组合连接到设备512。在一个实施例中,来自另一计算设备的输入设备或输出设备可以用作计算设备512的输入设备524或输出设备522。
计算设备512的部件可以通过各种互连(诸如总线)连接。这种互连可以包括诸如PCI快速(Express)等外围部件互连(PCI)、通用串行总线(USB)、火线(IEEE 1394)、光总线结构等。在另一实施例中,计算设备512的部件可以通过网络互连。例如,存储器518可以由位于不同物理位置的通过网络互连的多个物理存储器单元组成。
本领域技术人员将认识到,用于存储计算机可读指令的存储设备可以分布在网络上。例如,经由网络528可访问的计算设备530可以存储实现本文中提供的一个或多个实施例的计算机可读指令。计算设备512可以访问计算设备530并且下载部分或全部计算机可读指令以供执行。备选地,计算设备512可以根据需要下载计算机可读指令,或者一些指令可以在计算设备512处执行,而一些指令在计算设备530处执行。
本文中提供了实施例的各种操作。在一个实施例中,所描述的操作中的一个或多个可以构成存储在一个或多个计算机可读介质上的计算机可读指令,这些计算机可读指令如果由计算设备执行将引起计算设备执行所描述的操作。描述一些或所有操作的顺序不应当被解释为暗示这些操作必须是顺序相关的。受益于本说明书的本领域技术人员将理解可选的顺序。此外,应当理解,并非所有的操作都必须存在于本文中提供的每个实施例中。此外,应当理解,在一些实施例中不是所有的操作都是必要的。
此外,除非另有说明,否则“第一”、“第二”等并不旨在暗示时间方面、空间方面、排序等。相反,这些术语仅用作标识符、名称等。例如,第一对象和第二对象通常对应于对象A和对象B或两个不同的或两个相同的对象或同一对象。
此外,本文中使用的“示例性”表示用作示例、实例、说明等,而不一定是有利的。如本文中所使用的,“或”旨在表示包括性的“或”而不是排他性的“或”。另外,除非另有说明或者从上下文中清楚得知是指单数形式,否则在本申请中使用的“一个(a)”和“一个(an)”通常被解释为表示“一个或多个”。另外,A和B中的至少一个和/或类似物通常表示A或B和/或A和B。此外,在“包括(includes)”、“具有(having)”、“具有(has)”、“具有(with)”和/或其变体用于详细描述或权利要求中的意义上,这些术语旨在以类似于术语“包括(comprising)”的方式是包括性的。
此外,虽然已经关于一个或多个实现示出和描述了本公开,但是基于对本说明书和附图的阅读和理解,本领域技术人员将想到等同的改变和修改。本公开包括所有这样的修改和变更,并且仅由所附权利要求的范围限制。特别地,关于由上述部件(例如,元件、资源等)执行的各种功能,除非另有说明,否则用于描述这些部件的术语旨在对应于执行所描述的部件的特定功能的任何部件(例如,功能上等同),即使在结构上不等同于所公开的结构。另外,虽然可以仅关于几个实现中的一个公开了本公开的特定特征,但是这样的特征可以与其它实现的一个或多个其他特征组合,这对于任何给定或特定应用可能是期望的和有利的。

Claims (14)

1.一种用于索引被引用内容的方法,包括:
评估父内容以标识对由内容源托管的被引用内容的引用;
使用所述引用从所述内容源获取所述被引用内容;
评估所述被引用内容以确定描述所述被引用内容的搜索项;以及
使用所述搜索项将所述被引用内容与所述父内容一起索引到搜索索引中。
2.根据权利要求1所述的方法,包括:
接收搜索查询;以及
使用所述搜索查询评估所述搜索索引,包括:
响应于所述搜索查询对应于所述搜索项,提供所述父内容或者所述被引用内容中的至少一项作为所述搜索查询的搜索结果。
3.根据权利要求1所述的方法,包括:
接收搜索查询;以及
使用所述搜索查询评估所述搜索项,包括:
响应于所述搜索查询对应于所述父内容,提供所述父内容和所述被引用内容作为所述搜索查询的搜索结果。
4.根据权利要求1所述的方法,所述索引包括:
标识所述被引用内容中具有超过阈值的描述性相关度的一部分;以及
使用所述搜索项将所述被引用内容的所述部分与所述父内容一起索引到所述搜索索引中。
5.根据权利要求1所述的方法,包括:
标识被所述父内容引用的实体;
从远程源获取所述实体的描述性信息;
基于所述描述性信息生成所述实体的实体概要;以及
将所述实体概要与所述父内容一起索引到所述搜索索引中。
6.根据权利要求5所述的方法,所述获取描述性信息包括:
向搜索引擎提交所述实体的实体标识符;以及
评估由所述搜索引擎针对所述实体标识符提供的搜索结果以标识所述描述性信息。
7.根据权利要求5所述的方法,包括:
接收搜索查询;以及
使用所述搜索查询评估所述搜索索引,所述评估包括:
响应于所述搜索查询对应于所述实体概要,提供所述父内容、所述实体的所述描述性信息或者所述实体概要中的至少一项作为所述搜索查询的搜索结果。
8.根据权利要求1所述的方法,所述评估所述被引用内容包括:
标识包括链接至所述被引用内容的锚定项的网站,所述锚定项包括所述被引用内容的描述性信息;以及
基于所述描述性信息或者所述锚定项中的至少一项来确定所述搜索项。
9.根据权利要求8所述的方法,包括:
标识所述被引用内容内的项作为第二搜索项;以及
向所述搜索项分配第一相关性权重,所述第一相关性权重不同于向所述第二搜索项分配的第二相关性权重。
10.一种用于索引被引用内容的系统,包括:
索引部件,被配置成:
评估父内容以标识对由内容源托管的被引用内容的引用;
使用所述引用从所述内容源获取所述被引用内容;
评估所述被引用内容以确定描述所述被引用内容的搜索项;以及
使用所述搜索项将所述被引用内容与所述父内容一起索引到搜索索引中。
11.根据权利要求10所述的系统,包括:
搜索部件,被配置成:
接收搜索查询;以及
使用所述搜索查询评估所述搜索索引,包括:
响应于所述搜索查询对应于所述搜索项,提供所述父内容或者所述被引用内容中的至少一项作为所述搜索查询的搜索结果。
12.根据权利要求10所述的系统,所述父内容包括消息,并且所述被引用内容包括附接至所述消息的附接文件或者所述消息内到远程内容源的URL链路中的至少一项。
13.根据权利要求10所述的系统,所述索引部件被配置成:
标识由所述父内容引用的实体;
从远程源获取所述实体的描述性信息;
基于所述描述性信息生成所述实体的实体概要;以及
将所述实体概要与所述父内容一起索引到所述搜索索引中。
14.根据权利要求10所述的系统,所述搜索部件被配置成:
接收搜索查询;以及
使用所述搜索查询评估所述搜索索引,包括:
响应于所述搜索查询对应于所述实体概要,提供所述父内容、所述描述性信息或者所述实体概要中的至少一项作为所述搜索查询的搜索结果。
CN201580050505.1A 2014-09-18 2015-09-16 被引用内容索引 Pending CN106716411A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/489,667 2014-09-18
US14/489,667 US10055433B2 (en) 2014-09-18 2014-09-18 Referenced content indexing
PCT/US2015/050311 WO2016044358A1 (en) 2014-09-18 2015-09-16 Referenced content indexing

Publications (1)

Publication Number Publication Date
CN106716411A true CN106716411A (zh) 2017-05-24

Family

ID=54197135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580050505.1A Pending CN106716411A (zh) 2014-09-18 2015-09-16 被引用内容索引

Country Status (7)

Country Link
US (1) US10055433B2 (zh)
EP (1) EP3195152A1 (zh)
JP (1) JP6667511B2 (zh)
CN (1) CN106716411A (zh)
BR (1) BR112017003792A2 (zh)
RU (1) RU2705425C2 (zh)
WO (1) WO2016044358A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111130818A (zh) * 2019-12-30 2020-05-08 论客科技(广州)有限公司 一种群组消息回复方法、装置及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220377032A1 (en) * 2021-05-17 2022-11-24 Apple Inc. Content syndication

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040210567A1 (en) * 2003-03-27 2004-10-21 Francois Bourdoncle Method for the display of results in a search engine
CN101079846A (zh) * 2007-06-08 2007-11-28 腾讯科技(深圳)有限公司 一种邮件附件的发送及接收方法和系统
US20080027971A1 (en) * 2006-07-28 2008-01-31 Craig Statchuk Method and system for populating an index corpus to a search engine
US20120158738A1 (en) * 2010-12-15 2012-06-21 Microsoft Corporation Inference Indexing
US20120272160A1 (en) * 2011-02-23 2012-10-25 Nova Spivack System and method for analyzing messages in a network or across networks
US20130170738A1 (en) * 2010-07-02 2013-07-04 Giuseppe Capuozzo Computer-implemented method, a computer program product and a computer system for image processing

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050149496A1 (en) 2003-12-22 2005-07-07 Verity, Inc. System and method for dynamic context-sensitive federated search of multiple information repositories
US7707142B1 (en) 2004-03-31 2010-04-27 Google Inc. Methods and systems for performing an offline search
US7293007B2 (en) * 2004-04-29 2007-11-06 Microsoft Corporation Method and system for identifying image relatedness using link and page layout analysis
US8185591B1 (en) 2005-09-30 2012-05-22 Google Inc. Systems and methods for viewing email attachments as thumbnails
WO2007082308A2 (en) 2006-01-13 2007-07-19 Bluespace Software Corp. Determining relevance of electronic content
US20090063448A1 (en) 2007-08-29 2009-03-05 Microsoft Corporation Aggregated Search Results for Local and Remote Services
US20100169339A1 (en) 2008-12-30 2010-07-01 Yahoo! Inc., A Delaware Corporation System, method, or apparatus for updating stored search result values
CA2749716A1 (en) * 2009-01-16 2010-07-22 Google Inc. Visualizing site structure and enabling site navigation for a search result or linked page
US8589374B2 (en) 2009-03-16 2013-11-19 Apple Inc. Multifunction device with integrated search and application selection
JP5547599B2 (ja) 2010-09-30 2014-07-16 インターナショナル・ビジネス・マシーンズ・コーポレーション 検索クエリーの作成を支援する装置、グラフィカルユーザインターフェース生成システム、方法及びプログラム
US9123021B2 (en) 2010-12-08 2015-09-01 Microsoft Technology Licensing, Llc Searching linked content using an external search system
US9292607B2 (en) 2010-12-09 2016-03-22 Microsoft Technology Licensing, Llc Using social-network data for identification and ranking of URLs
US9858092B2 (en) 2011-01-06 2018-01-02 Mitel Networks Corporation Contextual application launch via search query
US20120323775A1 (en) 2011-06-14 2012-12-20 Bank Of America Enhanced searchability of fields associated with online billpay memo data
US20130166543A1 (en) 2011-12-22 2013-06-27 Microsoft Corporation Client-based search over local and remote data sources for intent analysis, ranking, and relevance
WO2014139120A1 (en) 2013-03-14 2014-09-18 Microsoft Corporation Search intent preview, disambiguation, and refinement
US20140358958A1 (en) 2013-05-29 2014-12-04 Microsoft Corporation Surfacing direct app actions
RU2629448C2 (ru) 2014-07-09 2017-08-29 Общество С Ограниченной Ответственностью "Яндекс" Система и способ управления и организации кэша веб-браузера
US10075422B2 (en) 2015-06-30 2018-09-11 Amazon Technologies, Inc. Device communication environment

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040210567A1 (en) * 2003-03-27 2004-10-21 Francois Bourdoncle Method for the display of results in a search engine
US20080027971A1 (en) * 2006-07-28 2008-01-31 Craig Statchuk Method and system for populating an index corpus to a search engine
CN101079846A (zh) * 2007-06-08 2007-11-28 腾讯科技(深圳)有限公司 一种邮件附件的发送及接收方法和系统
US20130170738A1 (en) * 2010-07-02 2013-07-04 Giuseppe Capuozzo Computer-implemented method, a computer program product and a computer system for image processing
US20120158738A1 (en) * 2010-12-15 2012-06-21 Microsoft Corporation Inference Indexing
US20120272160A1 (en) * 2011-02-23 2012-10-25 Nova Spivack System and method for analyzing messages in a network or across networks

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111130818A (zh) * 2019-12-30 2020-05-08 论客科技(广州)有限公司 一种群组消息回复方法、装置及存储介质

Also Published As

Publication number Publication date
US20160085780A1 (en) 2016-03-24
RU2017108896A3 (zh) 2019-04-12
EP3195152A1 (en) 2017-07-26
JP6667511B2 (ja) 2020-03-18
JP2017532663A (ja) 2017-11-02
US10055433B2 (en) 2018-08-21
RU2017108896A (ru) 2018-09-17
RU2705425C2 (ru) 2019-11-07
BR112017003792A2 (pt) 2017-12-12
WO2016044358A1 (en) 2016-03-24

Similar Documents

Publication Publication Date Title
CN107464162B (zh) 商品关联方法、装置及计算机可读存储介质
US11238233B2 (en) Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities
US20120158700A1 (en) Face recognition using social data
US9946799B2 (en) Federated search page construction based on machine learning
US20120078945A1 (en) Interactive addition of semantic concepts to a document
US10402403B2 (en) Utilization of probabilistic characteristics for reduction of graph database traversals
WO2017143930A1 (zh) 一种搜索结果排序方法及其设备
CN103714088A (zh) 搜索词获取方法、服务器、搜索词推荐方法及系统
US10242088B2 (en) Multi-source search
US20140108408A1 (en) Topic collections
US11422996B1 (en) Joint embedding content neural networks
US10482390B2 (en) Information discovery system
CN108027820A (zh) 用于产生短语黑名单以响应于搜索查询来防止某些内容出现在搜索结果中的方法和系统
US20160148325A1 (en) Method and apparatus for providing a response to an input post on a social page of a brand
CN106716411A (zh) 被引用内容索引
KR20130053448A (ko) 검색 장치, 검색 방법, 및 검색 프로그램을 기억하는 컴퓨터 판독 가능한 기록 매체
US20110055295A1 (en) Systems and methods for context aware file searching
JP6321874B1 (ja) サーバー装置
CN109074552A (zh) 基于知识图来增强联系卡
US20150186672A1 (en) Photo privacy
JP2004304585A (ja) 画像管理装置、画像管理方法及び画像管理用プログラム
Dridi Information retrieval framework based on social document profile
CN108369605A (zh) 内容项以及源检测系统
AU2016200644B2 (en) Apparatus, system and method for searching contents
CN105574028B (zh) 信息检索方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170524

RJ01 Rejection of invention patent application after publication