CN111767407A - 用可搜索的地理时间值对知识图条目进行编码以评估实体提及的传递地理时间接近度 - Google Patents

用可搜索的地理时间值对知识图条目进行编码以评估实体提及的传递地理时间接近度 Download PDF

Info

Publication number
CN111767407A
CN111767407A CN202010073070.5A CN202010073070A CN111767407A CN 111767407 A CN111767407 A CN 111767407A CN 202010073070 A CN202010073070 A CN 202010073070A CN 111767407 A CN111767407 A CN 111767407A
Authority
CN
China
Prior art keywords
geospatial
prefix
temporal
entity
hash value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010073070.5A
Other languages
English (en)
Other versions
CN111767407B (zh
Inventor
C·E·贝勒
E·G·卡茨
M·珀迪
R·小贝伦斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN111767407A publication Critical patent/CN111767407A/zh
Application granted granted Critical
Publication of CN111767407B publication Critical patent/CN111767407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/387Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种控制器,响应于在文档中检测到与实体的提及相关联的地理空间信息和时间信息,将地理空间信息转换成指定的地理空间格式并将时间信息转换成指定的时间格式。所述控制器用于针对所转换的地理空间信息计算基于前缀的地理空间值,以及针对所转换的时间信息计算基于前缀的时间值。所述控制器用于用基于前缀的地理空间值和基于前缀的时间值对知识图中用于来自文档的实体的提及的条目进行编码,其中,与知识图中用于另一实体提及的另一条目中的另外一个或多个基于前缀的地理空间值和另外一个或多个基于前缀的时间值相匹配的知识图中的基于前缀的地理空间值和基于前缀的时间值的每个数字反映实体和另一实体的地理时间接近度的粒度。

Description

用可搜索的地理时间值对知识图条目进行编码以评估实体提 及的传递地理时间接近度
本发明是在美国政府的支持下以合同号2013-12101100008进行的。政府在本发明中享有某些权利。
技术领域
本发明一般涉及计算系统,并且更具体地涉及用可搜索的地理时间值对知识图条目进行编码以评估实体提及(mention)的传递(transitive)地理时间接近度。
背景技术
知识图表示从关于现实世界实体的一个或多个来源提取的数据的集合。
发明内容
在一个实施例中,一种方法涉及响应于在文档中检测到与实体的提及相关联的地理空间信息和时间信息,由计算机系统将地理空间信息转换成指定的地理空间格式并将时间信息转换成指定的时间格式。该方法涉及由计算机系统针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值,以及针对所转换的时间信息计算一个或多个基于前缀的时间值。该方法涉及由计算机系统用该一个或多个基于前缀的地理空间值和该一个或多个基于前缀的时间值对知识图中用于来自文档的实体的提及的条目进行编码,其中,与知识图中用于另一实体提及的另一条目中的另外一个或多个基于前缀的地理空间值和另外一个或多个基于前缀的时间值相匹配的知识图中的一个或多个基于前缀的地理空间值和一个或多个基于前缀的时间值的每个数字反映实体和另一实体的地理时间接近度的粒度。
在另一实施例中,一种计算机系统包括:一个或多个处理器、一个或多个计算机可读存储器、一个或多个计算机可读存储设备以及程序指令,该程序指令存储在一个或多个存储设备中的至少一个存储设备上,以经由该一个或多个存储器中的至少一个存储器由该一个或多个处理器中的至少一个处理器执行。所存储的程序指令包括:响应于在文档中检测到与实体的提及相关联的地理空间信息和时间信息,将地理空间信息转换成指定的地理空间格式并将时间信息转换成指定的时间格式的程序指令。所存储的程序指令包括:针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值以及针对所转换的时间信息计算一个或多个基于前缀的时间值的程序指令。所存储的程序指令包括:用该一个或多个基于前缀的地理空间值和该一个或多个基于前缀的时间值对知识图中用于来自文档的实体的提及的条目进行编码的程序指令,其中,与知识图中用于另一实体提及的另一条目中的另外一个或多个基于前缀的地理空间值和另外一个或多个基于前缀的时间值相匹配的知识图中的一个或多个基于前缀的地理空间值和一个或多个基于前缀的时间值的每个数字反映实体和另一实体的地理时间接近度的粒度。
在另一个实施例中,一种计算机程序产品包括计算机可读存储介质,在计算机可读存储介质中体现有程序指令,其中,计算机可读存储介质不是瞬态信号本身。该程序指令可由计算机执行以使计算机:响应于在文档中检测到与实体的提及相关联的地理空间信息和时间信息,由计算机将地理空间信息转换成指定的地理空间格式并将时间信息转换成指定的时间格式。该程序指令可由计算机执行以使计算机:由计算机针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值以及针对所转换的时间信息计算一个或多个基于前缀的时间值。该程序指令可由计算机执行以使计算机:由计算机用一个或多个基于前缀的地理空间值和一个或多个基于前缀的时间值对知识图中用于来自文档的实体的提及的条目进行编码,其中,与知识图中用于另一实体提及的另一条目中的另外一个或多个基于前缀的地理空间值和另外一个或多个基于前缀的时间值相匹配的知识图中的一个或多个基于前缀的地理空间值和一个或多个基于前缀的时间值的每个数字反映实体和另一实体的地理时间接近度的粒度。
附图说明
被认为是本发明的一个或多个实施例的特性的新颖特征在所附权利要求中提出。然而,结合附图阅读以下示例性实施例的详细描述,将最好地理解本发明的一个或多个实施例,在附图中:
图1是示出用于支持贯穿知识图的基于地理时间接近度的实体搜索的地理时间搜索系统的一个示例的框图;
图2是示出在知识图中采用地理时间编码来区分由知识图搜索控制器支持的显式地理时间搜索和基于接近度的地理时间搜索的示例的框图;
图3是示出用于支持知识图中的基于地理时间接近度的实体搜索的地理时间控制器的一个示例的框图;
图4是示出用于针对知识图中的条目在文档中提取与实体提及相关联的地理时间数据的地理时间标签提取器的组件的一个示例的框图;
图5是示出了用于针对知识图中的条目从在文档中的实体提及生成基于前缀的地理时间编码值的编码控制器的组件的一个示例的框图;
图6是示出与实体提及的位置关系相关联地提取并编码在知识图中的地理时间数据的一个示例的框图;
图7是示出用于支持知识图中的基于地理时间接近度的实体搜索的地理时间控制器所接收的参数和所产生的结果的一个示例的框图;
图8是示出从具有针对查找接近度查询的地理时间编码的知识图收集的条目的示例的框图;
图9是示出查找接近实体控制器的组件的一个示例的框图,该查找接近实体控制器识别知识图中在查找接近实体查询中的一个或多个查询实体的阈值接近度内的实体提及;
图10是示出查找接近度控制器的组件的一个示例的框图,该查找接近度控制器针对在查找接近度查询中识别的多个实体,识别在实体提及中识别的地理空间和时间接近度的粒度;
图11是其中可实现本发明的一个实施例的计算机系统的一个示例的框图;
图12示出了用于采用在提及中具有支持贯穿知识图的基于传递接近度的实体搜索的格式的地理时间信息对知识图中的实体提及进行编码的过程和计算机程序的高级逻辑流程图;
图13示出了用于将与实体提及相关联的地理时间数据识别和编码为知识图中用于支持贯穿知识图的基于接近度的实体搜索的基于前缀的地理时间值的过程和计算机程序的高级逻辑流程图;
图14示出了用于执行基于传递接近度的实体搜索以查找贯穿知识图的搜索实体的阈值接近度内的其它实体提及的过程和计算机程序的高级逻辑流程图;
图15示出了用于执行基于传递接近度的实体搜索,以查找用于识别贯穿知识图的搜索实体的最接近地理时间接近度的粒度的两个或更多个搜索实体的提及的过程和计算机程序的高层逻辑流程图;以及
图16示出了用于针对查找接近度搜索的结果生成地图投影以说明所搜索的实体的最接近的地理时间接近度的过程和计算机程序的高级逻辑流程图。
具体实施方式
在下面的描述中,出于解释的目的,阐述了许多具体细节以提供对本发明的透彻理解。然而,对本领域技术人员显而易见的是,可以在没有这些具体细节的情况下实施本发明。在其它情况下,以框图形式示出了公知的结构和设备,以避免不必要地模糊本发明。
另外,在以下描述中,出于解释的目的,描述了许多系统。重要的是要注意,并且对于本领域的技术人员将显而易见的是,本发明可以在各种系统中执行,包括操作任何数量的不同类型的操作系统的各种计算机系统和电子设备。
图1是示出用于支持贯穿知识图的基于地理时间接近度的实体搜索的地理时间搜索系统的一个示例的框图。
在本发明的一个实施例中,知识图搜索控制器110管理知识图114的生成和更新。在一个示例中,知识图114表示在关于从一个或多个数据源收集的一个或多个实体的数据记录中收集的数据的集合。
在一个示例中,为了生成和更新知识图114,知识图搜索控制器110在一个或多个数据源(统称为语料库118)中搜索一个或多个实体的提及。在一个示例中,知识图搜索控制器110与一个或多个实体的已识别的提及以及实体的关系相关联地从语料库118中提取数据,并将实体提及和实体关系以及提取的数据添加到知识图114。在一个示例中,知识图搜索控制器110将实体提及和实体关系以及提取的数据以元组的数据记录为单位添加到知识图114。
在一个示例中,实体表示物理上或逻辑上存在的事物。例如,实体可以表示但不限于现实世界的人、企业、组织、物理对象、地点、事件、事物或概念中的一个或多个。另外,在一个示例中,一种关系表示实体如何彼此关联。例如,关系可以表示示出实体如何链接在一起的动词,诸如但不限于“位于”或“遇到”。
在一个示例中,语料库118包括从一个或多个来源访问的,具有一种或多种格式、类型、样式和语言的一个或多个文档。例如,语料库118包括在线资源,诸如但不限于社交媒体条目、由连接在物联网(IoT)和在线百科全书中的传感器和其它设备(例如但不限于在线实况录(factbooks)、维基数据(Wikidata)和维基百科(Wikipedia))生成的数据。
另外,在本发明的一个实施例中,知识图搜索控制器110管理知识图114的搜索。在一个示例中,为了管理知识图114的搜索,知识图搜索控制器110从一个或多个请求程序(诸如请求程序120)接收搜索查询(诸如知识图查询112),请求关于知识图114中一个或多个实体的信息。响应于接收到知识图查询112,知识图搜索控制器110在知识图114中搜索与知识图查询122中指定的一个或多个实体有关的信息,确定对知识图114的搜索结果,并向请求程序120返回搜索结果作为查询结果126。
例如,请求程序120可输入实体名称并请求关于实体的信息,其被作为知识图查询122提交。知识图搜索控制器110在知识图114中搜索包括在知识图查询122中的实体提及的条目,并在查询请求126中返回从知识图114取得的实体提及中收集的数据。例如,实体提及的一个元组条目可指示所搜索的实体访问了特定位置(诸如特定商店名称),或者可指示所搜索的实体在特定位置遇到了另一个实体,诸如相同商店名称,在该特定位置每个元组都被识别并返回给请求程序120。
在知识图查询的另一示例中,请求程序120可输入两个实体名称,并请求作为知识图查询122提交的关于两个实体共同具有什么关系的信息。知识图搜索控制器110在知识图114中搜索包括知识图查询122中的每个实体的元组条目,并且例如可确定两个实体的哪个元组条目具有“位于”和相同位置(诸如相同城市)的关系。知识图搜索控制器110在查询结果126中返回从知识图114收集的有关共同“位于”位置的一对实体的数据。
在该示例中,虽然知识图114中的条目所指向的数据可包括指示在特定时间记录的实体位置的地理空间元素,但一些实体可随时间推移在位置中是可迁的(transitive),而一些实体可随时间推移在位置中是固定的。知识图搜索控制器110还基于知识图114中的搜索实体提及,从知识图114确定一个实体在时间和位置上是否与另一实体重叠,将是有利的。特别地,当一个实体提及中记录的时间和地理空间元素与另一实体提及中记录的时间和地理空间元素不显式匹配,但在时间和空间上彼此接近时,知识图搜索控制器基于知识图114中的搜索实体提及,从知识图114确定一个实体是否与另一个实体在阈值接近度内重叠,将是有利的。
根据本发明的优点,知识图搜索控制器110实现用于支持和管理贯穿知识图114的基于地理时间接近度的搜索的地理时间控制器112。在一个示例中,地理时间既指时间元素,也指地理空间元素。在一个示例中,实体可以指的是位置不固定并且可以在不同时间位于不同位置的人、物或其它元素。
在该示例中,知识图114中的条目所指向的数据可包括在地理时间编码116中针对不同实体位置在不同时间记录的时间和地理空间元素。根据本发明的优点,地理时间控制器112采用地理时间编码116对知识图114中的实体和关系提及进行编码,其中地理时间编码116包括与每个实体和关系相关联的基于前缀的时间值和基于前缀的地理空间值。与实体提及相关联的基于前缀的值在进行比较时会基于实体提及之间共享的前缀的位数来指示实体提及的接近程度。通过采用基于前缀的地理时间编码116在知识图114中对实体和关系提及进行编码,实体提及的时间和地理空间接近度通过将整合的(consolidated)数据存储为固定大小的哈希值可以被更有效地存储,并且可以被更有效地存储以支持搜索,因为数据已预先格式化为可以快速与其它前缀进行逐位比较以评估接近度的前缀。
根据本发明的优点,请求程序120能够采用一个或多个类型的地理时间查询124来指定知识图查询122。例如,请求程序120可通过识别两个或更多个实体以请求该两个或更多个实体的地理时间接近度指示的粒度,或通过识别一个或多个实体和阈值接近度以请求查询实体的阈值接近度内的其它实体提及的识别,来指定地理时间查询124作为基于地理时间接近度的搜索。
根据本发明的优点,响应于地理时间查询124识别两个或更多个实体,地理时间控制器112在对与查询实体匹配的实体提及进行的地理时间编码116中评估需要地理时间接近度中的什么粒度级别来将该两个或更多个查询实体识别为重叠。根据本发明的另一优点,响应于地理时间查询124识别一个或多个实体和阈值接近度,地理时间控制器112在对与查询实体相匹配的实体提及进行的地理时间编码116中采用在与查询实体的阈值接近度内的地理时间编码来评估其它实体提及。在该示例中,地理时间控制器112支持基于显式文本匹配和在匹配文本中未显式识别的基于过渡、基于程度的匹配来识别实体提及的重叠的地理时间接近度,但是在特定的粒度下,实体提及之间存在重叠的地理时间接近度。
在一个示例中,根据优点,地理时间控制器112在知识图114中搜索地理时间查询124,从知识图114中提取搜索结果并在指定为地理时间结果128的查询结果126中返回搜索结果,该搜索结果包括用于实体提及的地理时间接近度信息以及从地理时间编码116中识别的地理时间接近度的粒度。
在本发明的一个实施例中,知识图114实现用于描述数据库内的数据的一个或多个基础模型,该模型被指定为支持地理时间编码116的存储。例如,知识图114可实现用于描述相互关联的关注事物的实体-关系(ER)模型,其中该模型由对关注事物进行分类的实体类型组成并指定实体类型的实例之间可能存在的关系,并被指定为支持地理时间编码116的存储。在另一示例中,知识图114可实现一个或多个附加或替代模型,包括但不限于RDF数据模型和分类图,其被指定为支持地理时间编码116的存储。
图2是在知识图中采用地理时间编码来区分由知识图搜索控制器支持的显式地理时间搜索和基于接近度的地理时间搜索的示例的框图。
在一个示例中,用户可提交识别知识图查询122中的两个或更多个实体的搜索查询,诸如“<实体[A],实体[B]>”的知识图查询。在一个示例中,知识图搜索控制器110响应于接收到识别多个实体的知识图查询,可在知识图114中搜索每个实体的提及,并且还评估由每个实体的提及所指示的关系。在一个示例中,由实体提及所指示的关系可包括显式匹配的地理时间数据,诸如两个实体都被命名为位于的特定时间和地点的指示。在另一示例中,由实体提及所指示的关系可包括地理时间数据,但是地理时间数据可不显式地精确匹配,然而,根据本发明的优点,地理时间控制器112评估地理时间编码116以评估实体的传递地理时间接近度来指示两个或更多个实体的位置关系。
在第一示例中,如附图标记202所示,知识图搜索控制器110根据知识图114中单个文档中对时间和地理空间关系的显式提及来识别搜索实体之间的地理时间关系。例如,如在附图标记202处所示,知识图搜索控制器110从文档A(DOC A)210中读取文本“实体[A]在第[Y]天在位置[X]遇到实体[B]”212,并提取关系“遇到(实体[A],实体[B])”214,其带有指向DOC A 210的指针。知识图搜索控制器110将提取的关系“遇到(实体[A],实体[B])”214添加到知识图114。随后,响应于查询指定两个或更多个实体,诸如如附图标记200所示的“<实体[A],实体[B]>”的查询,知识图搜索控制器110搜索知识图114并识别“实体[A]-实体[B]”的“遇到”的直接关系216,并在查询结果126中返回指向DOC A 210的“遇到”结果。在该示例中,根据本发明的优点,“位置[X]”和“第[Y]天”的地理时间信息也可以从DOC A 210中提取,在实体提及中编码为地理时间编码,并基于单个文档中两个实体提及的显式匹配时间和空间,在查询结果中返回作为指示地理时间接近度粒度的地理时间结果。
在第二示例中,如附图标记204所示,知识图搜索控制器110根据不同文档中具有相同显式地理时间元素的实体提及来识别搜索实体之间的地理时间关系。例如,如附图标记204所示,知识图搜索控制器110从文档B(DOC B)220读取“实体[A]在第[Y]天访问位置[X]”222,并提取指向DOC B 220的关系“位于(实体[A],位置[X])中”224。此外,如附图标记204所示,知识图搜索控制器110从文档C(DOC C)228读取“实体[B]在第[Y]天访问位置[X]”230,并提取指向DOC C 228的关系“位于(实体[B],位置[X])中”232。知识图搜索控制器110将提取的关系“位于(实体[A],位置[X])中”224和“位于(实体[B],位置[X]中)”232添加到知识图114。随后,响应于用一对实体(诸如知识图查询122中的“<实体[A],实体[B]>”200)对知识图114进行的查询,知识图搜索控制器110搜索知识图114并识别“实体[A]-位置[X]-实体[B]”226的间接关系,并在查询结果126中返回指向DOC B 220和DOC C 228的“位于”结果。在该示例中,根据本发明的优点,“位置[X]”和“第[Y]天”数据二者也可通过地理时间编码在知识图114中编码,并且“第[Y]天”也可基于不同文档中两个实体提及的显式匹配时间和空间,在查询结果中被返回作为指示接近度粒度的地理时间结果。
在第三示例中,根据本发明的优点,如附图标记206所示,地理时间控制器112支持知识图搜索控制器110通过评估地理时间编码116来识别不同文档中的实体之间的传递关系提及的接近度粒度。例如,如附图标记206所示,知识图搜索控制器110从文档B(DOC B)240读取“实体[A]在第[Y]天访问位置[X]”242,并且地理时间控制器112采用具有指向DOCB 240的关系“位于(实体[A],位置[X],第[Y]天)中”244的基于前缀的地理时间值对实体提及进行编码。此外,如附图标记206所示,知识图搜索控制器110从文档D(DOC D)247中读取“实体[B]在第[Y]天在位置[Z]工作”242,并且地理时间控制器112采用具有指向DOC D 248的关系“位于(实体[B],位置[Z],第[Y]天)中”的基于前缀的地理时间值来对实体提及进行编码。知识图搜索控制器110将提取的关系“位于(实体[A],位置[X],第[Y]天)中”244和“位于(实体[B],位置[Z],第[Y]天)中”249添加到具有地理时间编码116的知识图114。
随后,响应于附图标记200所示的对“<实体[A],实体[B]>”的查询,地理时间控制器112在由知识图搜索控制器110从知识图114识别的“实体[A]”和“实体[B]”的提及中搜索地理时间标签,识别共享相同时间元素的“位于(实体[A],位置[X],第[Y]天)中”244和“位于(实体[B],位置[Z],第[Y]天)中”249的地理时间标签,以及确定位置[X]和位置[Z]重叠所需的接近度粒度。知识图搜索控制器110返回识别位置[X]和位置[Z]之间的地理空间接近度粒度的传递关系“实体[A]-位置[X]/[Z]接近度-第[Y]天-实体[B]”246,并在查询结果126中返回指向DOC B 240和DOC D 248的“位于”结果。在另一示例中,如果“第[Y]天”的时间条目在每个实体提及中均具有差异,则地理时间控制器112还确定不同时间元素之间的时间接近度粒度。
在第四示例中,根据本发明的优点,如附图标记206所示,地理时间控制器112支持知识图搜索控制器110通过评估地理时间编码116识别在阈值接近度内具有传递关系提及的实体。在一个示例中,响应于知识图查询122包括地理时间查询元素(诸如附图标记250所示的“<实体[A],[P]英里,[R]小时>”),知识图搜索控制器110管理对提及中其它实体的搜索,包括地理时间编码116,该地理时间编码116指示提及的接近度粒度处在查询中指定的阈值接近度之内,如由阈值接近度实体提及252所示。例如,如“<实体[A],[P]英里,[R]小时>”的查询中所示,阈值接近度设定为“P”英里的地理空间阈值和“R”小时的时间阈值。在该示例中,知识图搜索控制器110从文档E(DOC E)270读取“实体[A]在第[Y,时间M]天访问位置[X]”254,并且地理时间控制器112提取指向DOC E 270的关系“位于(实体[A],位置[X],第[Y,时间M]天)”256的时间标签和地理空间标签二者。另外,在该示例中,知识图搜索控制器110从文档F(DOC F)272读取“实体[B]在第[Y,时间N]天在位置[Z]工作”258,并且地理时间控制器112提取指向DOC F 272的关系“位于(实体[A],位置[Z],第[Y,时间N]天)中”260的时间标签和地理空间标签二者。知识图搜索控制器110将提取的关系“位于(实体[A],位置[X],第[Y,时间M]天)”256和“位于(实体[B],位置[Z],第[Y,时间N]天)”260添加到知识图114,其中具有时间标签和地理空间标签二者的记录通过地理时间编码116识别。
随后,响应于附图标记250所示的“<实体[A],[P]英里,[R]小时>”的查询,地理时间控制器112搜索“实体[A]”、“实体[B]”的提及,以及在由知识图搜索控制器110从知识图114识别的其它实体中搜索地理时间编码。地理时间控制器112在“位于(实体[A],位置[X],第[Y,时间M]天)中”256和“位于(实体[B],位置[Z],第[Y,时间N]天)中”260内识别地理时间编码,确定“时间[M]”和“时间[N]”之间的时间粒度差异是否满足“[R]小时”的阈值接近度,并且如果是,则还确定“位置[X]”和“位置[Z]”之间的距离粒度差异是否满足“[P]英里”的阈值接近度。如果时间提及满足时间阈值并且地理空间提及满足地理空间阈值,在查询结果126中返回指向DOC F 272中的“实体[B]”的提及,则知识图搜索控制器110返回传递关系“实体[A]-位置[X]/[Y]接近度-第[Y]天-实体[B]”246。通过识别并返回在搜索实体的阈值接近度内的实体提及的指示,知识图搜索控制器110除了提供有关实体的显式地理时间关系的信息外,还提供有关实体的传递的基于接近度的地理时间关系的信息。
图3是用于支持知识图中基于地理时间接近度的实体搜索的地理时间控制器的一个示例的框图。
在一个示例中,地理时间控制器112包括地理时间标签提取器310。当知识图搜索控制器110在语料库118内找到实体提及时,地理时间标签提取器310识别与语料库118内的实体提及相关联的时间和地理空间元素以支持知识图搜索控制器110用基于前缀的地理时间值来生成知识图114,该地理时间值采用地理时间编码116中的实体提及来识别。
例如,地理时间标签提取器310识别时间元素,诸如但不限于,数字时间、日期、星期几、季节、时间段、事件,以及特定的时间点或时间范围的其它指示符。例如,地理时间标签提取器310识别地理空间元素,诸如但不限于,地理区域、商店名称、商户名称、街道名称、位置坐标、事件名称,以及特定位置或位置范围的其它指示符。
在一个示例中,地理时间控制器112包括编码控制器312,其用于通过考虑由地理时间标签提取器310所识别的提及的时间局部性,采用地理时间编码116来对知识图114中的每个实体的所有提及进行编码。接下来,编码控制器312计算提及的时间哈希或其它基于前缀的时间编码,并通过将偏移掩码应用于时间哈希来计算第二基于前缀的时间偏移哈希以寻址(address)时间边缘,使得在时间哈希中不共享前缀的接近时间可在时间偏移哈希中共享前缀。编码控制器312用包括时间哈希和时间偏移哈希的地理时间编码116来添加实体提及。
此外,编码控制器312通过考虑由地理时间标签提取器310识别的提及的地理空间局部性,采用地理时间编码对知识图中的每个实体的所有提及进行编码。接下来,编码控制器312计算地理空间哈希值,诸如提及的地理哈希或其它基于前缀的地理空间编码,并通过将地理空间哈希值的经度和纬度坐标旋转90度,以采集围绕有界区域(bounded area)的替代边缘的位置,来计算第二基于前缀的地理空间偏移哈希值以寻址位置边缘。编码控制器312用包括地理空间哈希和地理空间偏移哈希的地理时间编码116将实体提及添加到知识图114。
在该示例中,每个哈希值表示时间或地理空间数据到固定大小的映射,其中哈希的固定长度前缀存储为哈希值。当哈希函数应用于时间或地理空间数据时,时间上相似的事件的哈希的前缀共享相似的前缀数字,并且空间上相似的事件的哈希的前缀共享相似的前缀数字。在该示例中,为了适应可能不重叠的前缀边缘位置,将偏移掩码应用于创建时间偏移哈希,并且将旋转值应用于创建地理空间哈希以提供偏移前缀。前缀之间共享的数字数量提供了时间或地理空间接近度的粒度程度的指示符。
在一个示例中,地理时间控制器112包括查找接近实体控制器316。在一个示例中,查找接近实体控制器316管理地理时间查询124,该地理时间查询124包括识别一个或多个实体以及地理空间和时间阈值接近度的“查找接近实体”类型查询。
在该示例中,查找接近实体控制器316首先执行映射。在一个示例中,映射包括将在查询中识别的地理空间和时间阈值接近度从基于粒度的阈值映射到地理空间哈希前缀长度和时间哈希前缀长度,或者从基于时间和值的阈值映射到地理空间哈希前缀和时间哈希前缀。
接下来,查找接近实体控制器316基数(radix)通过最高有效数字对每个提及的时间哈希上的查询实体和非查询实体的所有提及进行分类。对于共享与阈值前缀匹配的时间哈希前缀或共享具有与阈值前缀长度匹配的长度的哈希前缀并包括查询实体的仓(bin),查找接近实体控制器316将这些仓中与查询实体不同的所有实体提及识别为实体提及的第一选择。接下来,查找接近实体控制器316基数通过最高有效数字对查询实体的所有提及和对每个提及的地理空间哈希上的实体提及的第一选择进行分类。对于共享与阈值前缀匹配的地理空间哈希前缀或具有与阈值前缀长度匹配的长度的哈希前缀并包括查询实体的仓,查找接近实体控制器316将这些仓中与查询实体不同的所有实体提及识别为实体提及的第二选择。查找接近实体控制器316将对实体提及的第二选择返回给知识图搜索控制器110,以用于指定查询结果126的地理时间结果128。
在一个示例中,地理时间控制器112包括查找接近度查询控制器318。在一个示例中,查找接近度控制器318管理包括识别两个或更多个实体的“查找接近度”查询的地理时间查询124。查找接近度控制器318基数通过最高有效数字对每个提及的时间哈希上的查询实体的所有提及进行分类。对于具有包含针对每个查询实体的提及的最长前缀的仓,查找接近度控制器318将实体提及识别为时间最接近的提及,并将时间最接近的提及的前缀的长度识别为时间接近度。接下来,查找接近度控制器318基数通过最高有效数字对每个提及的地理空间哈希值上最接近的提及的所有提及进行分类。对于具有包含针对每个查询实体的提及的最长前缀的仓,查找接近度控制器318将这些实体提及识别为地理空间最接近的提及,并将地理空间最接近的提及的前缀的长度识别为地理空间接近度。查找接近度控制器318可将时间接近度映射到最小时间量度,诸如年、周或日,并返回映射的时间接近度。接下来,查找接近度控制器318可将地理空间接近度映射到最短的地理空间量度,诸如英里或英尺,并返回映射的地理空间接近度以指定查询请求126的地理时间结果128。如果地理空间最接近的提及的地理空间前缀映射到命名的地理实体,诸如知识图114的记录或者另一个映射源中识别的城市、国家或位置,则查找接近度控制器318也可识别并返回命名的地理实体,用于指定查询结果126的地理时间结果128。
在一个示例中,查找接近度控制器318可针对映射表示生成数据点,其中,在地图投影和时间轴上,区域由地理空间最接近的提及的地理空间前缀描述以及时间由时间最接近的提及的时间前缀描述。在一个示例中,为了生成地图投影和时间轴,查找接近度控制器318通过纬度和经度坐标来确定映射位置,该纬度和经度坐标由地理空间前缀通过为所选地理空间前缀确定区域的边界框,并且然后为所选地理空间前缀确定映射到边界框中的坐标,来识别。如果地理空间前缀是偏移值,则查找接近度控制器318还反转在边界框中识别的地理空间偏移哈希值的坐标的经度和纬度旋转。
图4是示出用于针对知识图中的条目在文档中提取与实体提及相关联的地理时间数据的地理时间标签提取器的组件的一个示例的框图。
在该示例中,地理时间标签提取器310包括时间搜索器402,该时间搜索器402在具有实体提及的文档的内容中搜索与位置关系相关联的一个或多个类型的时间数据,诸如训练的时间参考类型406。在具有实体提及的文档内容中搜索一个或多个类型的时间数据,时间搜索器402还可在文档的元数据(诸如指示何时创建或访问文档的时间戳)中搜索与实体提及相关联的时间数据的指示。训练的时间参考类型406可包括但不限于,数字时间参考、日期参考、日历日参考、季节性参考、时间段参考、事件参考,以及对特定时间点或时间范围的指示符的其它参考。在一个示例中,时间搜索器402可实现一个或多个类型的训练的分类器,该分类器基于训练的时间参考类型406被训练以对文本的时间内容进行分类。在另一示例中,时间搜索器402可通过使用时间库解析数据来提取潜在的时间值,并且可例如通过每日、每周、每月、每季度,和每年的标识符来提取开始时间和结束时间。
在该示例中,地理时间标签提取器310还包括时间转换器404,用于转换由时间搜索器402识别的时间数据以满足时间格式定义408中的一个或多个时间格式定义。例如,时间格式定义408可指定基于UTC的时间格式。在另一示例中,时间格式定义408可指定时间格式,用于对与日期时间和时间跨度或年/月/时间相关联的时间数据进行分类。在该示例中,时间转换器404可应用一个或多个转换函数410以将一个或多个时间参考类型转换成一个或多个时间格式定义以用于编码为提取的时间标签。
在该示例中,地理时间标签提取器310包括地理空间搜索器422,该地理空间搜索器422在具有实体提及的文档的内容中搜索一个或多个类型的地理空间数据,诸如训练的地理空间参考类型426。训练的地理空间参考类型426可包括但不限于地理或空间参考,诸如但不限于地理区域参考、商店名称参考、商户名称参考、街道名称参考、位置坐标参考、事件名称参考,以及特定位置或位置区域的指示符的其它参考。
在一个示例中,地理空间搜索器422可实现一个或多个类型的训练的分类器,该分类器基于训练的地理空间参考类型426被训练以对文本的地理空间内容进行分类。例如,地理空间搜索器422可实现采用数百万个国家、城市、地区和城市的地理名称训练的分类器,其将唯一的地理标识符分配给每个识别的地理名称。在另一示例中,地理空间搜索器422可实现用街道等级信息训练的分类器,其将唯一的地理标识符分配给每个识别的地址或道路。在另一示例中,地理空间搜索器422可实现用邮政编码和国家代码训练的分类器,其将唯一的地理标识符分配给每个识别的邮政编码或国家代码。在一个示例中,地理空间搜索器402可实现用时间事件和历史时期信息训练的分类器,其将唯一的地理标识符分配给事件和历史时期指示符。
在该示例中,地理时间标签提取器310还包括地理空间转换器424,用于转换由地理空间搜索器422识别的地理空间数据以满足地理空间格式定义428中的一个或多个地理空间格式定义。例如,地理空间格式定义428可指定纬度和经度或基于地址的格式。在该示例中,地理空间转换器424可应用一个或多个转换函数420以将一个或多个地理空间参考类型转换成一个或多个地理空间格式定义以用于编码为提取的地理空间标签。
图5示出了编码控制器的组件的一个示例的框图,该编码控制器用于针对知识图中的条目从文档中的实体提及生成基于前缀的地理时间编码值。
在一个示例中,编码控制器312包括用于从由地理时间标签提取器310提取的时间标签中计算基于前缀的时间哈希值的时间哈希计算器510。在一个示例中,时间哈希计算器510可将一个或多个类型的完整长度的哈希函数应用于时间标签,并且然后计算具有固定大小的最高有效选择的哈希前缀,诸如4-32字节作为基于前缀的时间哈希值。在该示例中,与其它哈希前缀的相同位相比,基于前缀的时间哈希值的哈希前缀的每个位(从最高有效位开始)指示基于前缀的时间哈希值与其它基于前缀的时间哈希值的时间接近度的粒度,作为包括所比较的基于前缀的时间哈希值的实体提及的时间接近度的指示符。
另外,在一个示例中,编码控制器312包括时间偏移哈希计算器514,用于将掩码值512应用于基于前缀的时间哈希值以计算时间偏移哈希值,以便适应时间边缘。在一个示例中,当与其它偏移哈希值的相同位相比时,从最高有效位开始的基于前缀的时间偏移哈希值的哈希前缀的每个位指示基于前缀的时间偏移哈希值与其它基于前缀的时间偏移哈希值的时间接近度程度,作为包括比较的基于前缀的时间哈希值的实体提及的时间接近度的指示符。例如,时间哈希前缀长度匹配为1可反映100小时内的接近度,时间哈希前缀长度匹配为2可反映10小时内的接近度,时间哈希前缀长度匹配为3可反映1小时内的接近度,并且时间哈希前缀长度匹配为4可反映1分钟内的接近度。
在一个示例中,通常,将掩码值512设置为一个值,以将时间哈希值的每个有效数字增加或减少该数字的潜在值的一半,因此,跨越时间边缘的两个接近项将集中在范围中。例如,以天分隔的两个事件在被哈希成以天分隔的时间哈希值(诸如1999-12-31和2000-01-01的日期)时,可能不会共享前缀,但它们可能不共享哈希前缀,因为具有不同年份和月份值的哈希值将不会归一化为匹配的哈希前缀。通过应用具有半间隔掩码值的掩码值512,以将哈希的每个数字增加其潜在值的一半,可创建一组新的偏移哈希,该偏移哈希将有效地反映具有指示1天接近度的匹配哈希前缀的日期2000-06-15和2000-06-16。在另一示例中,如果时间哈希值表示自纪元以来的秒数(seconds-since-epoch)的时间表示,则掩码值512可应用“55555555555”的十进制偏移来应用半间隔掩码,以将哈希的每个数字增加其潜在值的一半。
在该示例中,编码控制器312包括地理空间哈希计算器520,用于从由地理时间标签提取器310提取的地理空间标签计算基于前缀的地理空间哈希值。在一个示例中,地理空间哈希计算器520可基于地理编码系统来计算基于前缀的地理空间哈希值,该地理编码系统将诸如纬度和经度或地址的地理空间位置编码为具有字母和数字的特定哈希的短字符串。在一个示例中,基于前缀的地理空间哈希值可表示地理哈希或其它基于前缀的地理空间哈希值。在一个示例中,由地理空间哈希计算器520应用的地理编码系统可应用分层空间数据结构,该分层空间数据结构将空间细分为如由空间填充曲线(诸如Z阶曲线)应用的网格形状的桶(bucket)。在该示例中,地理空间哈希的哈希前缀的每一位反映了精确度或接近度粒度。位置彼此之间的接近度通常由地理空间哈希共享的前缀数字的数量来反映,其中两个前缀之间从最高有效数字开始的共享数字越多,则由前缀识别的两个位置越接近。
通过计算用于采用实体提及进行编码的地理空间哈希值,在知识图中用实体提及进行编码的地理空间数据在用于最小化数据存储的单个值中具有连续切片(slice)中给定矩形区域的所有点,以及可将前缀与其它实体提及中的其它地理空间哈希值进行快速比较以确定接近度。例如,地理空间哈希前缀长度匹配为1可反映2500千米(km)内的接近度,地理空间哈希前缀长度匹配为2可反映630km内的接近度,地理空间哈希前缀长度匹配为3可反映78km内的接近度,地理空间哈希前缀长度匹配为4可反映20km内的接近度,地理空间哈希前缀长度匹配为5可反映2.4km内的接近度,地理空间哈希前缀长度匹配为6可反映0.61km内的接近度,地理空间哈希前缀长度匹配为7可反映0.076km内的接近度,地理空间哈希前缀长度匹配为8可反映0.019km内的接近度。在附加或替代实施例中,每个地理空间哈希前缀长度匹配可反映替代距离的接近度或其它地理空间接近度测量。
另外,在该示例中,编码控制器312包括地理空间偏移哈希计算器524,用于通过应用旋转值522从地理空间哈希值计算基于前缀的地理空间偏移哈希值。在该示例中,虽然地理空间哈希值可基于共同的前缀反映彼此相邻的点,但彼此靠近但在180度子午线相反侧的边缘情况位置对于接近但具有不同前缀的物理位置将具有不同的经度。为了识别在边缘情况位置上彼此接近的点,地理空间偏移哈希计算器524将纬度和经度坐标旋转诸如90度的旋转值522,并基于旋转的坐标计算基于前缀的地理空间偏移哈希值。在该示例中,基于前缀的地理空间哈希值可表示围绕位置的边界框的一个角,并且基于前缀的地理空间偏移哈希值可表示边界框的另一角。
图6示出了地理时间数据的一个示例的框图,该地理时间数据与实体提及的位置关系相关联地提取并且被编码在知识图中。
在一个示例中,知识图搜索控制器110针对特定实体的位置关系提及评估文档A(DOC A)600,该特定实体的位置关系提及包括地理时间位置关系提及。在该示例中,知识图搜索控制器110针对特定实体标识符识别实体提及602。
在该示例中,地理时间标签提取器310的时间搜索器402从DOC A600中提取所提取的时间标签610。地理时间标签提取器310的时间转换器404格式化所提取的时间标签610以输出格式化的时间标签612。编码控制器312的时间哈希计算器510基于格式化的时间标签612计算时间哈希值614。时间偏移哈希计算器514将掩码值512应用于时间哈希值614,以创建时间偏移哈希值616。此外,地理时间标签提取器310的地理空间搜索器422从DOC A 600提取所提取的地理空间标签620。地理时间标签提取器310的地理空间转换器424格式化所提取的时间标签610以输出格式化的地理空间标签622。编码控制器312的地理空间哈希计算器520基于格式化的地理空间标签622计算地理空间哈希值624。地理空间偏移哈希计算器524将旋转值522应用于地理空间哈希值624以创建地理空间偏移哈希值626。
在该示例中,知识图搜索控制器110向知识图条目630添加在实体提及602中以“实体标识符”识别的实体、在“实体提及doc A”中的实体提及602中的对DOC A 600的指针,以及作为“关系”的“位于”的关系指示符。另外,地理时间控制器112用如分别由“时间哈希值,时间偏移哈希值,地理空间哈希值,和地理空间偏移哈希值”所示的时间哈希值614、时间偏移哈希值616、地理空间哈希值624以及地理空间偏移哈希值626对知识图条目630进行编码。
图7示出了由地理时间控制器接收的参数和由地理时间控制器产生的结果的一个示例的框图,该地理时间控制器用于支持知识图中的基于地理时间接近度的实体搜索。
在一个示例中,查找接近实体控制器316支持对包括一个或多个实体712和阈值接近度714的地理时间查询参数710的查询,以定义对知识图114中的记录的搜索,该知识图114包括在位置和时间上重叠的一个或多个实体712(如阈值接近度714所界定)。在一个示例中,阈值接近度714包括地理空间粒度、时间粒度、特定地理空间值,和特定时间值中的一个或多个。
在一个示例中,响应于具有地理时间查询参数710的查询,查找接近实体控制器316产生地理时间结果720,该地理时间结果720指定在知识图114中的实体提及中识别为与在一个或多个实体712中指定的实体在接近度上重叠的一个或多个地理时间接近实体724(如由阈值接近度714所界定)。此外,地理时间结果720可识别一个或多个地理空间和时间标识符726,该地理空间和时间标识符726识别如识别为在针对查询实体的接近度上重叠的特定位置和时间。
在一个示例中,查找接近度控制器318支持对包括两个或更多个实体732的地理时间查询参数730的查询,以定义对知识图114中的记录的搜索,该知识图114包括如在位置和时间中重叠的两个或更多个实体732中识别的多个实体。
在一个示例中,响应于具有地理时间查询参数730的查询,查找接近度控制器318产生地理空间和时间接近度742的地理时间结果740,指示基于知识图114内的实体提及针对在接近度上重叠的多个查询实体识别的时间粒度和位置粒度。此外,地理时间结果740可识别一个或多个地理空间和时间标识符744,该地理空间和时间标识符744识别在所识别的实体提及中被识别为在接近度上重叠的特定位置和时间。
图8示出从采用针对查找接近度查询的地理时间编码的知识图收集的条目的示例的框图。
在一个示例中,表800包括条目820、822、824和826,每个条目表示知识图中的元组或其它数据记录。在该示例中,条目820和822表示用于“实体A”的知识图条目,并且条目824和826表示用于“实体B”的知识图条目。
特别地,在该示例中,表800中的每个条目识别实体802、文档的提及标识符804,以及地理空间哈希806、地理空间偏移地理哈希808、时间哈希810和时间偏移哈希812的地理时间编码元素。例如,条目820识别“实体A”、文档“A1”中的提及、“A35”的地理空间哈希、“M12”的地理空间偏移哈希、“3146”的时间哈希,以及“8701”的时间偏移哈希。条目822还识别“实体A”的条目、其具有文档“A2”中的提及、“V46”的地理空间哈希、“G72”的地理空间偏移哈希、“2995”的时间哈希,以及“8550”的时间偏移哈希。另外,在该示例中,条目824识别用于“实体B”的不同实体的条目、其具有文档“B1”中的提及、“Z76”的地理空间哈希、“G58”的地理空间偏移哈希、“3024”的时间哈希,以及“8579”的时间偏移哈希。条目826还识别用于“实体B”的条目,其具有文档“B2”中的提及、“A33”的地理空间哈希、“N47”的地理空间偏移哈希、“3543”的时间哈希,以及“9098”的时间偏移哈希。
图9示出了在知识图中识别在查找接近实体查询中的一个或多个查询实体的阈值接近度内的实体提及的查找接近实体控制器的组件的一个示例的框图。
在一个示例中,查找接近实体控制器316接收查找接近实体查询,诸如查找接近实体查询900,该查找接近实体查询900指定对与“实体[A]”接近并在由地理空间和时间粒度或地理空间和时间值指定的阈值接近度范围内的实体的搜索。查找接近实体控制器316针对一个或多个查询实体和一个或多个非查询实体(诸如表800中的条目)从知识图114中识别一个或多个条目的选择。
为了在表800中基于从知识图114中取得的实体提及来评估哪些实体提及以阈值接近度与“实体[A]”接近,查找接近实体控制器316应用接近度映射器904,该接近度映射器904取决于阈值接近度的类型来映射阈值接近度。例如,如果搜索查询中的阈值接近度指定了地理空间和时间粒度,则接近度映射器904将地理空间和时间粒度映射到相应的地理空间哈希前缀长度(诸如“1”)和相应的时间哈希前缀长度(诸如“1”),如附图标记906所示。在另一示例中,如果搜索查询中的阈值接近度指定了地理空间和时间值,则接近度映射器904将地理空间和时间值映射到相应的地理空间哈希前缀(诸如“G”)和相应的时间哈希前缀(诸如“8”),如附图标记908所示。
在该示例中,查找接近实体控制器316应用时间基数分类910,其将针对表800中的查询和非查询实体返回的提及的时间哈希分类到仓中,直到查询实体不共享仓为止,或者,在另一示例中,直到所有仓达到与阈值前缀长度相同的长度为止。在该示例中,时间基数分类910基于每个时间哈希的最高有效数字执行在附图标记912处所示的第一级别的分类,时间哈希示出为具有针对提及“A2”的“2-995”的第一仓和具有针对提及“A1”的“3-146”、针对提及“B1”的3-024以及针对提及“B2”的“3-543”的第二仓。在该示例中,图中的“|”分隔符识别仓之间的分隔。在该示例中,由于在附图标记912处多个实体共享第二仓,所以时间基数分类910基于每个时间哈希的前两个最高有效数字,执行对第二仓的第二级别的分类,时间哈希在附图标记914处示出为具有针对提及“B1”的“30-24”的第一仓、具有针对提及“A1”的“31-46”的第二仓,以及具有针对提及“B2”的“35-43”的第三仓。
在该示例中,时间基数分类910还将针对表800中的查询实体和非查询实体返回的提及的时间偏移哈希分类为仓,直到查询实体不共享仓,或者在另一示例中,直到所有仓达到与阈值前缀长度相同的长度。在该示例中,时间基数分类910基于每个时间偏移哈希的最高有效数字,执行在附图标记916处所示的第一级别的分类,时间偏移哈希示出为具有针对提及“A1”的“8-701”、针对提及“A2”的“8-550”以及针对提及“B1”的“8-579”的第一仓和具有针对提及“B2”的“9-098”的第二仓。在该示例中,由于在附图标记916处多个实体共享第一仓,所以时间基数分类910基于在附图标记918处所示的每个时间偏移哈希的前两个最高有效数字,执行对第一仓的第二级别的分类,时间偏移哈希示出为具有针对提及“A1”的“87-01”的第一仓以及具有针对提及“A2”的“85-50”和针对提及“B1”的“85-79”的第二仓。在该示例中,由于在附图标记918处多个实体共享第一仓,所以时间基数分类910基于在附图标记920处由具有针对提及“A2”的“855-0”的第一仓与具有针对提及“B1”的“857-9”的第二仓所示的每个时间偏移哈希的前三个最高有效数字,执行对第二仓的第三级别的分类。
在该示例中,查找接近实体控制器316包括时间提及选择器922,该时间提及选择器922识别包括查询元素的一个或多个选择仓,每个查询元素共享与阈值映射前缀长度相同长度的时间哈希前缀,并将与一个或多个查询实体不同的所有实体提及识别为所选实体提及。例如,时间提及选择器922以与“3-146(A1)”、“3-024(B1)”、“3-543(B2)”、“8-701(A1)”、“8-550(A2)”和“8-579(B1)”的为“1”的阈值前缀长度匹配的粒度来识别提及,如附图标记924所示,并且在实体提及中,将实体提及“B1”和“B2”识别为不包括查询实体的所选提及,如附图标记926所示。
另外,在该示例中,时间提及选择器922识别包括查询元素的一个或多个选择仓,每个查询元素共享与阈值映射前缀匹配的时间哈希值,并将与一个或多个查询实体不同的所有实体提及识别为所选实体提及。例如,时间提及选择器922识别具有与“8-701(A1)”、“8-550(A2)”和“8-579(B1)”的为“8”的阈值前缀匹配的值的提及,如附图标记928所示,并且从实体提及中,将实体提及“B1”识别为不包括查询实体的所选提及,如附图标记930所示。
接下来,查找接近实体控制器316包括地理空间基数分类932,其将针对每个查询实体返回的提及和从表800中选择的时间提及的地理空间哈希值分类为仓,直到查询实体不共享仓为止。在该示例中,地理空间基数分类932基于由具有针对提及“B1”的“Z76”的第一仓、具有针对提及“A1”的“A-35”和针对提及“B2”的“A-33”的第二仓以及具有针对提及“A2”的“V46”的第三仓所示的每个地理空间哈希的最高有效数字,执行在附图标记934处所示的第一级别的分类。接下来,地理空间基数分类932基于由具有针对提及“A1”的“A-35”的第一仓和具有针对提及“B2”的“A-33”的第二仓所示的每个地理空间哈希的两个最高有效数字,执行如在附图标记935处所示的对第二仓的第二级别的分类。如附图标记935所示,在第二级别的分类之后,没有实体共享仓。
在该示例中,地理空间基数分类932还将针对每个查询实体返回的提及以及从表800中选择的时间提及的地理空间偏移哈希值分类到仓中,直到查询实体不共享仓为止。在该示例中,地理空间基数分类932基于时间最接近的提及的每个地理空间哈希的最高有效数字,执行在附图标记936处所示的第一级别的分类,其中,第一仓具有针对提及“A1”的“M-12”的地理空间偏移哈希,第二仓具有针对提及“A2”的“G-72”和针对提及“B1”的“G-58”。在该示例中,由于在附图标记936处多个实体共享第二仓,因此地理空间基数分类932基于在附图标记937处由具有针对提及“A2”的“G7-2”的第一仓和具有针对提及“B1”的“G5-8”的第二仓所示的每个地理空间偏移哈希值的前两个最高有效数字,执行对仓的第二级别的分类。如附图标记937所示,在第二级别的分类之后,没有实体共享仓。
在该示例中,查找接近实体控制器316包括地理空间提及选择器940,其识别一个或多个选择仓的第二选择,该选择仓包括查询元素,每个查询元素共享与阈值映射前缀长度相同长度的地理空间哈希前缀,并将与一个或多个查询实体不同的所有实体提及识别为所选实体提及。例如,地理空间提及选择器940以与“A-35(A1)”和“A-33(B2)”的为“1”的阈值前缀长度匹配的粒度来识别提及,如附图标记942所示,并且从实体提及中,将实体提及“B2”识别为不包括查询实体的所选提及,如附图标记944所示。
此外,在该示例中,地理空间提及选择器922识别包括被查询元素的一个或多个选择仓的第二选择,每个被查询元素共享与阈值映射前缀匹配的地理空间哈希值,并将与一个或多个查询实体不同的所有实体提及识别为所选实体提及。例如,地理空间提及选择器940识别如附图标记946所示的具有与“G-72(A1)”和“G-58(B1)”的为“G”的阈值前缀匹配的值的提及,并且从实体提及中,将实体提及“B1”识别为不包括查询实体的所选提及,如附图标记948所示。
在该示例中,取决于在搜索查询中提供的阈值接近度的类型,查找接近实体控制器316基于由地理空间提及选择器940选择的地理空间选择提及来提供地理时间结果950。例如,如果阈值接近度的类型是粒度阈值,则地理时间结果950包括粒度匹配实体提及“B2”,如附图标记952所示。在另一示例中,如果阈值接近度的类型是值阈值,则地理时间结果950包括值匹配实体提及“B1”,如附图标记954所示。
图10是示出查找接近度控制器的组件的一个示例的框图,该查找接近度控制器针对在查找接近度查询中识别的多个实体,识别在实体提及中识别的地理空间和时间接近度的粒度。
在一个示例中,查找接近度控制器318接收诸如查找接近度查询1000的查找接近度查询,并且针对实体中的每个实体从知识图114中识别对一个或多个条目(诸如表800中的条目)的选择。为在表800中基于从知识图114取得的实体提及来评估“实体[A]”和“实体[B]”的粒度接近度,查找接近度控制器318应用时间基数分类1002,该时间基数分类1002将针对表800中的每个实体返回的提及的时间哈希值分类为仓,直到查询实体不共享仓为止。在该示例中,时间基数分类1002基于由具有针对提及“A2”的“2-995”的第一仓与具有针对提及“A1”的“3-146”、针对提及“B1”的“3-024”以及针对提及“B2”的“3-543”的第二仓所示的每个时间哈希的最高有效数字,执行在附图标记1004处所示的第一级别的分类。在该示例中,图中的“|”分隔符识别仓之间的分隔。在该示例中,由于在附图标记1004处多个实体共享第二仓,所以时间基数分类1002基于在附图标记1006处由具有针对提及“B1”的“30-24”的第一仓,具有针对提及“A1”的“31-46”的第二仓,与具有针对提及“B2”的“35-43”的第三仓所示的每个时间哈希值的前两个最高有效数字,执行对第二仓的第二级别的分类。
在该示例中,查找接近度控制器318包括时间查找仓1018,该时间查找仓1018针对具有最长前缀的时间哈希值识别包含每个查询实体的提及的仓,并且然后为提及中的每个提及分配最长前缀作为时间前缀。在该示例中,对于时间哈希分类,附图标记1004处所示的第二仓是具有最长前缀的仓,该最长前缀包含对查询实体中每个查询实体的提及,由提及“A1”、提及“B1”和提及“B2”所示。如附图标记1020所示,对于时间哈希分类,时间查找仓1018返回该仓的最长前缀,该仓包含以具有1个数字长度的最长前缀值“3”识别的查询实体中每个查询实体的提及。
另外,在一个示例中,时间基数分类1002将针对表800中的每个实体返回的提及的时间偏移哈希分类为仓,直到实体不共享仓为止。在该示例中,时间基数分类1002基于由具有针对提及“A1”的“8-701”、针对提及“A2”的“8-550”以及针对提及“B1”的“8-579”的第一仓与具有针对提及“B2”的“9-098”的第二仓所示的每个时间偏移哈希的最高有效数字,执行在附图标记1012处所示的第一级别的分类。在该示例中,由于在附图标记1012处多个实体共享第一仓,所以时间基数分类1002基于在附图标记1014处由具有针对提及“A1”的“87-01”的第一仓与具有针对提及“A2”的“85-50”和针对提及“B1”的“85-79”的第二仓所示的每个时间偏移哈希的前两个最高有效数字,执行对第一仓的第二级别分类。在该示例中,由于在附图标记1014处多个实体共享第二仓,所以时间基数分类1002基于附图标记1016处由具有针对提及“A2”的“855-0”的第一仓和具有针对提及“B1”的“857-9”的第二仓所示的每个时间偏移哈希的前三个最高有效位,执行对第二仓的第三级别的分类。
在该示例中,时间查找仓1018针对具有最长前缀的时间偏移哈希值识别包含每个查询实体的提及的仓,并且然后为提及中的每个提及分配最长前缀作为时间偏移前缀。在该示例中,对于时间偏移哈希分类,在附图标记1014处示出的第二仓是具有最长前缀的仓,该仓包含对查询实体中每个查询实体的提及,由提及“A2”和提及“B1”示出。如附图标记1022所示,对于时间偏移哈希分类,时间查找仓1018返回仓的最长前缀,该仓包含以具有2个数字长度的最长前缀值“85”识别的查询实体中的每个查询实体的提及。
在该示例中,查找接近度控制器318包括时间最接近选择器1024。时间最接近选择器1024评估时间哈希或时间偏移哈希是否具有最长前缀长度。在该示例中,附图标记1022处示出的时间偏移哈希最长前缀“85”长于附图标记1020处示出的时间哈希最长前缀“3”。时间最接近选择器1024识别在仓中针对所选最长前缀“85”的最接近实体提及,该最接近实体提及如在附图标记1026处所示被识别为来自附图标记1014处所示的第二仓的提及“A2”和“B1”。
在该示例中,查找接近度控制器318包括时间粒度计算器1028。时间粒度计算器1028基于前缀长度来评估针对最接近提及指示的时间接近度。在该示例中,如附图标记1030所示,时间粒度计算器确定2个数字的前缀“85”反映两个粒度级别的时间接近度,例如,这可反映100小时内的时间接近度。
接下来,查找接近度控制器318包括地理空间基数分类1032,其将针对表800中的每个实体返回的提及的地理空间哈希分类为仓,直到查询实体不共享仓为止。在该示例中,地理空间基数分类1032基于由具有针对提及“A2”的“V46”的第一仓与具有针对提及“B1”的“Z76”的第二仓所示的每个地理空间哈希值的最高有效数字执行第一级别的分类。如附图标记1034所示,在第一级别的分类之后,没有实体共享仓。
在该示例中,查找接近度控制器318包括地理空间查找仓1042,该地理空间查找仓1042针对具有最长前缀的地理空间哈希识别包含每个查询实体的提及的仓,并且然后为提及中的每个提及分配最长前缀作为地理空间偏移前缀。在该示例中,对于地理空间哈希分类,没有仓包含对每个查询实体的提及,因此地理空间查找仓1042返回最长前缀的空值前缀,如附图标记1044所示。
在该示例中,地理空间基数分类1032还将为表800中的每个实体返回的提及的地理空间偏移哈希分类为仓,直到查询实体不共享仓为止。在该示例中,地理空间基数分类1032基于在附图标记1038处由具有针对提及“A2”的“G-72”的第一仓和具有针对提及“B1”的“G-58”的第二仓所示的时间最接近提及的每个地理空间哈希的最高有效数字,执行在附图标记1038处示出的第一级别的分类。在该示例中,由于在附图标记1038处多个实体共享第一仓,所以地理空间基数分类1032基于在附图标记1040处由针对提及“A2”的“G7-2”的第一仓和针对提及“B1”的“G5-8”的第二仓所示的每个地理空间偏移哈希的前两个最高有效数字,执行对仓的第二级别的分类。如附图标记1040所示,在第二级别的分类之后,没有实体共享仓。
在该示例中,地理空间查找仓1042还针对具有最长前缀的地理空间偏移哈希识别包含每个查询实体的提及的仓,并且然后为提及中的每个提及分配最长前缀作为地理空间偏移前缀。在该示例中,对于地理空间偏移哈希分类,在附图标记1038处示出的第一仓是具有最长前缀的仓,该仓包含针对查询实体中每个查询实体的提及,由提及“A2”和提及“B1”所示。如附图标记642所示,对于地理空间偏移哈希分类,地理空间查找仓1042返回仓的最长前缀,该最长前缀包含以“G”的最长前缀值识别的查询实体中每个查询实体的提及。
在该示例中,查找接近度控制器318包括地理空间最接近选择器1048。地理空间最接近选择器1048评估地理空间哈希或地理空间偏移哈希是否具有最长的前缀长度。在该示例中,附图标记1046处所示的地理空间偏移哈希最长前缀“G”的长度长于附图标记1044处所示的地理空间哈希最长前缀“空值”的长度。地理空间最接近选择器1048针对所选最长前缀长度“G”识别在仓中的实体提及,该实体提及如在附图标记1050处所示被识别为来自附图标记1038处所示的第一仓中的提及“A2”和“B1”。
在该示例中,查找接近度控制器318包括地理空间粒度计算器1052。地理空间粒度计算器1052基于前缀长度来评估针对最接近提及所指示的地理空间接近度。在该示例中,如附图标记1054所示,地理空间粒度计算器1052确定1个数字的前缀“G”反映一个粒度级别的地理空间接近度,例如,这可以反映630km内的时间接近度。
在该示例中,查找接近度控制器318基于附图标记1030处所示的时间接近度并从附图标记1054处所示的地理空间接近度提供地理时间结果1060。在一个示例中,地理时间结果1060可被报告为前缀长度,如在附图标记1062处所示,作为接近度的指示。在另一示例中,查找接近度控制器318可首先将每个前缀长度转换成测量值,诸如将时间前缀长度转换成时间量,并且将地理空间前缀长度转换成距离,并在地理时间结果1060中报告测量值。
图11示出了可以在其中实现本发明的一个实施例的计算机系统的一个示例的框图。本发明可在由功能组件(诸如参考计算机系统1100描述的功能组件)组成的各种系统和系统组合中执行,并且可以通信地连接到网络(诸如网络1102)。
计算机系统1100包括总线1122或用于在计算机系统1100内传送信息的其它通信设备,以及至少一个硬件处理设备(诸如处理器1112),该硬件处理设备耦接到总线1122以处理信息。总线1122优选地包括低延迟和较高等待时间的路径,该路径通过桥和适配器连接并且在计算机系统1100内由多个总线控制器控制。在一个实施例中,计算机系统1100当被实现为服务器或节点时,包括多个处理器,该处理器被设计为提高网络服务能力。
在一个实施例中,处理器1112是至少一个通用处理器,该通用处理器在正常操作期间在软件1150的控制下处理数据,该软件包括应用软件、操作系统、中间件以及其它代码和计算机可执行程序中的至少一个,该其它代码和计算机可执行程序可从诸如随机存取存储器(RAM)1114的动态存储设备、诸如只读存储器(ROM)1116的静态存储设备、诸如大容量存储设备1118的数据存储设备,或其它数据存储介质访问。在一个实施例中,软件1150包括但不限于用于控制网络内的一个或多个系统的代码、应用、协议、接口和过程,该系统包括但不限于适配器、交换机、服务器、集群系统和网格环境。
在一个实施例中,计算机系统1100与诸如服务器1140的远程计算机或远程客户端进行通信。在一个示例中,服务器1140通过任何类型的网络(诸如网络1102),通过通信接口(诸如网络接口1132),或通过例如连接到网络1102的网络链路连接到计算机系统1100。
在一个实施例中,网络环境内的多个系统经由网络1102通信地连接,该网络1102是用于在通信连接的各个设备和计算机系统之间提供通信链路的介质。网络1102例如包括诸如电线或光纤电缆的永久连接以及通过电话连接和无线传输连接进行的临时连接,并且网络1102可包括路由器、交换机、网关和其它硬件,以实现经由网络1102连接的系统之间的通信信道。网络1102表示基于分组交换的网络、基于电话的网络、广播电视网络、局域网和有线区域网、公共网络和受限网络中的一个或多个。
网络1102和经由网络1102通信连接到计算机1100的系统实现了一个或多个类型的网络协议栈的一层或多层,该网络协议栈可包括物理层、链路层、网络层、传输层、表示层和应用层中的一个或多个。例如,网络1102实现传输控制协议/互联网协议(TCP/IP)协议栈或开放系统互连(OSI)协议栈中的一个或多个。另外,例如,网络1102表示使用TCP/IP协议套件彼此通信的网络和网关的全球集合。网络1102实现安全的HTTP协议层或其它安全协议以保护系统之间的通信。
在该示例中,网络接口1132包括适配器1134,该适配器1134用于通过链路将计算机系统1100连接到网络1102,并且用于经由网络1102将计算机系统1100通信地连接到服务器1140或其它计算系统。尽管未示出,但是网络接口1132可能包括附加软件,诸如设备驱动器、附加硬件和启用通信的其它控制器。当实现为服务器时,计算机系统1100可包括多个通信接口,该通信接口例如可经由连接到输入/输出控制器的多个外围组件互连(PCI)总线桥来访问。以该方式,计算机系统1100允许经由多个单独的端口到多个客户端的连接,并且每个端口还可支持到多个客户端的多个连接。
在一个实施例中,由处理器1112执行的操作控制图12-16的流程图的操作以及本文所述的其它操作。在一个实施例中,由处理器1112执行的操作由软件1150或其它代码请求,或者本发明的一个实施例的步骤可由包含用于执行步骤的硬连线逻辑的特定硬件组件来执行,或者由编程的计算机组件和自定义硬件组件的任意组合来执行。在一个实施例中,计算机系统1100的一个或多个组件或可集成到计算机系统1100的一个或多个组件中的其它组件包含用于执行图12-16中的流程图的操作的硬连线逻辑。
在一个实施例中,计算机系统1100包括有助于输入和输出的多个外围组件。这些外围组件连接到耦接于总线1122的多个级别之一的多个控制器、适配器和扩展插槽,诸如输入/输出(I/O)接口1126。例如,输入设备1124包括例如:麦克风、视频采集设备、图像扫描系统、键盘、鼠标,或经由控制输入的I/O接口1126在总线1122上通信地启用的其它输入外围设备。另外,例如,经由用于控制输出的I/O接口1126在总线1122上通信地启用的输出设备1120包括例如一个或多个图形显示设备、音频扬声器,和触觉可检测的输出接口,但是在另一示例中还包括其它输出接口。在本发明的替代实施例中,可添加附加的或替代的输入和输出外围组件。
关于图11,本发明的一个或多个实施例包括但不限于系统、方法和/或计算机程序产品。在一个实施例中,计算机程序产品包括其上具有用于使处理器执行本发明的方面的计算机可读程序指令的一个或多个计算机可读存储介质。
在一个实施例中,计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。在一个实施例中,网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
在一个实施例中,用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及过程式编程语言—诸如“C”语言或类似的编程语言。在一个实施例中,计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,在一个实施例中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域普通技术人员将理解,在附加或替代实施例中,图11中描绘的硬件可以变化。此外,本领域普通技术人员将理解,所描绘的示例并不意味着暗示关于本发明的架构限制。
图12示出了用于采用提及中的地理时间信息对知识图中的实体提及进行编码的过程和计算机程序的高级逻辑流程图,该地理时间信息具有支持贯穿知识图的基于传递接近度的实体搜索的格式。
在该示例中,过程和计算机程序在框1200开始,并且然后进行到框1202。框1202示出确定是否针对实体触发了地理时间控制。在框1202处,如果针对实体触发了地理时间控制,则过程进行到框1204。框1204示出了在文档语料库的每个文档内搜索实体提及。接下来,框1206示出确定在文档中是否识别了实体提及。
在框1206处,如果在文档中未识别实体提及,则过程进行到框1218。框1218示出确定是否搜索了所有文档。在框1218处,如果搜索了所有文档,则处理结束。否则,在框1218处,如果尚未搜索所有文档,则过程返回到框1204。
返回到框1206,在框1206处,如果在文档中识别了实体提及,则过程进行到框1208。框1208示出了在文档中搜索与该实体提及相关联的地理时间信息。接下来,框1210示出确定是否识别了一个或多个类型的相关联地理空间或时间信息。在框1210处,如果未识别地理空间或时间信息,则处理进行到框1218。在框1210处,如果识别一个或多个类型的地理空间或时间信息,则处理进行到框1212。框1212示出了通过信息类型将地理时间信息转换成一个或多个地理空间格式和时间格式。接下来,框1214示出了针对转换的地理时间信息来计算一个或多个基于前缀的地理时间值,诸如针对转换的地理时间信息来计算一个或多个基于前缀的哈希和偏移哈希值。此后,框1216示出用定位关系和一个或多个计算的基于前缀的地理时间值来对知识图用于实体提及和实体提及标识符的条目进行编码,并且过程结束。
图13示出了用于将与实体提及相关联的地理时间数据识别和编码为知识图中用于支持贯穿知识图的基于接近度的实体搜索的基于前缀的地理时间值的过程和计算机程序的高级逻辑流程图。
在一个示例中,过程和计算机程序在框1300处开始,并且然后进行到框1302。框1302示出确定是否触发了针对与实体提及相关联的地理时间数据的搜索。在框1302处,如果触发了针对与实体提及相关联的地理时间数据的搜索,则过程同时进行到框1304和框1316。
框1304示出在文档中搜索一个或多个类型的时间参考。接下来,框1306示出确定是否识别了时间参考类型。在框1306处,如果没有识别时间参考类型,则过程结束。在框1306处,如果识别时间参考类型,则过程进行到框1308。框1308示出通过应用一个或多个转换值,将具有时间参考类型的时间信息转换成标准时间格式定义,诸如协调的世界时间(UTC)。接下来,框1310示出根据转换的时间信息来计算基于前缀的时间哈希值。此后,框1312示出通过将偏移掩码应用于时间哈希值来计算基于前缀的时间偏移哈希值。接下来,框1314示出将时间哈希值和时间偏移哈希值设定为用于编码实体提及记录的基于前缀的时间值,并且过程结束。
框1316示出了搜索一个或多个类型的地理空间参考。接下来,框1318示出确定是否识别地理空间参考类型。在框1318处,如果没有识别地理空间参考类型,则过程结束。在框1318处,如果识别地理空间参考类型,则过程进行到框1320。框1320示出通过应用一个或多个转换值,将具有地理空间参考类型的地理空间信息转换成标准地理空间格式定义,诸如纬度和经度。接下来,框1322示出根据转换的地理空间信息计算基于前缀的地理空间哈希值。此后,框1324示出通过将地理空间哈希值的纬度和经度坐标旋转90度来计算基于前缀的地理空间偏移哈希值。接下来,框1326示出将地理空间哈希值和偏移地理空间哈希值设定为用于实体提及的地理空间信息的地理时间标签值,并且过程结束。
图14示出用于执行基于传递接近度的实体搜索以查找贯穿知识图的搜索实体的阈值接近度内的其它实体提及的过程和计算机程序的高级逻辑流程图。
在一个示例中,过程和计算机程序在框1400开始,然后进行到框1402。框1402示出确定是否接收到识别一个或多个实体和一个或多个阈值的查找接近度搜索。在框1402处,如果接收到识别一个或多个实体和一个或多个阈值的查找接近度搜索,则过程进行到框1404。
框1404示出确定指定哪个类型的阈值。在框1404处,如果阈值是基于粒度的,则过程进行到框1406。框1406示出将地理空间和时间粒度映射到地理空间哈希前缀长度和时间哈希前缀长度,并且过程进行到框1410。返回到框1404,如果阈值是基于值的,则该过程前进到框1408。框1408示出将地理空间和时间位置映射到地理空间哈希前缀和时间哈希前缀,并且该过程前进到框1410。
框1410示出从最高有效数字开始基数将每个时间哈希值上的查询实体的所有提及和非查询实体的所有提及分类到仓中。接下来,框1412示出识别具有查询实体的一个或多个选择仓,其中每个仓共享与阈值映射相同的时间哈希前缀或具有与阈值映射相同长度的哈希前缀。此后,框1414示出识别一个或多个选择仓中与一个或多个查询实体不同的所有实体提及,作为所选实体提及。接下来,框1416示出从最高有效数字开始基数将地理空间哈希值上的查询实体的所有提及和所选实体提及分类到仓中。此后,框1418示出识别具有查询实体的一个或多个地理空间选择仓,其中每个查询实体共享与阈值映射相同的地理空间哈希前缀或具有与阈值映射相同长度的哈希前缀。接下来,框1420示出识别一个或多个地理空间选择仓中与一个或多个查询实体不同的所有实体提及,作为结果实体提及。此后,框1422示出向搜索查询返回结果实体提及作为地理时间结果,并且过程结束。
图15示出了用于执行基于传递接近度的实体搜索,以查找用于识别贯穿知识图的搜索实体的最接近地理时间接近度的粒度的两个或更多个搜索实体的提及的过程和计算机程序的高层逻辑流程图。
在一个示例中,过程和计算机程序在框1500开始,并且然后进行到框1502。框1502示出确定是否接收到识别多个实体的查找接近度搜索。接下来,框1504示出从最高有效数字开始基数将每个时间哈希值上的查询实体的所有提及分类到仓中,直到查询实体的提及不共享仓为止。此后,框1506示出识别具有最长前缀的第一选择时间仓,该仓包含每个查询实体的提及。接下来,框1508示出从最高有效数字开始基数将每个时间偏移哈希值上的查询实体的所有提及分类到仓中,直到查询实体的提及不共享仓为止。此后,框1510示出识别具有最长偏移前缀的第二选择时间仓,该仓包含每个查询实体的提及。接下来,框1512示出从最长前缀和最长偏移前缀中的较长者中选择时间前缀。此后,框1514示出识别与时间前缀相关联的第一或第二时间仓中的实体,作为最接近的时间提及。接下来,框1516示出从最高有效数字开始基数将每个地理空间哈希值上的每个实体的最接近的时间提及分类到仓中,直到最接近的时间提及不共享仓为止。此后,框1518示出识别具有最长前缀的第一选择地理空间仓,该仓包含每个查询实体的提及。接下来,框1520示出从最高有效数字开始基数将每个地理空间偏移哈希值上的每个实体的最接近的时间提及分类到仓中,直到最接近的时间提及不共享仓为止。此后,框1522示出识别具有最长偏移前缀的第二选择地理空间仓,该仓包含每个查询实体的提及。接下来,框1524示出从最长前缀和最长偏移前缀中的较长者中选择地理空间前缀。此后,框1526示出将时间前缀映射到时间量度。接下来,框1528示出将地理空间前缀映射到地理空间量度。此后,框1530示出向搜索查询返回时间量度和地理空间量度作为地理时间结果,并且过程结束。
图16示出了用于针对查找接近度搜索的结果生成地图投影,以说明搜索实体的最接近的地理时间接近度的过程和计算机程序的高级逻辑流程图。
在一个示例中,过程和计算机程序在框1600处开始,并且然后进行到框1602。框1602示出确定查找接近度搜索查询是否包括对地图投影的请求。在框1602处,如果查找接近度搜索查询包括对地图投影的请求,则过程进行到框1604。框1604示出确定针对选择的地理空间前缀的坐标的区域的边界框。接下来,框1606示出确定选择的地理空间前缀是否被设定为地理空间偏移哈希值。在框1606处,如果将选择的地理空间前缀被设定为地理空间偏移哈希值,则过程进行到框1610。框1610示出反转针对边界框识别的地理空间偏移值的坐标的经度和纬度旋转。返回到框1606,如果未将选择的地理空间前缀设定为地理空间偏移哈希值,则该过程进行至框1608。框1608示出确定在边界框中针对选择的地理空间前缀的映射的坐标,并且该过程进行到框1612。
框1612示出为由确定的坐标指定的区域指定地图投影,其中时间轴由选择的时间前缀指定。接下来,框1614示出在地理时间结果中向搜索查询返回带有时间轴的地图投影,并且过程结束。
附图中的流程图和框图示出了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实现的体系结构、功能和操作。就这一点而言,流程图或框图中的每个框可代表代码的模块、段或部分,其包括用于实现指定的逻辑功能的一个或多个可执行指令。还应注意,在一些替代实现方式中,框中指出的功能可不按图中指出的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可基本上同时发生,或者有时框可以以相反的顺序发生。还应注意,框图和/或流程图说明中的每个框以及框图和/或流程图说明中的框的组合可由执行指定功能或动作的基于专用硬件的系统或专用硬件和计算机指令的组合来实现。
本文所使用的术语仅出于描述特定实施例的目的,并不旨在限制本发明。如本文所使用的,单数形式的“一”、“一个”和“该”也旨在包括复数形式,除非上下文另外明确指出。还将理解的是,当在本说明书中使用时,术语“包括”和/或“包含”指定存在所述特征、整数、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整数、步骤、操作、元件、组件和/或其组。
权利要求中的所有装置或步骤加上功能元件的对应结构、材料、动作和等同物旨在包括用于与如具体要求保护的其它要求保护的元件组合地执行功能的任何结构、材料或动作。已经出于说明和描述的目的给出了对本发明的一个或多个实施例的描述,但是其并不旨在是穷举的或将本发明限于所公开的形式。在不脱离本发明的范围和精神的情况下,许多修改和变化对于本领域普通技术人员将是显而易见的。选择和描述实施例是为了最优地解释本发明的原理和实际应用,并使本领域的其他普通技术人员能够理解本发明对于具有各种修改的各种实施例适于预期的特定用途。
前面的描述仅仅是本发明的实施例以及变型和替代的示例。尽管已经参考一个或多个实施例具体示出和描述了本发明,但是本领域技术人员将理解,在不脱离本发明的精神和范围的情况下,可以在形式和细节上进行各种改变。

Claims (21)

1.一种方法,包括:
响应于在文档中检测到与实体的提及相关联的地理空间信息和时间信息,由计算机系统将所述地理空间信息转换成指定的地理空间格式并将所述时间信息转换成指定的时间格式;
由所述计算机系统针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值,以及针对所转换的时间信息计算一个或多个基于前缀的时间值;以及
由所述计算机系统用所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值对知识图中用于来自所述文档的所述实体的所述提及的条目进行编码,其中,与所述知识图中用于另一实体提及的另一条目中的另外一个或多个基于前缀的地理空间值和另外一个或多个基于前缀的时间值相匹配的所述知识图中的所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值的每个数字反映所述实体和所述另一实体的地理时间接近度的粒度。
2.根据权利要求1所述的方法,其中,由所述计算机系统针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值以及针对所转换的时间信息计算一个或多个基于前缀的时间值进一步包括:
由所述计算机系统通过将哈希函数应用于所转换的地理空间信息来计算基于前缀的地理空间哈希值;以及
由所述计算机系统通过将所述基于前缀的地理空间哈希值的纬度和经度旋转一旋转值来计算基于前缀的地理空间偏移哈希值,其中,与所述知识图中用于所述另一实体提及的所述另一条目中的另一基于前缀的地理空间哈希值和另一基于前缀的地理空间偏移哈希值相匹配的所述基于前缀的地理空间哈希值和所述基于前缀的地理空间偏移哈希值的每个数字反映所述实体与所述另一实体的地理空间接近度的粒度。
3.根据权利要求1所述的方法,其中,由所述计算机系统针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值以及针对所转换的时间信息计算一个或多个基于前缀的时间值进一步包括:
由所述计算机系统通过将哈希函数应用于所转换的时间信息来计算基于前缀的时间哈希值;以及
由所述计算机系统通过将偏移掩码应用于所述基于前缀的时间哈希值以将所述基于前缀的时间哈希值的每个数字增加一半的潜在值,来计算基于前缀的时间偏移哈希值,其中,与所述知识图中用于所述另一实体提及的所述另一条目中的另一基于前缀的时间哈希值和另一基于前缀的时间偏移哈希值相匹配的所述基于前缀的时间哈希值和所述基于前缀的时间偏移哈希值的每个数字反映所述实体与所述另一实体的时间接近度的粒度。
4.根据权利要求1所述的方法,其中,由所述计算机系统用所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值对所述知识图中用于来自所述文档的所述实体的所述提及的条目进行编码进一步包括:
由所述计算机系统用所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值的位置关系的标识符来对所述知识图中用于来自所述文档的所述实体的所述提及的所述条目进行编码。
5.根据权利要求1所述的方法,进一步包括:
由所述计算机系统用位置关系的标识符、所述地理空间信息以及所述时间信息来存储所述知识图中用于来自所述文档的所述实体的所述提及的所述条目。
6.根据权利要求1所述的方法,进一步包括:
由所述计算机系统在文档语料库中搜索所述实体的一个或多个提及;以及
响应于识别所述文档语料库中具有所述实体的所述提及的文档,由所述计算机系统在所述特定文档中搜索与所述提及相关联的所述地理空间信息和所述时间信息。
7.根据权利要求1所述的方法,进一步包括:
由所述计算机系统通过应用一个或多个地理空间分类器来在所述文档中搜索所述地理空间信息,每个地理空间分类器被训练以从多个地理空间参考类型中检测一个或多个地理空间参考类型;
响应于所述一个或多个地理空间分类器返回所述文档中的第一文本选择的分类作为所述地理空间信息,由所述计算机系统将所述地理空间信息转换成所述指定的地理空间格式;
由所述计算机系统通过应用一个或多个时间分类器来在所述文档中搜索所述时间信息,每个时间分类器被训练以从多个时间参考类型中检测一个或多个时间参考类型;以及
响应于所述一个或多个时间分类器返回所述文档中的第二文本选择的分类作为所述时间信息,由所述计算机系统将所述时间信息转换成所述指定的时间格式。
8.一种计算机系统,包括:一个或多个处理器、一个或多个计算机可读存储器、一个或多个计算机可读存储设备以及程序指令,所述程序指令存储在所述一个或多个存储设备中的至少一个存储设备上以经由所述一个或多个存储器中的至少一个存储器由所述一个或多个处理器中的至少一个处理器执行,所存储的程序指令包括:
响应于在文档中检测到与实体的提及相关联的地理空间信息和时间信息,将所述地理空间信息转换成指定的地理空间格式并将所述时间信息转换成指定的时间格式的程序指令;
针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值以及针对所转换的时间信息计算一个或多个基于前缀的时间值的程序指令;以及
用所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值对知识图中用于来自所述文档的所述实体的所述提及的条目进行编码的程序指令,其中,与所述知识图中用于另一实体提及的另一条目中的另外一个或多个基于前缀的地理空间值和另外一个或多个基于前缀的时间值相匹配的所述知识图中的所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值的每个数字反映所述实体和所述另一实体的地理时间接近度的粒度。
9.根据权利要求8所述的计算机系统,针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值以及针对所转换的时间信息计算一个或多个基于前缀的时间值的程序指令进一步包括:
通过将哈希函数应用于所转换的地理空间信息来计算基于前缀的地理空间哈希值的程序指令;以及
通过将所述基于前缀的地理空间哈希值的纬度和经度旋转一旋转值来计算基于前缀的地理空间偏移哈希值的程序指令,其中,与所述知识图中用于所述另一实体提及的所述另一条目中的另一基于前缀的地理空间哈希值和另一基于前缀的地理空间偏移哈希值相匹配的所述基于前缀的地理空间哈希值和所述基于前缀的地理空间偏移哈希值的每个数字反映所述实体与所述另一实体的地理空间接近度的粒度。
10.根据权利要求8所述的计算机系统,其中,针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值以及针对所转换的时间信息计算一个或多个基于前缀的时间值的程序指令进一步包括:
通过将哈希函数应用于所转换的时间信息来计算基于前缀的时间哈希值的程序指令;以及
通过将偏移掩码应用于所述基于前缀的时间哈希值以将所述基于前缀的时间哈希值的每个数字增加一半的潜在值来计算基于前缀的时间偏移哈希值的程序指令,其中,与所述知识图中用于所述另一实体提及的所述另一条目中的另一基于前缀的时间哈希值和另一基于前缀的时间偏移哈希值相匹配的所述基于前缀的时间哈希值和所述基于前缀的时间偏移哈希值的每个数字反映所述实体与所述另一实体的时间接近度的粒度。
11.根据权利要求8所述的计算机系统,用所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值对所述知识图中用于来自所述文档的所述实体的所述提及的条目进行编码的程序指令进一步包括:
用所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值的位置关系的标识符来对所述知识图中用于来自所述文档的所述实体的所述提及的所述条目进行编码的程序指令。
12.根据权利要求8所述的计算机系统,进一步包括:
用位置关系的标识符、所述地理空间信息以及所述时间信息来存储所述知识图中用于来自所述文档的所述实体的所述提及的所述条目的程序指令。
13.根据权利要求8所述的计算机系统,进一步包括:
在文档语料库中搜索所述实体的一个或多个提及的程序指令;以及
响应于识别所述文档语料库中具有所述实体的所述提及的文档,在所述特定文档中搜索与所述提及相关联的所述地理空间信息和所述时间信息的程序指令。
14.根据权利要求8所述的计算机系统,进一步包括:
通过应用一个或多个地理空间分类器来在所述文档中搜索所述地理空间信息的程序指令,每个地理空间分类器被训练以从多个地理空间参考类型中检测一个或多个地理空间参考类型;
响应于所述一个或多个地理空间分类器返回所述文档中的第一文本选择的分类作为所述地理空间信息,将所述地理空间信息转换成所述指定的地理空间格式的程序指令;
通过应用一个或多个时间分类器来在所述文档中搜索所述时间信息的程序指令,每个时间分类器被训练以从多个时间参考类型中检测一个或多个时间参考类型;以及
响应于所述一个或多个时间分类器返回所述文档中的第二文本选择的分类作为所述时间信息,将所述时间信息转换成所述指定的时间格式的程序指令。
15.一种计算机程序产品,包括计算机可读存储介质,在所述计算机可读存储介质中体现有程序指令,其中,所述计算机可读存储介质不是瞬态信号本身,所述程序指令能够由计算机执行以使所述计算机:
响应于在文档中检测到与实体的提及相关联的地理空间信息和时间信息,由所述计算机将所述地理空间信息转换成指定的地理空间格式并将所述时间信息转换成指定的时间格式;
由所述计算机针对所转换的地理空间信息计算一个或多个基于前缀的地理空间值以及针对所转换的时间信息计算一个或多个基于前缀的时间值;以及
由所述计算机用所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值对知识图中用于来自所述文档的所述实体的所述提及的条目进行编码,其中,与所述知识图中用于另一实体提及的另一条目中的另外一个或多个基于前缀的地理空间值和另外一个或多个基于前缀的时间值相匹配的所述知识图中的所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值的每个数字反映所述实体和所述另一实体的地理时间接近度的粒度。
16.根据权利要求15所述的计算机程序产品,进一步包括能够由计算机执行以使所述计算机执行以下操作的程序指令:
由所述计算机通过将哈希函数应用于所转换的地理空间信息来计算基于前缀的地理空间哈希值;以及
由所述计算机通过将所述基于前缀的地理空间哈希值的纬度和经度旋转一旋转值来计算基于前缀的地理空间偏移哈希值,其中,与所述知识图中用于所述另一实体提及的所述另一条目中的另一基于前缀的地理空间哈希值和另一基于前缀的地理空间偏移哈希值相匹配的所述基于前缀的地理空间哈希值和所述基于前缀的地理空间偏移哈希值的每个数字反映所述实体与所述另一实体的地理空间接近度的粒度。
17.根据权利要求15所述的计算机程序产品,进一步包括能够由计算机执行以使所述计算机执行以下操作的程序指令:
由所述计算机通过将哈希函数应用于所转换的时间信息来计算基于前缀的时间哈希值;以及
由所述计算机通过将偏移掩码应用于所述基于前缀的时间哈希值以将所述基于前缀的时间哈希值的每个数字增加一半的潜在值,来计算基于前缀的时间偏移哈希值,其中,与所述知识图中用于所述另一实体提及的所述另一条目中的另一基于前缀的时间哈希值和另一基于前缀的时间偏移哈希值相匹配的所述基于前缀的时间哈希值和所述基于前缀的时间偏移哈希值的每个数字反映所述实体与所述另一实体的时间接近度的粒度。
18.根据权利要求15所述的计算机程序产品,进一步包括能够由计算机执行以使所述计算机执行以下操作的程序指令:
由所述计算机用所述一个或多个基于前缀的地理空间值和所述一个或多个基于前缀的时间值的位置关系的标识符来对所述知识图中用于来自所述文档的所述实体的所述提及的所述条目进行编码。
19.根据权利要求15所述的计算机程序产品,进一步包括可由计算机执行以使所述计算机执行以下操作的程序指令:
由所述计算机用位置关系的标识符、所述地理空间信息以及所述时间信息来存储所述知识图中用于来自所述文档的所述实体的所述提及的所述条目。
20.根据权利要求15所述的计算机程序产品,进一步包括能够由计算机执行以使所述计算机执行以下操作的程序指令:
由所述计算机在文档语料库中搜索所述实体的一个或多个提及;以及
响应于识别所述文档语料库中具有所述实体的所述提及的文档,由所述计算机在所述特定文档中搜索与所述提及相关联的所述地理空间信息和所述时间信息。
21.一种计算机系统,所述系统包括分别用于执行根据权利要求1-7中的任一项所述的方法的步骤的模块。
CN202010073070.5A 2019-03-30 2020-01-22 用可搜索的地理时间值对知识图条目进行编码以评估实体提及的传递地理时间接近度 Active CN111767407B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/370,968 US11526769B2 (en) 2019-03-30 2019-03-30 Encoding knowledge graph entries with searchable geotemporal values for evaluating transitive geotemporal proximity of entity mentions
US16/370968 2019-03-30

Publications (2)

Publication Number Publication Date
CN111767407A true CN111767407A (zh) 2020-10-13
CN111767407B CN111767407B (zh) 2024-02-09

Family

ID=72606395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010073070.5A Active CN111767407B (zh) 2019-03-30 2020-01-22 用可搜索的地理时间值对知识图条目进行编码以评估实体提及的传递地理时间接近度

Country Status (2)

Country Link
US (2) US11526769B2 (zh)
CN (1) CN111767407B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11526769B2 (en) 2019-03-30 2022-12-13 International Business Machines Corporation Encoding knowledge graph entries with searchable geotemporal values for evaluating transitive geotemporal proximity of entity mentions

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11694115B2 (en) * 2019-05-16 2023-07-04 Royal Bank Of Canada System and method for diachronic machine learning architecture
US11500934B2 (en) * 2020-06-30 2022-11-15 Vesoft. Inc POI recommendation method and device based on graph database, and storage medium
US10877948B1 (en) * 2020-07-01 2020-12-29 Tamr, Inc. Method and computer program product for geospatial binning
US11132364B1 (en) * 2020-07-29 2021-09-28 Sas Institute Inc. Range overlap query response system for graph data
CN112199491B (zh) * 2020-10-14 2022-04-22 中国科学院计算技术研究所厦门数据智能研究院 一种基于bert与先验知识特征的关系五元组抽取方法
US11531664B2 (en) * 2021-01-06 2022-12-20 Google Llc Stand in tables
US11645324B2 (en) * 2021-03-31 2023-05-09 Snap Inc. Location-based timeline media content system
CN116701573A (zh) * 2023-06-06 2023-09-05 哈尔滨理工大学 一种基于时序知识图谱的查询方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7885944B1 (en) * 2008-03-28 2011-02-08 Symantec Corporation High-accuracy confidential data detection
CN102782676A (zh) * 2009-08-11 2012-11-14 惠普开发有限公司 基于地理标记推荐的在线搜索
CN108027817A (zh) * 2015-12-30 2018-05-11 谷歌有限责任公司 基于用户的组关联建议查询

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699663B (zh) 2013-12-27 2017-02-08 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
US10346131B2 (en) * 2016-03-25 2019-07-09 International Business Machines Corporation Spatial predicates evaluation on geohash-encoded geographical regions
US10324973B2 (en) * 2016-06-12 2019-06-18 Apple Inc. Knowledge graph metadata network based on notable moments
US11526769B2 (en) 2019-03-30 2022-12-13 International Business Machines Corporation Encoding knowledge graph entries with searchable geotemporal values for evaluating transitive geotemporal proximity of entity mentions

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7885944B1 (en) * 2008-03-28 2011-02-08 Symantec Corporation High-accuracy confidential data detection
CN102782676A (zh) * 2009-08-11 2012-11-14 惠普开发有限公司 基于地理标记推荐的在线搜索
CN108027817A (zh) * 2015-12-30 2018-05-11 谷歌有限责任公司 基于用户的组关联建议查询

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11526769B2 (en) 2019-03-30 2022-12-13 International Business Machines Corporation Encoding knowledge graph entries with searchable geotemporal values for evaluating transitive geotemporal proximity of entity mentions
US11681927B2 (en) 2019-03-30 2023-06-20 International Business Machines Corporation Analyzing geotemporal proximity of entities through a knowledge graph

Also Published As

Publication number Publication date
US11681927B2 (en) 2023-06-20
CN111767407B (zh) 2024-02-09
US11526769B2 (en) 2022-12-13
US20200311565A1 (en) 2020-10-01
US20200311563A1 (en) 2020-10-01

Similar Documents

Publication Publication Date Title
CN111767407B (zh) 用可搜索的地理时间值对知识图条目进行编码以评估实体提及的传递地理时间接近度
US11550826B2 (en) Method and system for generating a geocode trie and facilitating reverse geocode lookups
US10281284B2 (en) Hybrid road network and grid based spatial-temporal indexing under missing road links
US9031958B2 (en) File searching on mobile devices
CN107026881B (zh) 业务数据的处理方法、装置及系统
US20100287166A1 (en) Method and system for search engine indexing and searching using the index
US8949196B2 (en) Systems and methods for matching similar geographic objects
CN104160394A (zh) 用于半结构化数据的可缩放分析平台
US10659911B1 (en) Deduplication of points of interest (POIs) from different sources
CN105760380A (zh) 数据库查询方法、装置及系统
US9959268B2 (en) Semantic modeling of geographic information in business intelligence
CN111008198B (zh) 业务数据获取方法、装置、存储介质、电子设备
US20140280085A1 (en) Systems and methods for point of interest data ingestion
US20190347335A1 (en) Categorization of websites
JP6484767B1 (ja) Ipアドレスに基づくユーザ属性推定システム
CN116305288B (zh) 一种隔离数据库资源的方法、装置、设备和存储介质
CN110727672A (zh) 数据映射关系查询方法、装置、电子设备及可读介质
US11232135B2 (en) Methods and system of using N-gram analysis to discover points of interest in a given geographic region
US20230102594A1 (en) Code page tracking and use for indexing and searching
Nagireddy Job recommendation system with NoSQL databases: Neo4j, MongoDB, DynamoDB, Cassandra and their critical comparison
CN114297527A (zh) 用户生成内容的推送方法、系统、设备和介质
CN116996995A (zh) 一种位置确定方法、装置、电子设备及存储介质
CN112380222A (zh) 地理空间数据全局唯一标识生成处理方法及装置
CN117762963A (zh) 分页查询的方法、装置、电子设备及介质
CN111104420A (zh) 数据处理方法、系统、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant