CN104636418A - 用于处理数据的方法和系统 - Google Patents

用于处理数据的方法和系统 Download PDF

Info

Publication number
CN104636418A
CN104636418A CN201410643414.6A CN201410643414A CN104636418A CN 104636418 A CN104636418 A CN 104636418A CN 201410643414 A CN201410643414 A CN 201410643414A CN 104636418 A CN104636418 A CN 104636418A
Authority
CN
China
Prior art keywords
spatio
time
temporal event
entity
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410643414.6A
Other languages
English (en)
Inventor
J·J·乔纳斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN104636418A publication Critical patent/CN104636418A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的各实施例涉及用于处理数据的方法和系统。一种实施和使用用于处理数据的技术的包括计算机程序产品的装置和方法。接收第一时空事件观察。接收第二时空事件观察。接收用于与以下各项中的一项或者多项对应的空间的区域和时间的范围的存在的奇特性指示符:第一时空事件观察和第二时空事件观察。使用存在的奇特性指示符来确定第一时空事件观察和第二时空事件观察是否属于相同实体。

Description

用于处理数据的方法和系统
技术领域
本发明涉及数据分析,并且更具体地,涉及空间和时间分析。
背景技术
空间和时间分析学允许实体与空间和时间数据关联。一些空间和时间分析学将空间和时间一般化,例如,被称为SpaceTimeBox(STB)的从空间和时间到特征的转换。STB以具体粒度反映空间区域和时间间隔。任何事件(即,在由其时间和地点所指定的时空中的任何点)可以被指派给至少一个STB。当实体与事件关联时,占据相同STB的其他实体可以被定位。可以使用具有STB的实体的相应STB以及这些实体的任何其他特征(比如长度、车牌号、颜色等)来比较它们。空间和时间的单位大小是基于各种条件被设置的可配置参数。在STB的情境中,一个密度可以是例如610米的空间和15分钟。
存在许多如下情况,在这些情况中,确定两个实体检测(跨不同数据源(也被称为“通道”)被分离或者尽管在时间上分离但来自相同数据源)是否实际上是相同实体将是有利的。当在一些密度之时,STB可以本身被用作用于确定两个观察的实体相同的代理,也存在其中无法应用这一技术的情况。例如,可能难于或者甚至不可能单独地根据STB数据确定是否在出租车背面有各自具有其自己的蜂窝电话的两个人或者是否仅有携带两个蜂窝电话的单个人。类似地,可能有从ATM机前面的空间发射的来自两个蜂窝电话的信号,并且STB的粒度可能不足以说明是否有携带两个蜂窝电话的一个人(即,实体)或者正排队等候的各自具有其自己的蜂窝电话的两个人。因此,存在对用于在此类情形中对实体去歧义(断言相同或者不同)的改进的技术的需要。
发明内容
在本发明的一个实施例中,提供了一种实施和使用用于处理数据的技术的包括计算机程序产品的装置和方法。接收第一时空事件观察。接收第二时空事件观察。接收用于与以下各项中的一项或者多项对应的空间的区域和时间的范围的存在的奇特性指示符:第一时空事件观察和第二时空事件观察。使用存在的奇特性指示符来确定第一时空事件观察和第二时空事件观察是否属于相同实体。
在附图和以下描述中阐明了本发明的一个或者多个实施例的细节。本发明的其他特征和优势将从描述和附图以及从权利要求变得显然。
附图说明
图1示出了根据一个实施例的用于通过使用存在的奇特性来对实体去歧义的实体分析学系统的示例的示意图。
图2示出了根据一个实施例的计算节点的示意性示例。
图3示出了根据一个实施例的用于基于存在的奇特性指示符来对实体去歧义的过程的流程图。
在各个附图中相似标号指示相似元素。
具体实施方式
在此描述的各种实施例归属于用于在其中空间和时间单独地不足以进行这样的确定的情况中对实体去歧义的改进的技术。一些数据源提供具有高度不精确性(有时数千米的潜在误差)的地理空间坐标。其他数据源能够呈现多个审慎实体(例如,红外图像突出显示视野中的仅一个活的热体实体)。通过组合这些类型的数据流,有可能断言各自具有可能的宽泛误差率的两个观察实际上是一个并且相同。以下更详细地说明用于这样做的各种技术。然而,首先将给出几个示例作为引入并且进一步增强对本发明的各种实施例的基本概念的理解以及说明“存在的奇特性”的概念。
示例1:你听到喷气发动机的噪音(观察1),你往上看天空并且看到仅一个喷气式飞机(观察2)。出于本能,你自动地调和这两个观察(知道喷气机制造噪音)并且推断出仅存在一个实体,引擎噪音与该实体关联。这种知道在这一空间中的单个实体的概念在此将被称为“存在的奇特性”。注意,即使在视野中存在鸟、风筝、热气球和喷气机,实体的类别的奇特性也仍将告知观察者噪音是由喷气式飞机制造,因为鸟、风筝和热气球并不制造任何这一种类的噪音。
示例2:在海滩,你向外看海洋并且观察到单个帆船(观察1)。你转移目光了5分钟,并且然后你转回看海洋。在那时你观察到在稍微不同地点的单个帆船(观察2)。由于存在的奇特性,你本能地断言帆船的这两个观察实际上归属于相同帆船(即,单个实体),即使你并未实际看到帆船移动。这是存在的奇特性的另一示例。
示例3:三个室友住在一个房子里。你知道他们中的两个离开度假并且仅一个仍然在房子里(观察1)。房子里的某人正在按TV遥控器上的频道变换器(观察2)。此时,存在的奇特性将使人想到正在改变频道的人是第三个(在家的)人,因此频道改变事件可以被断言为第三个人的事务。
示例4:你接收到具有代表ATM的所在位置的纬度/经度坐标集合的代表ATM刷卡的第一数据记录一(观察1)。你接收到代表由ATM在刷卡时由监控像机拍摄的视频的第二数据记录(观察2)。注意到在刷卡时在视频中仅出现了一个人(存在的奇特性),有理由推断出该ATM事务由在捕获的视频帧中的人(即,单个实体)执行。在另一方面,如果没有存在的奇特性(例如,如果在事务时在捕获的视频帧中出现了三个人,并且他们一起徘徊在ATM),则将没有存在的奇特性并且没有对帧中的哪个实体是实体事务的断言。
所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。
计算机程序指令也可以被加载到计算机、其他可编程数据处理装置或者其他设备上以使得一系列操作步骤在计算机、其他可编程数据处理装置或者其他设备上被执行以产生计算机实施的方法,从而使得在计算机或者其他可编程装置上执行的指令提供用于实施在流程图和/或框图的一个或者多个框中指定的功能/动作的过程。
图1示出了根据一个实施例的用来通过使用存在的奇特性来对实体去歧义的实体分析学系统(100)的示例的示意图。如在图1中可见,系统(100)包括一个或者多个计算节点(10),该一个或者多个计算节点(10)如以下将更详细描述的那样合作以处理在来自一个或者多个数据源(102)的入站消息中接收的数据。每个节点(10)可以是如下独立计算机或者处理器,该独立计算机或者处理器针对由来自数据源(102)的入站消息指定的实体和事件的给定集合贡献于执行在此描述的技术的更大任务。数据源(102)的一些示例包括在小汽车中的报告地理位置和时间的远程信息处理、收集以及报告地理位置和时间的智能电话应用、来自停车场的被设置为随时间从具体位置收集的视频、空间中的对象的空间坐标、海上船舶坐标(AIS)。
节点(10)被连接到共享的关系数据库管理系统(RDBMS)(104),共享的RDBMS(104)可以从节点(10)收集数据以及向节点(10)提供数据。共享的RDBMS(104)仅为用于实体分析学处理和/或运动处理的适当基础的一个示例并且并未旨在于使人想起关于在此描述的本发明的实施例的使用或者功能的范围的任何限制。本发明可以如在此以其他方式描述的那样在没有RDBMS的情况下被体现,例如通过作为替代使用存储装置或者完全存储器中实现方式的备选形式。在包含共享的RDBMS(104)的实施例中,共享的RDBMS(104)可以包含例如关于数据源、观察、实体、特征以及元素的数据。数据源典型地是数据库表、查询、来自记录的系统的提取或者在物理环境中实时发生的事件的传感器。观察典型地在记录在数据源中被添加、改变或者删除时或者在物理事件经由传感器可观察并且可以由一个或者多个记录代表时发生。实体典型地与在数据库表中的记录的特定类型(比如客户主记录或者事务记录)关联,并且可以反映可以随时间通过空间移动并且可以由这样的记录代表的物理对象。特征是关于实体的特定信息片。特征可以由均描述相同事物的方面的一组字段代表。许多字段代表由它们本身代表的特征,但是一些字段可以被分组成更高级别。例如,姓名和邮寄地址典型地包含多个字段或者元素。元素是特征的进一步分解(比如形成典型地址的一部分的邮政编码),并且典型地由表中的字段代表。
通过收集共享的RDBMS(104)中的这一类型的信息,计算节点(10)可以一起工作以断言何时两个观察可以被断言为来自相同实体。可以在去往一个或者多个数据目的地(106)的出站消息中提供这一断言的结果,该出站消息可以被用户定义并且随后例如在做出各种种类的经营决策时被使用。例如,基于实体的确定性知道要在ATM或者TV上登什么广告。数据目的地的示例包括共享的RDBMS(104)、实体分析学产品、用于显示的用户可读的电子表格等。
应当认识到,经营决策仅仅是在其中可以使用在此呈现的技术的领域的一个示例,并且本领域普通技术人员可以容易地想到对实体去歧义的其他备选使用。也应当认识到,尽管在图1中图示了仅一个数据源(102)、一个RDBMS(104)和一个数据目的地(106),但是在现实情境中,可以有在实体分析学系统(100)中包括的多个数据源(102)、多个(或者零个)RDBMS(104)和多个数据目的地(106)。
图2示出了计算节点(10)的示意性示例。计算节点(10)仅仅是适当计算节点的一个示例并且并未旨在于使人想起关于在此描述的本发明的实施例的使用或者功能的范围的任何限制。无论如何,计算节点(10)能够被实现和/或执行在此阐明的功能中的任何功能。在计算节点(10)中有计算设备(12)。公知的计算设备的示例包括但不限于个人计算机系统、服务器计算机系统、瘦客户端、厚客户端、手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、小型计算机系统、大型计算机系统和包括以上系统或者设备中的任何系统或者设备的分布式计算环境等。
可以在计算机系统可执行指令的广义情境(比如由计算机系统执行的程序模块)中描述计算设备(12)。一般而言,程序模块可以包括执行特定任务或者实现特定抽象数据类型的例程、程序、对象、部件、逻辑、数据结构等。计算设备(12)可以被实践于分布式云计算环境中,其中任务由通过通信网络被链接的远程处理设备执行。在分布式云计算环境中,程序模块可以被定位于包括存储器存储设备的远程计算机系统存储介质和本地计算机系统存储介质二者中。
如在图2中所示,计算节点(10)中的计算设备(12)被以通用计算设备的形式示出。计算设备(12)的部件可以包括但不限于一个或者多个处理器或者处理单元(16)、系统存储器(28)和将包括系统存储器(28)的各种系统部件耦合到处理器(16)的总线(18)。
总线(18)代表各种类型的总线结构中的任何总线结构中的一个或者多个总线结构,包括存储器总线或者存储器控制器、外围总线、加速图形端口和使用各种总线架构中的任何总线架构的本地总线或者处理器。通过示例而非限制的方式,此类架构包括工业标准架构(ISA)总线、外围部件互联(PCI)总线、PCI快速总线、无限带宽技术总线、超传输总线和串行ATA(SATA)总线。
计算设备(12)典型地包括各种计算机系统可读介质。此类介质可以是由计算设备(12)可访问的任何可用介质,并且其包括可移除和不可移除的易失性和非易失性介质二者。
系统存储器(28)可以包括非易失性存储器形式的计算机系统可读介质,比如随机访问存储器(RAM)30和/或高速缓存存储器32。计算设备(12)还可以包括其他可移除/不可移除的易失性/非易失性计算机系统存储介质。仅通过示例的方式,存储系统(34)可以被提供用于从不可移除非易失性磁介质(未示出并且典型地被称为“硬驱动”)读取以及向其写入。虽然未示出,但是可以提供用于从可移除非易失性存储介质(例如,“USB快闪驱动”)读取以及向其写入的磁盘驱动和用于从可移除非易失性光盘(比如CD-ROM、DVD-ROM或者其他光介质)读取以及向其写入的光盘驱动。在此类实例中,每一项可以通过一个或者多个数据介质接口被连接到总线(18)。如以下将进一步描绘和描述的,存储器(28)可以包括具有被配置用于执行本发明的实施例的功能的程序模块的集合(例如,至少一个)的至少一个程序产品。
具有程序模块的集合(至少一个)的程序/实用程序(40)可以被存储在存储器(28)以及通过示例而非限制的方式的操作系统、一个或者多个应用程序、其他程序模块和程序数据中。操作系统、一个或者多个应用程序、其他程序模块和程序数据中的每一项或者其一些组合可以包括联网环境的实现方式。程序模块(42)通常执行如在此描述的本发明的实施例的功能和/或方法。计算设备(12)也可以与一个或者多个外部设备(14)(比如键盘、指点设备、显示器24等)、支持用户与计算设备(12)交互的一个或者多个设备和/或支持计算设备(12)与一个或者多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)通信。这样的通信可以经由输入/输出(I/O)接口(22)出现。再次,计算设备(12)可以经由网络适配器(20)与一个或者多个网络(比如局域网(LAN)、通用广域网(WAN)和/或公共网络(例如,因特网))通信。如所描绘的那样,网络适配器(20)经由总线(18)与计算设备(12)的其他部件通信。应当理解,虽然未示出,但是其他硬件和/或软件部件可以连同计算机系统/服务器(12)被使用。示例包括但不限于:微代码、设备驱动器、冗余处理单元、外部盘驱动阵列、RAID系统、带驱动和数据档案存储系统等。
如以上描述的那样,空间和时间可以例如在多个STB之上被一般化,每个STB反映在具体粒度的空间区域和时间间隔,也就是说,STB例如可以被视为具有若干维度,比如经度维度、纬度维度和时间维度。在适合于反映在地球的表面上的实体的一些实施例中,针对观察的事件的STB通过使用地理哈希公共域地理空间量化算法连同简单时间量化算法被创建(参见http://en. wikipedia.org/wiki/Geohash)。STB被表示为字母数字串,其中串的长度代表STB的“粒度”;也就是说,更长的串代表更精确的地理空间区域和时间间隔。这些字母数字串以下将被称为“STB键”。应当注意到,空间和时间可以通过除了字母数字串之外的手段(例如,位向量)被表示,并且本发明并不限于依赖于在此描述的空间和时间表示的形式的实施例。
如以上描述的那样,在一些情况中,即使细粒度的STB(例如,平方米)也可能不足以解析出两个观察是否源自相同实体或者源自不同实体。为了进行这一确定,可以使用观察的附加源,其可以提供允许进行存在的奇特性确定的存在的奇特性指示符,如在以上的引入性实例中讨论的那样。现在将关于在图3中示出的流程图描述用于进行这样的确定的示例性过程。如在图3中可见,过程由接收两个时空事件观察开始(步骤302)。典型地,每个时空事件观察被包含在数据记录中,该数据记录也可以包含关于观察的事件的一些附加信息。每个观察的事件与一个或者多个量化的空间特征和时间特征关联,这些特征可以是可配置的并且可以基于观察的精确性被定义。应当注意到,两个时空事件观察几乎不在相同时间来到,虽然有时它们可以在相同时间来到。最常见地,事件观察在时间上分离,有时甚至相距数年。
接着,接收的时空事件观察被转换为量化的单位的时空(步骤303)。这样的量化的单位的时空的一个示例是以上描述的STB。在一些实施例中,STB可以如以上描述的那样由量化的键(比如字母数字串)表示。接着,针对第一事件和第二事件的量化的单位的时空被相互比较以确定它们是否充分匹配(步骤304)。在一些实施例中,比较可以涉及例如比较与每个时空事件观察关联的经度、维度和时间坐标。在其他实施例中,例如,在量化的键表示STB时,比较可以涉及比较代表相应的量化的单位的时空的量化的键,这可以改进比较的效率。
在步骤304中被认为是“充分比配”的标准可以典型地由用户定义,或者取决于时空事件观察的性质被自动确定。例如,在一些情形中,可以推断出如果在两个时空事件观察与之关联的两个量化的单位的时空之间没有准确匹配,则该两个时空事件观察不可能可以属于相同实体。
然而,也可以由如下情形,在这些情形中,当在两个时空事件观察与之关联的两个量化的单位的时空之间没有准确匹配时,仍然有可能该两个时空事件观察可以属于相同实体。例如,随着事件流逝,实体进入邻近的量化的单位的时空(例如,邻近的STB),在这一情况中,仅沿着时间维度移动。在静止对象的情况中,例如,两个时空事件观察可以具有相同经度和纬度坐标但是不同的时间坐标,从而因此将时空观察置入不同的量化的单位的时空中(因为时间维度在两个时空事件观察之间被改变了)。也可以有如下情形,在两个时空事件观察之间,在这些情形时静止实体的报告的位置似乎改变(例如,由于在被用来确定静止实体的位置的机制中的不准确),或者在这些情形时实体随便漂移或者径直移动。这也可以使得时空事件观察与不同的量化的单位的时空关联,虽然它们可以仍然属于相同实体。因此,重要的是具有对什么被认为是在两个量化的单位的时空之间的“充分匹配”的清楚定义。充分匹配例如可以是准确匹配;其可以是与直接邻近的量化的单位的时空的匹配;其可以是与被定位于几步之外的邻近的量化的单位的时空的匹配;其可以是在某个范围的经度、纬度和/或时间坐标内的匹配等。如本领域技术人员将认识到的,基本上任何类型的匹配标准可以针对什么应当定义在两个量化的单位的时空之间的“充分匹配”而被建立。
如果在针对第一时空事件观察和第二时空事件观察的量化的单位的时空之间不存在充分匹配,则第一时空事件观察和第二时空事件观察分别属于不同实体,并且“不同实体”结果被返回(步骤306),这结束过程(300)。
否则,如果在步骤304中确定在两个量化的单位的时空之间存在充分匹配,则存在两个时空事件观察可以与相同实体或者与两个相异实体有关的可能性。过程因此检查是否存在任何可用的补充的存在的奇特性指示符(步骤310)。此类指示符可以例如包括视觉指示符(如分别在以上的具有喷气式飞机观察以及来自ATM机的视频馈送的示例中)、用于单个实体或者用于其他实体的位置指示符(如分别在具有出城的两个室友和具有在海洋上移动的帆船的示例中)。应当注意到,在一些实施例中,这些存在的奇特性指示符可以与第一时空事件观察和/或第二时空事件观察一起被接收。例如,在穿过水面看着帆船时,观察到了可以被量化的时空事件,而同时在相同观察中注意到在场景中只有单个实体(即,存在的奇特性指示符被包括在时空事件观察中)。在其他实施例中,存在的奇特性指示符可以与第一时空事件观察和/或第二时空事件观察分离地被接收。本领域普通技术人员可以想到许多变型。应当进一步注意到,仅有几个可能的存在的奇特性指示符的示例。相同一般原则适用于可以被用来确定存在的奇特性的任何类型的指示符。
应当注意到,当考虑存在的奇特性时,存在的奇特性指示符可以继承自更早的(在时间上)量化的单位的时空(比如STB)。这一继承机制使得存在的奇特性指示符能够在量化的单位的时空的窗口化(边界)性质之外幸存。通过示例,当没有实体存在于量化的单位的时空中,并且实体之前被检测为进入该空的量化的单位的时空的单一实体,在新的量化的单位的时空中的该实体保持(继承)已经被从之前的量化的单位的时空建立的奇特性状态。作为另一示例,考虑以上具有在两个不同时间的船的观察的示例。当这两个观察可以在不同的量化的单位的时空中被表示时,当在海洋上的不同位置中并且在不同时间进行船的第二观察时,从第一观察可得的存在的奇特性指示符(即,对在海洋上仅有单个船的视觉确定)可以被继承。应当注意到,为了继承运作,在第二观察中必须也有存在的奇特性指示符(即,对在海洋上仅有单个船的视觉确定)。如果第二观察突然地包括许多实体(例如,若干船),则继承将不转移,因为将不可能确定哪个船将继承来自第一观察的性质。
如果在步骤310中确定存在可以与第一时空事件观察和第二时空事件观察关联的可用的存在的奇特性指示符,则这意味着时空事件观察实际上属于相同实体,并且“单个实体”结果被返回(步骤312),这结束过程(300)。在另一方面,如果在步骤310确定没有存在的奇特性指示符,则过程不能推断出两个时空事件观察是否属于一个实体或者属于不同实体。因此,“不确定”结果被返回(步骤314),这结束过程(300)。因此,虽然过程(300)不能在每种情况中确定两个时空事件观察是否可以被断言为来自单个实体或者分离的实体,但是它改进了与如果不使用存在的奇特性信息相比可以将事件和实体断言为相同的频率。
应当注意到,当考虑在两个量化的单位的时空之间的存在的奇特性的“继承”时,重要的是存在一些程度的“查看的连续性”,其可以由查看的连续性指示符表示。例如,如果一个船在24小时时段期间在码头每五分钟被观察到,则可合理地推断出在第一天早8点观察到的船与在第二天早上8点在码头观察到的船相同,并且在两个量化的单位的时空之间继承存在的奇特性是适当的。然而,如果没有查看的连续性指示符,即,在第一天早上8点存在一个观察、在第一天晚上11点存在另一个观察并且在第二天早上8点存在一个观察,则断言在三个观察之间的相同可能是不适当的。也就是说,观察可以可能属于三个不同的船,仅仅偶然看到相同的船在这些时间在码头的相同位置。不可能知道在这些观察之间发生了什么,因为没有查看的连续性指示符。因此,在这样的情形中,在不同的量化的单位的时空之间继承存在的奇特性可能是不适当的。出于这一原因,重要的是在决定是否在两个量化的单位的时空之间继承存在的奇特性指示符时小心谨慎。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在此使用的术语仅是为描述特定实施例的目的而使用,而不是有意来限制本发明的。如于此所使用的,单数形式的"一,"以及"所述"也是用于包括复数形式的,除非上下文清楚地指明的。要进一步理解的是,术语“包含”和/或“包括”(以及相似的术语,例如包括、包含、具有、有等)当使用在说明书中时是开放式的,表明了存在有被陈述的特征、整数、步骤、操作、部分和/或组件,但是不排除存在或者附加有一个或者多个的其它的特征、整数、步骤、操作、部分、组件和/或其组合。
在以下权利要求中的对应的结构、材料、动作和所有工具或者步骤加功能组件的等同物,如果有的话,是认为包括任意的结构、材料、或用于执行功能动作,以及其它的特定主张的被主张元素。本发明的描述被呈现以用于描述和显示的目的,但是不是有意具有排他性或者限制本发明为所公开的形式。很多修改和改变将对于那些本领域的技术人员是明显的,而没有脱离本发明的范围和精神。实施例被选中并被描述是为了更好地说明本发明的规则以及特定的应用,以使得其它的本领域技术人员理解本发明的带有各种修改的各种实施例适用于特定的预期使用。

Claims (9)

1.一种用于处理数据的计算机实施的方法,包括:
接收第一时空事件观察;
接收第二时空事件观察;
接收用于与以下各项中的一项或者多项对应的空间的区域和时间的范围的存在的奇特性指示符:所述第一时空事件观察和所述第二时空事件观察;以及
使用所述存在的奇特性指示符来确定所述第一时空事件观察和所述第二时空事件观察是否属于相同实体。
2.根据权利要求1所述的方法,还包括:
至少部分地基于所述第一时空事件观察和所述第二时空事件观察属于所述相同实体来做出经营决策。
3.根据权利要求1所述的方法,其中所述第一时空观察被存储为第一数据实体记录并且所述第二时空观察被存储为第二数据实体记录。
4.根据权利要求3所述的方法,其中所述存在的奇特性指示符被包含在以下各项中的一项或者多项中:所述第一实体数据记录和所述第二实体数据记录。
5.根据权利要求1所述的方法,其中所述第一时空观察和所述第二时空事件观察中的每一个被表示为可配置的量化的单位的空间和时间。
6.根据权利要求1所述的方法,其中所述存在的奇特性指示符还被用来确定与以下各项之一关联的实体的类别:所述第一事件观察和所述第二事件观察。
7.根据权利要求1所述的方法,其中所述存在的奇特性指示符还伴随有查看的连续性指示符。
8.根据权利要求1所述的方法,其中确定还包括比较与所述第一时空事件观察关联的第一量化的键和与所述第二时空事件观察关联的第二量化的键。
9.一种用于处理数据的计算机系统,包括用于执行根据权利要求1至8中的任何方法的全部步骤的装置。
CN201410643414.6A 2013-11-14 2014-11-07 用于处理数据的方法和系统 Pending CN104636418A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/080,229 US20150134379A1 (en) 2013-11-14 2013-11-14 Singularity of Presence
US14/080,229 2013-11-14

Publications (1)

Publication Number Publication Date
CN104636418A true CN104636418A (zh) 2015-05-20

Family

ID=53044551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410643414.6A Pending CN104636418A (zh) 2013-11-14 2014-11-07 用于处理数据的方法和系统

Country Status (3)

Country Link
US (2) US20150134379A1 (zh)
CN (1) CN104636418A (zh)
CA (1) CA2868336A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239459B (zh) * 2016-03-28 2020-10-02 阿里巴巴集团控股有限公司 实体联系图展示方法及装置
US10162042B1 (en) * 2018-04-20 2018-12-25 Blackberry Limited Methods and devices for coding position in V2X communications
SG11202113325VA (en) * 2020-03-11 2021-12-30 Grabtaxi Holdings Pte Ltd Method of predicting fare and fare prediction data system
CN115147934B (zh) * 2022-09-01 2022-12-23 中科星图股份有限公司 行为分析方法、装置、设备和计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246494A1 (en) * 2010-04-01 2011-10-06 International Business Machines Corporation Space and time for entity resolution
US20130054598A1 (en) * 2011-08-24 2013-02-28 International Business Machines Corporation Entity resolution based on relationships to a common entity
CN103064954A (zh) * 2011-12-30 2013-04-24 微软公司 基于实体的搜索和解析

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6910035B2 (en) * 2000-07-06 2005-06-21 Microsoft Corporation System and methods for providing automatic classification of media entities according to consonance properties
ITMI20071016A1 (it) * 2007-05-19 2008-11-20 Videotec Spa Metodo e sistema per sorvegliare un ambiente
US9569531B2 (en) * 2008-06-23 2017-02-14 Sri International System and method for multi-agent event detection and recognition
US8769022B2 (en) * 2009-08-31 2014-07-01 Qualcomm Incorporated System and method for evaluating outbound messages

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246494A1 (en) * 2010-04-01 2011-10-06 International Business Machines Corporation Space and time for entity resolution
US20130054598A1 (en) * 2011-08-24 2013-02-28 International Business Machines Corporation Entity resolution based on relationships to a common entity
CN103064954A (zh) * 2011-12-30 2013-04-24 微软公司 基于实体的搜索和解析

Also Published As

Publication number Publication date
CA2868336A1 (en) 2015-05-14
US20150134379A1 (en) 2015-05-14
US20150134588A1 (en) 2015-05-14

Similar Documents

Publication Publication Date Title
US20230367809A1 (en) Systems and Methods for Geolocation Prediction
Kaselimi et al. A vision transformer model for convolution-free multilabel classification of satellite imagery in deforestation monitoring
US20230289903A1 (en) Media management system
Ye et al. Developing human-centered urban digital twins for community infrastructure resilience: A research agenda
US10102220B2 (en) Activity based analytics
Dodge A data science framework for movement
US10275838B2 (en) Mapping social media sentiments
CN113487251B (zh) 基于一键式遥感的自然灾害预警与应急响应方法与系统
CN104636418A (zh) 用于处理数据的方法和系统
US20150379344A1 (en) Geographical area condition determination
Wang et al. Adversarial point cloud perturbations against 3D object detection in autonomous driving systems
Blasch et al. Video-based activity analysis using the L1 tracker on VIRAT data
US20170032255A1 (en) Injury risk factor identification, prediction, and mitigation
CN108509502A (zh) 用于基于视觉的监视系统的语音接口
EP3443482A1 (en) Classifying entities in digital maps using discrete non-trace positioning data
EP3828732A2 (en) Method and apparatus for processing identity information, electronic device, and storage medium
Tsou Online analysis process on Automatic Identification System data warehouse for application in vessel traffic service
Feng et al. The design and development of a ship trajectory data management and analysis system based on AIS
Hoffmann et al. Using social media images for building function classification
KR101768914B1 (ko) 지오 태깅 방법, 지오 태깅 장치 및 이를 수행하는 프로그램을 기록하는 기록매체
Yazdi et al. Nemo: An open-source transformer-supercharged benchmark for fine-grained wildfire smoke detection
Wilson et al. Object tracking and geo-localization from street images
Zheng et al. Stripe segmentation of oceanic internal waves in SAR images based on SegNet
KR20230086457A (ko) 화재 감지 시스템의 구축을 위한 전차 장치 및 그 방법
Wang et al. Development of a component-based interactive visualization system for the analysis of ocean data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150520

WD01 Invention patent application deemed withdrawn after publication