CN110399983A - 图形相似度分析 - Google Patents

图形相似度分析 Download PDF

Info

Publication number
CN110399983A
CN110399983A CN201910306083.XA CN201910306083A CN110399983A CN 110399983 A CN110399983 A CN 110399983A CN 201910306083 A CN201910306083 A CN 201910306083A CN 110399983 A CN110399983 A CN 110399983A
Authority
CN
China
Prior art keywords
similarity
information
computer
graphics
information index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910306083.XA
Other languages
English (en)
Other versions
CN110399983B (zh
Inventor
陈品谕
吴凌飞
陈家佑
朱雅达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN110399983A publication Critical patent/CN110399983A/zh
Application granted granted Critical
Publication of CN110399983B publication Critical patent/CN110399983B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/06Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
    • G06F7/20Comparing separate sets of record carriers arranged in the same sequence to determine whether at least some of the data in one set is identical with that in the other set or sets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了促进图形相似度分析的技术。在一个示例中,系统包括信息部件和相似度部件。信息部件生成指示与机器学习系统相关联的第一图形结构化数据集的第一熵测量的第一信息索引。信息部件还生成指示与机器学习系统相关联的第二图形结构化数据集的第二熵测量的第二信息索引。相似度部件基于与第一信息索引和第二信息索引相关联的图形相似度计算来确定第一图形结构化数据集与第二图形结构化数据集之间的相似度。

Description

图形相似度分析
技术领域
本公开涉及数字系统,更具体而言,涉及数据分析系统。
发明内容
以下给出发明内容以提供对本发明的一个或多个实施例的基本理解。本发明内容不旨在标识关键或重要元素,或描绘特定实施例的任何范围或权利要求的任何范围。其唯一目的是以简化形式呈现概念,作为稍后呈现的更详细描述的序言。在本文描述的一个或多个实施例中,描述了促进图形相似度分析的设备、系统、计算机实现的方法、装置和/或计算机程序产品。
根据实施例,一种系统可以包括信息部件和相似度部件。信息部件可以生成指示与机器学习系统相关联的第一图形结构化数据集的第一熵测量的第一信息索引。信息部件还可以生成指示与机器学习系统相关联的第二图形结构化数据集的第二熵测量的第二信息索引。相似度部件可以基于与第一信息索引和第二信息索引相关联的图形相似度计算来确定第一图形结构化数据集与第二图形结构化数据集之间的相似度。
根据另一个实施例,提供了一种计算机实现的方法。该计算机实现的方法可以包括由可操作地耦合到处理器的系统生成指示第一图形结构化数据集的第一熵测量的第一信息索引。该计算机实现的方法还可以包括由系统生成指示第二图形结构化数据集的第二熵测量的第二信息索引。此外,该计算机实现的方法可以包括由系统基于与第一信息索引和第二信息索引相关联的图形相似度计算来确定第一图形结构化数据集与第二图形结构化数据集之间的相似度。该计算机实现的方法还可以包括由系统基于第一图形结构化数据集与第二图形结构化数据集之间的相似度来执行机器学习处理。
根据又一个实施例,一种用于促进图形相似度分析的计算机程序产品可以包括计算机可读存储介质,该计算机可读存储介质中体现有程序指令。程序指令可以由处理器执行并使处理器由处理器生成第一图形数据结构的第一熵测量。程序指令还可以使处理器通过处理器生成第二图形数据结构的第二熵测量。此外,程序指令可以使处理器由处理器基于与第一熵测量和第二熵测量相关联的图形相似度计算来确定第一图形数据结构与第二图形数据结构之间的相似度。程序指令还可以使处理器由处理器基于与第一熵测量和第二熵测量相关联的图形相似度计算来执行机器学习处理。
根据又一个实施例,一种系统可以包括信息部件、相似度部件和分析部件。信息部件可以生成第一图形结构化数据集的第一熵测量并且生成第二图形结构化数据集的第二熵测量。相似度部件可以基于与第一熵测量和第二熵测量相关联的图形相似度计算来确定第一图形结构化数据集与第二图形结构化数据集之间的相似度。分析部件可以基于图形相似度计算来执行与第一图形结构化数据集和第二图形结构化数据集相关联的数据分析。
根据又一个实施例,提供了一种计算机实现的方法。该计算机实现的方法可以包括由可操作地耦合到处理器的系统生成一组信息索引,该组信息索引指示与针对一组图形数据结构的一组顺序改变相关联的一组熵测量。该计算机实现的方法还可以包括由系统基于与该组信息索引相关联的图形相似度计算来确定该组图形数据结构之间的相似度。此外,该计算机实现的方法可以包括由系统基于该组图形数据结构之间的相似度来执行机器学习处理。
附图说明
图1图示了根据本文描述的一个或多个实施例的示例非限制性系统的框图,该系统包括图形相似度部件。
图2图示了根据本文描述的一个或多个实施例的另一个示例非限制性系统的框图,该系统包括图形相似度部件。
图3图示了根据本文描述的一个或多个实施例的又一个示例非限制性系统的框图,该系统包括图形相似度部件。
图4图示了根据本文描述的一个或多个实施例的又一个示例非限制性系统的框图,该系统包括图形相似度部件。
图5图示了根据本文描述的一个或多个实施例的、促进图形相似度分析的示例非限制性系统。
图6图示了根据本文描述的一个或多个实施例的、促进图形相似度分析的另一个示例非限制性系统。
图7图示了根据本文描述的一个或多个实施例的、促进图形相似度分析的又一个示例非限制性系统。
图8图示了根据本文描述的一个或多个实施例的、用于提供图形相似度分析的示例非限制性计算机实现方法的流程图。
图9图示了根据本文描述的一个或多个实施例的、用于提供图形相似度分析的另一个示例非限制性计算机实现方法的流程图。
图10图示了其中可以促进本文描述的一个或多个实施例的示例非限制性操作环境的框图。
图11图示了根据本发明一个或多个实施例的示例非限制性云计算环境的框图。
图12图示了根据本发明一个或多个实施例的示例非限制性抽象模型层的框图。
具体实施方式
以下详细描述仅仅是说明性的,并不旨在限制实施例和/或实施例的应用或使用。此外,无意受前述背景技术或发明内容部分或具体实施方式部分中呈现的任何明示或暗示的信息的约束。
现在参考附图描述一个或多个实施例,其中相同的标号始终用于指相同的元件。在以下描述中,出于解释的目的,阐述了许多具体细节以便提供对一个或多个实施例的更透彻的理解。但是,显而易见的是,在各种情况下,可以在没有这些具体细节的情况下实践一个或多个实施例。
首先应当理解,尽管本公开包括关于云计算的详细描述,但其中记载的技术方案的实现却不限于云计算环境,而是能够结合现在已知或以后开发的任何其它类型的计算环境而实现。
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的交互就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
特征包括:
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理PDA)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
服务模型如下:
软件即服务(SaaS):向消费者提供的能力是使用提供者在云基础架构上运行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
平台即服务(PaaS):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
基础架构即服务(IaaS):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其它基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络部件(例如主机防火墙)可能具有有限的控制权。
部署模型如下:
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全要求、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构。
图形可以是相互关联数据之间的一个或多个关系的表示。例如,图形可以是数据样本、大脑网络的数字版本、在线社交网络、分布式系统等之间的一个或多个关系的表示。常常期望确定多个图形之间的图形相似度以促进与众多图形相关联的技术系统的分析。在一个示例中,可以将图形转换为向量表示以促进图形与被转换为另一个向量表示的另一个图形之间的相似度。但是,量化表示为向量的图形之间的相似度一般而言是困难的和/或计算上昂贵的。此外,表示为向量的图形一般不能用于不同的图形任务。
为了解决这些和/或其它问题,本文描述的实施例包括促进改进的图形相似度分析的系统、计算机实现的方法和计算机程序产品。在实施例中,可以基于指示图形之间的相似度距离的信息距离计算来执行具有改进的处理速度的图形相似度计算。在示例中,图形可以与技术应用相关联,其中技术应用诸如与大脑网络的数字表示相关联的大脑网络分析、动态联网系统中的异常检测、在线图形分析、流式传输数据图形分析、生物网络中的时间分析、图形模式挖掘、图形模式搜索、另一个技术应用等。在一方面,可以为多任务图形挖掘计算信息距离。在另一方面,可以通过跟踪对图形的改变来减少存储器消耗。此外,通过基于信息距离计算执行图形相似度计算,可以降低计算复杂度。在又一方面,可以为一组图形确定与熵测量相关联的信息索引。此外,可以基于该组图形的信息索引来执行图形相似度计算。在另一个实施例中,信息距离可以应用于与图形相关的机器学习系统和/或与图形相关的人工智能系统。照此,可以提高图形之间相似度计算的准确性。在另一个实施例中,可以对一组单图(single graph)或顺序图形改变执行快速图形熵计算。可以基于快速图形熵计算来执行快速图形相似度计算。快速图形相似度计算可以由机器学习系统和/或人工智能系统使用。例如,可以基于快速图形相似度计算来执行空间-时间网络分析。在另一个示例中,可以基于快速图形相似度计算来执行异常检测。在又一个示例中,可以基于快速图形相似度计算来执行图形聚类和/或分类。在某些实施例中,可以采用数据可视化和/或用户交互来促进快速图形相似度计算。因而,可以提高与图形相关联的机器学习处理生成的数据的准确性,可以提高与图形相关联的机器学习处理的质量,可以提高与图形相关联的机器学习处理生成的数据的速度,和/或可以减少使用与图形相关联的机器学习处理来分析数据的成本。此外,可以减少与图形相似度分析相关联的存储器消耗、与图形相似度分析相关联的处理消耗和/或与图形相似度分析相关联的计算复杂度。此外,可以改进与图形相关联的图形相似度分析处理和/或机器学习处理的效率和/或性能。而且,可以改进能够由机器学习系统和/或人工智能系统执行的许多不同的图形任务。
图1图示了根据本文描述的一个或多个实施例的促进图形相似度分析的示例非限制性系统100的框图。在各种实施例中,系统100可以是与诸如但不限于数据分析技术、数据分析学技术、图形数据库技术、图形计算技术、云计算技术、计算机技术、服务器技术、信息技术、机器学习技术、人工智能技术、数字技术和/或其它计算机技术之类的技术相关联的图形相似度分析系统。系统100可以采用硬件和/或软件来解决本质上高度技术性的问题,这些问题不是抽象的并且不能作为人的一组心理行为来执行。另外,所执行的处理中的一些可以由一个或多个专用计算机(例如,一个或多个专用处理单元、具有图形相似度分析部件的专用计算机等)执行,用于执行与图形相似度分析相关的既定任务和/或机器学习。系统100和/或系统的部件可以被用于解决通过上面提到的技术的进步、云计算系统的采用和/或计算机体系架构等产生的新问题。系统100的一个或多个实施例可以为与诸如但不限于数据分析系统、数据分析系统、图形数据库系统、图形计算系统、云计算系统、计算机系统、服务器系统、信息系统、机器学习系统、人工智能系统、数字系统和/或其它系统之类的技术相关联的图形相似度分析系统提供技术改进。系统100的一个或多个实施例还可以通过提高处理单元的处理性能、提高处理单元的处理效率和/或减少处理单元执行图形相似度分析处理的时间量来向与图形相似度分析相关联的处理单元(例如,处理器)提供技术改进。系统100的一个或多个实施例还可以通过提高图形相似度分析系统的处理性能、提高图形相似度分析系统的处理效率、减少图形相似度分析系统所采用的存储器存储和/或降低与图形相似度分析系统相关的计算复杂度来为图形相似度分析系统提供技术改进。在一个示例中,系统100可以与图形相似度分析处理相关联。
在图1所示的实施例中,系统100可以包括图形相似度分析部件102。如图1中所示,图形相似度分析部件102可以包括信息部件104和相似度部件106。图形相似度分析部件102的各方面可以构成在(一个或多个)机器内实现的(一个或多个)机器可执行部件,例如,在与一个或多个机器相关联的一个或多个计算机可读介质(或介质)中实施。当由一个或多个机器(例如,(一个或多个)计算机、(一个或多个)计算设备、(一个或多个)虚拟机等)执行时,这样的(一个或多个)部件可以使(一个或多个)机器执行所描述的操作。在一方面,图形相似度分析部件102还可以包括存储计算机可执行部件和指令的存储器108。此外,图形相似度分析部件102可以包括处理器110,以促进图形相似度分析部件102执行指令(例如,计算机可执行部件和相应指令)。如图所示,在一个或多个实施例中,信息部件104、相似度部件106、存储器108和/或处理器110可以彼此电连接和/或通信耦合。在某些实施例中,图形相似度分析部件102可以与机器学习系统和/或图形数据库系统通信。
图形相似度分析部件102(例如,图形相似度分析部件102的信息部件104)可以接收图形数据112。图形数据112可以指示与组成一个或多个图形的数据元素相关联的信息。图形可以是数据结构(例如,图形结构化数据集),其将数据表示为节点(例如,顶点)的网络,其中节点之间的关系可以表示为连接(例如,边)。图形数据112可以包括与和节点的网络相关联的一个或多个数据结构相关联的信息。此外,在某些实施例中,图形数据112可以包括为与节点的网络相关联的一个或多个数据结构提供属性和/或特性的元数据。照此,图形数据112可以与用于一组图形结构化数据集的数据相关联。在一方面,图形数据112可以包括用于与机器学习系统相关联的一组图形结构化数据集的信息。例如,图形数据112可以包括由机器学习系统处理和/或分析的、用于一组图形结构化数据集的信息。在实施例中,图形数据112可以包括用于一组单图(single graph)的信息。例如,图形数据112可以包括用于与节点和连接的第一网络相关联的第一数据结构的第一信息、用于与节点和连接的第二网络相关联的第二数据结构的第二信息等。在一方面,与该组单图相关联的数据可以是固定的。在另一方面,该组单图可以与用于随时间捕获的图形的一组快照相关联。例如,该组单图可以是随时间的图形序列。照此,该组单图可以与用于图形的顺序网络快照相关联。在一个示例中,该组单图可以与空间-时间数据相关联。在另一个实施例中,图形数据112可以包括用于顺序图形改变的信息。例如,图形数据112可以包括与用于图形或一组图形的图形序列的改变相关联的信息。
信息部件104可以生成与图形数据112相关联的熵数据。例如,信息部件104可以生成指示与用于图形数据112的一组熵测量相关联的一组信息索引的熵数据。熵数据可以是例如图形数据112中包含的平均数据量的测量。此外,熵数据可以是例如图形数据112中包括的数据中的不确定量的测度。在实施例中,信息部件104可以为第一图形结构化数据集生成第一熵测量,信息部件104可以为第二图形结构化数据集生成第二熵测量,等等。例如,信息部件104可以为与图形数据112相关联的第一图形结构化数据集生成指示第一熵测量的第一信息索引,为与图形数据112相关联的第二图形结构化数据集生成指示第二熵测量的第二信息索引,等等。第一熵测量可以是例如第一图形结构化数据集中包含的平均数据量的测量。此外,第一熵测量可以是例如第一图形结构化数据集中包括的数据中的不确定量的测量。此外,第二熵测量可以是例如第二图形结构化数据集中包含的平均数据量的测量。此外,第二熵测量可以是例如第二图形结构化数据集中包括的数据中的不确定量的测量。在一方面,信息部件104可以计算图形数据112中包含的平均数据量。例如,信息部件104可以计算第一图形结构化数据集中包含的平均数据量。此外,信息部件104可以计算第二图形结构化数据集中包含的平均数据量。在某些实施例中,信息部件104可以基于与第一图形结构化数据集相关联的一组顺序改变来更新第一信息索引。附加地或可替代地,信息部件104可以基于与第二图形结构化数据集相关联的一组顺序改变来更新第二信息索引。
相似度部件106可以确定图形数据112中包括的数据之间的相似度。在实施例中,相似度部件106可以基于与第一熵测量和第二熵测量相关联的图形相似度计算来确定第一图形结构化数据集与第二图形结构化数据集之间的相似度。例如,相似度部件106可以基于与第一信息索引和第二信息索引相关联的图形相似度计算来确定第一图形结构化数据集与第二图形结构化数据集之间的相似度。图形相似度计算可以确定例如第一信息索引和第二信息索引之间的信息距离。例如,信息距离可以是与第一信息索引和第二信息索引之间的概率分布相关联的Jensen-Shannon散度测量。在实施例中,相似度部件106可以生成相似度数据114。相似度数据114可以包括与第一图形结构化数据集与第二图形结构化数据集之间的相似度相关联的信息。例如,相似度数据114可以包括与图形相似度计算相关联的信息。在一个示例中,相似度数据114可以包括与第一信息索引和第二信息索引之间的信息距离相关联的信息。在实施例中,信息部件104可以生成第一信息索引和第二信息索引,以促进确定相似度数据114(例如,确定第一图形结构化数据集与第二图形结构化数据集之间的相似度)的减少的存储器消耗和/或降低的计算复杂度。
应该认识到的是,图形相似度分析部件102(例如,信息部件104和/或相似度部件106)执行与图形数据相关联的图形相似度处理和/或图形相似度分析处理,其不能由人类执行(例如,大于单个人类心智的能力)。例如,处理的数据量、数据处理的速度(例如,处理与多方相关联的数据的速度)和/或由图形相似度分析部件102(例如,信息部件104和/或者相似度部件106)处理的数据类型在一定时间段内可以比在同一时间段内由单个人类心智处理的量、速度和数据类型更大、更快和更不同。图形相似度分析部件102(例如,信息部件104和/或相似度部件106)也可以完全朝着执行一个或多个其它功能(例如,完全上电、完全执行等)操作,同时还执行以上参考的与图形数据相关联的图形相似度处理和/或图形相似度分析处理。而且,图形相似度分析部件102(例如,信息部件104和/或相似度部件106)可以确定用户不可能手动获得的信息。例如,包括在相似度数据114中的信息的类型、包括在相似度数据114中的信息的量和/或包括在相似度数据114中的各种信息可以比用户手动获得的信息更复杂。
图2图示了根据本文描述的一个或多个实施例的示例非限制性系统200的框图。为简洁起见,省略了对本文描述的其它实施例中采用的相同元件的重复描述。
系统200包括图形相似度分析部件102。图形相似度分析部件102可以包括信息部件104、相似度部件106、可视化部件202、存储器和/或处理器110。可视化部件202可以促进与由相似度部件106生成的相似度数据114相关联的数据可视化。例如,可视化部件202可以生成与由相似度部件106生成的相似度数据114相关联的视觉数据204。在一方面,相似度数据114可以在显示器上被渲染为一个或多个动态视觉元素,其中可以基于相似度数据114来更改视觉数据204的视觉特点(例如,内容、视觉特性、尺寸、色调、阴影等)。在实施例中,可视化部件202可以促进显示与相似度数据114相关联的信息。例如,可视化部件202可以在显示设备上呈现与相似度数据114相关联的信息。显示设备可以是例如具有显示器的计算设备、计算机、台式计算机、膝上型计算机、监视器设备、智能设备、智能电话、移动设备、手持设备、平板电脑、可穿戴设备、便携式计算设备或与显示器相关联的其它类型的设备。在一方面,可视化部件202可以生成用户界面以用人类可解释的格式显示与相似度数据114相关联的信息的至少一部分。在一个示例中,视觉数据204可以指示与第一图形结构化数据集与第二图形结构化数据集之间的相似度相关联的视觉统计。在一个示例中,视觉数据204可以指示与图形数据112的空间-时间网络诊断相关联的信息。在某些实施例中,可视化部件202可以提供与视觉数据204相关联的用户交互。例如,可视化部件202可以基于用户数据生成视觉数据。用户数据指示由显示设备提供的实时用户反馈。在一个示例中,用户数据可以指示与处理和/或分析相似度数据114的机器学习系统相关联的实时用户反馈。在某些实施例中,用户数据可以促进与图形相似度分析部件102相关联的图形相似度分析处理和/或机器学习处理的修改。例如,可以重复与图形相似度分析部件102相关联的图形相似度分析处理,以基于用户数据改善图形之间的相似度。在另一个示例中,可以重复与图形相似度分析部件102相关联的机器学习处理,以基于用户数据改善与图形相关联的异常检测和/或分类。
图3图示了根据本文描述的一个或多个实施例的示例非限制性系统300的框图。为简洁起见,省略了对本文描述的其它实施例中采用的相同元件的重复描述。
系统300包括图形相似度分析部件102。图形相似度分析部件102可以包括信息部件104、相似度部件106、可视化部件202、分析部件302、存储器和/或处理器110。分析部件302可以采用相似度数据114来执行图形数据112的分析。在实施例中,分析部件302可以基于相似度数据114执行图形数据112的空间-时间分析。在另一个实施例中,分析部件302可以基于相似度数据114执行与图形数据112相关联的异常检测。在又一个实施例中,分析部件302可以基于相似度数据114执行图形数据112的图形聚类和/或分类。在一方面,分析部件302可以采用与和图形数据112相关联的第一信息索引和第二信息索引相关联的图形相似度计算来执行图形数据112的分析(例如,对第一图形结构化数据集和第二个图形结构化数据集的分析)。在另一方面,分析部件302可以采用与图形数据112相关联的第一图形结构化数据集与第二图形结构化数据集之间的相似度用于与机器学习系统相关联的数据的任务相关分析。分析部件302可以使用相似度数据114基于图形数据112的分析来生成分析数据304。分析数据304可以包括例如与和图形数据112和/或相似度数据114相关联的空间-时间分析、异常检测、图形聚类和/或分类相关联的信息。
图4图示了根据本文描述的一个或多个实施例的示例非限制性系统400的框图。为简洁起见,省略了对本文描述的其它实施例中采用的相同元件的重复描述。
系统400包括图形相似度分析部件102。图形相似度分析部件102可以包括信息部件104、相似度部件106、可视化部件202、分析部件302、存储器和/或处理器110。分析部件302可以包括机器学习部件402。机器学习部件402可以执行一个或多个机器学习处理以便于基于相似度数据114分析图形数据112。在实施例中,机器学习部件402可以采用机器学习和/或人工智能原理(例如,机器学习处理)来使用例如相似度数据114学习与图形数据112相关的一个或多个特征和/或信息。在一方面,机器学习部件402可以采用机器学习和/或人工智能原理(例如,机器学习处理)来生成分析数据304。机器学习部件402可以关于明确地或隐含地学习与图形数据112相关的一个或多个特征和/或信息来执行学习。在一方面,机器学习部件402可基于与人工智能原理相关联的分类、相关、推断和/或表达来学习与图形数据112相关的一个或多个特征和/或信息。例如,机器学习部件402可以采用自动分类系统和/或自动分类处理来学习与图形数据112相关的一个或多个特征和/或信息。在一个示例中,机器学习部件402可以采用基于概率和/或统计的分析(例如,将分析实用程序和成本考虑在内)来学习和/或生成关于图形数据112的推断。在一方面,机器学习部件402可以包括推断部件(未示出),其可以进一步增强机器学习部件402的自动化方面,部分地利用基于推断的方案来学习与图形数据112相关的一个或多个特征和/或信息。
机器学习部件402可以采用任何合适的基于机器学习的技术、基于统计的技术和/或基于概率的技术。例如,机器学习部件402可以采用专家系统、模糊逻辑、SVM、隐马尔可夫模型(HMM)、贪婪搜索算法、基于规则的系统、贝叶斯模型(例如、贝叶斯网络)、神经网络、其它非线性训练技术、数据融合、基于效用的分析系统、采用贝叶斯模型的系统等。在另一方面,机器学习部件402可以执行与学习与图形数据112相关的一个或多个特征和/或信息相关联的一组机器学习计算。例如,机器学习部件402可以执行一组聚类机器学习计算、一组逻辑回归机器学习计算、一组决策树机器学习计算、一组随机森林机器学习计算、一组回归树机器学习计算、一组最小二乘机器学习计算、一组基于实例的机器学习计算、一组回归机器学习计算、一组支持向量回归机器学习计算、一组k均值机器学习计算、一组谱聚类机学习计算、一组规则学习机学习计算、一组贝叶斯机器学习计算、一组深Boltzmann机器计算、一组深信念网络计算、和/或一组不同的机器学习计算,以学习与图形数据112相关的一个或多个特征和/或信息。
图5图示了根据本文描述的一个或多个实施例的示例非限制性系统500的框图。为简洁起见,省略了对本文描述的其它实施例中采用的相同元件的重复描述。
系统500包括一组图形502。来自该组图形502的图形可以是数据结构(例如,图形结构化数据集),其将数据表示为节点(例如,顶点)的网络,其中节点之间的关系可以表示为连接(例如,边)。该组图形502可以包括与一个或多个图形相关联的信息。在示例中,该组图形502可以包括用于与第一数据结构相关联的第一图形的第一信息、用于与第二数据结构相关联的第二图形的第二信息,等等。在非限制性示例中,该组图形502可以包括与第一数据网络(例如,与第一大脑网络等对应的第一数据网络)相关联的第一图形,与第二数据网络(例如,与第二大脑网络等对应的第二数据网络)相关联的第二图形。在一方面,可以固定与该组图形502相关联的数据。在另一方面,该组图形502可以与用于随时间捕获的图形的一组快照相关联。例如,该组图形502可以是随时间的图形序列。照此,该组图形502可以与图形的顺序网络快照相关联。在一个示例中,该组图形502可以与空间-时间数据相关联。
该组图形502可以被提供给快速图形熵计算504。快速图形熵计算504可以为该组图形502生成一组信息索引。例如,快速图形熵计算504可以为来自该组图形502的第一图形生成第一信息索引,快速图形熵计算504可以为来自该组图形502的第二图形生成第二信息索引,等等。由快速图形熵计算504生成的信息索引可以是用于来自该组图形502的图形的熵测量。例如,用于来自该组图形502的第一图形的第一信息索引可以是第一图形的第一熵测量,用于来自该组图形502的第二图形的第二信息索引可以是第二图形的第二熵测量。此外,由快速图形熵计算504生成的信息索引可以包括线性计算复杂度。例如,执行快速图形熵计算504以生成信息索引的资源量可以与线性复杂度相关联。
可以基于由快速图形熵计算504生成的该组信息索引来执行快速图形相似度计算506。例如,快速图形相似度计算506可以基于该组信息索引来确定该组图形502之间的相似度。在一方面,快速图形相似度计算506可以基于该组信息索引确定该组图形502之间的信息距离。信息距离可以是例如与该组信息索引之间的概率分布相关联的Jensen-Shannon散度测量。
可以基于快速图形相似度计算506来执行分析处理508。例如,分析处理508可以基于快速图形相似度计算506执行该组图形502的任务相关分析。在一个示例中,分析处理508可以基于快速图形相似度计算506来执行该组图形502的分类。在另一个示例中,分析处理508可以基于快速图形相似度计算506确定与该组图形502相关联的一个或多个预测。在又一个示例中,分析处理508可以基于快速图形相似度计算506来执行与该组图形502相关联的异常检测。在又一个示例中,分析处理508可以基于快速图形相似度计算506来执行该组图形502的空间-时间分析。在又一个示例中,分析处理508可以基于快速图形相似度计算506来执行该组图形502的图形模式匹配和/或图形模式搜索。在实施例中,分析处理508可以执行一个或多个机器学习处理,以基于快速图形相似度计算506分析该组图形502。
在某些实施例中,数据可视化510可以提供与该组图形502相关联的视觉统计。例如,数据可视化510可以提供该组图形的空间-时间网络诊断。附加地或可替代地,数据可视化510可以提供与该组图形502相关联的信息的人类可读解释。在一方面,数据可视化510可以提供与快速图形熵计算504相关联的视觉统计。在另一方面,数据可视化510可以提供与快速图形相似度计算506相关联的视觉统计。在又一方面,数据可视化510可以提供与分析处理508相关联的视觉统计。在某些实施例中,数据可视化510可以促进获得指示与该组图形502、快速图形熵计算504、快速图形相似度计算506和/或分析处理508相关联的实时用户反馈的用户数据。在某些实施例中,可以基于用户数据来修改该组图形502和/或分析处理508。
图6图示了根据本文描述的一个或多个实施例的示例非限制性系统600的框图。为简洁起见,省略了对本文描述的其它实施例中采用的相同元件的重复描述。
系统600包括顺序图形改变602。顺序图形改变602可以包括与图形或一组图形的图形序列的改变相关联的信息。图形可以是数据结构(例如,图形结构化数据集),其将数据表示为节点(例如,顶点)的网络,其中节点之间的关系可以表示为连接(例如,边)。在一方面,与顺序图形改变602相关联的数据可以随时间改变。可以重复报告顺序图形改变602。在非限制性示例中,顺序图形改变602可以与动态系统相关联,例如,在线社交网络、动态网络系统、演进网络或与一个或多个图形相关联的另一个动态系统。
可以将顺序图形改变602提供给快速图形熵计算604。快速图形熵计算604可以为顺序图形变化602生成一组信息索引。例如,快速图形熵计算604可以从顺序图形变化602为第一图形改变生成第一信息索引,快速图形熵计算604可以从顺序图形变化602为第二图形改变生成的第二信息索引,等等。由快速图形熵计算604生成的信息索引可以是用于与顺序图形改变602相关联的图形的熵测量。例如,用于来自顺序图形改变602的第一图形的第一信息索引可以是用于与顺序图形改变602相关联的第一图形的第一熵度量,用于来自顺序图形改变602的第二图形的第二信息索引可以是用于与顺序图形改变602相关联的第二图形的第二熵测量,等等。此外,由快速图形熵计算604生成的信息索引可以包括线性计算复杂度。例如,执行快速图形熵计算604以生成信息索引的资源量可以与线性复杂度相关联。在实施例中,可以基于顺序图形改变602来更新来自该组信息索引的信息索引。例如,可以基于与第一图形相关联的改变来更新用于来自顺序图改变602的第一图形的第一信息索引,可以基于与第二图形相关联的改变来更新用于来自顺序图改变602的第二图形的第二信息索引,等等。
可以基于由快速图形熵计算604生成的该组信息索引来执行快速图形相似度计算606。例如,快速图形相似度计算606可以基于该组信息索引确定顺序图形改变602之间的相似度。在一方面,快速图形相似度计算606可以基于该组信息索引确定顺序图形改变602之间的信息距离。信息距离可以是例如与该组信息索引之间的概率分布相关联的Jensen-Shannon散度测量。
可以基于快速图形相似度计算606来执行分析处理608。例如,分析处理608可以基于快速图形相似度计算606来执行顺序图形改变602的任务相关分析。在一个示例中,分析处理608可以基于快速图形相似度计算606来执行顺序图形改变602的分类。在另一个示例中,分析处理608可以基于快速图形相似度计算606确定与顺序图形改变602相关联的一个或多个预测。在又一个示例中,分析处理608可以基于快速图形相似度计算606来执行与顺序图形改变602相关联的异常检测。在又一个示例中,分析处理608可以基于快速图形相似度计算606来执行顺序图形改变602的空间-时间分析。在又一个示例中,分析处理608可以基于快速图形相似度计算606来执行顺序图形改变602的图形模式匹配和/或图形模式搜索。在实施例中,分析处理608可以执行一个或多个机器学习处理,以基于快速图形相似度计算606分析顺序图形改变602。
在某些实施例中,数据可视化610可以提供与顺序图形改变602相关联的视觉统计。例如,数据可视化610可以提供该组图形的空间-时间网络诊断。附加地或可替代地,数据可视化610可以提供与顺序图形改变602相关联的信息的人类可读解释。在一方面,数据可视化610可提供与快速图形熵计算604相关联的视觉统计。在另一方面,数据可视化610可以提供与快速图形相似度计算606相关联的视觉统计。在又一方面,数据可视化610可以提供与分析处理608相关联的视觉统计。在某些实施例中,数据可视化610可以促进获得指示与顺序图形改变602、快速图形熵计算604、快速图形相似度计算606和/或分析处理608相关联的实时用户反馈的用户数据。在某些实施例中,可以基于用户数据来修改顺序图形改变602和/或分析处理608。
图7图示了根据本文描述的一个或多个实施例的示例非限制性系统700的框图。为简洁起见,省略了对本文描述的其它实施例中采用的相同元件的重复描述。
系统700包括一组图形结构化数据集702a-n。例如,图形结构化数据集702a可以是第一数据结构(例如,第一图形结构化数据集),其将第一数据表示为节点(例如,顶点)的第一网络,其中节点之间的关系可以表示为连接(例如,边)。此外,图形结构化数据集702b可以是第二数据结构(例如,第二图形结构化数据集),其将第二数据表示为节点(例如,顶点)的第二网络,其中节点之间的关系可以表示为连接(例如,边)。该组图形结构化数据集702a-n可以经由快速图形熵计算处理转换成一组信息索引704a-n。例如,用于图形结构化数据集702a的信息索引704a可以是用于图形结构化数据集702a的第一熵度量,用于来自顺序图形改变602的图形结构化数据集702n的信息索引704n可以是用于图形结构化数据集702n的第n个熵测量,等等。在一方面,可以在该组信息索引704a-n之间执行图形相似度计算706。例如,可以在信息索引704a与信息索引704n之间执行图形相似度计算706。在一方面,图形相似度计算706可以通过确定该组信息索引704a-n之间的相似度来确定该组图形结构化数据集702a-n之间的相似度。在实施例中,图形相似度计算706可以确定该组信息索引704a-n之间的信息距离。信息距离可以是例如与该组信息索引704a-n之间的概率分布相关联的Jensen-Shannon散度测量。
此外,机器学习系统708可以基于该组信息索引704a-n执行一个或多个机器学习处理。例如,机器学习系统708可以使用与图形相似度计算706相关联的信息来执行一个或多个机器学习处理。机器学习系统708可以例如基于该组信息索引704a-n之间的图形相似度计算706来执行该组图形结构化数据集702a-n的任务相关分析。在一个示例中,机器学习系统708可以基于该组信息索引704a-n之间的图形相似度计算706来执行该组图形结构化数据集702a-n的分类。在另一个示例中,机器学习系统708可以基于该组信息索引704a-n之间的图形相似度计算706来确定与该组图形结构化数据集702a-n相关联的一个或多个预测。在又一个示例中,机器学习系统708可以基于该组信息索引704a-n之间的图形相似度计算706来执行与该组图形结构化数据集702a-n相关联的异常检测。在又一个示例中,机器学习系统708可以基于该组信息索引704a-n之间的图形相似度计算706来执行该组图形结构化数据集702a-n的空间-时间分析。在又一个示例中,机器学习系统708可以基于该组信息索引704a-n之间的图形相似度计算706来执行该组图形结构化数据集702a-n的图形模式匹配和/或图形模式搜索。
图8图示了根据本文描述的一个或多个实施例的、用于提供图形相似度分析的示例非限制性计算机实现方法800的流程图。在802处,指示第一图形结构化数据集的第一熵测量的第一信息索引由可操作地耦合到处理器的系统(例如,通过信息部件104)生成。第一熵测量可以是例如第一图形结构化数据集中包含的平均数据量的测量。此外,第一熵测量可以是例如第一图形结构化数据集中包括的数据中的不确定量的测量。在实施例中,可以计算第一图形结构化数据集中包含的平均数据量。第一图形结构化数据集可以是第一数据结构(例如,第一图形数据结构),其将第一数据表示为节点(例如,顶点)的第一网络,其中节点之间的关系可以表示为连接(例如,边)。此外,在某些实施例中,第一图形结构化数据集可以与提供第一图形结构化数据集的属性和/或特性的元数据相关联。
在804处,指示第二图形结构化数据集的第二熵测量的第二信息索引由系统(例如,由信息部件104)生成。第二熵测量可以是例如第二图形结构化数据集中包含的平均数据量的测量。此外,第二熵测量可以是例如第二图形结构化数据集中包括的数据中的不确定量的测量。在实施例中,可以计算第二图形结构化数据集中包含的平均数据量。第二图形结构化数据集可以是第二数据结构(例如,第二图形数据结构),其将第二数据表示为节点(例如,顶点)的第二网络,其中节点之间的关系可以表示为连接(例如,边)。此外,在某些实施例中,第二图形结构化数据集可以与提供第二图形结构化数据集的属性和/或特性的元数据相关联。
在806处,由系统(例如,由相似度部件106)基于与第一信息索引和第二信息索引相关联的图形相似度计算来确定第一图形结构化数据集与第二图形结构化数据集之间的相似度。图形相似度计算可以确定例如第一信息索引和第二信息索引之间的信息距离。例如,信息距离可以是与第一信息索引和第二信息索引之间的概率分布相关联的Jensen-Shannon散度测量。
在808处,由系统(例如,由分析部件302和/或机器学习部件402)基于第一图形结构化数据集与第二图形结构化数据集之间的相似度来执行机器学习处理。例如,可以基于与第一信息索引和第二信息索引相关联的图形相似度计算来执行对第一图形结构化数据集和第二图形结构化数据集的分析。机器学习处理可以例如基于与第一信息索引和第二信息索引相关联的图形相似度计算来执行第一图形结构化数据集和第二图形结构化数据集的任务相关分析。在一个示例中,机器学习处理可以基于与第一信息索引和第二信息索引相关联的图形相似度计算来执行第一图形结构化数据集和第二图形结构化数据集的分类。在另一个示例中,机器学习处理可以基于与第一信息索引和第二信息索引相关联的图形相似度计算来确定与第一图形结构化数据集和第二图形结构化数据集相关联的一个或多个预测。在又一个示例中,机器学习处理可以基于与第一信息索引和第二信息索引相关联的图形相似度计算来执行与第一图形结构化数据集和第二图形结构化数据集相关联的异常检测。在又一个示例中,机器学习处理可以基于与第一信息索引和第二信息索引相关联的图形相似度计算来执行第一图形结构化数据集和第二图形结构化数据集的空间-时间分析。在又一个示例中,机器学习处理可以基于与第一信息索引和第二信息索引相关联的图形相似度计算来执行第一图形结构化数据集和第二图形结构化数据集的图形模式匹配和/或图形模式搜索。
在810处,确定与机器学习处理相关联的相似度和/或数据是否满足既定的标准。如果否,那么计算机实现的方法800返回到802。如果是,那么计算机实现的方法800结束。
在某些实施例中,计算机实现的方法800可以包括由系统基于与第一图形结构化数据集相关联的一组顺序改变来更新第一信息索引。附加地或可替代地,在某些实施例中,计算机实现的方法800可以包括由系统基于与第二图形结构化数据集相关联的一组顺序改变来更新第二信息索引。在某些实施例中,计算机实现的方法800可以包括由系统生成指示与第一图形结构化数据集与第二图形结构化数据集之间的相似度相关联的视觉统计的视觉数据。在某些实施例中,计算机实现的方法800可以包括由系统接收指示与机器学习处理相关联的实时用户反馈的用户数据。此外,确定第一图形结构化数据集与第二图形结构化数据集之间的相似度可以包括例如改进机器学习处理。
图9图示了根据本文描述的一个或多个实施例的、用于提供图形相似度分析的示例非限制性计算机实现方法900的流程图。在902处,指示与用于一组图形数据结构的一组顺序改变相关联的一组熵测量的一组信息索引由可操作地耦合到处理器的系统(例如,由信息部件104)生成。该组熵测量可以是例如该组图形数据结构中包含的平均数据量的一个或多个测量。此外,该组熵测量可以是例如该组图形数据结构中包括的数据中的不确定量的度量。在实施例中,可以计算该组图形数据结构中包含的平均数据量。来自该组图形数据结构的图形数据结构可以是数据结构(例如,图形结构化数据集),其将数据表示为节点(例如,顶点)的网络,其中节点之间的关系可以表示为连接(例如,边)。此外,在某些实施例中,该组图形数据结构可以与提供该组图形数据结构的属性和/或特性的元数据相关联。
在904处,由系统(例如,由相似度部件106)基于与该组信息索引相关联的图形相似度计算来确定该组图形数据结构之间的相似度。图形相似度计算可以确定例如该组信息索引之间的一个或多个信息距离。例如,信息距离可以是与该组信息索引之间的一个或多个概率分布相关联的Jensen-Shannon散度测量。
在906处,由系统(例如,由分析部件302和/或机器学习部件402)基于该组图形数据结构之间的相似度来执行机器学习处理。例如,可以基于与该组信息索引相关联的图形相似度计算来执行该组图形数据结构的分析。机器学习处理可以例如基于与该组信息索引相关联的图形相似度计算来执行该组图形数据结构的任务相关分析。在一个示例中,机器学习处理可以基于与该组信息索引相关联的图形相似度计算来执行该组图形数据结构的分类。在另一个示例中,机器学习处理可以基于与该组信息索引相关联的图形相似度计算来确定与该组图形数据结构相关联的一个或多个预测。在又一个示例中,机器学习处理可以基于与该组信息索引相关联的图形相似度计算来执行与该组图形数据结构相关联的异常检测。在又一个示例中,机器学习处理可以基于与该组信息索引相关联的图形相似度计算来执行该组图形数据结构的空间-时间分析。在又一个示例中,机器学习处理可以基于与该组信息索引相关联的图形相似度计算来执行该组图形数据结构的图形模式匹配和/或图形模式搜索。
在908处,确定与机器学习处理相关联的相似度和/或数据是否满足既定的标准。如果否,那么计算机实现的方法900返回到902。如果是,那么计算机实现的方法900结束。
在某些实施例中,计算机实现的方法900可以包括由系统基于与该组图形数据结构相关联的一组顺序改变来更新该组信息索引。在某些实施例中,计算机实现的方法900可以包括由系统生成指示与该组图形数据结构之间的相似度相关联的视觉统计的视觉数据。在某些实施例中,计算机实现的方法900可以包括由系统接收指示与机器学习处理相关联的实时用户反馈的用户数据。此外,确定该组图形数据结构之间的相似度可以包括例如改进机器学习处理。
为了简化解释,计算机实现的方法被描绘和描述为一系列动作。应当理解和认识到,本发明不受所示动作和/或动作次序的限制,例如动作可以以各种次序和/或同时发生,以及与本文未呈现和描述的其它动作一起发生。此外,并非所有示出的动作都是实现根据所公开主题的计算机实现的方法所需的。此外,本领域技术人员将理解并意识到,计算机实现的方法可以替代地经由状态图或事件表示为一系列相互关联的状态。此外,还应当认识到,下文和整个说明书中公开的计算机实现的方法能够存储在制品上,以促进将这种计算机实现的方法传输和传送到计算机。如本文所使用的,术语“制品”旨在涵盖可从任何计算机可读设备或存储介质访问的计算机程序。
而且,因为至少生成信息索引、确定图形结构化数据集之间的相似度和/或执行机器学习处理是从电气和机械部件和电路系统的组合建立的,所以人类无法复制或执行本文公开的与图形相似度分析部件102(例如,信息部件104、相似度部件106、可视化部件202、分析部件302和/或机器学习部件402)相关联的相似度分析处理和/或机器学习处理。例如,人类无法执行图形相似度分析处理、执行机器学习处理等。
为了提供所公开主题的各个方面的上下文,图10以及以下讨论旨在提供其中可以实现所公开主题的各个方面的合适环境的一般描述。图10图示了示例性非限制性操作环境的框图,其中可以促进本文描述的一个或多个实施例。为简洁起见,省略了对本文描述的其它实施例中采用的相同元件的重复描述。
参考图10,用于实现本公开的各个方面的合适操作环境1000还可以包括计算机1012。计算机1012还可以包括处理单元1014、系统存储器1016和系统总线1018。系统总线1018将系统部件(包括但不限于系统存储器1016)耦合到处理单元1014。处理单元1014可以是各种可用处理器中的任何一种。双微处理器和其它多处理器体系架构也可以用作处理单元1014。系统总线1018可以是若干类型的(一种或多种)总线结构中的任何一种,包括使用各种可用总线体系架构的存储器总线或存储器控制器、外围总线或外部总线,和/或本地总线,其中可用总线体系架构包括但不限于工业标准体系架构(ISA)、微通道架构(MSA)、扩展ISA(EISA)、智能驱动电子设备(IDE)、VESA本地总线(VLB)、外围部件互连(PCI)、卡总线、通用串行总线(USB)、高级图形端口(AGP)、Firewire(IEEE 1394)和小型计算机系统接口(SCSI)。
系统存储器1016还可以包括易失性存储器1020和非易失性存储器1022。包含在计算机1012内的元件之间传送信息的基本例程的基本输入/输出系统(BIOS)存储在非易失性存储器1022中,例如在启动期间。计算机1012还可以包括可移动/不可移动、易失性/非易失性计算机存储介质。图10图示了例如盘存储装置1024。盘存储装置1024还可以包括但不限于诸如磁盘驱动器、软盘驱动器、带驱动器、Jaz驱动器、Zip驱动器、LS-100驱动器、闪存卡或记忆棒之类的设备。盘存储装置1024还可以包括与其它存储介质分开或组合的存储介质。为了促进将盘存储装置1024连接到系统总线1018,通常使用可移动或不可移动的接口,诸如接口1026。图10还描绘了充当用户与合适的操作环境1000中描述的基本计算机资源之间的中介的软件。这种软件还可以包括例如操作系统1028。可以存储在盘存储装置1024上的操作系统1028用于控制和分配计算机1012的资源。
系统应用1030利用操作系统1028通过程序模块1032和程序数据1034对资源的管理,例如存储在或者系统存储器1016中或者盘存储装置1024上。应当认识到,本公开可以用各种操作系统或操作系统的组合来实现。用户通过(一个或多个)输入设备1036将命令或信息输入到计算机1012中。输入设备1036包括但不限于诸如鼠标、轨迹球、触控笔、触摸板、键盘、麦克风、操纵杆、游戏手柄、卫星天线、扫描仪、TV调谐卡、数码相机、数码摄像机、网络摄像头等之类的指示设备。这些和其它输入设备经由(一个或多个)接口端口1038通过系统总线1018连接到处理单元1014。(一个或多个)接口端口1038包括例如串行端口、并行端口、游戏端口和通用串行总线(USB)。(一个或多个)输出设备1040使用与(一个或多个)输入设备1036相同类型的端口中的一些端口。因此,例如,USB端口可以用于向计算机1012提供输入,并将信息从计算机1012输出到输出设备1040。提供输出适配器1042以说明存在一些输出设备1040,如监视器、扬声器和打印机,以及需要特殊适配器的其它输出设备1040。作为说明而非限制,输出适配器1042包括视频和声卡,其提供输出设备1040和系统总线1018之间的连接手段。应当注意的是,其它设备和/或设备系统提供输入和输出能力,诸如(一个或多个)远程计算机1044。
计算机1012可以使用到一个或多个远程计算机(诸如(一个或多个)远程计算机1044)的逻辑连接在联网环境中操作。(一个或多个)远程计算机1044可以是计算机、服务器、路由器、网络PC、工作站、基于微处理器的设备、对等设备或其它公共网络节点等,并且通常还可以包括许多或所有相对于计算机1012描述的元件。出于简洁的目的,仅示出了具有(一个或多个)远程计算机1044的存储器存储设备1046。(一个或多个)远程计算机1044通过网络接口1048逻辑连接到计算机1012,然后经由通信连接1050物理连接。网络接口1048涵盖有线和/或无线通信网络,诸如局域网(LAN)、广域网(WAN)、蜂窝网络等。LAN技术包括光纤分布式数据接口(FDDI)、铜分布式数据接口(CDDI)、以太网、令牌环等。WAN技术包括但不限于点对点链路、如综合业务数字网络(ISDN)及其变体的电路交换网络、分组交换网络和数字订户线(DSL)。(一个或多个)通信连接1050是指用于将网络接口1048连接到系统总线1018的硬件/软件。虽然为了说明清楚而在计算机1012内示出了通信连接1050,但是它也可以在计算机1012外部。仅出于示例性目的,用于连接到网络接口1048的硬件/软件还可以包括内部和外部技术,诸如包括常规电话级调制解调器、电缆调制解调器和DSL调制解调器的调制解调器、ISDN适配器和以太网卡。
现在参考图11,其中显示了示例性的云计算环境1150。如图所示,云计算环境1150包括云计算消费者使用的本地计算设备可以与其相通信的一个或者多个云计算节点1110,本地计算设备例如可以是个人数字助理(PDA)或移动电话1154A,台式电脑1154B、笔记本电脑1154C和/或汽车计算机系统1154N。云计算节点1110之间可以相互通信。可以在包括但不限于如上所述的私有云、共同体云、公共云或混合云或者它们的组合的一个或者多个网络中将云计算节点1110进行物理或虚拟分组(图中未显示)。这样,云的消费者无需在本地计算设备上维护资源就能请求云计算环境1150提供的基础架构即服务(IaaS)、平台即服务(PaaS)和/或软件即服务(SaaS)。应该理解的是,图11显示的各类计算设备1154A-N仅仅是示意性的,云计算节点1110以及云计算环境1150可以与任意类型网络上和/或网络可寻址连接的任意类型的计算设备(例如使用网络浏览器)通信。
现在参考图12,其中显示了云计算环境1150(图11)提供的一组功能抽象层。首先应该理解的是,图12所示的部件、层以及功能都仅仅是示意性的,本发明的实施例不限于此。如图12所示,提供下列层和对应功能:
硬件和软件层1260包括硬件和软件部件。硬件部件的示例包括:主机1261;基于RISC(精简指令集计算机)体系架构的服务器1262;服务器1263;刀片服务器1264;存储设备1265;网络和网络部件1266。软件部件的示例包括:网络应用服务器软件1267以及数据库软件1268。
虚拟层1270提供一个抽象层,该层可以提供下列虚拟实体的示例:虚拟服务器1271、虚拟存储1272、虚拟网络1273(包括虚拟私有网络)、虚拟应用和操作系统1274,以及虚拟客户端1275。
在一个示例中,管理层1280可以提供下述功能。资源供应功能1281:提供用于在云计算环境中执行任务的计算资源和其它资源的动态获取;计量和定价功能1282:在云计算环境内对资源的使用进行成本跟踪,并为此提供帐单和发票。在一个示例中,该资源可以包括应用软件许可。安全功能:为云的消费者和任务提供身份认证,为数据和其它资源提供保护。用户门户功能1283:为消费者和系统管理员提供对云计算环境的访问。服务水平管理功能1284:提供云计算资源的分配和管理,以满足必需的服务水平。服务水平协议(SLA)计划和履行功能1285:为根据SLA预测的对云计算资源未来需求提供预先安排和供应。
工作负载层1290提供云计算环境可能实现的功能的示例。在该层中,可提供的工作负载或功能的非限制示例包括:地图绘制与导航1291;软件开发及生命周期管理1292;虚拟教室的教学提供1293;数据分析处理1294;交易处理1295;以及图形相似度分析软件1296。
在任何可能的技术细节结合层面,本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的示例(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如互联网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用互联网服务提供商来通过互联网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参考根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应该理解的是,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其它设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
虽然上面已经在一个和/或多个计算机上运行的计算机程序产品的计算机可执行指令的一般上下文中描述了主题,但是本领域技术人员将认识到本公开也可以与其它程序模块组合实现。一般而言,程序模块包括执行特定任务和/或实现特定抽象数据类型的例程、程序、部件、数据结构等。而且,本领域技术人员将认识到,本发明的计算机实现的方法可以用其它计算机系统配置来实践,包括单处理器或多处理器计算机系统、小型计算设备、大型计算机以及计算机、手持式计算设备(例如,PDA、电话)、基于微处理器的或可编程的消费者或工业电子器件等。所示出的各方面还可以在分布式计算环境中实践,其中任务由通过通信网络链接的远程处理设备执行。但是,本公开的一些(如果不是全部)方面可以在独立计算机上实践。在分布式计算环境中,程序模块可以位于本地和远程存储器存储设备两者当中。
如在本申请中所使用的,术语“部件”、“系统”、“平台”、“接口”等可以指和/或可以包括计算机相关实体或与具有一个或多个具体功能的操作机器相关的实体。本文公开的实体可以是硬件、硬件和软件的组合、软件或执行中的软件。例如,部件可以是但不限于是在处理器上运行的进程、处理器、对象、可执行文件、执行的线程、程序和/或计算机。举例来说,在服务器上运行的应用和服务器都可以是部件。一个或多个部件可以驻留在进程和/或执行的线程内,并且部件可以位于一台计算机上和/或分布在两台或更多台计算机之间。在另一个示例中,相应的部件可以从其上存储有各种数据结构的各种计算机可读介质执行。部件可以经由本地和/或远程进程进行通信,诸如根据具有一个或多个数据分组的信号(例如,来自与本地系统、分布式系统的另一部件交互和/或跨网络(诸如互联网)经由信号与其它系统交互的一个部件的数据)。作为另一个示例,部件可以是具有由电气或电子电路系统操作的机械部件提供的具体功能的装置,其由处理器执行的软件或固件应用操作。在这种情况下,处理器可以在装置的内部或外部,并且可以执行软件或固件应用的至少一部分。作为又一个示例,部件可以是通过没有机械部件的电子部件提供具体功能的装置,其中电子部件可以包括执行至少部分地赋予电子部件的功能的软件或固件的处理器或其它手段。在一方面,部件可经由虚拟机(例如,在云计算系统内)模拟电子部件。
此外,术语“或”旨在表示包含性的“或”而非排他性的“或”。即,除非另有说明或从上下文中清楚,“X采用A或B”旨在表示任何自然的包容性置换。即,如果X采用A;X采用B;或者X采用A和B两者,那么在任何前述情况下都满足“X采用A或B”。而且,在本说明书和附图中使用的冠词“一”和“一个”一般应该被解释为表示“一个或多个”,除非另有说明或从上下文清楚地指向单数形式。如本文所使用的,术语“示例”和/或“示例性”用于表示用作示例、实例或说明。为避免疑义,本文公开的主题不受这些示例的限制。此外,本文描述为“示例”和/或“示例性”的任何方面或设计都不必被解释为比其它方面或设计更优选或更具优势,也不意味着排除本领域普通技术人员已知的等效示例性结构和技术。
当在本说明书中采用时,术语“处理器”可以指基本上任何计算处理单元或设备,包括但不限于单核处理器;具有软件多线程执行能力的单处理器;多核处理器;具有软件多线程执行能力的多核处理器;具有硬件多线程技术的多核处理器;并行平台;以及具有分布式共享存储器的并行平台。此外,处理器可以指被设计为执行本文所述的功能的集成电路、专用集成电路(ASIC)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑控制器(PLC)、复杂可编程逻辑器件(CPLD)、分立的门或晶体管逻辑、分立的硬件部件或其任意组合。另外,处理器可以利用纳米级体系架构,诸如但不限于基于分子和量子点的晶体管、开关和门,以便优化空间使用或增强用户装备的性能。处理器也可以被实现为计算处理单元的组合。在本公开中,诸如“存储”、“存储装置”、“数据存储”、“数据存储装置”、“数据库”之类的术语以及与部件的操作和功能相关的基本上任何其它信息存储部件都被成为“存储器部件”、在“存储器”中实施的实体,或包括存储器的部件。应当认识到,本文描述的存储器和/或存储器部件可以是或者易失性存储器或者非易失性存储器,或者可以包括易失性和非易失性存储器两者。作为说明而非限制,非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除ROM(EEPROM)、闪存,或非易失性随机存取存储器(RAM)(例如,铁电RAM(FeRAM))。易失性存储器可以包括RAM,其可以用作例如外部高速缓冲存储器。作为说明而非限制,RAM可以以多种形式获得,诸如同步RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据速率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、Synchlink DRAM(SLDRAM)、直接Rambus RAM(DRRAM)、直接Rambus动态RAM(DRDRAM)和Rambus动态RAM(RDRAM)。此外,本文公开的系统或计算机实现的方法的存储器部件旨在包括但不限于包括这些和任何其它合适类型的存储器。
以上描述的内容仅包括系统和计算机实现的方法的示例。当然,出于描述本公开的目的,不可能描述部件或计算机实现的方法的每个可想到的组合,但是本领域普通技术人员可以认识到本公开的许多其它组合和置换是可能的。此外,在具体实施方式、权利要求、附录和附图中使用术语“包含”、“具有”、“拥有”等等的范围内,这些术语旨在以与术语“包括”在权利要求中用作过渡词时被解释类似的方式是包含性的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (25)

1.一种系统,包括:
存储器,存储计算机可执行部件;
处理器,执行存储在所述存储器中的计算机可执行部件,其中所述计算机可执行部件包括:
信息部件,生成指示与机器学习系统相关联的第一图形结构化数据集的第一熵测量的第一信息索引、以及指示与所述机器学习系统相关联的第二图形结构化数据集的第二熵测量的第二信息索引;以及
相似度部件,基于与所述第一信息索引和所述第二信息索引相关联的图形相似度计算来确定所述第一图形结构化数据集与所述第二图形结构化数据集之间的相似度。
2.如权利要求1所述的系统,其中所述信息部件基于与所述第一图形结构化数据集相关联的一组顺序改变来更新所述第一信息索引。
3.如权利要求1所述的系统,其中所述第一信息索引与和所述第一图形结构化数据集相关联的第一熵测量对应,并且所述第二信息索引与和所述第二图形结构化数据集相关联的第二熵测量对应。
4.如权利要求1所述的系统,其中所述相似度部件基于所述第一信息索引和所述第二信息索引之间的信息距离来确定所述第一图形结构化数据集与所述第二图形结构化数据集之间的相似度。
5.如权利要求1所述的系统,其中所述计算机可执行部件还包括:
可视化部件,生成指示与所述第一图形结构化数据集与所述第二图形结构化数据集之间的所述相似度相关联的视觉统计的视觉数据。
6.如权利要求5所述的系统,其中所述可视化部件基于指示与所述机器学习系统相关联的实时用户反馈的用户数据来生成所述视觉数据。
7.如权利要求1所述的系统,其中所述计算机可执行部件还包括:
分析部件,采用与所述第一信息索引和所述第二信息索引相关联的所述图形相似度计算来执行对所述第一图形结构化数据集和所述第二图形结构化数据集的分析。
8.如权利要求1所述的系统,其中所述信息部件生成所述第一信息索引和所述第二信息索引,以促进确定第一图形结构化数据集与所述第二图形结构化数据集之间的所述相似度的减少的存储器消耗。
9.一种计算机实现的方法,包括:
由可操作地耦合到处理器的系统生成指示第一图形结构化数据集的第一熵测量的第一信息索引;
由所述系统生成指示第二图形结构化数据集的第二熵测量的第二信息索引;
由所述系统基于与所述第一信息索引和所述第二信息索引相关联的图形相似度计算来确定所述第一图形结构化数据集与所述第二图形结构化数据集之间的相似度;以及
由所述系统基于所述第一图形结构化数据集与所述第二图形结构化数据集之间的所述相似度来执行机器学习处理。
10.如权利要求9所述的计算机实现的方法,还包括:
由所述系统基于与所述第一图形结构化数据集相关联的一组顺序改变来更新所述第一信息索引。
11.如权利要求9所述的计算机实现的方法,其中生成所述第一信息索引包括计算所述第一图形结构化数据集中包含的平均数据量。
12.如权利要求9所述的计算机实现的方法,其中确定所述相似度包括确定所述第一信息索引和所述第二信息索引之间的信息距离。
13.如权利要求9所述的计算机实现的方法,还包括:
由所述系统生成指示与所述第一图形结构化数据集与所述第二图形结构化数据集之间的所述相似度相关联的视觉统计的视觉数据。
14.如权利要求9所述的计算机实现的方法,还包括:
由所述系统接收指示与所述机器学习处理相关联的实时用户反馈的用户数据。
15.如权利要求9所述的计算机实现的方法,其中执行所述机器学习处理包括基于与所述第一信息索引和所述第二信息索引相关联的所述图形相似度计算来执行对所述第一图形结构化数据集和所述第二图形结构化数据集的分析。
16.如权利要求9所述的计算机实现的方法,其中确定所述第一图形结构化数据集与所述第二图形结构化数据集之间的所述相似度包括改进所述机器学习处理。
17.一种促进图形相似度分析的计算机程序产品,所述计算机程序产品包括计算机可读存储介质,所述计算机可读存储介质中实施有程序指令,所述程序指令能够由处理器执行以使所述处理器:
由所述处理器生成第一图形数据结构的第一熵测量;
由所述处理器生成第二图形数据结构的第二熵测量;
由所述处理器基于与所述第一熵测量和所述第二熵测量相关联的图形相似度计算来确定所述第一图形数据结构与所述第二图形数据结构之间的相似度;以及
由所述处理器基于与所述第一熵测量和所述第二熵测量相关联的图形相似度计算来执行机器学习处理。
18.如权利要求17所述的计算机程序产品,其中所述程序指令还能够由所述处理器执行以使所述处理器:
由所述处理器基于与所述第一图形数据结构相关联的一组顺序改变来更新所述第一熵测量。
19.如权利要求17所述的计算机程序产品,其中所述程序指令还能够由所述处理器执行以使所述处理器:
由所述处理器基于所述第一熵测量和所述第二熵测量之间的信息距离确定所述第一图形数据结构与所述第二图形数据结构之间的所述相似度。
20.一种系统,包括:
存储器,存储计算机可执行部件;
处理器,执行存储在所述存储器中的计算机可执行部件,其中所述计算机可执行部件包括:
信息部件,生成第一图形结构化数据集的第一熵测量以及第二图形结构化数据集的第二熵测量;
相似度部件,基于与所述第一熵测量和所述第二熵测量相关联的图形相似度计算来确定所述第一图形结构化数据集与所述第二图形结构化数据集之间的相似度;以及
分析部件,基于所述图形相似度计算来执行与所述第一图形结构化数据集和所述第二图形结构化数据集相关联的数据分析。
21.如权利要求于20所述的系统,其中所述信息部件基于与所述第一图形结构化数据集相关联的一组顺序改变来更新所述第一熵测量。
22.如权利要求21所述的系统,其中所述相似度部件基于所述第一熵测量和所述第二熵测量之间的信息距离来确定所述第一图形结构化数据集与所述第二图形结构化数据集之间的所述相似度。
23.一种计算机实现的方法,包括:
由可操作地耦合到处理器的系统生成一组信息索引,所述一组信息索引指示与针对一组图形数据结构的一组顺序改变相关联的一组熵测量;
由所述系统基于与所述一组信息索引相关联的图形相似度计算来确定所述一组图形数据结构之间的相似度;以及
由所述系统基于所述一组图形数据结构之间的所述相似度来执行机器学习处理。
24.如权利要求23所述的计算机实现的方法,其中确定所述相似度包括确定所述一组信息索引之间的信息距离。
25.如权利要求24所述的计算机实现的方法,还包括:
由所述系统生成指示与所述一组图形数据结构之间的所述相似度相关联的视觉统计的视觉数据。
CN201910306083.XA 2018-04-17 2019-04-17 图形相似度分析 Active CN110399983B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/954,891 US11853713B2 (en) 2018-04-17 2018-04-17 Graph similarity analytics
US15/954,891 2018-04-17

Publications (2)

Publication Number Publication Date
CN110399983A true CN110399983A (zh) 2019-11-01
CN110399983B CN110399983B (zh) 2023-08-18

Family

ID=68161607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910306083.XA Active CN110399983B (zh) 2018-04-17 2019-04-17 图形相似度分析

Country Status (2)

Country Link
US (1) US11853713B2 (zh)
CN (1) CN110399983B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10929722B2 (en) * 2017-05-19 2021-02-23 Nec Corporation Anomaly detection in streaming networks
US11537719B2 (en) * 2018-05-18 2022-12-27 Deepmind Technologies Limited Deep neural network system for similarity-based graph representations
US11100199B2 (en) * 2018-08-30 2021-08-24 Servicenow, Inc. Automatically detecting misuse of licensed software
US10824749B2 (en) * 2018-09-28 2020-11-03 Code 42 Software, Inc. Automatic graph-based detection of unlikely file possession
US11521101B2 (en) * 2018-10-31 2022-12-06 Fair Isaac Corporation Devices and methods for efficient execution of rules using pre-compiled directed acyclic graphs
US11310284B2 (en) 2019-05-31 2022-04-19 Varmour Networks, Inc. Validation of cloud security policies
US11575563B2 (en) * 2019-05-31 2023-02-07 Varmour Networks, Inc. Cloud security management
US11290493B2 (en) 2019-05-31 2022-03-29 Varmour Networks, Inc. Template-driven intent-based security
US11711374B2 (en) 2019-05-31 2023-07-25 Varmour Networks, Inc. Systems and methods for understanding identity and organizational access to applications within an enterprise environment
US11863580B2 (en) 2019-05-31 2024-01-02 Varmour Networks, Inc. Modeling application dependencies to identify operational risk
US11403597B2 (en) * 2019-06-19 2022-08-02 Microsoft Technology Licensing, Llc Contextual search ranking using entity topic representations
US11809986B2 (en) 2020-05-15 2023-11-07 International Business Machines Corporation Computing graph similarity via graph matching
US11876817B2 (en) 2020-12-23 2024-01-16 Varmour Networks, Inc. Modeling queue-based message-oriented middleware relationships in a security system
US11818152B2 (en) 2020-12-23 2023-11-14 Varmour Networks, Inc. Modeling topic-based message-oriented middleware within a security system
US11777978B2 (en) 2021-01-29 2023-10-03 Varmour Networks, Inc. Methods and systems for accurately assessing application access risk
US11734316B2 (en) 2021-07-08 2023-08-22 Varmour Networks, Inc. Relationship-based search in a computing environment
US20230110007A1 (en) * 2021-09-30 2023-04-13 International Business Machines Corporation Assessing if records from different data sources represent a same entity
WO2023228288A1 (ja) * 2022-05-24 2023-11-30 日本電信電話株式会社 検知装置、検知方法、および、検知プログラム

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030115183A1 (en) * 2001-12-13 2003-06-19 International Business Machines Corporation Estimation and use of access plan statistics
CN1841380A (zh) * 2005-03-31 2006-10-04 微软公司 用于改进搜索引擎相关性的数据挖掘技术
US20100034470A1 (en) * 2008-08-06 2010-02-11 Alexander Valencia-Campo Image and website filter using image comparison
US8019748B1 (en) * 2007-11-14 2011-09-13 Google Inc. Web search refinement
CN103314572A (zh) * 2010-07-26 2013-09-18 新加坡科技研究局 用于图像处理的方法和设备
US20140079297A1 (en) * 2012-09-17 2014-03-20 Saied Tadayon Application of Z-Webs and Z-factors to Analytics, Search Engine, Learning, Recognition, Natural Language, and Other Utilities
WO2014080767A1 (ja) * 2012-11-22 2014-05-30 国立大学法人東京大学 多階層網羅的データに基づく細胞内分子間ネットワーク自動推定方法
US20140201126A1 (en) * 2012-09-15 2014-07-17 Lotfi A. Zadeh Methods and Systems for Applications for Z-numbers
US20140321761A1 (en) * 2010-02-08 2014-10-30 Microsoft Corporation Intelligent Image Search Results Summarization and Browsing
CN104756491A (zh) * 2012-11-01 2015-07-01 谷歌公司 基于组合的深度提示从单视场图像生成深度图
CN105144200A (zh) * 2013-04-27 2015-12-09 数据飞讯公司 用于处理非结构化数字的基于内容的检索引擎
US20160247175A1 (en) * 2013-01-04 2016-08-25 PlaceIQ, Inc. Analyzing consumer behavior based on location visitation
CN105917382A (zh) * 2014-01-21 2016-08-31 艾丽卡滑翔有限公司 用于交互式图形流传输的方法和系统
CN105989571A (zh) * 2015-03-19 2016-10-05 英特尔公司 基于使用结构相似性的图像匹配对计算机视觉预处理进行的控制
US20160330066A1 (en) * 2013-04-29 2016-11-10 Moogsoft, Inc. System and methods for decomposing events from managed infrastructures that includes a floating point unit
CN106687952A (zh) * 2014-09-26 2017-05-17 甲骨文国际公司 利用知识源进行相似性分析和数据丰富化的技术
CN106874687A (zh) * 2017-03-03 2017-06-20 深圳大学 病理切片图像智能分类方法及装置
US20170255693A1 (en) * 2016-03-04 2017-09-07 Microsoft Technology Licensing, Llc Providing images for search queries
US20180075369A1 (en) * 2016-09-09 2018-03-15 International Business Machines Corporation Data-driven models for improving products

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6684205B1 (en) * 2000-10-18 2004-01-27 International Business Machines Corporation Clustering hypertext with applications to web searching
US7031523B2 (en) * 2001-05-16 2006-04-18 Siemens Corporate Research, Inc. Systems and methods for automatic scale selection in real-time imaging
US7689559B2 (en) 2006-02-08 2010-03-30 Telenor Asa Document similarity scoring and ranking method, device and computer program product
US8935249B2 (en) 2007-06-26 2015-01-13 Oracle Otc Subsidiary Llc Visualization of concepts within a collection of information
US8194075B2 (en) * 2008-10-01 2012-06-05 International Business Machines Corporation Method and system for generating and displaying an interactive dynamic list view of multiply connected objects
CA2757461C (en) 2009-06-30 2023-05-16 International Business Machines Corporation Graph similarity calculation system, method and program
US20110125764A1 (en) * 2009-11-26 2011-05-26 International Business Machines Corporation Method and system for improved query expansion in faceted search
WO2013054257A1 (en) * 2011-10-09 2013-04-18 The Medical Research, Infrastructure and Health Services Fund of the Tel Aviv Medical Center Virtual reality for movement disorder diagnosis and/or treatment
US9603033B2 (en) 2011-12-31 2017-03-21 International Business Machines Corporation Online and distributed optimization framework for wireless analytics
US9349105B2 (en) * 2013-12-18 2016-05-24 International Business Machines Corporation Machine learning with incomplete data sets
US10305758B1 (en) * 2014-10-09 2019-05-28 Splunk Inc. Service monitoring interface reflecting by-service mode
US9852231B1 (en) * 2014-11-03 2017-12-26 Google Llc Scalable graph propagation for knowledge expansion
EP3101563B1 (en) * 2015-06-05 2018-01-10 Technische Universität Kaiserslautern Automated determination of network motifs
US9576031B1 (en) * 2016-02-08 2017-02-21 International Business Machines Corporation Automated outlier detection
US10673880B1 (en) * 2016-09-26 2020-06-02 Splunk Inc. Anomaly detection to identify security threats

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030115183A1 (en) * 2001-12-13 2003-06-19 International Business Machines Corporation Estimation and use of access plan statistics
CN1841380A (zh) * 2005-03-31 2006-10-04 微软公司 用于改进搜索引擎相关性的数据挖掘技术
US8019748B1 (en) * 2007-11-14 2011-09-13 Google Inc. Web search refinement
US20100034470A1 (en) * 2008-08-06 2010-02-11 Alexander Valencia-Campo Image and website filter using image comparison
US20140321761A1 (en) * 2010-02-08 2014-10-30 Microsoft Corporation Intelligent Image Search Results Summarization and Browsing
CN103314572A (zh) * 2010-07-26 2013-09-18 新加坡科技研究局 用于图像处理的方法和设备
US20140201126A1 (en) * 2012-09-15 2014-07-17 Lotfi A. Zadeh Methods and Systems for Applications for Z-numbers
US20140079297A1 (en) * 2012-09-17 2014-03-20 Saied Tadayon Application of Z-Webs and Z-factors to Analytics, Search Engine, Learning, Recognition, Natural Language, and Other Utilities
CN104756491A (zh) * 2012-11-01 2015-07-01 谷歌公司 基于组合的深度提示从单视场图像生成深度图
WO2014080767A1 (ja) * 2012-11-22 2014-05-30 国立大学法人東京大学 多階層網羅的データに基づく細胞内分子間ネットワーク自動推定方法
US20160247175A1 (en) * 2013-01-04 2016-08-25 PlaceIQ, Inc. Analyzing consumer behavior based on location visitation
CN105144200A (zh) * 2013-04-27 2015-12-09 数据飞讯公司 用于处理非结构化数字的基于内容的检索引擎
US20160330066A1 (en) * 2013-04-29 2016-11-10 Moogsoft, Inc. System and methods for decomposing events from managed infrastructures that includes a floating point unit
CN105917382A (zh) * 2014-01-21 2016-08-31 艾丽卡滑翔有限公司 用于交互式图形流传输的方法和系统
CN106687952A (zh) * 2014-09-26 2017-05-17 甲骨文国际公司 利用知识源进行相似性分析和数据丰富化的技术
CN105989571A (zh) * 2015-03-19 2016-10-05 英特尔公司 基于使用结构相似性的图像匹配对计算机视觉预处理进行的控制
US20170255693A1 (en) * 2016-03-04 2017-09-07 Microsoft Technology Licensing, Llc Providing images for search queries
US20180075369A1 (en) * 2016-09-09 2018-03-15 International Business Machines Corporation Data-driven models for improving products
CN106874687A (zh) * 2017-03-03 2017-06-20 深圳大学 病理切片图像智能分类方法及装置

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
"Visualization of Subtopics of the Thematic Document Collection Using the Context-Semantic Graph", 《IEEE》, pages 47 - 52 *
ALIMEHRI等: "Word ranking in a single document by Jensen–Shannon divergence", 《PHYSICS LETTERS A》 *
ALIMEHRI等: "Word ranking in a single document by Jensen–Shannon divergence", 《PHYSICS LETTERS A》, 28 August 2015 (2015-08-28), pages 1627 - 1632 *
PANAGIOTIS PAPADIMITRIOU等: "Web Graph Similarity for Anomaly Detection", 《HTTP://WWW.RESEARCHGATE.NET/PUBLICATION/22562539》 *
PANAGIOTIS PAPADIMITRIOU等: "Web Graph Similarity for Anomaly Detection", 《HTTP://WWW.RESEARCHGATE.NET/PUBLICATION/22562539》, 20 March 2009 (2009-03-20), pages 2 - 11 *
SHENGHAO LIU等: "SERGE: Successive Event Recommendation Based on Graph Entropy for Event-Based Social Networks", 《IEEE》, pages 3020 - 3030 *
韦丽: "基于HCT索引的图像内容检索系统", 《中国优秀硕士论文电子期刊》, pages 44 - 54 *

Also Published As

Publication number Publication date
US20190317728A1 (en) 2019-10-17
CN110399983B (zh) 2023-08-18
US11853713B2 (en) 2023-12-26

Similar Documents

Publication Publication Date Title
CN110399983A (zh) 图形相似度分析
US11386496B2 (en) Generative network based probabilistic portfolio management
Zheng et al. A primer for agent-based simulation and modeling in transportation applications
Papageorgiou Review study on fuzzy cognitive maps and their applications during the last decade
McNeill IBM and the visual formation of smart cities
CN110688466B (zh) 在用户对话系统中集成多个领域问题解决
US11282005B2 (en) Selecting a plurality of individuals and AI agents to accomplish a task
Brito et al. A conceptual comparison between discrete and continuous simulation to motivate the hybrid simulation methodology
US11688111B2 (en) Visualization of a model selection process in an automated model selection system
US11599823B2 (en) Quantum reinforcement learning agent
US20210065013A1 (en) Transfer learning based on cross-domain homophily influences
Imran et al. Engineering crowdsourced stream processing systems
US20220147816A1 (en) Divide-and-conquer framework for quantile regression
CN116187154A (zh) 使用机器学习用于对气候数据进行建模
Bryndin Collaboration Robots with Artificial Intelligence (AI) as digital doubles of person for communication in public life and space
Martynov et al. Information architecture to support engineering education in the era of industry 4.0
Pillay et al. Exploring graph neural networks for stock market prediction on the jse
US20230244996A1 (en) Auto adapting deep learning models on edge devices for audio and video
Lytchev et al. Integration and Development of Professionally-Oriented Social Network in the Context of the Evolution of the Information Landscape
Aggarwal et al. Pruning deficiency of big data analytics using cognitive computing
Boris et al. Optimal planning and scheduling of information processes during interaction among mobile objects
Lunga et al. The trillion pixel GeoAI challenge workshop
Ibrahim Digital twin technology: A study of differences from simulation modelling and applicability in improving risk analysis.
US11586705B2 (en) Deep contour-correlated forecasting
Wu et al. The construction of smart city community environment under the application of animation immersion technology integrated into southern Fujian Folk Culture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant