CN110297911A - 物联网(iot)计算环境中认知数据管护的方法和系统 - Google Patents

物联网(iot)计算环境中认知数据管护的方法和系统 Download PDF

Info

Publication number
CN110297911A
CN110297911A CN201910211654.1A CN201910211654A CN110297911A CN 110297911 A CN110297911 A CN 110297911A CN 201910211654 A CN201910211654 A CN 201910211654A CN 110297911 A CN110297911 A CN 110297911A
Authority
CN
China
Prior art keywords
data
data flow
new
inconsistent
concepts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910211654.1A
Other languages
English (en)
Other versions
CN110297911B (zh
Inventor
F.富斯科
F.维格利亚图罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN110297911A publication Critical patent/CN110297911A/zh
Application granted granted Critical
Publication of CN110297911B publication Critical patent/CN110297911B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

提供了由处理器在物联网(IoT)计算环境中进行认知数据管护的各种实施例。每个数据流和数据流的映射可以与一个或多个概念以及该一个或多个概念之间的关系相关。可以识别出在用于回答与一个或多个概念相关的时间序列数据的查询的那些数据流之间一个或多个不一致。可以使用经由机器学习操作的推断和推理来校正多个数据流中的那些数据流之间的不一致。

Description

物联网(IOT)计算环境中认知数据管护的方法和系统
技术领域
本发明总体上涉及计算系统,并且更具体地,涉及使用计算处理器的物联网(Internet of Things,IoT)计算环境中的认知数据管护(data curation)的各种实施例。
背景技术
在今天的社会中,消费者、商人、教育工作者和其它人通过各种各样的媒介实时、跨远距离地交流,而且很多时候没有边界或国界。计算机和网络技术的出现使得生活质量的提高成为可能,同时增强了日常活动并简化了信息共享。
计算系统可以包括物联网(IoT),这是使用现有互联网基础设施的分散在全球的计算设备的互连。也就是说,IoT基于这样的理念,即日常对象,不仅仅是计算机和计算机网络,可以是经由IoT通信网络(例如,自组织系统或互联网)可读取、可识别、可定位、可寻址和可控制的。换句话说,IoT可以指类似互联网的结构中唯一可识别的设备及其虚拟表示。随着技术的巨大进步和进步取得成果,对这些系统进行改进以提高效率和改进的需求越来越大。
发明内容
提供了由处理器在物联网(IoT)计算环境中进行认知数据管护的各种实施例。每个数据流和数据流的映射可以与语义知识库的一个或多个概念和该一个或多个概念之间的关系相关。可以识别出在用于回答与一个或多个概念相关的时间序列数据的查询的那些数据流之间的一个或多个不一致。多个数据流中的那些数据流之间的不一致可以使用经由机器学习操作的推断和对语义知识库的推理来校正。
除了前述示例性方法实施例之外,还提供了其它示例性系统和计算机产品实施例,并提供了相关优点。
附图说明
为了容易理解本发明的优点,将通过参考附图中所示的具体实施例来对上面简要描述的本发明进行更具体的描述。应当理解,这些附图示出了本发明的实施例,因此不被认为是对其范围的限制,将通过使用附图以附加的特性和细节来描述和解释本发明,其中:
图1是示出根据本发明实施例的描述示例性计算节点的框图;
图2是示出根据本发明实施例的描述示例性云计算环境的附加框图;
图3是示出根据本发明实施例的描述抽象模型层的附加框图;
图4是示出本发明各个方面之间的描述示例性功能关系的附加框图;
图5是示出根据本发明实施例的描述用于物联网(IoT)计算环境中的认知数据管护的示例性方法的框图/流程图;
图6是示出根据本发明实施例的描述用于IoT计算环境中的认知数据管护的示例性方法的流程图;和
图7是示出根据本发明实施例的描述用于IoT计算环境中的认知数据管护的附加示例性方法的流程图。
具体实施方式
计算系统可以包括称为“云计算”的大规模计算,其中资源可以经由诸如计算机网络的通信系统进行交互和/或访问。资源可以是软件呈现的计算设备、存储设备、应用和/或其它计算机相关设备和/或在一个或多个计算设备(诸如服务器)上执行的服务的模拟和/或仿真。例如,多个服务器可以通信和/或共享信息,该信息可以根据完成所请求的任务所需的处理能力、存储空间和/或其它计算资源的量在服务器之间扩张和/或收缩。“云”一词暗指计算设备、计算机网络和/或在这种布置中交互的其它计算机相关设备之间的互连关系图的云形外观。
物联网(IoT)是一个新兴的计算设备概念,该计算设备可以嵌入到对象中,尤其是电器中,并通过网络连接。IoT网络可以包括一个或多个IoT设备或“智能设备”,它们是物理对象,诸如嵌入有计算设备的电器。启用网络的电器的示例可以包括计算机、智能手机、笔记本电脑、家用电器、音频系统、电视、安全摄像机、安全传感器,以及无数其它示例。这种IoT计算系统可用于能源系统(例如,能源网格)、水网络、交通网络、智能建筑等。
例如,来自互连传感设备的不断增加的数据量有可能将许多行业转变为极其普遍的数据驱动的洞察和决策制定的潜力。在大多数领域中,数据存储在复杂的信息技术(“information technology,IT”)系统中,这些系统1)不是可消耗的格式(例如,不在时间或空间上对齐,并且需要一些非平凡(non-trivial)的组合来产生感兴趣的值),2)不精确(噪声),3)分散在多个数据存储孤岛上,通常彼此隔离(不一致),以及4)难以找到和导航。
因此,数据导航、验证、清理和准备降低了计算效率,并且是一项耗时的任务,这可能会为建立数据驱动的决策支持过程贡献大量努力。此外,由于为决策支持而设计的数据驱动认知系统导致增加的自动化,当数据不一致或错误时,这些认知系统可能会面临增加的风险。IoT设备也容易受到故障、网络攻击和环境变化的影响。
因此,需要为计算系统提供认知数据管护,以便减少建立和维护数据驱动的决策支持系统或其它数据科学操作的努力和成本。在一个方面,本发明提供了由处理器在IoT计算环境中进行认知数据管护。每个数据流和数据流的映射可以与一个或多个概念以及该一个或多个概念之间的关系相关。可以识别出在用于回答与一个或多个概念相关的时间序列数据的查询的那些数据流之间的一个或多个不一致。可以使用经由机器学习操作的推断和推理来校正多个数据流中的那些数据流之间的不一致。
在一个方面,可以通过时间范围接收关于所选概念的时间序列数据的用户查询。对于所请求的概念,可以返回唯一和一致的数据并具有异常标志。为了提供唯一和一致的数据,可以通过利用本体(ontology)关系来识别和解决与查询对象相关的概念相关联的数据流。任何不一致和/或异常可以在多个数据流之间被识别,这些数据流被提供用于通过利用底层推断模型来回答查询。每个底层数据流(例如,为回答查询而提供的多个数据流)和知识库可以经由机器学习操作和推理来校正。
在一个方面,在不一致和异常标志不能被唯一识别和解决的情况下,可以通过扩展和增强数据流和知识库的认知对话操作(例如,交互式认知通信)发送输入请求(例如,向用户)。知识库和数据流可以通过以下方式扩展:a)从用户接收新概念或新的时间序列数据集,b)推断与每个新概念的一个或多个关系,并推断新数据到现有概念的映射,和/或c)通过扩展数据流和知识库的认知对话来请求用户输入,其中新概念或时间序列不能映射到现有知识。
应当注意,如本文所述,术语“认知”(或“认识”)可以关于、存在于或涉及有意识的智力活动,诸如,例如思维、推理或记忆,其可以使用机器学习来执行。在附加方面,认知或“认识”可能是认知的心理过程,包括诸如意识、感知、推理和判断等方面。机器学习系统可使用人工推理来解释来自一个或多个数据源(例如,基于传感器的设备或其它计算系统)的数据,并学习可由机器学习确定和/或导出的主题、概念和/或过程。
在附加方面,认知或“认识”可以指使用机器学习(其可以包括使用基于传感器的设备或包括音频或视频设备的其它计算系统)通过思想、经验和一种或多种感官获取知识和理解的心理动作或过程。认知也可以指识别行为的模式,导致对一个或多个事件、操作或过程的“学习”。因此,随着时间的推移,认知模型可以开发语义标签来应用于观察到的行为,并使用知识域或本体来存储所学习到的观察到的行为。在一个实施例中,该系统在可以从一个或多个事件、操作或过程中学习的内容中提供渐进的复杂性水平。
在附加方面,术语认知可以指认知系统。认知系统可以是专用计算机系统或一组计算机系统,配置有硬件和/或软件逻辑(与软件在其上执行的硬件逻辑相组合)以仿真人类认知功能。这些认知系统应用类似人类的特征来传达和操纵想法,当这些想法与数字计算的固有优势相组合时,可以大规模地以高准确度(例如,在规定的百分比范围内或高于准确度阈值)和弹性来解决问题。认知系统可以执行一个或多个计算机实现的认知操作,这些操作近似人类思维过程,同时使用户或计算系统能够以更自然的方式交互。认知系统可以包括人工智能逻辑,诸如基于自然语言处理(natural language processing,NLP)的逻辑,以及机器学习逻辑,其可以被提供为专用硬件、在硬件上执行的软件或者专用硬件和在硬件上执行的软件的任意组合。认知系统的逻辑可以实现(多个)认知操作,其示例包括但不限于问答、语料库中内容的不同部分内相关概念的识别以及智能搜索算法,诸如互联网网页搜索。
一般来说,这样的认知系统能够执行以下功能:1)导航人类语言和理解的复杂性;2)摄取和处理大量结构化和非结构化数据;3)生成和评估假设;4)权衡和评估仅基于相关证据的响应;5)提供特定情况的建议、见解、估计、确定、评估、计算和指导;6)通过机器学习过程,利用每次迭代和交互来提高知识和学习;7)能够在影响点做出决策(上下文指导);8)按任务、过程或操作的比例缩放;9)扩展和扩大人类的专业知识和认识;10)从自然语言中识别共鸣的、类似人类的属性和特征;11)从自然语言中推导出各种语言特有或不可知的属性;12)记忆和回忆相关数据点(图像、文本、声音)(例如,来自数据点(图像、文本、声音)的高度相关回忆(记忆和回忆);和/或13)利用基于经验模拟人类认识的情境感知操作来预测和感测。
下面将进一步描述本发明的其它方面和伴随的益处。
首先应当理解,尽管本公开包括关于云计算的详细描述,但其中记载的技术方案的实现却不限于云计算环境,而是能够结合现在已知或以后开发的任何其它类型的计算环境而实现。
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的交互就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
特征包括:
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理个人数字助理)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(多租户)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
服务模型如下:
软件即服务(Software as a Service,SaaS):向消费者提供的能力是使用提供者在云基础架构上执行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
平台即服务(Platform as a Service,PaaS):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
基础架构即服务(Infrastructure as a Service,IaaS):向消费者提供的能力是消费者能够在其中部署并执行包括操作系统和应用的任意软件的处理、存储、网络和其它基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络组件(例如主机防火墙)可能具有有限的控制权。
部署模型如下:
私有云:云基础架构单独为某个组织执行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全参数、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构。
现在参考图1,其中显示了云计算节点的一个示例。图1显示的云计算节点10仅仅是适合的云计算节点的一个示例,不应对本发明实施例的功能和使用范围带来任何限制。总之,云计算节点10能够被用来实现和/或执行以上所述的任何功能。
云计算节点10具有计算机系统/服务器12,其可与众多其它通用或专用计算系统环境或配置一起操作。众所周知,适于与计算机系统/服务器12一起操作的计算系统、环境和/或配置的示例包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、10、大型计算机系统和包括上述任意系统的分布式云计算技术环境等等。
计算机系统/服务器12可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括执行特定的任务或者实现特定的抽象数据类型的例程、程序、目标程序、组件、逻辑、数据结构等。计算机系统/服务器12可以在通过通信网络链接的远程处理设备执行任务的分布式云计算环境中实现。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
如图1所示,云计算节点10中的计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型工业标准结构(Enhanced ISA,EISA)总线、视频电子标准协会(Video ElectronicsStandards Association,VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnects,PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是能够被计算机系统/服务器12访问的任意可获得的介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例CD-ROM,DVD-ROM如或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。将如下文进一步描述的,系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(local area network,LAN),广域网(wide area network,WAN)和/或公共网络,例如互联网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,其它硬件和/或软件模块可以与计算机系统/服务器12一起操作,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
现在参考图2,其中显示了示例性的云计算环境50。如图所示,云计算环境50包括云计算消费者使用的本地计算设备可以与其相通信的一个或者多个云计算节点10,本地计算设备例如可以是个人数字助理(PDA)或移动电话54A,台式电脑54B、笔记本电脑54C和/或汽车计算机系统54N。云计算节点10之间可以相互通信。可以在包括但不限于如上所述的私有云、共同体云、公共云或混合云或者它们的组合的一个或者多个网络中将云计算节点10进行物理或虚拟分组(图中未显示)。这样,云的消费者无需在本地计算设备上维护资源就能请求云计算环境50提供的基础架构即服务(IaaS)、平台即服务(PaaS)和/或软件即服务(SaaS)。应当理解,图2显示的各类计算设备54A-N仅仅是示意性的,云计算节点10以及云计算环境50可以与任意类型网络上和/或网络可寻址连接的任意类型的计算设备(例如使用网络浏览器)通信。
现在参考图3,其中显示了云计算环境50(图2)提供的一组功能抽象层。首先应当理解,图3所示的组件、层以及功能都仅仅是示意性的,本发明的实施例不限于此。如图3所示,提供下列层和对应功能:
设备层55包括嵌入有和/或独立的电子器件、传感器、致动器和其它对象的物理和/或虚拟设备,以在云计算环境50中执行各种任务。设备层55中的每个设备将网络能力结合到其它功能抽象层,使得从设备获得的信息可以被提供给其它功能抽象层,和/或来自其它抽象层的信息可以被提供给设备。在一个实施例中,包括设备层55在内的各种设备可以结合被统称为“物联网”(IoT)的实体网络。如本领域普通技术人员将理解的,这样的实体网络允许数据的相互通信、收集和传播以实现多种目的。
如图所示的设备层55包括传感器52;致动器53;具有集成处理、传感器和网络电子器件的“学习”恒温器(thermostat)56;照相机57;可控家用插座58和可控电气开关59,如图所示。其它可能的设备可以包括但不限于各种附加传感器设备、网络设备、电子设备(诸如遥控设备)、附加致动器设备,所谓的“智能”电器,诸如冰箱或洗衣机/烘干机,以及种类繁多的其它可能的互连对象。
硬件和软件层60包括硬件和软件组件。硬件组件的示例包括:大型机61;基于RISC(Reduced Instruction Set Computer,精简指令集计算机)结构的服务器62;服务器63;刀片服务器64;存储设备65;以及网络和网络组件66。在一些实施例中,软件组件包括网络应用服务器软件67和数据库软件68。
虚拟层70提供一个抽象层,该层可以提供下列虚拟实体的示例:虚拟服务器71、虚拟存储72、虚拟网络73(包括虚拟私有网络)、虚拟应用和操作系统74,以及虚拟客户端75。
在一个示例中,管理层80可以提供下述功能:资源供应功能81:提供用于在云计算环境中执行任务的计算资源和其它资源的动态获取;计量和定价功能82:在云计算环境内对资源的使用进行成本跟踪,并为此提供帐单和发票。在一个示例中,该资源可以包括应用软件许可。安全功能:为云的消费者和任务提供身份认证,为数据和其它资源提供保护。用户门户功能83:为消费者和系统管理员提供对云计算环境的访问。服务水平管理功能84:提供云计算资源的分配和管理,以满足必需的服务水平。服务水平协议(SLA)计划和履行功能85:为根据SLA预测的对云计算资源未来需求提供预先安排和供应。
工作负载层90提供云计算环境可能实现的功能的示例。在该层中,可提供的工作负载或功能的示例包括:地图绘制与导航91;软件开发及生命周期管理92;虚拟教室的教学提供93;数据分析处理94;交易处理95;以及,在本发明所示实施例的上下文中,各种认知数据管护工作负载和功能96。此外,认知数据管护工作负载和功能96可以包括诸如数据分析,数据分析法以及如将进一步描述的通知功能的操作。本领域普通技术人员将理解,认知数据管护工作负载和功能96也可以与各种抽象层的其它部分结合工作,诸如与硬件和软件60、虚拟70、管理80和其它工作负载90(诸如例如数据分析处理94)中的那些结合工作,以实现本发明所示实施例的各种目的。
如前所述,所示实施例的机制为IoT计算环境中的认知数据管护提供了新颖的方法。现在转到图4,示出了描述根据所示实施例的各种机制的示例性功能组件400的框图。图4示出了根据本技术的示例的在诸如计算环境402的计算环境中的认知数据管护工作负载和功能以及机器学习模型的训练。如将看到的,功能框中的许多也可以被视为功能的“模块”或“组件”,其描述意义与先前在图1-图3中描述的相同。考虑到上述内容,模块/组件框400还可以被结合到根据本发明的用于认知数据管护的系统的各种硬件和软件组件中。功能框400中的许多可以作为后台进程在分布式计算组件中或在用户设备上或其它地方的各种组件上执行。再次示出了计算机系统/服务器12,其结合了处理单元16和存储器28,以根据本发明的各个方面执行各种计算、数据处理和其它功能。
系统400可以包括计算环境402、认知数据管护系统430、一个或多个IoT设备450(例如IoT传感器设备)和一个或多个设备,诸如例如设备420(例如台式计算机、膝上型计算机、平板电脑、智能手机和/或可以具有一个或多个处理器和存储器的另一个电子设备)。设备420、IoT设备450、认知数据管护系统430和计算环境402可以通过一种或多种通信方法(诸如计算网络)来彼此关联和/或通信。在一个示例中,设备420、IoT设备450和/或认知数据管护系统430可以由与计算环境402相关联的所有者、客户或技术人员/管理员控制。在另一示例中,设备420、IoT设备450和/或认知数据管护系统430可以完全独立于计算环境402的所有者、客户或用户。
在一个方面,计算环境402可以向设备420和/或IoT设备450提供虚拟化计算服务(即,虚拟化计算、虚拟化存储、虚拟化网络等)。更具体地,计算环境402可以提供虚拟化计算、虚拟化存储、虚拟化联网和在硬件衬底上执行的其它虚拟化服务。
如图4所示,计算环境402可以包括机器学习组件406、与机器学习组件406相关联的知识域组件404以及认知数据管护系统430。知识域组件404还可以包括本体、知识库、数据映射和/或认知数据管护系统430和/或与IoT设备450相关联的其它数据。
知识域组件404可以是概念,概念之间的关系,机器学习数据,特征,参数,数据,简档数据,历史数据,经测试和验证的数据,或用于测试、监测、验证、检测、学习、分析、监测和/或维护数据的其它指定/定义的数据,认知数据管护系统430中的概念,和/或概念之间的关系的组合。更具体地,知识域组件404可以包括表示数据、数据流、语义概念以及到每个数据流的映射的一个或多个数据模型。
计算环境402还可以包括计算机系统12,如图1所示。计算机系统12还可以包括诊断组件410、数据完成组件435和/或认知对话组件440,每个组件都与机器学习组件406相关联,其中,该机器学习组件406用于训练和学习一个或多个机器学习模型,并且还用于将与一个或多个概念和概念之间的关系或其组合相关的推断和/或推理应用于认知数据管护系统430中的认知数据管护的机器学习模型。
在一个方面,机器学习组件406可以包括推理和推断组件408,用于认知地推断和/或推理认知数据管护系统430中的一个或多个概念之间的关系和映射。机器学习组件406还可以包括和/或使用表示数据、数据流、语义概念和到每个数据流的映射的一个或多个数据模型。另外,推理和推断组件408可以推断新概念和该一个或多个概念之间的关系和映射。在附加方面,认知数据管护系统可以使用机器学习组件406来对用于处理一个或多个用户查询以及用于检测和/或解决数据不一致所需要的数据流进行推断。
诊断组件410可以识别用于回答与一个或多个概念相关的时间序列数据的查询的多个数据流中的那些数据流之间的不一致和/或异常。
数据完成组件435可以使用机器学习组件406以及推理和推断组件408中的一个来推理和校正数据流(其可以包括不一致),并且还可以用于扩展和增强知识域组件404(例如,扩展知识库)。
认知对话组件440可用于启用和驱动可能需要输入的用户交互。也就是说,认知对话组件440可以(例如,从可能具有图形用户界面422“GUI”的设备420)请求和接收新的数据流和概念,以解决无法识别或解决的不一致和异常标志。
此外,设备420可以包括图形用户界面(graphical user interface,GUI)422,其能够在设备420上显示用于用户与GUI 422交互的一个或多个用户界面控件。例如,GUI 422可以显示具有用于从用户检索附加输入的问题和/或回答的交互式对话。例如,GUI 422可以可听地和/或可视地指示或显示问题“哪个数据是异常的:Y1或Y2?”,“数据流G3(Y)表示了什么概念?”,和一个陈述“回答:将W与G3(Y)连接起来”的回答。
机器学习组件406可以使用各种各样的方法组合来应用一个或多个启发式和基于机器学习的模型,诸如有监督的学习、无监督的学习、时间差学习(temporal differencelearning)、强化学习等。可以与本技术一起使用的有监督的学习的一些非限制性示例包括AODE(averaged one-dependence estimators,平均单依赖估计器)、人工神经网络、反向传播、贝叶斯统计、朴素贝叶斯分类器、贝叶斯网络、贝叶斯知识库、基于案例的推理、决策树、归纳逻辑编程、高斯过程回归、基因表达式编程、数据处理分组方法(group method ofdata handling,GMDH)、学习自动机、学习向量量化、最小消息长度(决策树、决策图等)、懒惰学习、基于实例的学习、最近邻算法、类比建模、可能近似正确的(probablyapproximately correct,PAC)学习、降纹波规则、知识获取方法、符号机器学习算法、子符号机器学习算法、支持向量机、随机森林、分类器集合、引导聚合(bootstrap aggregating,bagging)、boosting(元算法)、顺序分类、回归分析、信息模糊网络(information fuzzynetworks,IFN)、统计分类、线性分类器、费希尔线性判别、逻辑回归、感知器、支持向量机、二次分类器、k-最近邻、隐马尔可夫模型和boosting。可以与本技术一起使用的无监督的学习的一些非限制性示例包括人工神经网络、数据聚类、期望最大化、自组织映射、径向基函数网络、矢量量化、生成地形图、信息瓶颈方法、IBSEAD(distributed autonomous entitysystems based interaction,基于交互的分布式自治实体系统)、关联规则学习、apriori算法、eclat算法、FP增长算法、分层聚类、单链接聚类、概念聚类、分区聚类、K均值算法、模糊聚类和强化学习。时间差学习的一些非限制性示例可以包括Q学习和学习自动机。关于本段中描述的任何有监督的、无监督的、时间差异或其它机器学习的示例的具体细节是已知的,并且被认为在本公开的范围内。
现在转向图5,描述了与IoT计算环境中的认知数据管护相关的示例性功能500的框图。如图所示,各种功能框利用箭头来描述,箭头指示框500彼此之间的关系并示出处理流程。另外,还可以看到与每个功能框500相关的描述性信息。如将看到的,功能框中的许多也可以被视为功能的“模块”,其描述意义与先前在图4中描述的相同。考虑到上述内容,功能框500还可以被结合到根据本发明的用于图像增强的系统的各种硬件和软件组件中,诸如例如图4的硬件和软件组件中。功能框500中的许多可以作为后台进程在分布式计算组件中或在用户设备上或其它地方的各种组件上执行。
从框502开始,可以接收对概念“X”的时间序列数据的查询。在框504中,可以识别一个或多个相关数据流。可以从数据“Y”到概念X搜索所有数据流。可以诊断(例如,确定或检测)任何不一致,如框506中所示。也就是说,可以检测异常数据流,可以识别异常的源,并且可以标志异常。移至框508,可以对任何不一致执行数据完成操作。数据中的间隙可以用概念和数据映射来填补。异常数据可以被内插。对于那些无法校正的不一致,可以删除异常标志。
结合和/或并行于数据完成的操作,可以执行用户对话来接收附加的输入/信息(例如,在没有足够的知识来推断或校正数据的情况下),如框510中所示。也就是说,可以从用户提供或接收一系列问题和响应。例如,类似于图4的示例,用户对话可以包括问题“哪个数据异常:Y1还是Y2?”,“未知异常?什么标志?”,“数据流G3(Y)表示了什么概念?”和陈述“回答:将W与G3(Y)连接起来”的回答。可以提供任何更新的知识来进一步完成数据完成操作。从框508,移除的和/或校正的数据可以被提供给框506。如框512中所示,可以提供一致的回答(例如,用于提供回答的经解析和校正的数据流)来回答概念X。在一个方面,框512还可以不提供回答和/或提供一系列异常标志。
考虑以下其它方面。例如,考虑用于电力设施的数据处理系统,该系统包括由概念“传感器”、“服务点”、“变电站”、“配电设施”、“状态”、“能量需求”、“太阳能发电”和“连接到……”、“……的部分”和/或“具有……”的关系定义的语义模型。数据流可以包括:传感器处的计量数据、根据传感器数据产生特征的分析过程,以及根据传感器数据和特征产生其它量的估计的分析过程,诸如例如预测模型。也可能有语义概念和到数据流的映射的实例。
假设用户在查询中请求“8月10日12:00在配电设施上的分布式可再生发电总量”。所示实施例的机制可以检索回答查询的多个数据流(例如,在GraphDB中搜索)诸如,例如:a)连接到变电站、设施部分的所有服务点计量风力发电的总和;b)连接到变电站、设施部分(设施的电力负载)的所有监控和数据采集(“supervisory control and dataacquisitions,SCADA”)仪表的组合减去电力需求机器学习模型的输出;和/或c)使用天气(风)数据特征的风力发电机器学习模型的输出。本发明可以估计b)和c)在统计上是相同的,而a)是不一致的,其中标志“缺少可再生贡献(contribution)”。因此,可以执行推断(例如,在数据的联合密度模型上),可以从推断结果中产生异常特征(signature)(例如,使用残差),和/或可以将一组异常特征分类为已知的异常标志。在一个方面,推断模型可以是数据Y=f(x)+e的潜在变量模型,其中用于残差分析的模型反演和故障诊断技术可以检测和/或解决数据不一致。
结果,在移除数据流之后,作为推断模型的结果,可以返回和/或提供唯一的估计,并且可以标志数据流(例如,缺少风力贡献)。
作为附加示例,考虑同样的查询,其中数据流被标志为“不一致”,特别是“缺少风力发电”。在一个方面,本发明可以包含可能适合于正确回答查询的未标记数据。本发明可以通过无监督的学习算法(例如,k-最近邻)检测任何可以映射到感兴趣实体的未标记数据。一旦该实体的数据被正确标记,正确标记的数据可以被用来试图校正数据流中的任何间隙。
此外,在没有未标记的数据可用于填充和/或校正数据流中的间隙的情况下,给定上下文信息(例如,时间序列/数据的类型)和部分可用数据,本发明可以估计存在间隙的数据(内插、外推/预测)。本发明可以知道数据流中的间隙是什么。然而,一个或多个先前的选项能够用来修复不一致。用户可以上传缺少的信息(例如,新风力发电机的数据)。本发明可以将标志改变为已解析和/或保持其未解析,可能包括对其无法解析的原因的解释。
在附加实施例中,考虑一种用于电力设施的数据处理系统,该系统具有由诸如,例如:“传感器”、“服务点”、“变电站”、“配电设施”、“状态”、“能量需求”、“太阳能发电”的概念,以及这些概念之间的关系,诸如“连接到……”、“……的部分”、“具有……”等定义的语义模型。每个概念可以由一组属性定义。用户可以将新概念添加到由一组属性定义的数据模型中,这些属性可以是“能源供应”和值“太阳能”。所示实施例的机制通过自动关系发现实现扩展。基于规则的分类操作可用于提取规则,这些规则解释给定实体的某些属性(如果存在的话)的实体关系的存在。给定语义模型,基于规则的操作可以根据,例如,如果/那么关系成立,诸如例如,如果[“能源供应”=“太阳能”],那么该关系是“可再生能源”,来确定和/或学习规则。基于可以从经验中学习的一个或多个规则,本发明可以为该概念添加一种关系,诸如例如“可再生能源”。应该注意的是,一个或多个查询,诸如例如,“配电设施的总可再生发电”可能能够在响应查询中导出映射到太阳能的数据流,这是系统以前不知道的。
现在转向图6,描述了用于物联网(IoT)计算环境中的认知数据管护的方法600,其中可以实现所示实施例的各个方面。功能600可以被实现为作为机器上的指令执行的方法,其中指令被包括在至少一个计算机可读介质上或非暂时性机器可读存储介质上。功能600可以在框602中开始。每个数据流和数据流的映射可以与一个或多个概念以及一个或多个概念之间的关系相关,如框604中所示。如框606中所示,可以识别出在用于回答与一个或多个概念相关的时间序列数据的查询的那些数据流之间的一个或多个不一致。如框608中所示,可以使用经由机器学习操作的推断和推理来校正多个数据流中的那些数据流之间的不一致。功能600可以在框610中结束。
现在转向图7,示出了用于计算环境中的认知数据管护的附加方法700,其中可以实现所示实施例的各个方面。功能700可以被实现为作为机器上的指令执行的方法,其中指令被包括在至少一个计算机可读介质上或非暂时性机器可读存储介质上。功能700可以在框702中开始。数据流和数据流的映射可以与概念和该概念之间的关系相关,如框704中所示。如框706中所示,可以接收对关于概念的时间序列数据的一个或多个查询。如框708中所示,可以识别可用于回答接收到的查询的多个数据流。如框710中所示,可以检测和/或识别用于回答接收到的查询的多个数据流之间的不一致。多个数据流可以被组合以返回一致的时间序列来回答接收到的查询,如框712中所示。可以请求(例如,来自用户)和接收(例如,来自用户)新的数据和概念,以解决不能唯一识别不一致源的情况(例如,检测到的数据流中的不一致),如框714中所示。功能700可以在框716中结束。
在一个方面,结合和/或作为图6-图7的至少一个框的部分,600和/或700的操作可以包括以下的每一个。600和/或700的操作可以用异常标志来标志具有不一致的多个数据流中的那些数据流。
600和/或700的操作可以请求和接收新的数据流和概念,以解决无法识别或解决的不一致和异常标志。另外,600和/或700的操作可以接收一个或多个新概念和新的数据流中的时间序列数据,和/或使用机器学习操作基于现有关系开发在一个或多个新概念和时间序列数据之间的新的关系。600和/或700的操作可以进一步推断新概念和该一个或多个概念之间的关系和映射。
在附加方面,600和/或700的操作可以参与与用户的交互式通信对话,以识别新的关系并扩充现有知识域。此外,与校正不一致相关联,600和/或700的操作可以基于相关数据流的内插或外插来创建一个或多个新的数据流,和/或使用机器学习操作来创建一个或多个概念和未标记数据集之间的映射。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括其上具有计算机可读程序指令的计算机可读存储介质(或媒介),用于使得处理器执行本发明的各方面。
计算机可读存储介质可以是有形设备,其可以保存和存储指令供指令执行设备使用。计算机可读存储介质可以是,例如,但不限于,电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备,或者上述的任何适当组合。计算机可读存储介质的更具体示例的非穷举列表包括以下内容:便携式计算机磁盘、硬盘、随机存取存储器(randomaccess memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmable read-only memory,EPROM或闪存)、静态随机存取存储器(static random access memory,SRAM)、便携式光盘只读存储器(compact disc read-only memory,CD-ROM)、数字通用盘(digital versatile disk,DVD)、记忆棒、软盘、机械编码设备,诸如其上记录有指令的凹槽中的穿孔卡或凸起结构,以及上述内容的任何适当组合。本文使用的计算机可读存储介质本身不应被解释为瞬时信号,诸如无线电波或其它自由传播的电磁波、通过波导或其它传输介质传播的电磁波(例如,通过光纤电缆的光脉冲)或通过导线传输的电信号。
本文描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理设备,或者经由网络,例如互联网、局域网、广域网和/或无线网络下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口从网络接收计算机可读程序指令,并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。
用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集体系结构(instruction-set-architecture,ISA)指令、机器指令、机器相关指令、微码、固件指令、状态设置数据,或者是以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括诸如Smalltalk、C++等的面向对象编程语言,以及诸如“C”编程语言或类似编程语言的常规过程编程语言。计算机可读程序指令可以完全在用户计算机上执行,部分在用户计算机上执行,作为独立软件包,部分在用户计算机上和部分在远程计算机上执行,或者完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络连接到用户的计算机,包括局域网(LAN)或广域网(WAN),或者可以连接到外部计算机(例如,使用互联网服务提供商通过互联网)。在一些实施例中,包括例如可编程逻辑电路、现场可编程门阵列(field-programmable gate arrays,FPGA)或可编程逻辑阵列(programmable logic arrays,PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来个性化电子电路来执行计算机可读程序指令,以便执行本发明的各方面。
本文参考根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图说明和/或框图来描述本发明的方面。应当理解,流程图说明和/或框图的每个框,以及流程图说明和/或框图中的框的组合,可以通过计算机可读程序指令来实现。
这些计算机可读程序指令可以被提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器以产生机器,使得经由计算机或其它可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图框或框中指定的功能/动作的装置。这些计算机可读程序指令还可以存储在计算机可读存储介质中,其能够引导计算机、可编程数据处理装置和/或其它设备以特定方式执行,使得其中存储有指令的计算机可读存储介质包括制造品,该制造品包括实现流程图和/或框图框或框中指定的功能/动作的各方面的指令。
计算机可读程序指令还可以被加载到计算机、其它可编程数据处理装置或其它设备上,以使得在计算机、其它可编程装置或其它设备上执行一系列操作步骤,从而产生计算机实现的过程,使得在计算机、其它可编程装置或其它设备上执行的指令实现流程图和/或框图框或框中指定的功能/动作。
图中的流程图和框图说明了根据本发明各种实施例的系统、方法和计算机程序产品的可能实现的结构、功能和操作。在这点上,流程图或框图中的每个框可以表示指令的模块、段或部分,其包括用于实现指定(多个)逻辑功能的一个或多个可执行指令。在一些替代实现中,框中标注的功能可能会不按图中标注的顺序发生。例如,连续示出的两个框实际上可以基本上同时执行,或者这些框有时可以相反的顺序执行,这取决于所涉及的功能。还将注意到,框图和/或流程图说明中的每个框以及框图和/或流程图说明中的框的组合可以由执行指定功能或动作或执行专用硬件和计算机指令的组合的基于专用硬件的系统来实现。

Claims (20)

1.一种由处理器在物联网(IoT)计算环境中进行认知数据管护的方法,包括:
将多个数据流中的每一个和所述多个数据流的映射与语义知识库的一个或多个概念以及所述一个或多个概念之间的关系相关;
识别在用于回答与所述一个或多个概念相关的时间序列数据的查询的所述多个数据流中的那些数据流之间的不一致;和
使用经由机器学习操作的推断和对所述语义知识库的推理来校正所述多个数据流中的那些数据流之间的所述不一致。
2.根据权利要求1所述的方法,进一步包括利用异常标志来标志具有所述不一致的所述多个数据流中的那些数据流。
3.根据权利要求1所述的方法,进一步包括请求和接收新的数据流和概念,以解决无法识别或解决的所述不一致和异常标志。
4.根据权利要求1所述的方法,进一步包括:
接收一个或多个新概念和新的数据流中的时间序列数据;和
使用所述机器学习操作和对所述语义知识库的推理,基于现有关系,开发在一个或多个新概念和所述时间序列数据之间的新的关系。
5.根据权利要求1所述的方法,进一步包括推断在新概念和所述一个或多个概念之间的关系和映射。
6.根据权利要求1所述的方法,进一步包括参与与用户的交互式通信对话,以识别所述新的关系并扩充现有知识域。
7.根据权利要求1所述的方法,其中校正所述不一致进一步包括:
基于相关数据流的内插或外插来创建一个或多个新的数据流;和
使用所述机器学习操作和对所述语义知识库的推理来创建在所述一个或多个概念和未标记数据集之间的映射。
8.一种用于物联网(IoT)计算环境中的认知数据管护的系统,包括:
一个或多个具有可执行指令的处理器,当执行这些指令时,使得系统:
将多个数据流中的每一个和所述多个数据流的映射与语义知识库的一个或多个概念以及所述一个或多个概念之间的关系相关;
识别在用于回答与所述一个或多个概念相关的时间序列数据的查询的所述多个数据流中的那些数据流之间的不一致;和
使用经由机器学习操作的推断和对所述语义知识库的推理来校正所述多个数据流中的那些数据流之间的所述不一致。
9.根据权利要求8所述的系统,其中,所述可执行指令进一步利用异常标志来标志具有所述不一致的所述多个数据流中的那些数据流。
10.根据权利要求8所述的系统,其中,所述可执行指令进一步请求和接收新的数据流和概念,以解决无法识别或解决的所述不一致和异常标志。
11.根据权利要求8所述的系统,其中所述可执行指令进一步:
接收一个或多个新概念和新的数据流中的时间序列数据;和
使用所述机器学习操作和对所述语义知识库的推理,基于现有关系,开发在一个或多个新概念和所述时间序列数据之间的新的关系。
12.根据权利要求8所述的系统,其中,所述可执行指令进一步推断在新概念和所述一个或多个概念之间的关系和映射。
13.根据权利要求8所述的系统,其中,所述可执行指令进一步参与与用户的交互式通信对话,以识别所述新的关系并扩充现有知识域。
14.根据权利要求8所述的系统,其中校正所述不一致进一步包括:
基于相关数据流的内插或外插来创建一个或多个新的数据流;和
使用所述机器学习操作和对所述语义知识库的推理来创建在所述一个或多个概念和未标记数据集之间的映射。
15.一种由一个或多个处理器在物联网(IoT)计算环境中进行认知数据管护的计算机程序产品,所述计算机程序产品包括其中存储有计算机可读程序代码部分的非暂时性计算机可读存储介质,所述计算机可读程序代码部分包括:
可执行部分,其将多个数据流中的每一个和所述多个数据流的映射与语义知识库的一个或多个概念以及所述一个或多个概念之间的关系相关;
可执行部分,其识别在用于回答与所述一个或多个概念相关的时间序列数据的查询的所述多个数据流中的那些数据流之间的不一致;和
可执行部分,其使用经由机器学习操作的推断和对所述语义知识库的推理来校正所述多个数据流中的那些数据流之间的所述不一致。
16.根据权利要求15所述的计算机程序产品,进一步包括可执行部分,所述可执行部分利用异常标志来标志具有所述不一致的所述多个数据流中的那些数据流。
17.根据权利要求15所述的计算机程序产品,进一步包括可执行部分,该可执行部分请求和接收新的数据流和概念,以解决无法识别或解决的所述不一致和异常标志。
18.根据权利要求15所述的计算机程序产品,进一步包括可执行部分,其:
接收一个或多个新概念和新的数据流中的时间序列数据;
使用所述机器学习操作和对所述语义知识库的推理,基于现有关系,开发在一个或多个新概念和所述时间序列数据之间的新的关系;和
参与与用户的交互式通信对话,以识别所述新的关系并扩充现有的知识域。
19.根据权利要求15所述的计算机程序产品,进一步包括可执行部分,其推断在新概念和所述一个或多个概念之间的关系和映射。
20.根据权利要求15所述的计算机程序产品,其中校正所述不一致进一步包括可执行部分,所述可执行部分:
基于相关数据流的内插或外插来创建一个或多个新的数据流;和
使用所述机器学习操作和对所述语义知识库的推理来创建在所述一个或多个概念和未标记数据集之间的映射。
CN201910211654.1A 2018-03-21 2019-03-20 物联网(iot)计算环境中认知数据管护的方法和系统 Active CN110297911B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/927,217 2018-03-21
US15/927,217 US20190295001A1 (en) 2018-03-21 2018-03-21 Cognitive data curation in a computing environment

Publications (2)

Publication Number Publication Date
CN110297911A true CN110297911A (zh) 2019-10-01
CN110297911B CN110297911B (zh) 2023-06-30

Family

ID=67985176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910211654.1A Active CN110297911B (zh) 2018-03-21 2019-03-20 物联网(iot)计算环境中认知数据管护的方法和系统

Country Status (2)

Country Link
US (1) US20190295001A1 (zh)
CN (1) CN110297911B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222139A (zh) * 2020-02-24 2020-06-02 南京邮电大学 一种基于gep优化的智能电网数据异常有效识别方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11146444B2 (en) * 2018-07-31 2021-10-12 International Business Machines Corporation Computer system alert situation detection based on trend analysis
US11461728B2 (en) 2019-11-05 2022-10-04 International Business Machines Corporation System and method for unsupervised abstraction of sensitive data for consortium sharing
US11488172B2 (en) 2019-11-05 2022-11-01 International Business Machines Corporation Intelligent agent to simulate financial transactions
US11842357B2 (en) 2019-11-05 2023-12-12 International Business Machines Corporation Intelligent agent to simulate customer data
US11556734B2 (en) 2019-11-05 2023-01-17 International Business Machines Corporation System and method for unsupervised abstraction of sensitive data for realistic modeling
US11599884B2 (en) 2019-11-05 2023-03-07 International Business Machines Corporation Identification of behavioral pattern of simulated transaction data
US11461793B2 (en) 2019-11-05 2022-10-04 International Business Machines Corporation Identification of behavioral pattern of simulated transaction data
US11488185B2 (en) 2019-11-05 2022-11-01 International Business Machines Corporation System and method for unsupervised abstraction of sensitive data for consortium sharing
US11475467B2 (en) 2019-11-05 2022-10-18 International Business Machines Corporation System and method for unsupervised abstraction of sensitive data for realistic modeling
US11475468B2 (en) * 2019-11-05 2022-10-18 International Business Machines Corporation System and method for unsupervised abstraction of sensitive data for detection model sharing across entities
US11676218B2 (en) 2019-11-05 2023-06-13 International Business Machines Corporation Intelligent agent to simulate customer data
US11494835B2 (en) 2019-11-05 2022-11-08 International Business Machines Corporation Intelligent agent to simulate financial transactions

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101681368A (zh) * 2007-06-29 2010-03-24 国际商业机器公司 聚集查询处理
CN101694629A (zh) * 2009-10-23 2010-04-14 北京邮电大学 一种基于本体的上下文感知应用平台及其工作方法
CN102982097A (zh) * 2011-11-03 2013-03-20 微软公司 用于基于知识的数据质量解决方案的域
CN104516942A (zh) * 2013-09-26 2015-04-15 国际商业机器公司 概念驱动的自动分节标识
US20150186452A1 (en) * 2013-12-31 2015-07-02 International Business Machines Corporation Adaptive data fetching from network storage
US20160132896A1 (en) * 2014-11-12 2016-05-12 International Business Machines Corporation Global Regulatory Compliance Optimization Tool
CN105808923A (zh) * 2016-02-29 2016-07-27 北京航空航天大学 一种数据序列的异常检测方法和装置
CN106131867A (zh) * 2016-08-31 2016-11-16 成都九华圆通科技发展有限公司 一种无线电云监测系统
CN106302680A (zh) * 2016-08-06 2017-01-04 内蒙古大学 一种基于物联网的数据显示后台系统
US20170075918A1 (en) * 2014-03-28 2017-03-16 Tamr, Inc Method and system for large scale data curation
CN106776729A (zh) * 2016-11-18 2017-05-31 同济大学 一种大规模知识图谱路径查询预测器构造方法
CN107809493A (zh) * 2017-12-11 2018-03-16 上海齐网网络科技有限公司 一种基于多智能体的物联网操作系统原型

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10445317B2 (en) * 2014-06-09 2019-10-15 Cognitive Scale, Inc. Graph query engine for use within a cognitive environment
EP3278213A4 (en) * 2015-06-05 2019-01-30 C3 IoT, Inc. SYSTEMS, METHODS AND DEVICES FOR AN APPLICATION DEVELOPMENT PLATFORM OF AN INTERNET OF THE THINGS OF A COMPANY
US10805184B2 (en) * 2015-07-28 2020-10-13 Amazon Technologies, Inc. Data analytics and management of computing infrastructures
US10445656B2 (en) * 2015-09-29 2019-10-15 Cognitive Scale, Inc. Cognitive machine learning system
CN107967267A (zh) * 2016-10-18 2018-04-27 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
EP3361405B1 (en) * 2017-02-13 2020-12-30 Nokia Solutions and Networks Oy Enhancement of intrusion detection systems
US10778516B2 (en) * 2017-09-08 2020-09-15 Hewlett Packard Enterprise Development Lp Determination of a next state of multiple IoT devices within an environment

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101681368A (zh) * 2007-06-29 2010-03-24 国际商业机器公司 聚集查询处理
CN101694629A (zh) * 2009-10-23 2010-04-14 北京邮电大学 一种基于本体的上下文感知应用平台及其工作方法
CN102982097A (zh) * 2011-11-03 2013-03-20 微软公司 用于基于知识的数据质量解决方案的域
CN104516942A (zh) * 2013-09-26 2015-04-15 国际商业机器公司 概念驱动的自动分节标识
US20150186452A1 (en) * 2013-12-31 2015-07-02 International Business Machines Corporation Adaptive data fetching from network storage
US20170075918A1 (en) * 2014-03-28 2017-03-16 Tamr, Inc Method and system for large scale data curation
US20160132896A1 (en) * 2014-11-12 2016-05-12 International Business Machines Corporation Global Regulatory Compliance Optimization Tool
CN105808923A (zh) * 2016-02-29 2016-07-27 北京航空航天大学 一种数据序列的异常检测方法和装置
CN106302680A (zh) * 2016-08-06 2017-01-04 内蒙古大学 一种基于物联网的数据显示后台系统
CN106131867A (zh) * 2016-08-31 2016-11-16 成都九华圆通科技发展有限公司 一种无线电云监测系统
CN106776729A (zh) * 2016-11-18 2017-05-31 同济大学 一种大规模知识图谱路径查询预测器构造方法
CN107809493A (zh) * 2017-12-11 2018-03-16 上海齐网网络科技有限公司 一种基于多智能体的物联网操作系统原型

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
AKSHAY UTTAMA NAMBI S.N.*等: "A Unified Semantic Knowledge Base for IoT", 《2014 IEEE WORLD FORUM ON INTERNET OF THINGS》 *
AKSHAY UTTAMA NAMBI S.N.*等: "A Unified Semantic Knowledge Base for IoT", 《2014 IEEE WORLD FORUM ON INTERNET OF THINGS》, 31 December 2014 (2014-12-31), pages 1 - 6 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222139A (zh) * 2020-02-24 2020-06-02 南京邮电大学 一种基于gep优化的智能电网数据异常有效识别方法
CN111222139B (zh) * 2020-02-24 2022-06-03 南京邮电大学 一种基于gep优化的智能电网数据异常有效识别方法

Also Published As

Publication number Publication date
CN110297911B (zh) 2023-06-30
US20190295001A1 (en) 2019-09-26

Similar Documents

Publication Publication Date Title
CN110297911A (zh) 物联网(iot)计算环境中认知数据管护的方法和系统
Thai-Nghe et al. Factorization Models for Forecasting Student Performance.
US7389282B2 (en) System and method for predictive analysis and predictive analysis markup language
CN107615275A (zh) 估计用于运行数据挖掘服务的计算资源
CN112749749B (zh) 基于分类决策树模型的分类方法、装置及电子设备
CN110688466B (zh) 在用户对话系统中集成多个领域问题解决
US20200242199A1 (en) Intelligent management and interaction of a communication agent in an internet of things environment
US11669757B2 (en) Operational energy consumption anomalies in intelligent energy consumption systems
US20210241310A1 (en) Intelligent advertisement campaign effectiveness and impact evaluation
US20230359899A1 (en) Transfer learning based on cross-domain homophily influences
CN110502739A (zh) 结构化输入的机器学习模型的构建
CN113761250A (zh) 模型训练方法、商户分类方法及装置
Chen et al. Semisupervised anomaly detection of multivariate time series based on a variational autoencoder
Li et al. Study on the interaction between big data and artificial intelligence
Qin et al. Sora for computational social systems: From counterfactual experiments to artificiofactual experiments with parallel intelligence
US11475297B2 (en) Cross-domain homophily quantification for transfer learning
Parra-Ullauri et al. Event-driven temporal models for explanations-ETeMoX: explaining reinforcement learning
US10970490B2 (en) Automatic evaluation of artificial intelligence-based processes
Wang et al. A potential solution for intelligent energy management-knowledge graph
Zhang Multi-state system reliability analysis based on fuzzy colored petri nets
CN115280301A (zh) 用于语句对的高效紧凑的文本匹配系统
CN113342988A (zh) 一种基于lda跨域的构建服务知识图谱实现服务组合优化的方法及系统
US20230401437A1 (en) Reasoning with real-valued first order logic and probability intervals
Klippel Movement Choremes: Bridging Cognitive Understanding and Formal Characterizations of Movement Patterns 1
Daneshvar et al. Data management in modernizing the future multi-carrier energy networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant