CN105320729B - 源处的数据收集和清洗 - Google Patents

源处的数据收集和清洗 Download PDF

Info

Publication number
CN105320729B
CN105320729B CN201510336585.9A CN201510336585A CN105320729B CN 105320729 B CN105320729 B CN 105320729B CN 201510336585 A CN201510336585 A CN 201510336585A CN 105320729 B CN105320729 B CN 105320729B
Authority
CN
China
Prior art keywords
data
application
interface
mobile device
manager module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510336585.9A
Other languages
English (en)
Other versions
CN105320729A (zh
Inventor
E·弗洛雷斯
C·布莱尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iqvia Inc
Original Assignee
IMS Health Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IMS Health Inc filed Critical IMS Health Inc
Publication of CN105320729A publication Critical patent/CN105320729A/zh
Application granted granted Critical
Publication of CN105320729B publication Critical patent/CN105320729B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Abstract

一种清理数据的设备和方法,所述设备包括:接收器,其用于收集将要清理的电子数据;处理器,其耦接至所述接收器,所述处理器被配置用来从所述接收器接收所述数据;存储器,其耦接至所述处理器,所述存储器被配置用来存储应用程序;通向实例化模块的第一接口,其用于处理由所述接收器收集的数据;以及通向配置管理器模块的第二接口,所述配置管理器模块被配置用来控制由所述实例化模块用来处理数据的数据结构和规则,其中所述第一接口和所述第二接口可从所述应用程序调用以清理由所述接收器收集的所述数据。

Description

源处的数据收集和清洗
背景
技术领域
本发明的实施方案一般来说涉及数据收集,且明确地说涉及用于动态地定义数据结构并检测较靠近数据源的错误的数据收集,以及校正错误的数据或限制其进一步使用的系统和方法。
发明背景
移动健康(“mHealth”)是用于由诸如移动电话、病人监测装置、个人数字助理(PDA)和其它移动或无线装置等通信终端支持的医疗和公共健康实践的术语。mHealth涉及使用语音和短消息服务(SMS)以及较复杂的技术,诸如移动数据通信系统(例如,3G、4G、4GLTE等)、全球定位系统(GPS)和蓝牙技术。
移动应用程序(或移动app)是被设计成在智能电话、平板计算机和其它移动装置上运行的软件应用程序。一些移动app用以将敏感的个人信息(诸如保健信息)递送至消费者,或从消费者搜集健康状态信息并将健康状态信息发送至保健提供者。并非与敏感的个人信息的交换相关的所有移动app(例如,在保健方面已开发的应用程序)都广泛地对消费者可用。大多数先进的医疗app中的一些未必设计成针对一般消费者。一些移动app已为保健医生而设计,其它移动app是针对病人设计但需要处方,且另外的移动app希望仅用于病人中的一小部分。如本文中所使用,术语“移动app”或“移动应用程序”可包含在PC(例如,台式计算机、塔式计算机、膝上型计算机、上网本等)或其它通用消费者-计算装置(不限于移动装置,除非移动性提供所陈述的益处或除非另外受使用环境清楚地限制)上执行的应用程序。
信息系统(诸如,用于保健的系统)可产生和使用在多个源(诸如,移动应用程序、台式计算机应用程序、网络应用程序等等)处收集的电子数据。电子数据天生容易出现数据录入错误,不管数据是人工地还是通过传感器读数录入的。举例来说,人工地录入的电子数据可包含键入错误(例如,错误地键入的数字、互换位置的数字、遗漏的数字、重复键盘输入、非数字键盘输入、放错位置的小数点等)。电子传感器读数可遭遇传感器故障(例如,输出所有零或一些其它无效代码)、传感器错位或移位、通信线故障、来自环境的不适当的影响(例如,温度效应、振动或RF干扰)、时基不准确等。数据录入错误需要校正或移除,使得仅使用值得信任的数据(即,大体上无错误或具有可忽略的残留误差的电子数据)来做出分析和决定。数据也应该是有意义的,即,大体上详尽的或全面的,诸如通过按照情形指定而包含统计上重要的取样,或基本过程的完整循环,或类似物。值得信任和有意义的电子数据(即,足够可靠和足够完整以被作用于的信息)是可被分析且用以做出和支持决定的可起作用的信息。
用于将数据转换为可起作用的信息的目前已知的过程需要多个步骤,昂贵并耗时且经常导致不完整或不准确的数据。第一问题在于当(如大多数例子中)数据中的至少一些在某一方面(诸如,因不完整、不准确或含有垃圾元素)无效时将数据转换为可起作用的信息是非常昂贵的。将所收集的数据发送至清洗点,例如处理系统,在那里人工的或半自动系统可用以检测可疑的无效数据,并标记、校正和/或移除可疑的无效数据。当具有这些类型的缺陷的数据经历清洗过程时,所得信息仍可能含有间隙、不准确性和/或另外无效的信息。
第二问题在于常规数据清洗过程是耗时的且通常使用成批处理完成,且不可获得数据源来提供校正。举例来说,首先必须收集数据,接着将数据发送至服务器以用于清洗。使用成批处理使得在计算容量较不可能需要用于诸如用户支持等其它任务时可在切断时段期间完成清洗过程,或使得可在信息源不进一步注意过程的情况下提交清洗工作。
常规技术的第三问题是关于可处理结构化数据和执行其数据源的简单验证的应用程序。此些应用程序通常使用正规表达式(如在其计算机科学意义上已知的)以防止用户录入错误的数据,或提供防止用户录入不切实际的信息(例如,高于500mmHg的血压)的信息限制。关于此常规技术的问题在于较复杂的相关的或从属的数据情形需要其它类型的验证,这通过正规表达式不易于管理。对于复杂的数据验证,应用程序将需要将所收集的数据发送至后端服务器以用于质量控制处理和管理,这将是复杂的且耗时的过程。
常规技术的第四问题在于应用程序开发者通常在其应用程序中对特定数据结构或验证规则(也称作数据一致性规则)进行硬编码以用于特定使用状况。之后,如果数据结构改变或如果数据验证规则改变,那么应用程序源代码必须改变且应用程序的新版本必须分配至用户库。用户将需要下载和安装应用程序的新版本以得到最近的改变。继续使用应用程序的较旧版本的用户可能引入错误的数据或不会另外通过大多数最近的数据验证规则的数据。
已知的背景技术不能即时地更新其数据结构和质量规则。已知的背景技术需要针对每一更新改变应用程序的源代码,且用户需要下载每一更新版本,这是难使用的且不方便,且如果用户能够推迟或拒绝应用程序的更新版本的下载和安装可能易于出现关于数据质量的连续问题。
此外,已知的背景技术通常在服务器端执行数据质量处理(例如,数据清洗),尤其是对于复杂的数据。因此,在应用程序处收集终端用户数据且接着将其发送至应用程序服务器以用于成批处理。这是耗时的、成本高的且其不会良好地适合于交互模型。
因此,存在改进较靠近数据源的数据验证的需要,以便提供较值得信任和可起作用的信息来支持决定做出、源处的数据清洗以及最终提供改进的和客户满意。
发明概要
根据本公开的实施方案通过使用以下特征中的一者或多者而实现数据源处的较高质量的数据的收集:运行时间时的数据结构遵守;运行时间时的数据质量控制遵守;运行时间时的规则引擎配置;以及适应性规则集。与背景技术的已知系统相比,实施方案关于数据收集提供增加的速度、准确性和减少的成本。
根据本公开的实施方案提供并利用实现为应用程序接口(API)模块的一般在线可配置进程的集合,以便实现可在一般在线可配置进程的初始化期间配置的数据结构和数据验证规则的管理。实施方案仅验证符合在运行时间进程的初始化期间配置的数据结构和数据验证规则的文档或数据。
根据本公开的实施方案通过实施导致在源处录入的数据的质量控制的数据结构和用于信息管理的规则来简化数据转换过程。
在一个实施方案中,一种清理数据的设备包括:接收器,其用于收集将要清理的电子数据;处理器,其耦接至所述接收器,所述处理器被配置用来接收由所述接收器收集的所述数据;存储器,其耦接至所述处理器,所述存储器被配置用来存储应用程序;通向实例化模块的第一接口,所述实例化模块处理由所述接收器收集的数据;以及通向配置管理器模块的第二接口,所述配置管理器模块被配置用来控制由所述实例化模块用来处理数据的结构和规则,其中所述第一接口和所述第二接口可从所述应用程序调用以清理由所述接收器收集的所述数据。
在一个实施方案中,一种清理数据的方法包括:提供包括耦接至存储器的处理器的设备,所述存储器被配置用来存储应用程序;通过耦接至处理器的接收器收集将要清理的电子数据;通过使用第一接口以通过所述处理器执行实例化模块来处理由所述接收器收集的数据;通过使用第二接口以通过所述处理器执行配置管理器模块来控制由所述实例化模块用来处理数据的结构和规则;其中所述第一接口和所述第二接口可从所述应用程序调用以清理由所述接收器收集的所述数据。
前述内容是本公开的实施方案的简化总结以提供对本公开的一些方面的理解。此总结既不是本公开和其各种实施方案的广泛的也不是详尽的概述。其既不希望识别本公开的关键的或至关重要的元素,也不希望描绘本公开的范围,而是以简化的形式呈现本公开的所选择的概念以作为下文呈现的较详细的描述的介绍。如将了解,本公开的其它实施方案是可能的,其单独地或组合地利用上文阐述或下文详细描述的特征中的一者或多者。
附图简述
在考虑本发明的实施方案的以下详细描述后,尤其在结合附图进行时,本发明的以上和又进一步特征和优点将变得显而易见,在附图中各图中的相似的参考数字用以指代相似的组件,且其中:
图1说明根据本发明的实施方案的示范性配置文件;
图2说明根据本公开的实施方案的处于相对高的模块化抽象层的系统;
图3A说明根据本公开的实施方案的处于相对高的硬件抽象层的系统;
图3B说明根据本公开的另一实施方案的处于相对高的硬件抽象层的系统;
图4说明根据本公开的实施方案的通过服务器使用系统的过程;以及
图5说明根据本公开的实施方案的通过移动装置使用系统的过程。
本文中所使用的标题仅用于组织目的,且不意味着用以限制描述或权利要求的范围。如本申请案全文中所使用,词语“可”是以准许的意义使用(即,意味着具有可能),而不是强制意义(即,意味着必须)。类似地,词语“包含”意味着包含但不限于。为了促进理解,在可能的地方已使用相似的参考数字来指代图中共同的相似元件。除非使用环境另外指示,否则可使用虚线或点线来说明图中的任选部分。
具体实施方式
下文将结合示范性通信系统来说明本公开。尽管非常适合与例如使用服务器和/或数据库的系统一起使用,但本公开不限于与任何特定类型的通信系统或任何特定配置的系统元件一起使用。本领域技术人员将认识到,所公开的技术可在任何通信应用中使用,其中需要提供较可起作用的数据收集。
还将相对于软件、模块和相关联的硬件描述本公开的示范性系统和方法。然而,为了避免不必要地混淆本公开,以下描述省略可以框图形式展示的、众所周知的或另外概括的众所周知的结构、组件和装置。
在以下详细描述中,阐述众多特定细节以便提供对本文中描述的实施方案或其它实施例的透彻理解。在一些例子中,未详细描述众所周知的方法、程序、组件和电路,以防混淆以下描述。另外,所公开的实施例仅用于示范性目的且可代替或结合所公开的实施例而使用其它实施例。还应注意,本文中呈现的实施例不应解释为限制本发明的实施方案的范围,因为其它同样有效的实施例是可能的和合理的。
如本文中所使用,术语“模块”一般指步骤、过程或组件的逻辑序列或关联。举例来说,软件模块可包括计算机程序内的相关联的例程或子例程的集合。或者,模块可包括大体上独立的硬件装置。模块还可包括过程的逻辑集合,而与任何软件或硬件实现方式无关。
如本文中所使用,术语“网关”一般可包括在装置之间发送和接收数据的任何装置。举例来说,网关可包括路由器、交换器、网桥、防火墙、其它网络元件和类似物,和其任何组合。
如本文中所使用,术语“传输器”一般可包括能够传输信号的任何装置、电路或设备。如本文中所使用,术语“接收器”一般可包括能够接收信号的任何装置、电路或设备。如本文中所使用,术语“收发器”一般可包括能够传输和接收信号的任何装置、电路或设备。如本文中所使用,术语“信号”可包含电信号、无线电信号、光信号、声信号等等中的一者或多者。
如本文中所使用,术语“应用程序容器”一般可指可托管和支持若干应用程序配置的使用的移动应用程序。每一配置描述与应用程序相关的GUI外观、应用程序流程、逻辑和数据。容器可以被识别为第一配置的一个配置启动。第一配置可允许用户选择将要使用的其它配置。
如本文中所使用的术语“计算机可读媒体”指参与存储和/或提供指令至处理器以供执行的任何有形的非暂时存储和/或传输媒体。此媒体可采用许多形式,包含但不限于非易失性媒体、易失性媒体和传输媒体。非易失性媒体包含(例如)NVRAM或磁盘或光盘。易失性媒体包含动态存储器,诸如主存储器。计算机可读媒体的一般形式包含(例如)软盘、软磁盘、硬盘、磁带,或任何其它磁性媒体、磁性-光学媒体、CD-ROM、任何其它光学媒体、穿孔卡片、纸带、具有孔图案的任何其它物理媒体、RAM、PROM、EPROM、快闪EPROM、类似存储卡的固态媒体、任何其它存储芯片或存储盒、如下文描述的载波,或计算机可从其读取的任何其它媒体。电子邮件的数字文件附件或其它独立的信息档案或档案的集合被视为等效于有形的存储媒体的分配媒体。当计算机可读媒体被配置为数据库时,应理解数据库可以是任何类型的数据库,诸如相关的、分级的、面向对象的和/或类似的。因此,本公开被视为包含有形的存储媒体或分配媒体和现有技术辨识的等效物和后继媒体,其中存储了本公开的软件实现方式。
根据本公开的实施方案提供并利用实现为应用程序接口(API)模块的一般可配置进程的集合,以在运行时间实现未知数据结构和验证规则的管理。并入实施方案的应用程序将仅在文档或数据符合初始化进程期间定义的数据结构和验证规则集时接受文档或数据。
根据本公开的实施方案可适合于在多种目标计算平台(例如,智能电话、平板电脑、膝上型计算机、上网本、其它移动装置、台式计算机等)上执行,这在下文在图3A和3B的上下文中较详细地进行描述。一般可配置进程(诸如,数据API、规则API、规则引擎等等)可以用于目标计算平台的本机代码编写。本机代码称作计算机编程代码,其经编译以借助特定处理器和其指令集(例如,机器代码)直接运行。一般可配置进程可经封装以用于分配至目标计算平台以作为一般应用程序(“app”)容器的组件、新的数据结构和规则,或对现有数据结构和规则的改变。一般可配置进程可实现而无需改变或更新一般app容器的源代码。
根据本公开的实施方案使得不同应用程序能够使用共享的类型的数据结构来收集源处的结构化信息集。结构化信息集将具有较高质量(例如,较值得信任和有意义)且组织良好(例如,拥有类似的和一致的结构),同时减少清理所收集的数据以便从所收集的数据获得可起作用的信息所需的步骤的数目。数据的清理指不受信任的数据的识别和校正或移除,不受信任的数据例如包含重要错误的数据或当知道未知条件对于规范化、补偿、校正或类似物的目的将为重要的时在那些未知条件下搜集的数据。可能不重要的错误的实施例是在传感器或计时器的通常的容限或准确性内变化的测量,或统计取样误差。可能重要的错误的实施例是包含由来自环境的影响(例如,温度效应、振动或RF干扰)引起的相对大的变化或系统偏差(相对于通常的容限、准确性或取样误差)的测量。可能难以在应清理的错误与被监视的基本过程中的真实改变之间进行区分。实施方案通过减少清理数据的需要而节省资源,同时改进所产生的信息的质量。
关于上文论述的背景技术的缺点,即当(如在大多数例子中)数据中的至少一些在某一方面无效时将数据转换为可起作用的信息是非常昂贵的,根据本公开的实施方案可由多个信息源(例如,智能电话、平板电脑、膝上型计算机、上网本、其它移动装置、台式计算机等)使用以便在数据源处较有效率地且一致地收集数据。实施方案通过使用数据结构、规则和质量控制配置以确保所收集的数据符合预期,从而提供强制的一致性来实现此目标。因为此一致性在录入数据时发生,所以可警示用户遗漏的信息、不准确的信息、不一致的信息或与预期格式不符的信息。确定一致性可涉及使用历史数据和来自其它源的数据。用户接着能够在信息被提交至服务器以用于进一步使用和分析之前校正信息。
关于上文论述的背景技术的另一缺点,即常规数据清洗过程是耗时的且通常使用成批处理完成,根据本公开的实施方案使得应用程序(例如,与mHealth相关的app)能够在用户与应用程序的交互期间管理信息的录入。通过此过程,信息收集和管理可以是交互的、事务性的和快速的。
此外,因为应用程序的事务性和交互特性,实施方案准许大体上实时地处理信息。一旦信息被服务器接收,实施方案促进能够几乎同时地更新和管理统计或报告,因为数据被认为是可起作用的。这对于其中时间可以是非常重要的许多类型的应用程序(例如,评估广告活动的效果的应用程序,检测急性身体状况的应用程序等)可以是非常有价值的。
关于上文论述的背景技术的另一缺点,即较复杂的相关的或从属的数据情形需要太复杂而不能用正规表达式指定或通过正规表达式不易于管理的类型的验证,实施方案实现源处的大体上所有类型的数据集(例如,简单的或复杂的数据集)的结构化数据处理和数据质量控制两者,而无需在那个数据源可能不再可用时在服务器端建构验证。
关于上文论述的背景技术的另一缺点,即应用程序开发者通常在其应用程序中对特定数据结构或验证规则进行硬编码以用于特定使用状况,实施方案允许开发者开发软件app而不必担心数据结构和验证规则的格式,或不必担心数据结构和验证规则的改变,或不必担心数据质量的管理。通过提供实施方案来管理在信息源处由用户提供的信息,实施方案帮助确保软件app可符合预定义的标准或主动性(诸如,用于mHealth使用)。将要搜集的信息的数据结构(例如,字段定义)或录入的信息的质量要求(例如,数值信息的错误检查和一致性检查的水平或程度;计算数据之间的相互关系)的改变将不需要改变软件app的源文件。实施方案可通过使用正式的改变配置和控制方法来管理数据结构和验证规则集(包含对其的改变)。实施方案将倾向于降低软件app开发(诸如,用于mHealth应用程序)的复杂性,这是因为数据结构和验证规则集配置将用一致的方式来管理且对软件开发者可用。
根据本公开的实施方案提供用于在源处收集数据且将那个数据转换为可起作用的信息的灵活框架。灵活性包含能够即时地重新配置与所收集的数据相关的格式化和一致性要求,即实时地而无需重新分配或重启应用程序。特定疾病类型所需的数据结构和验证规则是重要的,且可随时间过去随着医学知识的进步而改变。在特定时间点,现有技术医学知识可将某些因素或行为视为疾病的提高的风险的标记。举例来说,每天四杯咖啡或两杯红酒在一年可被认为是健康的,但在后一年会被新的研究认为是不健康的或在统计上没有有意义的效果。因此,随着时间过去可能需要使医学app随着时间过去收集不同的病人数据,或随着时间过去用不用的方式分析所收集的数据。实施方案可通过准许和促进对所需数据结构和验证规则的改变以便在无需重新分配医学app本身的情况下继续搜集可起作用的信息来适应医学知识的这些进步。
本文中描述的实施方案不限于医学环境中的使用,而是可跨越多种环境或行业而为有用的。实施方案促进来自类似的应用程序的一致的数据收集,即使当由不同的开发者编写时也如此,且促进类似的应用程序的一致管理。
尽管其它技术(例如,XML和XML大纲)可在显示信息时提供有限的灵活性,但这些技术在提供检查源处的数据的准确性和一致性或管理集成的数据结构和验证规则引擎的灵活的能力方面是欠缺的。实施方案促进增强的错误和一致性检查。
根据本公开的实施方案可使用数据API和验证规则引擎,其曾经按本地级编码但可在运行时间重新配置以产生与软件应用程序的目的相关的可起作用的信息。实施方案因而允许软件应用程序支持所需数据结构和用于数据一致性的验证规则集、数据质量和过程流程,以产生可起作用的信息。
根据本公开的实施方案的另一优点在于对数据结构和验证规则的改变可按配置级而不是按应用程序源代码级实现。举例来说,配置级实现方式可依赖于在初始化后和任选地,周期性地或此后其它额外时间读取配置文件的应用程序。可将对数据结构和验证规则的改变编码至配置文件中。因此,可支持影响应用程序工作流程、用户体验(UX)或用户界面(UI)、数据类型或验证规则的即时改变(即,实时改变)而不引起改变、更新或重启软件应用程序的需要。
配置文件可通过使用可用不同方式,诸如使用JavaScript对象表示法(JSON)或可扩展标记语言(XML),或大体上任何其它特定的实现方式实现的语言来提供。配置文件可包括含有层次的规范且具有与验证规则相关联的数据字段和结构标记的数据结构描述。图1中说明了使用JSON的示范性配置文件。尽管图1说明配置文件可看起来的样子的一个实施例,但涵盖了配置文件的其它实现方式。
从实现方式角度来看,配置将由平台管理且数据API和验证规则引擎组件将(例如)通过使用配置数据、初始化文件和类似物嵌入于app容器中。数据API和验证规则引擎读取配置且相应地管理所需行为。应用程序(“app”)容器可以是可托管和支持若干应用程序配置的使用的移动应用程序。每一配置描述GUI外观、应用程序流程、逻辑和数据。容器可以被识别为第一配置的一个配置启动。第一配置可允许用户选择将要使用的其它配置。
举例来说,假设药品的剂量规定以“IU”为单位。进一步假设用户以“mgs”为单位来供应药品的测量(例如,用于监视或实施顺应性)。在此情形中,验证规则引擎将捕捉此错误。
然而,进一步假设在稍后的时间需要或要求更新验证规则以便接受以“mgs”为单位的测量。对于已知技术的系统,对验证规则的此更新不能在无需更新应用程序源代码,且接着将软件应用程序的编译的或运行时间版本分配给用户的情况下进行。这迫使用户用软件应用程序的新更新的版本来更新其装置。此更新对于移动用户特别不方便。举例来说,不方便可来自于移动用户超出其每月的数据传送限制,或移动用户可变得习惯于频繁的更新,或者因为由在软件应用程序可用于由用户下载之前需要提交软件应用程序以进行验证测试和认可而引起的软件应用程序的可用性的延迟。在软件更新已准备好的时间与用户准许或选择更新软件应用程序的时间之间可存在延迟。
另外,在本文中描述的实施方案不存在的情况下,从用户收集的数据将仍需要通常通过人或系统审查,且如果存在任何缺陷就进行清洗。此处理的全部将可能以成批模式完成且将花较长时间。而且,此处理可容易有错误,因为清洗数据至少部分是人工过程,且因此遭遇维护人员人工错误。
相比之下,且在更新验证规则的此请求后,实施方案可重新配置软件app而不必将软件app本身的更新分配至终端用户,使得终端用户可接着以“mgs”为单位录入其药物的剂量。类似地,也可更新验证规则集以处理药品剂量的改变、重复次数、药品相互作用的验证或有害相互作用的识别等等。
图2说明根据本公开的实施方案的处于相对高的模块化或功能抽象层的系统200。系统200包含与服务器203通信的移动装置201。移动装置201可包含应用程序205,其用以与服务器203交换信息和/或命令,例如从服务器203接收关于数据测量的控制的命令,和将所测量的数据从应用程序205传达至服务器203。
移动装置201可进一步包含发现和实例化模块207。当应用程序205需要进行测量时,可通过应用程序205调用发现和实例化模块207。发现和实例化模块207的实例化功能由应用程序205使用以在存储器中建立API(即,实施方案)工作所需的所有对象。应用程序205将使用发现和实例化模块207的发现功能来了解根据提供至API的配置可用的数据结构。应用程序205可使用由发现和实例化模块207提供的信息的描述而知道需要向用户请求或提供至用户的数据。应用程序205还可使用发现和实例化模块207提供的API来根据数据配置提供对应数据。发现和实例化模块207将会将数据验证委托给下文描述的结构管理器模块209。
移动装置201可进一步包含与发现和实例化模块207通信联系的结构管理器模块209。发现和实例化模块207可将与数据验证相关的某些任务委托给结构管理器模块209。举例来说,当发现和实例化模块207具有需要验证的一个或多个测量时,发现和实例化模块207可将数据与验证所述数据的请求发送至结构管理器模块209。数据验证可包含,例如,确保被验证的特定数据实例化在限制(例如,最小和最大值限制)内且不含有录入错误(例如,具有非数值字符的测量、遗漏的或额外的小数点,或不适合于数据的负号;电子邮件地址中的无效字符,诸如确切地没有一个“@符号”;邮寄地址中的无效字符;等等),或确保数据以其它方式符合所需结构(例如,血压测量包含心脏收缩和心脏舒张测量)。由结构管理器模块209执行的数据验证可视为自我参考验证,在这个意义上验证检验隔离的特定数据,而不必将将要验证的数据与其它数据进行比较。发现和实例化模块207还可发送识别数据的信息,使得结构管理器模块209可识别将应用于数据的正确的验证规则集。
移动装置201可进一步包含与结构管理器模块209通信联系的规则管理器模块211。结构管理器模块209可将与规则验证相关的某些任务委托给规则管理器模块211。举例来说,当发现和实例化模块207具有需要验证的一个或多个测量时,验证的部分可涉及对将要验证的测量的较全面的检验,以便确定测量是否符合与此测量与具有相同参数或不同参数的其它测量的关系相关的规则。举例来说,可检验来自动态血糖监测仪的测量以看其在预定数目的连续读数内是否未改变(其可指示传感器问题)或数据是否未遵循预期的每日模式或是否未遵循与其它外部事件(诸如,吃饭)相关的模式。由规则管理器模块211执行的数据验证可视为相关验证,在这个意义上验证通过将将要验证的数据与其它数据进行比较来检验特定数据。
移动装置201可进一步包含与应用程序205通信联系的配置管理器模块213。配置管理器模块213提供可用以促进改变数据结构或验证规则的功能。举例来说,可确定一系列测量的数据结构需要改变(例如,通过改变可接受读数的最小/最大限制),或规则需要改变(例如,将每日成分包含至心脏收缩和心脏舒张血压测量之间的可接受的比)。所请求的改变可由用户(例如,经由服务器203)输入至应用程序205,或可由应用程序205用算法确定(例如,作为减少虚假警报的自动尝试)。将确定改变涉及对数据验证、对规则验证还是对两者的改变。在一些实施方案中,此确定可由应用程序205进行且与改变本身一起传达至配置管理器模块213。在其它实施方案中,确定可由配置管理器模块213单独从改变进行,而无需应用程序205进行此确定。
配置管理器模块213与结构管理器模块209和规则管理器模块211通信联系。配置管理器模块213可辨识(通过被通知或通过其自己的确定)请求涉及对数据结构还是对规则验证的改变。如果改变与数据结构相关,那么配置管理器模块213将与结构管理器模块209通信以便更新所需的数据结构。如果改变与规则验证相关,那么配置管理器模块213将与规则管理器模块211通信以便更新所需的规则验证。
当数据验证发生时,两个情形中的一者可发生:第一,信息可与验证规则一致;或第二,信息可与验证规则不一致。在第二种情况中,实施方案告知应用程序205有事情出错了,且还将告知应用程序205什么出错了。实施方案可将若干类型的告知中的一者或多者返回至应用程序205,例如,以便指示严重性(例如,错误,警告),指示错误的可疑原因,等等。
图3A说明根据本公开的实施方案的处于相对高的硬件抽象层的系统300。系统300可用于说明源处的数据收集和清洗的工作流程样本。
系统300包含通过通信网络304与服务器303通信的移动装置301。移动装置301可包含通信接口(例如,有线以太网、无线Wi-Fi或蓝牙收发器等)以便使用如本领域技术人员已知的硬件和协议来与通信网络304通信。移动装置301可包含耦接至存储器307的处理器305。存储器307可被配置用来存储一个或多个应用(或app)程序309a、309b等,所述应用程序在由处理器305执行时用以与服务器303交换信息和/或命令,例如,从服务器303接收关于诸如数据测量或其它类型的信息的用户输入的控制的命令,且将所测量的数据从处理器305传达至服务器303。个别的但非特定的应用程序可称作应用程序309。授权的用户302允许与服务器303通信且例如通过定义规则集、数据结构和指示有效数据的其它描述来配置服务器303。此些配置又将传达至移动装置301。
通信网络304可以是分组交换的和/或电路交换的。示范性通信网络304包含(不限于)广域网(WAN)(诸如因特网)、公共交换电话网络(PSTN)、普通老式电话服务(POTS)网络、蜂窝式通信网络,或其组合。在一个配置中,通信网络304是支持TCP/IP协议套的公共网络。
移动装置301可进一步包含接收接口电路,例如接收器311a,其被配置用来从传感器313接收测量的。测量可包含将要清洗的读数或其它信息。接收器311a可耦接至处理器305以便将测量从传感器313传递至处理器305。
移动装置301可进一步包含接收接口电路,例如接收器311b,其被配置用来从用户输入/输出(I/O)装置314(诸如,键盘、触摸屏接口、用于语音辨识的麦克风等等)接收数据。数据可包含将要清洗的数值数据或其它信息。接收器311b可耦接至处理器305以便将用户I/O从I/O装置314传递至处理器305。
处理器305可被配置用来访问app容器315。app容器315包含用以执行本文中描述的方法的软件代码,以及由调用(诸如,父)进程用来访问软件的API集合。访问可通过由应用程序309调用或以其他方式与应用程序309通信的函式调用、事件处理程序或类似物。举例来说,事件处理程序可检测通过接收器311a或311b读取的新数据的存在或可用性,且接着调用app容器315中的API以便处理数据。在处理数据之后,可将数据供应至应用程序309以用于进一步处理或分析。app容器315可托管在移动装置301内的存储器(例如,包含存储器307或不同存储器)中,或可远程地托管且可由移动装置301经由通信链路访问,如图3B中说明,或两者的某一组合。
app容器315可包含API,诸如发现和实例化API 317、结构管理器API 319、规则管理器API 321和配置管理器API 323。发现和实例化API 317提供对发现和实例化模块207的编程访问。结构管理器API 319提供对结构管理器模块209的编程访问。规则管理器API 321提供对规则管理器模块211的编程访问。配置管理器API 323提供对配置管理器模块213的编程访问。
服务器303可被配置用来通过处理器305和配置管理器API 323来使用配置管理器模块213,以便改变结构管理器模块209和/或规则管理器模块211内含有的规则。改变可包含(例如)对规则集的改变或对数据结构描述的改变。
图3B说明根据本公开的实施方案的处于相对高的硬件抽象层的系统350。与图3的系统300相比,系统350将app容器315存储在存储器353中,存储器353远离移动装置351,但经由通信链路355与移动装置351通信联系。移动装置351可包含通信接口(例如,有线以太网、无线Wi-Fi或蓝牙收发器等)以便使用如本领域技术人员已知的硬件和协议来与通信网络304和/或存储器353通信。系统350的其它元件已在系统300的相似编号的元件的情况下进行描述。
图4说明根据本公开的实施方案的使用系统300的过程400。过程400的至少一些步骤可由服务器303实践。过程400在步骤401处开始,在步骤401处授权用户302可向服务器303公开用于以下中的一者或多者的配置,且服务器303可接收用于以下中的一者或多者的配置:(A)将由规则管理器模块211实现的规则集;(B)将由结构管理器模块209实现的数据结构描述;以及(C)应用程序309。
过程400接下来过渡至步骤403,在步骤403处公开的结构和规则配置可与移动装置301同步。此同步可在大体上任何时间点发生。在应用程序309已在运行之后对移动装置的更新可发生,举例来说,如果新的医学研究指示应收集额外类型的数据或如果应执行所收集的数据的额外数据检查(例如,以补偿先前未辨识的每日偏差,或补偿病人可能服用的新的药物,等等)。在一个实施方案中,服务器303可接着将公开的信息汇编至app容器中以用于传输至移动装置301。在另一实施方案中,公开的信息可在同步过程(诸如过程500)(下文所描述)期间传送至移动装置301。将信息传送至移动装置301可针对将要收集的额外数据或数据集重复。一些数据(例如,血压测量)可包含可个别地具有某一值的成分(例如,心脏收缩和心脏舒张测量),但数据可具有较多值作为包含在大致相同时间测量的所有成分的集合。数据集还可包含同一过程但随着时间过去而重复的测量(例如,用力期间的脉率监测仪,或用餐期间的血糖监测仪)。
过程400接下来过渡至步骤405,在步骤405处服务器303将接着将公开的信息传输至应用程序309可存取的存储装置。在一些实施方案中,存储装置可在移动装置301内,如图3A中所说明。在其它实施方案中,存储装置可在移动装置351外部,如图3B中所说明。在过程400结束时,控制可转移至图5的过程500。
图5说明根据本公开的实施方案的使用系统300的过程500。过程500中的至少一些步骤可由移动装置301和/或移动装置301内的应用程序309实践。尽管过程500是参考将app容器315存储于移动装置301内而描述的,但本领域技术人员将认识到如何调试过程500以包含移动装置301外部的存储。过程500在步骤501处开始,在步骤501处移动装置301从服务器303接收app容器315。app容器315包含用以访问app容器315中的软件的API。
过程500接下来过渡至步骤503,在步骤503处将在步骤501处接收的容器存储在移动装置301内的应用程序309可存取的存储器中。
过程500接下来过渡至步骤505,在步骤505处应用程序309启动。app容器315内的个别API可用于供应用程序309使用以便创建数据结构,创建和更新数据,以及验证数据以便帮助确保较高质量的数据。举例来说,应用程序309的软件开发者或授权用户302可使用可通过结构管理器API 319和规则管理器API 321访问的数据结构描述和规则集,以便开发或使用特定类型的mHealth应用程序(例如,糖尿病app)。使用app容器315帮助确保应用程序309确实能够以与其它类似的应用程序相同的方式管理数据一致性和数据质量。个别API形成可由多个应用程序309使用的功能接口的库以便提供用户体验的一致性和减少应用程序309上的开发时间。
app容器315可以是一般应用程序(即,在移动装置301上执行的软件,其不直接与源处的数据收集和清洗相关),其含有可配置的数据API、规则管理器API 321和(任选地)规则组件。规则组件指实际规则(例如,心脏收缩<190),而规则API指用以执行验证的方法的集合。app容器不需要先了解API实施的数据结构和相关联的规则的内容或配置,即,应用程序309内的数据结构和相关联的规则不存在硬编码。这允许应用程序309被设计和用以管理大体上任何类型的应用程序配置。
过程500接下来过渡至步骤507,在步骤507处应用程序309可使其本身与服务器303同步以便刷新应用程序309使用的数据结构和验证规则。举例来说,如果app容器315已不驻留于移动装置301内,那么当第一次执行应用程序309时可能需要刷新。如果app容器315已驻留以便服务应用程序309a,那么其可能不必安装另一app容器315来处理应用程序309b。如果app容器315已驻留,那么接着应用程序309可访问和更新用于应用程序309的应用程序类型的数据结构配置、规则集配置和用户数据信息。
过程500接下来过渡至步骤509,在步骤509处应用程序309可接着用从服务器303接收的配置来初始化本身且初始化规则管理器模块211和结构管理器模块209。
过程500接下来过渡至步骤509,在步骤509处应用程序309可接着根据所接收的配置正常地执行,且(例如)通过传感器313或用户I/O 314接受来自用户的信息。在应用程序309使用发现和实例化API 317创建数据结构的对象之后,此后对象将用以通过使用结构管理器API 319和规则管理器API 321来验证用户信息。
当更新的数据结构配置或规则集配置递送至移动装置301时,结构管理器API 319和规则管理器API 321可初始化以支持新的行为。因此实施方案在源处提供高质量的数据收集而不改变应用程序的源代码。需要改变的唯一事物是与应用程序相关联的配置信息。
根据本公开的实施方案对数据收集组织有用,数据收集组织本来可能消耗大量资源来清洗数据,因为在不实践本文中描述的实施方案的情况下在源处收集的数据是不可靠的。实施方案将帮助用户减少数据清洗的成本且改进依赖于可起作用的数据的应用程序可针对不同信息类型(例如,数据类型)收集和管理数据源处的数据的一致性。举例来说,对于一些保健相关的应用程序,大体上实时地需要信息以用于分析和病人参与。根据本公开的实施方案可使得数据能够在源处被收集,这可提供用于使数据可用的较简化的过程。
此外,根据本公开的实施方案促进管理和跟踪应用程序使用和健康信息以获得跨越多个app和多个用户群组的改进的病人护理。
本发明的实施方案包含具有耦接至一个或多个存储器的一个或多个处理单元的系统。一个或多个存储器可被配置用来存储软件,所述软件在由一个或多个处理单元执行时允许至少通过使用本文中描述的过程(至少包含图4至5和相关文本中的)来实践本发明。
所公开的方法可易于(诸如)通过使用对象或面向对象的软件开发环境在软件中实现,对象或面向对象的软件开发环境提供可在多种计算机或工作站平台上使用的便携式源代码。或者,所公开的系统可(诸如)通过使用标准逻辑电路或VLSI设计而部分地或完全地在硬件中实现。软件还是硬件可用以实现根据本发明的各种实施方案的系统可取决于各种因素,诸如系统的速度或效率要求、特定功能,以及所利用的特定软件或硬件系统。
尽管上述内容是针对本发明的实施方案,但可在不脱离本发明的基本范围的情况下设计本发明的其它和进一步实施方案。应理解,本文中描述的各种实施方案可结合描述的任何其它实施方案利用,而不脱离本文中含有的范围。此外,以上描述不希望为详尽的或将本发明限于所公开的精确形式。修改和变化按照以上教示是可能的或可从本发明的实践获取。某些示范性实施方案可通过使用开放列表来识别,开放列表包含指示列表项目是实施方案的代表和列表不希望表示除进一步实施方案之外的封闭列表的词语。此些词语可包含“例如”、“等”、“诸如”、“举例来说”、“等等”、“和类似物”等,以及如从周围的上下文将为显而易见的其它词语。
用于描述本申请案的元件、动作或指令不应解释为对本发明为至关重要的或必要的,除非明确地如此描述。而且,如本文中所使用,冠词“一”希望包含一个或多个项目。在希望仅一个项目的情况下,使用术语“一个”或类似语言。另外,如本文中所使用,在多个项目和/或多个项目种类的列表之前的术语“中的任一者”希望包含所述项目和/或项目种类个别地或结合其它项目和/或其它项目种类“中的任一者”、“中的任何组合”、“中的任何多个”和/或“中的多个的任何组合”。
此外,权利要求书不应视为限于所描述的次序或元件,除非如此陈述。另外,术语“构件”在任何权利要求中的使用希望援引35U.S.C.§112,
Figure BDA0000739897250000211
6且无词语“构件”的任何权利要求无此意图。

Claims (15)

1.一种清理数据的移动装置,其包括:
接收器,其用于收集将要清理的电子数据;
处理器,其耦接至所述接收器,所述处理器被配置用来接收由所述接收器收集的所述数据,并且被进一步配置用来从服务器接收应用程序容器,所述应用程序容器包含第一接口和第二接口;以及
存储器,其耦接至所述处理器,所述存储器被配置用来存储应用程序、配置文件以及包含所述第一接口和所述第二接口的所述应用程序容器,其中所述配置文件包括验证规则和数据结构,并且所述应用程序容器托管和支持若干应用程序配置的使用,
其中所述第一接口提供对实例化模块的编程访问,所述实例化模块由所述应用程序使用以在所述存储器中建立所述第一接口所需的对象,所述应用程序可操作以使用所述实例化模块的发现功能来了解根据所述第一接口所提供的配置而收集的数据的数据结构,
其中所述第二接口提供对配置管理器模块的编程访问,所述配置管理器模块被配置用来更新所述配置文件的数据结构和验证规则,其中所述配置文件由所述实例化模块使用以处理数据,并且其中所述应用程序的源代码不改变,并且
其中所述第一接口和所述第二接口可从所述应用程序调用以清理由所述接收器收集的所述数据,由此数据的清理包括被识别数据的识别和校正或移除。
2.如权利要求1所述的移动装置,其中所述实例化模块和所述配置管理器模块由所述移动装置托管。
3.如权利要求1所述的移动装置,其中所述实例化模块和所述配置管理器模块中的至少一者托管在所述移动装置外部。
4.如权利要求1所述的移动装置,其中所述第一接口和所述第二接口包括相应的应用程序接口(API)。
5.如权利要求1所述的移动装置,其进一步包括耦接至所述实例化模块的结构管理器模块,所述结构管理器模块被配置用来验证所述对象。
6.如权利要求5所述的移动装置,其进一步包括耦接至所述实例化模块的规则管理器模块,所述规则管理器模块被配置用来通过使用将由所述实例化模块处理的一个数据相对于另一数据进行比较的规则来验证由所述实例化模块处理的数据。
7.如权利要求6所述的移动装置,其中所述结构管理器模块和所述规则管理器模块可配置而不改变所述应用程序。
8.如权利要求7所述的移动装置,其中对所述结构管理器模块和所述规则管理器模块中至少一者的配置改变在不重新启动应用程序的情况下生效。
9.如权利要求7所述的移动装置,其中对所述结构管理器模块和所述规则管理器模块中至少一者的配置改变用算法确定。
10.如权利要求6所述的移动装置,其中所述结构管理器模块和所述规则管理器模块实时地操作以验证数据。
11.一种清理数据的方法,其包括:
提供包括耦接至存储器的处理器的移动装置,所述处理器被配置用来从服务器接收应用程序容器,所述应用程序容器包含第一接口和第二接口,所述存储器被配置用来存储应用程序、配置文件以及包含所述第一接口和所述第二接口的所述应用程序容器,其中所述配置文件包括验证规则和数据结构,并且所述应用程序容器托管和支持若干应用程序配置的使用;
通过耦接至处理器的接收器收集将要清理的电子数据,其中所述第一接口提供对实例化模块的编程访问,所述实例化模块由所述应用程序使用以在所述存储器中建立所述第一接口所需的对象,所述应用程序可操作以使用所述实例化模块的发现功能来了解根据所述第一接口所提供的配置而收集的数据的数据结构;
通过使用所述第二接口以通过所述处理器执行配置管理器模块来更新所述配置文件的数据结构和验证规则,其中所述配置文件由所述实例化模块使用以处理数据,并且其中所述应用程序的源代码不改变,
其中所述第一接口和所述第二接口可从所述应用程序调用以清理由所述接收器收集的所述数据,由此数据的清理包括被识别数据的识别和校正或移除。
12.如权利要求11所述的方法,其中所述实例化模块和所述配置管理器模块由所述移动装置托管。
13.如权利要求11所述的方法,其中所述实例化模块和所述配置管理器模块中的至少一者托管在所述移动装置外部。
14.如权利要求11所述的方法,其中处理由所述接收器收集的数据的步骤包括:验证所述对象。
15.如权利要求14所述的方法,其中处理由所述接收器收集的数据的步骤包括:
通过使用将一个数据相对于另一数据进行比较的规则来验证数据。
CN201510336585.9A 2014-06-17 2015-06-17 源处的数据收集和清洗 Active CN105320729B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/307,235 2014-06-17
US14/307,235 US20150363437A1 (en) 2014-06-17 2014-06-17 Data collection and cleaning at source

Publications (2)

Publication Number Publication Date
CN105320729A CN105320729A (zh) 2016-02-10
CN105320729B true CN105320729B (zh) 2020-10-20

Family

ID=53496399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510336585.9A Active CN105320729B (zh) 2014-06-17 2015-06-17 源处的数据收集和清洗

Country Status (5)

Country Link
US (1) US20150363437A1 (zh)
EP (1) EP2958037B1 (zh)
JP (1) JP6723692B2 (zh)
CN (1) CN105320729B (zh)
ES (1) ES2754323T3 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201409214D0 (en) * 2014-05-23 2014-07-09 Ibm A method and system for processing a data set
US9652489B2 (en) * 2014-08-26 2017-05-16 Bank Of America Corporation Compliance verification system
US9582301B2 (en) * 2014-09-17 2017-02-28 International Business Machines Corporation Method of defining javascript objects
JP6754626B2 (ja) * 2016-06-16 2020-09-16 株式会社 ミックウェア 情報通知システム、車輌異常通知システム、情報通知装置、情報通知制御方法、及びコンピュータプログラム
US11416801B2 (en) 2017-11-20 2022-08-16 Accenture Global Solutions Limited Analyzing value-related data to identify an error in the value-related data and/or a source of the error
CN110162385B (zh) * 2018-02-14 2023-07-04 微软技术许可有限责任公司 可动态刷新内存对象的处理框架
CN111259412B (zh) * 2020-01-09 2023-12-05 远景智能国际私人投资有限公司 权限控制方法、装置、计算机设备及存储介质
CN111984716B (zh) * 2020-08-20 2023-09-19 中国银行股份有限公司 交易数据采集方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452450A (zh) * 2007-11-30 2009-06-10 上海市电力公司 一种多源数据转换服务方法及其装置
US7890509B1 (en) * 2006-12-05 2011-02-15 First American Real Estate Solutions Llc Parcel data acquisition and processing
CN102257496A (zh) * 2009-12-07 2011-11-23 埃森哲环球服务有限公司 用于加速的数据质量增强的方法和系统
EP2590124A1 (en) * 2011-11-03 2013-05-08 Microsoft Corporation Domains for knowledge-based data quality solution

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3203701B2 (ja) * 1990-11-01 2001-08-27 インターナショナル・ビジネス・マシーンズ・コーポレーション コードセグメントのリンク方法とそのシステム及びコードセグメントのダイナミックリンク方法
US6314416B1 (en) * 1998-11-17 2001-11-06 Interface & Control Systems, Inc. Reconfigurable expert rule processing system
US8401874B2 (en) * 1999-06-23 2013-03-19 Koninklijke Philips Electronics N.V. Rules-based system for maternal-fetal care
US6965888B1 (en) * 1999-09-21 2005-11-15 International Business Machines Corporation Method, system, program, and data structure for cleaning a database table using a look-up table
US6513115B2 (en) * 1999-11-17 2003-01-28 International Business Machines Corporation System for reconfiguring an existing server process without ending and restarting
US6691138B1 (en) * 2000-06-21 2004-02-10 Bellsouth Intellectual Property Corporation Flexible configuration file manager
US6434419B1 (en) * 2000-06-26 2002-08-13 Sam Technology, Inc. Neurocognitive ability EEG measurement method and system
US7325190B1 (en) * 2000-10-02 2008-01-29 Boehmer Tiffany D Interface system and method of building rules and constraints for a resource scheduling system
US6975592B1 (en) * 2000-11-22 2005-12-13 Nortel Networks Limited Configurable rule-engine for layer-7 and traffic characteristic-based classification
US20040133460A1 (en) * 2001-02-13 2004-07-08 Suzanne Berlin Electronic acquisition system and method using a portal to facilitate data validation and to provide a universal client interface
DE10300760A1 (de) * 2002-01-23 2003-08-14 Siemens Vdo Automotive Corp Verfahren zum Erkennen eines fehlerhaft arbeitenden Tankfüllstandsmeldesystems
US20050065817A1 (en) * 2002-04-30 2005-03-24 Mihai Dan M. Separation of validated information and functions in a healthcare system
US7020804B2 (en) * 2002-12-03 2006-03-28 Lockheed Martin Corporation Test data generation system for evaluating data cleansing applications
US20050240354A1 (en) * 2003-08-27 2005-10-27 Ascential Software Corporation Service oriented architecture for an extract function in a data integration platform
US20050060372A1 (en) * 2003-08-27 2005-03-17 Debettencourt Jason Techniques for filtering data from a data stream of a web services application
US8217756B2 (en) * 2004-09-01 2012-07-10 Microsoft Corporation Rule-based filtering and alerting
US20060247944A1 (en) * 2005-01-14 2006-11-02 Calusinski Edward P Jr Enabling value enhancement of reference data by employing scalable cleansing and evolutionarily tracked source data tags
US7827206B2 (en) * 2005-11-03 2010-11-02 International Business Machines Corporation System and method for managing changes to business rules
US8768983B2 (en) * 2006-10-04 2014-07-01 International Business Machines Corporation Dynamic configuration of multiple sources and source types in a business process
US10621203B2 (en) * 2007-01-26 2020-04-14 Information Resources, Inc. Cross-category view of a dataset using an analytic platform
US20080306984A1 (en) * 2007-06-08 2008-12-11 Friedlander Robert R System and method for semantic normalization of source for metadata integration with etl processing layer of complex data across multiple data sources particularly for clinical research and applicable to other domains
CA2702085A1 (en) * 2007-10-08 2009-04-16 The Regents Of The University Of California Generation and dissemination of automatically pre-populated clinical notes
US9639331B2 (en) * 2008-07-09 2017-05-02 International Business Machines Corporation Service interface creation and modification for object-oriented services
US20100249551A1 (en) * 2009-03-31 2010-09-30 Nelicor Puritan Bennett LLC System And Method For Generating Corrective Actions Correlated To Medical Sensor Errors
US8150814B2 (en) * 2009-04-07 2012-04-03 Business Objects Software Ltd. System and method of data cleansing using rule based formatting
US8271106B2 (en) * 2009-04-17 2012-09-18 Hospira, Inc. System and method for configuring a rule set for medical event management and responses
US9032368B2 (en) * 2009-08-23 2015-05-12 Bank Of America Corporation Dynamic configuration system
CN102156893B (zh) * 2011-03-24 2013-05-08 大连海事大学 Rfid设备网络环境下采集数据的清洗系统及方法
CA2902649C (en) * 2013-03-15 2020-01-07 Julio Cesar SILVA Geographic utilization of artificial intelligence in real-time for disease identification and alert notification
US9503422B2 (en) * 2014-05-09 2016-11-22 Saudi Arabian Oil Company Apparatus, systems, platforms, and methods for securing communication data exchanges between multiple networks for industrial and non-industrial applications

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7890509B1 (en) * 2006-12-05 2011-02-15 First American Real Estate Solutions Llc Parcel data acquisition and processing
US8538918B1 (en) * 2006-12-05 2013-09-17 Corelogic Solutions, Llc Systems and methods for tracking parcel data acquisition
CN101452450A (zh) * 2007-11-30 2009-06-10 上海市电力公司 一种多源数据转换服务方法及其装置
CN102257496A (zh) * 2009-12-07 2011-11-23 埃森哲环球服务有限公司 用于加速的数据质量增强的方法和系统
EP2590124A1 (en) * 2011-11-03 2013-05-08 Microsoft Corporation Domains for knowledge-based data quality solution

Also Published As

Publication number Publication date
CN105320729A (zh) 2016-02-10
JP2016004586A (ja) 2016-01-12
EP2958037A1 (en) 2015-12-23
JP6723692B2 (ja) 2020-07-15
US20150363437A1 (en) 2015-12-17
EP2958037B1 (en) 2019-08-14
ES2754323T3 (es) 2020-04-17

Similar Documents

Publication Publication Date Title
CN105320729B (zh) 源处的数据收集和清洗
US9626277B2 (en) Anomaly analysis for software distribution
CN113407522B (zh) 一种数据处理方法、装置、计算机设备和计算机可读存储介质
US20210141705A1 (en) Detection and analysis of energy consumption of software applications
US9710322B2 (en) Component dependency mapping service
US20190266610A1 (en) Transaction management using machine learning and similarity analysis
US8893109B2 (en) Software distribution amongst medical devices taking into account dependencies between devices
US20140324530A1 (en) Method and system for detecting patters in data streams
US20160004517A1 (en) SOFTWARE DEVELOPMENT IMPROVEMENT TOOL - iREVIEW
US20150067153A1 (en) Remote monitoring of data facility in real-time using wireless sensor network
JP2018509709A (ja) 知識集約型データ処理システム
US9075687B1 (en) System and methods for declaration-based extension management for multi-tenant environments
US11424023B2 (en) Scalable and traceable healthcare analytics management
WO2006002465A1 (en) Method, apparatus, system and computer program product for cluster detection
Cinque et al. Debugging‐workflow‐aware software reliability growth analysis
CN107656750A (zh) 插件更新方法及装置
JP6015750B2 (ja) ログ収集サーバ、ログ収集システム、ログ収集方法
US20200301702A1 (en) System and method for merging specification files for an application programming interface
US20230237366A1 (en) Scalable and adaptive self-healing based architecture for automated observability of machine learning models
JP6707004B2 (ja) 企業のブループリントを生成するシステム及び方法
US10719308B1 (en) System and method for dynamically monitoring a configuration of a server computing device
EP3591481A1 (en) Device configuration management apparatus, system, and program
US20170235771A1 (en) Systems and methods for electronic mail communication based data management
US10691521B2 (en) Using telemetry to drive high impact accessibility issues
US20220357932A1 (en) Dependency-based automated data restatement

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: American Connecticut

Applicant after: IMS HEALTH Inc.

Address before: American Connecticut

Applicant before: IMS Co.,Ltd.

Address after: American Connecticut

Applicant after: IMS Co.,Ltd.

Address before: American Connecticut

Applicant before: IMS HEALTH Inc.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant