CN106663144A - 用于基于相互相关性进行分层数据分析的方法和装置 - Google Patents

用于基于相互相关性进行分层数据分析的方法和装置 Download PDF

Info

Publication number
CN106663144A
CN106663144A CN201580046475.7A CN201580046475A CN106663144A CN 106663144 A CN106663144 A CN 106663144A CN 201580046475 A CN201580046475 A CN 201580046475A CN 106663144 A CN106663144 A CN 106663144A
Authority
CN
China
Prior art keywords
attribute
correlation
data
classification
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580046475.7A
Other languages
English (en)
Inventor
周子捷
Q·Z·林
T·M·陈
Y·贾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN106663144A publication Critical patent/CN106663144A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明总体上涉及由用户基于相关性分析选择的访问数据。在本发明中提出了引入属性值规范化和基于属性之间的相互相关性的分层数据分析。属性的标度值到标称值的规范化提供了针对属性之间的相关性的假设的基础,因此科学地证明进一步的观察和比较。多层分层调查使得不仅能够在属性的水平山,而且能够在有关数据的水平上进行分析,这提供了更加详细的观察。

Description

用于基于相互相关性进行分层数据分析的方法和装置
技术领域
本发明总体上涉及基于相关性分析来评估感兴趣数据,尤其是基于海量数据的相关性分析来评估感兴趣临床数据。
背景技术
现今,医院中盛行的电子信息系统使得能够收集海量数据以用于分析。相关性是关键性分析方法以调查所收集的数据之间的相互影响,用于生成对观察、预测、诊断和其他用途有用的新的知识。然而,需要使用不同种类的相关性计算方法来处理从数据类型(例如,数值、标称等)的数据库提取的数据,这对于比较来说是不合适的。此外,如此大量的信息,例如具有每患者的超过200个数据属性的CVIS(心血管信息系统),要求良好设计的结构以向对调查相应特性和影响感兴趣的用户呈现数据和数据之间的相关性。
美国专利2013/0138592A1公开了一种用于海量数据处理的方法,其用于通过使用多个属性来生成关系图并从关系图提取子图以表示假设,其中,相关性是基于数据属性的依赖性分类来生成。此外,相关性值(被表达为p值)被用于统一地表示由不同的统计测试估计的相关性,所述相关性是依赖于有关属性的特定数据类型来决定的。然而,尽管相关性值(被表达为p值)能够根据解决不同假设的各种统计测试生成,但是所谓的统一的相关性值并不反映一致的定量值或假设,并且因此对于比较并不是合理的。依赖性分类确实减少了所提供的相关性,从而增强了用户方便性,但是它们也抑制了对数据类型的潜在依赖性和数据中包含的信息的丢失部分的调查。此外,没有为数据处理提供分层分析,并且所有的数据处理都是在属性水平上执行的,使得分析效率低下且不完整。
美国专利2012/215455A1公开了一种方法,其涉及利用通信模块来接收至少一个位置信号,利用时间戳将从所述位置信号获得的地理空间数据存储在存储器中,并且利用所述通信模块从传感器接收随时间的生物医学信号。利用时间戳将来自所接收的生物信号的生物医学数据存储在所述存储器中。对位置信号的接收和对来自所述位置的地理空间数据的存储在不同的地理位置中进行重复。
“The use of multiple correspondence analysis to explore associationsbetween categories of qualitative variables in healthy ageing”(PatricioSoares Costa等人,Journal of aging research,卷2013,302163,2013年,XP55190591)公开了一种用于在检测和表示用于调查认知老化的大数据集中的下层结构中图示多个对应性分析(MCA)的适用性的研究。
发明内容
因此,期望提供高效的方法和装置来促进对数据的完整调查并以清楚且简单的方式来呈现用户感兴趣的信息。
为了更好的解决这些关心问题中的一个或多个,根据本发明的一个方面的实施例,提供了用于基于相互相关性进行分层数据分析的装置和方法。
一种用于基于相互相关性进行数据分析的装置,所述数据包括多个属性,所述装置包括:
规范化器,其适于将数据集中的每个数据的属性规范化为标称值;
计算器,其适于基于所述属性的经规范化的标称值来计算所述数据集中的每个数据的所述属性之间的相关性;
第一生成器,其适于生成类别以及所述类别之间的相关性的第一图形,每个类别包括基于预定义的规则的经分类的属性,所述类别之间的每个相关性是相应类别的属性之间的平均相关性;或者适于生成推荐的属性的第一图形;
第二生成器,其适于生成由用户从所述第一图形选择的第一属性、有关属性以及所述第一属性与所述有关属性之间的所述相关性的第二图形,所述第一属性与每个有关属性之间的所述相关性高于预定义的相关性阈值;
第三生成器,其适于基于所述第一属性的值和由用户从所述第二图形选择的至少第二属性的值来生成有关数据的统计学分布的第三图形,有关数据包括所述第一属性和至少所述第二属性。
所述统计学分布被呈现在坐标平面中,其中,所述第一属性和至少所述第二属性的属性的每个值组合以及针对每个值组合的对应的统计学结果由坐标轴值和统计指示符的至少有区别的视觉性质来表示,所述统计指示符指示所述第一属性和至少所述第二属性的属性的值组合以及对应于所述值组合的统计学结果。
在本发明中提出了引入对属性的值的规范化和用于基于属性之间的相互相关性进行数据分析的分层分析装置。属性的标度值到标称值的规范化提供了针对属性的相关性的假设的基础,使得进一步的观察和比较被科学地证明。多层分层调查使得不仅能够在属性水平上进行分析,而且能够分析有关数据,这提供了更加详细的观察,其使得海量数据分析高效且完整。
在一个实施例中,所述规范化是基于领域知识的。
基于领域知识的标度值到标称值的规范化使得数据分析在医学上更加有意义且高效。代替于标度值,标称值给出对属性的状态的直接且简单的定义,例如“正常”或“异常”,这使得分析是更好地可感知的。
在一个实施例中,推荐基于选择频率或医学指南。
在一个实施例中,所述装置还包括第四生成器,所述第四生成器适于基于所述第一属性和至少所述第二属性的由用户选择的值来生成有关的数据的列表,有关数据包括所述第一属性和至少所述第二属性。
所述装置提供一个额外的层,以观看有关数据的内容,这完成了对属性的类别/顶部属性、属性、有关属和数据内容的完整调查。其使得用户能够充分利用可获得的数据中包含的所有信息。
在一个实施例中,两个属性之间的相关性由连接所述两个属性的相关性指示符来呈现,所述相关性指示符的视觉性质基于相关性值。
借助于每个相关性指示符的(?)视觉性质,属性之间的相关性值的即时可视化促进对属性之间的复杂关系的方便理解。
本发明包括一种基于相互相关性进行数据分析的方法,所述数据包括多个属性(?),所述方法包括:
将数据集中的每个数据的属性规范化为标称值;
基于所述属性的经规范化的标称值来计算所述数据集中的每个数据的所述属性之间的相关性;
生成类别以及所述类别之间的相关性的第一图形,每个类别包括基于预定义的规则的经分类的属性,所述类别之间的每个相关性是相应类别的属性之间的平均相关性;或者生成推荐的属性的第一图形;
生成由用户从所述第一图形选择的第一属性、有关属性以及所述第一属性与所述有关属性之间的所述相关性的第二图形,所述第一属性与每个有关属性之间的所述相关性高于预定义的相关性阈值;
基于所述第一属性的值和由用户从所述第二图形选择的至少第二属性的值来生成有关数据的统计学分布的第三图形,所述有关数据包括所述第一属性和至少所述第二属性。
以下更详细描述了本公开的各个方面和特征。而且,根据说明书并参考附图,本发明的其他目标和优点将变得显而易见且容易理解。
附图说明
下文将结合实施例并参考附图来更加详细地描述和解释本发明,其中:
图1是示出本发明的实施的用于基于相互相关性进行3层数据分析的装置的示意图;
图2是示出推荐的属性的第三图形的示意图。
图3(a)是示出属性的类别和类别之间的相关性的第三图形的示意图。
图3(b)是示出属性的类别和类别之间的相关性的第三图形的示意图。其中,选定的类别的属性被进一步显示。
图4(a)是示出第一属性、有关属性以及第一属性与第一有关属性之间的相关性的第一图形的示意图。
图4(b)是示出基于第一图形的第二属性的值的有关数据的统计学结果的第二图形的示意图,有关数据包括第一属性和第二属性。
图5(a)是示出第一属性、有关属性以及第一属性与第一有关属性之间的相关性的第一图形的示意图。
图5(b)是示出基于第一图形的第二属性和第三属性的值的有关数据的统计学结果的第二图形的示意图,有关数据包括第一属性、第二属性和第三属性。
图6是示出本发明的实施例的用于基于相互相关性进行3层数据分析的方法的示意图。
在附图中,相同的附图标记指示相似或对应的特征和/或功能。
具体实施方式
将关于特定实施例并参考特定附图来描述本发明,但是本发明并不限于这些实施例和附图,而仅由权利要求限制。所描述的附图仅仅是示意性的而非限制性的。在附图中,为了图示目的,元件中的一些的尺寸可以被夸大而不必是按比例绘制的。
图1是示出根据本发明的实施例的用于基于相互相关性进行3层(类别/推荐-属性-数据)数据分析以调查相互影响的装置的示意图。用于本发明的分析的临床数据包括多个属性,所述多个属性中的每个包含以下中的一项:特定患者的人口统计学信息、生活方式信息、医学信息、护理提供者信息、历史和风险因子信息、先前访问信息、流程信息等。医学信息包括患者的基本健康信息、病变信息、设备信息和随访信息。每个属性的值能够是标称类型或标度类型。标称类型是关于幅值不连续的、不可测量的且不可辨别的一种值。例如,诸如性别、家乡、雇佣状态的大多数人口统计学信息和如医学类型、病变类型、所使用的设备的一些医学历史信息是标称的,其并不能够以数值方式进行测量。相反,标度类型是关于幅值连续的、可测量的且可辨别的一种值。例如,诸如年龄的人口统计学信息和诸如药物的剂量、病变描述参数的医学历史信息是标度类型信息,其能够以数值方式测量。以上描述的多个数据构成数据集,作为本发明的分析目标。规范化器101将所有属性的值规范化成在统一标准下的标称值,以提供用于进一步分析的普遍地可比较的基础。统一标准是基于领域知识的。例如,根据临床指南(例如,美国心脏病学会(ACC)指南)和/或由心脏病专家在考虑本地标准的情况下的输入将标度值转换成“正常”和“异常”。利用指南和/或专家输入,能够根据组合多个属性来导出额外的属性,例如,能够根据CTO是否被执行(是/否)以及流程后,生物标记,TIMI是否为3来导出标称CTO结果(成功的/失败的/没有CTO)。利用统一的标准化(标度值被转换成标称值),在关于所有属性的一个假设下生成属性的值,证明用于属性的校正分析的合理的基础。基于属性的转换额值,计算器102计算属性之间的相关性。能够采用适于标称值的统计方法来进行计算,例如,卡方检验法、费舍尔精确检验法、二项式检验法、秩和检验法等。基于针对所有属性的普遍假设生成的相关性是在科学上有意义的且可比较的。
第一生成器103生成类别和类别之间的相关性的第一图形。属性基于预定义的规则或数据注册分类被分类成类别,所述预定义的规则或数据注册分类能够基于临床活动、关于经济因子的信息、生活方式分类、随访信息、历史和风险因子、解剖信息、病变信息、设备信息、事件/并发症信息等的定义。然后,呈现类别和类别之间的相关性以给出针对类别的依赖性关系的总览。类别之间的相关性基于被分类到每个类别的属性的相关性值。关于一个实施方式,被分类到每个类别的属性之间的平均相关性值能够被用于表示类别之间的相关性。在选择一个类别之后,由用户选择的类别的属性被显示。属性的类别被实施为被处理(?)以用于数据分析的顶层,这减少了用于选择和观察的选取。与感兴趣类别的属性的进一步显示一起,分析流程在找到用户的感兴趣的属性方面对于用户而言变得更高效。作为备选,用于数据分析的第一层也能够例如根据临床推荐、专家建议或根据相关性或其他准则的计算初步选出而被实施为受限的推荐的属性的列表。此外,能够采用数据的预处理器来将数据的结构进行统一作为针对数据分析的先决条件。各种电子信息系统可用于在医院中使用,例如,CIS(临床信息系统)、LIS(实验室信息系统)、RIS(放射信息系统)等,其得到各种数据格式。关于跨不同信息系统的数据分析,期望统一的结构以提供用于所有数据的共同基础,因此实现用于所有数据的特定属性的相关性分析。统一的结构能够被设计为对可获得的信息系统可能的所有属性的整合,并且值填塞将被执行以形成用于与原始的那些相比较的丢失属性的新的统一的数据。例如,零能够被填塞到针对新生成的数据丢失的属性。
第二生成器104生成第一属性、有关属性以及第一属性与第一有关属性之间的相关性的第二图形。第一属性是由用户出于偏好选择的属性。有关属性是这样的属性:其与第一(?)属性的相关性高于预定义的相关性阈值。例如,通过统计显著性将适于标称值的统计学方法的相关性值呈现为p值,并且通常接受的阈值被设置为0.05。它们之间的相关性被呈现用于进一步调查。以清楚且简单的方式提供了由用户选择的属性及其有关属性的可视化。
第三生成器105基于由用户选择的第二图形的第一属性和至少第二属性的值来生成有关数据的统计学分布的第三图形,其中,有关数据包括第一属性和至少第二属性。第二生成器104实施对关于由用户选择的属性的数据的详细调查,以从统计学观点提供有关数据的更多信息。能够部署第四生成器(未在图1中图示)来呈现基于针对第一属性、第二属性和/或第三属性的由用户选择的值的数据列表。
图2、图3(a)和图3(b)是第三层数据分析的用户接口的实施方式。图2是示出推荐的属性的第一图形的示意图。选择窗口301被设置用于选取第三层分析,其能够要么是顶部5个结果量度要么是归类。关于顶部5个结果量度,它们是基于预定义的规则推荐的,例如是基于它们被选择的频率或基于医学指南来推荐的。然后,根据属性(属性01~属性05)呈现的显示区302被推荐。图3(a)和图3(b)是示出属性的类别、类别之间的相关性的第一图形的示意图,并且它们还显示由用户选择的类别的属性。如果通过选择窗口301选取类别,则在经分类的类别(类别01~类别05)中向用户呈现所有属性,以选取他的偏好。并且,在连接两者类别的相关性指示符中呈现类别之间的相关性。实施例的相关性指示符是线的形式。线的厚度表示类别之间的相关性值。具有太弱(亦即,低于特定阈值)相关性的类别将不具有连接线。例如,类别02与类别05之间的线比类别02与类别04之间的线细,这指示类别02与类别04之间的相关性比与类别05之间的相关性强。也能够通过其他视觉性质或指示符的其他形状来呈现相关性值。视觉性质能够是颜色、亮度、填充样式或其他。形状能够是条形、链状或其他。在选取一个类别(例如,类别03)之后,被分类到类别03的所有属性(属性03、属性06、属性07、属性08、属性09)的列表被显示在类别03之下以用于由用户进一步选择(所述用户在这种情况下选择选定的类别07)。图2、图3(a)和图3(b)是数据分析分层的顶层的实施例以增强有效性。
图4(a)和图4(b)是具有由用户选择的第一属性和第二属性的第二和第三层数据分析的用户接口的实施方式。图4(a)是示出第一属性、有关属性以及第一属性与有关属性之间的相关性的第二图形的示意图。接口包括属性显示区401、属性选择显示窗口402和图表按钮403。属性显示区401被用于显示所生成的第一图形。由用户选择的第一属性是属性07,其被定位在中心中。由点线4011~4015分割的每个区被分配给根据特定准则(例如,在一个实施例中为上升的统计显著性)分类的一个类别的有关属性。例如,由点线4012和点线4013分割的区是被分配给类别03的有关属性(属性03、属性06、属性07、属性08、属性09)的区。此外,经分类的有关属性被分散在两侧上。位于左侧的有关属性是只与由用户选择的属性07相关的属性。位于右侧的有关属性是与包括由用户选择的属性07的多个属性相关的属性。然后,属性02被选择为由用户从第二图形选择的第二属性。在在图4(a)中选择任何属性之前,在属性之上悬停将触发要沿着线(附图中未示出)显示的详细信息(例如,诸如p值和相关性强度的统计显著性)。每当属性被选择为由用户选择的属性时,其将被显示在属性选择显示窗口402中。图表按钮403使得能够示出有关属性的统计学分布。图4(b)基于从第一图形选择的第一属性的值、从第二图形选择的第二属性的值和包括第一属性的有关数据来示出有关数据的统计学结果的第三图形,其中,有关数据包括第一属性和第二属性。接口包括统计学分布显示区501和属性选择显示窗口502。图表是基于属性07和属性02的不同值的条形图。属性07的值是“正常”或“异常”,并且属性02的值是“是”或“否”,这得到四种组合。而且,分别针对四种组合由条形形状统计学指示符5011~5014所呈现的符合的有关数据分布被示出在坐标平面中,其中,y轴表示针对对应的组合的有关数据的数量,x轴表示第一属性07的值,并且颜色表示第二属性02的值。能够进行另外的动作以示出由用户选择的特定组合的数据的列表(未图示)以供调查。能够通过点击表示组合的条形指示符或来自用户的输入来实施动作。
图5(a)和图5(b)是具有由用户选择的第一属性、第二属性和第三属性的第一和第二层数据分析的用户接口的实施方式。对于图6(a),唯一的差异在于选择由用户选择的第三属性,其中,由用户选择的第三属性是属性09,其值要么是“是”要么是“否”。这得到八个组合。对于图5(b),符合的有关数据分布和8个组合被示出在坐标平面中,其中,y轴表示针对对应组合的有关数据的数量,x轴表示第一属性的值,并且颜色表示第二属性和第三属性的值。
关于第一属性的更多属性能够被涉及以用于统计学分布分析,并且诸如强度和填充样式的统计学性质的更多视觉性质能够被用于表示属性的值的更多组合。
图6是示出在本发明的实施例中的用于基于相互相关性进行3层数据分析的方法的示意图。本发明包括基于相互相关性进行数据分析的方法,所述数据包括多个属性,所述方法包括:
步骤101:将数据集中的每个数据的属性规范化为标称值;
步骤102:基于所述属性的经规范化的标称值来计算所述数据集中的每个数据的属性之间的相关性;
步骤103:生成类别以及所述类别之间的相关性的第一图形,每个类别包括基于预定义的规则的经分类的属性,所述类别之间的每个相关性是相应类别的属性之间的平均相关性;或者生成推荐的属性的第一图形;
步骤104:生成由用户从所述第一图形选择的第一属性、有关属性以及所述第一属性与所述有关属性之间的所述相关性的第二图形,所述第一属性与每个有关属性之间的所述相关性高于预定义的相关性阈值;
步骤105:基于所述第一属性和由用户从所述第二图形选择的至少第二属性的值来生成有关数据的统计学分布的第三图形,所述有关数据包括所述第一属性和至少所述第二属性。
本领域技术人员通过研究附图、公开内容以及权利要求,在实践请求保护的发明时能够理解并实现对所公开的实施例的其他变型。在权利要求书中,“包括”一词不排除其他元件或步骤,并且词语“一”或“一个”不排除多个。单个处理器或其他单元可以履行在权利要求中记载的若干项的功能。尽管在互不相同的从属权利要求中记载了某些措施,但是这并不指示不能有利地使用这些措施的组合。计算机程序可以被存储/分布在合适的介质上,例如与其他硬件一起或作为其他硬件的部分供应的光学存储介质或固态介质,但是也可以被以其他形式分布,例如经由因特网或其他有线或无线的电信系统分布。权利要求中的任何附图标记都不应被解释为对范围的限制。

Claims (11)

1.一种用于基于相互相关性进行分层数据分析的装置,所述数据包括多个属性,所述装置包括:
规范化器,其适于将数据集中的每个数据的属性规范化为标称值;
计算器,其适于基于所述属性的经规范化的标称值来计算所述数据集中的每个数据的所述属性之间的相关性;
第一生成器,其适于生成类别以及所述类别之间的相关性的第一图形,每个类别包括基于预定义的规则的经分类的属性,所述类别之间的每个相关性是相应类别的属性之间的平均相关性;或者适于生成推荐的属性的第一图形;
第二生成器,其适于生成由用户从所述第一图形选择的第一属性、相关的属性以及所述第一属性与所述相关的属性之间的所述相关性的第二图形,所述第一属性与每个相关的属性之间的所述相关性高于预定义的相关性阈值;
第三生成器,其适于基于所述第一属性的值和由用户从所述第二图形选择的至少第二属性的值来生成所述相关的数据的统计学分布的第三图形,所述相关的数据包括所述第一属性和至少所述第二属性;
其中,所述数据是医学数据。
2.根据权利要求1所述的装置,其中,所述标称值是基于预定义的诊断规则确定的。
3.根据权利要求1或2所述的装置,其中,所述第一图形的所述属性是根据由用户对每个属性的选择频率或医学指南推荐的。
4.根据权利要求1至3中的任一项所述的装置,还包括第四生成器,其适于基于所述第一属性和至少所述第二属性的由用户选择的值来生成相关的数据的列表,有关数据包括所述第一属性和至少所述第二属性。
5.根据权利要求1至4中的任一项所述的装置,其中,由连接两个类别或属性的相关性指示符来呈现所述两个类别或属性之间的所述相关性,所述相关性指示符的视觉性质基于所述两个类别或属性之间的所述相关性的值。
6.一种基于相互相关性进行分层数据分析的方法,所述数据包括多个属性,所述方法包括以下步骤:
将数据集中的每个数据的属性规范化为标称值;
基于所述属性的经规范化的标称值来计算所述数据集中的每个数据的所述属性之间的相关性;
生成类别以及所述类别之间的相关性的第一图形,每个类别包括基于预定义的规则的经分类的属性,所述类别之间的每个相关性是相应类别的属性之间的平均相关性;或者生成推荐的属性的第一图形;
生成由用户从所述第一图形选择的第一属性、相关的属性以及所述第一属性与所述相关的属性之间的所述相关性的第二图形,所述第一属性与每个相关的属性之间的所述相关性高于预定义的相关性阈值;
基于所述第一属性的值和由用户从所述第二图形选择的至少第二属性的值来生成所述相关的数据的统计学分布的第三图形,所述相关的数据包括所述第一属性和至少所述第二属性;
其中,所述数据是医学数据。
7.根据权利要求6所述的方法,其中,所述标称值是基于预定义的诊断规则确定的。
8.根据权利要求6或7所述的方法,其中,所述第一图形的所述属性是根据由用户对每个属性的选择频率或医学指南推荐的。
9.根据权利要求6至8中的任一项所述的方法,还包括以下步骤:基于所述第一属性和至少所述第二属性的值来生成有关数据的列表,所述有关数据包括所述第一属性和至少所述第二属性。
10.根据权利要求6至9中的任一项所述的方法,其中,由连接两个类别或属性的相关性指示符来呈现所述两个类别或属性之间的所述相关性,所述相关性指示符的视觉性质基于所述两个类别或属性之间的所述相关性的值。
11.一种包括计算机程序代码单元的计算机程序产品,所述计算机程序代码单元用于在所述计算机程序代码单元在计算机上运行时,令所述计算机执行根据权利要求6所述的方法的步骤。
CN201580046475.7A 2014-08-29 2015-08-27 用于基于相互相关性进行分层数据分析的方法和装置 Pending CN106663144A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN2014085560 2014-08-29
CNPCT/CN2014/085560 2014-08-29
EP14194063.5 2014-11-20
EP14194063 2014-11-20
PCT/EP2015/069574 WO2016030436A1 (en) 2014-08-29 2015-08-27 Method and apparatus for hierarchical data analysis based on mutual correlations

Publications (1)

Publication Number Publication Date
CN106663144A true CN106663144A (zh) 2017-05-10

Family

ID=54064305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580046475.7A Pending CN106663144A (zh) 2014-08-29 2015-08-27 用于基于相互相关性进行分层数据分析的方法和装置

Country Status (7)

Country Link
US (1) US20170220525A1 (zh)
EP (1) EP3186737A1 (zh)
JP (1) JP6644767B2 (zh)
CN (1) CN106663144A (zh)
BR (1) BR112017003766A2 (zh)
RU (1) RU2703959C2 (zh)
WO (1) WO2016030436A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11263230B2 (en) 2017-09-29 2022-03-01 Koninklijke Philips N.V. Method and system of intelligent numeric categorization of noisy data
EP3477659A1 (en) 2017-10-27 2019-05-01 Koninklijke Philips N.V. A method and system of intelligent numeric categorization of noisy data
CN110079490A (zh) * 2019-03-29 2019-08-02 石河子大学 一种卡介苗PhoPR基因过表达菌株的构建及其用途
US11243969B1 (en) * 2020-02-07 2022-02-08 Hitps Llc Systems and methods for interaction between multiple computing devices to process data records

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998045775A1 (en) * 1997-04-08 1998-10-15 1215627 Ontario Inc. Knowledge-based information retrieval system
US5941820A (en) * 1994-01-03 1999-08-24 Zimmerman; Steven Medical data display method
US6804609B1 (en) * 2003-04-14 2004-10-12 Conocophillips Company Property prediction using residual stepwise regression
CN101094335A (zh) * 2006-06-20 2007-12-26 株式会社日立制作所 电视节目推荐设备和电视节目推荐方法
US20080312845A1 (en) * 2007-05-14 2008-12-18 Abbott Diabetes Care, Inc. Method and apparatus for providing data processing and control in a medical communication system
CN101677376A (zh) * 2008-09-18 2010-03-24 三菱电机株式会社 节目推荐装置
CN103136440A (zh) * 2011-11-30 2013-06-05 国际商业机器公司 数据处理方法和装置
CN103907107A (zh) * 2011-05-27 2014-07-02 Avg技术捷克有限责任公司 用于推荐软件应用的系统和方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU7996787A (en) * 1986-10-20 1988-04-21 Book Data Ltd. Furnishing the identification of customers
US6993246B1 (en) * 2000-09-15 2006-01-31 Hewlett-Packard Development Company, L.P. Method and system for correlating data streams
EP1328889A4 (en) * 2000-10-11 2005-06-01 Healthtrio Inc SYSTEM FOR TRANSFERRING HEALTH CARE DATA
US8010663B2 (en) * 2008-11-21 2011-08-30 The Invention Science Fund I, Llc Correlating data indicating subjective user states associated with multiple users with data indicating objective occurrences
US9251685B2 (en) * 2011-02-17 2016-02-02 International Business Machines Corporation System and method for medical diagnosis using geospatial location data integrated with biomedical sensor information
RU2605387C2 (ru) * 2012-09-26 2016-12-20 Общество с ограниченной ответственностью "Колловэар" Способ и система для хранения данных графов

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5941820A (en) * 1994-01-03 1999-08-24 Zimmerman; Steven Medical data display method
WO1998045775A1 (en) * 1997-04-08 1998-10-15 1215627 Ontario Inc. Knowledge-based information retrieval system
US6804609B1 (en) * 2003-04-14 2004-10-12 Conocophillips Company Property prediction using residual stepwise regression
CN101094335A (zh) * 2006-06-20 2007-12-26 株式会社日立制作所 电视节目推荐设备和电视节目推荐方法
US20080312845A1 (en) * 2007-05-14 2008-12-18 Abbott Diabetes Care, Inc. Method and apparatus for providing data processing and control in a medical communication system
CN101677376A (zh) * 2008-09-18 2010-03-24 三菱电机株式会社 节目推荐装置
CN103907107A (zh) * 2011-05-27 2014-07-02 Avg技术捷克有限责任公司 用于推荐软件应用的系统和方法
CN103136440A (zh) * 2011-11-30 2013-06-05 国际商业机器公司 数据处理方法和装置

Also Published As

Publication number Publication date
US20170220525A1 (en) 2017-08-03
RU2017109914A3 (zh) 2019-04-04
WO2016030436A1 (en) 2016-03-03
RU2703959C2 (ru) 2019-10-22
BR112017003766A2 (pt) 2017-12-12
EP3186737A1 (en) 2017-07-05
JP6644767B2 (ja) 2020-02-12
RU2017109914A (ru) 2018-10-03
JP2017526065A (ja) 2017-09-07

Similar Documents

Publication Publication Date Title
US20180089376A1 (en) Systems and methods for visualizing data
RU2616985C2 (ru) Система и способ для поддержки принятия клинических решений для планирования терапии с помощью логического рассуждения на основе прецедентов
RU2533500C2 (ru) Система и способ для объединения клинических признаков и признаков изображений для диагностики с применением компьютера
US20160379511A1 (en) Differentially weighted modifiable prescribed history reporting apparatus, systems, and methods for decision support and health
CN107785057B (zh) 医疗数据处理方法、装置、存储介质和计算机设备
Luo et al. DiagTest3Grp: an R package for analyzing diagnostic tests with three ordinal groups
US20170169352A1 (en) State inference in a heterogeneous system
CN106599553A (zh) 疾病预警方法及装置
Antila et al. The PredictAD project: development of novel biomarkers and analysis software for early diagnosis of the Alzheimer's disease
US11037659B2 (en) Data-enriched electronic healthcare guidelines for analytics, visualization or clinical decision support
CN106663144A (zh) 用于基于相互相关性进行分层数据分析的方法和装置
CN107145715B (zh) 一种基于推举算法的临床医学智能判别装置
US9990469B2 (en) Inferring a state of a system over time
Staff et al. The completeness of electronic medical record data for patients with Type 2 Diabetes in primary care and its implications for computer modelling of predicted clinical outcomes
WO2016006042A1 (ja) データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム
US20140153795A1 (en) Parametric imaging for the evaluation of biological condition
CN111180027A (zh) 一种基于医疗大数据的患者画像相关性规则筛选方法及装置
US11037680B2 (en) Medical information processing apparatus and medical information processing method
US20230060794A1 (en) Diagnostic Tool
US11983947B2 (en) Generating document content by data analysis
Prajapati et al. Designing AI to Predict Covid-19 Outcomes by Gender
Fadeeva et al. A protocol for developing a complex needs indicator for veterans (CNIV) in the UK
Sams et al. Predictive modelling and its visualization for telehealth data–Concept and implementation of an interactive viewer
Cremerius et al. Data-Based Process Variant Analysis.
EP3975200A1 (en) Reduction of healthcare variation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination