CN111341454A - 数据挖掘方法和装置 - Google Patents

数据挖掘方法和装置 Download PDF

Info

Publication number
CN111341454A
CN111341454A CN201811551431.1A CN201811551431A CN111341454A CN 111341454 A CN111341454 A CN 111341454A CN 201811551431 A CN201811551431 A CN 201811551431A CN 111341454 A CN111341454 A CN 111341454A
Authority
CN
China
Prior art keywords
medical record
record data
parameters
regional
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811551431.1A
Other languages
English (en)
Other versions
CN111341454B (zh
Inventor
石晓东
高飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201811551431.1A priority Critical patent/CN111341454B/zh
Publication of CN111341454A publication Critical patent/CN111341454A/zh
Application granted granted Critical
Publication of CN111341454B publication Critical patent/CN111341454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提出一种数据挖掘方法和装置,涉及大数据分析技术领域。本公开的一种数据挖掘方法,包括:获取病历数据,病历数据中包括每条病历的用药参数和病症参数;根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。通过这样的方法,能够通过对病历数据的分析得到病历参数的关联关系,从而实现对病历数据的有效应用,以便于有针对性的诊断和调度医疗资源。

Description

数据挖掘方法和装置
技术领域
本公开涉及大数据分析技术领域,特别是一种数据挖掘方法和装置。
背景技术
目前医疗领域已经普遍采用电子病历,或将普通病历数据录入电子系统。电子病历多用于跟踪单个用户的病史、用药史,为医生了解病人状况带来了方便。
发明内容
发明人发现,相关技术中只是将病历数据归档存储,缺乏深层应用。由于生活习惯、气候习惯或年龄特点等因素的影响,病症可能会产生一些区域化、年龄相关化的特点,利用病历数据能够获取人群病症特点,从而有针对性的调度医疗资源和诊断。
本公开的一个目的在于增加对病历数据的有效应用,以便于有针对性的诊断和调度医疗资源。
根据本公开的一个方面,提出一种数据挖掘方法,包括:获取病历数据,病历数据中包括每条病历的用药参数和病症参数;根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。
可选地,病历数据中还包括患者画像信息,患者画像信息包括地域参数、性别参数、年龄参数、职业参数中的一项或多项。
可选地,数据挖掘方法还包括:根据参数关联关系指导病症诊断或用药。
可选地,确定相关度大于预定相关度门限的参数关联关系包括:将出现在同一份病历或同一患者的病历中的病历数据中的参数作为一同出现的项;获取支持度大于等于预定支持度门限的频繁项集,其中,支持度与预定相关度门限正相关。
可选地,获取支持度大于等于预定支持度门限的频繁项集包括:获取支持度大于等于预定支持度门限的2元频繁项集;在n-1元频繁项集的基础上获取n元频繁项集,直至n+1元频繁项集为空,其中,n为大于1的正整数。
可选地,获取病历数据包括:根据预定格式筛选、归一化初始病历数据,获取病历数据,其中,筛选初始病历数据包括:按照预定格式删除不完整的初始病历数据;归一化初始病历数据包括:将初始病历数据的格式归一化,相同病症的标识归一化,以及将相同药物的标识归一化。
可选地,确定相关度大于预定相关度门限的参数关联关系包括:将出现在同一患者的病历中的病历数据的每个参数分别作为项,生成病历向量;根据余弦相似度算法将患者分群,获取患者病历向量集合;根据同一患者病历向量集合,获取支持度大于等于预定支持度门限的频繁项集。
可选地,在病历数据中包括地域参数的情况下:根据地域参数与病症参数的相关度确定地域病症防疫策略;和/或,根据地域参数与药物参数的相关度确定地区药物供给策略。
通过这样的方法,能够通过对病历数据的分析得到病历参数的关联关系,从而实现对病历数据的有效应用,以便于有针对性的调度医疗资源和诊断。
根据本公开的另一个方面,提出一种数据挖掘装置,包括:病历数据获取单元,被配置为获取病历数据,病历数据中包括每条病历的用药参数和病症参数;关联关系确定单元,被配置为根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。
可选地,病历数据中还包括患者画像信息,患者画像信息包括地域参数、性别参数、年龄参数、职业参数中的一项或多项。
可选地,数据挖掘装置还包括:指导单元,被配置为根据参数关联关系指导病症诊断或用药。
可选地,关联关系确定单元被配置为:将出现在同一份病历或同一患者的病历中的病历数据中的参数作为一同出现的项;获取支持度大于等于预定支持度门限的频繁项集,其中,支持度与预定相关度门限正相关。
可选地,病历数据获取单元还被配置为:根据预定格式筛选、归一化初始病历数据,获取病历数据,其中,筛选初始病历数据包括:按照预定格式删除不完整的初始病历数据,归一化初始病历数据包括:将初始病历数据的格式归一化,相同病症的标识归一化,以及将相同药物的标识归一化。
可选地,关联关系确定单元还被配置为:将出现在同一患者的病历中的病历数据的每个参数分别作为项,生成病历向量;根据余弦相似度算法将患者分群,获取患者病历向量集合;根据同一患者病历向量集合,获取支持度大于等于预定支持度门限的频繁项集。
可选地,指导单元还被配置为:在病历数据中包括地域参数的情况下:根据地域参数与病症参数的相关度确定地域病症防疫策略;和/或,根据地域参数与药物参数的相关度确定地区药物供给策略。
根据本公开的又一个方面,提出一种数据挖掘装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行如上文中任意一种数据挖掘方法。
这样的装置能够通过对病历数据的分析得到病历参数的关联关系,从而实现对病历数据的有效应用,以便于有针对性的调度医疗资源和诊断。
根据本公开的再一个方面,提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上文中任意一种数据挖掘方法的步骤。
通过执行这样的计算机可读存储介质上的指令,能够通过对病历数据的分析得到病历参数的关联关系,从而实现对病历数据的有效应用,以便于有针对性的调度医疗资源和诊断。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本公开的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1为本公开的数据挖掘方法的一个实施例的流程图。
图2为本公开的数据挖掘方法的另一个实施例的流程图。
图3为本公开的数据挖掘方法中确定参数关联关系的一个实施例的流程图。
图4为本公开的数据挖掘方法中确定参数关联关系的一个实施例的示意图。
图5为本公开的数据挖掘装置的一个实施例的示意图。
图6为本公开的数据挖掘装置的另一个实施例的示意图。
图7为本公开的数据挖掘装置的又一个实施例的示意图。
具体实施方式
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
本公开的数据挖掘方法的一个实施例的流程图如图1所示。
在步骤101中,获取病历数据,病历数据中包括每条病历的用药参数和病症参数。在一个实施例中,病历数据的来源可以包括疾病诊断、处方明细、化验检查等。在一个实施例中,病历数据可以以一次就诊为单位,每条病历即一次就诊或化验等中产生的病历;病历数据还可以以人为单位,汇总一位患者的历史就诊数据作为一条病历数据。
在步骤102中,根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。在一个实施例中,参数关联关系可以包括用药与用药之间的关联关系,便于医生获取用药预期;可以包括病症与病症之间的关联关系,便于医生获取病症诊断预期;还可以包括用药与病症之间的关联关系,供医生针对病症参考用药。在一个实施例中,可以生成知识图谱方便查看。
通过这样的方法,能够通过对病历数据的分析得到病历参数的关联关系,从而实现对病历数据的有效应用,以便于有针对性的诊断和调度医疗资源。
在一个实施例中,病历数据中还可以包括患者画像信息,患者画像信息包括地域参数、性别参数、年龄参数、职业参数中的一项或多项。
通过这样的方法,不仅能够获得病症与病症、病症与用药、用药与用药之间的关联关系,还可以得到地域病症和用药特点、性别病症和用药特点、病症的年龄分布、职业病症特点等,进一步为医生的诊断、用药提出参考建议,从而进一步增强对病历数据的有效应用;另外,这样的关联关系还能够提供不同地域、年龄、参数、职业人群的健康状况、健康缺陷,进而及早预防,提高民众的健康水平。
在一个实施例中,根据地域参数与病症参数的相关度确定地域病症防疫策略,或者可以根据地域参数与药物参数的相关度确定地区药物供给策略,从而优化药物配置、疾病防治效果。
本公开的数据挖掘方法的另一个实施例的流程图如图2所示。
在步骤201中,根据预定格式筛选、归一化初始病历数据,获取病历数据。筛选初始病历数据可以包括:按照预定格式删除不完整的初始病历数据;归一化初始病历数据可以包括:将初始病历数据的格式归一化,相同病症的标识归一化,和相同药物的标识归一化。如表1所示:
表1 病历数据
名称 数据类型 字段名称 备注
A
B
C
表1为完成筛选和归一化处理后的病历数据,每条病历数据均可以处理为如表1所示的形式,其中A、B、C为参数的类型,如A为患者的画像参数标识,B为病症参数标识,C为用药参数标识。
对于书写不规范,或同义词表述的情况,采用数据字典将表述归一化,数据字典如表2所示。
表2 数据字典
名称 数据类型 包含 备注
A XX A1/A2/A3 XX
B XX B1/B2/B3 XX
C XX C1/C2/C3 XX
在步骤202中,将出现在同一份病历或同一患者的病历中的病历数据中的参数作为一同出现的项。
在步骤203中,获取支持度大于等于预定支持度门限的频繁项集。在一个实施例中,可以通过调节支持度来控制所需的参数之间的关联强度。如,若需要提高获取的参数关联关系的关联强度,则提高支持度门限;若需要获得更多的参数关联关系,放低对关联强度的要求,则可以降低支持度门限。
在步骤204中,根据参数关联关系指导病症诊断或用药。
通过这样的方法,能够克服电子病历机构不统一,格式多样化,不便于处理的问题,便于后期数据挖掘,还能够通过设置支持度门限能够控制目标关联程度,从而控制数据量,有助于有针对性的应用数据。
本公开的数据挖掘方法中确定参数关联关系的一个实施例的流程图如图3所示。
在步骤301中,将出现在同一份病历或同一患者的病历中的病历数据中的参数作为一同出现的项,并设i=1。
在步骤302中,令i=i+1,获取支持度大于等于预定支持度门限的i元频繁项集。
在步骤303中,判断i元频繁项集中是否存在项。若存在,则继续执行步骤302;若不存在,则执行步骤304。
在步骤304中,获取2~i元频繁项集,i为大于等于2的整数。
如图4所示,其中TID代表患者,Items Bought代表病历参数,如病症或用药。In为参数标识,sup为项集的出现次数,预定支持度门限为min_sup,假设min_sup=2。以图4中上方的病历数据为基础,逐渐获取二元频繁项集和三元频繁项集,从而得到两项参数间的关联关系、三项参数间的关联关系。
通过这样的方法,能够获取多元频繁项集,即获得多个参数之间的关联关系,充分发现病历的参数之间可能的关系,有助于医生发现隐藏病症,提高诊断的准确度,另外,对医学研究发现病症、药物间隐藏的关联关系也能产生有益效果。
在一个实施例中,可以将出现在同一患者的病历中的病历数据的每个参数分别作为项,生成病历向量,进而根据余弦相似度算法将患者分群,获取患者病历向量集合,根据同一集合获取支持度大于等于预定支持度门限的频繁项集,从而能够针对相似人群进行数据挖掘,实现有针对性的分析,提高生成多元频繁项集的概率,有助于为特定人群的医疗诊断提供参考意见,进一步便于有针对性的调度医疗资源。
本公开的数据挖掘装置的一个实施例的示意图如图5所示。
病历数据获取单元501能够获取病历数据,病历数据中包括每条病历的用药参数和病症参数。在一个实施例中,病历数据可以以一次就诊为单位,每条病历即一次就诊中产生的病历;病历数据还可以以人为单位,汇总一位患者的历史就诊数据作为一条病历数据。
关联关系确定单元502能够根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。在一个实施例中,参数关联关系可以包括用药与用药之间的关联关系,便于医生获取用药预期;可以包括病症与病症之间的关联关系,便于医生获取病症诊断预期;还可以包括用药与病症之间的关联关系,供医生针对病症参考用药。在一个实施例中,关联关系确定单元502可以采用如图2、3所示实施例中的方式确定参数关联关系。
这样的装置能够通过对病历数据的分析得到病历参数的关联关系,从而实现对病历数据的有效应用,以便于有针对性的诊断和调度医疗资源。
在一个实施例中,病历数据中还可以包括患者画像信息,患者画像信息包括地域参数、性别参数、年龄参数、职业参数中的一项或多项。
这样的装置不仅能够获得病症与病症、病症与用药、用药与用药之间的关联关系,还可以得到地域病症和用药特点、性别病症和用药特点、病症的年龄分布、职业病症特点等,进一步为医生的诊断、用药提出参考建议,从而进一步增强对病历数据的有效应用;另外,这样的关联关系还能够提供不同地域、年龄、参数、职业人群的健康状况、健康缺陷,进而及早预防,提高民众的健康水平。
在一个实施例中,如图5所示,数据挖掘装置还可以包括指导单元503,能够根据参数关联关系指导病症诊断或用药。另外,还可以根据地域参数与病症参数的相关度确定地域病症防疫策略,或者可以根据地域参数与药物参数的相关度确定地区药物供给策略,从而优化药物配置、疾病防治效果。
在一个实施例中,关联关系确定单元502还可以先将出现在同一患者的病历中的病历数据的每个参数分别作为项,生成病历向量,进而根据余弦相似度算法将患者分群,获取患者病历向量集合,再根据同一患者病历向量集合,获取支持度大于等于预定支持度门限的频繁项集,从而能够针对相似人群进行数据挖掘,实现有针对性的分析,提高生成多元频繁项集的概率,有助于为特定人群的医疗诊断提供参考意见,进一步便于有针对性的调度医疗资源。
本公开数据挖掘装置的一个实施例的结构示意图如图6所示。数据挖掘装置包括存储器601和处理器602。其中:存储器601可以是磁盘、闪存或其它任何非易失性存储介质。存储器用于存储上文中数据挖掘方法的对应实施例中的指令。处理器602耦接至存储器601,可以作为一个或多个集成电路来实施,例如微处理器或微控制器。该处理器602用于执行存储器中存储的指令,能够实现对病历数据的有效应用,以便于有针对性的调度医疗资源和诊断。
在一个实施例中,还可以如图7所示,数据挖掘装置700包括存储器701和处理器702。处理器702通过BUS总线703耦合至存储器701。该数据挖掘装置700还可以通过存储接口704连接至外部存储装置705以便调用外部数据,还可以通过网络接口706连接至网络或者另外一台计算机系统(未标出)。此处不再进行详细介绍。
在该实施例中,通过存储器存储数据指令,再通过处理器处理上述指令,能够实现对病历数据的有效应用,以便于有针对性的调度医疗资源和诊断。
在另一个实施例中,一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现数据挖掘方法对应实施例中的方法的步骤。本领域内的技术人员应明白,本公开的实施例可提供为方法、装置、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
至此,已经详细描述了本公开。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本公开的方法以及装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法以及装置。用于方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
最后应当说明的是:以上实施例仅用以说明本公开的技术方案而非对其限制;尽管参照较佳实施例对本公开进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本公开的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本公开技术方案的精神,其均应涵盖在本公开请求保护的技术方案范围当中。

Claims (17)

1.一种数据挖掘方法,包括:
获取病历数据,病历数据中包括每条病历的用药参数和病症参数;
根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。
2.根据权利要求1的方法,其中,病历数据中还包括患者画像信息,患者画像信息包括地域参数、性别参数、年龄参数、职业参数中的一项或多项。
3.根据权利要求1的方法,还包括:
根据参数关联关系指导病症诊断或用药。
4.根据权利要求1的方法,其中,确定相关度大于预定相关度门限的参数关联关系包括:
将出现在同一份病历或同一患者的病历中的病历数据中的参数作为一同出现的项;
获取支持度大于等于预定支持度门限的频繁项集,其中,支持度与预定相关度门限正相关。
5.根据权利要求4的方法,其中,获取支持度大于等于预定支持度门限的频繁项集包括:
获取支持度大于等于预定支持度门限的2元频繁项集;
在n-1元频繁项集的基础上获取n元频繁项集,直至n+1元频繁项集为空,其中,n为大于1的正整数。
6.根据权利要求1的方法,其中,获取病历数据包括:
根据预定格式筛选、归一化初始病历数据,获取病历数据,其中,筛选初始病历数据包括:按照预定格式删除不完整的初始病历数据;归一化初始病历数据包括:将初始病历数据的格式归一化、相同病症的标识归一化,以及将相同药物的标识归一化。
7.根据权利要求2的方法,其中,确定相关度大于预定相关度门限的参数关联关系包括:
将出现在同一患者的病历中的病历数据的每个参数分别作为项,生成病历向量;
根据余弦相似度算法将患者分群,获取患者病历向量集合;
根据同一所述患者病历向量集合,获取支持度大于等于预定支持度门限的频繁项集。
8.根据权利要求2的方法,在病历数据中包括地域参数的情况下:
根据地域参数与病症参数的相关度确定地域病症防疫策略;
和/或,
根据地域参数与药物参数的相关度确定地区药物供给策略。
9.一种数据挖掘装置,包括:
病历数据获取单元,被配置为获取病历数据,病历数据中包括每条病历的用药参数和病症参数;
关联关系确定单元,被配置为根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。
10.根据权利要求9的装置,其中,病历数据中还包括患者画像信息,患者画像信息包括地域参数、性别参数、年龄参数、职业参数中的一项或多项。
11.根据权利要求9或10的装置,还包括:
指导单元,被配置为根据参数关联关系指导病症诊断或用药。
12.根据权利要求9的装置,其中,关联关系确定单元被配置为:
将出现在同一份病历或同一患者的病历中的病历数据中的参数作为一同出现的项;
获取支持度大于等于预定支持度门限的频繁项集,其中,支持度与预定相关度门限正相关。
13.根据权利要求9的装置,其中,病历数据获取单元还被配置为:根据预定格式筛选、归一化初始病历数据,获取病历数据,其中,筛选初始病历数据包括:按照预定格式删除不完整的初始病历数据;归一化初始病历数据包括:将初始病历数据的格式归一化,相同病症的标识归一化,和相同药物的标识归一化。
14.根据权利要求10的装置,其中,关联关系确定单元还被配置为:
将出现在同一患者的病历中的病历数据的每个参数分别作为项,生成病历向量;
根据余弦相似度算法将患者分群,获取患者病历向量集合;
根据同一所述患者病历向量集合,获取支持度大于等于预定支持度门限的频繁项集。
15.根据权利要求11的装置,其中,指导单元还被配置为:在病历数据中包括地域参数的情况下:
根据地域参数与病症参数的相关度确定地域病症防疫策略;
和/或,
根据地域参数与药物参数的相关度确定地区药物供给策略。
16.一种数据挖掘装置,包括:
存储器;以及
耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行如权利要求1至8任一项的方法。
17.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至8任意一项的方法的步骤。
CN201811551431.1A 2018-12-19 2018-12-19 数据挖掘方法和装置 Active CN111341454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811551431.1A CN111341454B (zh) 2018-12-19 2018-12-19 数据挖掘方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811551431.1A CN111341454B (zh) 2018-12-19 2018-12-19 数据挖掘方法和装置

Publications (2)

Publication Number Publication Date
CN111341454A true CN111341454A (zh) 2020-06-26
CN111341454B CN111341454B (zh) 2023-07-25

Family

ID=71181375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811551431.1A Active CN111341454B (zh) 2018-12-19 2018-12-19 数据挖掘方法和装置

Country Status (1)

Country Link
CN (1) CN111341454B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112530533A (zh) * 2020-11-30 2021-03-19 北京百度网讯科技有限公司 病历文档检测方法、装置及电子设备
CN112652405A (zh) * 2020-12-24 2021-04-13 平安科技(深圳)有限公司 临床路径的挖掘方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018689A (ja) * 2003-06-30 2005-01-20 Web Intelligence Lab:Kk データマイニング方法
CN101324901A (zh) * 2008-08-06 2008-12-17 中国电信股份有限公司 数据挖掘方法、平台和系统
US20120209625A1 (en) * 2009-04-22 2012-08-16 Lead Horse Technologies, Inc. Artificial intelligence-assisted medical reference system and method
CN106202883A (zh) * 2016-06-28 2016-12-07 成都中医药大学 一种基于大数据分析建立疾病云图的方法
CN107392645A (zh) * 2017-06-20 2017-11-24 小草数语(北京)科技有限公司 用户挖掘方法、装置及其设备
CN108346471A (zh) * 2017-01-23 2018-07-31 中国移动通信有限公司研究院 一种病理数据的分析方法及装置
CN108389608A (zh) * 2018-02-08 2018-08-10 康美药业股份有限公司 药品推荐方法、电子设备和存储介质
CN108597614A (zh) * 2018-04-12 2018-09-28 上海熙业信息科技有限公司 一种基于中文电子病历的辅助诊断决策方法
CN108650684A (zh) * 2018-02-12 2018-10-12 中国联合网络通信集团有限公司 一种关联规则确定方法及装置
CN108806767A (zh) * 2018-06-15 2018-11-13 中南大学 基于电子病历的疾病症状关联分析方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018689A (ja) * 2003-06-30 2005-01-20 Web Intelligence Lab:Kk データマイニング方法
CN101324901A (zh) * 2008-08-06 2008-12-17 中国电信股份有限公司 数据挖掘方法、平台和系统
US20120209625A1 (en) * 2009-04-22 2012-08-16 Lead Horse Technologies, Inc. Artificial intelligence-assisted medical reference system and method
CN106202883A (zh) * 2016-06-28 2016-12-07 成都中医药大学 一种基于大数据分析建立疾病云图的方法
CN108346471A (zh) * 2017-01-23 2018-07-31 中国移动通信有限公司研究院 一种病理数据的分析方法及装置
CN107392645A (zh) * 2017-06-20 2017-11-24 小草数语(北京)科技有限公司 用户挖掘方法、装置及其设备
CN108389608A (zh) * 2018-02-08 2018-08-10 康美药业股份有限公司 药品推荐方法、电子设备和存储介质
CN108650684A (zh) * 2018-02-12 2018-10-12 中国联合网络通信集团有限公司 一种关联规则确定方法及装置
CN108597614A (zh) * 2018-04-12 2018-09-28 上海熙业信息科技有限公司 一种基于中文电子病历的辅助诊断决策方法
CN108806767A (zh) * 2018-06-15 2018-11-13 中南大学 基于电子病历的疾病症状关联分析方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
倪东: "基于数据挖掘的关联规则研究", 《太原学院学报》, vol. 36, no. 3, pages 36 - 39 *
杨开明: ""糖尿病中医临床数据挖掘技术研究"", pages 2 - 3 *
肖光磊等: "正相关关联规则及其在中医药中的应用", vol. 46, no. 6, pages 228 *
高生鹏: "基于关联规则的医学用药数据挖掘及可视化", 《中国硕士学位论文全文数据库信息科技辑》, pages 138 - 906 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112530533A (zh) * 2020-11-30 2021-03-19 北京百度网讯科技有限公司 病历文档检测方法、装置及电子设备
CN112530533B (zh) * 2020-11-30 2024-04-02 北京百度网讯科技有限公司 病历文档检测方法、装置及电子设备
CN112652405A (zh) * 2020-12-24 2021-04-13 平安科技(深圳)有限公司 临床路径的挖掘方法、装置、设备及存储介质
WO2022134476A1 (zh) * 2020-12-24 2022-06-30 平安科技(深圳)有限公司 临床路径的挖掘方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111341454B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
Carlson et al. The changing landscape of vestibular schwannoma management in the United States—a shift toward conservatism
JP6915282B2 (ja) オープンデータ及び臨床医の入力を用いて患者の治療リスクを評価するシステム及び方法
US11464455B2 (en) Method and apparatus of context-based patient similarity
US9996889B2 (en) Identifying group and individual-level risk factors via risk-driven patient stratification
Zhavoronkov et al. Deep biomarkers of aging and longevity: from research to applications
Greer et al. Clinical examination for outcome prediction in nontraumatic coma
EP3276570A1 (en) Computer system and information processing method
RU2007124523A (ru) Способы, системы и компьютерные программные продукты для разработки и использования прогнозных моделей для прогнозирования большинства медицинских случаев, оценки стратегий вмешательства и для одновременной оценки нерегулярности биологических маркеров
RU2019112163A (ru) Системы и способы интеллектуального анализа медицинских данных
CN110689939A (zh) 一种用药序列的推荐方法、装置、可读介质及电子设备
CN113628761B (zh) 抗血管生成药物联合免疫检查点抑制剂治疗疗效预测方法
US20090316969A1 (en) Determining efficacy of therapeutic intervention in neurosychiatric disease
CN111341454A (zh) 数据挖掘方法和装置
CN111430037A (zh) 相似病历查找方法及系统
CN116543867A (zh) 基于预测模型指导t2dm患者mtm模式的方法及装置
AU2024216371A1 (en) Techniques for image-based examination of dialysis access sites
US20220254490A1 (en) Data processing system for estimating disease progression rates
CN107050668B (zh) 基于云处理的放疗效果预测方法
US20200043583A1 (en) System and method for workflow-sensitive structured finding object (sfo) recommendation for clinical care continuum
CN117116357A (zh) 布拉格治疗免疫应答预测方法和装置
JPWO2021035224A5 (zh)
US20160034646A1 (en) Systems and methods for electronic medical charting
JP6138824B2 (ja) セルフケア行動の患者固有の順序付けられたリストを生成するための方法、システム及びコンピュータプログラム
KR20210104864A (ko) 자연어 처리를 사용하여 유해 사례를 찾는 방법
Johnson et al. Model selection and inference for censored lifetime medical expenditures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant