CN106407650A - 一种中医数据处理装置和方法 - Google Patents

一种中医数据处理装置和方法 Download PDF

Info

Publication number
CN106407650A
CN106407650A CN201610754623.7A CN201610754623A CN106407650A CN 106407650 A CN106407650 A CN 106407650A CN 201610754623 A CN201610754623 A CN 201610754623A CN 106407650 A CN106407650 A CN 106407650A
Authority
CN
China
Prior art keywords
data
symptom
dosage
drug
standardization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610754623.7A
Other languages
English (en)
Other versions
CN106407650B (zh
Inventor
张声生
朱彦
周强
刘静
李宗友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute Of Information On Traditional Chinese Medicine Cacms
Beijing Hospital of Traditional Chinese Medicine Affiliated to Capital University of Medicine Sciences
Original Assignee
Institute Of Information On Traditional Chinese Medicine Cacms
Beijing Hospital of Traditional Chinese Medicine Affiliated to Capital University of Medicine Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Information On Traditional Chinese Medicine Cacms, Beijing Hospital of Traditional Chinese Medicine Affiliated to Capital University of Medicine Sciences filed Critical Institute Of Information On Traditional Chinese Medicine Cacms
Priority to CN201610754623.7A priority Critical patent/CN106407650B/zh
Publication of CN106407650A publication Critical patent/CN106407650A/zh
Application granted granted Critical
Publication of CN106407650B publication Critical patent/CN106407650B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种中医数据处理装置和方法,通过读取临床中医病案数据,获取所述病案数据中所有诊次的中药剂量数据和症状程度数据;将所述中药剂量数据进行归一化处理得到标准化中药剂量数据,将所述症状程度数据进行标准化处理得到标准化症状程度数据;计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值,根据所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值之间的关系得到每个病案数据的事物数据;通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则。本发明能够实现病案数据的多个诊次的中药剂量变化与症状改善程度的关系的有效统计与分析。

Description

一种中医数据处理装置和方法
技术领域
本发明涉及一种数据挖掘领域,尤其涉及中医数据的处理装置及方法。
背景技术
中医学有着数千年的历史,大量的中医临床病案是其主要载体之一。尤其是名老中医临床病案尤为珍贵,其中包含了名老中医的临证思辨特点和处方用药经验,对中医工作者有较大的参考价值。
近年来,随着信息技术的发展,数据挖掘技术在中医领域,尤其是在名老中医诊疗经验挖掘研究工作中的应用逐渐成为热点。其中,关联规则(association rule)作为数据挖掘技术中应用较广的方法,在中医临床病案数据挖掘方面也得到了广泛应用。中医病案由病因、病机、症状、证候、诊断、治法及方药等组成,是一个错综复杂的整体,但其中也有着隐含的规律和联系。关联规则方法通过对中医病症、证候与方药之间、病因病机、治法与方药之间以及方剂规律之间关系的分析,能在揭示疾病的发生发展规律,发现疾病治疗的临床特色、认识中药方剂配伍的特点等方面。
现有技术在实践中至少存在如下问题:目前的方法没有考虑诊次之间的变化,只能静态地分析中药和症状是否同时出现的规律,无法实现中药剂量变化与症状改善程度之间关系的有效统计与分析。
CN103365978A公开了一种基于LDA主题模型的中医药数据挖掘方法,包括以下具体步骤:1)先在LDA模型中确定处方-主题和主题-药剂两组先验,处方-主题和主题-药剂分别由超参数α和β确定,使用AS方式对两组先验进行先验假设;2)确定LDA模型中的主题数目;3)采用Gibbs采样方法对上述LDA模型进行求解;4)生成LDA模型的语义RDF文档,将LDA模型的结果映射至四元组,并用语义RDF文档进行表示;5)将药剂和处方进行关联,建立处方-主题-药剂的可视化结构网络G。该方法的优点在于,适用于海量中药处方的处理和挖掘,并可以得到可视化的结构模型,但无法解决多个诊次之间中药剂量和疗效之间的关联关系的问题。
CN103366093A公开了一种中医数字化辅助辨证论治方法,包括人体辩证元素的引用、建立病症功效码Fw、建立药品功效码Fy、症状词汇提取、获取病人综合病症功效、处方功效计算、获取匹配处方共7个步骤,将“辩证”与“论治”使用信息技术进行量化考核,以达到现代信息技术辅助中医临床辨证论治效果。该方法仍然无法实现中药剂量变化与症状改善程度之间关系的有效统计与分析。
CN105286782A公开了一种智能化中医脉诊系统,包括:一脉象采集器,其用于采集用户的脉象信息;以及一诊断设备,其包含一数据库、一症状信息输入模块、一诊断模块以及一诊断结果输出模块,所述数据库内预先存储一建立了多种常见疾病的脉象信息、所表现的外在症状信息以及包含疾病名称的处方的对照表,所述症状信息输入模块供用户输入所患疾病的症状信息,所述诊断模块连接所述脉象采集器、所述症状信息输入模块以及所述数据库用于获得包含有疾病名称的处方,所述诊断结果输出模块,其与所述诊断模块连接供输出经所述诊断模块分析对比所获得的包含有疾病名称的处方。借由上述设置,可方便用户为自己诊断并提供相应的诊断结果,供用户参考。但该系统仍然没有对中药剂量变化与症状改善程度之间关系进行有效统计与分析
综上所述,迫切需要一种对中医数据进行处理的方案,以实现对中药剂量变化与症状改善程度之间关系进行有效统计与分析。
发明内容
为解决上述技术问题,本发明提供了一种中医数据处理方法,其包括以下步骤:
读取临床中医病案数据,获取所述病案数据中所有诊次的中药剂量数据和症状程度数据;
将所述中药剂量数据进行归一化处理得到标准化中药剂量数据,将所述症状程度数据进行标准化处理得到标准化症状程度数据;
计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值,根据所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值之间的关系得到每个病案数据的事物数据;
通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则。
根据本发明所述的方法,优选地,所述标准化中药剂量数据包括:小剂量,中剂量,大剂量三个等级;所述标准化症状程度数据具体包括:用数字0、1、2、3分别表示症状消失、症状减轻、症状不变、症状加重。
根据本发明所述的方法,优选地,所述计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值为:根据所述标准化中药剂量数据的三个等级和所述标准化症状程度数据的四个症状程度计算每个病案数据中所有诊次之间所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值。
根据本发明所述的方法,优选地,所述关联规则数据挖掘算法采用Apriori算法。
根据本发明所述的方法,优选地,所述通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则包括:根据所述Apriori算法,得到所有支持度大于最小支持度的频繁项集,根据所述频繁项集和指定最小置信度,得到所述中药剂量变化和症状程度变化关联规则。
本发明还提供一种中医数据处理装置,其包括以下模块:
病案数据读取模块:读取临床中医病案数据,获取所述病案数据中所有诊次的中药剂量数据和症状程度数据;
病案数据标准化处理模块:将所述中药剂量数据进行归一化处理得到标准化中药剂量数据,将所述症状程度数据进行标准化处理得到标准化症状程度数据;
事物数据计算模块:计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值,根据所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值之间的关系得到每个病案数据的事物数据;和
病案数据挖掘模块:通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则。
根据本发明的装置,优选地,所述标准化中药剂量数据包括:小剂量,中剂量,大剂量三个等级;所述标准化症状程度数据具体包括:用数字0、1、2、3分别表示症状消失、症状减轻、症状不变、症状加重。
根据本发明的装置,优选地,在所述事物数据计算模块中,计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值为:根据所述标准化中药剂量数据的三个等级和所述标准化症状程度数据的四个症状程度计算每个病案数据中所有诊次之间所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值。
根据本发明的装置,优选地,所述关联规则数据挖掘算法采用Apriori算法。
根据本发明的装置,优选地,在所述病案数据挖掘模块中,通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则包括:根据所述Apriori算法,得到所有支持度大于最小支持度的频繁项集,根据所述频繁项集和指定最小置信度,得到中药剂量变化和症状程度变化关联规则。
采用本发明的技术方案,能够实现医案的多个诊次所体现的中药剂量变化与症状改善程度的关系的有效统计与分析,通过两种模式的数据挖掘分别获得的两种结果:
1)模式1:临证用药规律挖掘:症状变化->中药剂量变化。能体现中医师的用药规律,即针对疾病的发展和症状的变化,采用的中药(或中药配伍)的剂量变化。
2)模式2:中药疗效规律挖掘:中药剂量变化->症状变化。能发现中药剂量变化对症状的改善作用:即哪种中药(或中药配伍)的剂量变化对改善哪些症状最有效。
附图说明
图1为本发明方法实现流程图。
图2为本发明的病案数据示例。
具体实施方式
下面结合附图以及具体实施例对本发明作进一步的说明,但本发明的保护范围并不限于此。
<处理方法>
图1为本发明方法实现流程图。如图1所示,本发明包括以下方法步骤:步骤1-读取临床病案数据;步骤2-对读取的临床病案数据进行处理;步骤3-计算中药剂量变化属性和症状变化属性;步骤4-根据关联规则挖掘事务数据,得到中药剂量变化和症状程度变化关联规则。
<步骤1>
本发明的步骤1为:读取临床中医病案数据,获取所述病案数据中所有诊次的中药剂量数据和症状程度数据。从已有的中医临床病案数据库中,读取需要分享的若干条病案数据,其中每一条病案数据包含一个或多个诊次信息,每一个诊次信息中包含症状和处方(参见图2)。所述临床病案数据库仅为示例说明,还可以由各种独立的数据存储装置,或云存储,分布式存储等作为临床病案数据存储的存储方式。
<步骤2>
本发明的步骤2为:将所述中药剂量数据进行归一化处理得到标准化中药剂量数据,将所述症状程度数据进行标准化处理得到标准化症状程度数据。对读取的临床病案数据进行归一化处理包括剂量归一化和症状程度标准化。
2.1剂量归一化
将剂量进行归一化处理:如分成3个等级:小、中和大剂量。例如,茯苓5g的剂量为“小剂量”,茯苓10g的剂量为“中剂量”,20g为“大剂量”。
2.2症状程度标准化
对症状的程度建立量表:
症状程度 评分
2
消失 0
减轻 1
加重 3
<步骤3>
本发明的步骤3为:计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值,根据所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值之间的关系得到每个病案数据的事物数据。计算过程包括中药剂量变化属性的计算、症状变化属性的计算和事务数据的生成。
3.1剂量变化属性
根据前后两个诊次间中药剂量变化,获得以下两个层次的变化属性:
3.2症状变化属性
根据量表评分的差值获得症状变化属性:变大(差值>0)、不变(差值=0)、变小(差值<0)。
3.3事物数据的生成
模式1:临证用药规律挖掘:症状变化->中药剂量变化
对每一个病案数据,循环计算诊次n,诊次n+1之间的中药剂量变化值和症状变化值。
1)计算症状变化ΔS:对诊次n和诊次n+1,计算两个层次的症状变化值:Sn+1-Sn
2)中药剂量变化ΔD:对诊次n和诊次n+1,计算两个层次的中药剂量变化值:Dn+1-Dn
模式2:中药疗效规律挖掘:中药剂量变化->症状变化
对每一个病案数据,循环计算诊次n,诊次n+1和诊次n+2之间的中药剂量变化值和症状变化值。
1)中药剂量变化ΔD:对诊次n和诊次n+1,计算两个层次的中药剂量变化值:Dn+1-Dn
2)计算症状变化ΔS:对诊次n+1和诊次n+2,计算两个层次的症状变化值:Sn+2-Sn+1
<步骤4>
本发明的步骤4为:通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则。其包括获取频繁项集步骤以及获取用药剂量变化和症状变化关联规则步骤。
4.1获取频繁项集
分别对模式1和和模式2的剂量层次1和层次2中的事物数据,使用经典的Apriori算法发现频繁项集,以发现“症状变化”和“用药剂量变化”之间的联系。在这里,所有支持度大于最小支持度的项集称为频繁项集。
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法,其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。所有支持度大于最小支持度的项集称为频繁项集,简称频集。该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第一步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。
(1)L1=find_frequent_1-itemsets(D);
(2)for(k=2;Lk-1≠Φ;k++){
(3)Ck=apriori_gen(Lk-1,min_sup);
(4)for each transaction t∈D{//scan D for counts
(5)Ct=subset(Ck,t);//get the subsets of t that are candidates
(6)for each candidate c∈Ct
(7)c.count++;
(8)}
(9)Lk={c∈Ck|c.count≥min_sup}
(10)}
(11)return L=∪k Lk;
4.2获取用药剂量变化和症状变化关联规则
根据频繁项集和最小置信度,获取用药剂量变化和症状变化关联规则。
模式1:临证用药规律挖掘:症状变化->中药剂量变化。
假设症状变化ΔS1、ΔS2为规则前置条件,中药剂量变化ΔD1代表规则结果,则置信度表示症状变化ΔS1、ΔS2同时出现的情况下中药剂量变化ΔD1发生的概率。
模式2:中药疗效规律挖掘:中药剂量变化->症状变化。
假设中药剂量变化ΔD1、ΔD2为规则前置条件,症状变化ΔS1代表规则结果,则置信度表示中药剂量变化ΔD1、ΔD2同时出现的情况下症状变化ΔS1发生的概率。
获得规则后,可以采用文本形式来描述关联规则结果。如以(A,B,C)->D(supp;conf)形式描述,其中A,B,C分别表示前置条件,D表示规则结果,supp表示支持度;conf表示置信度。当一条规则满足最小支持度和最小置信度时,认为该规则是比较常见和比较可信的。
<处理装置>
本发明的中医数据处理装置包括以下模块:模块1-病案数据读取模块;模块2-病案数据标准化处理模块;模块3-事物数据计算模块;模块4-病案数据挖掘模块。
<模块1>
本发明的模块1为病案数据读取模块,其可以读取临床中医病案数据,获取所述病案数据中所有诊次的中药剂量数据和症状程度数据。本发明的模块1可以从已有的中医临床病案数据库中,读取需要分享的若干条病案数据。每一条病案数据包含一个或多个诊次信息,每一个诊次信息中包含症状和处方(参见图2)。
<模块2>
本发明的模块2为病案数据标准化处理模块,其可以将所述中药剂量数据进行归一化处理得到标准化中药剂量数据,将所述症状程度数据进行标准化处理得到标准化症状程度数据。本发明的模块2对读取的临床病案数据进行归一化处理,包括剂量归一化和症状程度标准化。对于剂量归一化处理:如分成3个等级:小、中和大剂量。例如,茯苓10g的剂量为“中剂量”,20g为“大剂量”。对于症状程度标准化处理:将症状程度分为四种:用数字0、1、2、3分别表示症状消失、症状减轻、症状不变、症状加重。建立的量表与步骤2相同,这里不再赘述。
<模块3>
本发明的模块3为事物数据计算模块,其可以计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值,根据所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值之间的关系得到每个病案数据的事物数据。本发明的模块3可以包括两个子模块:中药剂量变化属性的计算模块、症状变化属性的计算模块和事务数据的生成模块。
3.1剂量变化属性的计算模块
在该模块中,根据前后两个诊次间中药剂量变化,获得以下两个层次的变化属性,详见步骤3的表格内容,这里不再赘述。
3.2症状变化属性的计算模块
在该模块中,根据量表评分的差值获得症状变化属性:变大(差值>0)、不变(差值=0)、变小(差值<0)。
3.3事物数据的生成模块
事物数据的生成模块采用两种模式运行,详述如下:
模式1:临证用药规律挖掘:症状变化->中药剂量变化
对每一个病案数据,循环计算诊次n,诊次n+1之间的中药剂量变化值和症状变化值。
1)计算症状变化ΔS:对诊次n和诊次n+1,计算两个层次的症状变化值:Sn+1-Sn
2)中药剂量变化ΔD:对诊次n和诊次n+1,计算两个层次的中药剂量变化值:Dn+1-Dn
模式2:中药疗效规律挖掘:中药剂量变化->症状变化
对每一个病案数据,循环计算诊次n,诊次n+1和诊次n+2之间的中药剂量变化值和症状变化值。
1)中药剂量变化ΔD:对诊次n和诊次n+1,计算两个层次的中药剂量变化值:Dn+1-Dn
2)计算症状变化ΔS:对诊次n+1和诊次n+2,计算两个层次的症状变化值:Sn+2-Sn+1
<模块4>
本发明的模块4为病案数据挖掘模块,其可以通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则。本发明的模块4包括两个子模块:获取频繁项集模块以及获取用药剂量变化和症状变化关联规则模块。
4.1获取频繁项集模块
在获取频繁项集模块中,分别对模式1和和模式2的剂量层次1和层次2中的事物数据使用经典的Apriori算法发现频繁项集,以发现“症状变化”和“用药剂量变化”之间的联系。Apriori算法详见步骤4,这里不再赘述。
4.2获取用药剂量变化和症状变化关联规则模块
在该模块中,根据频繁项集和最小置信度,获取用药剂量变化和症状变化关联规则。具体获取过程参见步骤4,这里不再赘述。
实施例1
图2为本发明的病案数据示例,包括三个诊次的处方及症状信息。
病人出诊有以下症状:早饱,嗳气。
初诊开具的处方为:白芍15g;当归10g;延胡索10g;茯苓10g。
病人第二次复诊,早饱症状减轻,嗳气症状没有变化。
第二次复诊开具的处方,将茯苓剂量增加为20g,其他中药的配伍和剂量未发生改变。
病人第三次复诊,病人早饱症状和嗳气症状均消失。
第三次复诊开具的处方为,和第二次复诊开具的处方相同。
按照本发明的方案,实现如下:
步骤1,从数据库读取上述三个诊次的病案数据,包括病人症状和每次开具的处方。
步骤2,对读取的临床病案数据进行处理。
将剂量进行归一化处理:如分成3个等级:小、中和大剂量。
如茯苓5g的剂量为“小剂量”,茯苓10g的剂量为“中剂量”,20g为“大剂量”。
对症状程度进行标准化处理:分别用数字0、1、2、3代表真正消失,症状减轻,存在症状(未发生改变),症状加重。
步骤3,计算中药剂量变化属性和症状变化属性,生成事物数据。
诊次2和诊次1之间茯苓的变化,层次1为“变大”,层次2为“中->大”;诊次2和诊次1之间症状“早饱”变化值为:减轻(1)-有(2)=-1,故变化值为“变小”,“嗳气”变化值为:有(2)-有(2)=0,故变化值为“不变”。诊次3和诊次2之间茯苓的变化,层次1为“不变”,层次2为“大->大”;诊次3和诊次2之间症状“早饱”变化值为:消失(0)-减轻(1)=-1,故变化值为“变小”,“嗳气”变化值为:消失(0)-有(2)=-2,故变化值为“变小”。
根据剂量变化属性和症状变化属性生成事物数据。
模式1:临证用药规律挖掘:症状变化->中药剂量变化
对每一个病案,循环计算诊次n,诊次n+1之间的中药剂量变化值和症状变化值。
1)计算症状变化ΔS:对诊次n和诊次n+1,计算两个层次的症状变化值:Sn+1-Sn
2)中药剂量变化ΔD:对诊次n和诊次n+1,计算两个层次的中药剂量变化值:Dn+1-Dn
如示例中:诊次2和诊次1之间茯苓的变化,层次1为“变大”,层次2为“中->大”;诊次2和诊次1之间症状“早饱”变化值为:减轻(1)-有(2)=-1,故变化值为“变小”,“嗳气”变化值为:有(2)-有(2)=0,故变化值为“不变”。故在剂量层次1的模式下产生事物数据:(早饱“变小”,嗳气“不变,”茯苓“变大”);剂量层次2的模式下产生事物数据:(早饱“变小”,嗳气“不变”,茯苓“中->大”);诊次3和诊次2之间茯苓的变化,层次1为“不变”,层次2为“大->大”;诊次3和诊次2之间症状“早饱”变化值为:消失(0)-减轻(1)=-1,故变化值为“变小”,“嗳气”变化值为:消失(0)-有(2)=-2,故变化值为“变小”。故在剂量层次1的模式下产生事物数据:(早饱“变小”,嗳气“变小”,茯苓“不变”);剂量层次2的模式下产生事物数据:(早饱“变小”,嗳气“变小”,茯苓“大->大”);
模式2:中药疗效规律挖掘:中药剂量变化->症状变化
对每一个病案,循环计算诊次n,诊次n+1和诊次n+2之间的中药剂量变化值和症状变化值。
1)中药剂量变化ΔD:对诊次n和诊次n+1,计算两个层次的中药剂量变化值:Dn+1-Dn
2)计算症状变化ΔS:对诊次n+1和诊次n+2,计算两个层次的症状变化值:Sn+2-Sn+1
如示例中:诊次2和诊次1之间茯苓的变化,层次1为“变大”,层次2为“中->大”;诊次3和诊次2之间症状“嗳气”变化值为:消失(0)-有(2)=-2,故变化值为“变小”。故在剂量层次1的模式下产生事物数据:(茯苓“变大”,嗳气“变小”);剂量层次2的模式下产生事物数据:(茯苓“中->大”,嗳气“变小”)。
步骤4,根据关联规则挖掘病案数据,基于最小支持度获取频繁项集。
获取频繁项集:分别对模式1和和模式2的剂量层次1和层次2中的事物数据,使用经典的Apriori算法发现频繁项集,以发现“症状变化”和“用药剂量变化”之间的联系。在这里,所有支持度大于最小支持度的项集称为频繁项集。
根据频繁项集和最小置信度,获取用药剂量变化和症状变化关联规则。
模式1:临证用药规律挖掘:症状变化->中药剂量变化。
假设症状变化早饱“变小”,嗳气“变小”为规则前置条件,中药剂量变化茯苓“变大”代表规则结果,则置信度表示症状变化早饱“变小”,嗳气“变小”同时出现的情况下中药剂量变化茯苓“变大”发生的概率。
模式2:中药疗效规律挖掘:中药剂量变化->症状变化。
假设中药剂量变化茯苓“变大”为规则前置条件,症状变化早饱“变小”,嗳气“变小”代表规则结果,则置信度表示剂量茯苓“变大”出现的情况下症状变化早饱“变小”,嗳气“变小”发生的概率。
获得规则后,可以采用文本形式来描述关联规则结果。如以(A,B,C)->D(supp;conf)形式描述,其中A,B,C分别表示前置条件,D表示规则结果,supp表示支持度;conf表示置信度。当一条规则满足最小支持度和最小置信度时,认为该规则是比较常见和比较可信的。
通过上述数据挖掘,得到数据挖掘处理结果后,医生或者患者可以根据患者症状以及置信度(比如大于60%)来检索合适的处方。也可以为医药研究者提供药物疗效和患者症状的关系。
以上实施例仅作为本发明保护方案的示例,不对本发明的具体实施方式进行限定。

Claims (10)

1.一种中医数据处理方法,其特征在于,该方法包括以下步骤:
读取临床中医病案数据,获取所述病案数据中所有诊次的中药剂量数据和症状程度数据;
将所述中药剂量数据进行归一化处理得到标准化中药剂量数据,将所述症状程度数据进行标准化处理得到标准化症状程度数据;
计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值,根据所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值之间的关系得到每个病案数据的事物数据;
通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则。
2.根据权利要求1所述的方法,其特征在于,所述标准化中药剂量数据包括:小剂量,中剂量,大剂量三个等级;所述标准化症状程度数据具体包括:用数字0、1、2、3分别表示症状消失、症状减轻、症状不变、症状加重。
3.根据权利要求2所述的方法,其特征在于,所述计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值为:根据所述标准化中药剂量数据的三个等级和所述标准化症状程度数据的四个症状程度计算每个病案数据中所有诊次之间所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值。
4.根据权利要求1~3之一的方法,其特征在于,所述关联规则数据挖掘算法采用Apriori算法。
5.根据权利要求4所述的方法,其特征在于,所述通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则包括:根据所述Apriori算法,得到所有支持度大于最小支持度的频繁项集,根据所述频繁项集和指定最小置信度,得到所述中药剂量变化和症状程度变化关联规则。
6.一种中医数据处理装置,其特征在于,该装置包括以下模块:
病案数据读取模块:读取临床中医病案数据,获取所述病案数据中所有诊次的中药剂量数据和症状程度数据;
病案数据标准化处理模块:将所述中药剂量数据进行归一化处理得到标准化中药剂量数据,将所述症状程度数据进行标准化处理得到标准化症状程度数据;
事物数据计算模块:计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值,根据所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值之间的关系得到每个病案数据的事物数据;和
病案数据挖掘模块:通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则。
7.根据权利要求6所述的装置,其特征在于,在所述病案数据标准化处理模块中,所述标准化中药剂量数据包括:小剂量,中剂量,大剂量三个等级;所述标准化症状程度数据具体包括:用数字0、1、2、3分别表示症状消失、症状减轻、症状不变、症状加重。
8.根据权利要求7所述的装置,其特征在于,在所述事物数据计算模块中,计算每个病案数据中所有诊次之间的所述标准化中药剂量数据的变化值和标准化症状程度数据的变化值为:根据所述标准化中药剂量数据的三个等级和所述标准化症状程度数据的四个症状程度计算每个病案数据中所有诊次之间所述标准化中药剂量数据的变化值和所述标准化症状程度数据的变化值。
9.根据权利要求6~8任一项所述的装置,其特征在于,所述关联规则数据挖掘算法采用Apriori算法。
10.根据权利要求9所述的装置,其特征在于,在所述病案数据挖掘模块中,通过关联规则数据挖掘算法挖掘所述事物数据,得到所述每个病案数据中所有诊次之间的中药剂量变化和症状程度变化关联规则包括:根据所述Apriori算法,得到所有支持度大于最小支持度的频繁项集,根据所述频繁项集和指定最小置信度,得到中药剂量变化和症状程度变化关联规则。
CN201610754623.7A 2016-08-29 2016-08-29 一种中医数据处理装置和方法 Expired - Fee Related CN106407650B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610754623.7A CN106407650B (zh) 2016-08-29 2016-08-29 一种中医数据处理装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610754623.7A CN106407650B (zh) 2016-08-29 2016-08-29 一种中医数据处理装置和方法

Publications (2)

Publication Number Publication Date
CN106407650A true CN106407650A (zh) 2017-02-15
CN106407650B CN106407650B (zh) 2018-10-19

Family

ID=58003885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610754623.7A Expired - Fee Related CN106407650B (zh) 2016-08-29 2016-08-29 一种中医数据处理装置和方法

Country Status (1)

Country Link
CN (1) CN106407650B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919671A (zh) * 2017-02-20 2017-07-04 广东省中医院 一种中医文本病案挖掘与辅助决策智能系统
CN107220484A (zh) * 2017-05-10 2017-09-29 山东中医药大学 一种中医方药数据分析挖掘系统
CN109147879A (zh) * 2018-07-02 2019-01-04 北京众信易保科技有限公司 基于医疗单据的可视化报表的方法和系统
CN109346191A (zh) * 2018-08-31 2019-02-15 青海师范大学 一种生物信息数据分析系统
CN113744886A (zh) * 2020-05-27 2021-12-03 中国科学院软件研究所 一种基于中医医案挖掘的中医辨证论治模式挖掘方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7370033B1 (en) * 2002-05-17 2008-05-06 Oracle International Corporation Method for extracting association rules from transactions in a database
CN103432651A (zh) * 2012-12-31 2013-12-11 南京理工大学 一种闭环的智能麻醉控制系统
CN104794340A (zh) * 2015-04-17 2015-07-22 南京大学 一种智能化中医药信息处理系统
CN104866979A (zh) * 2015-06-08 2015-08-26 苏芮 一种突发急性传染病的中医病例数据处理方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7370033B1 (en) * 2002-05-17 2008-05-06 Oracle International Corporation Method for extracting association rules from transactions in a database
CN103432651A (zh) * 2012-12-31 2013-12-11 南京理工大学 一种闭环的智能麻醉控制系统
CN104794340A (zh) * 2015-04-17 2015-07-22 南京大学 一种智能化中医药信息处理系统
CN104866979A (zh) * 2015-06-08 2015-08-26 苏芮 一种突发急性传染病的中医病例数据处理方法和系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919671A (zh) * 2017-02-20 2017-07-04 广东省中医院 一种中医文本病案挖掘与辅助决策智能系统
CN106919671B (zh) * 2017-02-20 2020-06-05 广东省中医院 一种中医文本病案挖掘与辅助决策智能系统
CN107220484A (zh) * 2017-05-10 2017-09-29 山东中医药大学 一种中医方药数据分析挖掘系统
CN107220484B (zh) * 2017-05-10 2019-11-05 山东中医药大学 一种中医方药数据分析挖掘系统
CN109147879A (zh) * 2018-07-02 2019-01-04 北京众信易保科技有限公司 基于医疗单据的可视化报表的方法和系统
CN109147879B (zh) * 2018-07-02 2021-07-27 北京众信易保科技有限公司 基于医疗单据的可视化报表的方法和系统
CN109346191A (zh) * 2018-08-31 2019-02-15 青海师范大学 一种生物信息数据分析系统
CN109346191B (zh) * 2018-08-31 2020-09-29 上海城建职业学院 一种生物信息数据分析系统
CN113744886A (zh) * 2020-05-27 2021-12-03 中国科学院软件研究所 一种基于中医医案挖掘的中医辨证论治模式挖掘方法及系统
CN113744886B (zh) * 2020-05-27 2024-03-19 中国科学院软件研究所 一种基于中医医案挖掘的中医辨证论治模式挖掘方法及系统

Also Published As

Publication number Publication date
CN106407650B (zh) 2018-10-19

Similar Documents

Publication Publication Date Title
CN106407650B (zh) 一种中医数据处理装置和方法
Abacha et al. MEANS: A medical question-answering system combining NLP techniques and semantic Web technologies
Cui et al. EpiDEA: extracting structured epilepsy and seizure information from patient discharge summaries for cohort identification
Wu et al. A comparative study of current clinical natural language processing systems on handling abbreviations in discharge summaries
Barnado et al. Developing electronic health record algorithms that accurately identify patients with systemic lupus erythematosus
CN100449531C (zh) 病人数据挖掘
Fang et al. The traditional chinese medicine prescription pattern of endometriosis patients in Taiwan: a population‐based study
CN104765947A (zh) 一种面向大数据的潜在药物不良反应数据挖掘方法
US20200075135A1 (en) Trial planning support apparatus, trial planning support method, and storage medium
Elkins et al. Coding neuroradiology reports for the Northern Manhattan Stroke Study: a comparison of natural language processing and manual review
CN105956412A (zh) 基于智能图文识别实现冠心病临床数据收集的系统及方法
CN106650232A (zh) 一种根据药物计算疾病发生概率的方法及其系统
He et al. A method for analyzing commonalities in clinical trial target populations
Zhong et al. Medication literacy in a cohort of Chinese patients discharged with essential hypertension
Bertl et al. Finding indicator diseases of psychiatric disorders in BigData using clustered association rule mining
Bertl et al. Evaluation of Data Quality in the Estonian National Health Information System for Digital Decision Support.
Lamy et al. Extracting clinical knowledge from electronic medical records
Bogie D Phil et al. Development of predictive informatics tool using electronic health records to inform personalized evidence-based pressure injury management for Veterans with spinal cord injury
CN111951971B (zh) 一种中药和症状关系的数据挖掘方法
Feng et al. Applications of data mining methods in the integrative medical studies of coronary heart disease: progress and prospect
CN106844325B (zh) 医疗信息处理方法和医疗信息处理装置
Chen et al. Mining Symptom‐Herb Patterns from Patient Records Using Tripartite Graph
CN106971083A (zh) 基于检验指标的用药信息处理方法
RU98104U1 (ru) Распределенная автоматизированная система мониторинга здоровья
CN110299206A (zh) 一种多内容隐含狄利克雷分布模型及中医医案隐含病机挖掘方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181019

CF01 Termination of patent right due to non-payment of annual fee