CN105740612A - 基于中医临床医案的疾病诊疗方法和系统 - Google Patents
基于中医临床医案的疾病诊疗方法和系统 Download PDFInfo
- Publication number
- CN105740612A CN105740612A CN201610057302.1A CN201610057302A CN105740612A CN 105740612 A CN105740612 A CN 105740612A CN 201610057302 A CN201610057302 A CN 201610057302A CN 105740612 A CN105740612 A CN 105740612A
- Authority
- CN
- China
- Prior art keywords
- treatment
- diagnosis
- dimensional feature
- conf
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种基于中医临床医案的疾病诊疗方法和系统。其中,该方法包括获取中医临床医案数据;其中,所述中医临床医案数据包括临床症状;将所述中医临床医案数据转换为高维特征向量;其中,所述高维特征向量反映各临床症状之间的相关性;将所述高维特征向量与名医医案数据库进行匹配;如果匹配成功,则从名医医案数据库中确定疾病诊疗建议;如果匹配失败,则基于所述高维特征向量,利用诊疗模型按照预定策略进行症状预测,确定所述疾病诊疗建议;其中,所述诊疗模型基于所述名医医案数据库并通过机器学习的方式构建而成。通过本发明实施例解决了如何扩大疾病诊疗范围的技术问题。
Description
技术领域
本发明实施例涉及中医疾病诊疗技术领域,尤其是涉及一种基于中医临床医案的疾病诊疗方法和系统。
背景技术
基于海量临床数据构建智能的中医疾病诊疗系统,可以直接用于在线的用户自诊服务;在该领域中已有部分方法,如:
在中医温病诊疗知识模型的建立中,类比西医的诊断层次,将中医温病的诊疗过程分为发病层、诊断层、治疗层和预后层。利用本体论的方法建立知识之间的相互关系,构建起温病诊疗的知识模型。知识模型中包含多种逻辑推理关系,可以实现推理的功能。
在基于中医四诊合参辅助诊疗系统的感冒判别模型中,通过融合脉诊、舌诊、患者语音以及问诊信息,在此基础上构建了27维的特征向量,在60个临床病例的小样本数据集上,采用RBF核的SVM分类器作为诊疗模型进行训练,判断患者为风寒还是风热感冒。该方法只是局限于某一类疾病的诊疗,而且其样本量太小,严重限制了其推广性能。
有鉴于此,特提出本发明。
发明内容
本发明实施例的主要目的在于提供一种基于中医临床医案的疾病诊疗方法,其至少部分地解决了如何扩大疾病诊疗范围的技术问题。此外,还提供一种基于中医临床医案的疾病诊疗系统。
为了实现上述目的,根据本发明的一个方面,提供了以下技术方案:
一种基于中医临床医案的疾病诊疗方法,所述方法至少包括:
获取中医临床医案数据;其中,所述中医临床医案数据包括临床症状;
将所述中医临床医案数据转换为高维特征向量;其中,所述高维特征向量反映各临床症状之间的相关性;
将所述高维特征向量与名医医案数据库进行匹配;
如果匹配成功,则从名医医案数据库中确定疾病诊疗建议;
如果匹配失败,则基于所述高维特征向量,利用诊疗模型按照预定策略进行症状预测,确定所述疾病诊疗建议;其中,所述诊疗模型基于所述名医医案数据库并通过机器学习的方式构建而成。
根据本发明的另一个方面,还提供了一种基于中医临床医案的疾病诊疗系统,所述系统至少包括:
获取单元,被配置为获取中医临床医案数据;其中,所述中医临床医案数据包括临床症状;
转换单元,被配置为将所述中医临床医案数据转换为高维特征向量;其中,所述高维特征向量反映各临床症状之间的相关性;
匹配单元,被配置为将所述高维特征向量与名医医案数据库进行匹配;
第一确定单元,被配置为如果匹配成功,则从名医医案数据库中确定疾病诊疗建议;
第二确定单元,被配置为如果匹配失败,则基于所述高维特征向量,利用诊疗模型按照预定策略进行症状预测,确定所述疾病诊疗建议;其中,所述诊疗模型基于所述名医医案数据库并通过机器学习的方式构建而成。
与现有技术相比,上述技术方案至少具有以下有益效果:
本发明实施例通过获取中医临床医案数据,接着将中医临床医案数据转换为高维特征向量;其中,高维特征向量反映各临床症状之间的相关性;然后将高维特征向量与名医医案数据库进行匹配;如果匹配成功,则从名医医案数据库中确定疾病诊疗建议;如果匹配失败,则基于高维特征向量,利用诊疗模型按照预定策略进行症状预测,确定疾病诊疗建议;其中,诊疗模型基于名医医案数据库并通过机器学习的方式构建而成。由此,解决了如何扩大疾病诊疗范围的技术问题。实现了综合地给出疾病诊疗方案的技术效果。而且,该系统既可以作为一个总体的中医诊疗方案,也可以作为针对某一类特定疾病的中医智能解决方案。
当然,实施本发明的任一产品不一定需要同时实现以上所述的所有优点。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其它优点可通过在所写的说明书、权利要求书以及附图中所特别指出的方法来实现和获得。
需要说明的是,发明内容部分并非旨在标识出请求保护的主题的必要技术特征,也并非是用来确定请求保护的主题的保护范围。所要求保护的主题不限于解决在背景技术中提及的任何或所有缺点。
附图说明
附图作为本发明的一部分,用来提供对本发明的进一步的理解,本发明的示意性实施例及其说明用于解释本发明,但不构成对本发明的不当限定。显然,下面描述中的附图仅仅是一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。在附图中:
图1为根据一示例性实施例示出的基于中医临床医案的疾病诊疗方法的流程示意图;
图2为根据一示例性实施例示出的将临床症状词汇表映射为特征向量的示意图;
图3为根据一示例性实施例示出的将特征向量扩展为高维特征向量的示意图;
图4为根据一示例性实施例示出的基于中医临床医案的疾病诊疗系统结构示意图。
这些附图和文字描述并不旨在以任何方式限制本发明的构思范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
下面结合附图以及具体实施例对本发明实施例解决的技术问题、所采用的技术方案以及实现的技术效果进行清楚、完整的描述。显然,所描述的实施例仅仅是本申请的一部分实施例,并不是全部实施例。基于本申请中的实施例,本领域普通技术人员在不付出创造性劳动的前提下,所获的所有其它等同或明显变型的实施例均落在本发明的保护范围内。本发明实施例可以按照权利要求中限定和涵盖的多种不同方式来具体化。
需要说明的是,在下面的描述中,为了方便理解,给出了许多具体细节。但是很明显,本发明的实现可以没有这些具体细节。
需要说明的是,在没有明确限定或不冲突的情况下,本发明中的各个实施例及其中的技术特征可以相互组合而形成技术方案。
本发明实施例通过对海量中医临床医案的数据分析,获取智能的疾病诊疗系统。通过融合名医医案数据库以及智能诊疗模型的诊断意见,综合的给出疾病诊疗方案。该系统可以作为一个总体的诊疗系统,也可以作为针对某一类特定疾病的智能解决方案。
本发明实施例提供一种基于中医临床医案的疾病诊疗方法。如图1所示,该方法至少可以包括:
S100:获取中医临床医案数据。
其中,中医临床医案数据包括:纸质医案数据和电子医案数据。
本步骤可以包括通过文字识别方式对纸质医案数据进行电子化。或者以人工的方式录入,例如通过诊疗系统等由医生手工录入。
电子医案数据包括:将中医临床医案的信息转化为电子医案数据以及医生通过医案信息系统直接录入的电子医案数据。将中医临床医案的信息转化为电子医案数据包括对纸质医案数据通过OCR等文字识别方式进行医案数据电子化输入。具体地,可以通过OCR系统进行文字识别,从而将其进行医案数据电子化。获取到的中医临床医案数据可以存入数据库中。
其中,中医临床医案数据可以包括但不限于:患者信息、临床症状、诊断意见以及处方。
S110:将中医临床医案数据转换为高维特征向量;其中,高维特征向量反映各临床症状之间的相关性。
本步骤具体可以包括:
S112:根据中医临床医案数据,统计临床症状,构建临床症状词汇表。
S114:将临床症状词汇表映射为特征向量。
其中,特征向量可以为词袋模型特征。
例如:对于患者来说,临床症状至多只会出现一次,因此其特征为一个稀疏的01向量。1表示具有该症状;0表示没有该症状。
图2示例性地示出了将临床症状词汇表(也即患者临床数据)映射为特征向量。其中,患者临床数据可以包括但不限于腰部、双足、右膝部肿痛,活动受限,神志清,精神欠佳,纳差,睡眠正常,小便黄数,大便未解。
S116:根据临床症状之间的相关性,利用相关度算法,将特征向量扩展为高维特征向量。
作为示例,临床症状之间的相关性可以反映出患者同时出现的症状,例如,发烧可以和咳嗽一起出现。本步骤将反映这种症状之间的相关性的相关项映射为向量,形成相关性特征向量,然后将相关性特征向量加入到特征向量中,构成高维特征向量,从而能更准确地预测患者的疾病,以给出更合理的疾病诊疗建议。
在本步骤中,可以利用相关度算法(如:Aprori,是一种挖掘关联规则的频繁项集算法),向特征向量中加入相关度元素(也即相关项),从而扩展为高维特征向量。也就是通过Aprori算法获取频繁项集之后,将这些频繁项集加入到原有的特征空间,进一步扩展词袋模型特征空间的维度。
采用Aprori算法挖掘频繁项集的算法原理如下:
其中,Aprori算法需要预先定义最小支撑度min_sup。
图3示例性地示出了将特征向量扩展为高维特征向量的过程。其中,将临床症状之间的相关性(例如:精神欠佳、纳差,纳差、睡眠正常,精神欠佳、纳差、睡眠正常)作为扩展规则,将精神欠佳、纳差,纳差、睡眠正常,精神欠佳、纳差、睡眠正常等扩展规则映射为向量010001……000100,然后将该向量加入到特征向量中,从而构成高维特征向量。其中,精神欠佳与纳差相关,构成一组相关项;纳差与睡眠正常相关,也构成一组相关项;精神欠佳与纳差以及睡眠正常相关,还构成一组相关项。0表示不具有相关项;1表示具有相关项。
S120:将高维特征向量与名医医案数据库进行匹配。
S130:如果匹配成功,则从名医医案数据库中确定疾病诊疗建议。
S140:如果匹配失败,则基于高维特征向量,利用诊疗模型按照预定策略进行症状预测,确定疾病诊疗建议。其中,诊疗模型基于名医医案数据库并通过机器学习的方式构建而成。
其中,诊疗模型可以基于多种机器学习方法来构建,如:随机森林算法、支持向量机以及深度学习算法等。
在实际应用中,将高维特征向量(也即中医临床医案特征向量)输入到训练好的诊疗模型中,根据诊疗模型得到一系列患者的疾病和证候名称以及其所对应的置信度值(预测概率总和)。选取置信度值最高的前n个证候结果作为输出。
可以根据以下策略来确定最终的疾病诊疗建议。
选取置信度值最高的前n个诊疗建议。
对n个诊疗建议对应的置信度值排序。
构建所述诊疗模型预测终止条件:
W(k)=(conf(k)-conf(k+2))/(conf(k+1)-conf(k+2))
其中,W(k)表示终止条件;k取1至n-2,且k小于n;conf(k)、conf(k+1)和conf(k+2)分别表示第k、k+1和k+2个置信度;
如果W(k)大于预定阈值,则确定前k个诊疗建议作为疾病诊疗建议。
下面以随机森林方法为例,来说明得到患者的疾病和证候名称以及其所对应的置信度值的过程。
随机森林就是由多棵CART(ClassificationAndRegressionTree)构成的。对于每棵树,使用的训练集是从总的训练集中有放回采样出来的,这意味着,总的训练集中的有些样本可能多次出现在一棵树的训练集中,也可能从未出现在一棵树的训练集中。在训练每棵树的节点时,使用的特征是从所有特征中按照一定比例随机地无放回的抽取的。
随机森林的训练过程包括:
(1)给定训练集S,测试集T,特征维数F。其中,S可以为现有临床病例或者名医医案数据的高维特征向量;T可以为部分未用过的临床病例或者名医医案数据的高维特征向量。
确定参数:N表示使用到的CART的数量,d表示每棵树的深度,f表示每个节点使用到的特征数量;终止条件:s表示节点上最少样本数,m表示节点上最少的信息增益;其中,对于第i棵树,1<i<N,i表示树的序数。
(2)从S中有放回的抽取大小和S一样的训练集S(i),作为根节点的样本,从根节点开始训练。
(3)如果当前节点上达到终止条件,则设置当前节点为叶子节点,如果是分类问题,该叶子节点的预测输出为当前节点样本集合中数量最多的那一类c(j),概率p为c(j)占当前样本集的比例;如果是回归问题,预测输出为当前节点样本集各个样本值的平均值。然后继续训练其他节点。如果当前节点没有达到终止条件,则从F维特征中无放回的随机选取f维特征。利用这f维特征,寻找分类效果最好的一维特征k及其阈值thr,当前节点上样本第k维特征小于thr的样本被划分到左节点,其余的被划分到右节点。
在疾病诊疗的实际应用中,叶子节点的预测输出为当前节点样本集合中数量最多的疾病以及证候c(j),其诊疗概率p为c(j)占当前样本集的比例;如果当前节点没有达到终止条件,则从F维特征中无放回地随机选取f维特征。利用这f维特征,寻找分类效果最好的一维特征k,当前节点上样本第k维特征等于0的样本被划分到左节点,第k维特征等于1的样本被划分到右节点。
CART使用Gini值作为在当前节点分类效果的评判标准,其定义为Gini=1-∑(P(j)*P(j)),P(j)为当前节点上数据集中第i类样本的比例;其中,j表示样本类别。
(4)重复(2)、(3)直到所有节点都已经被训练或者被标记为叶子节点;
(5)重复(2)、(3)、(4)直到所有CART都被训练过。
训练好的随机森林分类器分类过程如下:
对于第i棵树,1<i<N:
(1)从当前树的根节点开始,根据当前节点所选的特征以及其对应的0/1值,判断是进入左节点或是进入右节点,直到到达某个叶子节点并输出预测值,即疾病以及证候c(j)的诊疗概率p。
(2)重复执行(1)直到所有N棵树都输出了预测值。预测值为所有树中预测概率总和最大的疾病以及证候,诊疗概率即对每个属于该类别诊疗概率p进行累计。
由此,基于随机森林分类器的诊疗模型,输入为患者临床症状特征向量,输出为一系列患者的疾病以及证候名称以及其所对应的置信度值(预测概率总和)。
下面以一优选实施例来对本发明实施例进行详细说明。
S200:获取中医临床医案数据。
S210:将中医临床医案数据转换为高维特征向量。
S220:将高维特征向量与名医医案数据库进行匹配。如果匹配,则执行S230;否则执行S240。
S230:直接采用名医医案数据库中的诊疗建议。
S240:采用训练好的诊疗模块进行症状预测。
其中,采用训练好的诊疗模块进行症状预测具体可以包括:
S242:选取置信度值最高的前n个诊疗建议作为诊疗建议备选集合。
S244:利用诊疗建议对应的置信度值,可以按照如下预定策略输出最终疾病诊疗建议:
将排序好的前n个诊疗建议对应的置信度值集合作为初始数据;
按照下述方式构建诊疗模型的预测终止条件:
W(k)=(conf(k)-conf(k+2))/(conf(k+1)-conf(k+2))
其中,W(k)表示终止条件;k取1至n-2,且k小于n:conf(k)、conf(k+1)和conf(k+2)分别表示第k、k+1和k+2个置信度。
如果W(k)大于thr(预先设定的阈值),则说明第k个置信度conf(k)与第k+1个置信度conf(k+1)相差比较大,此时终止,取前k个诊疗建议作为最终的疾病诊疗建议。如果W(k)小于thr(预先设定的阈值),则继续进行判断,直至第k个置信度conf(k)与第k+1个置信度conf(k+1)相差比较大(也即相邻两个置信度相差比较大)为止。
本实施例中将各个步骤按照上述先后次序的方式进行了描述,本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时执行或执行次序颠倒,这些简单的变化都在本发明的保护范围之内。
基于与方法实施例相同的技术构思,还提供一种基于中医临床医案的疾病诊疗系统。如图4所示,所述系统40至少包括:获取单元41、转换单元42、匹配单元43、第一确定单元44和第二确定单元45。其中,获取单元41被配置为获取中医临床医案数据;其中,中医临床医案数据包括临床症状。转换单元42被配置为将中医临床医案数据转换为高维特征向量;其中,高维特征向量反映各临床症状之间的相关性。匹配单元43被配置为将高维特征向量与名医医案数据库进行匹配。第一确定单元44被配置为如果匹配成功,则从名医医案数据库中确定疾病诊疗建议。第二确定单元45被配置为如果匹配失败,则基于高维特征向量,利用诊疗模型按照预定策略进行症状预测,确定疾病诊疗建议;其中,诊疗模型基于名医医案数据库并通过机器学习的方式构建而成。
优选地,获取单元还可以包括:电子化模块。其中,电子化模块被配置为通过文字识别方式对纸质医案数据进行电子化。
在本发明实施例的一些可选的实现方式中,转换单元具体可以包括:第一构建模块、映射模块和扩展模块。其中,
第一构建模块被配置为根据中医临床医案数据统计临床症状,构建临床症状词汇表。映射模块被配置为将临床症状词汇表映射为特征向量。扩展模块被配置为根据临床症状之间的相关性,利用相关度算法,将特征向量扩展为高维特征向量。
在本发明实施例的一些可选的实现方式中,第二确定单元具体还可以包括:选取模块、排序模块和第二构建模块及确定模块。其中,选取模块被配置为选取置信度值最高的前n个诊疗建议。排序模块被配置为对n个诊疗建议对应的置信度值排序。第二构建模块被配置为构建诊疗模型预测终止条件:
W(k)=(conf(k)-conf(k+2))/(conf(k+1)-conf(k+2))
其中,W(k)表示终止条件;k取1至n-2,且k小于n:conf(k)、conf(k+1)和conf(k+2)分别表示第k、k+1和k+2个置信度;确定模块被配置为如果W(k)大于预定阈值,则确定前k个诊疗建议作为疾病诊疗建议。
需要说明的是:上述实施例提供的基于中医临床医案的疾病诊疗系统在进行疾病诊疗时,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
上述系统实施例可以用于执行上述方法实施例,其技术原理、所解决的技术问题及产生的技术效果相似,所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
应指出的是,上面分别对本发明的系统实施例和方法实施例进行了描述,但是对一个实施例描述的细节也可应用于另一个实施例。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。本领域技术人员应该理解:本发明实施例中的模块或者步骤还可以再分解或者组合。例如上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
以上对本发明实施例所提供的技术方案进行了详细的介绍。虽然本文应用了具体的个例对本发明的原理和实施方式进行了阐述,但是,上述实施例的说明仅适用于帮助理解本发明实施例的原理;同时,对于本领域技术人员来说,依据本发明实施例,在具体实施方式以及应用范围之内均会做出改变。
需要说明的是,本文中涉及到的流程图或框图不仅仅局限于本文所示的形式,其还可以进行划分和/或组合。
需要说明的是:附图中的标记和文字只是为了更清楚地说明本发明,不视为对本发明保护范围的不当限定。
术语“包括”、“包含”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
本发明的各个步骤可以用通用的计算装置来实现,例如,它们可以集中在单个的计算装置上,例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备或者多处理器装置,也可以分布在多个计算装置所组成的网络上,它们可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。因此,本发明不限于任何特定的硬件和软件或者其结合。
本发明提供的方法可以使用可编程逻辑器件来实现,也可以实施为计算机程序软件或程序模块(其包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件或数据结构等等),例如根据本发明的实施例可以是一种计算机程序产品,运行该计算机程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现所述方法。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可以从计算机主体上拆卸下来的可移动介质(例如:采用热插拔技术的存储设备)。所述内置介质包括但不限于可重写的非易失性存储器,例如:RAM、ROM、快闪存储器和硬盘。所述可移动介质包括但不限于:光存储介质(例如:CD-ROM和DVD)、磁光存储介质(例如:MO)、磁存储介质(例如:磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如:存储卡)和具有内置ROM的媒体(例如:ROM盒)。
本发明并不限于上述实施方式,在不背离本发明实质内容的情况下,本领域普通技术人员可以想到的任何变形、改进或替换均落入本发明的范围。
Claims (9)
1.一种基于中医临床医案的疾病诊疗方法,其特征在于,所述方法至少包括:
获取中医临床医案数据;其中,所述中医临床医案数据包括临床症状;
将所述中医临床医案数据转换为高维特征向量;其中,所述高维特征向量反映各临床症状之间的相关性;
将所述高维特征向量与名医医案数据库进行匹配;
如果匹配成功,则从名医医案数据库中确定疾病诊疗建议;
如果匹配失败,则基于所述高维特征向量,利用诊疗模型按照预定策略进行症状预测,确定所述疾病诊疗建议;其中,所述诊疗模型基于所述名医医案数据库并通过机器学习的方式构建而成。
2.根据权利要求1所述的方法,其特征在于,所述获取中医临床医案数据具体包括:
通过文字识别方式对纸质医案数据进行电子化;或者,
以人工的方式录入。
3.根据权利要求1所述的方法,其特征在于,所述将所述中医临床医案数据转换为高维特征向量具体包括:
根据所述中医临床医案数据统计所述临床症状,构建临床症状词汇表;
将所述临床症状词汇表映射为特征向量;
根据所述临床症状之间的相关性,利用相关度算法,将所述特征向量扩展为高维特征向量。
4.根据权利要求1所述的方法,其特征在于,所述预定策略包括:
选取置信度值最高的前n个诊疗建议;
对所述n个诊疗建议对应的置信度值排序;
构建所述诊疗模型预测终止条件:
W(k)=(conf(k)-conf(k+2))/(conf(k+1)-conf(k+2))
其中,所述W(k)表示终止条件;所述k取1至n-2,且k小于n:所述conf(k)、所述conf(k+1)和所述conf(k+2)分别表示第k、k+1和k+2个置信度;
如果所述W(k)大于预定阈值,则确定前k个诊疗建议作为所述疾病诊疗建议。
5.根据权利要求1所述的方法,其特征在于,所述机器学习的方式包括但不限于随机森林算法、支持向量机以及深度学习算法。
6.一种基于中医临床医案的疾病诊疗系统,其特征在于,所述系统至少包括:
获取单元,被配置为获取中医临床医案数据;其中,所述中医临床医案数据包括临床症状;
转换单元,被配置为将所述中医临床医案数据转换为高维特征向量;其中,所述高维特征向量反映各临床症状之间的相关性;
匹配单元,被配置为将所述高维特征向量与名医医案数据库进行匹配;
第一确定单元,被配置为如果匹配成功,则从名医医案数据库中确定疾病诊疗建议;
第二确定单元,被配置为如果匹配失败,则基于所述高维特征向量,利用诊疗模型按照预定策略进行症状预测,确定所述疾病诊疗建议;其中,所述诊疗模型基于所述名医医案数据库并通过机器学习的方式构建而成。
7.根据权利要求6所述的系统,其特征在于,所述获取单元具体包括:
电子化模块,被配置为通过文字识别方式对纸质医案数据进行电子化;或者,
录入单元,被配置为以人工的方式录入。
8.根据权利要求6所述的系统,其特征在于,所述转换单元具体包括:
第一构建模块,被配置为根据所述中医临床医案数据统计所述临床症状,构建临床症状词汇表;
映射模块,被配置为将所述临床症状词汇表映射为特征向量;
扩展模块,被配置为根据所述临床症状之间的相关性,利用相关度算法,将所述特征向量扩展为高维特征向量。
9.根据权利要求6所述的系统,其特征在于,所述第二确定单元具体包括:
选取模块,被配置为选取置信度值最高的前n个诊疗建议;
排序模块,被配置为对所述n个诊疗建议对应的置信度值排序;
第二构建模块,被配置为构建所述诊疗模型预测终止条件:
W(k)=(conf(k)-conf(k+2))/(conf(k+1)-conf(k+2))
其中,所述W(k)表示终止条件;所述k取1至n-2,且k小于n:所述conf(k)、所述conf(k+1)和所述conf(k+2)分别表示第k、k+1和k+2个置信度;
确定模块,被配置为如果所述W(k)大于预定阈值,则确定前k个诊疗建议作为所述疾病诊疗建议。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610057302.1A CN105740612B (zh) | 2016-01-27 | 2016-01-27 | 基于中医临床医案的疾病诊疗系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610057302.1A CN105740612B (zh) | 2016-01-27 | 2016-01-27 | 基于中医临床医案的疾病诊疗系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105740612A true CN105740612A (zh) | 2016-07-06 |
CN105740612B CN105740612B (zh) | 2019-07-05 |
Family
ID=56246745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610057302.1A Expired - Fee Related CN105740612B (zh) | 2016-01-27 | 2016-01-27 | 基于中医临床医案的疾病诊疗系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105740612B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570319A (zh) * | 2016-10-31 | 2017-04-19 | 北京科技大学 | 一种确定中医诊断模式的方法及装置 |
CN106874643A (zh) * | 2016-12-27 | 2017-06-20 | 中国科学院自动化研究所 | 基于词向量自动构建知识库实现辅助诊疗的方法和系统 |
CN107242857A (zh) * | 2017-06-12 | 2017-10-13 | 南开大学 | 基于深度学习的智能中医综合诊疗系统 |
JP2018010390A (ja) * | 2016-07-12 | 2018-01-18 | グロースメディスン株式会社 | 骨粗鬆症の推奨薬の提示システム |
CN108109692A (zh) * | 2017-11-08 | 2018-06-01 | 北京无极慧通科技有限公司 | 一种治疗方案的选择方法和系统 |
CN108231200A (zh) * | 2018-01-11 | 2018-06-29 | 浙江大学 | 一种基于主题模型和ilp的看病攻略生成方法 |
CN109346185A (zh) * | 2018-09-19 | 2019-02-15 | 北京科技大学 | 一种中医辅助诊断系统 |
CN109599177A (zh) * | 2018-11-27 | 2019-04-09 | 华侨大学 | 一种基于病历的深度学习预测医疗轨迹的方法 |
CN109616205A (zh) * | 2018-12-04 | 2019-04-12 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN109935323A (zh) * | 2018-12-29 | 2019-06-25 | 南京怡得健康管理有限公司 | 一种自动化有氧运动能力和心肺临床症状的评估系统 |
CN110136839A (zh) * | 2019-05-14 | 2019-08-16 | 北京百度网讯科技有限公司 | 一种症状信息处理方法、装置和电子设备 |
CN110600123A (zh) * | 2019-08-29 | 2019-12-20 | 成都信息工程大学 | 一种中医临床辅助诊断方法 |
CN110634134A (zh) * | 2019-09-04 | 2019-12-31 | 杭州憶盛医疗科技有限公司 | 一种细胞形态学人工智能自动诊断新方法 |
CN110853764A (zh) * | 2019-11-28 | 2020-02-28 | 成都中医药大学 | 一种糖尿病证候预测系统 |
CN111178444A (zh) * | 2019-12-31 | 2020-05-19 | 山东中医药大学第二附属医院 | 一种基于向量分析的中药配方治疗效果统计方法 |
CN111339153A (zh) * | 2020-02-21 | 2020-06-26 | 海南随手电子商务有限公司 | 匹配用户信息的方法及装置、存储介质、处理器 |
CN112002408A (zh) * | 2020-07-24 | 2020-11-27 | 北京科技大学 | 一种中医专病临床辅助诊断装置 |
CN112233750A (zh) * | 2020-10-20 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于咯血性状及疾病的信息匹配系统 |
CN113140310A (zh) * | 2021-05-06 | 2021-07-20 | 王耘 | 一种中医药智能诊疗系统及创建方法 |
CN117059214A (zh) * | 2023-07-21 | 2023-11-14 | 南京智慧云网络科技有限公司 | 一种基于人工智能的临床科研数据整合与智能分析系统及其方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120290319A1 (en) * | 2010-11-11 | 2012-11-15 | The Board Of Trustees Of The Leland Stanford Junior University | Automatic coding of patient outcomes |
WO2014201515A1 (en) * | 2013-06-18 | 2014-12-24 | Deakin University | Medical data processing for risk prediction |
CN104866979A (zh) * | 2015-06-08 | 2015-08-26 | 苏芮 | 一种突发急性传染病的中医病例数据处理方法和系统 |
CN104915561A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 疾病特征智能匹配方法 |
CN105184103A (zh) * | 2015-10-15 | 2015-12-23 | 清华大学深圳研究生院 | 基于病历数据库的虚拟名医 |
-
2016
- 2016-01-27 CN CN201610057302.1A patent/CN105740612B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120290319A1 (en) * | 2010-11-11 | 2012-11-15 | The Board Of Trustees Of The Leland Stanford Junior University | Automatic coding of patient outcomes |
WO2014201515A1 (en) * | 2013-06-18 | 2014-12-24 | Deakin University | Medical data processing for risk prediction |
CN104866979A (zh) * | 2015-06-08 | 2015-08-26 | 苏芮 | 一种突发急性传染病的中医病例数据处理方法和系统 |
CN104915561A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 疾病特征智能匹配方法 |
CN105184103A (zh) * | 2015-10-15 | 2015-12-23 | 清华大学深圳研究生院 | 基于病历数据库的虚拟名医 |
Non-Patent Citations (2)
Title |
---|
汤琼: "基于案例分析的中医临床诊疗支持系统设计与实现", 《医学信息》 * |
郑健等: "基于本体的名老中医医案研究应用系统", 《福建中医学院学报》 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018010390A (ja) * | 2016-07-12 | 2018-01-18 | グロースメディスン株式会社 | 骨粗鬆症の推奨薬の提示システム |
CN106570319B (zh) * | 2016-10-31 | 2019-10-22 | 北京科技大学 | 一种确定中医诊断模式的方法及装置 |
CN106570319A (zh) * | 2016-10-31 | 2017-04-19 | 北京科技大学 | 一种确定中医诊断模式的方法及装置 |
CN106874643A (zh) * | 2016-12-27 | 2017-06-20 | 中国科学院自动化研究所 | 基于词向量自动构建知识库实现辅助诊疗的方法和系统 |
CN107242857A (zh) * | 2017-06-12 | 2017-10-13 | 南开大学 | 基于深度学习的智能中医综合诊疗系统 |
CN108109692A (zh) * | 2017-11-08 | 2018-06-01 | 北京无极慧通科技有限公司 | 一种治疗方案的选择方法和系统 |
CN108231200A (zh) * | 2018-01-11 | 2018-06-29 | 浙江大学 | 一种基于主题模型和ilp的看病攻略生成方法 |
CN108231200B (zh) * | 2018-01-11 | 2020-06-30 | 浙江大学 | 一种基于主题模型和ilp的看病攻略生成方法 |
CN109346185A (zh) * | 2018-09-19 | 2019-02-15 | 北京科技大学 | 一种中医辅助诊断系统 |
CN109599177A (zh) * | 2018-11-27 | 2019-04-09 | 华侨大学 | 一种基于病历的深度学习预测医疗轨迹的方法 |
CN109616205A (zh) * | 2018-12-04 | 2019-04-12 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN109935323A (zh) * | 2018-12-29 | 2019-06-25 | 南京怡得健康管理有限公司 | 一种自动化有氧运动能力和心肺临床症状的评估系统 |
CN110136839A (zh) * | 2019-05-14 | 2019-08-16 | 北京百度网讯科技有限公司 | 一种症状信息处理方法、装置和电子设备 |
CN110600123A (zh) * | 2019-08-29 | 2019-12-20 | 成都信息工程大学 | 一种中医临床辅助诊断方法 |
CN110634134A (zh) * | 2019-09-04 | 2019-12-31 | 杭州憶盛医疗科技有限公司 | 一种细胞形态学人工智能自动诊断新方法 |
CN110853764A (zh) * | 2019-11-28 | 2020-02-28 | 成都中医药大学 | 一种糖尿病证候预测系统 |
CN110853764B (zh) * | 2019-11-28 | 2023-11-14 | 成都中医药大学 | 一种糖尿病证候预测系统 |
CN111178444A (zh) * | 2019-12-31 | 2020-05-19 | 山东中医药大学第二附属医院 | 一种基于向量分析的中药配方治疗效果统计方法 |
CN111178444B (zh) * | 2019-12-31 | 2023-06-02 | 山东中医药大学第二附属医院 | 一种基于向量分析的中药配方治疗效果统计方法 |
CN111339153A (zh) * | 2020-02-21 | 2020-06-26 | 海南随手电子商务有限公司 | 匹配用户信息的方法及装置、存储介质、处理器 |
CN112002408A (zh) * | 2020-07-24 | 2020-11-27 | 北京科技大学 | 一种中医专病临床辅助诊断装置 |
CN112233750A (zh) * | 2020-10-20 | 2021-01-15 | 吾征智能技术(北京)有限公司 | 一种基于咯血性状及疾病的信息匹配系统 |
CN112233750B (zh) * | 2020-10-20 | 2024-02-02 | 吾征智能技术(北京)有限公司 | 一种基于咯血性状及疾病的信息匹配系统 |
CN113140310A (zh) * | 2021-05-06 | 2021-07-20 | 王耘 | 一种中医药智能诊疗系统及创建方法 |
CN113140310B (zh) * | 2021-05-06 | 2024-02-27 | 王耘 | 一种中医药智能诊疗系统及创建方法 |
CN117059214A (zh) * | 2023-07-21 | 2023-11-14 | 南京智慧云网络科技有限公司 | 一种基于人工智能的临床科研数据整合与智能分析系统及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105740612B (zh) | 2019-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105740612A (zh) | 基于中医临床医案的疾病诊疗方法和系统 | |
CN108804677B (zh) | 结合多层级注意力机制的深度学习问题分类方法及系统 | |
Yu et al. | Hierarchical topic modeling of Twitter data for online analytical processing | |
Fang et al. | Unbiased metric learning: On the utilization of multiple datasets and web images for softening bias | |
Albalate et al. | Semi-supervised and unsupervised machine learning: novel strategies | |
Ding | Diversified ensemble classifiers for highly imbalanced data learning and their application in bioinformatics | |
Jacob et al. | Efficient classifier for classification of prognostic breast cancer data through data mining techniques | |
CN109935337B (zh) | 一种基于相似性度量的病案查找方法及系统 | |
Allahverdipour et al. | An improved k-nearest neighbor with crow search algorithm for feature selection in text documents classification | |
Figueroa et al. | Ensembling classifiers for detecting user intentions behind web queries | |
Ali et al. | An artificial intelligence-based framework for data-driven categorization of computer scientists: a case study of world’s top 10 computing departments | |
Moreira et al. | Learning to rank academic experts | |
Sameer et al. | Multi-objectives TLBO hybrid method to select the related risk features with rheumatism disease | |
Moholkar et al. | Lioness adapted GWO-based deep belief network enabled with multiple features for a novel question answering system | |
Zhang et al. | Enhancing clinical decision support systems with public knowledge bases | |
Chander | Clustering and Bayesian networks | |
Xiong et al. | Mining semantic information of co-word network to improve link prediction performance | |
Alali | A novel stacking method for multi-label classification | |
Guillén et al. | A machine learning approach for identifying subtypes of autism | |
Recharla et al. | Exploring Depression Symptoms through Similarity Methods in Social Media Posts. | |
CN116978106B (zh) | 批处理混合对比学习的跨模态情绪异常检测方法和装置 | |
Allahyari | Semantic web topic models: Integrating ontological knowledge and probabilistic topic models | |
Monika et al. | Data pre-processing and customized onto-graph construction for knowledge extraction in healthcare domain of semantic web | |
Boostani et al. | Diagnosis of the OCD Patients using Drawing Features of the Bender Gestalt Shapes | |
Ratnayake | Application of the recommendation architecture model for text mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190705 Termination date: 20210127 |