CN107463772A - 多维向量疾病谱的构建系统 - Google Patents

多维向量疾病谱的构建系统 Download PDF

Info

Publication number
CN107463772A
CN107463772A CN201710596247.8A CN201710596247A CN107463772A CN 107463772 A CN107463772 A CN 107463772A CN 201710596247 A CN201710596247 A CN 201710596247A CN 107463772 A CN107463772 A CN 107463772A
Authority
CN
China
Prior art keywords
disease
module
coordinate
levels
major class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710596247.8A
Other languages
English (en)
Other versions
CN107463772B (zh
Inventor
毛奎彬
李鑫
邓俊文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huiyang Health Science And Technology Co Ltd
Original Assignee
Guangzhou Huiyang Health Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huiyang Health Science And Technology Co Ltd filed Critical Guangzhou Huiyang Health Science And Technology Co Ltd
Priority to CN201710596247.8A priority Critical patent/CN107463772B/zh
Publication of CN107463772A publication Critical patent/CN107463772A/zh
Application granted granted Critical
Publication of CN107463772B publication Critical patent/CN107463772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开一种多维向量疾病谱的构建系统,包括病种池模块、循环定点模块以及病种整合模块,病种池模块设有多层病种数据集和病种差异数据集,多层病种数据集用于存放三个层次的病种集合的从属关系逐层进行归纳到病种大类;病种差异数据集中用于存放三个层次的病种分类差异信息;循环定点模块用于从病种池模块中获取病种分类与差异信息,再计算找到不同病种分类在空间中的定点得到各个层次的病种在多维空间中的位置坐标;病种整合模块根据各个层次病种的集合归属关系,将各个层次病种的坐标整合在一起,得到各个具体病种的位置坐标后,将计算结果以空间向量库的结构进行输出并分层显示。为电子病历数据处理提供数据基础。

Description

多维向量疾病谱的构建系统
技术领域
本发明涉及医疗技术领域,特别是指一种多维向量疾病谱的构建系统。
背景技术
在电子病历的聚类分析以及检索优化中的一种新思路是将电子病历抽象为一个个空间向量,再通过运算两个向量之间的距离以衡量两者之间的关联程度,从而再找出组间距离较为接近的一组向量,或者是找到距离由检索条件抽象而成的空间向量最接近的向量集合。而这些运算的基础工作是将电子病历抽象化为空间向量,而对于某些特殊的文本型变量,例如诊断等,就需要较为精细的抽象方法,从而将具体的变量取值转变为空间向量中的一个或多个维度,并使这些向量之间的距离能够代表不同取值之间的差异与联系。
因此,有必要设计一种新的多维向量疾病谱的构建系统,以解决上述技术问题。
发明内容
针对背景技术中存在的问题,本发明的目的是提供一种多维向量疾病谱的构建系统,为电子病历、检索优化乃至更多领域的电子病历数据处理提供数据基础。
本发明的技术方案是这样实现的:一种多维向量疾病谱的构建系统,包括病种池模块、循环定点模块以及病种整合模块,其中,所述病种池模块设有多层病种数据集和病种差异数据集,所述多层病种数据集用于存放三个层次的病种集合的从属关系,将具体的病种聚类存放于不同的集合当中,再逐层进行归纳,一直归纳到病种大类;所述病种差异数据集中用于存放三个层次的病种分类差异信息,所述差异信息以临床实践作为指导,将不同病种分类之间的差异量化为数值,便于将这些差异作为距离以在空间中进行定点;所述循环定点模块用于从病种池模块中获取病种分类与差异信息,再采用空间循环定点的计算找到不同病种分类在空间中的定点;经过各个层次的循环定点计算之后,得到各个层次的病种在多维空间中的位置坐标;所述病种整合模块根据各个层次病种的集合归属关系,将各个层次病种的坐标整合在一起,依次将病种大类、ADRGs以及具体病种的位置坐标先后整合于一个坐标当中,所得的坐标即为各个具体病种在多维空间中的位置坐标;得到各个具体病种的位置坐标后,将计算结果以空间向量库的结构进行输出,包含各个病种的名称与对应坐标,分层显示。
在上述技术方案中,所述病种大类的构建采用的是DRGs分组的分组大类分类方法,包含25个大类,包括神经系统疾病、眼部疾病、耳鼻咽喉疾病及多发性创伤,是对不同病种的大类划分。
在上述技术方案中,所述ADRGs是指在病种大类下对不同病种更进一步的区分,在每个病种大类下对其所属的病种进行更加细致的区分。
在上述技术方案中,所述空间循环定点的计算是采用逐渐升维的方法,逐渐增加病种分类,根据与已添加病种之间的距离找到现有空间中是否能够定点,如果不能定点则升维。
在上述技术方案中,所述各具体病种的位置坐标是结构化的树状结构,第一部分的坐标是病种大类的坐标,第二部分的坐标是ADRGs的坐标,第三部分是在具体病种层次的坐标。
本发明多维向量疾病谱的构建系统,包括病种池模块、循环定点模块以及病种整合模块,病种池模块设有多层病种数据集和病种差异数据集,能够将不同病种之间的实际差异进行量化,构建出一个多维空间,并通过这种运算方法找到这些病种在多维空间中的坐标,从而反应不同病种之间的差异。多维向量疾病谱的构建能够为电子病历、检索优化乃至更多领域的电子病历数据处理提供数据基础。
附图说明
图1为本发明多维向量疾病谱构建系统原理框图;
图2为本发明中循环定点算法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明在于多层病种数据集的分层构建。在医学诊疗实践中病种不计其数,如果逐个计算距离运算量极为庞大,构建出来的空间向量也会维度极高。因此将病种数据集进行分层,三个层次分为DRGs的病种大类、ADRGs以及具体病种,三个层次经过循环定点找到在多维空间中的具体定位,从而最终确立多维向量疾病谱
所述多维向量疾病谱的构建系统,是以点代病种,以距离具像化病种之间的差异,根据“不在同一条直线上的三个点确定一个平面”这一数学公理,通过循环定点找到不同病种在多维空间中的定位,如图1所示,其包括病种池模块、循环定点模块以及病种整合模块,以下是对上述各模块的详细说明。
(1)病种池模块:
病种池模块是该系统的初始模块,存放着用于疾病谱构建运算的未处理数据。具体而言,病种池模块分为两个子模块,分别为多层病种数据集,以及病种差异数据集。
多层病种数据集存放的是三个层次的病种集合的从属关系,将具体的病种聚类存放于不同的集合当中,再逐层进行归纳,一直归纳到病种大类。三个层次分别为:
a.病种大类:病种大类的构建采用的是DRGs分组的分组大类分类方法,其中包含25个大类,包括神经系统疾病、眼部疾病、耳鼻咽喉疾病乃至多发性创伤等,是对不同病种的大类划分。
b.ADRGs:在病种大类下对不同病种更进一步的区分,在每个病种大类下对其所属的病种进行更加细致的区分,例如对于耳鼻咽喉疾病大类而言,可以继续划分为:头颈部肿瘤、鼓窦与乳突疾病、耳鼻咽喉肿瘤等。
c.具体病种:在每个ADRGs下具体的病种,例如耳鼻咽喉肿瘤分类下还包括鼻咽癌、喉癌等疾病。
在病种差异数据集中,存放着三个层次的病种分类差异信息,这些差异信息以临床实践作为指导,将不同病种分类之间的差异量化为数值,以便于将这些差异作为距离以在空间中进行定点。
例如在第一层次病种大类之内,不同病种之间的差异经过量化之后得到一张表:
神经系统 眼部 耳鼻咽喉 呼吸系统 ...
神经系统 0
眼部 100 0
耳鼻咽喉 250 100 0
呼吸系统 200 200 50 0
....
如上表所示,当中的数值代表两个病种大类之间的关系,数值越小关联程度越高。例如耳鼻咽喉疾病与呼吸系统疾病之间的数值为50,说明两者关系较大。需要说明的是,在病种大类之中设置的距离单位是最大的,ADRGs次之,具体病种最小,以体现不同种类病种之间的绝对差异。
(2)循环定点模块:
循环定点模块是具体的运算模块,该模块从病种池模块获取病种分类与差异信息,再采用空间循环定点的算法找到不同病种分类在空间中的定点。
空间循环定点的算法是采用逐渐升维的方法,逐渐增加病种分类,根据与已添加病种之间的距离找到现有空间中是否能够定点,如果不能定点则升维。具体步骤如下,流程图如图2所示:
a.先以任意一个病种分类作为空间基点,定基点坐标为0。
b.引入第二个病种,读取该病种与基点病种之间的距离,将该距离设置为该病种坐标。
c.引入下一个病种,读取该病种与第一个病种之间的距离,读取该病种与第二个病种之间的距离,以距离作为各自的半径、以两个病种坐标为圆心作圆(或多维空间下的球体)。在多个解中取正值解。如果无解,则选取两圆(或球体)相聚最近的一条径的中点,作为该病种的坐标。如果两圆交点落在原维度上则不升维,新坐标为该交点坐标;如果不落在原维度上,则升维,升维后原各病种的空间坐标该维度设为0,而新引入病种的坐标即为升维后的空间坐标。
d.判断新引入病种的新升维度的值是否小于设定的升维阈值,如果小于该升维阈值,则重新降维,将该点在原多维空间的投影作为该新引入病种的坐标。
e.新引入病种,重复c、d两个步骤,之前已引入的点都作为参考坐标。重复上述操作,指导该层次所有的病种都完成。
(3)病种整合模块:
经过各个层次的循环定点运算之后,得到各个层次的病种在多维空间中的位置坐标。随后病种整合模块根据各个层次病种的集合归属关系,将各个层次病种的坐标整合在一起,依次将病种大类、ADRGs乃至具体病种的位置坐标先后整合于一个坐标当中,所得的坐标即为各个具体病种在多维空间中的位置坐标。
由以上步骤描述可知,各具体病种的位置坐标都是结构化的树状结构,第一部分的坐标是病种大类的坐标,第二部分的坐标是ADRGs的坐标,第三部分是在具体病种层次的坐标。因此使得同一类较为接近的病种在空间位置中能够占据较为相近的位置。保证这一点的前提是各层次的坐标单位是不同的,例如第一层次的坐标单位是50,第二层次的坐标单位是10,第三层次的坐标单位是1,这样就避免了两大类病种在空间位置中可能出现的交叉重叠现象,确保两大类不同的病种之间的较大差异能较好地通过多维向量坐标表示出来。
得到各个具体病种的位置坐标后,将运算结果以空间向量库的结构进行输出,包含各个病种的名称与对应坐标,分层显示。
以下是结合一具体有实例对本发明做的进一步说明:
现在病种池模块中三个层次下有如下的病种:
首先进行第一层次即病种大类的空间定位。以上四个大类的差异量化表如下表所示:
神经系统疾病 耳鼻咽喉疾病 呼吸系统疾病 内分泌疾病
神经系统疾病 0
耳鼻咽喉疾病 250 0
呼吸系统疾病 200 50 0
内分泌疾病 250 150 150 0
以神经系统疾病作为基点,坐标为0。
引入耳鼻咽喉疾病,以两者之间的距离作为新坐标,坐标为250。
引入呼吸系统疾病,与神经系统疾病之间的距离为200,与耳鼻咽喉疾病的距离为50,则两圆交点刚好落在原维度(一维)上,呼吸系统疾病坐标为200。
引入内分泌疾病,内分泌疾病与神经系统疾病、耳鼻咽喉疾病、呼吸系统疾病的距离分别为250、150、150。经过运算后内分泌疾病在空间中的坐标到达三维空间,坐标为(200,150,9)。所设定的升维阈值是10,而第三维的坐标值为9,小于升维阈值,因此重新降维,因此内分泌疾病的空间坐标为(200,150)。原来各病种也升维到二维,但二维坐标值为0。
因此计算结果各病种大类的坐标值为:
坐标
神经系统疾病 (0,0)
耳鼻咽喉疾病 (250,0)
呼吸系统疾病 (200,0)
内分泌疾病 (200,150)
如果病种大类继续增多,维度可以继续上升。
而在神经系统疾病大类下,各小类病种的坐标也已得出:神经退行性疾病0,外周神经系统疾病30,占位性病变是80。在神经退行性疾病这一类下,早老性痴呆是1,帕金森病是2,因此早老性痴呆和帕金森病的坐标值为:
坐标
早老性痴呆 (0,0,0,1)
帕金森病 (0,0,0,2)
早老性痴呆与帕金森病在坐标上较为接近,因此说明两者有一定的相似性(都为神经退行性疾病)。将上述方法应用到所有病种,可以得到一个囊括大量病种的多维向量疾病谱。
综上,相较现有技术,本发明多维向量疾病谱的构建系统具有以下有益效果:
1.以空间向量作为运算工具,对电子病历进行聚类分析、检索优化的处理操作时,必要的前提条件是对诊断这一类取值复杂的文本型变量进行向量抽象。如果用人工凭借感性印象对浩杂的病种进行多维空间的抽象,在低维条件下或许还能保持一定的准确性,但一旦升到高维,或病种数达到一定量级后,由于情况繁杂准确性将难以保证。如果采用分层构建,将不同病种之间的差异具体化为空间中的距离,那么就可以用这些距离在空间中寻找下一个病种的坐标。两两病种之间的差异总是好把握的,因此用距离寻找空间坐标的准确性会高得多。
2.如果不进行分层,那么就需要对数量众多成百上千的病种逐个逐个进行差异定量分析,再根据两两之间的差异作为距离计算多维空间中的的相对坐标。如果有n种病种,那么就会有n×(n-1)/2对关系,当n为成百上千的情况下这一计算量会非常大,而且无法确保同属于一类的疾病能够分到相近的位置中。而采用分层构建,就能够在局部范围数量不多的一类病种之间进行运算,运算量将会小得多,而且能够确保同一类的病种在同一个范围内,距离较近。
3.如果不采用分层构建,对大量的病种进行两两之间的差异分析,并以两两之间量化的差异作为距离进行空间定位的话,那么病种极多,而循环定点在每一次定点过程中都有可能伴随着升维,那么结果就有可能是定位的结果可能上升到非常高的维数,可能是几百几千的高维,而这一复杂运算结果对检索优化、聚类分析等领域的实践会造成不少的麻烦,不利于实际应用。而分层构建就能够在各层次内进行构建,能避免最后的结果上升到非常高的维度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种多维向量疾病谱的构建系统,其特征在于:包括病种池模块、循环定点模块以及病种整合模块,其中,
所述病种池模块设有多层病种数据集和病种差异数据集,所述多层病种数据集用于存放三个层次的病种集合的从属关系,将具体的病种聚类存放于不同的集合当中,再逐层进行归纳,一直归纳到病种大类;所述病种差异数据集中用于存放三个层次的病种分类差异信息,所述差异信息以临床实践作为指导,将不同病种分类之间的差异量化为数值,便于将这些差异作为距离以在空间中进行定点;
所述循环定点模块用于从病种池模块中获取病种分类与差异信息,再采用空间循环定点的计算找到不同病种分类在空间中的定点;经过各个层次的循环定点计算之后,得到各个层次的病种在多维空间中的位置坐标;
所述病种整合模块根据各个层次病种的集合归属关系,将各个层次病种的坐标整合在一起,依次将病种大类、ADRGs以及具体病种的位置坐标先后整合于一个坐标当中,所得的坐标即为各个具体病种在多维空间中的位置坐标;得到各个具体病种的位置坐标后,将计算结果以空间向量库的结构进行输出,包含各个病种的名称与对应坐标,分层显示。
2.根据权利要求1所述的多维向量疾病谱的构建系统,其特征在于:所述病种大类的构建采用的是DRGs分组的分组大类分类方法,包含25个大类,包括神经系统疾病、眼部疾病、耳鼻咽喉疾病及多发性创伤,是对不同病种的大类划分。
3.根据权利要求2所述的多维向量疾病谱的构建系统,其特征在于:所述ADRGs是指在病种大类下对不同病种更进一步的区分,在每个病种大类下对其所属的病种进行更加细致的区分。
4.根据权利要求1所述的多维向量疾病谱的构建系统,其特征在于:所述空间循环定点的计算是采用逐渐升维的方法,逐渐增加病种分类,根据与已添加病种之间的距离找到现有空间中是否能够定点,如果不能定点则升维。
5.根据权利要求3所述的多维向量疾病谱的构建系统,其特征在于:所述各具体病种的位置坐标是结构化的树状结构,第一部分的坐标是病种大类的坐标,第二部分的坐标是ADRGs的坐标,第三部分是在具体病种层次的坐标。
CN201710596247.8A 2017-07-20 2017-07-20 多维向量疾病谱的构建系统 Active CN107463772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710596247.8A CN107463772B (zh) 2017-07-20 2017-07-20 多维向量疾病谱的构建系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710596247.8A CN107463772B (zh) 2017-07-20 2017-07-20 多维向量疾病谱的构建系统

Publications (2)

Publication Number Publication Date
CN107463772A true CN107463772A (zh) 2017-12-12
CN107463772B CN107463772B (zh) 2020-12-18

Family

ID=60543859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710596247.8A Active CN107463772B (zh) 2017-07-20 2017-07-20 多维向量疾病谱的构建系统

Country Status (1)

Country Link
CN (1) CN107463772B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108968951A (zh) * 2018-08-15 2018-12-11 武汉中旗生物医疗电子有限公司 心电图检测方法、装置及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1303061A (zh) * 1999-10-21 2001-07-11 国际商业机器公司 用于排序分类属性以更好地可视化多维数据的系统和方法
EP2733643A2 (en) * 2012-11-16 2014-05-21 Tata Consultancy Services Limited System and method facilitating designing of classifier while recognizing characters in a video
CN106650299A (zh) * 2017-01-18 2017-05-10 浙江大学 一种患者相似性分析的快速计算方法
CN106778014A (zh) * 2016-12-29 2017-05-31 浙江大学 一种基于循环神经网络的患病风险预测方法
CN106845098A (zh) * 2017-01-17 2017-06-13 天津艾登科技有限公司 一种基于决策树算法的疾病诊断分组的实现方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1303061A (zh) * 1999-10-21 2001-07-11 国际商业机器公司 用于排序分类属性以更好地可视化多维数据的系统和方法
EP2733643A2 (en) * 2012-11-16 2014-05-21 Tata Consultancy Services Limited System and method facilitating designing of classifier while recognizing characters in a video
CN106778014A (zh) * 2016-12-29 2017-05-31 浙江大学 一种基于循环神经网络的患病风险预测方法
CN106845098A (zh) * 2017-01-17 2017-06-13 天津艾登科技有限公司 一种基于决策树算法的疾病诊断分组的实现方法
CN106650299A (zh) * 2017-01-18 2017-05-10 浙江大学 一种患者相似性分析的快速计算方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LUO Z: ""Dynamic Categorization of Clinical Research Eligibility Criteria by Hierarchical Clustering"", 《JOURNAL OF BIOMEDICAL INFORMATICS》 *
李保利: ""基于类别层次结构的多层文本分类样本扩展策略"", 《北京大学学报自然科学版》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108968951A (zh) * 2018-08-15 2018-12-11 武汉中旗生物医疗电子有限公司 心电图检测方法、装置及系统
CN108968951B (zh) * 2018-08-15 2021-06-22 武汉中旗生物医疗电子有限公司 心电图检测方法、装置及系统

Also Published As

Publication number Publication date
CN107463772B (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
CN110349652B (zh) 一种融合结构化影像数据的医疗数据分析系统
Chereda et al. Utilizing Molecular Network Information via Graph Convolutional Neural Networks to Predict Metastatic Event in Breast Cancer.
Schmidt et al. A family of interaction-adjusted indices of community similarity
US20130254202A1 (en) Parallelization of synthetic events with genetic surprisal data representing a genetic sequence of an organism
EP3475683B1 (en) Image atlas systems and methods
CN104200114B (zh) 流式细胞仪数据快速分析方法
WO2016139183A1 (en) Computerized device and method for processing image data
CN111312334B (zh) 一种影响细胞间通讯的受体-配体系统分析方法
CN111785366B (zh) 患者治疗方案的确定方法、装置及计算机设备
Sweeney et al. Combined mapping of multiple clustering algorithms (communal): a robust method for selection of cluster number, K
CN106022297A (zh) 一种手势识别方法及装置
Cao et al. Supervised contrastive pre-training formammographic triage screening models
Hao et al. Vp-detector: A 3d multi-scale dense convolutional neural network for macromolecule localization and classification in cryo-electron tomograms
Hasan et al. Automatic clustering and classification of coffee leaf diseases based on an extended kernel density estimation approach
Burke Discovering patterns in microarray data
CN107436933A (zh) 用于病历档案整理的层次聚类系统
CN107463772A (zh) 多维向量疾病谱的构建系统
CN111951260B (zh) 基于部分特征融合卷积神经网络实时目标计数系统及方法
Tran et al. Blood cell count using deep learning semantic segmentation
CN115985503B (zh) 基于集成学习的癌症预测系统
Popescu et al. Intelligent image processing system for detection and segmentation of regions of interest in retinal images
TWI599896B (zh) 多輸出決策屬性選擇暨資料離散化分類方法
Hitimana et al. An Intelligent System-Based Coffee Plant Leaf Disease Recognition Using Deep Learning Techniques on Rwandan Arabica Dataset
Ayoola et al. A Comparative Analysis of Hybridized Genetic Algorithm in Predictive Models of Breast Cancer Tumors
Wang et al. Partially-independent component analysis for tissue heterogeneity correction in microarray gene expression analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant