CN110704405A - 一种基于疾病指标的数据融合方法及装置 - Google Patents
一种基于疾病指标的数据融合方法及装置 Download PDFInfo
- Publication number
- CN110704405A CN110704405A CN201910809887.1A CN201910809887A CN110704405A CN 110704405 A CN110704405 A CN 110704405A CN 201910809887 A CN201910809887 A CN 201910809887A CN 110704405 A CN110704405 A CN 110704405A
- Authority
- CN
- China
- Prior art keywords
- index
- disease
- index set
- disease index
- names
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/20—ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Bioethics (AREA)
- Quality & Reliability (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种基于疾病指标的数据融合方法及装置,该方法包括:获取第一疾病指标集以及第二疾病指标集,所述第一疾病指标集以及所属第二疾病指标集均包括指标名称和所述指标名称对应的所属层级;根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集。本发明通过获取至少两个疾病指标集中的指标名称和所属层级后,根据指标名称所属的层级采用相应的融合策略,以获得经过融合的目标疾病指标集,从而可以对多种疾病进行综合统计分析,可以为医学研究人员提供一种多疾病共同研究的解决方案,对疾病的发展研究以及药物治疗研究具有重要意义。
Description
技术领域
本发明涉及医疗数据处理技术领域,尤其涉及一种基于疾病指标的数据融合方法及装置。
背景技术
医疗机构是对患者进行诊断和提供医疗服务(例如治疗疾病)的机构,目前公立医院和私立医院在对患者进行诊治(包括诊断和治疗)的过程中会产生大量的诊断数据,这些诊断数据会较清晰的反映患者的身体状况(例如是否具有特定的疾病,以及这些疾病的诊疗情况)。
目前常用的做法是根据疾病的具体类型将对应的诊断数据分别存放在不同疾病指标集中,比如:胃癌的建立一个胃癌疾病指标集,结直肠癌的建立一个结直肠癌指标集。胃癌的既往史可以包括是否有胃部恶性肿瘤史、是否有胃部手术史、胃部手术史信息.胃部手术名称、胃部手术史信息.胃部手术时间、是否有胃部恶性肿瘤家族史、胃部恶性肿瘤家族史亲属关系等,结直肠癌的既往史可以包括是否有炎症性肠病、是否有阑尾手术史、是否有胆囊手术史、是否肠息肉病史、是否有结直肠恶性肿瘤史、是否有结直肠手术史、入院时间、肿瘤名称、肿瘤发生时间等。
可见,上述疾病指标集可以对具体的疾病进行深度分析和统计,但是无法对多种疾病进行综合统计分析。
发明内容
本发明提供一种基于疾病指标的数据融合方法及装置,以解决现有疾病指标集无法对多种疾病进行综合统计分析的技术问题。
本发明实施例的第一方面,提供了一种基于疾病指标的数据融合方法,包括:
获取至少两个第一疾病指标集中每个第一疾病指标集的指标名称和指标名称的所属层级;
获取第一疾病指标集以及第二疾病指标集;所述疾病指标集包括指标名称和所述指标名称对应的所属层级;
根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集。
本发明实施例的第二方面,提供了一种基于疾病指标的数据融合装置,包括:
获取模块,用于获取第一疾病指标集以及第二疾病指标集,所述疾病指标集包括指标名称和所述指标名称对应的所属层级;
指标集确定模块,用于根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集。
本发明实施例的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面中任一项所述的基于疾病指标的数据融合方法。
本发明实施例的第四方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面中任一项所述的基于疾病指标的数据融合方法。
本发明实施例提供的一种基于疾病指标的数据融合方法及装置的有益效果至少在于:通过获取至少两个疾病指标集中的指标名称和所属层级后,根据指标名称所属的层级不同,采用不同的融合策略,以获得经过融合的目标疾病指标集,从而可以对多种疾病进行综合统计分析,可以为医学研究人员提供一种多疾病共同研究的解决方案,对疾病(例如肿瘤疾病)的发展研究以及药物治疗研究均有重要意义。
附图说明
为了更清楚地说明本发明实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种基于疾病指标的数据融合方法的流程示意图;
图2为本发明一实施例提供的一种基于疾病指标的数据融合方法中确定目标疾病指标集的流程示意图;
图3为本发明一实施例提供的一种基于疾病指标的数据融合方法中根据第一相似度确定目标疾病指标集的流程示意图;
图4为本发明一实施例提供的一种基于疾病指标的数据融合方法中根据第二相似度确定目标疾病指标集的流程示意图;
图5为本发明一实施例提供的一种基于疾病指标的数据融合方法中根据第三相似度确定目标疾病指标集的流程示意图;
图6为本发明一实施例提供的一种基于疾病指标的数据融合装置的结构示意图;
图7为本发明另一实施例提供的一种基于疾病指标的数据融合装置中指标集确定模块的结构示意图;
图8为本发明一实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的一种基于疾病指标的数据融合方法的流程示意图。如图1所示,本发明实施例提供的基于疾病指标的数据融合方法,包括:
S10:获取第一疾病指标集以及第二疾病指标集,所述第一疾病指标集以及所属第二疾病指标集均包括指标名称和所述指标名称对应的所属层级。
此处第一疾病指标集和第二疾病指标集可以是相同类型的指标集,也可以是不同类型的指标集。每个疾病指标集中均包括相应的指标的信息,例如指标名称以及指标名称对应的所属层级,其中所属层级可以根据实际需要进行设置,例如可以是三层。
在本实施例中,第一疾病指标集可以是胃癌疾病指标集,第二疾病指标集可以是结直肠癌疾病指标集,其中胃癌疾病指标集中包括的指标名称以及指标名称的所属层级如下:
结直肠癌疾病指标集中包括的指标名称以及指标名称的所属层级如下:
指标名称 | 指标名称的所属层级 |
姓名 | 第一层 |
性别 | 第一层 |
国籍 | 第一层 |
民族 | 第一层 |
评价时间 | 第二层 |
ECOG评分 | 第二层 |
KPS评分 | 第二层 |
ASA分级 | 第二层 |
淋巴结肿大部位 | 第二层 |
是否有炎症性肠病 | 第三层 |
是否有阑尾手术史 | 第三层 |
是否有胆囊手术史 | 第三层 |
是否肠息肉病史 | 第三层 |
是否有结直肠恶性肿瘤史 | 第三层 |
是否有结直肠手术史 | 第三层 |
其中,第一层级为通用层,该层的指标不会根据患者疾病的所属专科、疾病的不同而改变;第二层级为专科层,属于该层的指标根据患者疾病所属专科的不同而具有不同的处理逻辑,且处理后的值也不相同;第三层级为疾病层,属于该层的指标根据专科领域内的疾病不同而具有不同的处理逻辑,且处理后的值也不相同。指标被进行加工处理后,可以采用PKID作为其唯一标示。
可以理解的是,疾病指标集的数量并不仅限于上述的两个(第一疾病指标集和第二疾病指标集),还可以为三个及三个以上,其处理逻辑与疾病指标集的数量为两个时相同,此处不再赘述。
S20:根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集。
通过将第一疾病指标集和第二疾病指标集进行融合,可以获得融合后的疾病指标集,即目标疾病指标集。根据步骤S10的分析可知,第一疾病指标集和第二疾病指标集中有的指标名称相同,有的指标名称不同,而根据指标的所属层级不同,在进行融合时可以采用不同的融合策略,以获得目标疾病指标集。
请参阅图2,在一个实施例中,步骤S20包括以下步骤:
步骤S31:判断所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级是否为第一层级。
当所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级为第一层级时,此时可以根据第一层级的融合规则来对两个疾病指标集进行融合。
此时可进行下述步骤:
步骤S32:选取所述第一疾病指标集中的一个指标名称为第一目标指标名称,并计算所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第一目标指标名称的第一相似度。
在本实施例中,第一层级为通用层,该层的指标不会根据患者疾病的所属专科、疾病的不同而改变,因此采用的融合策略为“去重取并集”,即将第一疾病指标集和第二疾病指标集中均属于第一层级的指标中相同的部分去重,然后进行合并。
例如,第一疾病指标集和第二疾病指标集分别为上述的胃癌疾病指标集和结直肠癌疾病指标集时,胃癌疾病指标集中属于第一层级的指标包括:姓名、性别、国籍和民族,结直肠癌疾病指标集中属于第一层级的指标包括:姓名、性别、国籍和民族,因此在融合时,可以依次将胃癌疾病指标集中的姓名、性别、国籍和民族分别选为第一目标指标名称,分别计算与结直肠癌疾病指标集中的姓名、性别、国籍和民族的相似度。
步骤S33:根据所述第一相似度,确定所述目标疾病指标集。
当第一目标指标名称与其他指标名称之间的相似度满足一定条件时,则可以认为两者其实为同一个指标名称,这时需要“去重”;当第一目标指标名称与其他指标名称之间的相似度不满足一定条件时,则可以认为两者为不同的指标名称,在进行融合时均需要保留。请参阅图3,其具体的融合过程可以为:
步骤S331:判断所述第一相似度是否大于等于第一相似度阈值。
当所述第一相似度大于等于所述第一相似度阈值时,则进行下述步骤:
步骤S332:去除所述其他指标名称,从而实现相同指标名称的去重。
当所述第一相似度小于所述第一相似度阈值时,则进行下述步骤:
步骤S333:保留所述其他指标名称。
例如,针对第一层级,胃癌疾病指标集选定的第一目标指标名称为姓名时,与结直肠癌疾病指标集构成的相似度比较对包括(姓名,姓名)、(姓名,性别)、(姓名,国籍)以及(姓名,民族),第一相似度阈值可以根据需要进行设置。进行相似度比较可知,(姓名,姓名)的相似度满足大于等于第一相似度阈值,(姓名,性别)、(姓名,国籍)以及(姓名,民族)的相似度不满足大于等于第一相似度阈值,因此(姓名,姓名)需要去重,仅保留一个姓名即可,而性别、国籍和民族保留。依次类推,胃癌疾病指标集选定的第一目标指标名称为性别、国籍和民族时,依次进行上述过程可知,经过“去重”过程后,保留的指标名称为姓名、性别、国籍和民族。
步骤S334:将所述第一疾病指标集和所述第二疾病指标集中所属的层级为第一层级的指标名称进行合并,以获得所述目标疾病指标集。
经过上述去重过程后,留下的第一疾病指标集和第二疾病指标集中的指标名称均为目标疾病指标集中第一层级的指标名称。在上述实施例中,所获得的目标疾病指标集中属于第一层级的指标名称包括:姓名、性别、国籍和民族。
请参阅图2,在一个实施例中,当所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级不是第一层级时,可继续进行下述步骤:
步骤S41:判断所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级是否为第二层级。
当所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级为第二层级时,此时可以根据第一层级的融合规则来对两个疾病指标集进行融合。在本实施例中,第二层级为专科层,属于该层的指标根据患者疾病所属专科的不同而具有不同的处理逻辑,且处理后的值也不相同,因此还需要对专科层进一步进行判断,以确定不同的融合策略。此时可进行下述步骤:
步骤S42:选取所述第一疾病指标集中的一个指标名称为第二目标指标名称,并判断所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称是否属于同一数据层。
当所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称属于同一数据层时,意味着其属于相同的专科,此时可进行下述步骤:
步骤S43:计算所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称的第二相似度。
在本实施例中,对于属于同一专科的指标采用的融合策略为“去重取并集”,即将第一疾病指标集和第二疾病指标集中均属于第二层级同一专科的指标中相同的部分去重,然后进行合并。获取第二相似度的过程与上述步骤S32类似,此处不再赘述。
步骤S44:根据所述第二相似度,确定所述目标疾病指标集。
当第二目标指标名称与其他指标名称之间的相似度满足一定条件时,则可以认为两者其实为同一个指标名称,这时需要“去重”;当第二目标指标名称与其他指标名称之间的相似度不满足一定条件时,则可以认为两者为不同的指标名称,在进行融合时均需要保留。请参阅图4,其具体的融合过程可以为:
步骤S441:判断所述第二相似度是否大于等于第二相似度阈值。
当所述第二相似度大于等于所述第二相似度阈值时,则进行下述步骤:
步骤S442:去除所述其他指标名称,从而实现相同指标名称的去重。
当所述第一相似度小于所述第二相似度阈值时,则进行下述步骤:
步骤S443:保留所述其他指标名称;
步骤S444:将所述第一疾病指标集和所述第二疾病指标集中所属的层级为第二层级的指标名称进行合并,以获得所述目标疾病指标集。
经过上述去重过程后,留下的第一疾病指标集和第二疾病指标集中的指标名称均为目标疾病指标集中第二层级的指标名称。
请参阅图2,在一个实施例中,步骤S42后,当所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称不属于同一数据层时,意味着其属于不同的专科,此时不需要进行“去重”再合并,可进行下述步骤:
步骤S45:计算所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称的第三相似度。
步骤S46:根据所述第三相似度,确定所述目标疾病指标集。
此时,虽然不需要去重,但考虑到第二层级不同专科的指标名称可能存在相同的情形,因此为了避免在疾病指标集融合后出现混淆的情形,需要对相似的指标名称进行标记,以确定目标疾病指标集。请参阅图5,具体过程可以为:
步骤S461:判断所述第三相似度是否大于等于第三相似度阈值;
当所述第三相似度大于等于所述第三相似度阈值时,意味着两个指标名称可认为相同,此时进行下述步骤:
步骤S462:对所述第二目标指标名称和所述其他指标名称分别进行标记,以获得标记后指标名称。在标记时,可以采用所属的专科名称作为对应指标名称的后缀,从而可以实现区分。
当所述第三相似度小于所述第三相似度阈值时,则进行下述步骤:
步骤S463:保留所述其他指标名称;
步骤S464:将所述第一疾病指标集和所述第二疾病指标集中所属层级为第二层级的标记后指标名称进行合并,以获得所述目标疾病指标集。
经过上述标记过程后,第一疾病指标集和第二疾病指标集中的指标名称均为目标疾病指标集中第二层级的指标名称。
请参阅图2,在一个实施例中,当所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级不是第三层级时,可继续进行下述步骤:
步骤S51:判断所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级是否为第三层级;
当所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级为第三层级时,此时可以根据第三层级的融合规则来对两个疾病指标集进行融合。在本实施例中,第二层级为疾病层,属于该层的指标根据专科领域内疾病的不同而具有不同的处理逻辑,且处理后的值也不相同,采取的融合策略为“不去重取并集”。此时可进行下述步骤:
步骤S52:对所述第一疾病指标集和所述第二疾病指标集中指标名称分别进行标记,以获得标记后指标名称。在标记时,可以采用所属的专科名称作为对应指标名称的后缀;当然,也可以通过其他相关信息来进行标注,从而可以实现区分。
步骤S53:将所述第一疾病指标集和所述第二疾病指标集中所属层级为第三层级的标记后指标名称进行合并,以获得所述目标疾病指标集。
例如,第一疾病指标集和第二疾病指标集分别是胃癌疾病指标集和结直肠癌疾病指标集时,经过融合所获得的目标疾病指标集可以为:
在获得目标疾病指标集后,可以对目标疾病指标集中的指标进行权限管理,以使得具有相应权限的用户可以获得相应的信息。例如,针对只有胃癌权限的用户,对应标记为结直肠癌的指标以及该指标下对应的数据对胃癌权限的人隐藏,不可以使用该数据进行导出、抽取、搜索等数据的应用。
本实施例提供的基于疾病指标的数据融合方法的有益效果至少在于:通过获取至少两个疾病指标集中的指标名称和所属层级后,根据指标名称所属的层级不同,采用不同的融合策略,以获得经过融合的目标疾病指标集,从而可以对多种疾病进行综合统计分析,可以为医学研究人员提供一种多疾病共同研究的解决方案,对疾病(例如肿瘤疾病)的发展研究以及药物治疗研究均有重要意义。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
以下给出两个具体的实施例,以对采用上述基于疾病指标的数据融合方法后获得目标疾病指标集进行示例性说明,并不用于限制本发明。
实施例一:
第一疾病指标集是胃癌疾病指标集,第二疾病指标集是乳腺癌疾病指标集。其中,胃癌疾病指标集中包括的指标名称以及指标名称的所属层级如下:
乳腺癌疾病指标集中包括的指标名称以及指标名称的所属层级如下:
指标名称 | 指标名称的所属层级 |
患者姓名 | 第一层 |
患者身份证 | 第一层 |
住院检查 | 第一层 |
体格检查 | 第二层 |
住院病情评估 | 第二层 |
T分期 | 第三层 |
N分期 | 第三层 |
M分期 | 第三层 |
采用上述步骤对两个疾病指标集进行处理,融合后的目标疾病指标集中包括的指标名称以及指标名称的所属层级如下:
实施例二:
第一疾病指标集是胃癌疾病指标集,第二疾病指标集是结直肠癌疾病指标集。其中,胃癌疾病指标集中包括的指标名称以及指标名称的所属层级如下:
指标名称 | 指标名称的所属层级 |
患者姓名 | 第一层 |
患者性别 | 第一层 |
是否肝转移(否) | 第二层 |
组织学类型(溃疡) | 第二层 |
是否有胃部手术(是) | 第二层 |
T分期 | 第三层 |
N分期 | 第三层 |
M分期 | 第三层 |
身体状况评价-ECGO评分 | 第三层 |
结直肠癌疾病指标集中包括的指标名称以及指标名称的所属层级如下:
采用上述步骤对两个疾病指标集进行处理,融合后的目标疾病指标集中包括的指标名称以及指标名称的所属层级如下:
指标名称 | 指标名称的所属层级 |
患者姓名 | 第一层 |
患者性别 | 第一层 |
是否肝转移【胃癌】(否) | 第二层 |
组织学类型【胃癌】(溃疡) | 第二层 |
是否有胃部手术(是) | 第二层 |
是否肝转移【结直肠癌】(否) | 第二层 |
组织学类型【结直肠癌】(高分化) | 第二层 |
是否有阑尾炎手术(是) | 第二层 |
胃癌T分期 | 第三层 |
胃癌N分期 | 第三层 |
胃癌M分期 | 第三层 |
结直肠癌T分期 | 第三层 |
结直肠癌N分期 | 第三层 |
结直肠癌M分期 | 第三层 |
身体状况评价-ECGO评分 | 第三层 |
腹部B超-检查时间 | 第三层 |
请参阅图6,本实施例的目的还在于提供一种基于疾病指标的数据融合装置,包括获取模块61和指标集确定模块62。其中,获取模块61用于获取第一疾病指标集以及第二疾病指标集,所述疾病指标集包括指标名称和所述指标名称对应的所属层级;指标集确定模块62用于根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集。
请参阅图7,进一步地,指标集确定模块62包括第一层级判断单元631、第一相似度获取单元632以及第一指标集确定单元633。其中,第一层级判断单元631用于判断所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级是否为第一层级;第一相似度获取单元632用于选取所述第一疾病指标集中的一个指标名称为第一目标指标名称,并计算所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第一目标指标名称的第一相似度;第一指标集确定单元633用于根据所述第一相似度,确定所述目标疾病指标集。
进一步地,指标集确定模块62还包括第二层级判断单元641、数据层判断单元642、第二相似度获取单元643、第二指标集确定单元644、第三相似度获取单元645以及第三指标集确定单元646。其中,第二层级判断单元641用于判断所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级是否为第二层级;数据层判断单元642用于选取所述第一疾病指标集中的一个指标名称为第二目标指标名称,并判断所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称是否属于同一数据层;第二相似度获取单元643用于计算所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称的第二相似度;第二指标集确定单元644用于根据所述第二相似度,确定所述目标疾病指标集;第三相似度获取单元645用于计算所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称的第三相似度;第三指标集确定单元646用于根据所述第三相似度,确定所述目标疾病指标集。
进一步地,指标集确定模块62还包括第三层级判断单元651、指标标记单元652、第四指标集确定单元653。其中,第三层级判断单元651用于判断所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级是否为第三层级;指标标记单元652用于对所述第一疾病指标集和所述第二疾病指标集中指标名称分别进行标记,以获得标记后指标名称;第四指标集确定单元653用于将所述第一疾病指标集和所述第二疾病指标集中所属层级为第三层级的标记后指标名称进行合并,以获得所述目标疾病指标集
图8是本发明一实施例提供的终端设备的示意图。如图8所示,该实施例的终端设备7包括:处理器70、存储器71以及存储在存储器71中并可在处理器70上运行的计算机程序72。处理器70执行计算机程序72时实现上述各个基于疾病指标的数据融合方法实施例中的步骤,例如图1所示的步骤S10至步骤S20。
示例性的,计算机程序72可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器71中,并由处理器70执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序72在终端设备7中的执行过程。
终端设备7可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备7可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图8仅仅是终端设备7的示例,并不构成对终端设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备7还可以包括输入输出设备、网络接入设备、总线等。
处理器70可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器71可以是终端设备7的内部存储单元,例如终端设备7的硬盘或内存。存储器71也可以是终端设备7的外部存储设备,例如终端设备7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器71还可以既包括终端设备7的内部存储单元也包括外部存储设备。存储器71用于存储计算机程序以及终端设备7所需的其它程序和数据。存储器71还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (11)
1.一种基于疾病指标的数据融合方法,其特征在于,包括:
获取第一疾病指标集以及第二疾病指标集,所述第一疾病指标集以及所属第二疾病指标集均包括指标名称和所述指标名称对应的所属层级;
根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集。
2.根据权利要求1所述的基于疾病指标的数据融合方法,其特征在于,所述根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集,包括:
判断所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级是否为第一层级;
当所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级为第一层级时,选取所述第一疾病指标集中的一个指标名称为第一目标指标名称,并计算所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第一目标指标名称的第一相似度;
根据所述第一相似度,确定所述目标疾病指标集。
3.根据权利要求2所述的基于疾病指标的数据融合方法,其特征在于,所述根据所述第一相似度,确定所述目标疾病指标集,包括:
判断所述第一相似度是否大于等于第一相似度阈值;
当所述第一相似度大于等于所述第一相似度阈值时,去除所述其他指标名称;
当所述第一相似度小于所述第一相似度阈值时,保留所述其他指标名称;
将所述第一疾病指标集和所述第二疾病指标集中所属的层级为第一层级的指标名称进行合并,以获得所述目标疾病指标集。
4.根据权利要求1所述的基于疾病指标的数据融合方法,其特征在于,所述根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集,包括:
判断所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级是否为第二层级;
当所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级为第二层级时,选取所述第一疾病指标集中的一个指标名称为第二目标指标名称,并判断所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称是否属于同一数据层;
当所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称属于同一数据层时,计算所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称的第二相似度;
根据所述第二相似度,确定所述目标疾病指标集。
5.根据权利要求4所述的基于疾病指标的数据融合方法,其特征在于,所述根据所述第二相似度,确定所述目标疾病指标集,包括:
判断所述第二相似度是否大于等于第二相似度阈值;
当所述第二相似度大于等于所述第二相似度阈值时,去除所述其他指标名称;
当所述第一相似度小于所述第一相似度阈值时,保留所述其他指标名称;
并将所述第一疾病指标集和所述第二疾病指标集中所属的层级为第二层级的指标名称进行合并,以获得所述目标疾病指标集。
6.根据权利要求4所述的基于疾病指标的数据融合方法,其特征在于,当所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称不属于同一数据层时,计算所述第一疾病指标集和所述第二疾病指标集中其他指标名称与所述第二目标指标名称的第三相似度;
根据所述第三相似度,确定所述目标疾病指标集。
7.根据权利要求6所述的基于疾病指标的数据融合方法,其特征在于,所述根据所述第三相似度,确定所述目标疾病指标集,包括:
判断所述第三相似度是否大于等于第三相似度阈值;
当所述第三相似度大于等于所述第三相似度阈值时,对所述第二目标指标名称和所述其他指标名称分别进行标记,以获得标记后指标名称;
当所述第三相似度小于所述第三相似度阈值时,保留所述其他指标名称;
将所述第一疾病指标集和所述第二疾病指标集中所属层级为第二层级的标记后指标名称进行合并,以获得所述目标疾病指标集。
8.根据权利要求1所述的基于疾病指标的数据融合方法,其特征在于,所述根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集,包括:
判断所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级是否为第三层级;
当所述第一疾病指标集和所述第二疾病指标集中指标名称所属的层级为第三层级时,对所述第一疾病指标集和所述第二疾病指标集中指标名称分别进行标记,以获得标记后指标名称;
将所述第一疾病指标集和所述第二疾病指标集中所属层级为第三层级的标记后指标名称进行合并,以获得所述目标疾病指标集。
9.一种基于疾病指标的数据融合装置,其特征在于,包括:
获取模块,用于获取第一疾病指标集以及第二疾病指标集,所述疾病指标集包括指标名称和所述指标名称对应的所属层级;
指标集确定模块,用于根据所述第一疾病指标集以及第二疾病指标集中的指标名称及其对应的所属层级,确定目标疾病指标集。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至8中任一所述的基于疾病指标的数据融合方法。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任一所述的基于疾病指标的数据融合方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910809887.1A CN110704405B (zh) | 2019-08-29 | 2019-08-29 | 一种基于疾病指标的数据融合方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910809887.1A CN110704405B (zh) | 2019-08-29 | 2019-08-29 | 一种基于疾病指标的数据融合方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110704405A true CN110704405A (zh) | 2020-01-17 |
CN110704405B CN110704405B (zh) | 2020-11-10 |
Family
ID=69193836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910809887.1A Active CN110704405B (zh) | 2019-08-29 | 2019-08-29 | 一种基于疾病指标的数据融合方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110704405B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364134A (zh) * | 2020-11-23 | 2021-02-12 | 医渡云(北京)技术有限公司 | 业务指标推荐方法、装置、介质及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080168027A1 (en) * | 2004-02-20 | 2008-07-10 | Kruger Michael W | System and method for analyzing and correcting retail data |
CN106354787A (zh) * | 2016-08-24 | 2017-01-25 | 齐鲁工业大学 | 一种基于相似度的实体共指消解方法 |
CN107958008A (zh) * | 2016-10-18 | 2018-04-24 | 中国移动通信有限公司研究院 | 一种统一标签库的更新方法及装置 |
CN108280221A (zh) * | 2018-02-08 | 2018-07-13 | 北京百度网讯科技有限公司 | 关注点的层次化构建方法、装置和计算机设备 |
CN108572947A (zh) * | 2017-03-13 | 2018-09-25 | 腾讯科技(深圳)有限公司 | 一种数据融合方法及装置 |
CN109101541A (zh) * | 2018-07-02 | 2018-12-28 | 深圳市彬讯科技有限公司 | 新增指标管理方法、设备及计算机可读存储介质 |
CN109408578A (zh) * | 2018-10-30 | 2019-03-01 | 环境保护部华南环境科学研究所 | 一种针对异构环境监测数据融合方法 |
-
2019
- 2019-08-29 CN CN201910809887.1A patent/CN110704405B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080168027A1 (en) * | 2004-02-20 | 2008-07-10 | Kruger Michael W | System and method for analyzing and correcting retail data |
CN106354787A (zh) * | 2016-08-24 | 2017-01-25 | 齐鲁工业大学 | 一种基于相似度的实体共指消解方法 |
CN107958008A (zh) * | 2016-10-18 | 2018-04-24 | 中国移动通信有限公司研究院 | 一种统一标签库的更新方法及装置 |
CN108572947A (zh) * | 2017-03-13 | 2018-09-25 | 腾讯科技(深圳)有限公司 | 一种数据融合方法及装置 |
CN108280221A (zh) * | 2018-02-08 | 2018-07-13 | 北京百度网讯科技有限公司 | 关注点的层次化构建方法、装置和计算机设备 |
CN109101541A (zh) * | 2018-07-02 | 2018-12-28 | 深圳市彬讯科技有限公司 | 新增指标管理方法、设备及计算机可读存储介质 |
CN109408578A (zh) * | 2018-10-30 | 2019-03-01 | 环境保护部华南环境科学研究所 | 一种针对异构环境监测数据融合方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364134A (zh) * | 2020-11-23 | 2021-02-12 | 医渡云(北京)技术有限公司 | 业务指标推荐方法、装置、介质及电子设备 |
CN112364134B (zh) * | 2020-11-23 | 2024-05-31 | 医渡云(北京)技术有限公司 | 业务指标推荐方法、装置、介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110704405B (zh) | 2020-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200357118A1 (en) | Medical scan viewing system with enhanced training and methods for use therewith | |
Shung et al. | Machine learning to predict outcomes in patients with acute gastrointestinal bleeding: a systematic review | |
Yoo et al. | AI-based improvement in lung cancer detection on chest radiographs: results of a multi-reader study in NLST dataset | |
Witowski et al. | Improving breast cancer diagnostics with deep learning for MRI | |
CN107239722B (zh) | 用于从医疗文档中提取诊断对象的方法和装置 | |
Zheng et al. | Diagnostic accuracy of deep learning and radiomics in lung cancer staging: a systematic review and meta-analysis | |
Zhang et al. | Artificial intelligence-aided colonoscopy for polyp detection: a systematic review and meta-analysis of randomized clinical trials | |
Maldonado et al. | Validation of the BRODERS classifier (Benign versus aggRessive nODule Evaluation using Radiomic Stratification), a novel HRCT-based radiomic classifier for indeterminate pulmonary nodules | |
US20230011031A1 (en) | Automatically determining a medical recommendation for a patient based on multiple medical images from multiple different medical imaging modalities | |
Thomassin-Naggara et al. | Artificial intelligence and breast screening: French Radiology Community position paper | |
Hooper et al. | Relevance of the autopsy as a medical tool: a large database of physician attitudes | |
Dash et al. | Cervical transformation zone segmentation and classification based on improved inception-resnet-v2 using colposcopy images | |
Clark et al. | Diffusion of digital breast tomosynthesis among women in primary care: associations with insurance type | |
Yi et al. | The added value of an artificial intelligence system in assisting radiologists on indeterminate BI-RADS 0 mammograms | |
CN110704405B (zh) | 一种基于疾病指标的数据融合方法及装置 | |
Chang et al. | Artificial intelligence for breast cancer screening in mammography (AI-STREAM): a prospective multicenter study design in Korea using AI-based CADe/x | |
Ganguli et al. | Downstream mammary and extramammary cascade services and spending following screening breast magnetic resonance imaging vs mammography among commercially insured women | |
CN109545319B (zh) | 基于知识关系分析的处方告警方法及终端设备 | |
CN113822872A (zh) | 一种用于肝癌影像组学图像特征信息提取方法 | |
Jeong et al. | The EMory BrEast imaging Dataset (EMBED): a racially diverse, granular dataset of 3.5 M screening and diagnostic mammograms | |
CN109522331B (zh) | 以个人为中心的区域化多维度健康数据处理方法及介质 | |
CN109509550B (zh) | 基于数据分析的就诊信息处理方法、装置、设备及介质 | |
Giannou et al. | Automated distinction of neoplastic from healthy liver parenchyma based on machine learning | |
CN114529718B (zh) | 一种结外鼻型nk/t细胞淋巴瘤诊断与预后模型的构建方法 | |
US10910108B2 (en) | Indicator for probable inheritance of genetic disease |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |