CN112908441B - 一种医疗平台的数据处理方法、装置以及处理设备 - Google Patents

一种医疗平台的数据处理方法、装置以及处理设备 Download PDF

Info

Publication number
CN112908441B
CN112908441B CN202110241875.0A CN202110241875A CN112908441B CN 112908441 B CN112908441 B CN 112908441B CN 202110241875 A CN202110241875 A CN 202110241875A CN 112908441 B CN112908441 B CN 112908441B
Authority
CN
China
Prior art keywords
data
medical
ontology
medical data
platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110241875.0A
Other languages
English (en)
Other versions
CN112908441A (zh
Inventor
李颖智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenhua College
Original Assignee
Wenhua College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenhua College filed Critical Wenhua College
Priority to CN202110241875.0A priority Critical patent/CN112908441B/zh
Publication of CN112908441A publication Critical patent/CN112908441A/zh
Application granted granted Critical
Publication of CN112908441B publication Critical patent/CN112908441B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请提供了一种医疗平台的数据处理方法、装置以及处理设备,为医疗平台,通过局部本体以及全局本体的构建,配置一数据融合适配器,如此对于不同数据源、存在语义异构关系的医疗数据的数据处理,消除语义异构性,实现深层的数据融合。方法包括:获取医疗平台上的不同医疗数据,不同医疗数据之间存在语义异构关系;对不同医疗数据进行抽象提取,并构建得到每个数据源对应的医疗数据局部本体模型;整合多个医疗数据局部本体模型,构建医疗数据全局本体模型;根据本体概念之间的语义相似度计算结果,优化医疗数据全局本体模型;将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器,数据融合适配器用于对医疗平台上的医疗数据进行数据处理。

Description

一种医疗平台的数据处理方法、装置以及处理设备
技术领域
本申请涉及信息领域,具体涉及一种医疗平台的数据处理方法、装置以及处理设备。
背景技术
随着数字办公化的普及,各个工作领域中的信息,以其线上系统的方式,提供更为简洁、高效的数据存储、数据管理、信息数据等信息处理,如此进一步提高工作效率。
以医疗平台为例,医疗平台可接入各种的医疗设备,医疗设备可将采集、处理得到的医疗数据上传至医疗平台,又或者还可从下载医疗平台存储的医疗数据。
而在现有的相关技术的研究过程中,发明人发现,医疗平台涉及的医疗数据之间,经常存在着异构关系,或者说,各医疗数据经常由于数据源的关系,在数据结构上存在着不同,而要应用这些异构数据,则需要进行数据融合,以便利用这些异构数据,而由于医疗数据存在着结构复杂、数据类型多、数据量大、缺少参照完整性约束、字典表混杂等复杂的异构情况,数据之间缺乏基本的组织和联系,而仅进行简单的数据格式转换,只能满足基础的数据交换功能,而未能妥善地解决更为深层的语义异构问题。
发明内容
本申请提供了一种医疗平台的数据处理方法、装置以及处理设备,为医疗平台,通过局部本体以及全局本体的构建,配置一数据融合适配器,如此对于不同数据源、存在语义异构关系的医疗数据的数据处理,可消除其语义异构性,实现深层的数据融合。
第一方面,本申请提供了一种医疗平台的数据处理方法,方法包括:
获取医疗平台上的不同医疗数据,不同医疗数据之间存在语义异构关系;
对不同医疗数据进行抽象提取,并构建得到每个数据源对应的医疗数据局部本体模型,医疗数据局部本体模型用于描述医疗平台的医疗数据的局部本体特征;
整合多个医疗数据局部本体模型,构建医疗数据全局本体模型,医疗数据全局本体模型用于表述医疗平台的医疗数据的全局本体特征;
根据本体概念之间的语义相似度计算结果,优化医疗数据全局本体模型;
将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器,数据融合适配器用于对医疗平台上的医疗数据进行数据处理。
结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,对不同医疗数据进行抽象提取,并构建得到每个数据源对应的医疗数据局部本体模型,包括:
对不同医疗数据进行逆向工程,得到对应的数据模型,数据模型用于描述每个数据源所包含的实体、关系、属性、建以及键约束;
对数据模型包含的关系模式进行拆解,得到多个数据表,多个数据表满足第二范式属性;
在多个数据表中,将存在一一对应的逻辑关系的两个数据表进行合并;
根据映射规则对应关系,将合并处理后的多个数据表转换为本体中的概念以及关联;
基于本体中的概念以及关联,构建医疗数据局部本体模型,医疗数据局部本体模型是通过OWL语言进行描述的。
结合本申请第一方面,在本申请第一方面第二种可能的实现方式中,整合多个医疗数据局部本体模型,构建医疗数据全局本体模型,包括:
从同义异名、同名异义、异名异义、外延异构、关联异构方面,统一多个医疗数据局部本体模型之间的类以及关联;
建立类以及关联两者,与多个医疗数据局部本体模型之间的映射关系;
融合多个医疗数据局部本体模型,得到医疗数据全局本体模型。
结合本申请第一方面,在本申请第一方面第三种可能的实现方式中,根据本体概念之间的语义相似度计算结果,优化医疗数据全局本体模型,包括:
根据本体概念之间的层次深度计算结果,优化医疗数据全局本体模型的层次;
根据本体概念之间的通过语义重合度计算结果,优化医疗数据全局本体模型的重合度;
根据本体概念之间的通过语义偏移度计算结果,优化医疗数据全局本体模型的偏移度。
结合本申请第一方面,在本申请第一方面第四种可能的实现方式中,数据融合适配器是通过服务的形式配置的,数据融合适配器的数量为至少一个,数据融合适配器由适配器管理器进行统一管理。
结合本申请第一方面,在本申请第一方面第五种可能的实现方式中,获取医疗平台上的不同医疗数据,包括:
根据针对医疗平台的数据融合任务,触发获取医疗平台上的不同医疗数据;
将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器之后,方法还包括:
根据数据融合适配器,对医疗平台上的医疗数据进行数据融合处理。
结合本申请第一方面,在本申请第一方面第六种可能的实现方式中,将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器之后,方法还包括:
检测医疗平台是否存在更新的医疗数据;
若是,则通过数据融合适配器对更新的医疗数据进行数据融合处理。
第二方面,本申请提供了一种医疗平台的数据处理装置,装置包括:
获取单元,用于获取医疗平台上的不同医疗数据,不同医疗数据之间存在语义异构关系;
构建单元,用于对不同医疗数据进行抽象提取,并构建得到每个数据源对应的医疗数据局部本体模型,医疗数据局部本体模型用于描述医疗平台的医疗数据的局部本体特征;
构建单元,还用于整合多个医疗数据局部本体模型,构建医疗数据全局本体模型,医疗数据全局本体模型用于表述医疗平台的医疗数据的全局本体特征;
优化单元,用于根据本体概念之间的语义相似度计算结果,优化医疗数据全局本体模型;
封装单元,用于将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器,数据融合适配器用于对医疗平台上的医疗数据进行数据处理。
结合本申请第二方面,在本申请第二方面第一种可能的实现方式中,构建单元,具体用于:
对不同医疗数据进行逆向工程,得到对应的数据模型,数据模型用于描述每个数据源所包含的实体、关系、属性、建以及键约束;
对数据模型包含的关系模式进行拆解,得到多个数据表,多个数据表满足第二范式属性;
在多个数据表中,将存在一一对应的逻辑关系的两个数据表进行合并;
根据映射规则对应关系,将合并处理后的多个数据表转换为本体中的概念以及关联;
基于本体中的概念以及关联,构建医疗数据局部本体模型,医疗数据局部本体模型是通过OWL语言进行描述的。
结合本申请第二方面,在本申请第二方面第二种可能的实现方式中,构建单元,具体用于:
从同义异名、同名异义、异名异义、外延异构、关联异构方面,统一多个医疗数据局部本体模型之间的类以及关联;
建立类以及关联两者,与多个医疗数据局部本体模型之间的映射关系;
融合多个医疗数据局部本体模型,得到医疗数据全局本体模型。
结合本申请第二方面,在本申请第二方面第三种可能的实现方式中,优化单元,具体用于:
根据本体概念之间的层次深度计算结果,优化医疗数据全局本体模型的层次;
根据本体概念之间的通过语义重合度计算结果,优化医疗数据全局本体模型的重合度;
根据本体概念之间的通过语义偏移度计算结果,优化医疗数据全局本体模型的偏移度。
结合本申请第二方面,在本申请第二方面第四种可能的实现方式中,数据融合适配器是通过服务的形式配置的,数据融合适配器的数量为至少一个,数据融合适配器由适配器管理器进行统一管理。
结合本申请第二方面,在本申请第二方面第五种可能的实现方式中,获取单元,具体用于:
根据针对医疗平台的数据融合任务,触发获取医疗平台上的不同医疗数据;
装置还包括处理单元,用于:
根据数据融合适配器,对医疗平台上的医疗数据进行数据融合处理。
结合本申请第二方面,在本申请第二方面第六种可能的实现方式中,装置还包括处理单元,用于:
检测医疗平台是否存在更新的医疗数据;
若是,则通过数据融合适配器对更新的医疗数据进行数据融合处理。
第三方面,本申请提供了一种处理设备,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
从以上内容可得出,本申请具有以下的有益效果:
针对于医疗平台的数据融合场景,本申请提供一种数据融合机制,先获取到医疗平台上的不同医疗数据,这些医疗数据之间存在语义异构关系,接着对这些医疗数据进行抽象提取,构建得到每个数据源对应的医疗数据局部本体模型,再整合这些医疗数据局部本体模型,构建得到医疗数据全局本体模型,并根据本体概念之间的语义相似度计算结果,优化医疗数据全局本体模型,而后将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器,医疗平台则可根据该数据融合适配器对平台上的医疗数据进行数据处理,在这过程中,由于数据融合适配器是通过局部本体以及全局本体的构建得到的,因此,对于不同数据源、存在语义异构关系的医疗数据的数据处理,可消除其语义异构性,实现深层的数据融合,保障了医疗平台在医疗数据上的兼容性以及通用性,进而可保障医疗平台的工作效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请医疗平台的数据处理方法的一种流程示意图;
图2为本申请构建医疗数据局部本体模型的一种场景示意图;
图3为本申请数据融合适配器的一种场景示意图;
图4为本申请医疗平台的数据处理装置的一种结构示意图;
图5为本申请处理设备的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号,并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤,已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序,只要能达到相同或者相类似的技术效果即可。
本申请中所出现的模块的划分,是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。
在介绍本申请提供的医疗平台的数据处理方法之前,首先介绍本申请所涉及的背景内容。
本申请提供的医疗平台的数据处理方法、装置以及计算机可读存储介质,可应用于处理设备上,为医疗平台,通过局部本体以及全局本体的构建,配置一数据融合适配器,如此对于不同数据源、存在语义异构关系的医疗数据的数据处理,可消除其语义异构性,实现深层的数据融合。
本申请提及的医疗平台的数据处理方法,其执行主体可以为医疗平台的数据处理装置,或者集成了该医疗平台的数据处理装置的服务器、物理主机或者用户设备(UserEquipment,UE)等处理设备。其中,医疗平台的数据处理装置可以采用硬件或者软件的方式实现,UE具体可以为智能手机、平板电脑、笔记本电脑、台式电脑或者个人数字助理(Personal Digital Assistant,PDA)等终端设备,处理设备可以通过设备集群的方式设置。
下面,开始介绍本申请提供的医疗平台的数据处理方法。
首先,参阅图1,图1示出了本申请医疗平台的数据处理方法的一种流程示意图,本申请提供的医疗平台的数据处理方法,具体可包括如下步骤:
步骤S101,获取医疗平台上的不同医疗数据,不同医疗数据之间存在语义异构关系;
步骤S102,对不同医疗数据进行抽象提取,并构建得到每个数据源对应的医疗数据局部本体模型,医疗数据局部本体模型用于描述医疗平台的医疗数据的局部本体特征;
步骤S103,整合多个医疗数据局部本体模型,构建医疗数据全局本体模型,医疗数据全局本体模型用于表述医疗平台的医疗数据的全局本体特征;
步骤S104,根据本体概念之间的语义相似度计算结果,优化医疗数据全局本体模型;
步骤S105,将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器,数据融合适配器用于对医疗平台上的医疗数据进行数据处理。
从图1所示实施例可看出,针对于医疗平台的数据融合场景,本申请提供一种数据融合机制,先获取到医疗平台上的不同医疗数据,这些医疗数据之间存在语义异构关系,接着对这些医疗数据进行抽象提取,构建得到每个数据源对应的医疗数据局部本体模型,再整合这些医疗数据局部本体模型,构建得到医疗数据全局本体模型,并根据本体概念之间的语义相似度计算结果,优化医疗数据全局本体模型,而后将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器,医疗平台则可根据该数据融合适配器对平台上的医疗数据进行数据处理,在这过程中,由于数据融合适配器是通过局部本体以及全局本体的构建得到的,因此,对于不同数据源、存在语义异构关系的医疗数据的数据处理,可消除其语义异构性,实现深层的数据融合,保障了医疗平台在医疗数据上的兼容性以及通用性,进而可保障医疗平台的工作效率。
下面则对上述图1所示实施例的各个步骤及其在实际应用中可能的实现方式进行详细阐述。
在本申请中,医疗平台,可以理解为医疗工作所搭建的线上办公平台,医疗工作具体可以为研究、数据管理临床、等医疗方面的工作,具体可随具体的应用场景而调整。
而由于医疗领域中涉及的医疗数据,受限于医疗数据采集设备、医疗数据输出设备、医疗信息刊登平台、存储方式、传输方式等不同数据源的关系,导致在对众多医疗数据进行数据处理时,时常出现语义异构问题,即使进行了数据格式的转换,在更为深层的方面,仍存在异构问题,这影响了医疗数据的使用价值。
在本申请中,针对于存在语义异构关系的医疗数据,则为平台提出了一种数据融合适配器的配置方案,通过该数据融合适配器,来解决对存在语义异构关系的医疗数据进行数据处理时,可妥善地克服语义异构问题,实现更为深层的数据融合效果。
存在语义异构关系的医疗数据,可以理解为在未应用本申请提供的医疗平台的数据处理方法的医疗平台中的医疗数据,也可以理解为已由工作人员配置了标识了语义异构关系的医疗数据,甚至,还可以理解为已由机器识别出的存在语义异构关系的医疗数据(例如在数据融合过程中发现存在语义异构问题的医疗数据),具体可随实际需要调整。
这些存在语义异构关系的医疗数据,具体可从医疗平台获取,而在这过程中,其获取方式,可随处理设备与医疗平台之间的实际关系进行调整。例如,当处理设备处于医疗平台中时,则可从平台内部进行获取;或者,当处理设备处于医疗平台外部时,则可通过平台开放的数据接口进行获取;又或者,处理设备还可从医疗平台外部的存储有医疗平台中的医疗数据的其他设备处,进行获取。
本申请所提出的数据融合适配器,其主要包括局部本体以及全局本体的构建处理。
对应于平台中的医疗数据背后的不同数据源,则可对医疗数据进行抽象提取,识别医疗数据深层的局部本体特征,并基于这些不同数据源的局部本体特征,构建其背后数据源所对应的医疗数据局部本体模型。
局部本体特征,可以理解为,针对于具体的数据源,从语义层次上描述其知识的规范说明,其具有共享、概念化、明确性、形式化的一系列特点,将具体数据源(例如医疗异构数据库)涉及的医疗数据,从客观世界中抽象出具体的本体概念,规范说明了本体概念本身的含义以及不同本体概念之间的关联关系(例如实例、公理)。
作为适于实用的一种具体实现方式,本申请综合了“骨架法”、七步法、循环法等本体构建方法,结合医疗领域特点,精简本体构建步骤,提出了五步法来提取每个数据源的数据存储结构构建医疗局部本体模型,实现更为精确的构建效果,结合图2示出的本申请构建医疗数据局部本体模型的一种场景示意图,本申请医疗数据局部本体模型的构建处理,可包括:
关系模型提取:对不同医疗数据进行逆向工程,得到对应的数据模型,数据模型用于描述每个数据源所包含的实体、关系、属性、建以及键约束;
关系模式拆解:对数据模型包含的关系模式进行拆解,得到多个数据表,多个数据表满足第二范式属性,通过第二范式去除表中含有的冗余数据,且满足表中所有非主键都完全函数依赖于主键的特性,实现字段信息的主题都是在同一范围内的目的;
关系模式合并:在多个数据表中,如果数据库中某个本体概念的信息存储到多张表中,表之间存在逻辑上的一对一关系,将存在一一对应的逻辑关系的两个数据表进行合并;
元素映射:根据映射规则对应关系,将合并处理后的多个数据表转换为本体中的概念以及关联;
构建局部本体模型:基于本体中的概念以及关联,构建医疗数据局部本体模型,医疗数据局部本体模型是通过网络本体语言(Ontology Wed Language,OWL)进行统一描述的。
而全局本体特征,与局部本体特征类似的,可以理解为从不同数据源的角度出发,从语义层次上描述其知识的规范说明,如此,在前期针对不同数据源分别构建对应的医疗数据局部本体模型后,则可对这些医疗数据局部本体模型进行整合,再次进行本体概念的提取,构建得到从整体层面上反应这些数据源的医疗数据全局本体模型。
可以理解的是,全局本体是作为数据源和数据应用之间沟通的桥梁,是局部数据源的全局视图,对于局部数据源的集成,可通过作为数据源视图的局部本体和全局本体之间的映射关系,达到从局部到全局的一致和统一性。
作为又一种适于实用的具体实现方式,医疗数据全局本体模型的构建处理,可包括:
从同义异名、同名异义、异名异义、外延异构、关联异构方面,统一多个医疗数据局部本体模型之间的类以及关联;
建立类以及关联两者,与多个医疗数据局部本体模型之间的映射关系;
融合多个医疗数据局部本体模型,得到医疗数据全局本体模型。
而当构建了医疗数据全局本体模型后,对于模型中从语义层次描述的本体概念,或者说描述的本体概念本身的含义以及不同本体概念之间的关联关系,则可从相似度角度,继续进行等同、相同本体概念的识别,以此结合相似度计算结果,融合等同、相同的本体概念,对医疗数据全局本体模型进行精简化处理,使得医疗数据全局本体模型的精确度进一步的提高。
作为又一种适于实用的具体实现方式,医疗数据全局本体模型的优化处理,可包括:
根据本体概念之间的层次深度计算结果,优化医疗数据全局本体模型的层次,在本体层次树中,两个本体概念所处结点的层次越靠近底层,本体概念的分类就越细致,抽象程度就越小,具体化程度就越大,故在两本体概念所处的层次深度越大的本体概念间的差异性越小,语义相似度越大;
根据本体概念之间的通过语义重合度计算结果,优化医疗数据全局本体模型的重合度,在本体层次树中,两个本体概念所处结点间包含的相同祖先结点的个数在总体结点个数中所占的比例越大,本体概念间的语义重合度就越大,本体概念间的相同程度就越大;
根据本体概念之间的通过语义偏移度计算结果,优化医疗数据全局本体模型的偏移度,在本体层次树中,两个本体概念所处结点的层次深度之差在两个本体概念所处结点间的最短路径长度中所占比例。语义偏移度表示本体概念间层次差异程度,通过概念在本体内的结点本体深度比重、语义距离和同祖结点比重等来衡量相似度,这使得该语义偏移度计算算法在规模较大的本体中效果较好,故应用在规模庞大、分类细致、复杂度高的医学本体的相似度计算中较为精准。
此时,则可将医疗数据全局本体封装置医疗平台的数据融合适配器中,例如把消息解析成数据,然后根据数据交换路由表中的输出配置把数据输出到目标,凭借该数据融合适配器,医疗平台在对平台中的医疗数据进行数据处理时,则可对存在数据异构关系的医疗数据,可消除其语义异构性,实现深层的数据融合。
作为又一种适于实用的具体实现方式,参阅图3示出的本申请数据融合适配器的一种场景示意图,在本申请中,数据融合适配器具体是通过服务的形式配置的,数据融合适配器的数量为至少一个,数据融合适配器由适配器管理器进行统一管理。
或者说,适配器注册都是通过服务的方式来实现,应用系统使用者通过适配器管理器创建、运行和管理相应的服务,因此适配器提可以适应不同的业务系统,通过动态配置和服务注册调用适配器管理器中的服务,一个适配器管理器可以同时运行多个适配器,并对所有部署好的适配器进行统一管理和高度。
为简化适配器的部署工作,可采取以数据流向为主线,组件化体系结构的设计思路部署适配器,具体可将适配器的业务逻辑细粒度化为更小逻辑的单元-适配器组件,由组件完全相应的数据处理流程。
可以理解的是,本申请在实际应用中,具体是由数据融合任务触发的数据融合适配度的配置处理,即,如此,之前获取医疗平台上的不同医疗数据,具体可以为:
根据针对医疗平台的数据融合任务,触发获取医疗平台上的不同医疗数据;
而将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器之后,还可根据该数据融合适配器,对医疗平台上的医疗数据进行数据融合处理,完成对医疗平台上的医疗数据的数据融合。
可以看出,该场景,对应的是将医疗平台的现有医疗数据进行统一化的数据融合处理,适用于对医疗平台整体范围或者局部范围内应用本申请,以解决医疗平台的现有医疗数据存在的语义异构情况。
又或者,相对于上述通过医疗平台的现有医疗数据进行数据融合,以改善历史医疗数据容易遗留下来的语义异构问题,在实际应用中,还可针对新的医疗数据,通过本申请,以改善医疗平台在未来的应用过程中可避免存在语义异构问题。
如此,可检测医疗平台是否存在更新的医疗数据,若是,则通过数据融合适配器对更新的医疗数据进行数据融合处理。
当然,在实际应用中,两者的应用场景、应用时机,也是可以共存的,即,对医疗平台的现有医疗数据、历史医疗数据进行统一化的数据融合处理,并继续对更新的、新的医疗数据,继续保持数据融合处理,以此进行全方位的数据融合,保证医疗工作的进行。
以上是本申请提供医疗平台的数据处理方法的介绍,为便于更好的实施本申请提供的医疗平台的数据处理方法,本申请还提供了医疗平台的数据处理装置。
参阅图4,图4为本申请医疗平台的数据处理装置的一种结构示意图,在本申请中,医疗平台的数据处理装置400具体可包括如下结构:
获取单元401,用于获取医疗平台上的不同医疗数据,不同医疗数据之间存在语义异构关系;
构建单元402,用于对不同医疗数据进行抽象提取,并构建得到每个数据源对应的医疗数据局部本体模型,医疗数据局部本体模型用于描述医疗平台的医疗数据的局部本体特征;
构建单元402,还用于整合多个医疗数据局部本体模型,构建医疗数据全局本体模型,医疗数据全局本体模型用于表述医疗平台的医疗数据的全局本体特征;
优化单元403,用于根据本体概念之间的语义相似度计算结果,优化医疗数据全局本体模型;
封装单元404,用于将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器,数据融合适配器用于对医疗平台上的医疗数据进行数据处理。
在一种示例性的实现方式中,构建单元402,具体用于:
对不同医疗数据进行逆向工程,得到对应的数据模型,数据模型用于描述每个数据源所包含的实体、关系、属性、建以及键约束;
对数据模型包含的关系模式进行拆解,得到多个数据表,多个数据表满足第二范式属性;
在多个数据表中,将存在一一对应的逻辑关系的两个数据表进行合并;
根据映射规则对应关系,将合并处理后的多个数据表转换为本体中的概念以及关联;
基于本体中的概念以及关联,构建医疗数据局部本体模型,医疗数据局部本体模型是通过OWL语言进行描述的。
在又一种示例性的实现方式中,构建单元402,具体用于:
从同义异名、同名异义、异名异义、外延异构、关联异构方面,统一多个医疗数据局部本体模型之间的类以及关联;
建立类以及关联两者,与多个医疗数据局部本体模型之间的映射关系;
融合多个医疗数据局部本体模型,得到医疗数据全局本体模型。
在又一种示例性的实现方式中,优化单元403,具体用于:
根据本体概念之间的层次深度计算结果,优化医疗数据全局本体模型的层次;
根据本体概念之间的通过语义重合度计算结果,优化医疗数据全局本体模型的重合度;
根据本体概念之间的通过语义偏移度计算结果,优化医疗数据全局本体模型的偏移度。
在又一种示例性的实现方式中,数据融合适配器是通过服务的形式配置的,数据融合适配器的数量为至少一个,数据融合适配器由适配器管理器进行统一管理。
在又一种示例性的实现方式中,获取单元401,具体用于:
根据针对医疗平台的数据融合任务,触发获取医疗平台上的不同医疗数据;
装置还包括处理单元405,用于:
根据数据融合适配器,对医疗平台上的医疗数据进行数据融合处理。
在又一种示例性的实现方式中,装置还包括处理单元405,用于:
检测医疗平台是否存在更新的医疗数据;
若是,则通过数据融合适配器对更新的医疗数据进行数据融合处理。
本申请还提供了处理设备,参阅图5,图5示出了本申请处理设备的一种结构示意图,具体的,本申请处理设备可包括处理器501、存储器502以及输入输出设备503,处理器501用于执行存储器502中存储的计算机程序时实现如图1对应实施例中医疗平台的数据处理方法的各步骤;或者,处理器501用于执行存储器502中存储的计算机程序时实现如图4对应实施例中各单元的功能,存储器502用于存储处理器501执行上述图1对应实施例中医疗平台的数据处理方法所需的计算机程序。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器502中,并由处理器501执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
处理设备可包括,但不仅限于处理器501、存储器502、输入输出设备503。本领域技术人员可以理解,示意仅仅是处理设备的示例,并不构成对处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如处理设备还可以包括网络接入设备、总线等,处理器501、存储器502、输入输出设备503以及网络接入设备等通过总线相连。
处理器501可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是处理设备的控制中心,利用各种接口和线路连接整个设备的各个部分。
存储器502可用于存储计算机程序和/或模块,处理器501通过运行或执行存储在存储器502内的计算机程序和/或模块,以及调用存储在存储器502内的数据,实现计算机装置的各种功能。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据处理设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器501用于执行存储器502中存储的计算机程序时,具体可实现以下功能:
获取医疗平台上的不同医疗数据,不同医疗数据之间存在语义异构关系;
对不同医疗数据进行抽象提取,并构建得到每个数据源对应的医疗数据局部本体模型,医疗数据局部本体模型用于描述医疗平台的医疗数据的局部本体特征;
整合多个医疗数据局部本体模型,构建医疗数据全局本体模型,医疗数据全局本体模型用于表述医疗平台的医疗数据的全局本体特征;
根据本体概念之间的语义相似度计算结果,优化医疗数据全局本体模型;
将医疗数据全局本体模型封装进医疗平台配置的数据融合适配器,数据融合适配器用于对医疗平台上的医疗数据进行数据处理。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的医疗平台的数据处理装置、处理设备及其相应单元的具体工作过程,可以参考如图1对应实施例中医疗平台的数据处理方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请如图1对应实施例中医疗平台的数据处理方法中的步骤,具体操作可参考如图1对应实施例中医疗平台的数据处理方法的说明,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(Read Only Memory,ROM)、随机存取记忆体(Random Access Memory,RAM)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请如图1对应实施例中医疗平台的数据处理方法中的步骤,因此,可以实现本申请如图1对应实施例中医疗平台的数据处理方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请提供的医疗平台的数据处理方法、装置、处理设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (3)

1.一种医疗平台的数据处理方法,其特征在于,所述方法包括:
获取医疗平台上的不同医疗数据,所述不同医疗数据之间存在语义异构关系;
对所述不同医疗数据进行抽象提取,并构建得到每个数据源对应的医疗数据局部本体模型,所述医疗数据局部本体模型用于描述所述医疗平台的医疗数据的局部本体特征;
整合多个所述医疗数据局部本体模型,构建医疗数据全局本体模型,所述医疗数据全局本体模型用于表述所述医疗平台的医疗数据的全局本体特征;
根据本体概念之间的语义相似度计算结果,优化所述医疗数据全局本体模型;
将所述医疗数据全局本体模型封装进所述医疗平台配置的数据融合适配器,所述数据融合适配器用于对所述医疗平台上的医疗数据进行数据处理;
所述数据融合适配器是通过服务的形式配置的,所述数据融合适配器的数量为至少一个,不同的所述数据融合适配器适应不同的业务系统,所述数据融合适配器由适配器管理器通过接口监控服务组件、本体构建服务组件、数据提取服务组件、任务管理服务组件、消息管理服务组件和映射规则服务组件进行统一管理;
所述对所述不同医疗数据进行抽象提取,并构建得到每个数据源对应的医疗数据局部本体模型,包括:
对所述不同医疗数据进行逆向工程,得到对应的数据模型,所述数据模型用于描述每个数据源所包含的实体、关系、属性、建以及键约束;
对所述数据模型包含的关系模式进行拆解,得到多个数据表,所述多个数据表满足第二范式属性;
在所述多个数据表中,将存在一一对应的逻辑关系的两个数据表进行合并;
根据映射规则对应关系,将合并处理后的所述多个数据表转换为本体中的概念以及关联;
基于所述本体中的概念以及关联,构建所述医疗数据局部本体模型,所述医疗数据局部本体模型是通过OWL语言进行描述的;
所述整合多个所述医疗数据局部本体模型,构建医疗数据全局本体模型,包括:
从同义异名、同名异义、异名异义、外延异构、关联异构方面,统一多个所述医疗数据局部本体模型之间的类以及关联;
建立所述类以及关联两者,与多个所述医疗数据局部本体模型之间的映射关系;
融合多个所述医疗数据局部本体模型,得到所述医疗数据全局本体模型;
所述根据本体概念之间的语义相似度计算结果,优化所述医疗数据全局本体模型,包括:
根据所述本体概念之间的层次深度计算结果,优化所述医疗数据全局本体模型的层次;
根据所述本体概念之间的通过语义重合度计算结果,优化所述医疗数据全局本体模型的重合度;
根据所述本体概念之间的通过语义偏移度计算结果,优化所述医疗数据全局本体模型的偏移度;
所述获取医疗平台上的不同医疗数据,包括:
根据针对所述医疗平台的数据融合任务,触发获取所述医疗平台上的所述不同医疗数据;
所述将所述医疗数据全局本体模型封装进所述医疗平台配置的数据融合适配器之后,所述方法还包括:
根据所述数据融合适配器,对所述医疗平台上的医疗数据进行数据融合处理;
所述将所述医疗数据全局本体模型封装进所述医疗平台配置的数据融合适配器之后,所述方法还包括:
检测所述医疗平台是否存在更新的医疗数据;
若是,则通过所述数据融合适配器对所述更新的医疗数据进行所述数据融合处理。
2.一种处理设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1所述的方法。
3.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1所述的方法。
CN202110241875.0A 2021-03-04 2021-03-04 一种医疗平台的数据处理方法、装置以及处理设备 Active CN112908441B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110241875.0A CN112908441B (zh) 2021-03-04 2021-03-04 一种医疗平台的数据处理方法、装置以及处理设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110241875.0A CN112908441B (zh) 2021-03-04 2021-03-04 一种医疗平台的数据处理方法、装置以及处理设备

Publications (2)

Publication Number Publication Date
CN112908441A CN112908441A (zh) 2021-06-04
CN112908441B true CN112908441B (zh) 2024-06-21

Family

ID=76107671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110241875.0A Active CN112908441B (zh) 2021-03-04 2021-03-04 一种医疗平台的数据处理方法、装置以及处理设备

Country Status (1)

Country Link
CN (1) CN112908441B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052673A (zh) * 2017-12-29 2018-05-18 中国电子科技集团公司信息科学研究院 一种物联网数据集成与融合中间件系统

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030172368A1 (en) * 2001-12-26 2003-09-11 Elizabeth Alumbaugh System and method for autonomously generating heterogeneous data source interoperability bridges based on semantic modeling derived from self adapting ontology
US8347145B2 (en) * 2004-05-04 2013-01-01 Northrop Grumman Systems Corporation System and method for providing a mission based management system
CN102385635A (zh) * 2011-12-14 2012-03-21 湖南科技大学 一种基于本体模式的异构数据集成方法
CN102542027B (zh) * 2011-12-22 2014-09-17 北京航空航天大学深圳研究院 一种基于关系模式学习本体的数据集成系统的构建方法
CN104182454B (zh) * 2014-07-04 2018-03-27 重庆科技学院 基于领域本体构建的多源异构数据语义集成的模型及方法
CN105117386A (zh) * 2015-09-19 2015-12-02 杭州电子科技大学 一种基于图书内容结构的语义关联方法
CN106559717A (zh) * 2015-09-25 2017-04-05 中兴通讯股份有限公司 Jslee容器系统,处理方法及网络融合的系统
CN105187559B (zh) * 2015-09-30 2019-06-11 成都智信电子技术有限公司 一种数据融合治理系统
US11074652B2 (en) * 2015-10-28 2021-07-27 Qomplx, Inc. System and method for model-based prediction using a distributed computational graph workflow
CN106649551A (zh) * 2016-11-07 2017-05-10 大连工业大学 基于cbr有限元模板的检索方法
CN107978341A (zh) * 2017-12-22 2018-05-01 南京昂特医信数据技术有限公司 一种基于语境的医学语义框架下的异构数据适配方法及其系统
CN109063114B (zh) * 2018-07-27 2020-11-24 华南理工大学广州学院 能源云平台的异构数据集成方法、装置、终端及存储介质
CN110659293B (zh) * 2019-09-24 2022-02-11 支付宝(杭州)信息技术有限公司 基于变更代码的数据表确定方法以及装置
CN110990579B (zh) * 2019-10-30 2022-12-02 清华大学 跨语言的医学知识图谱构建方法、装置与电子设备
CN111858649B (zh) * 2020-08-05 2022-06-17 哈尔滨工业大学(威海) 一种基于本体映射的异构数据融合方法
CN112364000A (zh) * 2020-10-29 2021-02-12 广西电网有限责任公司南宁供电局 一种电力行业多源异构数据融合的系统及方法
CN112328623A (zh) * 2020-11-06 2021-02-05 昆山数字城市信息技术有限公司 基于混合本体模式的多源异构数据管理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052673A (zh) * 2017-12-29 2018-05-18 中国电子科技集团公司信息科学研究院 一种物联网数据集成与融合中间件系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于本体的医疗异构数据集成研究与应用;陆旭;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》;第19-24页 *
基于本体的医疗数据仓库维度建模研究与应用;王腾;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》;第19-28页 *

Also Published As

Publication number Publication date
CN112908441A (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
US20210011688A1 (en) Automatic discovery of microservices from monolithic applications
CN108351796B (zh) 用于在各种运行时环境中与模型交互并执行模型的统一接口规范
CN105453040B (zh) 在分布式计算环境中处理数据流的方法和系统
CN111767143A (zh) 交易数据处理方法、装置、设备及系统
Flahive et al. Ontology as a Service (OaaS): a case for sub-ontology merging on the cloud
US9930006B2 (en) Method for assigning logical addresses to the connection ports of devices of a server cluster, and corresponding computer program and server cluster
CN114691786A (zh) 数据血缘关系的确定方法及装置、存储介质、电子装置
Adedugbe et al. Leveraging cloud computing for the semantic web: review and trends
CN115203435A (zh) 基于知识图谱的实体关系生成方法及数据查询方法
Flahive et al. Ontology as a Service (OaaS): extracting and replacing sub-ontologies on the cloud
CN110659029B (zh) 生成表示计算机程序的语义流图
US11704327B2 (en) Querying distributed databases
CN112908441B (zh) 一种医疗平台的数据处理方法、装置以及处理设备
Grasic et al. Automating ontology based information integration using service orientation
CN107463638A (zh) 离线虚拟机间文件共享方法和设备
CN109213565A (zh) 异构虚拟计算资源的管理方法、相关设备及存储介质
US11727022B2 (en) Generating a global delta in distributed databases
Wang et al. Towards an efficient platform for social big data analytics
Parmar et al. Internet of Things Framework for Device Integration in Automation Applications
Wu et al. Formal specification and transformation method of system requirements from B Method to AADL Model
US11556591B2 (en) Tenant-isolated custom annotations for search within a public corpus
CN117112451B (zh) 测试方法、装置、电子设备及计算机可读存储介质
Rejeb et al. The Big Picture on Semantic Web and Interoperability. What We Know and What We Don’t
Keet et al. Orchestrating a network of mereo (topo) logical theories: An abridged report
Gröner et al. Metamodelling and ontologies (∗)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant