CN114064923A - 数据处理方法、装置、电子设备和存储介质 - Google Patents
数据处理方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114064923A CN114064923A CN202111372536.2A CN202111372536A CN114064923A CN 114064923 A CN114064923 A CN 114064923A CN 202111372536 A CN202111372536 A CN 202111372536A CN 114064923 A CN114064923 A CN 114064923A
- Authority
- CN
- China
- Prior art keywords
- medical knowledge
- medical
- knowledge
- data
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000003860 storage Methods 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 claims description 76
- 238000010276 construction Methods 0.000 claims description 56
- 238000012545 processing Methods 0.000 claims description 47
- 230000000875 corresponding effect Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012795 verification Methods 0.000 claims description 14
- 230000002596 correlated effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 21
- 201000010099 disease Diseases 0.000 description 19
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 19
- 239000003814 drug Substances 0.000 description 19
- 230000008569 process Effects 0.000 description 19
- 208000024891 symptom Diseases 0.000 description 19
- 229940079593 drug Drugs 0.000 description 16
- 238000004519 manufacturing process Methods 0.000 description 14
- 230000008520 organization Effects 0.000 description 12
- 238000011282 treatment Methods 0.000 description 11
- 239000000047 product Substances 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000011161 development Methods 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000012550 audit Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000004140 cleaning Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000001556 precipitation Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000001376 precipitating effect Effects 0.000 description 3
- 208000017667 Chronic Disease Diseases 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 238000009411 base construction Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000008571 general function Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种数据处理方法、装置、电子设备和存储介质,涉及计算机领域,尤其涉及设备应用领域。具体实现方案为:获取多种医疗知识源的医疗知识数据;基于每个医疗知识源的医疗知识数据,生成每个医疗知识源的第一医疗知识图谱,其中,第一医疗知识图谱用于表征对应的医疗知识源中的医疗知识数据的关系;基于多个第一医疗知识图谱生成第二医疗知识图谱,其中,第二医疗知识图谱用于构建多个第一医疗应用。
Description
技术领域
整个申请涉及计算机技术领域,尤其涉及设备应用领域中的数据处理方法、装置、电子设备和存储介质。
背景技术
目前,医疗知识加工方法,主要依赖于单一应用产品的需求,每一个医疗应用是都需要单独搭建一套对应的医疗知识库,从而每当开发一个医疗应用时,都需要从头开始搭建其所需要的医疗知识。
发明内容
本公开提供了一种数据处理方法、装置、电子设备和存储介质。
根据本公开的一方面,提供了一种数据处理方法。该方法可以应用于医疗知识平台,包括:获取多种医疗知识源的医疗知识数据;基于每个医疗知识源的医疗知识数据,生成每个医疗知识源的第一医疗知识图谱,其中,第一医疗知识图谱用于表征对应的医疗知识源中的医疗知识数据的关系;基于多个第一医疗知识图谱生成第二医疗知识图谱,其中,第二医疗知识图谱用于构建多个第一医疗应用。
根据本公开的另一方面,还提供了另一种应用的构建方法,该方法包括:调用第二医疗知识图谱,其中,第二医疗知识图谱为由本公开实施例的数据处理方法获得;基于第二医疗知识图谱构建第一医疗应用。
根据本公开的另一方面,还提供了一种数据处理装置。该装置可以应用于医疗知识平台,包括:获取单元,用于获取多种医疗知识源的医疗知识数据;第一生成单元,用于基于每个医疗知识源的医疗知识数据,生成每个医疗知识源的第一医疗知识图谱,其中,第一医疗知识图谱用于表征对应的医疗知识源中的医疗知识数据的关系;第二生成单元,用于基于多个第一医疗知识图谱生成第二医疗知识图谱,其中,第二医疗知识图谱用于构建多个第一医疗应用。
根据本公开的另一方面,还提供了另一种应用的构建装置。该装置包括:调用单元,用于调用第二医疗知识图谱,其中,第二医疗知识图谱为由本公开实施例的数据处理方法获得;构建单元,用于基于第二医疗知识图谱构建第一医疗应用。
根据本公开的另一方面,还提供了一种电子设备。该电子设备可以包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开实施例的数据处理方法。
根据本公开的另一方面,还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开实施例的数据处理方法。
根据本公开的另一方面,还提供了一种计算机程序产品,可以包括计算机程序,计算机程序在被处理器执行时实现本公开实施例的数据处理方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的一种数据处理方法的流程图;
图2是根据本公开实施例的一种应用的构建方法的流程图;
图3是根据本公开实施例的一种医疗知识中台图的示意图;
图4是根据本公开实施例的一种基础工具集组成图的示意图;
图5是根据本公开实施例的一种医疗知识加工功能图的示意图;
图6是根据本公开实施例的一种医疗知识库分类图的示意图;
图7是根据本公开实施例的一种中台内核的示意图;
图8是根据本公开实施例的一种通用医疗知识应用图的示意图;
图9是根据本公开实施例的一种数据处理装置的示意图;
图10是根据本公开实施例的一种应用的构建装置的示意图
图11是根据本公开实施例的一种数据处理的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面从医疗知识平台一侧对本公开实施例的数据处理方法进行介绍,包括由医疗知识平台主要执行的应用的构建方法。其中,上述医疗知识平台可以为医疗知识中台,该医疗知识中台是一种特殊的医疗知识平台,医疗知识中台是知识可复用的平台,也即,其一方面可以沉淀知识数据,另一方面在知识沉淀完之后,可以被其它的应用进行复用。
图1是根据本公开实施例的一种数据处理方法的流程图。如图1所示,该方法可以包括以下步骤:
步骤S102,获取多种医疗知识源的医疗知识数据。
在本公开上述步骤S102提供的技术方案中,医疗知识源可以为医学经典著作、医学教科书、医疗学术期刊、医疗临床指南、医疗诊疗标准、电子病历、健康档案等医疗知识源/数据源,多种医疗知识源又可以称为多源异构医疗知识源。可选地,医疗知识数据可以为结构化的医疗文本知识,又可以称为单条知识源的医疗知识数据。
可选地,针对多个医学经典著作、医学教科书、医疗学术期刊、医疗临床指南、医疗诊疗标准、电子病历、健康档案等医疗知识源/数据源进行处理,可以包括医疗文本识别、语音识别、图像识别、自然语言处理等方式,实现对多个医疗知识源中具体内容的电子化和数字化,形成结构化的医疗文本知识。
举例而言,可以利用包括文本识别、语音识别、图像识别、自然语言处理等多种类型的基础工具的基础工具集,以组件化的方式提供服务,从而广泛的对医疗知识源/数据源进行处理和识别,实现从医疗知识源/数据源中提结构化医疗知识数据,这一步为实现病历文本结构化、症状识别、病历理解等基本操作具有重要意义。
步骤S104,基于每个医疗知识源的医疗知识数据,生成每个医疗知识源中的第一医疗知识图谱,其中,第一医疗知识图谱用于表征对应的医疗知识源的医疗知识数据的关系。
在本公开上述步骤S104提供的技术方案中,基于每个医疗知识源的医疗知识数据,可以融合生成对应每个医疗知识源的第一医疗知识图谱,其中,第一医疗知识图谱用于表征对应医疗知识源中医疗知识数据以及医疗知识数据之间的关系,又可以为单条知识源的医疗知识图谱。可选地,该实施例通过对医疗知识数据进行处理,从而实现第一医疗知识图谱进行构建的目的。
可选地,对医疗知识数据,开展医疗知识生产,对于结构较差的医疗知识数据,先进行数据清洗;对清洗过的数据进行知识抽取,从而识别出有用的知识;对识别出的医疗实体和关系进行处理,从而将单个知识源中的知识与医疗知识中台的整体知识体系进行对齐,保持一致;对上述识别出来的医疗实体之间建立关系,实现医疗实体对应的节点和边的构建,从而生成第一医疗知识图谱。
举例而言,该实施可以基于基础工具集对医疗知识源进行处理,得到医疗知识数据,对于医疗知识数据,开展医疗知识生产,对于数据结构较差的知识源,先进行数据清洗;在医疗文本知识中,从结构、语义和时序等方面进行知识抽取,知识抽取包括对疾病、症状、药品、治疗等实体和疾病-症状、疾病-治疗药物等关系进行抽取,从而判断出有用的知识,实现内容理解;然后按照中台内核的约束,对识别出的医疗实体和关系进行实体消歧和共指消解等处理,从而实现将知识源中的知识与医疗知识中台的整体知识体系进行对齐,保持一致,完成知识融合;最后对医疗实体之间建立关系,实现医疗实体对应的节点和边的构建,生成第一医疗知识图谱。
步骤S106,基于多个第一医疗知识图谱关联生成第二医疗知识图谱,其中,第二医疗知识图谱用于构建多个第一医疗应用。
在本公开上述步骤S106提供的技术方案中,可以基于多个第一医疗知识图谱关联生成第二医疗知识图谱,该第二医疗知识图谱用于构建第一医疗应用,该第一医疗应用的数量可以为多个。可选地,该实施例的第二医疗知识图谱可以为基于多个第一医疗知识图谱生成大规模的可视化的图谱(医疗行业知识图谱),以为广泛应用的建设提供坚实基础。通过将第一医疗知识图谱与医疗知识中台内已有的知识图谱进行关联,从而汇入到整个大规模的知识图谱之中,该第二医疗知识图谱是可以多次利用的,可以将第二医疗知识图谱用于构建第一医疗应用。其中,第一医疗应用可以为外部智能化医疗应用,比如,为新研医疗应用。
可选地,该实施例可以基于医疗知识生产和组织过程,也可以基于疾病、症状、体征、药品、手术操作等各类医学本体及其之间的属性关系生成第二医疗知识图谱,该步骤可以使系统更接近于人类的认知思维,为第二医疗知识图谱在医疗知识平台的广泛应用提供坚实基础。
举例而言,对构建完成的第二医疗知识图谱按照症状、体征、检验、检查、疾病、药品和手术操作等主题对医疗知识进行存储,通过中间件等方式,实现向外部智能化医疗应用按需调用,从而为智能化医疗应用的构建提供了有力支持。
该实施例通过将多个不同的医疗知识源快速转换成大规模的医疗行业知识图谱,并可以复用在新研医疗应用的构建中,从而实现了提高医疗应用的构建效率的技术效果,可以解决医疗应用构建过程中医疗知识重复加工的技术问题。
通过上述步骤S102至步骤S106,获取多个医疗知识源的医疗知识数据;基于每个医疗知识源的医疗知识数据,生成每个医疗知识源的第一医疗知识图谱,其中,第一医疗知识图谱用于表征对应的医疗知识源的医疗知识数据的关系;基于多个第一医疗知识图谱生成第二医疗知识图谱,其中,第二医疗知识图谱用于构建多个第一医疗应用。也就是说,本公开将多个不同的医疗知识源快速转换成第一医疗知识图谱,基于第一医疗知识图谱生成第二医疗知识图谱,通过将第一医疗知识图谱复用在其他医疗应用构建中,从而提高了构建医疗应用的效率,解决了构建医疗应用的效率低的技术问题。
下面对该实施例的上述方法进行进一步地详细介绍。
作为一种可选的实施方式,该方法还包括:对多个医疗知识源的医疗知识数据和医疗知识平台的原始医疗知识数据进行关联,得到关联医疗知识数据;基于多个第一医疗知识图谱生成第二医疗知识图谱包括:基于多个第一医疗知识图谱和关联医疗知识数据生成第二医疗知识图谱。
在该实施例中,上述医疗知识平台可以为医疗知识中台,上述医疗知识平台的原始医疗知识数据为医疗知识中台的已有医疗知识数据,将多个医疗知识数据与医疗知识中台内已有的医疗知识数据进行关联,汇入到整个大规模的知识图谱中,从而生成第二医疗知识图谱。可选地,如果在医疗知识中台没有现有医疗知识数据的相关数据,则可以不关联,直接在医疗知识中台新建位置,通过将新生成的多个医疗知识数据在医疗知识平台中进行映射,从而方便第一医疗应用对其调用。
作为一种可选的实施方式,对多个医疗知识源的医疗知识数据和第一医疗应用的医疗知识数据进行关联,得到关联医疗知识数据,该方法还包括:将多个医疗知识源的医疗知识数据和第一医疗应用的医疗知识数据按照目标分类信息进行关联,得到关联医疗知识数据,其中,目标分类信息用于表示医疗知识体系。
在该实施例中,目标分类信息可以为现有的医疗知识体系的分类信息,可以为按照知识的不同维度进行分类,包括症状库、体征库、检验库、检查库、疾病库、药品库、手术操作库等,其中,目标分类信息要可以覆盖医院临床科室、医技科室的所有知识维度。
可选地,目标分类信息可以为按照知识的不同维度进行分类,进而将其存储在医疗知识库中,目标分类信息不仅仅是上述所列举的,可以根据具体场景来确定。
举例而言,可以通过知识组织,完成对医疗知识源的医疗知识数据的统一组织,主要为,通过知识关联,将医疗知识源中的医疗知识数据按照医疗知识体系的分类要求与所要使用的第一医疗应用的医疗知识数据按照目标分类信息进行关联,从而便于第一医疗应用的调用使用。
作为一种可选的实施方式,该方法还包括:对关联医疗知识数据进行校验,得到校验结果;基于多个第一医疗知识图谱和关联医疗知识数据生成第二医疗知识图谱,包括:确定校验结果为对关联医疗知识数据校验合格,则基于多个第一医疗知识图谱和关联医疗知识数据生成第二医疗知识图谱。
在该实施例中,由于医疗行业的零容错性低,对于生成医疗知识图谱的准确性要求较高,因此需要对关联医疗知识数据进行校验,可选地,该校验可以是由用户触发审核指令,来对关联医疗知识数据进行校验,校验合格的医疗知识数据生成第二医疗知识图谱,对外发布校验合格的第二医疗知识图谱,从而保证对外输出知识的准确性。
举例而言,可以通过知识组织中的知识审核组件对多个第一医疗知识图谱和关联的医疗数据进行校验,通过只显示校验合格的医疗数据,从而得到第二医疗知识图谱。
作为一种可选的实施方式,该方法还包括:确定校验结果为对关联医疗知识数据校验合格,则发布关联医疗知识数据,其中,发布后的关联医疗知识数据由第一医疗应用进行调用。
在该实施例中,确定校验结果为对关联医疗知识数据校验合格,则将审核通过的医疗知识对外进行发布,发布后的关联医疗知识数据由第一医疗应用进行调用。
举例而言,可以通过知识组织中的知识发布组件,将校验结果合格的关联医疗知识数据对外进行发布,发布后的关联医疗知识数据由可以由第一医疗应用按照自己实际需求进行调用。
作为一种可选的实施方式,基于每个医疗知识源的医疗知识数据,生成每个医疗知识源的第一医疗知识图谱,该方法还包括:确定每个医疗知识源的医疗知识数据对应的多个医疗实体;建立多个医疗实体之间的目标关系;基于目标关系建立第一医疗知识图谱。
在该实施例中,医疗实体可以为疾病、症状、药品、治疗等实体和疾病-症状、疾病-治疗药物等关系,也可以为症状、体征、检验、检查、疾病、药品和手术操作等主题。
举例而言,在医疗知识数据中,从结构、语义和时序等方面进行知识抽取,包括疾病、症状、药品、治疗等实体和疾病-症状、疾病-治疗药物等关系识别,使得机器判断出每个医疗知识源的医疗知识数据对应的多个医疗实体,从而将关系相同的医疗实体之间建立关系,生成第一医疗知识图谱。
作为一种可选的实施方式,该方法还包括:对第二医疗知识图谱进行分类,并将分类后的第二医疗知识图谱存储至目标数据库中,其中,目标数据库由第一医疗应用进行调用。
在该实施例中,可以对构建完成的第二医疗知识图谱,按照症状、体征、检验、检查、疾病、药品和手术操作等主题对医疗知识进行存储,通过应用层及中间件等方式提供服务,从而实现外部智能化医疗应用的按需调用。需要说明的是,存储主题可以根据实际需求进行修改,此处不做限定。
举例而言,可以创建一个医疗知识库,用于存储生成的医疗知识数据,可以按照知识的不同维度,比如,症状库、体征库、检验库、检查库、疾病库、药品库、手术操作库等,对医疗知识库中的医疗知识数据分类存储。该组件可以具备自动化沉淀医疗知识的能力,可以将已有的医疗知识沉淀到中台之中,从而能够快速支持新应用产品的开发,实现第一医疗应用的快速调用,避免了后期再重复进行知识加工的建设。
作为一种可选的实施方式,对第二医疗知识图谱进行分类包括:按照目标分类信息对第二医疗知识图谱进行分类,其中,目标分类信息用于表示医疗知识体系。
在该实施例中,可以通过医学知识体系和医学知识标准对医疗知识加工和医疗知识库构建过程进行约束,使得机器能够判断出抽取的有用的知识,以实现后面的关联步骤。
可选地,可以通过中台内核模块实现按照目标分类信息对第二医疗知识图谱进行分类。其中,中台内核模块用于对医疗知识加工和医疗知识库构建过程进行约束,引导机器进行医学知识加工,并按照预设的医疗知识体系,将医疗知识数据存储到医疗知识库中,中台内核模块可以包括医疗行业标准、医疗知识体系和医疗术语集等单元。
作为一种可选的实施方式,该方法包括:获取并响应目标请求,调用第二医疗应用,其中,第二医疗应用用于从目标数据库中输出第二医疗知识图谱中的目标医疗知识数据。
在该实施例中,第二医疗应用可以为通用医疗知识应用,是医疗知识中台能够对外提供医疗知识服务的基本方式,将医疗知识中台的能力向用户提供通用功能,满足用户基础的知识应用需求,基于通用医疗知识应用和医疗知识库,能够支持进行场景化的应用开发,通用医疗知识应用可以包括知识门户、知识搜索、知识问答、知识推荐、和知识写作等。需要注意的是,通用医疗知识应用包括的内容可以根据实际使用情况进行增减,比如,当用户只需要知识搜索与知识问答时,可以只选择通用医疗知识应用中的知识搜索与知识问答,其他部分则不显示。
可选地,根据实际使用情况构建第二医疗应用,用户根据自己需求在第二医疗应用上选择自己想要了解的医疗知识数据,从而从目标数据库中输出用户所选择的第二医疗知识图谱中的目标医疗知识数据。
下面从对本公开实施例的一种应用构建方法进一步进行介绍。
图2是根据本公开实施例的一种应用的构建方法的流程图。如图2所示,该方法可以包括以下步骤:
步骤S202,调用第二医疗知识图谱。
可选地,第二医疗知识图谱为由上述的数据处理方法获得。
步骤S204,基于第二医疗知识图谱构建第一医疗应用。
在该实施例中,可以实现根据实际需求,基于第二医疗知识图谱,通过对第二医疗知识图谱上进行功能的添加,从而构建第一医疗应用。
在该实施例中,将多种不同的医疗知识源快速转换成第一医疗知识图谱,基于多个第一医疗知识图谱关联生成第二医疗知识图谱,通过将第二医疗知识图谱复用在其他医疗应用构建中,从而提高了构建医疗应用的效率,解决了构建医疗应用的效率低的技术问题。
同时,该实施例还在本实施例的基础上,允许根据使用时的实际需求,与其他功能组件、程序等结合使用,但需要注意的,只要是基于本实施例的基础上进行的改进,仍在本公开的保护范围之内。
下面结合优选的实施例对本公开实施例的上述技术方案进行进一步地举例介绍。
随着自然语言处理、知识图谱构建等人工智能技术在医疗领域的不断深入应用,医疗领域的智能化程度不断加深,如临床辅助决策系统、合理用药系统、智慧病案系统、慢病管理系统等多种智能化医疗应用系统都纷纷从概念走向应用,已经成为未来智慧医院建设过程中必不可少的要素。
但传统医疗知识加工方法,主要依赖于单一应用产品的需求,按照知识应用的场景,对所需的医疗知识进行标注,抽取实体和关系,再生成机器可识别的知识图谱,机器利用建立的简单标签进行推理计算,支持应用产品需求。但这种加工方式不仅效率低下、存在实体标注不全面、关系构建不购精确的弊端,并且医疗知识与应用产品耦合度较高,导致最终医疗知识的标准化程度低,严重制约了医疗知识的大规模、高频率复用的使用。
同时,在现有的技术手段中,每一个智能化医疗应用建设是都需要单独搭建一套对应的医疗知识库。每当开发一个新的智能化医疗应用时,都需要从头开始搭建其所需要的医疗知识,而这部分工作可能在过往的智能化医疗应用中已经建设。因此,这样的建设方法使得医疗知识的可复用程度低,应用之间都是烟囱式的建设模式,造成大量重复开发。长此以往,随着医疗机构部署智能化医疗应用数量的增长,造成的重复开发也将越来越严重。
针对上述问题,相关技术提出了一种基于自然语言理解的税务知识中台及其构建方法,但是该方法仅是面向税务领域,由于医疗行业在知识分类、知识关联程度、知识源结构等方面与税务领域有较强的差异,所以税务中台的方法并不适用医疗行业提出的知识中台构建方法。
相关技术还提出了一种AI服务的中台构建方法,该方法将AI模型等能力进行中台化处理,并对外提供服务,但该方法仍未实现将医疗知识进行中台化处理,且AI模型的沉淀方式与知识的沉淀方式在技术实现上差异较大,仍旧需要新的技术方法实现中台化沉淀。
相关技术还提出了另一种医疗知识系统及医疗知识编辑方法、应用方法,该方法面向医生等医护人员提供了一套编辑医疗知识的可视化系统,重点在于人机交互的技术能力,但该方法仍未解决医疗知识图谱的规模化构建问题,在面向用户方面和技术实现上存在一定问题。
相关技术还提出了另外两种医疗知识图谱构建方法及装置和一种医学知识图谱的构建方法、装置、介质及电子设备,上述两种方法都是解决医疗知识图谱的构建问题,二者只是在具体的构建算法上有所差异,但上述两种方法仍未实现以中台化的方式将医疗知识图谱化构建能力进行沉淀,也无法改变应用产品以往自上而下的设计建设路径,更无法支持自下而上的应用产品建设方式,存在成本稿,建设效率低的问题。
而本公开,通过将医疗知识加工过程工具和医疗知识资源进行中台化沉淀,将提升智能化医疗应用的构建效率,一方面通过医疗知识中台提供组件化医疗知识加工工具,能够降低构建医疗知识图谱的门槛,能够更快速的将知识源转换成医疗知识图谱,另外一方面将已有的医疗知识沉淀到中台之中,不断丰富和拓展中台能力,能够快速支持新应用产品的开发,从而避免了后期再重复进行知识加工的建设的问题,实现了降低建设成本的技术效果。
本公开提出一种医疗知识中台的构建方法,通过设计一种开放的分层架构,整合功能模块,解决现有多源异构医疗知识源存在的医疗知识可复用程度低、医疗知识加工过程不规范、医疗知识管理效率低等问题,实现对医疗知识的显性化表达和持续沉淀,使得机器能够理解和利用医疗知识,从而能够支持知识驱动的应用开发建设。
在本公开的第一方面,提供了一种医疗知识中台化的架构,如图3所示,图3是根据本公开实施例的一种医疗知识中台图的示意图,其中,所述中台包括:基础工具集模块、医疗知识加工模块、医学知识库模块、中台内核模块和通用医疗知识应用模块。
(1)基础工具集模块:用于提供标准化的医疗知识处理、加工、调取和应用工具集,实现对医学教科书、医疗临床指南、电子病历等知识源/数据源的预处理,将医学知识转换成能够支持机器可读写的数据规范格式。
图4是根据本公开实施例的一种基础工具集组成图的示意图,如图4所示,基础工具集包括文本识别、语音识别、图像识别、自然语言处理等多种类型的基础工具,以组件化的方式提供服务,能够对广泛的医学知识源/数据源进行处理和识别,实现从知识源/数据源中提结构化医疗数据,使得机器看清、听清,能够向医生一样具备感知能力,支撑实现病历文本结构化、症状识别、病历理解等基本操作,为下一步知识加工提供预处理。
(2)医疗知识加工模块:通过对医疗知识的生产和组织等过程,依托算法模型完成对医疗知识的一站式、全自动标注和关系构建,形成机器可理解、可调用的医疗知识。
图5是根据本公开实施例的一种医疗知识加工功能图的示意图,如图5所示,医疗知识加工主要包括知识生产、知识组织和医疗知识图谱,完成医疗知识的标准化输出,具体的:
知识生产,主要生成单条知识源的医疗知识图谱,通过数据清洗、内容理解、知识融合和图谱生成等过程,提取识别医学实体、关系,并通过实体消歧和共指消解等常规操作,完成标准化融合,实现单条知识源的知识图谱构建;
知识组织,主要完成知识点与知识点之间的关联与组织,对发现的医疗知识进行统一组织,通过知识关联,将生产的新知识按照医疗知识体系的分类要求与现有知识进行关联,并依托知识审核和知识发布等过程,确保新生产知识的正确性,实现对中台内部知识的组织管理;
医疗知识图谱基于医疗知识生产和组织过程,能够基于疾病、症状、体征、药品、手术操作等各类医学本体及其之间的属性关系,生成可视化的图谱展现,并使得机器更加接近于人类的认知思维,为广泛应用提供坚实基础。
(3)医学知识库模块:按照设定好的医学主题对被加工处理过的医学知识进行分类存储,并对外支持医学知识的调用和读取。
图6是根据本公开实施例的一种医疗知识库分类图的示意图。如图6所示,医疗知识库将生成的医学知识进行存储,具备自动化沉淀医学知识的能力,可向外提供将医疗知识中台的知识服务能力,可按照知识的不同维度进行分类,主要包括症状库、体征库、检验库、检查库、疾病库、药品库、手术操作库等,覆盖医院临床科室、医技科室的知识维度。
(4)中台内核模块:主要依据医学知识体系和医学知识规则,实现对医学知识加工过程的约束和引导,确保符合医学逻辑。
图7是根据本公开实施例的一种中台内核的示意图。如图7所示,中台内核模块的重点是对医疗知识加工和医疗知识库构建过程进行约束,引导机器进行医学知识加工,并按照预设的医疗知识体系存储到医疗知识库中,完成知识的积累和增长,主要包括医疗行业标准、医疗知识体系和医疗术语集等。
(5)通用医疗知识应用模块:对外提供医疗知识读取、调用、检索、查询和智能交互等服务;对内实现对医学知识处理和加工过程的规范化处置及规则调优。
图8是根据本公开实施例的一种通用医疗知识应用图的示意图,如图8所示,通用医疗知识应用是医疗知识中台能够对外提供医疗知识服务的基本方式,将医疗知识中台的能力向用户提供通用功能,满足用户基础的知识应用需求,基于通用医疗知识应用和医疗知识库,能够支持进行场景化的应用开发。通用医疗知识应用主要包括知识门户、知识搜索、知识问答、知识推荐、和知识写作等。
在本公开的第二方面,提供了一种医疗知识中台的搭建方法,需要说明的是,医疗知识中台的搭建方法并不唯一,不做具体限定。具体包括:
第一部分,基础工具集,针对医学经典著作、医学教科书、医疗学术期刊、医疗临床指南、医疗诊疗标准、电子病历、健康档案等医疗知识源/数据源进行处理,主要包括医疗文本识别、语音识别、图像识别、自然语言处理等方式,实现对知识源中具体内容的电子化和数字化,形成结构化的医疗文本知识;
第二部分,医疗知识生产,依托基础工具集识别处理的结果,对于单条知识源,开展医疗知识生产,对于数据结构较差的知识源,先进行数据清洗;通过内容理解,在医疗文本知识中,从结构、语义和时序等方面进行内容理解、知识融合等知识生产过程,包括疾病、症状、药品、治疗等实体和疾病-症状、疾病-治疗药物等关系识别,使得机器能够判断出有用的知识,实现内容理解;知识融合,主要按照中台内核的约束,对识别出的医疗实体和关系进行实体消歧和共指消解等处理,能够将知识源中的知识与中台的整体知识体系进行对齐,保持一致,完成知识融合;图谱生成,对医疗实体之间建立关系,实现节点和边的构建,完成图谱生成;
第三部分,医疗知识组织,对于知识生产后产生的单条知识源的知识图谱,需要与中台内已有的知识图谱进行关联,从而汇入到整个大规模的知识图谱之中;知识审核,由于医疗行业的零容错性,对于生成医疗知识图谱的准确性要求较高,因此需要人工介入对部分内容进行审核,确保最终对外输出知识的准确性;知识发布,将审核通过的医疗知识对外进行发布,便于外部调用使用;
第四部分,医疗知识库,对构建完成的医疗知识图谱,按照症状、体征、检验、检查、疾病、药品和手术操作等主题对医疗知识进行存储,并通过应用程序接口(ApplicationProgramming Interface,简称API)、软件开发包(Software Development,简称SDK)以及中间件等方式提供服务,实现外部智能化医疗应用的按需调用,支持智能化医疗应用的构建;
第五部分,通用医疗知识应用,为满足用户的基本使用需要,需要构建知识门户、知识检索、知识问答、知识推荐、知识写作等通用的知识应用,需要根据实际使用情况进行适当增减。
本公开,基于医疗知识中台构建方法,通过获取多源异构医疗知识源的医疗知识,基于每个医疗知识源的医疗知识数据,生成单条知识源的医疗知识图谱,基于多条知识源的医疗知识图谱,生成大规模可视化的图谱展现,从而为广泛应用的建设提供坚实基础,也就是说,本方案通过将多个不同的医疗知识源快速转换成大规模的医疗行业知识图谱,并可以复用在新研医疗应用的构建中,从而实现了对医疗机构内部的医疗知识资源的梳理、存储、加工、处理及应用,并能够支持面向特定医疗领域的智能化应用场景类产品研发,如临床辅助决策系统、合理用药系统、智慧病案系统、慢病管理系统等,进而实现了提高医疗应用的构建效率的技术效果,解决了医疗应用构建过程中医疗知识重复加工的技术问题。
本公开实施例还提供了一种用于执行图1所示实施例的数据处理方法的数据处理装置。
图9是根据本公开实施例的一种数据处理装置的示意图。如图9所示,该数据处理装置90可以包括:获取单元91、第一生成单元92和第二生成单元93。
获取单元91,用于获取多种医疗知识源的医疗知识数据。
第一生成单元92,用于基于每个医疗知识源的医疗知识数据,生成每个医疗知识源的第一医疗知识图谱,其中,第一医疗知识图谱用于表征对应的医疗知识源中的医疗知识数据的关系。
第二生成单元93,用于基于多个第一医疗知识图谱生成第二医疗知识图谱,其中,第二医疗知识图谱用于构建多个第一医疗应用。
可选地,第一生成单元92包括:关联模块,用于对多个医疗知识源的医疗知识数据和医疗知识平台的原始医疗知识数据进行关联,得到关联医疗知识数据;基于多个第一医疗知识图谱生成第二医疗知识图谱,第一生成单元92包括第一生成模块,用于基于多个第一医疗知识图谱和关联医疗知识数据生成第二医疗知识图谱。
可选地,关联模块包括:第一关联子模块,用于对多个医疗知识源的医疗知识数据和第一医疗应用的医疗知识数据进行关联,得到关联医疗知识数据包括:将多个医疗知识源的医疗知识数据和第一医疗应用的医疗知识数据按照目标分类信息进行关联,得到关联医疗知识数据,其中,目标分类信息用于表示医疗知识体系。
可选地,第一生成单元92包括:校验模块,用于对关联医疗知识数据进行校验,得到校验结果;基于多个第一医疗知识图谱和关联医疗知识数据生成第二医疗知识图谱,包括:确定校验结果为对关联医疗知识数据校验合格,则基于多个第一医疗知识图谱和关联医疗知识数据生成第二医疗知识图谱。
可选地,校验模块包括:确定子模块,用于确定校验结果为对关联医疗知识数据校验合格,则发布关联医疗知识数据,其中,发布后的关联医疗知识数据由第一医疗应用进行调用。
可选地,第一生成单元92包括:确定模块,用于确定每个医疗知识源的医疗知识数据对应的多个医疗实体;建立模块,用于建立多个医疗实体之间的目标关系;基于目标关系建立第一医疗知识图谱。
可选地,第二生成单元93包括:分类模块,用于对第二医疗知识图谱进行分类,并将分类后的第二医疗知识图谱存储至目标数据库中,其中,目标数据库由第一医疗应用进行调用。
可选地,分类模块包括:分类子模块,用于按照目标分类信息对第二医疗知识图谱进行分类,其中,目标分类信息用于表示医疗知识体系。
可选地,第二生成单元93包括:调用单元,用于获取并响应目标请求,调用第二医疗应用,其中,第二医疗应用用于从目标数据库中输出第二医疗知识图谱中的目标医疗知识数据。
本公开实施例还提供了一种用于执行图2所示实施例的应用的构建方法的应用的构建装置。
图10是根据本公开实施例的一种应用的构建装置的示意图。如图10所示,该应用的构建装置100可以包括:调用单元101和构建单元102
调用单元101,用于调用第二医疗知识图谱,其中,所述第二医疗知识图谱为本公开实施例的数据处理方法获得。
构建单元102,用于基于第二医疗知识图谱构建第一医疗应用。
在该实施例的应用的构建装置中,将多个不同的医疗知识源快速转换成第一医疗知识图谱,将第一医疗知识图谱复用在其他医疗应用构建中,从而提高了构建医疗应用的效率,解决了构建医疗应用的效率低的技术问题。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
本公开的实施例提供了一种电子设备,该电子设备可以包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开实施例的数据处理方法。
可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
根据本公开的实施例,本公开还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开实施例的数据处理方法。
可选地,在本实施例中,上述非易失性存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取多种医疗知识源的医疗知识数据;
S2,基于每个医疗知识源的医疗知识数据,生成每个医疗知识源的第一医疗知识图谱,其中,第一医疗知识图谱用于表征对应的医疗知识源中的医疗知识数据的关系;
S3,基于多个第一医疗知识图谱生成第二医疗知识图谱,其中,第二医疗知识图谱用于构建多个第一医疗应用。
可选地,在本实施例中,上述非易失性存储介质还可以被设置为存储用于执行以下步骤的计算机程序:
S1,调用第二医疗知识图谱,其中,第二医疗知识图谱为由本公开实施例的数据处理方法获得;
S2,基于第二医疗知识图谱构建第一医疗应用。
可选地,在本实施例中,上述非瞬时计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的实施例,本公开还提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现以下步骤:
S1,获取多种医疗知识源的医疗知识数据;
S2,基于每个医疗知识源的医疗知识数据,生成每个医疗知识源的第一医疗知识图谱,其中,第一医疗知识图谱用于表征对应的医疗知识源中的医疗知识数据的关系;
S3,基于多个第一医疗知识图谱生成第二医疗知识图谱,其中,第二医疗知识图谱用于构建多个第一医疗应用。
根据本公开的实施例,本公开还提供了另一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现以下步骤:
S1,调用第二医疗知识图谱,其中,第二医疗知识图谱为由本公开实施例的数据处理方法获得;
S2,基于第二医疗知识图谱构建第一医疗应用。
图11是根据本公开实施例的一种数据处理的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,设备110包括计算单元111,其可以根据存储在只读存储器(ROM)112中的计算机程序或者从存储单元118加载到随机访问存储器(RAM)113中的计算机程序,来执行各种适当的动作和处理。在RAM 113中,还可存储设备110操作所需的各种程序和数据。计算单元111、ROM112以及RAM 113通过总线114彼此相连。输入/输出(I/O)接口115也连接至总线114。
设备110中的多个部件连接至I/O接口115,包括:输入单元116,例如键盘、鼠标等;输出单元117,例如各种类型的显示器、扬声器等;存储单元118,例如磁盘、光盘等;以及通信单元119,例如网卡、调制解调器、无线通信收发机等。通信单元119允许设备110通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元111可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元111的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元111执行上文所描述的各个方法和处理,例如方法数据处理方法。例如,在一些实施例中,方法数据处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元118。在一些实施例中,计算机程序的部分或者全部可以经由ROM 112和/或通信单元119而被载入和/或安装到设备110上。当计算机程序加载到RAM 113并由计算单元111执行时,可以执行上文描述的数据处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元111可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (15)
1.一种数据处理方法,应用于医疗知识平台,包括:
获取多种医疗知识源的医疗知识数据;
基于每个所述医疗知识源的医疗知识数据,生成每个所述医疗知识源的第一医疗知识图谱,其中,所述第一医疗知识图谱用于表征对应的所述医疗知识源中的医疗知识数据的关系;
基于多个所述第一医疗知识图谱生成第二医疗知识图谱,其中,所述第二医疗知识图谱用于构建多个第一医疗应用。
2.根据权利要求1所述的方法,
所述方法还包括:对多个所述医疗知识源的医疗知识数据和所述医疗知识平台的原始医疗知识数据进行关联,得到关联医疗知识数据;
基于多个所述第一医疗知识图谱生成第二医疗知识图谱包括:基于多个所述第一医疗知识图谱和所述关联医疗知识数据生成所述第二医疗知识图谱。
3.根据权利要求2所述的方法,其中,对多个所述医疗知识源的医疗知识数据和所述医疗知识平台的原始医疗知识数据进行关联,得到关联医疗知识数据包括:
将多个所述医疗知识源的医疗知识数据和所述原始医疗知识数据按照目标分类信息进行关联,得到所述关联医疗知识数据,其中,所述目标分类信息用于表示医疗知识体系。
4.根据权利要求2所述的方法,
所述方法还包括:对所述关联医疗知识数据进行校验,得到校验结果;
基于多个所述第一医疗知识图谱和所述关联医疗知识数据生成第二医疗知识图谱,包括:确定所述校验结果为对所述关联医疗知识数据校验合格,则基于多个所述第一医疗知识图谱和所述关联医疗知识数据生成所述第二医疗知识图谱。
5.根据权利要求4所述的方法,还包括:
确定所述校验结果为对所述关联医疗知识数据校验合格,则发布所述关联医疗知识数据,其中,发布后的所述关联医疗知识数据由所述第一医疗应用进行调用。
6.根据权利要求1所述的方法,其中,基于每个所述医疗知识源的医疗知识数据,生成每个所述医疗知识源的第一医疗知识图谱包括:
确定每个所述医疗知识源的医疗知识数据对应的多个医疗实体;
建立多个所述医疗实体之间的目标关系;
基于所述目标关系建立所述第一医疗知识图谱。
7.根据权利要求1所述的方法,还包括:
对所述第二医疗知识图谱进行分类,并将分类后的所述第二医疗知识图谱存储至目标数据库中,其中,所述目标数据库由所述第一医疗应用进行调用。
8.根据权利要求7所述的方法,其中,对所述第二医疗知识图谱进行分类包括:
按照目标分类信息对所述第二医疗知识图谱进行分类,其中,所述目标分类信息用于表示医疗知识体系。
9.根据权利要求7所述的方法,还包括:
获取并响应目标请求,调用第二医疗应用,其中,所述第二医疗应用用于从所述目标数据库中输出所述第二医疗知识图谱中的目标医疗知识数据。
10.一种应用的构建方法,包括:
调用第二医疗知识图谱,其中,所述第二医疗知识图谱为由权利要求1-9中任意一项所述的数据处理方法获得;
基于所述第二医疗知识图谱构建第一医疗应用。
11.一种数据处理装置,应用于医疗知识平台,包括:
获取单元,用于获取多种医疗知识源的医疗知识数据;
第一生成单元,用于基于每个所述医疗知识源的医疗知识数据,生成每个所述医疗知识源的第一医疗知识图谱,其中,所述第一医疗知识图谱用于表征对应的所述医疗知识源中的医疗知识数据的关系;
第二生成单元,用于基于多个所述第一医疗知识图谱生成第二医疗知识图谱,其中,所述第二医疗知识图谱用于构建多个第一医疗应用。
12.一种应用的构建装置,包括:
调用单元,用于调用第二医疗知识图谱,其中,所述第二医疗知识图谱为由权利要求1-9中任意一项所述的数据处理方法获得;
构建单元,用于基于所述第二医疗知识图谱构建第一医疗应用。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111372536.2A CN114064923A (zh) | 2021-11-18 | 2021-11-18 | 数据处理方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111372536.2A CN114064923A (zh) | 2021-11-18 | 2021-11-18 | 数据处理方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114064923A true CN114064923A (zh) | 2022-02-18 |
Family
ID=80278342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111372536.2A Pending CN114064923A (zh) | 2021-11-18 | 2021-11-18 | 数据处理方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114064923A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114464269A (zh) * | 2022-04-07 | 2022-05-10 | 国家超级计算天津中心 | 一种虚拟药物生成方法、装置及计算机设备 |
CN116910250A (zh) * | 2023-06-28 | 2023-10-20 | 北京百度网讯科技有限公司 | 知识处理方法、装置、电子设备及存储介质 |
-
2021
- 2021-11-18 CN CN202111372536.2A patent/CN114064923A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114464269A (zh) * | 2022-04-07 | 2022-05-10 | 国家超级计算天津中心 | 一种虚拟药物生成方法、装置及计算机设备 |
CN116910250A (zh) * | 2023-06-28 | 2023-10-20 | 北京百度网讯科技有限公司 | 知识处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10181012B2 (en) | Extracting clinical care pathways correlated with outcomes | |
CN110457439B (zh) | 一站式智能写作辅助方法、装置和系统 | |
US20230004721A1 (en) | Method for training semantic representation model, device and storage medium | |
US12008313B2 (en) | Medical data verification method and electronic device | |
CN109637602B (zh) | 医疗数据存储和查询方法、装置、存储介质及电子设备 | |
US20190156256A1 (en) | Generating risk assessment software | |
Pearce et al. | Coding and classifying GP data: the POLAR project | |
CN114064923A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN113656590B (zh) | 行业图谱的构建方法、装置、电子设备及存储介质 | |
CN110750540A (zh) | 构建医疗业务知识库的方法、获得医疗业务语义模型的方法及系统、介质 | |
CN111415747A (zh) | 电子病历的构建方法及装置 | |
CN117577254A (zh) | 医疗领域语言模型构建及电子病历文本结构化方法、系统 | |
US11645452B2 (en) | Performance characteristics of cartridge artifacts over text pattern constructs | |
CN111143394A (zh) | 知识数据处理方法、装置、介质及电子设备 | |
CN112582073B (zh) | 医疗信息获取方法、装置、电子设备和介质 | |
Johnson et al. | From sour grapes to low-hanging fruit: a case study demonstrating a practical strategy for natural language processing portability | |
CN113360490A (zh) | 数据处理方法、装置、设备、介质及程序产品 | |
CN112269884A (zh) | 信息抽取方法、装置、设备及存储介质 | |
CN111984797A (zh) | 客户身份识别装置及方法 | |
US10832809B2 (en) | Case management model processing | |
CN114117082B (zh) | 用于对待校正数据校正的方法、设备和介质 | |
CN115146634A (zh) | 应急预案转化待办流程图的处理方法及相关装置 | |
KR20190052980A (ko) | 인재 정보 처리 방법 및 장치 | |
Jayaratna et al. | HL7 v3 message extraction using semantic web techniques | |
US20210042390A1 (en) | Common Labeled Annotated Document Transcription for Coordinating Annotation of Documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |