CN111986799A - 一种以关节运动功能为核心的骨科知识图谱的构建系统 - Google Patents
一种以关节运动功能为核心的骨科知识图谱的构建系统 Download PDFInfo
- Publication number
- CN111986799A CN111986799A CN202010640048.4A CN202010640048A CN111986799A CN 111986799 A CN111986799 A CN 111986799A CN 202010640048 A CN202010640048 A CN 202010640048A CN 111986799 A CN111986799 A CN 111986799A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- concept
- unit
- corpus
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000399 orthopedic effect Effects 0.000 title claims abstract description 45
- 238000010276 construction Methods 0.000 title claims abstract description 39
- 230000006870 function Effects 0.000 claims abstract description 11
- 238000003860 storage Methods 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 9
- 238000010801 machine learning Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 4
- 210000003484 anatomy Anatomy 0.000 abstract description 12
- 201000010099 disease Diseases 0.000 abstract description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 19
- 210000001519 tissue Anatomy 0.000 description 7
- 210000000988 bone and bone Anatomy 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000007659 motor function Effects 0.000 description 4
- 210000002303 tibia Anatomy 0.000 description 4
- 210000001264 anterior cruciate ligament Anatomy 0.000 description 3
- 210000000845 cartilage Anatomy 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 210000003041 ligament Anatomy 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000005499 meniscus Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 208000012659 Joint disease Diseases 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000002980 postoperative effect Effects 0.000 description 2
- 238000010146 3D printing Methods 0.000 description 1
- 206010062061 Knee deformity Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 210000000544 articulatio talocruralis Anatomy 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000000511 carpometacarpal joint Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000004394 hip joint Anatomy 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000008407 joint function Effects 0.000 description 1
- 210000000629 knee joint Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000000323 shoulder joint Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/40—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Urology & Nephrology (AREA)
- Surgery (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种以关节运动功能为核心的骨科知识图谱的构建系统,所述构建系统包括:元数据定义模块、知识获取模块、数据集构建模块和知识存储模块;所述元数据定义模块,用于获取骨科知识的元数据,对所述元数据进行定义,并根据所述定义构建规范;所述元数据包括:所述骨科知识的概念类型,所述骨科知识的关系类型和关系属性类型;所述知识获取模块,用于通过语料库获取骨科知识的原始数据;所述数据集构建模块,用于根据所述规范,利用所述原始数据构建数据集;所述知识存储模块,用于将所述元数据、规范和所述数据集存储于数据库中。该构建系统能够清楚表达“疾病‑>关节功能‑>关节解剖”的知识体系,并显著提升关节领域HIS系统的智能化程度。
Description
技术领域
本发明属于人工智能技术领域,具体地说,涉及一种以关节运动功能为核心的骨科知识图谱的构建系统。
背景技术
为了能够让医疗信息系统具有更高的智能,为医疗系统配备一个更好的知识体系是必由之路。知识图谱是知识体系的一种可行的表达方式。通常来说,知识图谱是将知识表达成为概念(或者叫做节点)和关系(或者叫做边),并将其存储起来。其他应用程序可以基于这些知识进行查询或者推理。
在分级诊疗的关节疾病的场景中,因为涉及大量运动功能和解剖概念,基层医生或者全科医生通常没有足够的医疗知识能够对问题进行分型,使得误诊率上升,患者体验下降。因此,在骨科关节临床场景中,一个好的辅助知识体系就变得非常重要,它会显著提升临床人员判断的效率和准确率。比如对于一个内翻膝畸形患者,基层医生可以通过知识图谱来了解哪些解剖组织在功能上和这种畸形的相关度更高,从而帮助他制定合理的手术规划和术后康复计划。
但如果只是简单将疾病和解剖结构联系在一起,会出现可解释性不足的情况,这是因为关节疾病通常是和关节功能的变化密切联系在一起的。因此,构建一个将“疾病->关节功能->关节解剖”表达出来的知识体系,对于提升关节领域医疗信息系统的智能化程度至关重要。
目前,已经有多种不同的方法对骨科知识进行表达,但是现有的方法都存在不同程度的弊端:
1)平面解剖图:平面解剖图是历史最悠久的传统知识表达方法。它将一个人类视角上能看到的解剖组织画在同一个图中。它的优点是容易构建,而且理解起来非常直观。解剖图可以理解成在一个二维平面上对医学知识的表达形式。
但是,平面解剖图不是面向计算机表达的。也就是说,在解剖图中,解剖组织缺少特定的编号,解剖组织的关系也没有量化。这使得各类应用程序无法直接利用平面解剖图中的知识,而只能通过人类阅读之后,再由人类进行转换。因此,这类信息不仅处理效率很低,准确性也不高。
2)三维形式呈现的解剖:随着计算机图形技术和交互技术的发展,解剖知识的表达很快从二维平面演进到三维空间的表达,并可以支持大量的数据交互,允许用户从不同的角度来观察和获取解剖知识。此外,由于三维解剖能够支持3D打印,进一步降低了知识获取的难度。
在交互性和知识的丰富程度上,三维解剖图已经远远超过了平面解剖图,但是由于它依然无法被计算机所处理,因此这种方法无法解决信息处理效率低的问题。
3)医学术语集:随着医疗信息化和计算机处理能力的发展,各类医学术语集逐渐成长,例如:UMLS、SNOMED、ICD、OMAHA等。在一些术语集(如SNOMED,OMAHA)中,各类解剖结构的概念已经得到了比较多的表达,同时这类数据库也有一定的概念之间的关系的表达。可以认为,医学术语集将医学知识的表达带入了多维时代。
在术语集中,每个术语都有特定的ID,相似的概念被归并成为一个概念,概念之间有定量的关系表达。因此,医学术语集成功地解决了平面解剖图和三维解剖图在计算机表达上的问题。但是术语集是以信息交换为核心的,使得它不是面向特定应用的。当医生想要了解为什么某个特定疾病和特定解剖组织之间有关系的时候,术语集无法给出解答。因为,当面向一个特定场景的时候,术语集中的关系不足,即术语集通常不能提供完整的解释。
4)通用医学知识图谱:医学知识图谱通常指的是在大规模的在线数据中抽取出的(实体,关系,实体)的三元组的结合。通常具备一定的临床应用场景,可以被其他的系统调用和推理。
通用医学知识图谱的概念和关系基本上都来自于自动化抽取的工作,因此在特定子领域的概念和密度不足,使得在具体的应用上,极其容易出现无法推理的问题。
综上所述,现有技术中并没有一种可数字交换、以运动能力为核心,并可应用于关节领域的骨科知识图谱或知识体系的的构建系统。
发明内容
为了克服现有技术中的缺陷,本发明提供了一种以关节运动功能为核心的骨科知识图谱的构建系统。
根据本发明的一个方面,提供一种以关节运动功能为核心的骨科知识图谱的构建系统,所述构建系统包括:元数据定义模块、知识获取模块、数据集构建模块和知识存储模块;
所述元数据定义模块,用于获取骨科知识的元数据,对所述元数据进行定义,并根据所述定义构建规范;
所述元数据包括:所述骨科知识的概念类型,所述骨科知识的关系类型和关系属性类型;
所述知识获取模块,用于通过语料库获取骨科知识的原始数据;
所述数据集构建模块,用于根据所述规范,利用所述原始数据构建数据集;
所述知识存储模块,用于将所述元数据、规范和所述数据集存储于数据库中。
根据本发明的一个具体实施方式,所述语料库包括:非数字化数据信息库、术语集、在线数据库和/或专家知识库。
根据本发明的另一个具体实施方式,当所述语料库为术语集时,
所述知识获取模块,用于通过所述术语集获取骨科知识的术语;
所述数据集构建模块,用于根据所述规范,利用所述术语构建数据集。
根据本发明的又一个具体实施方式,所述数据集包括:概念集、关系集和关系属性集。
根据本发明的又一个具体实施方式,所述数据集构建模块进一步包括:分类单元、具体概念语料集生成单元、标注单元、模型生成单元、概念识别单元和概念集生成单元;
所述分类单元,用于对关节进行分类;
所述具体概念语料集生成单元,用于在所述原始数据中,为每类关节提取一定数目的语料,形成多个具体概念语料集;
所述标注单元,用于根据所述规范,提取所述具体概念语料集中的概念,并对所述概念进行标注;
所述模型生成单元,用于采用概念抽取算法进行训练,形成机器学习模型;
所述概念识别单元,用于将所述原始数据输入所述机器学习模型,获得概念识别结果;
所述概念集生成单元,用于将所述概念识别结果中的所有概念进行组合,形成概念集。
根据本发明的又一个具体实施方式,所述数据集构建模块进一步包括:具体关系语料集生成单元、规则构建单元、抽取单元和关系集生成单元;
所述具体关系语料集生成单元,用于在所述原始数据中,根据所述元数据中的关系类型,为每种关系类型确定一定数目的语料,形成具体关系语料集;
所述规则构建单元,用于构建关系表达规则;
所述抽取单元,用于对所述原始数据进行关系抽取,将抽取出的关系按照所述关系表达规则标记为若干个三元组;
所述关系集生成单元,用于将所述若干个三元组进行集合,形成关系集。
根据本发明的又一个具体实施方式,所述数据集构建模块进一步包括:排序单元,属性生成单元、关系属性集生成单元;
所述排序单元,用于根据所述三元组出现的频率,对所述三元组进行排序,并将出现次数最多的三元组的出现次数标记为N;
所述属性生成单元,用于获取所述三元组的属性w,所述属性w等于所述三元组的出现次数除以N;
所述关系属性集生成单元,用于将若干三元组的属性w进行集合,形成关系属性集。
根据本发明的又一个具体实施方式,所述术语集包括:OMAHA和/或SNOMED。
根据本发明的又一个具体实施方式,所述概念抽取算法为:条件随机场算法。
本发明提出了一种以关节运动功能为核心的骨科知识图谱的构建系统。该构建系统:首先通过元数据定义模块对元数据进行定义,并根据所述定义构建规范;之后,在所有元数据定义完善的基础上,通过多种不同的数据来源和方法来构建具体的数据集,并最终将元数据、规范和数据集存储在某种数据库引擎中,供其他多种智能应用根据场景来使用。本发明提供的构建系统信息处理效率高,数据来源广泛、利用率高,推理顺畅。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1所示为根据本发明提供的一种以关节运动功能为核心的骨科知识图谱的构建系统的一个具体实施方式的结构示意图;
图2所示为图1所示的数据集构建模块的一个具体实施方式的结构示意图;
图3所示为图1所示的数据集构建模块的另一个具体实施方式的结构示意图;
图4所示为图1所示的数据集构建模块的又一个具体实施方式的结构示意图;
图5所示为概念类型的一个具体实施方式的分类示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
参见图1,本发明提供了一种以关节运动功能为核心的骨科知识图谱的构建系统。所述构建系统包括:元数据定义模块10、知识获取模块20、数据集构建模块30和知识存储模块40。
所述元数据定义模块10,用于获取骨科知识的元数据,对所述元数据进行定义,并根据所述定义构建规范。所述元数据包括:所述骨科知识的概念类型,所述骨科知识的关系类型和关系属性类型。
在骨科知识图谱中,每个概念(或者有时候称“实体”)都会有其类型,比如:“胫骨”是“骨骼”的一种,而“半月板”是“软骨”的一种。在本发明提供的骨科知识图谱的构建系统中,元数据定义模块10先获取骨科知识的元数据,并对所述元数据进行定义。例如:“骨骼”、“软骨”作为元数据被获取,且会被抽象为两种不同的概念类型。而“胫骨”和“半月板”只是具体的概念,而并非是概念类型。可以理解,在骨科知识图谱当中,一个具体的概念必须属于某个预定义的概念类型,即具体概念“胫骨”属于“骨骼”概念类型,具体概念“半月板”属于“软骨”概念类型。
如图5所示,本发明提供的构建系统将骨科知识图谱的概念类型分为三大类别:解剖组织类别、运动功能类别和临床所见类别。为了在骨科知识图谱的构建过程中更精细、准确性更高,在每个类别中,还可以有更详细的类目。同时,为了加快数据处理速度,提高数据处理的准确性,可以给每个概念类型一个特定的ID,如:概念类型“部位”,其ID为T01。编号方式有多种,可以根据需要选择,在此不做进一步限定。表1为概念类型和具体概念的举例说明:
表1
在表1中,T01~T09属于解剖组织类别111,T20属于运动功能类别112,T31~T33属于临床所见类别113。
在所述元数据中,除了骨科知识的概念类型,还包括骨科知识的关系类型。在本发明中,骨科知识图谱包括6种关系类型,分别是:是…子类、包含于、支持、限制、附着和相关,如表2所示。
表2
在概念类型之间建立关系类型的时候,要注意以下两点:
第一,在两个概念类型之间允许建立某种关系类型,但并不代表第一个概念类型中的所有概念与第二个概念类型中的所有概念之间都需要建立这种关系类型。例如:“T07”类型的概念和“T01”类型的概念之间允许建立R02关系;但并不意味着所有“T07”类型的概念和“T01”类型的概念之间都要建立R02关系。
第二,本发明中提到的关系类型都是有向的,即所述关系类型用于表示所述概念类型中的概念之间的有向关系。举例说明:A->B间存在关系R,和B->A间存在关系R,是两种完全不同的状态。
在关系类型定义的基础上,可以定义关系属性类型。所述关系属性类型是用于对关系类型进行附加说明。关系属性类型包括多种关系属性,通常,我们采用关系属性类型中的关系置信度来对关系类型进行附加说明。
所述关系置信度用[0,1]中的一个标量w进行表达。w值小,所述关系置信度低;w值大,则所述关系置信度高。也就是说,w值越接近0,说明该关系存在的置信度越低;相反,w值越接近1,说明该关系的置信度越高。
元数据定义模块10在对元数据进行定义后,将所有的定义组成一个规范。
所述知识获取模块20,用于通过语料库获取骨科知识的原始数据。所述语料库包括:非数字化数据信息库、术语集、在线数据库和/或专家知识库。所述非数字化数据信息库包括:教科书、文献等。所述术语集包括:OMAHA和/或SNOMED。在线数据库包括:维基百科、各种学术数据库(万方数据库、知网数据库)等。
所述数据集构建模块30,用于根据所述规范,利用上述获得的原始数据构建数据集。构建数据集的方式主要包括:直接利用术语集和/或自动化方式。
当所述语料库为术语集时,即原始数据来源于术语集时,数据集的构建相对简单,通常情况下,可以直接利用术语集中的术语。具体的,所述知识获取模块20,用于通过所述术语集获取骨科知识的术语(原始数据);所述数据集构建模块30,用于根据所述规范,利用所述术语构建数据集。
当所述原始数据来源于非术语集或者即使来源于术语集但并不是直接利用所述术语集中的术语时,构建数据集的过程就要相对复杂。与元数据对应,数据集包括:概念集、关系集和关系属性集。因此,以下以这三种数据集的构建为例进行阐述。
以构建概念集为例:
参见图2,所述数据集构建模块30进一步包括:分类单元311、具体概念语料集生成单元312、标注单元313、模型生成单元314、概念识别单元315和概念集生成单元316。
所述分类单元311,用于对关节进行分类。由于本发明是针对以关节运动功能为核心的骨科知识图谱的构建,因此,需要首先确定知识图谱所覆盖的关节。例如,可以将人体的关节分为以下类别:指间关节、踝关节、桡尺近端关节、桡腕关节、枕寰关节、腕掌关节、肩关节、髋关节、膝关节等。
所述具体概念语料集生成单元312,用于在所述原始数据中,为每类关节提取一定数目的语料,形成多个具体概念语料集。具体地,通过语料库获取原始数据(语料),这些原始数据的选择需要覆盖上述各类关节类型,并且这些原始数据的内容应当是与关节解剖、运动损伤诊断以及治疗是相关的。在这些原始数据中,为每类关节提取30条语料,形成多个具体概念语料集,即每类关节一个具体概念语料集。为每类关节提取的语料条数可根据需要进行调整,本发明中的30条是发明人经过反复研究和实验所确定的。提取条数过多,会影响数据处理速度;而条数过少,会导致后续所建模型准确度差。
所述标注单元313,用于根据所述规范,提取所述具体概念语料集中的概念,并对所述概念进行标注。例如,在具体概念语料集中有一句话:“发现前交叉韧带受到损伤”,这时,标注单元313就会在这句话的第3个字到第7个字上进行标注,将这7个字标注为“T06韧带”。标注的目标就是提示算法,哪些字的组合应当成为一个概念。
所述模型生成单元314,用于采用概念抽取算法进行训练,形成机器学习模型。在每一个具体概念语料集中都有相当数量的数据被标注,因此只需要对这些标注后的数据进行训练,就可以形成较为精确的机器学习模型。优选的,采用成熟概念抽取算法对上述数据进行训练。更为优选的,采用条件随机场(Conditional Random Field)进行数据训练,并形成机器学习模型。
所述概念识别单元315,用于将所述原始数据输入所述机器学习模型,获得概念识别结果。在形成机器模型时,用到了一定数量的语料。而在机器模型形成后,就可以对原始数据进行大规模概念识别,最终获得概念识别结果。
所述概念集生成单元316,用于将所述概念识别结果中的所有概念进行组合,形成概念集。
以构建关系集为例:
所述数据集构建模块30进一步包括:具体关系语料集生成单元321、规则构建单元322、抽取单元323和关系集生成单元324。
所述具体关系语料集生成单元321,用于在所述原始数据中,根据所述元数据中的关系类型,为每种关系类型确定一定数目的语料,形成具体关系语料集。根据R01到R06的所有关系,为每种关系确定一定数量的具体的行文样例,例如:可以是20个。所述行文样例需要在不同的语料来源中有比较均匀的分布。所述语料来源指语料库,也就是说,行为样例最好来源于不同的语料库,并在这些不同的语料库中有比较均匀的分布。
所述规则构建单元322,用于构建关系表达规则。比如,从语料库中获取到一句话:“前交叉韧带上端起自股骨外侧髁内面后部,止于胫骨髁间隆起前方的骨面。”经过标注单元313的处理,这句话可以表示为“[T06韧带]上端起自[T04骨骼起止部位],止于[T04骨骼起止部位]”。当存在其他语句的表示模式与上面那句话相同时,认为,其他语句中也表达了一种韧带和起止点的关系。此时,规则构建单元322就完成了R05关系表达规则的构建。
所述抽取单元323,用于对所述原始数据进行关系抽取,将抽取出的关系按照所述关系表达规则标记为若干个三元组。具体的,对原始数据中的每句话,均可以应用上述规则构建单元322所构建的关系表达规则,并结合前文中已经形成的概念集作为词表,抽取出关系。将抽取出的关系以及该关系所连接的两个概念记录成一个三元组,如(“前交叉韧带”,“R05”,“股骨外侧髁内面后部”)。
所述关系集生成单元324,用于将所述若干个三元组进行集合,形成关系集。
以构建关系属性集为例:
所述数据集构建模块30进一步包括:排序单元331,属性生成单元332、关系属性集生成单元333。
所述排序单元331,用于根据所述三元组出现的频率,对所述三元组进行排序,并将出现次数最多的三元组的出现次数标记为N。
所述属性生成单元332,用于获取所述三元组的属性w,所述属性w等于所述三元组的出现次数除以N。
所述关系属性集生成单元333,用于将若干三元组的属性w进行集合,形成关系属性集。
数据集构建模块30除了用于根据所述规范,利用所述原始数据构建数据集之外,还可用于对原始数据中的非法知识进行提示和去除。最终,数据集构建模块30输出的数据集是符合所述规范的知识集合,包括具体的:概念集、关系集和关系属性集。
所述知识存储模块40,用于将上述元数据、规范和所述数据集存储于数据库中。将前述内容存储至数据库系统中,即完成了整个骨科知识图谱的构建。
数据库的选择有多种,例如:关系型数据库引擎MySQL。但是为了提高检索和推理的效率,本发明优选采用图数据库引擎,如Neo4j、graphdb等。
通过本发明提供的构建系统,能够构建出清楚、完整、易推理应用的骨科知识图谱。该骨科知识图谱所表示的知识体系能够应用在教学、手术、康复等各个阶段。如:在诊断阶段,可以根据疾病和运动功能的情况,提示可能相关的相应功能解剖部位;在手术阶段,会利用上述解剖部位进行术中规划;在康复阶段,根据不同的解剖部位制定有针对性的术后康复计划。
虽然关于示例实施例及其优点已经详细说明,应当理解在不脱离本发明的精神和所附权利要求限定的保护范围的情况下,可以对这些实施例进行各种变化、替换和修改。对于其他例子,本领域的普通技术人员应当容易理解在保持本发明保护范围内的同时,工艺步骤的次序可以变化。
此外,本发明的应用范围不局限于说明书中描述的特定实施例的工艺、机构、制造、物质组成、手段、方法及步骤。从本发明的公开内容,作为本领域的普通技术人员将容易地理解,对于目前已存在或者以后即将开发出的工艺、机构、制造、物质组成、手段、方法或步骤,其中它们执行与本发明描述的对应实施例大体相同的功能或者获得大体相同的结果,依照本发明可以对它们进行应用。因此,本发明所附权利要求旨在将这些工艺、机构、制造、物质组成、手段、方法或步骤包含在其保护范围内。
Claims (9)
1.一种以关节运动功能为核心的骨科知识图谱的构建系统,其特征在于,所述构建系统包括:元数据定义模块、知识获取模块、数据集构建模块和知识存储模块;
所述元数据定义模块,用于获取骨科知识的元数据,对所述元数据进行定义,并根据所述定义构建规范;
所述元数据包括:所述骨科知识的概念类型,所述骨科知识的关系类型和关系属性类型;
所述知识获取模块,用于通过语料库获取骨科知识的原始数据;
所述数据集构建模块,用于根据所述规范,利用所述原始数据构建数据集;
所述知识存储模块,用于将所述元数据、规范和所述数据集存储于数据库中。
2.根据权利要求1所述的构建系统,其特征在于,所述语料库包括:非数字化数据信息库、术语集、在线数据库和/或专家知识库。
3.根据权利要求2所述的构建系统,其特征在于,当所述语料库为术语集时,
所述知识获取模块,用于通过所述术语集获取骨科知识的术语;
所述数据集构建模块,用于根据所述规范,利用所述术语构建数据集。
4.根据权利要求2所述的构建系统,其特征在于,所述数据集包括:概念集、关系集和关系属性集。
5.根据权利要求4所述的构建系统,其特征在于,所述数据集构建模块进一步包括:分类单元、具体概念语料集生成单元、标注单元、模型生成单元、概念识别单元和概念集生成单元;
所述分类单元,用于对关节进行分类;
所述具体概念语料集生成单元,用于在所述原始数据中,为每类关节提取一定数目的语料,形成多个具体概念语料集;
所述标注单元,用于根据所述规范,提取所述具体概念语料集中的概念,并对所述概念进行标注;
所述模型生成单元,用于采用概念抽取算法进行训练,形成机器学习模型;
所述概念识别单元,用于将所述原始数据输入所述机器学习模型,获得概念识别结果;
所述概念集生成单元,用于将所述概念识别结果中的所有概念进行组合,形成概念集。
6.根据权利要求5所述的构建系统,其特征在于,所述数据集构建模块进一步包括:具体关系语料集生成单元、规则构建单元、抽取单元和关系集生成单元;
所述具体关系语料集生成单元,用于在所述原始数据中,根据所述元数据中的关系类型,为每种关系类型确定一定数目的语料,形成具体关系语料集;
所述规则构建单元,用于构建关系表达规则;
所述抽取单元,用于对所述原始数据进行关系抽取,将抽取出的关系按照所述关系表达规则标记为若干个三元组;
所述关系集生成单元,用于将所述若干个三元组进行集合,形成关系集。
7.根据权利要求6所述的构建系统,其特征在于,所述数据集构建模块进一步包括:排序单元,属性生成单元、关系属性集生成单元;
所述排序单元,用于根据所述三元组出现的频率,对所述三元组进行排序,并将出现次数最多的三元组的出现次数标记为N;
所述属性生成单元,用于获取所述三元组的属性w,所述属性w等于所述三元组的出现次数除以N;
所述关系属性集生成单元,用于将若干三元组的属性w进行集合,形成关系属性集。
8.根据权利要求7所述的构建系统,其特征在于,所述术语集包括:OMAHA和/或SNOMED。
9.根据权利要求8所述的构建系统,其特征在于,所述概念抽取算法为:条件随机场算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010640048.4A CN111986799B (zh) | 2020-07-06 | 2020-07-06 | 一种以关节运动功能为核心的骨科知识图谱的构建系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010640048.4A CN111986799B (zh) | 2020-07-06 | 2020-07-06 | 一种以关节运动功能为核心的骨科知识图谱的构建系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111986799A true CN111986799A (zh) | 2020-11-24 |
CN111986799B CN111986799B (zh) | 2024-06-04 |
Family
ID=73438353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010640048.4A Active CN111986799B (zh) | 2020-07-06 | 2020-07-06 | 一种以关节运动功能为核心的骨科知识图谱的构建系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111986799B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114064611A (zh) * | 2021-11-18 | 2022-02-18 | 中冶赛迪重庆信息技术有限公司 | 一种元数据可复用的数据建模方法及系统 |
CN114998816A (zh) * | 2022-08-08 | 2022-09-02 | 深圳市指南针医疗科技有限公司 | 基于骨骼ai视频的病例改进方法、装置及存储介质 |
CN117727448A (zh) * | 2024-02-06 | 2024-03-19 | 四川省医学科学院·四川省人民医院 | 一种基于医联体的压力性损伤智能决策防治系统 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108733708A (zh) * | 2017-04-21 | 2018-11-02 | 国家计算机网络与信息安全管理中心 | 用于知识管理的方法、装置及计算机存储介质 |
CN109271530A (zh) * | 2018-10-17 | 2019-01-25 | 长沙瀚云信息科技有限公司 | 一种疾病知识图谱构建方法和平台系统、设备、存储介质 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN109559822A (zh) * | 2018-11-12 | 2019-04-02 | 平安科技(深圳)有限公司 | 智能初诊方法、装置、计算机设备及存储介质 |
CN109684485A (zh) * | 2018-12-25 | 2019-04-26 | 福州大学 | 一种基于swrl的任意规则推理引擎设计方法 |
CN109903848A (zh) * | 2019-03-04 | 2019-06-18 | 北京大学人民医院(北京大学第二临床医学院) | 关节周围骨折临床智能决策支持系统 |
CN110059195A (zh) * | 2019-04-10 | 2019-07-26 | 华侨大学 | 一种基于lis的医学检验知识图谱构建方法 |
CN110222201A (zh) * | 2019-06-26 | 2019-09-10 | 中国医学科学院医学信息研究所 | 一种专病知识图谱构建方法及装置 |
CN110704631A (zh) * | 2019-08-16 | 2020-01-17 | 北京紫冬认知科技有限公司 | 医疗知识图谱的构建方法及装置 |
CN110929040A (zh) * | 2019-10-30 | 2020-03-27 | 清华大学 | 针对特定医疗领域的知识图谱构建方法及装置 |
CN110968650A (zh) * | 2019-10-30 | 2020-04-07 | 清华大学 | 基于医生协助的医疗领域知识图谱构建方法 |
CN110990579A (zh) * | 2019-10-30 | 2020-04-10 | 清华大学 | 跨语言的医学知识图谱构建方法、装置与电子设备 |
CN111159365A (zh) * | 2019-11-26 | 2020-05-15 | 国网湖南省电力有限公司 | 调度模型本体智能问答系统的实现方法、系统及存储介质 |
CN111177322A (zh) * | 2019-12-30 | 2020-05-19 | 成都数之联科技有限公司 | 一种领域知识图谱的本体模型构建方法 |
-
2020
- 2020-07-06 CN CN202010640048.4A patent/CN111986799B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108733708A (zh) * | 2017-04-21 | 2018-11-02 | 国家计算机网络与信息安全管理中心 | 用于知识管理的方法、装置及计算机存储介质 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN109271530A (zh) * | 2018-10-17 | 2019-01-25 | 长沙瀚云信息科技有限公司 | 一种疾病知识图谱构建方法和平台系统、设备、存储介质 |
CN109559822A (zh) * | 2018-11-12 | 2019-04-02 | 平安科技(深圳)有限公司 | 智能初诊方法、装置、计算机设备及存储介质 |
CN109684485A (zh) * | 2018-12-25 | 2019-04-26 | 福州大学 | 一种基于swrl的任意规则推理引擎设计方法 |
CN109903848A (zh) * | 2019-03-04 | 2019-06-18 | 北京大学人民医院(北京大学第二临床医学院) | 关节周围骨折临床智能决策支持系统 |
CN110059195A (zh) * | 2019-04-10 | 2019-07-26 | 华侨大学 | 一种基于lis的医学检验知识图谱构建方法 |
CN110222201A (zh) * | 2019-06-26 | 2019-09-10 | 中国医学科学院医学信息研究所 | 一种专病知识图谱构建方法及装置 |
CN110704631A (zh) * | 2019-08-16 | 2020-01-17 | 北京紫冬认知科技有限公司 | 医疗知识图谱的构建方法及装置 |
CN110929040A (zh) * | 2019-10-30 | 2020-03-27 | 清华大学 | 针对特定医疗领域的知识图谱构建方法及装置 |
CN110968650A (zh) * | 2019-10-30 | 2020-04-07 | 清华大学 | 基于医生协助的医疗领域知识图谱构建方法 |
CN110990579A (zh) * | 2019-10-30 | 2020-04-10 | 清华大学 | 跨语言的医学知识图谱构建方法、装置与电子设备 |
CN111159365A (zh) * | 2019-11-26 | 2020-05-15 | 国网湖南省电力有限公司 | 调度模型本体智能问答系统的实现方法、系统及存储介质 |
CN111177322A (zh) * | 2019-12-30 | 2020-05-19 | 成都数之联科技有限公司 | 一种领域知识图谱的本体模型构建方法 |
Non-Patent Citations (11)
Title |
---|
孙郑煜;鄂海红;宋美娜;王宁;: "基于大数据技术的医学知识图谱构建方法", 软件, no. 01, 15 January 2020 (2020-01-15), pages 13 - 17 * |
孙郑煜;鄂海红;宋美娜;王宁;: "基于大数据技术的医学知识图谱构建方法", 软件, no. 01, pages 13 - 17 * |
张晶: "知识地图构建与应用研究", 《中国博士学位论文全文数据库-信息科技辑》, no. 06, 15 June 2017 (2017-06-15), pages 143 - 5 * |
昝红英;窦华溢;贾玉祥;关同峰;奥德玛;张坤丽;穗志方;: "基于多来源文本的中文医学知识图谱的构建", 郑州大学学报(理学版), no. 02, 6 January 2020 (2020-01-06), pages 45 - 51 * |
昝红英;窦华溢;贾玉祥;关同峰;奥德玛;张坤丽;穗志方;: "基于多来源文本的中文医学知识图谱的构建", 郑州大学学报(理学版), no. 02, pages 45 - 51 * |
李景 等: "标准文献语料库构建研究", 《图书馆理论与实践》, no. 12, 30 December 2013 (2013-12-30), pages 41 - 44 * |
盛明;张勇;邢春晓;: "基于医在回路的医疗健康知识图谱系统架构的研究", 安徽大学学报(自然科学版), no. 06, 15 November 2019 (2019-11-15), pages 48 - 54 * |
盛明;张勇;邢春晓;: "基于医在回路的医疗健康知识图谱系统架构的研究", 安徽大学学报(自然科学版), no. 06, pages 48 - 54 * |
谢先章: "面向中医骨科问诊的疾病知识图谱构建技术研究", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》, no. 4, pages 056 - 578 * |
韩普;马健;张嘉明;刘亦卓;: "基于多数据源融合的医疗知识图谱框架构建研究", 现代情报, no. 06, 30 May 2019 (2019-05-30), pages 81 - 90 * |
韩普;马健;张嘉明;刘亦卓;: "基于多数据源融合的医疗知识图谱框架构建研究", 现代情报, no. 06, pages 81 - 90 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114064611A (zh) * | 2021-11-18 | 2022-02-18 | 中冶赛迪重庆信息技术有限公司 | 一种元数据可复用的数据建模方法及系统 |
CN114998816A (zh) * | 2022-08-08 | 2022-09-02 | 深圳市指南针医疗科技有限公司 | 基于骨骼ai视频的病例改进方法、装置及存储介质 |
CN117727448A (zh) * | 2024-02-06 | 2024-03-19 | 四川省医学科学院·四川省人民医院 | 一种基于医联体的压力性损伤智能决策防治系统 |
CN117727448B (zh) * | 2024-02-06 | 2024-04-19 | 四川省医学科学院·四川省人民医院 | 一种基于医联体的压力性损伤智能决策防治系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111986799B (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022170768A1 (zh) | 单髁关节图像的处理方法、装置、设备和存储介质 | |
CN111986799B (zh) | 一种以关节运动功能为核心的骨科知识图谱的构建系统 | |
US11938030B1 (en) | Artificial neural network for aligning joint replacement implants | |
CN107145511A (zh) | 基于医学文本信息的结构化医学数据库生成方法及系统 | |
Sagheb et al. | Use of natural language processing algorithms to identify common data elements in operative notes for knee arthroplasty | |
Rouzrokh et al. | Applying deep learning to establish a total hip arthroplasty radiography registry: a stepwise approach | |
Ogiela et al. | Image languages in intelligent radiological palm diagnostics | |
Lacoste et al. | Medical-image retrieval based on knowledge-assisted text and image indexing | |
CN109585014B (zh) | 一种决策结果确定方法、装置、设备及可读存储介质 | |
de Herrera et al. | Comparing fusion techniques for the ImageCLEF 2013 medical case retrieval task | |
CN111984694A (zh) | 一种骨科搜索引擎系统 | |
Huang et al. | OVQA: A clinically generated visual question answering dataset | |
CN115831380A (zh) | 一种基于医疗知识图谱的智能医疗数据管理系统及方法 | |
Wyles et al. | External validation of natural language processing algorithms to extract common data elements in THA operative notes | |
US11322229B2 (en) | System and method of documenting clinical trials | |
Sayadi et al. | Harnessing the power of artificial intelligence to teach cleft lip surgery | |
Shi et al. | The application of three-dimensional technologies in the improvement of orthopedic surgery training and medical education quality: a comparative bibliometrics analysis | |
CN111128388A (zh) | 一种值域数据匹配方法、装置及相关产品 | |
CN110610766A (zh) | 基于症状特征权重推导疾病概率的装置和存储介质 | |
CN117216578A (zh) | 基于元学习的可自定义标签深度学习模型构建方法及系统 | |
CN116737945B (zh) | 一种患者emr知识图谱映射方法 | |
CN111986800B (zh) | 一种以关节运动功能为核心的骨科知识图谱的构建方法 | |
Banerjee et al. | Accessing and representing knowledge in the medical field: visual and lexical modalities | |
CN113793668A (zh) | 基于人工智能的症状标准化方法、装置、电子设备及介质 | |
CN114840676B (zh) | 用于对关于骨科的文本分类的方法、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |