CN107085655B - 基于属性的约束概念格的中医数据处理方法及系统 - Google Patents
基于属性的约束概念格的中医数据处理方法及系统 Download PDFInfo
- Publication number
- CN107085655B CN107085655B CN201710224831.0A CN201710224831A CN107085655B CN 107085655 B CN107085655 B CN 107085655B CN 201710224831 A CN201710224831 A CN 201710224831A CN 107085655 B CN107085655 B CN 107085655B
- Authority
- CN
- China
- Prior art keywords
- attribute
- attributes
- constraint
- node
- concept lattice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Abstract
本发明提供了一种基于属性的约束概念格的中医数据处理方法及系统,方法为:获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,相似度模型是基于中医数据建立的;将待诊断病历数据中的证型所对应的属性进行中文分词、词性标注,得到单值形式背景;通过基于属性的概念格构造方式中的多个不同的约束条件,对单值形式背景中的属性进行处理,形成约束概念格;将约束概念格中的属性节点与相似度模型中的属性节点进行比较,得到诊断证型。本发明通过相似度模型与约束概念格中的各个属性节点进行匹配,最后得出诊断结果。提高了节点匹配准确度,减少匹配时间,提高了用户体验。
Description
技术领域
本发明涉及中医数据处理领域,尤其涉及基于属性的约束概念格的中医数据处理方法及系统。
背景技术
计算机的应用已经渗入到社会进步和人类生活中的各个角落,但计算机在医疗领域的的应用还主要停留在电子数据处理和医学信息管理阶段,如计算机辅助教学、医院财务管理系统、电子病历等。而投入实际运用的智能辅助诊断和治疗系统还只是处在研发阶段。
医学诊断是根据病人的病史、症状等信息得出病因的一个过程。推理是诊断过程中的一个重要步骤。在专家给病人诊断的过程中,专家主要是依靠自己已拥有的经验来解决问题。医学专家常常不能定量的描述出他们是怎么得到的诊断的结果的,这意味着很难建立一个准确的模型。计算机也很难去模拟专家的诊断方法来给病人诊断病情。
现有技术中,基于知识,采用约束概念格表示和处理具体的医学病例,其最大的优点在于动态知识库,即通过增量学习而不断增加只是的案例库,且现有的约束概念格是基于对象的渐进式构造的,由于待诊断病历数据中包含大量的对象,对每个对象与约束条件进行匹配,计算量大,匹配时间长,进而生成最终的诊断证型时间过程,影响用户体验。
发明内容
针对上述技术问题,本发明提供一种基于属性的约束概念格的中医数据处理方法及系统,采用了以患者的待诊断病历数据作为主要诊断依据,通过相似度模型与约束概念格中的各个属性节点(属性节点的对应症状属性)进行匹配,最后得出诊断结果。其中,约束概念格的构造是基于属性的渐进式构造,在生成新的属性节点时大大减少判断是否满足约束条件的操作,因此能有效的减少建格时间及匹配时间,提高用户体验。
为解决上述技术问题,本发明提供的技术方案是:
第一方面,本发明提供一种基于属性的约束概念格的中医数据处理方法,包括:
步骤S1,获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,所述相似度模型是基于中医数据建立的;
步骤S2,将所述待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;
步骤S3,对所述分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,所述单值形式背景中包括至少一个属性;
步骤S4,通过基于属性的概念格构造方式中的多个不同的约束条件,对所述单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;
步骤S5,将所述约束概念格中的属性节点与所述相似度模型中的属性节点进行比较,得到诊断证型,完成对所述待诊断病历数据的辅助诊断。
本发明提供的基于属性的约束概念格的中医数据处理方法,其技术方案为:获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,所述相似度模型是基于中医数据建立的;将所述待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;对所述分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,所述单值形式背景中包括至少一个属性;通过基于属性的概念格构造方式中的多个不同的约束条件,对所述单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;将所述约束概念格中的属性节点与所述相似度模型中的属性节点进行比较,得到诊断证型,完成对所述待诊断病历数据的辅助诊断。
本发明提供的基于属性的约束概念格的中医数据处理方法,采用了以患者的待诊断病历数据作为主要诊断依据,通过相似度模型与约束概念格中的各个属性节点(属性节点的对应症状属性)进行匹配,最后得出诊断结果。其中,约束概念格的构造是基于属性的渐进式构造,在生成新的属性节点时大大减少判断是否满足约束条件的操作,因此能有效的减少建格时间及匹配时间,提高用户体验。
进一步地,建立所述相似度模型,具体为:
获得中医数据,所述中医数据为原始中医诊断文本数据,所述原始中医诊断文本数据形成多值形式背景;
对所述多值形式背景中的证型所对应的属性进行中文分词,得到分词后的中医词汇;
对所述分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,形成单值形式背景,所述单值形式背景中包括多个属性;
获得多个不同的约束条件,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,形成约束概念格;
根据所述多个属性节点,形成相似度模型。
进一步地,所述多个不同的约束条件包括单约束、与约束、或约束、非约束、与非约束和或非约束。
进一步地,当所述约束条件为单约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
将所述单值形式背景中的属性与所述单约束中的属性对应的对象进行比较,得到有交集的属性;
将所述有交集的属性按照基于属性的概念格构造方式依次在所述单约束的属性基础上添加,得到多个属性节点。
进一步地,当所述约束条件为与约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获得所述与约束中的第一属性和第二属性;
将所述第二属性按照基于属性的概念格构造方式在所述第一属性的基础上进行属性添加,得到多个属性节点。
进一步地,当所述约束条件为或约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获得所述或约束中的第三属性和第四属性;
判断所述单值形式背景中与所述第三属性产生交集的属性,及与所述第四属性产生交集的属性;
依次按照基于属性的概念格建造方式在所述第三属性的基础上添加所述与所述第三属性产生交集的属性,形成第一属性节点;
依次按照基于属性的概念格建造方式在所述第四属性的基础上添加所述与所述第四属性产生交集的属性,形成第二属性节点;
对所述第一属性节点对应的对象和所述第二属性节点对应的对象,进行比较判断,得到多个属性节点:
当所述第一属性节点对应的对象存在于所述第二属性节点对应的对象中,则将所述第一属性节点对应的对象生成的属性节点与所述第二属性节点对应的对象生成的属性节点作为一个属性节点;
当所述第一属性节点对应的对象不存在于所述第二属性节点对应的对象中,将所述第一属性节点对应的对象和所述第二属性节点对应的对象分别生成的属性节点作为两个属性节点。
进一步地,当所述约束条件为非约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获取所述单值形式背景中与所述非约束中的属性不同的所有属性;
按照基于属性的概念格构造方式在所述非约束中的属性基础上添加所述与所述非约束中的属性不同的所有属性,得到多个属性节点。
进一步地,当所述约束条件为与非约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获取所述与非约束中的第五属性和第六属性;
获取所述单值形式背景中与所述第五属性和第六属性不同的所有属性;
按照基于属性的概念格构造方式在所述第五属性基础上添加所述与所述第五属性不同的所有属性,形成第三属性节点;
按照基于属性的概念格构造方式在所述第六属性基础上添加所述与所述第六属性不同的所有属性,形成第四属性节点;
对所述第三属性节点对应的对象和所述第四属性节点对应的对象,进行比较判断,得到多个属性节点:
当所述第三属性节点对应的对象存在于所述第四属性节点对应的对象中,则将所述第三属性节点对应的对象生成的属性节点与所述第四属性节点对应的对象生成的属性节点作为一个属性节点;
当所述第三属性节点对应的对象不存在于所述第四属性节点对应的对象中,将所述第三属性节点对应的对象和所述第四属性节点对应的对象分别生成的属性节点作为两个属性节点。
进一步地,当所述约束条件为或非约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获取所述或非约束中的第七属性和第八属性;
获取所述单值形式背景中与所述第七属性不同的所有属性,或与所述单值形式背景中与所述第八属性不同的所有属性;
按照基于属性的概念格构造方式在所述第七属性基础上添加所述与所述第七属性不同的所有属性,形成第五属性节点;
或按照基于属性的概念格构造方式在所述第八属性基础上添加所述与所述第八属性不同的所有属性,形成第六属性节点;
对所述第五属性节点对应的对象和所述第六属性节点对应的对象,进行比较判断,得到多个属性节点:
当所述第五属性节点对应的对象存在于所述第六属性节点对应的对象中,则将所述第五属性节点对应的对象生成的属性节点与所述第六属性节点对应的对象生成的属性节点作为一个属性节点;
当所述第五属性节点对应的对象不存在于所述第六属性节点对应的对象中,将所述第五属性节点对应的对象和所述第六属性节点对应的对象分别生成的属性节点作为两个属性节点。
第二方面,本发明提供了一种基于属性的约束概念格的中医数据处理系统,包括:
数据及模型获取模块,用于获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,所述相似度模型是基于中医数据建立的;
分词模块,用于将所述待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;
单值形式背景生成模块,用于对所述分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,所述单值形式背景中包括至少一个属性;
约束概念格生成模块,用于通过基于属性的概念格构造方式中的多个不同的约束条件,对所述单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;
诊断证型生成模块,用于将所述约束概念格中的属性节点与所述相似度模型中的属性节点进行比较,得到诊断证型,完成对所述待诊断病历数据的辅助诊断。
本发明提供的基于属性的约束概念格的中医数据处理系统,其技术方案为:通过数据及模型获取模块,获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,所述相似度模型是基于中医数据建立的;通过分词模块,将所述待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;通过单值形式背景生成模块,对所述分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,所述单值形式背景中包括至少一个属性;通过约束概念格生成模块,通过基于属性的概念格构造方式中的多个不同的约束条件,对所述单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;通过诊断证型生成模块,将所述约束概念格中的属性节点与所述相似度模型中的属性节点进行比较,得到诊断证型,完成对所述待诊断病历数据的辅助诊断。
本发明提供的基于属性的约束概念格的中医数据处理系统,采用了以患者的待诊断病历数据作为主要诊断依据,通过相似度模型与约束概念格中的各个属性节点(属性节点的对应症状属性)进行匹配,最后得出诊断结果。其中,约束概念格的构造是基于属性的渐进式构造,在生成新的属性节点时大大减少判断是否满足约束条件的操作,因此能有效的减少建格时间及匹配时间,提高用户体验。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。
图1示出了本发明实施例所提供的一种基于属性的约束概念格的中医数据处理方法的流程图;
图2示出了本发明实施例所提供的一种基于属性的约束概念格的中医数据处理系统的示意图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。
实施例一
图1示出了本发明实施例所提供的一种基于属性的约束概念格的中医数据处理方法的流程图;如图1所示,实施例一提供的一种基于属性的约束概念格的中医数据处理方法,包括:
步骤S1,获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,相似度模型是基于中医数据建立的;
步骤S2,将待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;
步骤S3,对分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,单值形式背景中包括至少一个属性;
步骤S4,通过基于属性的概念格构造方式中的多个不同的约束条件,对单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;
步骤S5,将约束概念格中的属性节点与相似度模型中的属性节点进行比较,得到诊断证型,完成对待诊断病历数据的辅助诊断。
本发明提供的基于属性的约束概念格的中医数据处理方法,其技术方案为:获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,相似度模型是基于中医数据建立的;将待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;对分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,单值形式背景中包括至少一个属性;通过基于属性的概念格构造方式中的多个不同的约束条件,对单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;将约束概念格中的属性节点与相似度模型中的属性节点进行比较,得到诊断证型,完成对待诊断病历数据的辅助诊断。
本发明提供的基于属性的约束概念格的中医数据处理方法,采用了以患者的待诊断病历数据作为主要诊断依据,通过相似度模型与约束概念格中的各个属性节点(属性节点的对应症状属性)进行匹配,最后得出诊断结果。其中,约束概念格的构造是基于属性的渐进式构造,在生成新的属性节点时大大减少判断是否满足约束条件的操作,因此能有效的减少建格时间及匹配时间,提高用户体验。
其中,属性表示中医数据中的主证、舌象等,可用于作为诊断病情的依据。
其中,将约束概念格中的属性节点与相似度模型中的属性节点进行比较是基于权重的方式进行比较,权重越大表示得到的诊断证型越准确。
优选地,本发明中对分词后的中医词汇进行词性标注,采用改进的二阶隐马尔可夫模型,放宽原有的隐马尔可夫模型,考虑更多的情况,将中医词汇标注的更准确,进而使属性分类更准确,最后可直接使得到的诊断证型更准确。
改进的二阶隐马尔可夫模型的核心思想是时刻t的状态转移不仅与时刻t-1有关,还与时刻t+1有关;在时刻t输出观测值的概率,不仅取决于时刻t的状态,还与时刻t+1所处的状态和观测值有关,因此将t-1、t和t+1时刻的状态都作为参考进行模型的建立,使相似模型中的属性节点更准确。
具体地,建立相似度模型,具体为:
获得中医数据,中医数据为原始中医诊断文本数据,原始中医诊断文本数据形成多值形式背景;
对多值形式背景中的证型所对应的属性进行中文分词,得到分词后的中医词汇;
对分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,形成单值形式背景,单值形式背景中包括多个属性;
获得多个不同的约束条件,通过基于属性的概念格构造方式对单值形式背景及约束条件中的属性进行处理,得到多个属性节点,形成约束概念格;
根据多个属性节点,形成相似度模型。
本发明中的相似度模型是基于约束概念格建立的,通过大量的中医数据建立起的相似度模型,对待诊断病历数据对应的约束概念格中的属性进行对应的匹配,找到待诊断病历数据中属性对应的相似或一致的属性,进而可得到诊断证型。相似度模型根据待诊断病历数据不断进行更新,保证相似模型的准确性及稳定性。
本发明中约束概念格的构造是基于属性的渐进式构造,相同的属性代表词性相同的同一类中医词汇,在生成新的属性节点时大大减少判断是否满足约束条件的操作,因此能有效的减少建格时间及匹配时间,提高用户体验。
优选地,多个不同的约束条件包括单约束、与约束、或约束、非约束、与非约束和或非约束。
约束条件划分的越多,将属性划分的越细致,保证属性节点的准确性,进而使最终生成的诊断证型更准确。
具体地,当约束条件为单约束,通过基于属性的概念格构造方式对单值形式背景及约束条件中的属性进行处理,得到多个属性节点,具体为:
将单值形式背景中的属性与单约束中的属性对应的对象进行比较,得到有交集的属性;
将有交集的属性按照基于属性的概念格构造方式依次在单约束的属性基础上添加,得到多个属性节点。
当约束条件为单约束时,例如,当约束条件为单约束A时,首先判断单值形式背景中与单约束的属性对应的对象产生交集的属性(假设为属性B和属性D),然后按照基于属性的概念格构造方式依次在单约束的属性基础上添加属性B和属性D。这样就得到哦了多个节点。
具体地,当约束条件为与约束,通过基于属性的概念格构造方式对单值形式背景及约束条件中的属性进行处理,得到多个属性节点,具体为:
获得与约束中的第一属性和第二属性;
将第二属性按照基于属性的概念格构造方式在第一属性的基础上进行属性添加,得到多个属性节点。
当约束条件为与约束,例如,属性A且属性B时,直接按照基于属性的概念格构造方式在属性A的基础上添加属性B,或在属性B的基础上添加属性A,得到多个属性节点。
具体地,当约束条件为或约束,通过基于属性的概念格构造方式对单值形式背景及约束条件中的属性进行处理,得到多个属性节点,具体为:
获得或约束中的第三属性和第四属性;
判断单值形式背景中与第三属性产生交集的属性,及与第四属性产生交集的属性;
依次按照基于属性的概念格建造方式在第三属性的基础上添加与第三属性产生交集的属性,形成第一属性节点;
依次按照基于属性的概念格建造方式在第四属性的基础上添加与第四属性产生交集的属性,形成第二属性节点;
对第一属性节点对应的对象和第二属性节点对应的对象,进行比较判断,得到多个属性节点:
当第一属性节点对应的对象存在于第二属性节点对应的对象中,则将第一属性节点对应的对象生成的属性节点与第二属性节点对应的对象生成的属性节点作为一个属性节点;
当第一属性节点对应的对象不存在于第二属性节点对应的对象中,将第一属性节点对应的对象和第二属性节点对应的对象分别生成的属性节点作为两个属性节点。
当约束条件为或约束,例如,属性A或者属性B时,按照以下步骤:
判断单值形式背景中与属性A产生交集的属性,假设分别为属性B和属性D,与属性B产生交集的属性,分别为属性D和属性E。
依次按照基于属性的概念格建造方式在属性A的基础上添加属性B和属性D,且在属性B的基础上添加属性D和属性E。
其中,当按照基于属性的概念格的建造方式构造属性B时,如果产生的新节点的对象存在于构造属性A时的新节点的对象,则不产生该节点,即构造属性B时的属性D与构造属性A时的属性D相同,则不产生构造属性B时对应的属性D的属性节点。若构造属性B时的属性D与构造属性A时的属性D不相同,则分别生成新的属性节点,避免重复节点的产生,影响匹配的准确度。
具体地,当约束条件为非约束,通过基于属性的概念格构造方式对单值形式背景及约束条件中的属性进行处理,得到多个属性节点,具体为:
获取单值形式背景中与非约束中的属性不同的所有属性;
按照基于属性的概念格构造方式在非约束中的属性基础上添加与非约束中的属性不同的所有属性,得到多个属性节点。
当约束条件为非约束时,例如,非属性A时,首先判断单值形式背景中除去属性A以外的所有属性,然后按照基于属性的概念格构造方式依次添加除属性A以外的全部属性。如果新产生的节点的对象属于属性A对应的对象的子集,则不产生该节点,避免重复节点的产生,影响匹配的准确度。
具体地,当约束条件为与非约束,通过基于属性的概念格构造方式对单值形式背景及约束条件中的属性进行处理,得到多个属性节点,具体为:
获取与非约束中的第五属性和第六属性;
获取单值形式背景中与第五属性和第六属性不同的所有属性;
按照基于属性的概念格构造方式在第五属性基础上添加与第五属性不同的所有属性,形成第三属性节点;
按照基于属性的概念格构造方式在第六属性基础上添加与第六属性不同的所有属性,形成第四属性节点;
对第三属性节点对应的对象和第四属性节点对应的对象,进行比较判断,得到多个属性节点:
当第三属性节点对应的对象存在于第四属性节点对应的对象中,则将第三属性节点对应的对象生成的属性节点与第四属性节点对应的对象生成的属性节点作为一个属性节点;
当第三属性节点对应的对象不存在于第四属性节点对应的对象中,将第三属性节点对应的对象和第四属性节点对应的对象分别生成的属性节点作为两个属性节点。
当约束条件为与非约束时,例如,非属性A且非属性B时,首先判断单值形式背景中除去属性A和属性B以外的所有属性,然后按照基于属性的概念格构造方式依次添加除属性A和属性B以外的全部属性。如果新产生的节点的对象属于属性A或者属性B对应的对象的子集,则不产生该节点。避免重复节点的产生,影响匹配的准确度。
具体地,当约束条件为或非约束,通过基于属性的概念格构造方式对单值形式背景及约束条件中的属性进行处理,得到多个属性节点,具体为:
获取或非约束中的第七属性和第八属性;
获取单值形式背景中与第七属性不同的所有属性,或与单值形式背景中与第八属性不同的所有属性;
按照基于属性的概念格构造方式在第七属性基础上添加与第七属性不同的所有属性,形成第五属性节点;
或按照基于属性的概念格构造方式在第八属性基础上添加与第八属性不同的所有属性,形成第六属性节点;
对第五属性节点对应的对象和第六属性节点对应的对象,进行比较判断,得到多个属性节点:
当第五属性节点对应的对象存在于第六属性节点对应的对象中,则将第五属性节点对应的对象生成的属性节点与第六属性节点对应的对象生成的属性节点作为一个属性节点;
当第五属性节点对应的对象不存在于第六属性节点对应的对象中,将第五属性节点对应的对象和第六属性节点对应的对象分别生成的属性节点作为两个属性节点。
当约束条件为或非约束时,例如,非属性A或非属性B时,首先判断单值形式背景中除去属性A或除去属性B以外的所有属性,然后按照基于属性的概念格构造方式依次添加除属性A或属性B以外所有属性。如果新产生的节点的对象属于属性A且属性B对应的对象的子集,则不产生该节点。避免重复节点的产生,影响匹配的准确度。
图2示出了本发明实施例所提供的一种基于属性的约束概念格的中医数据处理系统的示意图,参见图2,本发明提供了一种基于属性的约束概念格的中医数据处理系统10,包括:
数据及模型获取模块101,用于获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,相似度模型是基于中医数据建立的;
分词模块102,用于将待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;
单值形式背景生成模块103,用于对分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,单值形式背景中包括至少一个属性;
约束概念格生成模块104,用于通过基于属性的概念格构造方式中的多个不同的约束条件,对单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;
诊断证型生成模块105,用于将约束概念格中的属性节点与相似度模型中的属性节点进行比较,得到诊断证型,完成对待诊断病历数据的辅助诊断。
本发明提供的基于属性的约束概念格的中医数据处理系统10,其技术方案为:通过数据及模型获取模块101,获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,相似度模型是基于中医数据建立的;通过分词模块102,将待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;通过单值形式背景生成模块103,对分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,单值形式背景中包括至少一个属性;通过约束概念格生成模块104,通过基于属性的概念格构造方式中的多个不同的约束条件,对单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;通过诊断证型生成模块105,将约束概念格中的属性节点与相似度模型中的属性节点进行比较,得到诊断证型,完成对待诊断病历数据的辅助诊断。
本发明提供的基于属性的约束概念格的中医数据处理系统10,采用了以患者的待诊断病历数据作为主要诊断依据,通过相似度模型与约束概念格中的各个属性节点(属性节点的对应症状属性)进行匹配,最后得出诊断结果。其中,约束概念格的构造是基于属性的渐进式构造,在生成新的属性节点时大大减少判断是否满足约束条件的操作,因此能有效的减少建格时间及匹配时间,提高用户体验。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
Claims (8)
1.一种基于属性的约束概念格的中医数据处理方法,其特征在于,包括:
步骤S1,获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,所述相似度模型是基于中医数据建立的;
建立所述相似度模型,具体为:
获得中医数据,所述中医数据为原始中医诊断文本数据,所述原始中医诊断文本数据形成多值形式背景;
对所述多值形式背景中的证型所对应的属性进行中文分词,得到分词后的中医词汇;
对所述分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,形成单值形式背景,所述单值形式背景中包括多个属性;
获得多个不同的约束条件,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,形成约束概念格;
根据所述多个属性节点,形成相似度模型;
步骤S2,将所述待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;
步骤S3,对所述分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,所述单值形式背景中包括至少一个属性;
步骤S4,通过基于属性的概念格构造方式中的多个不同的约束条件,对所述单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;
所述多个不同的约束条件包括单约束、与约束、或约束、非约束、与非约束和或非约束;
步骤S5,将所述约束概念格中的属性节点与所述相似度模型中的属性节点进行比较,得到诊断证型,完成对所述待诊断病历数据的辅助诊断。
2.根据权利要求1所述的基于属性的约束概念格的中医数据处理方法,其特征在于,
当所述约束条件为单约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
将所述单值形式背景中的属性与所述单约束中的属性对应的对象进行比较,得到有交集的属性;
将所述有交集的属性按照基于属性的概念格构造方式依次在所述单约束的属性基础上添加,得到多个属性节点。
3.根据权利要求1所述的基于属性的约束概念格的中医数据处理方法,其特征在于,
当所述约束条件为与约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获得所述与约束中的第一属性和第二属性;
将所述第二属性按照基于属性的概念格构造方式在所述第一属性的基础上进行属性添加,得到多个属性节点。
4.根据权利要求1所述的基于属性的约束概念格的中医数据处理方法,其特征在于,
当所述约束条件为或约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获得所述或约束中的第三属性和第四属性;
判断所述单值形式背景中与所述第三属性产生交集的属性,及与所述第四属性产生交集的属性;
依次按照基于属性的概念格建造方式在所述第三属性的基础上添加所述与所述第三属性产生交集的属性,形成第一属性节点;
依次按照基于属性的概念格建造方式在所述第四属性的基础上添加所述与所述第四属性产生交集的属性,形成第二属性节点;
对所述第一属性节点对应的对象和所述第二属性节点对应的对象,进行比较判断,得到多个属性节点:
当所述第一属性节点对应的对象存在于所述第二属性节点对应的对象中,则将所述第一属性节点对应的对象生成的属性节点与所述第二属性节点对应的对象生成的属性节点作为一个属性节点;
当所述第一属性节点对应的对象不存在于所述第二属性节点对应的对象中,将所述第一属性节点对应的对象和所述第二属性节点对应的对象分别生成的属性节点作为两个属性节点。
5.根据权利要求1所述的基于属性的约束概念格的中医数据处理方法,其特征在于,
当所述约束条件为非约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获取所述单值形式背景中与所述非约束中的属性不同的所有属性;
按照基于属性的概念格构造方式在所述非约束中的属性基础上添加所述与所述非约束中的属性不同的所有属性,得到多个属性节点。
6.根据权利要求1所述的基于属性的约束概念格的中医数据处理方法,其特征在于,
当所述约束条件为与非约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获取所述与非约束中的第五属性和第六属性;
获取所述单值形式背景中与所述第五属性和第六属性不同的所有属性;
按照基于属性的概念格构造方式在所述第五属性基础上添加所述与所述第五属性不同的所有属性,形成第三属性节点;
按照基于属性的概念格构造方式在所述第六属性基础上添加所述与所述第六属性不同的所有属性,形成第四属性节点;
对所述第三属性节点对应的对象和所述第四属性节点对应的对象,进行比较判断,得到多个属性节点:
当所述第三属性节点对应的对象存在于所述第四属性节点对应的对象中,则将所述第三属性节点对应的对象生成的属性节点与所述第四属性节点对应的对象生成的属性节点作为一个属性节点;
当所述第三属性节点对应的对象不存在于所述第四属性节点对应的对象中,将所述第三属性节点对应的对象和所述第四属性节点对应的对象分别生成的属性节点作为两个属性节点。
7.根据权利要求1所述的基于属性的约束概念格的中医数据处理方法,其特征在于,
当所述约束条件为或非约束,通过基于属性的概念格构造方式对所述单值形式背景及所述约束条件中的属性进行处理,得到多个属性节点,具体为:
获取所述或非约束中的第七属性和第八属性;
获取所述单值形式背景中与所述第七属性不同的所有属性,或与所述单值形式背景中与所述第八属性不同的所有属性;
按照基于属性的概念格构造方式在所述第七属性基础上添加所述与所述第七属性不同的所有属性,形成第五属性节点;
或按照基于属性的概念格构造方式在所述第八属性基础上添加所述与所述第八属性不同的所有属性,形成第六属性节点;
对所述第五属性节点对应的对象和所述第六属性节点对应的对象,进行比较判断,得到多个属性节点:
当所述第五属性节点对应的对象存在于所述第六属性节点对应的对象中,则将所述第五属性节点对应的对象生成的属性节点与所述第六属性节点对应的对象生成的属性节点作为一个属性节点;
当所述第五属性节点对应的对象不存在于所述第六属性节点对应的对象中,将所述第五属性节点对应的对象和所述第六属性节点对应的对象分别生成的属性节点作为两个属性节点。
8.一种基于属性的约束概念格的中医数据处理系统,其特征在于,包括:
数据及模型获取模块,用于获得待诊断病历数据和预先基于属性的概念格构造的相似度模型,所述相似度模型是基于中医数据建立的;
分词模块,用于将所述待诊断病历数据中的证型所对应的属性进行中文分词,得到分词后的中医词汇;
单值形式背景生成模块,用于对所述分词后的中医词汇进行词性标注,将词性相同的一类词汇归为一类,得到单值形式背景,所述单值形式背景中包括至少一个属性;
约束概念格生成模块,用于通过基于属性的概念格构造方式中的多个不同的约束条件,对所述单值形式背景中的属性进行处理,得到属性节点,形成约束概念格;
诊断证型生成模块,用于将所述约束概念格中的属性节点与所述相似度模型中的属性节点进行比较,得到诊断证型,完成对所述待诊断病历数据的辅助诊断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710224831.0A CN107085655B (zh) | 2017-04-07 | 2017-04-07 | 基于属性的约束概念格的中医数据处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710224831.0A CN107085655B (zh) | 2017-04-07 | 2017-04-07 | 基于属性的约束概念格的中医数据处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107085655A CN107085655A (zh) | 2017-08-22 |
CN107085655B true CN107085655B (zh) | 2020-11-24 |
Family
ID=59614736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710224831.0A Active CN107085655B (zh) | 2017-04-07 | 2017-04-07 | 基于属性的约束概念格的中医数据处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107085655B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109637605B (zh) * | 2018-12-11 | 2022-05-10 | 北京大学 | 电子病历结构化方法及计算机可读存储介质 |
CN111354465B (zh) * | 2020-02-26 | 2023-02-28 | 深圳市凯利博实业有限公司 | 一种基于体温计和区块链的健康分析方法及系统 |
CN114049956B (zh) * | 2022-01-12 | 2022-06-24 | 山东建筑大学 | 基于属性导出模糊对象语言概念格的疾病诊断预测系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004070624A1 (en) * | 2003-02-06 | 2004-08-19 | Email Analysis Pty Ltd | Information classification and retrieval using concept lattices |
CN101286158A (zh) * | 2008-01-25 | 2008-10-15 | 太原科技大学 | 基于约束概念格的天体光谱局部偏离数据挖掘系统和方法 |
CN201788510U (zh) * | 2010-07-13 | 2011-04-06 | 南通大学 | 融合粒子群与可拓粗糙格的动态电子病历协同挖掘系统 |
CN103123607A (zh) * | 2013-03-08 | 2013-05-29 | 扬州大学 | 一种基于形式概念分析的软件回归测试方法 |
CN105893350A (zh) * | 2016-03-31 | 2016-08-24 | 重庆大学 | 一种电子商务中文本评论质量的评价方法与系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576888B (zh) * | 2008-05-07 | 2011-05-11 | 香港理工大学 | 中文信息检索中基于结构约束的索引词权重计算方法 |
CN101639826B (zh) * | 2009-09-01 | 2012-07-04 | 西北大学 | 一种基于中文句式模板变换的文本隐藏方法 |
CN101727487A (zh) * | 2009-12-04 | 2010-06-09 | 中国人民解放军信息工程大学 | 一种面向网络评论的观点主题识别方法和系统 |
CN103092994B (zh) * | 2013-02-20 | 2016-10-05 | 苏州思方信息科技有限公司 | 基于信息概念格矫正的svm文本自动分类方法及其系统 |
CN106484863A (zh) * | 2016-10-10 | 2017-03-08 | 中南大学 | 基于属性构建概念格的增加算法 |
-
2017
- 2017-04-07 CN CN201710224831.0A patent/CN107085655B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004070624A1 (en) * | 2003-02-06 | 2004-08-19 | Email Analysis Pty Ltd | Information classification and retrieval using concept lattices |
CN101286158A (zh) * | 2008-01-25 | 2008-10-15 | 太原科技大学 | 基于约束概念格的天体光谱局部偏离数据挖掘系统和方法 |
CN201788510U (zh) * | 2010-07-13 | 2011-04-06 | 南通大学 | 融合粒子群与可拓粗糙格的动态电子病历协同挖掘系统 |
CN103123607A (zh) * | 2013-03-08 | 2013-05-29 | 扬州大学 | 一种基于形式概念分析的软件回归测试方法 |
CN105893350A (zh) * | 2016-03-31 | 2016-08-24 | 重庆大学 | 一种电子商务中文本评论质量的评价方法与系统 |
Non-Patent Citations (2)
Title |
---|
Rough set-based approaches for discretization:a compact review;Rahman Ali等;《Springer Science+ Business Media Dordrecht 2015》;20150204;第44卷;第235-263页 * |
基于属性的概念格渐进式构造原理与算法;智慧来等;《计算机工程与应用》;20120911;第48卷(第26期);第17-21页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107085655A (zh) | 2017-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929420B2 (en) | Structured report data from a medical text report | |
CN110491465B (zh) | 基于深度学习的疾病分类编码方法、系统、设备及介质 | |
Shin et al. | Classification of radiology reports using neural attention models | |
CN109036577B (zh) | 糖尿病并发症分析方法及装置 | |
CN113241135A (zh) | 一种基于多模态融合的疾病风险预测方法和系统 | |
CN112100369A (zh) | 结合语义的网络故障关联规则生成方法和网络故障检测方法 | |
CN107085655B (zh) | 基于属性的约束概念格的中医数据处理方法及系统 | |
CN113094477B (zh) | 数据结构化方法、装置、计算机设备及存储介质 | |
WO2019114618A1 (zh) | 一种深度神经网络训练方法、装置及计算机设备 | |
CN111540470B (zh) | 一种基于bert迁移学习的社交网络抑郁倾向检测模型及其训练方法 | |
Mahajan | Applications of pattern recognition algorithm in health and medicine | |
CN110889505B (zh) | 一种图文序列匹配的跨媒体综合推理方法和系统 | |
CN112820400B (zh) | 基于医疗知识图谱知识推理的疾病诊断装置、设备 | |
Leng et al. | Bi-level artificial intelligence model for risk classification of acute respiratory diseases based on Chinese clinical data | |
CN114191665A (zh) | 机械通气过程中人机异步现象的分类方法和分类装置 | |
CN116719840A (zh) | 一种基于病历后结构化处理的医疗信息推送方法 | |
Ganesan et al. | Elderly people activity recognition in smart grid monitoring environment | |
CN116313141A (zh) | 一种基于知识图谱的不明原因发热智能问诊方法 | |
Mahammad et al. | Machine Learning Approach to Predict Asthma Prevalence with Decision Trees | |
CN114429822A (zh) | 病历质检方法、装置和存储介质 | |
CN113658688A (zh) | 基于无分词深度学习的临床决策支持方法 | |
AU2021100217A4 (en) | Traditional Chinese Medicine Data Processing Method and System Combining Attribute-based Constrained Concept Lattice | |
CN111966780A (zh) | 一种基于词向量建模和信息检索的回顾性队列选择方法及装置 | |
US20230317279A1 (en) | Method and system for medical diagnosis using graph embeddings | |
CN117473400B (zh) | 基于多通道层级变换网络结构的设备故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |