CN109686443B - 一种临床诊断辅助决策系统和医学知识图谱积累方式 - Google Patents
一种临床诊断辅助决策系统和医学知识图谱积累方式 Download PDFInfo
- Publication number
- CN109686443B CN109686443B CN201811602217.4A CN201811602217A CN109686443B CN 109686443 B CN109686443 B CN 109686443B CN 201811602217 A CN201811602217 A CN 201811602217A CN 109686443 B CN109686443 B CN 109686443B
- Authority
- CN
- China
- Prior art keywords
- knowledge
- logic
- data
- core
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种临床诊断辅助决策系统和医学知识图谱积累方式,包括第一知识提取和第二知识提取、数据标准化和第一标准词库、逻辑命题公式转换、逻辑推理及验证、关键字或问题转换、第三标准词库,本发明涉及一种临床诊断辅助决策系统和医学知识图谱积累方式,本发明所采用的临床医学知识图谱是从一个非常可靠的初始小知识数据集,在临床问诊和辅诊的过程中以离线和在线方式逐步增长积累起来的,其每一个新知识数据的追加都是在机器逻辑推理证明或人类专家认可的基础上进行的,以此,来解决可靠数据的来源问题和增长积累问题,这个可靠的核心知识数据库是整个系统的根本,以此来辅助知识数据的互通一致性。
Description
技术领域
本发明属于临床诊断和医学知识图谱积技术领域,具体为一种临床诊断辅助决策系统和医学知识图谱积累方式。
背景技术
在临床医学诊断辅助系统的历史中,前期大多以专家系统的方式实现,当代的主要实现方式是以机器学习和数据挖掘技术处理大量病历的方式实现和以医学知识图谱推理为基础的实现,这些方法的缺点如下:
1、专家系统的建立是依靠一组总结的规则,一个专家系统强于另一个的主要因素,就是这些规则的完备性、正确性、和表达能力,尽管规则可以被机器校验,但规则的扩充往往无法机器完成,在实践中,专家系统的弱点表现为规则不足、规则涵盖的范围不够、规则扩充困难、和外部知识源交互困难等,虽然专家系统可以进行逻辑推理,但经常表现为答非所问。
2、当代机器学习和数据挖掘技术利用大数据可以很好地从数据中提取规律,在很多场合达到超越人类的表现,然而,在医学临床应用中,数据存在不可靠性和不完整性,因此导致统计学中的辛普森悖论现象,和机器学习与数据挖掘中常出现的不平衡数据现象,例如,很多辅助诊断系统依靠电子病历数据,从病历数据中寻找症状和疾病之间的关系,然而,门诊中或者治好的病例往往在病历记录中没有体现,或者病人转科室转院造成病历记录不完善,或者并发症造成病历记录混杂,等等,这些实际医疗服务中的问题造成实际有效病历的数量及其稀少,尽管病历总数貌似庞大,而且,电子病历在历史上就是非结构化的,单纯依靠自然语言处理技术处理很难达到完全的准确,即使今年结构化电子病历成为主流,但因为医学诊断的复杂性,其结构化往往不彻底,因此,数据依赖是该方向的无法提供可靠辅助诊断的根源。
依靠专业医学知识图谱进行推理可以给出一些专业性高的结果,但由于现存医学知识图谱的不完善性,其结果往往和专家系统的结果类似,并且,当代知识图谱推理采用的经常是机器学习技术,在一定范围内保证某个比例的准确,但无法保证诊断的可靠性。
通过以上方法和技术手段建立的智能问诊系统在问诊的效率和结论准确度上难以平衡,为保证准确性,不得不问诊很多问题,但后台的数据未必能支持大量有效问题;如果收敛问诊过程,准确性会显著降低,况且,上述方法由于数据的限制,所能支撑的准确性上限本身就不高。
总结以上存在方法,数据的不完善、不正确,知识图谱的不完善,规则的扩展性限制导致可靠的高效的临床医学辅助诊断系统不能快速、准确、可解释地提供智能诊断服务。
发明内容:
本发明的目的就在于为了解决上述问题而提供一种临床诊断辅助决策系统和医学知识图谱积累方式,解决了现有的临床诊断辅助决策系统和医学知识图谱积累方式存在方法,数据的不完善、不正确,知识图谱的不完善的问题。
为了解决上述问题,本发明提供了一种技术方案:
一种临床诊断辅助决策系统,包括知识提取、核心知识库、关键字或问题转换、逻辑推理器、逻辑表达式转换器、数据标准化及同义词库生成和标准词库。
作为优选,所述知识提取包括第一知识提取、第二知识提取和第三知识提取,所述第一知识提取与第二知识提取和第三知识提取的知识提取目的不同,所述第一知识提取的目的是从第一核心知识库中提取和任何从初始主述以及启发式问诊输入关键字相关的数据及其关系,所述第一知识提取是简单地仅提取相关知识,而所述第二知识提取和第三知识提取的目的是遍历所有核心知识库中的知识。
作为优选,所述核心知识库包括第一核心知识库、第二核心知识库和第三核心知识库,所述核心知识库的表现形式可以是任意组织存储形式,所述核心知识库里包含常识、已证明正确、或被专家认可的知识数据。
作为优选,所述关键字或问题转换包括第一关键字或问题转换和第二关键字或问题转换,所述第一关键字或问题转换和第二关键字或问题转换是第一逻辑表达式转换器和第三逻辑表达式转换器的逆过程。
作为优选,所述逻辑推理器包括第一逻辑推理器、第二逻辑表达式转换器和第二逻辑推理器,所述逻辑推理器从第一逻辑表达式转换器得到的一系列逻辑命题公式本身和表达式间是否有逻辑冲突、缺失、冗余等错误。
作为优选,所述逻辑表达式转换器包括第一逻辑表达式转换器和第三逻辑表达式转换器,所述第一逻辑表达式转换器和第三逻辑表达式转换器是第一关键字或问题转换和第二关键字或问题转换的逆过程,即从词库向核心知识库依照标准对照逻辑命题公式中的标准词语转换,同时,将词语间的逻辑关系符号从逻辑关系向自然语言转换。
作为优选,所述逻辑推理及验证包括第一逻辑推理器、第二逻辑表达式转换器和第二逻辑推理器,其目的在于发现从所述第一逻辑表达式转换器得到的一系列逻辑命题公式本身和表达式间是否有逻辑冲突、缺失、冗余等错误。
作为优选,所述数据标准化及同义词库生成介绍了数据标准化,所述数据标准化是能否进行数理逻辑推理和验证的重要部件。
作为优选,所述标准词库包括第一标准词库、第二标准词库和第三标准词库,所述标准词库是核心知识库和外界知识源之间的沟通桥梁,所述标准词库的建立是以国际国内通用的医学词汇表、中文医学主题词库、中文疾病词库等标准为初始标准词汇库,所述标准词库在基于自然语言处理的同义词提取中采用自然语言处理技术从更广泛的文本中提取同义词近义词,在所述基于自然语言处理的同义词提取的过程中存在同义近义辨识,所述同义近义辨识中采用人和机器同时辨识的策略,提取的词汇会加入所述第三标准词库。在所述第三标准词库至词典反复循环中,丰富标准词库,所述标准词库中核心词汇为其他标准提供的基本入口,通过所述第三标准词库至词典和文本至基于自然语言处理的同义词提取得到的同义近义词,追加至其他标准提供的基本入口之后。
一种医学知识图谱积累方式,所述方式为:
1)患者提供初始主述给第一知识提取和外部知识搜索器,在知识提取的三个源中,核心知识库优先级高于其他知识库,所述其他知识库优先级高于病历和医书等更普通的知识源,当高优先级的知识源含有知识数据时,不对低优先级知识源做查询检索,其中包括高质量医学文本,高质量医学文本通过数据挖掘工具对常识和专家知识进行提取,所述外部知识搜索器可以是现有的知识库知识图谱搜索工具,或现有的能挖掘知识的文本挖掘和数据挖掘技术,所述第一知识提取在第一标准词库的帮助下从第一核心知识库中提取含有主述关键字的知识交与第一逻辑表达式转换器,外部知识搜索器从知识图或其他知识库以及其他数据源包含医书、病历、医书等中提取相关知识,经过数据标准化转化为标准词库中包含的标准文字;
2)然后转交第一逻辑表达式转换器,优质正确病历具有一定的校正能力,所述优质正确病历存在结构化、序列化,因为以上得到多组知识数据和关系,转换器将数据和关系转换为一组逻辑命题公式,第一逻辑推理器对这组逻辑命题公式进行逻辑运算,同时进行第二逻辑验证,所述第二逻辑验证验证第二是否有逻辑问题存在利用是否有其他关联知识进行数据修复修补,这种运算可以是可满足性问题,即SAT或satisfiablity的求解器SATsolver,也可以是更复杂的问题用其他数理逻辑证明工具theorem prover,取决于应用场景的不同,本发明以SAT问题求解为例,所述第一逻辑推理器在进行满足性问题求解后的结果可能是:逻辑命题公式不满足、需要对某些逻辑变量置位、个别命题公式没必要多余,只要产生任何一个结果,都是做有逻辑问题存在第一是否有逻辑问题存在的和第三是否有逻辑问题存在问题,如是,则对应地在第一是否有逻辑问题存在,可以找出逻辑冲突点或最小冲突逻辑子句、删除冗余命题公式、找出需要置位逻辑变量,在第一是否有逻辑问题存在中判定有数据和关系修正修补需要后,由第一关键字或问题转换将需要置位的逻辑变量向数据转换,将需要确认的逻辑关系向自然语言表达的问题转换,基于规则的查找匹配的取词较为重要,亦即产生新的关键字或问题,经由启发式问诊向搜索者查问;
3)所述第一追加或修改核心数据和第二追加或修改核心数据辅助查询,同时,新的关键字或问题需求会发往对应专家进行第一专家证实和第二专家证实,一旦专家证实答案,新的数据和关系会被加入核心知识库作为补充,启发式问诊每次询问搜索者,都会得到新的关键字和关系,然后重复上述过程并在第一逻辑推理器中替换被修改过的逻辑变量和逻辑关系,或补充新的逻辑变量和逻辑关系,直到第一是否有逻辑问题存在判定全部数据和关系无进一步问题,在诊断结果中,首先得到的是一组逻辑命题公式通常对于SAT问题,考虑合取范式,在诊断结果将逻辑符号和表达式通过标准词库翻译后,即为诊断结果。
本发明的有益效果是:本发明涉及一种临床诊断辅助决策系统和医学知识图谱积累方式,本发明所采用的临床医学知识图谱是从一个非常可靠的初始小知识数据集,在临床问诊和辅诊的过程中以离线和在线方式逐步增长积累起来的,其每一个新知识数据的追加都是在机器逻辑推理证明或人类专家认可的基础上进行的,以此,来解决可靠数据的来源问题和增长积累问题,这个可靠的核心知识数据库是整个系统的根本,该知识数据库的能力决定了诊断问诊的能力,此外,针对医学同义词构建了一个同义词积累校验系统,以此来辅助知识数据的互通一致性。
本发明的诊断问诊过程是一个逻辑推理和知识数据整合的过程,在机器逻辑推理的过程中,从病人主诉的症状提取相关知识数据,以机器逻辑推理去掉不适合该病人情况的核心知识数据,同时从外部知识源中搜索相关知识条目并启发式地向病人问诊更多潜在的主述,以便提取核心知识库中的其他间接关联的数据,问诊诊断结束于机器逻辑推理发现数据和逻辑关系互相满足没有未知和冲突的知识数据,这个过程可以保证诊断实在可靠的核心知识数据支撑下,同时以更合乎逻辑的方式迅速将问诊诊断过程收敛。
本发明对知识数据反复以在线和离线方式,同时采用专家证实和经验证实,保证核心知识数据库的可靠性,验证的过程亦采用机器逻辑验证技术手段,以降低专家人工证实的工作量,和所需临床病历数据的数量。
附图说明:
为了易于说明,本发明由下述的具体实施及附图作以详细描述。
图1为本发明的问诊诊断辅助系统总体构成及流程示意图;
图2为本发明的核心知识库生成和离线数据积累方法示意图;
图3为本发明的核心知识库病历校正示意图;
图4为本发明的核心词库生成和积累示意图。
图中:101、患者;102、初始主述;103、启发式问诊;104、第一知识提取;105、第一核心知识库;106、第一追加或修改核心数据;107、第一专家证实;108、第一关键字或问题转换;109、第一是否有逻辑问题存在;110、第一逻辑推理器;111、第一逻辑表达式转换器;112、外部知识搜索器;113、数据标准化;114、第一标准词库;115、其他知识库;116、病历、医书等;117、诊断结果。
201、高质量医学文本;202、常识;203、专家知识;204、数据挖掘工具;205、第二核心知识库;206、第二知识提取;207、第二逻辑表达式转换器;208、第二逻辑验证;209、第二是否有逻辑问题存在;210、数据修复修补;211、是否有其他关联知识。
301、优质正确病历;302、结构化、序列化;303、第二标准词库;304、第三知识提取;305、第三逻辑表达式转换器;306、第二逻辑推理器;307、第三是否有逻辑问题存在;308、第二关键字或问题转换;309、第二专家证实;310、第二追加或修改核心数据;311、第三核心知识库。
401、第三标准词库;402、取词;403、基于规则的查找匹配;404、词典;405、其他标准;406、文本;407、基于自然语言处理的同义词提取;408、同义近义辨识。
具体实施方式:
如图1-4所示,本具体实施方式采用以下技术方案:
一种临床诊断辅助决策系统,包括知识提取、核心知识库、关键字或问题转换、逻辑推理器、逻辑表达式转换器、数据标准化113及同义词库生成和标准词库。
其中,所述知识提取包括第一知识提取104、第二知识提取206和第三知识提取304,所述第一知识提取104与第二知识提取206和第三知识提取304的知识提取目的不同,所述第一知识提取104的目的是从第一核心知识库105中提取和任何从初始主述102以及启发式问诊103输入关键字相关的数据及其关系,所述第一知识提取104是简单地仅提取相关知识,而所述第二知识提取206和第三知识提取304的目的是遍历所有核心知识库中的知识。
其中,所述核心知识库包括第一核心知识库105、第二核心知识库205和第三核心知识库311,所述核心知识库的表现形式可以是任意组织存储形式,所述核心知识库里包含常识202、已证明正确、或被专家认可的知识数据。
其中,所述关键字或问题转换包括第一关键字或问题转换108和第二关键字或问题转换308,所述第一关键字或问题转换108和第二关键字或问题转换308是第一逻辑表达式转换器111和第三逻辑表达式转换器305的逆过程。
其中,所述逻辑推理器包括第一逻辑推理器110、第二逻辑表达式转换器207和第二逻辑推理器306,所述逻辑推理器从第一逻辑表达式转换器111得到的一系列逻辑命题公式本身和表达式间是否有逻辑冲突、缺失、冗余等错误。
其中,所述逻辑表达式转换器包括第一逻辑表达式转换器111和第三逻辑表达式转换器305,所述第一逻辑表达式转换器111和第三逻辑表达式转换器305是第一关键字或问题转换108和第二关键字或问题转换308的逆过程,即从词库向核心知识库依照标准对照逻辑命题公式中的标准词语转换,同时,将词语间的逻辑关系符号从逻辑关系向自然语言转换。
其中,所述逻辑推理及验证包括第一逻辑推理器110、第二逻辑表达式转换器207和第二逻辑推理器306,其目的在于发现从所述第一逻辑表达式转换器111得到的一系列逻辑命题公式本身和表达式间是否有逻辑冲突、缺失、冗余等错误。
其中,所述数据标准化113及同义词库生成介绍了数据标准化113,所述数据标准化113是能否进行数理逻辑推理和验证的重要部件。
其中,所述标准词库包括第一标准词库114、第二标准词库303和第三标准词库401,所述标准词库是核心知识库和外界知识源之间的沟通桥梁,所述标准词库的建立是以国际国内通用的医学词汇表、中文医学主题词库、中文疾病词库等标准为初始标准词汇库,所述标准词库在基于自然语言处理的同义词提取407中采用自然语言处理技术从更广泛的文本406中提取同义词近义词,在所述基于自然语言处理的同义词提取407的过程中存在同义近义辨识408,所述同义近义辨识408中采用人和机器同时辨识的策略,提取的词汇会加入所述第三标准词库401。在所述第三标准词库401至词典404反复循环中,丰富标准词库,所述标准词库中核心词汇为其他标准405提供的基本入口,通过所述第三标准词库401至词典404和文本406至基于自然语言处理的同义词提取407得到的同义近义词,追加至其他标准405提供的基本入口之后。
一种医学知识图谱积累方式,所述方式为:
1)患者101提供初始主述102给第一知识提取104和外部知识搜索器112,在知识提取的三个源中,核心知识库优先级高于其他知识库115,所述其他知识库115优先级高于病历和医书等更普通的知识源,当高优先级的知识源含有知识数据时,不对低优先级知识源做查询检索,其中包括高质量医学文本201,高质量医学文本201通过数据挖掘工具204对常识202和专家知识203进行提取,所述外部知识搜索器112可以是现有的知识库知识图谱搜索工具,或现有的能挖掘知识的文本406挖掘和数据挖掘技术,所述第一知识提取104在第一标准词库114的帮助下从第一核心知识库105中提取含有主述关键字的知识交与第一逻辑表达式转换器111,外部知识搜索器112从知识图或其他知识库115以及其他数据源包含医书、病历、医书等116中提取相关知识,经过数据标准化113转化为标准词库中包含的标准文字;
2)然后转交第一逻辑表达式转换器111,优质正确病历301具有一定的校正能力,所述优质正确病历301存在结构化、序列化302,因为以上得到多组知识数据和关系,转换器将数据和关系转换为一组逻辑命题公式,第一逻辑推理器110对这组逻辑命题公式进行逻辑运算,同时进行第二逻辑验证208,所述第二逻辑验证208验证第二是否有逻辑问题存在209利用是否有其他关联知识211进行数据修复修补210,这种运算可以是可满足性问题,即SAT或satisfiablity的求解器SAT solver,也可以是更复杂的问题用其他数理逻辑证明工具theorem prover,取决于应用场景的不同,本发明以SAT问题求解为例,所述第一逻辑推理器110在进行满足性问题求解后的结果可能是:逻辑命题公式不满足、需要对某些逻辑变量置位、个别命题公式没必要多余,只要产生任何一个结果,都是做有逻辑问题存在第一是否有逻辑问题存在109的和第三是否有逻辑问题存在307问题,如是,则对应地在第一是否有逻辑问题存在109,可以找出逻辑冲突点或最小冲突逻辑子句、删除冗余命题公式、找出需要置位逻辑变量,在第一是否有逻辑问题存在109中判定有数据和关系修正修补需要后,由第一关键字或问题转换108将需要置位的逻辑变量向数据转换,将需要确认的逻辑关系向自然语言表达的问题转换,基于规则的查找匹配403的取词402较为重要,亦即产生新的关键字或问题,经由启发式问诊103向搜索者查问;
3)所述第一追加或修改核心数据106和第二追加或修改核心数据310辅助查询,同时,新的关键字或问题需求会发往对应专家进行第一专家证实107和第二专家证实309,一旦专家证实答案,新的数据和关系会被加入核心知识库作为补充,启发式问诊103每次询问搜索者,都会得到新的关键字和关系,然后重复上述过程并在第一逻辑推理器110中替换被修改过的逻辑变量和逻辑关系,或补充新的逻辑变量和逻辑关系,直到第一是否有逻辑问题存在109判定全部数据和关系无进一步问题,在诊断结果117中,首先得到的是一组逻辑命题公式通常对于SAT问题,考虑合取范式,在诊断结果117将逻辑符号和表达式通过标准词库翻译后,即为诊断结果117。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点,本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内,本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (9)
1.一种临床诊断辅助决策系统,其特征在于,包括知识提取、核心知识库、关键字或问题转换、逻辑推理器、逻辑表达式转换器、数据标准化(113)及同义词库生成和标准词库;
该系统工作原理:患者(101)提供初始主述信息(102)给知识提取和外部知识搜索器(112);在知识提取的三个源中,核心知识库优先级高于其他知识库,其他知识库优先级高于病历和医书等更普通的知识源;当高优先级的知识源含有知识数据时,不对低优先级知识源做查询检索;外部知识搜索器(112)是现有的知识库知识图谱搜索工具,或现有的能挖掘知识的文本挖掘和数据挖掘技术;知识提取在标准词库的帮助下从核心知识库中提取含有主述关键字的知识交与逻辑表达式转换器;外部知识搜索器(112)从知识图或知识库以及其他数据源包含医书、病历中提取相关知识,经过数据标准化(113)转化为标准词库中包含的标准文字,然后转交逻辑表达式转换器;
因为以上得到多组知识数据和关系,转换器将数据和关系转换为一组逻辑命题公式;逻辑推理器在进行满足性问题求解后的结果是:逻辑命题公式不满足、需要对某些逻辑变量置位、个别命题公式没必要多余;只要产生任何一个结果,都是做有逻辑问题存在;如是,则找出逻辑冲突点或最小冲突逻辑子句、删除冗余命题公式、找出需要置位逻辑变量;判定有数据和关系修正修补需要后,由关键字或问题转换将需要置位的逻辑变量向数据转换,将需要确认的逻辑关系向自然语言表达的问题转换,亦即产生新的关键字和问题,经由启发式问诊(103)向搜索者查问;同时,新的关键字和问题需求会发往对应专家进行证实(107);一旦专家证实答案,新的数据和关系会被加入核心知识库作为补充;启发式问诊(103)每次询问搜索者,都会得到新的关键字和关系,然后重复上述过程并在逻辑推理器中替换被修改过的逻辑变量和逻辑关系,或补充新的逻辑变量和逻辑关系,直到判定全部数据和关系无进一步问题;在诊断结果(117)中,首先得到的是一组逻辑命题公式,在诊断结果(117)将逻辑符号和表达式通过标准词库翻译后,即为诊断结果。
2.根据权利要求1所述的一种临床诊断辅助决策系统,其特征在于:所述知识提取包括第一知识提取(104)、第二知识提取(206)和第三知识提取(304),所述第一知识提取(104)与第二知识提取(206)和第三知识提取(304)的知识提取目的不同,所述第一知识提取(104)的目的是从第一核心知识库(105)中提取和任何从初始主述(102)以及启发式问诊(103)输入关键字相关的数据及其关系,所述第一知识提取(104)是简单地仅提取相关知识,而所述第二知识提取(206)和第三知识提取(304)的目的是遍历所有核心知识库中的知识。
3.根据权利要求1所述的一种临床诊断辅助决策系统,其特征在于:所述核心知识库包括第一核心知识库(105)、第二核心知识库(205)和第三核心知识库(311),所述核心知识库的表现形式是任意组织存储形式,所述核心知识库里包含常识(202)、已证明正确、或被专家认可的知识数据。
4.根据权利要求1所述的一种临床诊断辅助决策系统,其特征在于:所述关键字或问题转换包括第一关键字或问题转换(108)和第二关键字或问题转换(308),所述第一关键字或问题转换(108)和第二关键字或问题转换(308)是第一逻辑表达式转换器(111)和第三逻辑表达式转换器(305)的逆过程。
5.根据权利要求1所述的一种临床诊断辅助决策系统,其特征在于:所述逻辑推理器包括第一逻辑推理器(110)、第二逻辑表达式转换器(207)和第二逻辑推理器(306),所述逻辑推理器从第一逻辑表达式转换器(111)得到的一系列逻辑命题公式本身和表达式间是否有逻辑冲突、缺失、冗余等错误。
6.根据权利要求1所述的一种临床诊断辅助决策系统,其特征在于:所述逻辑表达式转换器包括第一逻辑表达式转换器(111)和第三逻辑表达式转换器(305),所述第一逻辑表达式转换器(111)和第三逻辑表达式转换器(305)是第一关键字或问题转换(108)和第二关键字或问题转换(308)的逆过程,即从词库向核心知识库依照标准对照逻辑命题公式中的标准词语转换,同时,将词语间的逻辑关系符号从逻辑关系向自然语言转换。
7.根据权利要求1所述的一种临床诊断辅助决策系统,其特征在于:所述逻辑推理及验证包括第一逻辑推理器(110)、第二逻辑表达式转换器(207)和第二逻辑推理器(306),其目的在于发现从所述第一逻辑表达式转换器(111)得到的一系列逻辑命题公式本身和表达式间是否有逻辑冲突、缺失、冗余错误。
8.根据权利要求1所述的一种临床诊断辅助决策系统,其特征在于:所述标准词库包括第一标准词库(114)、第二标准词库(303)和第三标准词库(401),所述标准词库是核心知识库和外界知识源之间的沟通桥梁,所述标准词库的建立是以国际国内通用的医学词汇表、中文医学主题词库、中文疾病词库标准为初始标准词汇库,所述标准词库在基于自然语言处理的同义词提取(407)中采用自然语言处理技术从更广泛的文本(406)中提取同义词近义词,在所述基于自然语言处理的同义词提取(407)的过程中存在同义近义辨识(408),所述同义近义辨识(408)中采用人和机器同时辨识的策略,提取的词汇会加入所述第三标准词库(401),在所述第三标准词库(401)至词典(404)反复循环中,丰富标准词库,所述标准词库中核心词汇为中文医学主题词CMESH、中文疾病名称编码ICD10、中文MeDRA、其他标准(405)提供的基本入口,通过所述第三标准词库(401)至词典(404)和文本(406)至基于自然语言处理的同义词提取(407)得到的同义近义词,追加至中文医学主题词CMESH、中文疾病名称编码ICD10、中文MeDRA、其他标准(405)提供的基本入口之后。
9.一种医学知识图谱积累方式,其特征在于:
1)、患者(101)提供初始主述(102)给第一知识提取(104)和外部知识搜索器(112),在知识提取的三个源中,核心知识库优先级高于其他知识库(115),所述其他知识库(115)优先级高于病历和医书更普通的知识源,当高优先级的知识源含有知识数据时,不对低优先级知识源做查询检索,其中包括高质量医学文本(201),高质量医学文本(201)通过数据挖掘工具(204)对常识(202)和专家知识(203)进行提取,所述外部知识搜索器(112)是现有的知识库知识图谱搜索工具,或现有的能挖掘知识的文本(406)挖掘和数据挖掘技术,所述第一知识提取(104)在第一标准词库(114)的帮助下从第一核心知识库(105)中提取含有主述关键字的知识交与第一逻辑表达式转换器(111),外部知识搜索器(112)从知识图或其他知识库(115)以及其他数据源包含医书、病历、医书等(116)中提取相关知识,经过数据标准化(113)转化为标准词库中包含的标准文字;
2)、然后转交第一逻辑表达式转换器(111),优质正确病历(301)具有一定的校正能力,所述优质正确病历(301)存在结构化、序列化(302),因为以上得到多组知识数据和关系,转换器将数据和关系转换为一组逻辑命题公式,第一逻辑推理器(110)对这组逻辑命题公式进行逻辑运算,同时进行第二逻辑验证(208),所述第二逻辑验证(208)验证第二是否有逻辑问题存在(209)利用是否有其他关联知识(211)进行数据修复修补(210),这种运算是可满足性问题,即SAT或satisfiablity的求解器SATsolver,或是更复杂的问题用其他数理逻辑证明工具theoremprover,取决于应用场景的不同,本发明以SAT问题求解为例,所述第一逻辑推理器(110)在进行满足性问题求解后的结果是:逻辑命题公式不满足、需要对某些逻辑变量置位、个别命题公式没必要多余,只要产生任何一个结果,都视作有逻辑问题存在第一是否有逻辑问题存在(109)的和第三是否有逻辑问题存在(307)问题,如是,则对应地在第一是否有逻辑问题存在(109),找出逻辑冲突点或最小冲突逻辑子句、删除冗余命题公式、找出需要置位逻辑变量,在第一是否有逻辑问题存在(109)中判定有数据和关系修正修补需要后,由第一关键字或问题转换(108)将需要置位的逻辑变量向数据转换,将需要确认的逻辑关系向自然语言表达的问题转换,基于规则的查找匹配403的取词402较为重要,亦即产生新的关键字或问题,经由启发式问诊(103)向搜索者查问;
3)、所述第一追加或修改核心数据(106)和第二追加或修改核心数据(310)辅助查询,同时,新的关键字或问题需求会发往对应专家进行第一专家证实(107)和第二专家证实(309),一旦专家证实答案,新的数据和关系会被加入核心知识库作为补充,启发式问诊(103)每次询问搜索者,都会得到新的关键字和关系,然后重复上述过程并在第一逻辑推理器(110)中替换被修改过的逻辑变量和逻辑关系,或补充新的逻辑变量和逻辑关系,直到第一是否有逻辑问题存在(109)判定全部数据和关系无进一步问题,在诊断结果(117)中,首先得到的是一组逻辑命题公式,在诊断结果(117)将逻辑符号和表达式通过标准词库翻译后,即为诊断结果(117)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811602217.4A CN109686443B (zh) | 2018-12-26 | 2018-12-26 | 一种临床诊断辅助决策系统和医学知识图谱积累方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811602217.4A CN109686443B (zh) | 2018-12-26 | 2018-12-26 | 一种临床诊断辅助决策系统和医学知识图谱积累方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109686443A CN109686443A (zh) | 2019-04-26 |
CN109686443B true CN109686443B (zh) | 2021-05-25 |
Family
ID=66189746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811602217.4A Active CN109686443B (zh) | 2018-12-26 | 2018-12-26 | 一种临床诊断辅助决策系统和医学知识图谱积累方式 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109686443B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245242B (zh) * | 2019-06-20 | 2022-01-18 | 北京百度网讯科技有限公司 | 医学知识图谱构建方法、装置以及终端 |
CN112801492B (zh) * | 2021-01-22 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 基于知识阶层的数据质检的方法、装置及计算机设备 |
CN112786188A (zh) * | 2021-02-05 | 2021-05-11 | 北京致医健康信息技术有限公司 | 辅助诊断系统的离线工作方法、装置、终端设备及介质 |
CN113889260B (zh) * | 2021-09-09 | 2024-05-24 | 杨惠 | 用于hpv诊断的知识系统、诊断意见系统及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5419143B2 (ja) * | 2009-04-27 | 2014-02-19 | トランス・コスモス株式会社 | コード変換支援装置、コード変換支援方法及びコード変換支援プログラム |
CN104376228A (zh) * | 2014-12-08 | 2015-02-25 | 瞿年清 | 一种中医智能辅助诊疗仪 |
CN106776888A (zh) * | 2016-11-30 | 2017-05-31 | 北京赛迈特锐医疗科技有限公司 | 智能结构化搜索系统及其搜索方法 |
CN107785074A (zh) * | 2017-10-27 | 2018-03-09 | 上海利连信息科技有限公司 | 一种基于规则推理引擎的疾病辅助判别方法和系统 |
CN107887036A (zh) * | 2017-11-09 | 2018-04-06 | 北京纽伦智能科技有限公司 | 临床决策辅助系统的构建方法、装置及临床决策辅助系统 |
CN108461151A (zh) * | 2017-12-15 | 2018-08-28 | 北京大学深圳研究生院 | 一种知识图谱的逻辑增强方法及装置 |
-
2018
- 2018-12-26 CN CN201811602217.4A patent/CN109686443B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5419143B2 (ja) * | 2009-04-27 | 2014-02-19 | トランス・コスモス株式会社 | コード変換支援装置、コード変換支援方法及びコード変換支援プログラム |
CN104376228A (zh) * | 2014-12-08 | 2015-02-25 | 瞿年清 | 一种中医智能辅助诊疗仪 |
CN106776888A (zh) * | 2016-11-30 | 2017-05-31 | 北京赛迈特锐医疗科技有限公司 | 智能结构化搜索系统及其搜索方法 |
CN107785074A (zh) * | 2017-10-27 | 2018-03-09 | 上海利连信息科技有限公司 | 一种基于规则推理引擎的疾病辅助判别方法和系统 |
CN107887036A (zh) * | 2017-11-09 | 2018-04-06 | 北京纽伦智能科技有限公司 | 临床决策辅助系统的构建方法、装置及临床决策辅助系统 |
CN108461151A (zh) * | 2017-12-15 | 2018-08-28 | 北京大学深圳研究生院 | 一种知识图谱的逻辑增强方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109686443A (zh) | 2019-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109686443B (zh) | 一种临床诊断辅助决策系统和医学知识图谱积累方式 | |
CN110147436B (zh) | 一种基于教育知识图谱与文本的混合自动问答方法 | |
CN106844368B (zh) | 用于人机对话的方法、神经网络系统和用户设备 | |
CN110377715A (zh) | 基于法律知识图谱的推理式精准智能问答方法 | |
US8909516B2 (en) | Functionality for normalizing linguistic items | |
JP2005535007A (ja) | 文書検索システム用の知識抽出のための自己学習システムの合成方法 | |
Jin et al. | ComQA: Question answering over knowledge base via semantic matching | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
CN111651569B (zh) | 一种电力领域的知识库问答方法及系统 | |
Luo et al. | A hybrid normalization method for medical concepts in clinical narrative using semantic matching | |
CN116992002A (zh) | 一种智能护理方案应答方法及系统 | |
CN118296121A (zh) | 一种基于大语言模型的医学术语标准化辅助诊断方法 | |
Kim et al. | Constructing novel datasets for intent detection and ner in a korean healthcare advice system: guidelines and empirical results | |
Polat et al. | Testing Prompt Engineering Methods for Knowledge Extraction from Text | |
CN118132579A (zh) | 基于nl2sql的医保智能查询方法及系统 | |
CN113157887A (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
CN115312186B (zh) | 一种糖尿病视网膜病变辅助筛查系统 | |
Christophe et al. | A methodology supporting syntactic, lexical and semantic clarification of requirements in systems engineering | |
WO2022227196A1 (zh) | 一种数据分析方法、装置、计算机设备及存储介质 | |
CN113314236A (zh) | 一种面向高血压的智能问答系统 | |
Wei et al. | A Data-Driven Human–Machine Collaborative Product Design System Toward Intelligent Manufacturing | |
Taniguchi et al. | An investigation between schema linking and text-to-sql performance | |
CN109684376B (zh) | 启发式精准知识数据搜索引擎及数据自学习自诊断方法 | |
Khandait et al. | Automatic question generation through word vector synchronization using lamma | |
Wang et al. | A Survey on Large Language Models from General Purpose to Medical Applications: Datasets, Methodologies, and Evaluations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |