CN107887025A - 一种医疗大脑系统 - Google Patents

一种医疗大脑系统 Download PDF

Info

Publication number
CN107887025A
CN107887025A CN201711375987.5A CN201711375987A CN107887025A CN 107887025 A CN107887025 A CN 107887025A CN 201711375987 A CN201711375987 A CN 201711375987A CN 107887025 A CN107887025 A CN 107887025A
Authority
CN
China
Prior art keywords
medical
module
symptom
bodies
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711375987.5A
Other languages
English (en)
Inventor
李朋
刘青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ji'nan Elephant Information Technology Co Ltd
Original Assignee
Ji'nan Elephant Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ji'nan Elephant Information Technology Co Ltd filed Critical Ji'nan Elephant Information Technology Co Ltd
Priority to CN201711375987.5A priority Critical patent/CN107887025A/zh
Publication of CN107887025A publication Critical patent/CN107887025A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

一种医疗大脑系统,包括对话引擎模块,医疗知识库模块,诊断模块;所述对话引擎模块用于询问问题、获取外界症状描述输入,并进行分析,得到医疗实体;所述医疗知识库模块用于向对话引擎模块、诊断模块提供疾病信息;所述诊断模块用于将医疗实体与医疗知识库模块提供的医疗信息进行对比,得到各种疾病的权重,判断权重之和和所设定阈值的关系。本系统通过设置对话引擎模块实现症状输入的全面性,通过与诊断模块的配合,实现识别疾病的准确性;医疗实体的具体化能够提升在识别时的查全率,防止因为人为认知的问题导致症状识别不准确的风险。

Description

一种医疗大脑系统
技术领域:
本发明涉及一种医疗大脑系统。
背景技术:
随着科学技术与经济的发展,人们对医疗的需求量及要求也越来越高,在电脑硬件及机器学习技术发展取得了很大成就的同时,医疗类软件的发展也引起了人们的广泛重视。一些发达国家近年来出现了很多这方面的研究理论成果和软件产品,我国在这方面的研究也具备了一定的规模。但是现有的产品多是停留在理论阶段,与现实使用存在一定的差距,对于各种算法和模板的使用并没有有效的组合来有效的解决直接利用计算机来实现疾病判断,现在多以计算机作为媒介或者辅助设备来使用,这带来了很多的不便。现有技术对此并没有解决之策。
发明内容:
本发明的目的就是针对现有技术存在的上述缺点,提供了一种医疗大脑系统,直接作为终端使用,无需人实时的介入,诊断效率高,解决了现有技术中存在的问题。
本发明为解决上述技术问题所采用的技术方案是:
一种医疗大脑系统,包括对话引擎模块,医疗知识库模块,诊断模块;
所述对话引擎模块用于询问问题、获取外界症状描述输入,并进行分析,得到医疗实体;
所述医疗知识库模块用于向对话引擎模块、诊断模块提供疾病信息;
所述诊断模块用于将医疗实体与医疗知识库模块提供的医疗信息进行对比,得到各种疾病的权重,判断权重之和和所设定阈值的关系,所述权重之和为第一位疾病的权重或者前几位的权重之和,若权重之和等于或者超过所设定的阈值,则输出所引用权重对应的疾病;若权重之和小于所设定的阈值,则继续调用对话引擎模块。
优选的,所述对话引擎模块包括症状获取模块,医疗实体分词模块,医疗实体取代模块,医疗实体相似性获取模块;
所述症状获取模块用于询问问题、获得症状描述,并调用医疗知识库模块,获得初始医疗实体,所述医疗实体包括部位实体和症状实体;
所述医疗实体分词模块用于将初始医疗实体分离为部位实体和/或症状实体;
所述医疗实体取代模块调用医疗知识库模块,扩充部位实体的同义词或者近义词,扩充症状实体的同义词或者近义词,并且最终得到符合医疗知识库模块比对要求的部位实体和/或症状实体;
所述医疗实体相似性获取模块将扩充后的部位实体和症状实体进行交叉组合,调用医疗知识库模块对比后,得到最终的医疗实体。
优选的,所述医疗实体分体模块采用BILSTM+CRF算法。
优选的,所述医疗实体取代模块采用word2vec模型得到医疗实体的整体向量。
优选的,所述医疗实体相似性获取模块采用AIML模板,调用医疗知识库模块,判断所获得医疗实体的完整性。
优选的,所述诊断模块用tf-idf算法评价医疗实体,得到各种症状的权重。
优选的,所述对话引擎模块获取语音输入信息或文档输入信息。
优选的,所述诊断模块将所引用权重对应的症状进行语音输出。
优选的,所述知识库模块采用树状结构数据库,疾病分为如下字段描述:症状、检查方式、既往史、并发症、病因、诱因、流行病学。
优选的,所述知识库模块还包括一判别疾病存在的关键问题的问题字段。
与现有技术相比,本发明的优点是:通过设置对话引擎模块实现症状输入的全面性,通过与诊断模块的配合,实现识别疾病的准确性;医疗实体的具体化能够提升在识别时的查全率,防止因为人为认知的问题导致症状识别不准确的风险;本身能够采用语音对话的方式进行,方便使用者使用,提高用户体验。
附图说明:
图1为本发明的流程示意图。
具体实施方式:
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。
如图1所示,一种医疗大脑系统,其特征在于:包括对话引擎模块,医疗知识库模块,诊断模块;
所述对话引擎模块用于询问问题、获取外界症状描述输入,并进行分析,得到医疗实体;
所述医疗知识库模块用于向对话引擎模块、诊断模块提供疾病信息;
所述诊断模块用于将医疗实体与医疗知识库模块提供的医疗信息进行对比,得到各种疾病的权重,判断权重之和和所设定阈值的关系,所述权重之和为第一位疾病的权重或者前几位的权重之和,若权重之和等于或者超过所设定的阈值,则输出所引用权重对应的疾病;若权重之和小于所设定的阈值,则继续调用对话引擎模块。
所述对话引擎模块包括症状获取模块,医疗实体分词模块,医疗实体取代模块,医疗实体相似性获取模块;
所述症状获取模块用于询问问题、获得症状描述,并调用医疗知识库模块,获得初始医疗实体,所述医疗实体包括部位实体和症状实体;例如:腹部疼痛,腹部是部位实体,疼痛是症状实体,然后通过组合,组合的方式邻近的方式来进行组合,即部位和哪个症状在句子中的举例比较近,就进行组合。但是部分词,例如头痛本身就是一个词,不需要组合,直接通过字典比对的方式得出该词不用组合。
所述医疗实体分词模块用于将初始医疗实体分离为部位实体和/或症状实体;
所述医疗实体取代模块调用医疗知识库模块,扩充部位实体的同义词或者近义词,扩充症状实体的同义词或者近义词,并且最终得到符合医疗知识库模块比对要求的部位实体和/或症状实体;
所述医疗实体相似性获取模块将扩充后的部位实体和症状实体进行交叉组合,然后调用医疗知识库模块对比后,得到最终的医疗实体。
所述医疗实体分体模块采用BILSTM+CRF算法。因为BILSTM能够考虑上下文的情况,而CRF可以样本统计出转移概率,二者结合来完成实体的识别标注预测。
所述医疗实体取代模块采用word2vec模型得到医疗实体的整体向量。此处采用word2vec来完成,但是由于部分词短语不在word2vec语料里,因为该算法是依靠分词,所以此时需要对短语应用分词在进行分词,例如:“头一阵一阵痛”分成三个词:头,一阵一阵,痛,然后分别利用word2vec模型进行找向量,然后进行相加得到短语的整体向量,然后与医疗知识库模块里的短语向量进行比对(医疗知识库模块里的向量获取方式与常规的方式一样)。
所述医疗实体相似性获取模块采用AIML模板,调用医疗知识库模块,判断所获得医疗实体的完整性。
所述诊断模块用tf-idf算法评价医疗实体,得到各种疾病的权重。关于权重初始设定由经验丰富的医生的进行设定,以保证准确率。
所述对话引擎模块获取语音输入信息或文档输入信息。前端可采用UI模块等设计。提高使用效率和用户体验。
所述诊断模块将所引用权重对应的症状进行语音输出。进行使用效率和用户体验。
所述知识库模块采用树状结构数据库,疾病分为如下字段描述:症状、检查方式、既往史、并发症、病因及诱因、流行病学。
所述知识库模块还包括一判别疾病是否存在的关键问题的问题字段。比如怀孕通过B超就可以确诊,所以针对这个病如果病人来问的话说了些症状,如果初步判断成妊娠,可以通过B超反问确诊。
S1:用户语句分词,采用CRF进行标注进行训练。
S2:识别医疗实体,分为两类,一个是部位实体,一个是症状实体,采用BILSTM+CRF来完成,因为BILSTM能够考虑上下文的情况,而CRF可以样本统计出转移概率,二者结合来完成实体的识别标注预测。
S3:医疗实体进行取代,该取代是为了组合出具有完整意思的症状,例如:腹部疼痛,腹部是部位实体,疼痛是症状实体,然后通过组合,组合的方式邻近的方式来进行组合,即部位和哪个症状在句子中的举例比较近,就进行组合。但是部分词,例如头痛本身就是一个词,不需要组合,直接通过字典比对的方式得出该词不用组合。
S4:医疗实体相似性获取,该目的是为了把词症状标准化,可以与医疗库进行比对,此处采用word2vec来完成,但是由于部分词短语不在word2vec语料里,因为该算法是依靠分词,所以此时需要对短语应用分词再进行分词,例如:“头一阵一阵痛”分成三个词:头,一阵一阵,痛,然后分别利用word2vec模型进行找向量,然后进行相加得到短语的整体向量,然后与医疗知识库模块里的短语向量进行比对(医疗知识库模块里的向量获取方式与常规的方式一样)。
多轮对话引擎模块通过上述的分词以及症状来分析是否需要与用户进行多轮的对话才增加诊断模块的可信性,所以通过AIML模板的方式以及医疗知识库数据抽取达到所需要的完备症状信息。
根据多轮对话引擎提供的信息以及医疗知识库作比对,利用tf-idf算法算出症状词的权重,以此来算出各个可能疾病的权重,其中最大一个或者几个即为本次的最有可能的诊断结果。然后利用模板的形式进行语句合成输出。
本实施例提出的医疗大脑系统,通过对用户语句的分析进行分词及实体识别,为多轮对话提供基础数据支持,多轮引擎通过AIML及模板的形式完成多轮对话增加判断疾病的完备信息,以此信息为诊断引擎提供支持,诊断引擎通过计算各个症状的权重以及概率算出当前症状信息最有可能符合的疾病以此完成诊断。
应用例:以下对话中,S表示病人,D表示本发明:
S:语音输入(包含自己目前的症状)
假设识别后的语句:我这两天发现我儿子老是咳嗽,不愿意吃奶,时常还会出现呕吐,请问是什么病?
处理这个语句的流程:
意图识别:发现目前问的是关于诊断的意图;
提取医疗实体:咳嗽,不愿意吃奶,呕吐;
医疗实体相似替换:咳嗽,拒乳,呕吐(无部位实体)。
可疑病症的抓取:通过上面三个实体词,与医疗数据库做比对,发现小儿食管异物的临床表现中包含了这三个,小儿支原体肺炎包含了两个,所以可以认为这两个病就为可疑性最高的病。
D:您儿子是否还具有进食困难的症状?(出现这样的反问,是因为知识库模块目前认为小儿食管异物是最高的可能性病,所以把该病的其他症状挑出进行反问。)
S:有。(此时该症状也加入了医疗实体,同时该病的概率进一步的提高,通过这样的反问,直到反问后算出目前该疾病大于等于某一个设定的阈值就基本可以诊断目前患者所患的病。)
诊断完成之后,病症通过语音合成的方式播放出来,整个流程诊断的过程,同时进入数据库进行存储,以便加入新的样本迭代本发明,让其一步步的变得更准确。
本发明未详述之处,均为本技术领域技术人员的公知技术。

Claims (10)

1.一种医疗大脑系统,其特征在于:包括对话引擎模块,医疗知识库模块,诊断模块;
所述对话引擎模块用于询问问题、获取外界症状描述输入,并进行分析,得到医疗实体;
所述医疗知识库模块用于向对话引擎模块、诊断模块提供疾病信息;
所述诊断模块用于将医疗实体与医疗知识库模块提供的医疗信息进行对比,得到各种疾病的权重,判断权重之和和所设定阈值的关系,所述权重之和为第一位疾病的权重或者前几位的权重之和,若权重之和等于或者超过所设定的阈值,则输出所引用权重对应的疾病;若权重之和小于所设定的阈值,则继续调用对话引擎模块。
2.根据权利要求1所述的一种医疗大脑系统,其特征在于:所述对话引擎模块包括症状获取模块,医疗实体分词模块,医疗实体取代模块,医疗实体相似性获取模块;
所述症状获取模块用于询问问题、获得症状描述,并调用医疗知识库模块,获得初始医疗实体,所述医疗实体包括部位实体和症状实体;
所述医疗实体分词模块用于将初始医疗实体分离为部位实体和/或症状实体;
所述医疗实体取代模块调用医疗知识库模块,扩充部位实体的同义词或者近义词,扩充症状实体的同义词或者近义词,并且最终得到符合医疗知识库模块比对要求的部位实体和/或症状实体;
所述医疗实体相似性获取模块将扩充后的部位实体和症状实体进行交叉组合,调用医疗知识库模块对比后,得到最终的医疗实体。
3.根据权利要求2所述的一种医疗大脑系统,其特征在于:所述医疗实体分体模块采用BILSTM+CRF算法。
4.根据权利要求2所述的一种医疗大脑系统,其特征在于:所述医疗实体取代模块采用word2vec模型得到医疗实体的整体向量。
5.根据权利要求2所述的一种医疗大脑系统,其特征在于:所述医疗实体相似性获取模块采用AIML模板,调用医疗知识库模块,判断所获得医疗实体的完整性。
6.根据权利要求1所述的一种医疗大脑系统,其特征在于:所述诊断模块用tf-idf算法评价医疗实体,得到各种症状的权重。
7.根据权利要求1所述的一种医疗大脑系统,其特征在于:所述对话引擎模块获取语音输入信息或文档输入信息。
8.根据权利要求1所述的一种医疗大脑系统,其特征在于:所述诊断模块将所引用权重对应的症状进行语音输出。
9.根据权利要求1所述的一种医疗大脑系统,其特征在于:所述知识库模块采用树状结构数据库,疾病分为如下字段描述:症状、检查方式、既往史、并发症、病因、诱因、流行病学。
10.根据权利要求1所述的一种医疗大脑系统,其特征在于:所述知识库模块还包括一判别疾病存在的关键问题的问题字段。
CN201711375987.5A 2017-12-19 2017-12-19 一种医疗大脑系统 Pending CN107887025A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711375987.5A CN107887025A (zh) 2017-12-19 2017-12-19 一种医疗大脑系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711375987.5A CN107887025A (zh) 2017-12-19 2017-12-19 一种医疗大脑系统

Publications (1)

Publication Number Publication Date
CN107887025A true CN107887025A (zh) 2018-04-06

Family

ID=61771970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711375987.5A Pending CN107887025A (zh) 2017-12-19 2017-12-19 一种医疗大脑系统

Country Status (1)

Country Link
CN (1) CN107887025A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101624A (zh) * 2018-08-13 2018-12-28 腾讯科技(深圳)有限公司 对话处理方法、装置、电子设备及存储介质
CN109166622A (zh) * 2018-08-20 2019-01-08 重庆柚瓣家科技有限公司 基于知识图谱的疾病预诊系统
CN109241257A (zh) * 2018-08-20 2019-01-18 重庆柚瓣家科技有限公司 一种基于知识图谱的智慧问答系统及其方法
CN109273080A (zh) * 2018-09-12 2019-01-25 京东方科技集团股份有限公司 智能诊疗方法、装置、电子设备及存储介质
CN109902233A (zh) * 2019-02-28 2019-06-18 百度在线网络技术(北京)有限公司 智能对象推荐方法、装置、设备和存储介质
CN110289093A (zh) * 2019-05-30 2019-09-27 合肥阿拉丁智能科技有限公司 医疗问诊智能对话系统引擎
CN110442732A (zh) * 2019-07-24 2019-11-12 万达信息股份有限公司 一种智能导医方法、系统及存储介质
CN111339252A (zh) * 2020-02-25 2020-06-26 腾讯科技(深圳)有限公司 一种搜索方法、装置及存储介质
CN113990513A (zh) * 2021-10-27 2022-01-28 吾征智能技术(北京)有限公司 一种基于症状特征的疾病分类的系统、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247868A (zh) * 2017-05-18 2017-10-13 深思考人工智能机器人科技(北京)有限公司 一种人工智能辅助问诊系统
CN107403067A (zh) * 2017-07-31 2017-11-28 京东方科技集团股份有限公司 基于医学知识库的智能分诊服务器、终端及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247868A (zh) * 2017-05-18 2017-10-13 深思考人工智能机器人科技(北京)有限公司 一种人工智能辅助问诊系统
CN107403067A (zh) * 2017-07-31 2017-11-28 京东方科技集团股份有限公司 基于医学知识库的智能分诊服务器、终端及系统

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101624A (zh) * 2018-08-13 2018-12-28 腾讯科技(深圳)有限公司 对话处理方法、装置、电子设备及存储介质
CN109166622A (zh) * 2018-08-20 2019-01-08 重庆柚瓣家科技有限公司 基于知识图谱的疾病预诊系统
CN109241257A (zh) * 2018-08-20 2019-01-18 重庆柚瓣家科技有限公司 一种基于知识图谱的智慧问答系统及其方法
CN109166622B (zh) * 2018-08-20 2022-08-05 重庆柚瓣家科技有限公司 基于知识图谱的疾病预诊系统
CN109241257B (zh) * 2018-08-20 2022-07-19 重庆柚瓣家科技有限公司 一种基于知识图谱的智慧问答系统及其方法
CN109273080B (zh) * 2018-09-12 2021-08-27 京东方科技集团股份有限公司 智能诊疗方法、装置、电子设备及存储介质
CN109273080A (zh) * 2018-09-12 2019-01-25 京东方科技集团股份有限公司 智能诊疗方法、装置、电子设备及存储介质
CN109902233A (zh) * 2019-02-28 2019-06-18 百度在线网络技术(北京)有限公司 智能对象推荐方法、装置、设备和存储介质
CN110289093A (zh) * 2019-05-30 2019-09-27 合肥阿拉丁智能科技有限公司 医疗问诊智能对话系统引擎
CN110442732A (zh) * 2019-07-24 2019-11-12 万达信息股份有限公司 一种智能导医方法、系统及存储介质
CN111339252A (zh) * 2020-02-25 2020-06-26 腾讯科技(深圳)有限公司 一种搜索方法、装置及存储介质
CN111339252B (zh) * 2020-02-25 2021-05-11 腾讯科技(深圳)有限公司 一种搜索方法、装置及存储介质
CN113990513A (zh) * 2021-10-27 2022-01-28 吾征智能技术(北京)有限公司 一种基于症状特征的疾病分类的系统、设备及介质

Similar Documents

Publication Publication Date Title
CN107887025A (zh) 一种医疗大脑系统
CN109741806B (zh) 一种医学影像诊断报告辅助生成方法及其装置
CN111461176B (zh) 基于归一化互信息的多模态融合方法、装置、介质及设备
US11670420B2 (en) Drawing conclusions from free form texts with deep reinforcement learning
CN108628824A (zh) 一种基于中文电子病历的实体识别方法
CN110675944A (zh) 分诊方法及装置、计算机设备及介质
CN107247868A (zh) 一种人工智能辅助问诊系统
CN112133441B (zh) 一种mh术后裂孔状态预测模型的建立方法和终端
CN111949759A (zh) 病历文本相似度的检索方法、系统及计算机设备
CN109949929A (zh) 一种基于深度学习大规模病历的辅助诊断系统
CN110838368A (zh) 一种基于中医临床知识图谱的机器人主动问诊方法
CN112241457A (zh) 一种融合扩展特征的事理知识图谱事件检测方法
CN116682553A (zh) 一种融合知识与患者表示的诊断推荐系统
CN110674641A (zh) 基于gpt-2模型的中文电子病历实体识别方法
CN116434841A (zh) 基于多模态数据的胚胎评估方法及装置
CN116628490A (zh) 图文音多模态预训练模型方法、装置、电子设备和介质
CN113066572B (zh) 一种增强局部特征提取的中医辅助诊断系统及方法
CN111222325A (zh) 一种双向栈式循环神经网络的医疗语义标注方法和系统
CN113836892B (zh) 样本量数据提取方法、装置、电子设备及存储介质
CN116341546A (zh) 一种基于预训练模型的医学自然语言处理方法
Yu et al. Prompt learning for multi-modal COVID-19 diagnosis
CN115565655A (zh) 一种增强的辅助问诊方法
CN114520053A (zh) 一种医疗信息的处理方法、系统、终端和存储介质
CN112380231A (zh) 一种具有抑郁障碍特征的训练用机器人系统和方法
CN112562819A (zh) 一种针对先心病的超声多切面数据的报告生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180406

RJ01 Rejection of invention patent application after publication