CN112749287A - 知识图谱的构建方法和使用方法、装置和介质 - Google Patents

知识图谱的构建方法和使用方法、装置和介质 Download PDF

Info

Publication number
CN112749287A
CN112749287A CN202110106769.1A CN202110106769A CN112749287A CN 112749287 A CN112749287 A CN 112749287A CN 202110106769 A CN202110106769 A CN 202110106769A CN 112749287 A CN112749287 A CN 112749287A
Authority
CN
China
Prior art keywords
entity
disease
knowledge graph
characteristic
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110106769.1A
Other languages
English (en)
Inventor
何峻青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202110106769.1A priority Critical patent/CN112749287A/zh
Publication of CN112749287A publication Critical patent/CN112749287A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明实施例提供了一种知识图谱的构建方法和使用方法、装置和介质。其中的方法具体包括:依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。本发明实施例可以提升知识图谱对问诊的作用,进而能够提高医疗信息的处理准确率。

Description

知识图谱的构建方法和使用方法、装置和介质
技术领域
本发明实施例涉及医疗技术领域,尤其涉及一种知识图谱的构建方法和使用方法、装置和介质。
背景技术
随着互联网的普及和医疗资源的增加,越来越多的用户会在互联网上搜索医疗信息,以确定可能患有的疾病。
目前的医疗信息处理方法,通常利用知识图谱将琐碎、零散的医疗信息知识相互连接,知识图谱中通常包括疾病实体与症状实体之间的边关系;并依据上述边关系,针对用户的症状预测得到对应的疾病。
发明人在实施例本发明实施例的过程中发现,医疗信息处理的一个重要因素是通过问诊,获得足够多的症状信息;这样,仅使用知识图谱中疾病实体与症状实体之间的边关系,对问诊的作用有限,导致医疗信息的处理准确率较低。
发明内容
本发明实施例设计了一种新型医疗知识图谱,并提供一种知识图谱的构建方法和使用方法、装置和介质,可以提升知识图谱对问诊的作用,进而能够提高医疗信息的处理准确率。
为了解决上述问题,本发明实施例公开了一种知识图谱的构建方法,包括:
依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
为了解决上述问题,本发明实施例公开了一种知识图谱的使用方法,所述方法包括:
依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体,确定目标问题,所述目标问题用于对用户进行问诊。
为了解决上述问题,本发明实施例公开了一种知识图谱的使用方法,所述方法包括:
依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;所述问题实体用于表征与所述预设疾病特征实体相关的问题;
依据所述问题实体,确定预设疾病问题;所述预设疾病问题包括:问题文本、以及至少一个预设选项;
若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
另一方面,本发明实施例公开了一种知识图谱的构建装置,包括:
问题实体确定模块,用于依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
第一关联模块,用于在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
另一方面,本发明实施例公开了一种知识图谱的使用装置,所述装置包括:
问题实体获取模块,用于依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;以及
问题确定模块,用于依据所述问题实体,确定目标问题,所述目标问题用于对用户进行问诊。
另一方面,本发明实施例公开了一种知识图谱的使用装置,所述装置包括:
问题实体获取模块,用于依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;所述问题实体用于表征与所述预设疾病特征实体相关的问题;
预设疾病问题确定模块,用于依据所述问题实体,确定预设疾病问题;所述预设疾病问题包括:问题文本、以及至少一个预设选项;以及
建议输出模块,用于若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
再一方面,本发明实施例公开了一种用于构建知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
再一方面,本发明实施例公开了一种用于使用知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体,确定目标问题,所述目标问题用于对用户进行问诊。
再一方面,本发明实施例公开了一种用于使用知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;所述问题实体用于表征与所述预设疾病特征实体相关的问题;
依据所述问题实体,确定预设疾病问题;所述预设疾病问题包括:问题文本、以及至少一个预设选项;
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的知识图谱的构建方法。
本发明实施例包括以下优点:
本发明实施例在知识图谱中的疾病特征实体包括多种其他医疗知识图谱不具备的信息,包括类型、从属关系、频次、命中动作等,建立疾病特征实体与问题实体之间的关联。这样,在问诊流程中,可以依据用户相关的疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可以在问诊流程中生成用于问诊的问题,因此能够提升知识图谱对问诊的作用,进而能够提高医疗信息的处理效率。
本发明实施例提出的知识图谱中的疾病实体包括多种信息,其中临床占比、高发年龄、高发季节等是其他医疗知识图谱所不具备的,这些信息都标注了概率信息,这些概率信息可用于对疾病特征实体的排序以及疾病预测处理,提高问诊效率和用户疾病特征对应的多种疾病之间的区分度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种疾病实体及其属性的示意图;
图2是本发明实施例的一种疾病特征实体及其属性的示意图;
图3是本发明的一种知识图谱的构建方法实施例一的步骤流程图;
图4是本发明的一种知识图谱的构建方法实施例二的步骤流程图;
图5是本发明的一种知识图谱的使用方法实施例的步骤流程图;
图6是本发明的一种知识图谱的使用方法实施例的步骤流程图;
图7是本发明的一种知识图谱的构建装置实施例的结构框图;
图8是本发明的一种知识图谱的使用装置实施例的结构框图;
图9是本发明的一种知识图谱的使用装置实施例的结构框图;
图10是本发明的一种用于构建知识图谱的装置1100的框图;及
图11是本发明的一些实施例中服务端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对传统技术中知识图谱中疾病实体与症状实体之间的边关系对问诊的作用有限,导致医疗信息的处理准确率较低的技术问题,本发明实施例提供了一种知识图谱的构建方法,该方法可以包括:依据疾病特征实体,确定问题实体;该问题实体用于表征与疾病特征实体相关的问题;在知识图谱中,建立该疾病特征实体与该问题实体之间的关联。
本发明实施例提出问题实体的概念,并在知识图谱中建立疾病特征实体与问题实体之间的关联。这样,在问诊流程中,可以依据用户相关的疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可以在问诊流程中生成用于问诊的问题,因此能够提升知识图谱对问诊的作用,进而能够提高问诊效率、以及医疗信息的处理准确率。
知识图谱实施例
本发明实施例中,知识图谱是结构化的语义知识库,用于描述物理世界中的概念及其相互关系。
本发明实施例中,实体(Entity)是指客观存在并可相互区别的事务,包括具体的人、事、物、抽象的概念或联系等。实体可以是具体的对象,如:一种疾病,一种疾病特征等;也可以是抽象的事件,如:针对疾病特征的一次问诊等。
实体可以有很多特性,单个特性称为属性。每个属性有一个值域,其类型可以是整数型、实数型、或字符串型等。标记属性的命名单位称为字段。字段的状态可以包括:已填充状态或未填充状态,其中,已填充状态对应已填充的字段内容,未填充状态表征对应的字段内容待填充。
医疗领域中的实体可以称为医疗实体。医疗实体可以包括:疾病实体、疾病特征实体、或问题实体等。
疾病实体可以表征具体的疾病,如“高血压”、“白血病”等。疾病可以对应有疾病系统。疾病系统可以对应解剖学意义上的系统,如疾病系统可以包括:运动系统、消化系统、呼吸系统、泌尿系统、生殖系统、内分泌系统、免疫系统、神经系统和循环系统等。
可选地,疾病实体的属性可以包括如下属性中的至少一种:
疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
所述特征集合中可以包括:与该疾病特征实体相关联的疾病特征;
所述临床占比用于表征疾病在疾病系统中的发病概率,可以依据疾病的发病数量与疾病系统的发病数量得到。
参照图1,示出了本发明实施例的一种疾病实体及其属性的示意图。其中,疾病实体的属性可以包括:疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性。疾病实体包含了临床占比、所属系统、高发年龄、高发季节等医疗领域的传统知识图谱不具备的信息。
单个属性可以对应有属性参数。
例如,疾病系统属性的属性参数可以包括:系统概率,可以表征单个疾病系统的患者占所有疾病系统的患者的比例,可以依据单个疾病系统的病人和所有疾病系统的病人的比值得到。
又如,特征集合属性的属性参数可以包括如下参数中的至少一种:
疾病特征在疾病的条件下的条件概率;特征集合中通常包括多个疾病特征,条件概率可以为多个疾病特征在疾病的条件下分别对应的条件概率;
疾病特征在疾病的条件下的惩罚因子,该惩罚因子可以对应在疾病的条件下不能出现的疾病特征,用于在疾病预测处理的过程中,对疾病的概率进行惩罚。
参照表1,示出了本发明实施例的一种疾病实体的实例的示意,其中,疾病名称“急性喉炎”和“支气管炎”均为“呼吸系统”的疾病,其分别对应多种疾病特征,每种疾病特征分别对应有条件概率。
表1
Figure BDA0002917806900000061
疾病特征实体可以表征具体的疾病特征。疾病特征的类型可以包括:症状、诱因、高发季节、接触史、家族史等。
疾病特征实体的属性可以包括:命中动作属性,该命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
疾病特征实体的属性可以包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。从属关系属性的属性参数可以包括:父疾病特征或子疾病特征。
例如,疾病特征“呕吐”的子疾病特征包括:“喷射性呕吐”;又如,疾病特征“发热”的子疾病特征包括:“低热”、“高热”等。
参照图2,示出了本发明实施例的一种疾病特征实体及其属性的示意图。其中,疾病特征实体的属性可以包括:特征标识属性、类型属性、从属关系属性、频次属性、命中动作属性、释义属性等。其中,频次属性可以表征对应疾病特征在所有疾病实体的特征集合中出现的次数。疾病特征实体包含了从属关系、特征对应的类型、频次、命中动作情况下的问题等信息,是医疗领域的传统知识图谱所不具备的。
参照表2,示出了本发明实施例的一种疾病特征实体的实例的示意。其中,疾病特征“呕吐”的命名动作属性“问题实体的标识18”,表征在疾病特征“呕吐”被选中的情况下,将触发问题实体标识为18的问题实体。
表2
Figure BDA0002917806900000071
上述命中动作属性可以提高问诊流程中问题接序的合理性。例如,若用户选中了“呕吐”症状,则会根据该“呕吐”症状的命中动作属性,查找到对应的问题实体标识18,以进一步针对“喷射性呕吐”症状进行问诊。
问题实体与针对疾病特征的一次问诊相应,用于表征一次问诊对应的问题。由于一次问诊可以涉及至少一个疾病特征,因此,问题实体对应的问题可以涉及至少一个疾病特征。
可选地,问题实体的字段可以包括:问题文本字段和答案选项字段。问题文本字段用于表征待回复的问题。问题文本字段的示例可以包括:“是否没有恶心动作直接呕吐?”、“有以下哪些症状?”、“之前得过以下哪些疾病?、“皮疹是什么类型的?“大便的形状是怎样的?”等。答案选项字段用于表征可供选择的答案选项。
可选地,问题实体的字段还可以包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征疾病特征实体;
所述触发条件字段用于表征对应的问题实体为依据疾病特征实体触发得到;
所述跳转关系字段用于选中答案选项的条件下执行预设跳转。
可选地,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
当然,本领域技术人员可以根据实际应用需求,确定预设跳转,例如,预设跳转还可以包括:执行预设函数,预设函数可用于结束问题实体的查找等。
参照表3,示出了问题实体的字段的意义和取值。
表3
Figure BDA0002917806900000081
Figure BDA0002917806900000091
本发明实施例的问题实体可以包括:问题实体实例、和/或、问题实体模板。模板是将一个事物的结构规律予以固定化、标准化的成果,它体现的是结构形式的标准化。具体到本发明实施例,问题实体模板可以将问题实体实例的结构规律标准化,以体现问题实体实例的结构形式的标准化。
其中,问题实体实例的所有字段处于已填充状态。问题实体实例可以与预设的疾病特征相应。
参照表4,示出了本发明实施例的一种问题实体实例的示意。该问题实体实例的标识为18,为依据疾病特征“呕吐”触发得到,也即,在“呕吐”特征被选中的情况下,可以触发标识为18的问题实体实例。
该问题实体实例与疾病特征“喷射性呕吐”相应,用于对疾病特征“喷射性呕吐”进行问诊。问题文本中可以包含疾病特征“喷射性呕吐”的释义,以帮助用户确定是否命中对应的疾病特征,并选择对应的答案选项。
表4
标识 18
问题文本 是否没有恶心动作直接呕吐?
答案选项 [是,否,我不知道]
疾病特征 喷射性呕吐
触发条件 呕吐
问题实体模板的问题文本字段处于已填充状态,问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。预设字段可以包括:答案选项字段、疾病特征字段、触发条件字段、以及跳转关系字段中的任一或组合。
问题实体模板可以与预设类型的疾病特征相应,这样,在问诊流程中,可以依据用户相关的疾病特征对应的类型,在知识图谱中查找得到对应的问题实体模板,并依据用户相关的疾病特征,对问题实体模板进行字段填充,字段填充后的问题实体模板可以作为动态的问题实体实例,动态的问题实体实例可以包含用于问诊的问题。由于问题实体模板与预设类型的疾病特征相应,故字段填充后的问题实体模板中可以包含预设类型的多种疾病特征的信息,因此能够提高用于问诊的问题所包含的疾病特征数量,进而能够减少问诊的交互轮数,以及能够提高问诊效率。
上述对问题实体模板进行字段填充,具体可以包括:依据用户相关的疾病特征,对答案选项字段进行填充,不同的疾病特征可以对应不同的答案选项。具体地,可以在答案选项字段中填充用户相关的疾病特征对应的释义,不同的释义可以对应不同的答案选项。
上述对问题实体模板进行字段填充,具体可以包括:依据用户相关的疾病特征对应的命中动作属性,对跳转关系字段进行填充。具体地,可以在跳转关系字段中填充用户相关的疾病特征对应的命中动作属性。
例如,跳转关系字段的内容可以为:答案选项被选中的情况下,跳转至预设的问题实体,假设答案选项对应第一疾病特征实体,第一疾病特征实体的命中动作属性中记录有第二疾病特征实体,则预设的问题实体可以为:第二疾病特征实体对应的问题实体信息。
假设用户相关的疾病特征为第一疾病特征,则可以在问题实体模板的答案选项字段中填充第一疾病特征的信息,以及,在跳转关系字段中填充第二疾病特征实体对应的问题实体信息。
参照表5,示出了本发明实施例的一种问题实体模板的示意。该问题实体模板可以与症状类型的疾病特征相应,用于对症状类型的疾病特征进行问诊。
在问诊流程中,可以依据用户相关的症状1、症状2…症状N(N可以为大于0的自然数),对该问题实体模板进行字段填充。
例如,在答案选项字段中填充症状1、症状2…症状N等症状的释义,以帮助用户确定是否命中对应的疾病特征,并选择对应的答案选项。
需要说明的是,本发明实施例中,在答案选项与疾病特征一一对应的情况下,“选中答案选项”与“选中疾病特征”可以为等同特征。例如,选中症状1对应的答案选项,可以等同于选中症状1。
又如,可以在疾病特征字段中填充症状类型。或者,在跳转关系字段中填充症状1、症状2…症状N的子症状对应的问题实体标识等。
可以理解,除了答案选项字段的填充之外,其他预设字段的填充是可选的,也即,可以不进行疾病特征字段、触发条件字段、以及跳转关系字段的填充。
可以理解,表5所示与症状类型的疾病特征相应的问题实体模板只是作为可选实施例,实际上,本领域技术人员还可以根据实际应用需求,采用与其他类型的疾病特征相应的问题实体模板。例如,还可以采用与接触史类型的疾病特征相应的问题实体模板,对应的问题文本可以包括:“是否接触过如下病原、有害因素、疾病患者?”等。
表5
Figure BDA0002917806900000111
方法实施例一
参照图3,示出了本发明的一种知识图谱的构建方法实施例一的步骤流程图,该实施例用于构建知识图谱,具体可以包括如下步骤:
步骤301、依据疾病特征实体,确定问题实体;上述问题实体用于表征与上述疾病特征实体相关的问题;
步骤302、在知识图谱中,建立上述疾病特征实体与上述问题实体之间的关联。
步骤301中,疾病特征实体可以表征与疾病相关的特征,其可以包括:疾病中出现的疾病特征,也可以包括:疾病中不能出现的疾病特征。
在本发明的一种可选实施例中,确定疾病特征实体的过程可以包括:确定主诉列表,并确定所述主诉列表对应的疾病列表;依据医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充;依据所述主诉列表中主诉、以及填充得到的疾病特征,确定疾病特征实体。
在医疗技术领域,主诉用于表征患者或代诊者对最主要的症状和(或)体征的叙述,主诉通常包括:患者或代诊者陈述的症状、体征、性质、以及持续时间等内容中的至少一种。
本发明实施例可以从医疗查询数据和/或病历数据等医疗资源中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。预设的标准可以包括:主诉的字符数量不超过数量阈值等,数量阈值可以为20等。
在具体实现中,可以根据主诉列表中的单个主诉,确定对应的疾病,进而将确定的疾病添加至疾病列表。一种实现方式可以为,向医生终端发送主诉,由医生终端对应的用户确定主诉对应的疾病。其中,医生终端的用户可以为具有M(M可以为大于0的自然数,M可以大于7)年以上临床经验的医生,其可以依据知识和经验,确定主诉对应的疾病。
疾病列表中的疾病可以作为知识图谱中疾病实体的数据源。也即,可以疾病列表中的疾病,构建对应的疾病实体。
在确定疾病列表后,本发明实施例可以依据医学书籍、医学数据库、医学问答数据等医疗资源,对疾病列表中的疾病进行疾病特征的扩充。也即,针对疾病,在疾病对应的主诉的基础上,对除了主诉之外的疾病特征进行扩充。扩充所涉及疾病特征的类型可以包括:症状、诱因、高发季节、接触史、家族史等。
可选地,可以从医疗资源中获取疾病对应的疾病内容,并从疾病内容中抽取上述类型对应的疾病特征。
上述主诉列表中主诉、以及填充得到的疾病特征,可以作为疾病特征实体对应疾病特征的数据源。也即,还可以依据主诉列表中主诉、以及填充得到的疾病特征,构建疾病特征实体。
在本发明的一种可选实施例中,还可以向医生终端发送疾病对应的候选疾病特征(主诉和填充得到的疾病特征),以使医生终端的用户对候选疾病特征进行更新。上述对候选疾病特征进行更新具体可以包括:候选疾病特征的增加、候选疾病特征的删除、或者候选疾病特征的修改等。
更新后的候选疾病特征,可以作为疾病特征实体对应疾病特征的数据源。例如,可以针对疾病对应的更新后的候选疾病特征,确定疾病对应的特征集合。
在本发明的另一种可选实施例中,还可以针对疾病,确定特征集合中疾病特征在疾病的条件下的条件概率、和/或、疾病特征在疾病的条件下的惩罚因子。可选地,可以依据疾病特征在疾病对应医疗资源中的出现信息,确定上述条件概率或惩罚因子;或者,可由医生终端的用户确定上述条件概率或惩罚因子。
在本发明的再一种可选实施例中,还可以依据疾病及疾病所属疾病系统的医疗数据,确定疾病在疾病系统中的发病概率(临床占比)、和/或、系统概率。
上述条件概率能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
在本发明实施例的一种应用示例1中,对于出现“咳嗽”症状、“咳痰”症状的病人,在进行疾病预测处理的过程中,虽然“急性喉炎”和“支气管炎”都能与这两个症状匹配,但是“咳嗽”在“急性喉炎”中的概率为0.6,“咳痰”在“急性喉炎”中的概率为0.4;而“咳嗽”在“支气管炎”中的概率为0.8,“咳痰”在“支气管炎”中的概率为0.6。由于上述条件概率,可以确定这两个症状与“支气管炎”之间的匹配程度高于这两个症状与“急性喉炎”之间的匹配程度,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
上述惩罚因子能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
临床占比能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
在本发明的一种可选实施例中,上述确定疾病特征实体,具体可以包括:对主诉、以及填充得到的疾病特征进行特征归一化,以得到归一化后的疾病特征;并依据归一化后的疾病特征,确定疾病特征实体。
上述特征归一化可以将语义相同且描述不同的疾病特征,统一为标准描述。例如,“头疼”对应的个性化或口语化的症状描述具体包括:“针扎一样疼”、“一抽一抽的痛”、“一摸就疼”、“咽口水跟着疼”等。又如,“舌痛”对应的个性化或口语化的症状描述具体包括:“舌头左边疼”、“舌尖疼痛”、“舌头根疼”、“舌头边缘痛”等。
本发明实施例中,确定疾病特征实体,具体可以包括:确定疾病特征实体对应的多个属性,并针对特定的疾病特征实体,确定对应的属性值。疾病特征实体对应的多个属性具体可以包括:特征标识属性、类型属性、从属关系属性、频次属性、命中动作属性、释义属性等。
本发明实施例的问题实体,用于对疾病特征实体对应的疾病症状进行问诊,以帮助用户确定是否出现对应的疾病症状。
本领域技术人员可以根据实际应用需求,确定疾病特征实体对应的问题实体。根据一种实施例,可以向医生终端发送疾病特征实体的信息,以使医生设置疾病特征实体对应的问题实体。
根据另一种实施例,可以依据疾病特征实体对应的类型、以及历史问诊数据,确定疾病特征实体对应的问题实体。
本发明实施例中,问题实体的字段可以包括:问题文本字段和答案选项字段,其中,问题文本字段或答案选项字段中可以包括疾病特征实体的标识或释义等信息。
可选地,问题实体的字段还可以包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征疾病特征实体;
所述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
所述跳转关系字段用于选中答案选项的条件下执行预设跳转。
可选地,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
当然,本领域技术人员可以根据实际应用需求,确定预设跳转,例如,预设跳转还可以包括:执行预设函数,预设函数可用于结束问题实体的查找等。
本发明实施例还可以向医生终端发送问题实体的信息,以使医生终端的用户对问题实体的信息进行审核。
步骤302中,问题实体可以包括:问题实体实例,问题实体实例可以与预设的疾病特征相应。因此,本发明实施例可以在知识图谱中,建立预设的疾病特征实体与问题实体实例之间的关联。
本发明实施例的问题实体可以包括:问题实体模板,问题实体模板可以与预设类型的疾病特征相应。因此,本发明实施例可以在知识图谱中,建立预设类型的疾病特征实体与问题实体实例之间的关联。
本发明实施例中,建立疾病特征实体与问题实体之间的关联,具体可以包括:依据问题实体中的疾病特征字段,建立疾病特征实体与问题实体之间的映射关系,其中,问题实体中的疾病特征字段与疾病特征实体相匹配。
若问题实体中的疾病特征字段表征预设的疾病特征,则映射关系中的问题实体为问题实体实例,映射关系中的疾病特征实体对应一种预设的疾病特征。
若问题实体中的疾病特征字段表征预设类型的疾病特征,则映射关系中的问题实体为问题实体模板,映射关系中的疾病特征实体对应预设类型的多种疾病特征。
在本发明的一种可选实施例中,还可以在知识图谱中建立疾病实体与疾病特征实体之间的关联。具体地,可以将疾病实体与其特征集合中疾病特征对应的疾病特征实体进行关联。可以理解,本发明实施例对于疾病实体与疾病特征实体之间的具体关联方式不加以限制。因此,本发明实施例的知识图谱可以包括:疾病实体、疾病特征实体和问题实体,其中,疾病实体与疾病特征实体相关联,疾病特征实体和问题实体相关联。
综上,本发明实施例的知识图谱的构建方法,在知识图谱中建立疾病特征实体与问题实体之间的关联。这样,在问诊流程中,可以依据用户相关的疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可以在问诊流程中生成用于问诊的问题,因此能够提升知识图谱对问诊的作用,进而能够提高医疗信息的处理准确率。
并且,本发明实施例在疾病特征实体中通过命中动作属性表征了:疾病特征与问题实体的信息之间的关系,在对应疾病特征被选中的情况下,将触发对应的问题实体。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
另外,本发明实施例在问题实体中通过跳转关系字段表征了:疾病特征对应的答案选项被选中的情况下、将跳转至预设的问题实体,这样可以提高问诊流程中问题接序的合理性。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
再者,本发明实施例的知识图谱中的疾病实体包括多种属性,其中,疾病系统属性、特征集合属性、临床占比属性等属性对应有概率信息,这些概率信息可用于疾病预测处理。在多种疾病与用户的症状匹配的情况下,上述概率信息可用于对该多种疾病进行区分,因此能够提高疾病预测处理的准确率。
上述条件概率能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
上述惩罚因子能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
临床占比能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
方法实施例二
参照图4,示出了本发明的一种知识图谱的构建方法实施例二的步骤流程图,该实施例具体可以包括如下步骤:
步骤401、确定主诉列表;
在实际应用中,可以从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
步骤402、确定疾病列表;
医生根据各主诉对应的疾病构建疾病列表。这些疾病即为知识图谱中的疾病集合。
步骤403、特征扩充;
在实际应用中,可以依据医学书籍、网络资源等医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充,疾病特征可以包括:症状、接触史等类型。
步骤404、特征审核和概率标注;
在实际应用中,多年(例如8年)以上资历的医生,可以根据临床经验审核这些疾病特征,进行疾病特征的增删改,并标注各个疾病的条件下、各疾病特征出现的条件概率。
步骤405、特征归一化;
根据医学信息,对这些疾病特征进行归一化,即合并、调整。
步骤406、设置问题实体,并将设置的问题实体保存至知识图谱。
在实际应用中,可以根据归一化后的疾病特征,考虑可能询问的所有问题,设置问题实体。设置的问题实体可由医生审核后确定和保存。
方法实施例三
参照图5,示出了本发明的一种知识图谱的使用方法实施例的步骤流程图,该实施例用于问诊,该方法具体可以包括如下步骤:
步骤501、依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;上述问题实体用于表征与上述疾病特征实体相关的问题;
步骤502、依据上述问题实体,确定目标问题,上述目标问题用于对用户进行问诊。
本发明实施例可应用于问诊场景。问诊是通过对患者或代诊者进行有目的的询问,了解疾病的发生、发展、诊治经过、现在症状及其他一切与疾病有关的情况,以诊察疾病的一种方法。随着人工智能技术的不断发展,基于人工智能的问诊方式逐渐发展起来,给用户的生活带来了诸多便捷。
本发明实施例在知识图谱中利用疾病特征实体与问题实体之间的关联进行问诊。这样,在问诊流程中,可以依据用户相关的目标疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的目标问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可以在问诊流程中自动生成用于问诊的问题,因此能够提升知识图谱对问诊的作用,进而能够提高问诊效率、医疗信息的处理准确率。
本发明实施例中,上述目标疾病特征具体可以包括:
与用户疾病特征相关的疾病特征;和/或
候选疾病对应的疾病特征,上述候选疾病为对用户疾病特征进行疾病预测处理得到。
用户疾病特征可以表征用户出现的疾病特征。本发明实施例可以通过键盘输入、选项选择、语音输入等输入方式,确定用户疾病特征。
本发明实施例可以依据知识图谱中疾病特征在各个疾病中的条件概率等属性,基于疾病预测处理,确定与用户疾病特征相关的候选疾病,以及计算需要向用户询问的疾病特征列表。可以依据多种疾病特征在一种疾病的医疗资源中的共现信息,确定与用户疾病特征相关的疾病以及疾病特征,从而计算需要向用户询问的疾病特征列表。疾病特征列表中可以包括前述的目标疾病特征。可以理解,本发明实施例对于需要向用户询问的疾病特征列表的具体确定方式不加以限制。
候选疾病的特征集合中可以包括:候选疾病对应的疾病特征。由于用户疾病特征可以表征经过用户确认也即用户出现的疾病特征,因此,本发明实施例可以从候选疾病对应的疾病特征中去除用户疾病特征,以得到目标疾病特征。
本发明实施例可以依据目标疾病特征对应的疾病特征实体,在知识图谱中疾病特征实体与问题实体之间的映射关系中进行查找,以得到目标疾病特征对应的问题实体。
本发明实施例可以提供从知识图谱中获取对应的问题实体、并确定目标问题的如下技术方案:
技术方案1、
技术方案1中,可以依据疾病特征实体与问题实体实例之间的映射关系,确定目标疾病特征对应的问题实体实例。
在具体实现中,可以从目标疾病特征对应的问题实体实例中获取问题文本字段的内容和答案选项字段的内容,以得到目标问题;也即,目标问题可以包括:问题文本字段的内容和答案选项字段的内容。例如,在目标疾病特征为“呕吐”的情况下,可以依据“呕吐”对应的问题实体实例,确定目标问题A。目标问题A的问题文本可以为“是否呕吐”,目标问题A的答案选项可以为:[是,否,我不知道]。
在目标疾病特征对应的答案选项被选中的情况下,可以依据所述目标疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体。
例如,目标疾病特征为“呕吐”,在目标问题A对应的答案选项[是]被选中的情况下,根据表2所示疾病特征实体的命中动作属性,将触发问题实体标识为18的问题实体实例。此种情况下,可以依据问题实体标识为18的问题实体实例,生成目标问题B。目标问题B的问题文本可以为“是否没有恶心动作直接呕吐?”,目标问题B的答案选项可以为:[是,否,我不知道]。
技术方案2、
技术方案2中,可以依据疾病特征实体的类型与问题实体模板之间的映射关系,确定目标疾病特征对应的问题实体模板。
此种情况下,上述确定目标问题,具体可以包括:依据上述目标疾病特征,对上述问题实体模板进行字段填充,以得到目标问题。
问题实体模板的字段具体包括:问题文本字段和答案选项字段;上述对所述问题实体模板进行字段填充,具体包括:步骤S1和/或步骤S2。步骤S1和步骤S2的执行顺序不分先后。
其中,步骤S1可以依据属于一种类型的至少一种目标疾病特征,对所述类型对应的问题实体模板进行字段答案字段的填充,以在得到的目标问题中携带至少一种目标疾病特征的信息。例如,目标疾病特征的类型为“症状”,则可以在“症状”对应问题实体模板的答案选项字段中,填充症状1、症状2…症状N等症状的释义,以帮助用户确定是否命中对应的疾病特征,并选择对应的答案选项。
步骤S2可以依据所述目标疾病特征对应疾病特征实体中的命中动作属性,对问题实体模板的跳转关系字段进行填充。具体地,可以在跳转关系字段中填充目标疾病特征对应命中动作属性的信息。
例如,跳转关系字段的内容可以为:答案选项被选中的情况下,跳转至预设的问题实体,假设答案选项对应第一疾病特征实体,第一疾病特征实体的命中动作属性中记录有第二疾病特征实体,则预设的问题实体可以为:第二疾病特征实体对应的问题实体信息。
假设目标疾病特征为第一疾病特征,则可以在问题实体模板的答案选项字段中填充第一疾病特征的信息,以及,在跳转关系字段中填充第二疾病特征实体对应的问题实体标识。
技术方案3、
技术方案3中,可以在目标疾病特征对应的答案选项被选中的情况下,依据所述目标疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
所述跳转关系字段用于选中答案选项的条件下执行预设跳转。可选地,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体可以为父子关系。
例如,在目标问题B对应的答案选项[是]被选中的情况下,可以根据问题实体的跳转关系字段,触发“嗜睡”等症状对应的问题实体实例。此种情况下,可以依据“嗜睡”等症状对应的问题实体实例,生成目标问题C。目标问题C的问题文本可以为“是否嗜睡?”,目标问题C的答案选项可以为:[是,否,我不知道]。
技术方案1基于问题实体实例确定目标问题;技术方案2基于问题实体模板的填充确定目标问题;技术方案3可以通过问题实体中的跳转关系字段,获取问题实体。可以理解,本领域技术人员可以根据实际应用需求,采用技术方案1至技术方案3中的任一或组合。
综上,本发明实施例的知识图谱的使用方法,在问诊流程中,可以依据用户相关的疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可以在问诊流程中生成用于问诊的问题,因此能够提升知识图谱对问诊的作用,进而能够提高医疗信息的处理准确率。
并且,本发明实施例在疾病特征实体中通过命中动作属性表征了:疾病特征与问题实体的信息之间的关系,在对应疾病特征被选中的情况下,将触发对应的问题实体。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
另外,本发明实施例在问题实体中通过跳转关系字段表征了:疾病特征对应的答案选项被选中的情况下、将跳转至预设的问题实体,这样可以提高问诊流程中问题接序的合理性。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
方法实施例四
参照图6,示出了本发明的一种知识图谱的使用方法实施例的步骤流程图,该方法用于问诊,该方法具体可以包括如下步骤:
步骤601、依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;上述问题实体用于表征与上述预设疾病特征实体相关的问题;
具体的,从知识图谱中获取与用户疾病特征相匹配的预设疾病特征实体,然后,获取与相匹配的预设疾病特征实体对应的问题实体。
步骤602、依据上述问题实体,确定预设疾病问题;上述预设疾病问题具体包括:问题文本、以及至少一个预设选项;
步骤603、若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
本发明实施例中,预设疾病特征实体可以表征预设疾病对应的疾病特征,预设疾病可以包括:危急程度和/或严重程度较高的疾病,预设疾病对应的疾病特征可以包括:危急重症。
本发明实施例在问诊过程中,依据预设疾病特征实体对应的问题实体,确定预设疾病问题,并利用预设疾病问题对用户进行问诊;可以在问诊过程中进行危急程度和/或严重程度较高的预设疾病的排除,进而可以提高医疗信息处理的安全性。
根据一种实施例,可以建立疾病特征与预设疾病特征实体对应的问题实体之间的对应关系,这样,可以将用户疾病特征与对应关系中的疾病特征进行匹配,以得到用户疾病特征和预设疾病特征实体对应的问题实体。
根据另一种实施例,可以在疾病特征实体中通过命中动作属性表征:疾病特征与预设疾病特征实体对应的问题实体的信息之间的关系。这样,可以依据用户疾病特征,查找对应疾病特征实体中的命中动作属性,进而可以得到用户疾病特征和预设疾病特征实体对应的问题实体。
在本发明的一种应用示例2中,假设用户疾病特征为“发热”,则本发明实施例可以依据上述对应关系、或者“发热”实体对应的命中动作属性,确定与“发热”相关的预设疾病对应的问题实体。例如,问题实体中可以包括预设疾病问题,预设疾病问题的问题文本可以为“有以下哪些症状?”,预设疾病问题的至少一个预设选项可以包括:预设疾病特征对应的选项、以及“以上都不是”的选项。预设疾病特征对应的选项可以包括:“超过40度”、“寒战”等。
若接收到用户针对任一预设选项的选择操作,则说明用户命中了预设疾病特征,说明用户对应预设疾病的概率较高,此种情况下,输出就医建议信息,可以提高用户对于病情的重视程度,进而可以增强医疗信息处理的安全性。
综上,本发明实施例的知识图谱的使用方法,在问诊过程中,依据预设疾病特征实体对应的问题实体,确定预设疾病问题,并利用预设疾病问题对用户进行问诊;可以在问诊过程中进行危急程度和/或严重程度较高的预设疾病的排除,进而可以提高医疗信息处理的安全性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
参照图7,示出了本发明的一种知识图谱的构建装置实施例的结构框图,具体可以包括:问题实体确定模块701和第一关联模块702。
其中,问题实体确定模块701,用于依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
第一关联模块702,用于在知识图谱中,建立上述疾病特征实体与上述问题实体之间的关联。
可选地,上述问题实体的字段可以包括:问题文本字段和答案选项字段。
可选地,上述问题实体的字段还可以包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,上述疾病特征字段用于表征对应的疾病特征实体;
上述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
上述跳转关系字段用于在选中答案选项的条件下执行预设跳转。
可选地,上述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与上述第二问题实体对应的疾病特征实体为父子关系。
可选地,上述问题实体可以包括:
问题实体实例;上述问题实体实例的所有字段处于已填充状态;和/或
问题实体模板;上述问题实体模板的问题文本字段处于已填充状态,上述问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。
可选地,上述疾病特征实体的属性可以包括:命中动作属性,上述命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
可选地,上述疾病特征实体的属性可以包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。
可选地,上述装置还可以包括:
第二关联模块,用于在知识图谱中,建立上述疾病特征实体与疾病实体之间的关联;
上述疾病实体的属性可以包括如下属性中的至少一种:
疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
其中,上述特征集合中可以包括:与上述疾病特征实体相关联的疾病特征;
上述临床占比属性用于表征疾病在疾病系统中的发病概率。
可选地,上述疾病系统属性对应有系统概率,用于表征疾病系统的疾病的发病概率之和。
可选地,上述特征集合属性的属性参数可以包括如下参数中的至少一种:
疾病特征在疾病的条件下的条件概率;
疾病特征在疾病的条件下的惩罚因子。
可选地,上述装置还可以包括:
主诉确定模块,用于确定主诉列表,并确定上述主诉列表对应的疾病列表;
特征扩充模块,用于依据医疗资源,对上述疾病列表中的疾病进行疾病特征的扩充;
疾病特征实体确定模块,用于依据上述主诉列表中主诉、以及扩充得到的疾病特征,确定疾病特征实体。
可选地,上述主诉确定模块,可以包括:
主诉处理模块,用于从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
综上,本发明实施例的知识图谱的构建装置,在知识图谱中建立疾病特征实体与问题实体之间的关联。这样,在问诊流程中,可以依据用户相关的疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可以在问诊流程中生成用于问诊的问题,因此能够提升知识图谱对问诊的作用,进而能够提高医疗信息的处理准确率。
并且,本发明实施例在疾病特征实体中通过命中动作属性表征了:疾病特征与问题实体的信息之间的关系,在对应疾病特征被选中的情况下,将触发对应的问题实体。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
另外,本发明实施例在问题实体中通过跳转关系字段表征了:疾病特征对应的答案选项被选中的情况下、将跳转至预设的问题实体,这样可以提高问诊流程中问题接序的合理性。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
再者,本发明实施例的知识图谱中的疾病实体包括多种属性,其中,疾病系统属性、特征集合属性、临床占比属性等属性对应有概率信息,这些概率信息可用于疾病预测处理。在多种疾病与用户的症状匹配的情况下,上述概率信息可用于对该多种疾病进行区分,因此能够提高疾病预测处理的准确率。
上述条件概率能够表征疾病特征与疾病之间的匹配程度或疾病特征对疾病的重要程度,因此,将条件概率应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
上述惩罚因子能够表征疾病特征对于疾病的排除程度,进而能够综合确定多种疾病特征对于疾病的影响。例如,用户出现了不应该出现在某疾病中的特征,可以依据该惩罚因子降低该疾病的可能性,例如可以依据该惩罚因子降低该疾病的得分,进而能够提高与用户疾病特征相匹配的多种疾病之间的区分度。
临床占比能够表征疾病在疾病系统中的发病概率,可以反映对应疾病的常见性。将临床占比应用于疾病预测处理,能够提高与用户疾病特征相匹配的多种疾病之间的区分度。例如,在用户疾病特征对应多种疾病的情况下,可以依据多种疾病分别对应的临床占比,对多种疾病进行排序。
在将临床占比和系统概率应用于疾病预测处理的过程中,可以依据临床占比和系统概率确定疾病的先验概率,进而可以依据该先验概率对多种疾病进行排序。这样,可以提高与用户疾病特征相匹配的多种疾病之间的区分度。
参照图8,示出了本发明的一种知识图谱的使用装置实施例的结构框图,具体可以包括:问题实体获取模块801和问题确定模块802。
其中,问题实体获取模块801,用于依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;上述问题实体用于表征与上述疾病特征实体相关的问题.
问题确定模块802,用于依据上述问题实体,确定目标问题,上述目标问题用于对用户进行问诊。
可选地,上述问题实体可以包括:问题实体模板;上述问题确定模块802可以包括:
字段填充模块,用于依据上述目标疾病特征,对上述问题实体模板进行字段填充,以得到目标问题。
可选地,上述字段填充模块可以包括:
第一字段填充模块,用于依据属于一种类型的至少一种目标疾病特征,对上述类型对应的问题实体模板进行字段填充,以在得到的目标问题中携带至少一种目标疾病特征的信息。
可选地,上述问题实体模板的字段可以包括:问题文本字段和答案选项字段;
上述字段填充模块可以包括:
第二字段填充模块,用于在上述问题实体模板的答案选项字段中填充上述目标疾病特征的信息。
可选地,上述字段填充模块可以包括:
第三字段填充模块,用于依据上述目标疾病特征对应疾病特征实体中的命中动作属性,对上述问题实体模板的跳转关系字段进行填充。
可选地,上述问题实体可以包括:问题实体实例;上述问题确定模块802可以包括:
目标问题获取模块,用于从上述目标疾病特征对应的问题实体实例中,获取目标问题。
可选地,上述问题实体获取模块可以包括:
第一问题实体获取模块,用于在上述目标疾病特征对应的答案选项被选中的情况下,依据上述目标疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体;和/或
第二问题实体获取模块,用于在上述目标疾病特征对应的答案选项被选中的情况下,依据上述目标疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
可选地,上述目标疾病特征可以包括:
与用户疾病特征相关的疾病特征;和/或
候选疾病对应的疾病特征,上述候选疾病为对用户疾病特征进行疾病预测处理得到。
可选地,上述装置还可以包括:
查找模块,用于依据用户疾病特征,在疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
目标疾病特征确定模块,用于依据上述候选疾病对应的疾病特征,确定上述目标疾病特征。
综上,本发明实施例的知识图谱的使用装置,在问诊流程中,可以依据用户相关的疾病特征,在知识图谱中查找对应的问题实体,并依据查找得到的问题实体,得到用于问诊的问题。由于本发明实施例的知识图谱中疾病特征实体与问题实体之间的关联,可以在问诊流程中生成用于问诊的问题,因此能够提升知识图谱对问诊的作用,进而能够提高医疗信息的处理准确率。
并且,本发明实施例在疾病特征实体中通过命中动作属性表征了:疾病特征与问题实体的信息之间的关系,在对应疾病特征被选中的情况下,将触发对应的问题实体。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
另外,本发明实施例在问题实体中通过跳转关系字段表征了:疾病特征对应的答案选项被选中的情况下、将跳转至预设的问题实体,这样可以提高问诊流程中问题接序的合理性。由于可以自动进行疾病特征与问题实体之间的关联,因此不仅能够降低人工运营问诊路径所花费的资源成本,而且可以提高问诊流程中问题接序的合理性。
参照图9,示出了本发明的一种知识图谱的使用装置实施例的结构框图,具体可以包括:问题实体获取模块901、预设疾病问题确定模块902和建议输出模块903。
其中,问题实体获取模块901,用于依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;上述问题实体用于表征与上述预设疾病特征实体相关的问题。
预设疾病问题确定模块902,用于依据上述问题实体,确定预设疾病问题;上述预设疾病问题可以包括:问题文本、以及至少一个预设选项。
建议输出模块903,用于若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
综上,本发明实施例的知识图谱的使用装置,在问诊过程中,依据预设疾病特征实体对应的问题实体,确定预设疾病问题,并利用预设疾病问题对用户进行问诊;可以在问诊过程中进行危急程度和/或严重程度较高的预设疾病的排除,进而可以提高医疗信息处理的安全性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于构建知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
图10是根据一示例性实施例示出的一种用于构建知识图谱的装置1100的框图。例如,装置1100可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图10,装置1100可以包括以下一个或多个组件:处理组件1102,存储器1104,电源组件1106,多媒体组件1108,音频组件1110,输入/输出(I/O)的接口1112,传感器组件1114,以及通信组件1116。
处理组件1102通常控制装置1100的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1102可以包括一个或多个处理器1120来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1102可以包括一个或多个模块,便于处理组件1102和其他组件之间的交互。例如,处理组件1102可以包括多媒体模块,以方便多媒体组件1108和处理组件1102之间的交互。
存储器1104被配置为存储各种类型的数据以支持在设备1100的操作。这些数据的示例包括用于在装置1100上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件1106为装置1100的各种组件提供电力。电源组件1106可以包括电源管理系统,一个或多个电源,及其他与为装置1100生成、管理和分配电力相关联的组件。
多媒体组件1108包括在所述装置1100和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1108包括一个前置摄像头和/或后置摄像头。当设备1100处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1110被配置为输出和/或输入音频信号。例如,音频组件1110包括一个麦克风(MIC),当装置1100处于操作模式,如呼叫模式、记录模式和语音数据处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1104或经由通信组件1116发送。在一些实施例中,音频组件1110还包括一个扬声器,用于输出音频信号。
I/O接口1112为处理组件1102和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1114包括一个或多个传感器,用于为装置1100提供各个方面的状态评估。例如,传感器组件1114可以检测到设备1100的打开/关闭状态,组件的相对定位,例如所述组件为装置1100的显示器和小键盘,传感器组件1114还可以检测装置1100或装置1100一个组件的位置改变,用户与装置1100接触的存在或不存在,装置1100方位或加速/减速和装置1100的温度变化。传感器组件1114可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1114还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1114还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1116被配置为便于装置1100和其他设备之间有线或无线方式的通信。装置1100可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1116经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件1116还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频数据处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1100可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1104,上述指令可由装置1100的处理器1120执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图11是本发明的一些实施例中服务端的结构示意图。该服务端1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务端中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务端1900上执行存储介质1930中的一系列指令操作。
服务端1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务端或者终端)的处理器执行时,使得装置能够执行图3或图4所示的知识图谱的构建方法、或者图5或图6所示的知识图谱的使用方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务端或者终端)的处理器执行时,使得装置能够执行一种知识图谱的构建方法,所述方法包括:依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
本发明实施例公开了A1、一种知识图谱的构建方法,所述方法包括:
依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
A2、根据A1所述的方法,所述问题实体的字段包括:问题文本字段和答案选项字段。
A3、根据A2所述的方法,所述问题实体的字段还包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征对应的疾病特征实体;
所述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
所述跳转关系字段用于在选中答案选项的条件下执行预设跳转。
A4、根据A3所述的方法,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
A5、根据A2至A4中任一所述的方法,所述问题实体包括:
问题实体实例;所述问题实体实例的所有字段处于已填充状态;和/或
问题实体模板;所述问题实体模板的问题文本字段处于已填充状态,所述问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。
A6、根据A1至A4中任一所述的方法,所述疾病特征实体的属性包括:命中动作属性,所述命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
A7、根据A1至A4中任一所述的方法,所述疾病特征实体的属性包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。
A8、根据A1至A4中任一所述的方法,所述方法还包括:
在知识图谱中,建立所述疾病特征实体与疾病实体之间的关联;
所述疾病实体的属性包括如下属性中的至少一种:
疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
其中,所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;
所述临床占比属性用于表征疾病在疾病系统中的发病概率。
A9、根据A8所述的方法,所述疾病系统属性对应有系统概率,用于表征疾病系统的疾病的发病概率之和。
A10、根据A8所述的方法,所述特征集合属性的属性参数包括如下参数中的至少一种:
疾病特征在疾病的条件下的条件概率;
疾病特征在疾病的条件下的惩罚因子。
A11、根据A1至A4中任一所述的方法,所述方法还包括:
确定主诉列表,并确定所述主诉列表对应的疾病列表;
依据医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充;
依据所述主诉列表中主诉、以及扩充得到的疾病特征,确定疾病特征实体。
A12、根据A11所述的方法,所述确定主诉列表,包括:
从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
本发明实施例公开了B13、一种知识图谱的使用方法,所述方法包括:
依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体,确定目标问题,所述目标问题用于对用户进行问诊。
B14、根据B13所述的方法,所述问题实体包括:问题实体模板;所述确定目标问题,包括:
依据所述目标疾病特征,对所述问题实体模板进行字段填充,以得到目标问题。
B15、根据B14所述的方法,所述对所述问题实体模板进行字段填充,包括:
依据属于一种类型的至少一种目标疾病特征,对所述类型对应的问题实体模板进行字段填充,以在得到的目标问题中携带至少一种目标疾病特征的信息。
B16、根据B14所述的方法,所述问题实体模板的字段包括:问题文本字段和答案选项字段;
所述对所述问题实体模板进行字段填充,包括:
在所述问题实体模板的答案选项字段中填充所述目标疾病特征的信息。
B17、根据B14所述的方法,所述对所述问题实体模板进行字段填充,包括:
依据所述目标疾病特征对应疾病特征实体中的命中动作属性,对所述问题实体模板的跳转关系字段进行填充。
B18、根据B13所述的方法,所述问题实体包括:问题实体实例;所述确定目标问题,包括:
从所述目标疾病特征对应的问题实体实例中,获取目标问题。
B19、根据B13所述的方法,所述从知识图谱中获取对应的问题实体,包括:
在所述目标疾病特征对应的答案选项被选中的情况下,依据所述目标疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体;和/或
在所述目标疾病特征对应的答案选项被选中的情况下,依据所述目标疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
B20、根据B13至B19中任一所述的方法,所述目标疾病特征包括:
与用户疾病特征相关的疾病特征;和/或
候选疾病对应的疾病特征,所述候选疾病为对用户疾病特征进行疾病预测处理得到。
B21、根据B13至B19中任一所述的方法,所述方法还包括:
依据用户疾病特征,在疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
依据所述候选疾病对应的疾病特征,确定所述目标疾病特征。
本发明实施例公开了C22、一种知识图谱的使用方法,所述方法包括:
依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;所述问题实体用于表征与所述预设疾病特征实体相关的问题;
依据所述问题实体,确定预设疾病问题;所述预设疾病问题包括:问题文本、以及至少一个预设选项;
若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
本发明实施例公开了D23、一种知识图谱的构建装置,包括:
问题实体确定模块,用于依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
第一关联模块,用于在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
D24、根据D23所述的装置,所述问题实体的字段包括:问题文本字段和答案选项字段。
D25、根据D24所述的装置,所述问题实体的字段还包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征对应的疾病特征实体;
所述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
所述跳转关系字段用于在选中答案选项的条件下执行预设跳转。
D26、根据D25所述的装置,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
D27、根据D24至D26中任一所述的装置,所述问题实体包括:
问题实体实例;所述问题实体实例的所有字段处于已填充状态;和/或
问题实体模板;所述问题实体模板的问题文本字段处于已填充状态,所述问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。
D28、根据D23至D26中任一所述的装置,所述疾病特征实体的属性包括:命中动作属性,所述命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
D29、根据D23至D26中任一所述的装置,所述疾病特征实体的属性包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。
D30、根据D23至D26中任一所述的装置,所述装置还包括:
第二关联模块,用于在知识图谱中,建立所述疾病特征实体与疾病实体之间的关联;
所述疾病实体的属性包括如下属性中的至少一种:
疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
其中,所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;
所述临床占比属性用于表征疾病在疾病系统中的发病概率。
D31、根据D30所述的装置,所述疾病系统属性对应有系统概率,用于表征疾病系统的疾病的发病概率之和。
D32、根据D30所述的装置,所述特征集合属性的属性参数包括如下参数中的至少一种:
疾病特征在疾病的条件下的条件概率;
疾病特征在疾病的条件下的惩罚因子。
D33、根据D23至D26中任一所述的装置,所述装置还包括:
主诉确定模块,用于确定主诉列表,并确定所述主诉列表对应的疾病列表;
特征扩充模块,用于依据医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充;
疾病特征实体确定模块,用于依据所述主诉列表中主诉、以及扩充得到的疾病特征,确定疾病特征实体。
D34、根据D33所述的装置,所述主诉确定模块,包括:
主诉处理模块,用于从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
本发明实施例公开了E35、一种知识图谱的使用装置,所述装置包括:
问题实体获取模块,用于依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;以及
问题确定模块,用于依据所述问题实体,确定目标问题,所述目标问题用于对用户进行问诊。
E36、根据E35所述的装置,所述问题实体包括:问题实体模板;所述问题确定模块包括:
字段填充模块,用于依据所述目标疾病特征,对所述问题实体模板进行字段填充,以得到目标问题。
E37、根据E36所述的装置,所述字段填充模块包括:
第一字段填充模块,用于依据属于一种类型的至少一种目标疾病特征,对所述类型对应的问题实体模板进行字段填充,以在得到的目标问题中携带至少一种目标疾病特征的信息。
E38、根据E36所述的装置,所述问题实体模板的字段包括:问题文本字段和答案选项字段;
所述字段填充模块包括:
第二字段填充模块,用于在所述问题实体模板的答案选项字段中填充所述目标疾病特征的信息。
E39、根据E36所述的装置,所述字段填充模块包括:
第三字段填充模块,用于依据所述目标疾病特征对应疾病特征实体中的命中动作属性,对所述问题实体模板的跳转关系字段进行填充。
E40、根据E35所述的装置,所述问题实体包括:问题实体实例;所述问题确定模块包括:
目标问题获取模块,用于从所述目标疾病特征对应的问题实体实例中,获取目标问题。
E41、根据E35所述的装置,所述问题实体获取模块包括:
第一问题实体获取模块,用于在所述目标疾病特征对应的答案选项被选中的情况下,依据所述目标疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体;和/或
第二问题实体获取模块,用于在所述目标疾病特征对应的答案选项被选中的情况下,依据所述目标疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
E42、根据E35至E41中任一所述的装置,所述目标疾病特征包括:
与用户疾病特征相关的疾病特征;和/或
候选疾病对应的疾病特征,所述候选疾病为对用户疾病特征进行疾病预测处理得到。
E43、根据E35至E41中任一所述的装置,所述装置还包括:
查找模块,用于依据用户疾病特征,在疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
目标疾病特征确定模块,用于依据所述候选疾病对应的疾病特征,确定所述目标疾病特征。
本发明实施例公开了F44、一种知识图谱的使用装置,所述装置包括:
问题实体获取模块,用于依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;所述问题实体用于表征与所述预设疾病特征实体相关的问题;
预设疾病问题确定模块,用于依据所述问题实体,确定预设疾病问题;所述预设疾病问题包括:问题文本、以及至少一个预设选项;以及
建议输出模块,用于若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
本发明实施例公开了G45、一种用于构建知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
G46、根据G45所述的装置,所述问题实体的字段包括:问题文本字段和答案选项字段。
G47、根据G46所述的装置,所述问题实体的字段还包括如下字段中的至少一种:疾病特征字段、触发条件字段、以及跳转关系字段;
其中,所述疾病特征字段用于表征对应的疾病特征实体;
所述触发条件字段用于表征对应的问题实体依据疾病特征实体触发得到;
所述跳转关系字段用于在选中答案选项的条件下执行预设跳转。
G48、根据G47所述的装置,所述跳转关系字段用于在选中答案选项的条件下,从第一问题实体跳转至第二问题实体,第一问题实体对应的疾病特征实体与所述第二问题实体对应的疾病特征实体为父子关系。
G49、根据G45至G47中任一所述的装置,所述问题实体包括:
问题实体实例;所述问题实体实例的所有字段处于已填充状态;和/或
问题实体模板;所述问题实体模板的问题文本字段处于已填充状态,所述问题实体模板的除了问题文本字段之外的预设字段处于未填充状态。
G50、根据G45至G48中任一所述的装置,所述疾病特征实体的属性包括:命中动作属性,所述命中动作属性用于表征在对应疾病特征实体被选中的情况下,触发的问题实体的信息。
G51、根据G45至G48中任一所述的装置,所述疾病特征实体的属性包括:从属关系属性,用于表征与对应疾病特征实体具有父子关系的疾病特征实体。
G52、根据G45至G48中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在知识图谱中,建立所述疾病特征实体与疾病实体之间的关联;
所述疾病实体的属性包括如下属性中的至少一种:
疾病标识属性、疾病系统属性、特征集合属性、临床占比属性、以及高发年龄属性;
其中,所述特征集合中包括:与所述疾病特征实体相关联的疾病特征;
所述临床占比属性用于表征疾病在疾病系统中的发病概率。
G53、根据G52所述的装置,所述疾病系统属性对应有系统概率,用于表征疾病系统的疾病的发病概率之和。
G54、根据G52所述的装置,所述特征集合属性的属性参数包括如下参数中的至少一种:
疾病特征在疾病的条件下的条件概率;
疾病特征在疾病的条件下的惩罚因子。
G55、根据G45至G48中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定主诉列表,并确定所述主诉列表对应的疾病列表;
依据医疗资源,对所述疾病列表中的疾病进行疾病特征的扩充;
依据所述主诉列表中主诉、以及扩充得到的疾病特征,确定疾病特征实体。
G56、根据G55所述的装置,所述确定主诉列表,包括:
从医疗查询数据和/或病历数据中获取主诉,根据预设的标准筛选主诉,并依据筛选后的主诉建立主诉列表。
本发明实施例公开了H57、一种用于使用知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体,确定目标问题,所述目标问题用于对用户进行问诊。
H58、根据H57所述的装置,所述问题实体包括:问题实体模板;所述确定目标问题,包括:
依据所述目标疾病特征,对所述问题实体模板进行字段填充,以得到目标问题。
H59、根据H58所述的装置,所述对所述问题实体模板进行字段填充,包括:
依据属于一种类型的至少一种目标疾病特征,对所述类型对应的问题实体模板进行字段填充,以在得到的目标问题中携带至少一种目标疾病特征的信息。
H60、根据H58所述的装置,所述问题实体模板的字段包括:问题文本字段和答案选项字段;
所述对所述问题实体模板进行字段填充,包括:
在所述问题实体模板的答案选项字段中填充所述目标疾病特征的信息。
H61、根据H58所述的装置,所述对所述问题实体模板进行字段填充,包括:
依据所述目标疾病特征对应疾病特征实体中的命中动作属性,对所述问题实体模板的跳转关系字段进行填充。
H62、根据H57所述的装置,所述问题实体包括:问题实体实例;所述确定目标问题,包括:
从所述目标疾病特征对应的问题实体实例中,获取目标问题。
H63、根据H57所述的装置,所述从知识图谱中获取对应的问题实体,包括:
在所述目标疾病特征对应的答案选项被选中的情况下,依据所述目标疾病特征对应的疾病特征实体中的命中动作属性,从知识图谱中获取对应的问题实体;和/或
在所述目标疾病特征对应的答案选项被选中的情况下,依据所述目标疾病特征对应问题实体中的跳转关系字段,从知识图谱中获取对应的问题实体。
H64、根据H57至H63中任一所述的装置,所述目标疾病特征包括:
与用户疾病特征相关的疾病特征;和/或
候选疾病对应的疾病特征,所述候选疾病为对用户疾病特征进行疾病预测处理得到。
H65、根据H57至H63中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据用户疾病特征,在疾病实体与疾病特征实体之间的关联关系中进行查找,以得到候选疾病;
依据所述候选疾病对应的疾病特征,确定所述目标疾病特征。
本发明实施例公开了I66、一种用于使用知识图谱的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;所述问题实体用于表征与所述预设疾病特征实体相关的问题;
依据所述问题实体,确定预设疾病问题;所述预设疾病问题包括:问题文本、以及至少一个预设选项;
若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
本发明实施例公开了J67、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A12中一个或多个所述的知识图谱的构建方法。
本发明实施例公开了K68、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如B13至B21中一个或多个所述的知识图谱的使用方法。
本发明实施例公开了L69、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如C22所述的知识图谱的使用方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种知识图谱的构建方法、一种知识图谱的处理构建和一种用于构建知识图谱的装置、一种知识图谱的使用方法、一种知识图谱的使用装置和一种用于使用知识图谱的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种知识图谱的构建方法,其特征在于,所述方法包括:
依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
2.一种知识图谱的使用方法,其特征在于,所述方法包括:
依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体,确定目标问题,所述目标问题用于对用户进行问诊。
3.一种知识图谱的使用方法,其特征在于,所述方法包括:
依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;所述问题实体用于表征与所述预设疾病特征实体相关的问题;
依据所述问题实体,确定预设疾病问题;所述预设疾病问题包括:问题文本、以及至少一个预设选项;
若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
4.一种知识图谱的构建装置,其特征在于,包括:
问题实体确定模块,用于依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
第一关联模块,用于在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
5.一种知识图谱的使用装置,其特征在于,所述装置包括:
问题实体获取模块,用于依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;以及
问题确定模块,用于依据所述问题实体,确定目标问题,所述目标问题用于对用户进行问诊。
6.一种知识图谱的使用装置,其特征在于,所述装置包括:
问题实体获取模块,用于依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;所述问题实体用于表征与所述预设疾病特征实体相关的问题;
预设疾病问题确定模块,用于依据所述问题实体,确定预设疾病问题;所述预设疾病问题包括:问题文本、以及至少一个预设选项;以及
建议输出模块,用于若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
7.一种用于构建知识图谱的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据疾病特征实体,确定问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
在知识图谱中,建立所述疾病特征实体与所述问题实体之间的关联。
8.一种用于使用知识图谱的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据目标疾病特征对应的疾病特征实体,从知识图谱中获取对应的问题实体;所述问题实体用于表征与所述疾病特征实体相关的问题;
依据所述问题实体,确定目标问题,所述目标问题用于对用户进行问诊。
9.一种用于使用知识图谱的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据用户疾病特征,从知识图谱中获取预设疾病特征实体对应的问题实体;所述问题实体用于表征与所述预设疾病特征实体相关的问题;
依据所述问题实体,确定预设疾病问题;所述预设疾病问题包括:问题文本、以及至少一个预设选项;
若接收到用户针对任一预设选项的选择操作,则输出对应的就医建议信息。
10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1所述的知识图谱的构建方法。
11.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求2所述的知识图谱的使用方法。
12.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求3所述的知识图谱的使用方法。
CN202110106769.1A 2021-01-26 2021-01-26 知识图谱的构建方法和使用方法、装置和介质 Pending CN112749287A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110106769.1A CN112749287A (zh) 2021-01-26 2021-01-26 知识图谱的构建方法和使用方法、装置和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110106769.1A CN112749287A (zh) 2021-01-26 2021-01-26 知识图谱的构建方法和使用方法、装置和介质

Publications (1)

Publication Number Publication Date
CN112749287A true CN112749287A (zh) 2021-05-04

Family

ID=75653227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110106769.1A Pending CN112749287A (zh) 2021-01-26 2021-01-26 知识图谱的构建方法和使用方法、装置和介质

Country Status (1)

Country Link
CN (1) CN112749287A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113284629A (zh) * 2021-07-16 2021-08-20 成都索贝数码科技股份有限公司 一种基于医疗大数据、依据社会属性构建疾病画像的方法
CN116028603A (zh) * 2022-06-07 2023-04-28 成都成电金盘健康数据技术有限公司 一种基于大数据的智能预问诊方法及装置、系统、存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182262A (zh) * 2018-01-04 2018-06-19 华侨大学 基于深度学习和知识图谱的智能问答系统构建方法和系统
CN108461151A (zh) * 2017-12-15 2018-08-28 北京大学深圳研究生院 一种知识图谱的逻辑增强方法及装置
CN109448838A (zh) * 2018-09-28 2019-03-08 小伍健康科技(上海)有限责任公司 一种基于深度神经网络的症状诊断方法及设备
CN109817329A (zh) * 2019-01-21 2019-05-28 暗物智能科技(广州)有限公司 一种医疗问诊对话系统以及应用于该系统的强化学习方法
CN110504028A (zh) * 2019-08-22 2019-11-26 上海软中信息系统咨询有限公司 一种疾病问诊方法、装置、系统、计算机设备和存储介质
CN111180081A (zh) * 2019-12-30 2020-05-19 众安信息技术服务有限公司 一种智能问诊方法及装置
CN111950285A (zh) * 2020-07-31 2020-11-17 合肥工业大学 多模态数据融合的医疗知识图谱智能自动构建系统和方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108461151A (zh) * 2017-12-15 2018-08-28 北京大学深圳研究生院 一种知识图谱的逻辑增强方法及装置
CN108182262A (zh) * 2018-01-04 2018-06-19 华侨大学 基于深度学习和知识图谱的智能问答系统构建方法和系统
CN109448838A (zh) * 2018-09-28 2019-03-08 小伍健康科技(上海)有限责任公司 一种基于深度神经网络的症状诊断方法及设备
CN109817329A (zh) * 2019-01-21 2019-05-28 暗物智能科技(广州)有限公司 一种医疗问诊对话系统以及应用于该系统的强化学习方法
CN110504028A (zh) * 2019-08-22 2019-11-26 上海软中信息系统咨询有限公司 一种疾病问诊方法、装置、系统、计算机设备和存储介质
CN111180081A (zh) * 2019-12-30 2020-05-19 众安信息技术服务有限公司 一种智能问诊方法及装置
CN111950285A (zh) * 2020-07-31 2020-11-17 合肥工业大学 多模态数据融合的医疗知识图谱智能自动构建系统和方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113284629A (zh) * 2021-07-16 2021-08-20 成都索贝数码科技股份有限公司 一种基于医疗大数据、依据社会属性构建疾病画像的方法
CN116028603A (zh) * 2022-06-07 2023-04-28 成都成电金盘健康数据技术有限公司 一种基于大数据的智能预问诊方法及装置、系统、存储介质
CN116028603B (zh) * 2022-06-07 2023-12-19 成都成电金盘健康数据技术有限公司 一种基于大数据的智能预问诊方法及装置、系统、存储介质

Similar Documents

Publication Publication Date Title
CN111859020B (zh) 推荐方法、装置、电子设备及计算机可读存储介质
US20230268073A1 (en) Inquiry information processing method and apparatus, and medium
CN110232137B (zh) 一种数据处理方法、装置和电子设备
CN111339744B (zh) 票务信息展示方法、装置及存储介质
CN106777016B (zh) 基于即时通信进行信息推荐的方法及装置
CN111708943A (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN112749287A (zh) 知识图谱的构建方法和使用方法、装置和介质
CN113099297A (zh) 卡点视频的生成方法、装置、电子设备及存储介质
CN109862421A (zh) 一种视频信息识别方法、装置、电子设备及存储介质
CN109213942A (zh) 一种搜索结果展示方法及装置
CN108460138A (zh) 音乐推荐方法、装置、设备及存储介质
CN112035705A (zh) 标签生成方法及装置、电子设备和存储介质
CN115512829A (zh) 疾病诊断相关分组的获取方法、装置及介质
CN112000840B (zh) 一种业务对象的展示方法和装置
CN111246255B (zh) 视频推荐方法、装置、存储介质、终端及服务器
CN111241844A (zh) 一种信息推荐方法及装置
CN110634570A (zh) 一种诊断仿真方法及相关装置
CN112749286A (zh) 知识图谱的构建和使用方法、装置和介质
CN112507123A (zh) 一种数据处理方法及装置
CN109977303A (zh) 多媒体信息的交互方法、装置及存储介质
CN114676308A (zh) 搜索词推荐方法、装置、电子设备、存储介质及产品
CN112083811B (zh) 一种候选项展示方法和装置
CN113792178A (zh) 一种歌曲生成方法、装置、电子设备及存储介质
CN112069405A (zh) 周期性事件的处理方法和装置
CN113076430B (zh) 一种基于医疗问题的数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination