CN111768869B - 面向智能问答系统的医学指南图谱化构建搜索系统及方法 - Google Patents

面向智能问答系统的医学指南图谱化构建搜索系统及方法 Download PDF

Info

Publication number
CN111768869B
CN111768869B CN202010913175.7A CN202010913175A CN111768869B CN 111768869 B CN111768869 B CN 111768869B CN 202010913175 A CN202010913175 A CN 202010913175A CN 111768869 B CN111768869 B CN 111768869B
Authority
CN
China
Prior art keywords
entity
disease
matrix
medical
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010913175.7A
Other languages
English (en)
Other versions
CN111768869A (zh
Inventor
温序铭
王明洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Sobey Digital Technology Co Ltd
Original Assignee
Chengdu Sobey Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Sobey Digital Technology Co Ltd filed Critical Chengdu Sobey Digital Technology Co Ltd
Priority to CN202010913175.7A priority Critical patent/CN111768869B/zh
Publication of CN111768869A publication Critical patent/CN111768869A/zh
Application granted granted Critical
Publication of CN111768869B publication Critical patent/CN111768869B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种面向智能问答系统的医学指南图谱化构建搜索系统及方法,包括步骤:将医学指南构建为医疗知识图谱;用矩阵对用户输入进行表征得到关键词表征矩阵,并将关键词表征矩阵与知识图谱表征矩阵进行匹配计算矩阵相似度,并根据矩阵相似度输出问诊结果等;本发明有利于提高智能问答系统问诊的效率和精确度。

Description

面向智能问答系统的医学指南图谱化构建搜索系统及方法
技术领域
本发明涉及一种面向智能问答系统的医学指南图谱化构建搜索系统及方法。
背景技术
随着互联网技术的发展,越来越多的患者会提前根据网上的医学指南进行查询相关病症表现及所属科室,然后选择去医院挂号就诊。早期的医疗问答系统主要是利用信息检索、数据库等技术,由于中文语言表达系统的特殊性,使得相同疾病的表述存在多种形式,在应对患者千变万化的问题时展现出巨大的局限性,同时对于隐含的、但却是用户真正关注的问题的推断能力欠缺。
发明内容
本发明的目的在于克服现有技术的不足,提供一种面向智能问答系统的医学指南图谱化构建搜索系统及方法,减少了实际匹配过程中消耗的时间和完成了实体消歧,有助于提高问诊的效率和精确度。
本发明的目的是通过以下方案实现的:
一种面向智能问答系统的医学指南图谱化构建搜索方法,包括:
将医学指南构建为医疗知识图谱;用矩阵对用户输入进行表征得到关键词表征矩阵,并将关键词表征矩阵与知识图谱表征矩阵进行匹配计算矩阵相似度,并根据矩阵相似度输出问诊结果。
进一步地,将医学指南构建为医疗知识图谱包括:
S1,收集数据,收集医学指南数据;
S2,基于收集数据设计图谱,以疾病为中心,将医学指南数据作为结点,并设置结点与中心的属性关系;
S3,基于设计图谱清洗数据,并基于实体链接的实体消歧进行数据清洗。
进一步地,在步骤S3中,基于设计图谱清洗数据包括:
S31,实体链接输入,输入医学指南知识库、消歧实体指称项及其上下文信息;
S32,对输入的实体链接进行链接候选过滤,根据医学领域知识和规则过滤指称项不可能指向的实体,保留链接实体候选;
S33,对过滤后的实体链接确定实体链接最终指向,给定指称项及其链接候选,确定该实体指称项最终指向的目标实体;
S34,计算实体指称项的候选实体概念与指称项上下文中的其他实体概念的一致性打分,作为实体链接采用主题一致模型,一致性的依据。
进一步地,在步骤S34中,使用实体与文本内其他实体的语义关联的平均值作为重 要程度的打分
Figure 238644DEST_PATH_IMAGE001
Figure 421363DEST_PATH_IMAGE002
其中,
Figure 404363DEST_PATH_IMAGE003
是实体指称项上下文中所有实体的结合,
Figure 455364DEST_PATH_IMAGE004
是实体
Figure 800895DEST_PATH_IMAGE005
和实体
Figure 764303DEST_PATH_IMAGE006
之间 的语义关联值;使用目标实体与上下文中其他实体的加权语义关联平均作为一致性打分
Figure 483866DEST_PATH_IMAGE007
Figure 948346DEST_PATH_IMAGE008
其中,
Figure 23749DEST_PATH_IMAGE003
是实体指称项,
Figure 472572DEST_PATH_IMAGE009
是实体
Figure 492481DEST_PATH_IMAGE005
的权重,而
Figure 636018DEST_PATH_IMAGE004
是实体之间的语义关 联度。
进一步地,所述医学指南数据包括疾病简介、病因、预防、症状、所属科室、治疗、并发症、潜伏期中的任一种或多种。
进一步地,在步骤S31中医学指南知识库包括疾病实体表、疾病的文本描述、疾病的结构化信息、疾病的辅助信息。
进一步地,包括用户输入解析步骤:对用户的输入进行问句解析,通过对用户问句中的关键词解析,对问句进行分类,提取问句中病症关键词。
进一步地,构建Transformer编码器对提取到的病症关键词编码,得到用户输入表征矩阵。
进一步地,构建Transformer编码器对知识图谱中疾病症状图进行编码得到疾病转换矩阵;用户输入表征矩阵和疾病转换矩阵采用Transformer相似度算法计算矩阵相似度,得出关键词表征矩阵和知识图谱表征矩阵相似度最高的结果,即为患者询问的病症,按照知识图谱与此实体对应的关系得到输出结果。
一种基于如上任一所述面向智能问答系统的医学指南图谱化构建搜索方法的系统,包括关键词模板库,且关键词模板库实时更新;在关键词模板库中包含症状、原因、并发症、用药、预防、持续时间、治疗、易感人群、所属科室、用途中的任一种或多种。
本发明的有益效果是:
(1)本发明简化了网络结构,在Transformer网络结构中仅使用了编码器部分,将用户问题关键词和知识图谱实体进行编码转换成矩阵,对比矩阵的相似度进行疾病匹配,使得在实际匹配过程中消耗的时间更少,从而有利于提高智能问答系统问诊的效率。
(2)本发明合理使用了实体消歧,因为医疗知识实体提取已知给定,所以使用基于实体链接的实体消歧方法,能够根据实体指称项的候选实体概念与指称项上下文中的其他实体概念的一致性程度进行打分,从而完成了实体消歧,有利于提高智能问答系统的问诊搜索精确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明系统的执行流程示意图;
图2为本发明的实施例采用Transformer算法计算矩阵相似度的流程图;
图3为本发明的数据清洗示意图。
具体实施方式
本说明书中所有实施例公开的所有特征(包括任何附加权利要求、摘要和附图),或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合或替换。
如图1~3所示,一种面向智能问答系统的医学指南图谱化构建搜索系统,包括步骤:
将医学指南构建为医疗知识图谱;用矩阵对用户输入进行表征得到关键词表征矩阵,并将关键词表征矩阵与知识图谱表征矩阵进行匹配计算矩阵相似度,并根据矩阵相似度输出问诊结果。
进一步地,将医学指南构建为医疗知识图谱包括步骤:
S1,收集数据,收集医学指南数据;
S2,设计图谱,以疾病为中心,将医学指南数据作为结点,并设置结点与中心的属性关系;
S3,清洗数据,基于实体链接的实体消歧进行数据清洗。
进一步地,在步骤S3中,包括步骤:
S31,实体链接输入,输入医学指南知识库、消歧实体指称项及其上下文信息;
S32,链接候选过滤,根据医学领域知识和规则过滤指称项不可能指向的实体,保留链接实体候选;
S33,确定实体链接最终指向,给定指称项及其链接候选,确定该实体指称项最终指向的目标实体。
S34,计算实体指称项的候选实体概念与指称项上下文中的其他实体概念的一致性打分,作为实体链接采用主题一致模型,一致性的依据。
进一步地,在步骤S34中,使用实体与文本内其他实体的语义关联的平均值作为重 要程度的打分
Figure 611933DEST_PATH_IMAGE001
Figure 572935DEST_PATH_IMAGE002
其中,
Figure 955506DEST_PATH_IMAGE010
是实体指称项上下文中所有实体的结合,
Figure 683160DEST_PATH_IMAGE004
是实体
Figure 857789DEST_PATH_IMAGE005
和实体
Figure 599480DEST_PATH_IMAGE006
之间 的语义关联值;使用目标实体与上下文中其他实体的加权语义关联平均作为一致性打分
Figure 859560DEST_PATH_IMAGE007
Figure 328588DEST_PATH_IMAGE008
其中,
Figure 357724DEST_PATH_IMAGE003
是实体指称项,
Figure 332633DEST_PATH_IMAGE009
是实体
Figure 936134DEST_PATH_IMAGE005
的权重,而
Figure 349798DEST_PATH_IMAGE004
是实体之间的语义关 联度。
进一步地,所述医学指南数据包括疾病简介、病因、预防、症状、所属科室、治疗、并发症、潜伏期中的任一种或多种。
进一步地,在步骤S31中医学指南知识库包括疾病实体表、疾病的文本描述、疾病的结构化信息、疾病的辅助信息。
进一步地,包括用户输入解析步骤:对用户的输入进行问句解析,通过对用户问句中的关键词解析,对问句进行分类,提取问句中病症关键词。
进一步地,构建Transformer编码器对提取到的病症关键词编码,得到用户输入表征矩阵。
进一步地,构建Transformer编码器对知识图谱中疾病症状图进行编码得到疾病转换矩阵;用户输入表征矩阵和疾病转换矩阵采用Transformer相似度算法计算矩阵相似度,得出关键词表征矩阵和知识图谱表征矩阵相似度最高的结果,即为患者询问的病症,按照知识图谱与此实体对应的关系得到输出结果。
一种基于如上任一所述面向智能问答系统的医学指南图谱化构建搜索系统的方法,包括关键词模板库,且关键词模板库实时更新;
在本发明的其他实施方式中,一种面向智能问答系统的医学指南图谱化构建搜索系统,包括:
医疗知识图谱构建模块,用于将医学指南构建为医疗知识图谱;表征模块,用矩阵对用户输入进行表征得到关键词表征矩阵;矩阵相似度计算模块,用于将关键词表征矩阵与知识图谱表征矩阵进行匹配计算矩阵相似度;输出模块,用于根据矩阵相似度输出问诊结果。
可选地,医疗知识图谱构建模块包括:
数据收集模块,用于收集医学指南数据;
设计图谱模块,以疾病为中心,将医学指南数据作为结点,并设置结点与中心的属性关系;
数据清洗模块,基于实体链接的实体消歧进行数据清洗。
可选地,在数据清洗模块中,包括:
实体链接输入模块,用于输入医学指南知识库、消歧实体指称项及其上下文信息;
链接候选过滤模块,用于根据医学领域知识和规则过滤指称项不可能指向的实体,保留链接实体候选;
实体链接最终指向模块,用于给定指称项及其链接候选,确定该实体指称项最终指向的目标实体。
打分计算模块,用于计算实体指称项的候选实体概念与指称项上下文中的其他实体概念的一致性打分,作为实体链接采用主题一致模型,一致性的依据。
可选地,在打分计算模块中,使用实体与文本内其他实体的语义关联的平均值作 为重要程度的打分
Figure 843227DEST_PATH_IMAGE001
Figure 316934DEST_PATH_IMAGE002
其中,
Figure 207398DEST_PATH_IMAGE003
是实体指称项上下文中所有实体的结合,
Figure 34540DEST_PATH_IMAGE004
是实体
Figure 772689DEST_PATH_IMAGE005
和实体
Figure 338668DEST_PATH_IMAGE006
之间 的语义关联值;使用目标实体与上下文中其他实体的加权语义关联平均作为一致性打分
Figure 670424DEST_PATH_IMAGE007
Figure 160311DEST_PATH_IMAGE008
其中,
Figure 674338DEST_PATH_IMAGE003
是实体指称项,
Figure 99634DEST_PATH_IMAGE011
是实体
Figure 43319DEST_PATH_IMAGE005
的权重,而
Figure 730040DEST_PATH_IMAGE004
是实体之间的语义关 联度。
可选地,医学指南数据包括疾病简介、病因、预防、症状、所属科室、治疗、并发症、潜伏期中的任一种或多种。
可选地,在实体链接输入模块中医学指南知识库包括疾病实体表、疾病的文本描述、疾病的结构化信息、疾病的辅助信息。
可选地,包括用户输入解析步骤:对用户的输入进行问句解析,通过对用户问句中的关键词解析,对问句进行分类,提取问句中病症关键词。
可选地,构建Transformer编码器对提取到的病症关键词编码,得到用户输入表征矩阵。
可选地,构建Transformer编码器对知识图谱中疾病症状图进行编码得到疾病转换矩阵;用户输入表征矩阵和疾病转换矩阵采用Transformer相似度算法计算矩阵相似度,得出关键词表征矩阵和知识图谱表征矩阵相似度最高的结果,即为患者询问的病症,按照知识图谱与此实体对应的关系得到输出结果。
可选地,包括关键词模板库,且实时更新;在关键词模板库中包含症状、原因、并发症、用药、预防、持续时间、治疗、易感人群、所属科室、用途中的任一种或多种。
本发明设计了一种基于医学指南的智能问答系统制作方法,将现有的医学指南构建成医疗知识图谱,并根据Transformer相似度算法计算出患者问答中疾病的多维矩阵表示,匹配医学知识图谱中的疾病转换矩阵,找出患者真正关心的问题,根据医疗知识图谱给出医学建议,提高问诊的效率和精确度。
1、用户输入转换
此步骤完成用户的输入转换,供后续与知识图谱中相关病症进行匹配。对于用户的输入,基于规则匹配方式进行问句解析,通过对用户问句中的关键词解析,对问句进行分类,提取中病症关键词。关键词模板库包含症状、原因、并发症、用药、预防、持续时间、治疗、易感人群、所属科室、用途等关键词。以治疗关键词为例,其中包含“怎么治疗、如何治疗、如何医治、怎么治、医疗方式、疗法、可以治、可以医”等等关键词,因为医疗问题本身属于封闭域类场景,可以根据用户询问的关键词进行枚举,对于新的关键词,可随时加入模板匹配库。
根据匹配到的关键词,需要和知识图谱中的相似病症进行匹配,得出问诊结果。这一步使用自然语言处理中的Transformer算法进行相似度计算匹配。
首先构建Transformer编码器对提取到的关键词和知识图谱中疾病症状图进行编码,分别得到对应的表征矩阵,得到表征矩阵后进行矩阵相似度计算,得出关键词表征矩阵和知识图谱表征矩阵相似度最高的结果,即为患者询问的病症,按照知识图谱与此实体对应的关系得到输出结果。
2、知识图谱构建
此步骤对医学指南进行图谱化,包括对医学指南的数据收集、图谱设计、知识清洗,最后是知识存储,将医学指南以知识图谱的形式存放,为用户提供智能问答知识库。
i. 数据收集使用爬虫的形式,爬取网络上可靠来源的医学指南,包括疾病的简介、病因、预防、症状、所属科室、治疗、并发症、潜伏期等内容。
ii. 对于图谱设计,按照字典的形式建立结点,以疾病为中心,以病因、科室、并发症、潜伏期等为结点,并设置相应的属性关系。
iii. 完成数据收集和图谱设计之后,目标实体列表基本给定,此处使用基于实体链接的实体消歧系统进行数据清洗。实体链接的输入包括两部分:
(1)医学指南知识库:包括疾病实体表、疾病的文本描述、疾病的结构化信息、疾病的辅助信息
(2)待消歧实体指称项及其上下文信息
该阶段的步骤为:
链接候选过滤:根据医学领域知识和规则过滤大部分指称项不可能指向的实体,仅仅保留少量链接实体候选
实体链接:给定指称项及其链接候选,确定该实体指称项最终指向的目标实体。
实体链接采用主题一致模型,一致性依据:实体指称项的候选实体概念与指称项上下文中的其他实体概念的一致性程度。
计算一致性打分时,考虑如下两方面因素:
上下文实体的重要程度:与主题的相关程度。使用实体与文本内其他实体的语义关联的平均值作为重要程度的打分。
Figure 114885DEST_PATH_IMAGE002
其中,
Figure 835716DEST_PATH_IMAGE010
是实体指称项上下文中所有实体的结合
Figure 391331DEST_PATH_IMAGE004
是实体
Figure 223021DEST_PATH_IMAGE005
和实体
Figure 931214DEST_PATH_IMAGE006
之间 的语义关联值。使用目标实体与上下文中其他实体的加权语义关联平均作为一致性打分。
Figure 744318DEST_PATH_IMAGE008
其中,
Figure 865858DEST_PATH_IMAGE003
是实体指称项,
Figure 438922DEST_PATH_IMAGE011
是实体
Figure 595097DEST_PATH_IMAGE005
的权重,而
Figure 47943DEST_PATH_IMAGE004
是实体之间的语义关 联度。
本发明的关键点
1、使用爬虫技术、知识图谱构建技术完成医学指南图谱化设计,挖掘医学指南中的数据价值。
2、用户问答关键词基于规则匹配,并且可实时更新医疗关键词库,提高用户关键词识别精度。
3、使用深度学习算法对用户的问答进行相似度计算,找到与知识图谱中最接近的疾病分类,快速给用户带来疾病问答结果。
本发明的技术优点:
本发明基于深度学习思想,结合RNN中Transformer算法编码器和知识图谱构建技术实现将医学指南图谱化,建立智能问答系统,主要优势如下:
1、简化网络结构
Transformer算法中编码器与解码器是对应关系,完成文本识别或翻译,本发明在网络结构中仅使用编码器部分,将用户问题关键词和知识图谱实体进行编码转换成矩阵,对比矩阵的相似度进行疾病匹配,使得在实际匹配过程中消耗的时间更少。
2、合理使用实体消歧
因为医疗知识实体提取是已知给定,所以使用基于实体链接的实体消歧方法。根据实体指称项的候选实体概念与指称项上下文中的其他实体概念的一致性程度,根据一致性程度进行打分,完成实体消歧。
本发明功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (8)

1.一种面向智能问答系统的医学指南图谱化构建搜索方法,其特征在于,包括:
将医学指南构建为医疗知识图谱;用矩阵对用户输入进行表征得到关键词表征矩阵,并将关键词表征矩阵与知识图谱表征矩阵进行匹配计算矩阵相似度,并根据矩阵相似度输出问诊结果;
将医学指南构建为医疗知识图谱包括:
S1,收集数据,收集医学指南数据;
S2,基于收集数据设计图谱,以疾病为中心,将医学指南数据作为结点,并设置结点与中心的属性关系;
S3,基于设计图谱清洗数据,并基于实体链接的实体消歧进行数据清洗;
在步骤S3中,基于设计图谱清洗数据包括:
S31,实体链接输入,输入医学指南知识库、消歧实体指称项及其上下文信息;
S32,对输入的实体链接进行链接候选过滤,根据医学领域知识和规则过滤指称项不可能指向的实体,保留链接实体候选;
S33,对过滤后的实体链接确定实体链接最终指向,给定指称项及其链接候选,确定该实体指称项最终指向的目标实体;
S34,计算实体指称项的候选实体概念与指称项上下文中的其他实体概念的一致性打分,作为实体链接采用主题一致模型,一致性的依据。
2.根据权利要求1所述的面向智能问答系统的医学指南图谱化构建搜索方法,其特征 在于,在步骤S34中,使用实体与文本内其他实体的语义关联的平均值作为重要程度的打分
Figure DEST_PATH_IMAGE001
Figure DEST_PATH_IMAGE003
其中,
Figure 199865DEST_PATH_IMAGE004
是实体指称项上下文中所有实体的结合,
Figure DEST_PATH_IMAGE005
是实体
Figure 657391DEST_PATH_IMAGE006
和实体
Figure DEST_PATH_IMAGE007
之间的语 义关联值;使用目标实体与上下文中其他实体的加权语义关联平均作为一致性打分
Figure 534080DEST_PATH_IMAGE008
Figure 887701DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE011
是实体指称项,
Figure 482630DEST_PATH_IMAGE001
是实体
Figure 947110DEST_PATH_IMAGE006
的权重,而是实体之间的语义关联度。
3.根据权利要求1所述的面向智能问答系统的医学指南图谱化构建搜索方法,其特征在于,所述医学指南数据包括疾病简介、病因、预防、症状、所属科室、治疗、并发症、潜伏期中的任一种或多种。
4.根据权利要求1所述的面向智能问答系统的医学指南图谱化构建搜索方法,其特征在于,在步骤S31中医学指南知识库包括疾病实体表、疾病的文本描述、疾病的结构化信息、疾病的辅助信息。
5.根据权利要求1所述的面向智能问答系统的医学指南图谱化构建搜索方法,其特征在于,包括用户输入解析步骤:对用户的输入进行问句解析,通过对用户问句中的关键词解析,对问句进行分类,提取问句中病症关键词。
6.根据权利要求5所述的面向智能问答系统的医学指南图谱化构建搜索方法,其特征在于,构建Transformer编码器对提取到的病症关键词编码,得到用户输入表征矩阵。
7.根据权利要求6所述的面向智能问答系统的医学指南图谱化构建搜索方法,其特征在于,构建Transformer编码器对知识图谱中疾病症状图进行编码得到疾病转换矩阵;用户输入表征矩阵和疾病转换矩阵采用Transformer相似度算法计算矩阵相似度,得出关键词表征矩阵和知识图谱表征矩阵相似度最高的结果,即为患者询问的病症,按照知识图谱与此实体对应的关系得到输出结果。
8.一种基于如上任一所述面向智能问答系统的医学指南图谱化构建搜索方法的系统,其特征在于,包括关键词模板库,且关键词模板库实时更新;在关键词模板库中包含症状、原因、并发症、用药、预防、持续时间、治疗、易感人群、所属科室、用途中的任一种或多种。
CN202010913175.7A 2020-09-03 2020-09-03 面向智能问答系统的医学指南图谱化构建搜索系统及方法 Active CN111768869B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010913175.7A CN111768869B (zh) 2020-09-03 2020-09-03 面向智能问答系统的医学指南图谱化构建搜索系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010913175.7A CN111768869B (zh) 2020-09-03 2020-09-03 面向智能问答系统的医学指南图谱化构建搜索系统及方法

Publications (2)

Publication Number Publication Date
CN111768869A CN111768869A (zh) 2020-10-13
CN111768869B true CN111768869B (zh) 2020-12-11

Family

ID=72729234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010913175.7A Active CN111768869B (zh) 2020-09-03 2020-09-03 面向智能问答系统的医学指南图谱化构建搜索系统及方法

Country Status (1)

Country Link
CN (1) CN111768869B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111966884B (zh) * 2020-10-21 2021-01-26 北京妙医佳健康科技集团有限公司 一种信息推送方法和装置
CN112507123A (zh) * 2020-12-04 2021-03-16 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN112466463B (zh) * 2020-12-10 2023-08-18 求臻医学科技(浙江)有限公司 基于肿瘤精准诊疗知识图谱的智能解答系统
CN114168751B (zh) * 2021-12-06 2024-07-09 厦门大学 一种基于医学知识概念图的医学文本标签识别方法及系统
CN117370525A (zh) * 2023-10-20 2024-01-09 厦门狄耐克物联智慧科技有限公司 一种基于微调大模型的智能导诊方法
CN118093788B (zh) * 2024-04-22 2024-07-02 成都同步新创科技股份有限公司 一种基于大模型的中小企业知识库的构建与搜索方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083690A (zh) * 2019-04-10 2019-08-02 华侨大学 一种基于智能问答的对外汉语口语训练方法及系统
CN110569328A (zh) * 2019-07-31 2019-12-13 平安科技(深圳)有限公司 实体链接方法、电子装置及计算机设备
CN110853714A (zh) * 2019-10-21 2020-02-28 天津大学 基于致病贡献网络分析的药物重定位模型
CN111191014A (zh) * 2019-12-26 2020-05-22 上海科技发展有限公司 药品重定位方法、系统、终端以及介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783973B (zh) * 2016-08-24 2022-02-25 慧科讯业有限公司 基于行业知识图谱数据库对互联网媒体事件进行监测的方法、装置和系统
US11087211B2 (en) * 2017-10-05 2021-08-10 Salesforce.Com, Inc. Convolutional neural network (CNN)-based suggestions for anomaly input
CN110111905B (zh) * 2019-04-24 2021-09-03 云知声智能科技股份有限公司 一种医疗知识图谱的构建系统和构建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083690A (zh) * 2019-04-10 2019-08-02 华侨大学 一种基于智能问答的对外汉语口语训练方法及系统
CN110569328A (zh) * 2019-07-31 2019-12-13 平安科技(深圳)有限公司 实体链接方法、电子装置及计算机设备
CN110853714A (zh) * 2019-10-21 2020-02-28 天津大学 基于致病贡献网络分析的药物重定位模型
CN111191014A (zh) * 2019-12-26 2020-05-22 上海科技发展有限公司 药品重定位方法、系统、终端以及介质

Also Published As

Publication number Publication date
CN111768869A (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
CN111768869B (zh) 面向智能问答系统的医学指南图谱化构建搜索系统及方法
CN107729392B (zh) 文本结构化方法、装置、系统和非易失性存储介质
CN111292848B (zh) 一种基于贝叶斯估计的医疗知识图谱辅助推理方法
CN109684445B (zh) 口语化医疗问答方法及系统
CN111813957A (zh) 基于知识图谱的医疗导诊方法和可读存储介质
CN113707297A (zh) 医疗数据的处理方法、装置、设备及存储介质
JP5687269B2 (ja) 知識発見のための方法およびシステム
JP7464800B2 (ja) 小サンプル弱ラベル付け条件での医療イベント認識方法及びシステム
CN110706807A (zh) 一种基于本体语义相似度的医学问答方法
CN113764112A (zh) 一种在线医疗问答方法
CN115269865A (zh) 一种面向辅助诊断的知识图谱构建方法
CN113569023A (zh) 一种基于知识图谱的中文医药问答系统及方法
Gardner et al. Open-vocabulary semantic parsing with both distributional statistics and formal knowledge
CN112925918B (zh) 一种基于疾病领域知识图谱的问答匹配系统
CN116340544B (zh) 一种基于知识图谱的中医药古籍可视分析方法与系统
CN111597349B (zh) 一种基于人工智能的轨道交通规范实体关系自动补全方法
CN112883172B (zh) 一种基于双重知识选择的生物医学问答方法
Galitsky Multi-case-based reasoning by syntactic-semantic alignment and discourse analysis
CN109977235B (zh) 一种触发词的确定方法和装置
CN115186112B (zh) 一种基于辨证映射规则的医药数据检索方法及装置
Gao et al. Knowledge question-answering system based on knowledge graph of traditional Chinese medicine
CN116628219A (zh) 一种基于知识图谱的问答方法
CN114496231B (zh) 基于知识图谱的体质识别方法、装置、设备和存储介质
CN113868387A (zh) 一种基于改进tf-idf加权的word2vec医疗相似问题检索方法
CN109215797B (zh) 基于扩展关联规则的中医医案非分类关系抽取方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant