CN116244492A - 一种医疗导诊方法、装置及存储介质 - Google Patents
一种医疗导诊方法、装置及存储介质 Download PDFInfo
- Publication number
- CN116244492A CN116244492A CN202111477377.2A CN202111477377A CN116244492A CN 116244492 A CN116244492 A CN 116244492A CN 202111477377 A CN202111477377 A CN 202111477377A CN 116244492 A CN116244492 A CN 116244492A
- Authority
- CN
- China
- Prior art keywords
- entity
- target
- matrix
- preset
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Animal Behavior & Ethology (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种医疗导诊方法、装置及存储介质,方法包括:获取目标对象的主诉信息,并对主诉信息进行实体识别,得到至少一个实体;基于至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建目标图谱对应的连接关系矩阵;将至少一个实体进行特征融合,得到对应的融合特征矩阵;利用预设自注意力机制分类模型,基于连接关系矩阵和融合特征矩阵,确定目标图谱中每个实体对应的权重;从目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为目标对象的导诊推荐结果。通过上述技术方案,提高了医疗导诊的准确性。
Description
技术领域
本申请涉及语义解析和知识图谱技术领域,尤其涉及一种医疗导诊方法、装置及存储介质。
背景技术
随着医学水平和大数据技术的发展,公众获取基本医学信息的难度越来越低,但面对门槛较高的医学知识和网络上海量的鱼龙混杂的医学信息,如何筛选出符合自己需求的信息成了难点。并且,当今医疗资源愈发紧张,常有患者只知道症状和部位,不知道挂哪个科室的号,找哪位医生更合适,这些现象都大大较低了医疗资源的分配和利用效率。
目前,基于知识图谱的导诊方案一般聚焦于部位、症状和疾病对应的节点之间是否有连接关系,并直接将有连接关系的科室和医生作为导诊方案的进行推荐,或者根据以往病历统计症状与疾病的概率,进行科室和医生的推荐,准确性较低。
发明内容
为解决上述技术问题,本发明实施例期望提供一种医疗导诊方法、装置及存储介质,基于预设医疗关系图谱,深度挖掘患者主诉信息中各实体之间的关系,并结合各实体对应的融合特征信息,利用预设自注意力机制分类模型,为患者推荐导诊方案,提高了医疗导诊的准确性。
本发明的技术方案是这样实现的:
本发明提供了一种医疗导诊方法,所述方法包括:
获取目标对象的主诉信息,并对所述主诉信息进行实体识别,得到至少一个实体;
基于所述至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建所述目标图谱对应的连接关系矩阵;所述预设医疗关系图谱中设定有各种类型的各种实体之间的连接关系;
将所述至少一个实体进行特征融合,得到对应的融合特征矩阵;
利用预设自注意力机制分类模型,基于所述连接关系矩阵和所述融合特征矩阵,确定所述目标图谱中每个实体对应的权重;
从所述目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为所述目标对象的导诊推荐结果。
在上述方法中,所述基于所述至少一个实体,从预设医疗关系图谱中确定目标图谱,包括:
将所述预设医疗关系图谱中,与所述至少一个实体相连的每一个实体,确定为目标实体;
在基于所述目标实体确定出不满足预设实体查找停止条件的情况下,继续查找与所述目标实体相连的实体,并将查找到的实体继续确定为所述目标实体,直至基于所述目标实体确定出满足所述预设实体查找停止条件;
从所述预设医疗关系图谱中,选取包含所述目标实体和所述至少一个实体的区域,确定为所述目标图谱。
在上述方法中,所述构建所述目标图谱对应的连接关系矩阵,包括:
针对所述目标图谱中每个实体,确定与所述目标图谱中每个实体之间的连接数量,并利用确定的连接数量生成对应的一个向量;
将所述目标图谱中不同实体对应的向量进行组合,得到初始向量矩阵;
根据所述初始向量矩阵的维度,确定单位矩阵,并将所述初始向量矩阵与所述单位矩阵之和确定为所述连接关系矩阵。
在上述方法中,所述将所述至少一个实体进行特征融合,得到对应的融合特征矩阵,包括:
利用预设预训练语言模型,确定所述至少一个实体中每一个实体对应的特征向量,得到至少一个特征向量;
将所述至少一个特征向量进行组合,得到所述至少一个实体对应的整体特征向量;
将所述至少一个特征向量中每个特征向量与所述整体特征向量进行融合,得到所述融合特征矩阵。
在上述方法中,所述利用预设自注意力机制分类模型,基于所述连接关系矩阵和所述融合特征矩阵,确定所述目标图谱中每个实体对应的权重,包括:
将所述融合特征矩阵和所述连接关系矩阵之积,确定为联合特征矩阵;
将所述联合特征矩阵输入所述预设自注意力机制分类模型,得到所述目标图谱中每个实体对应的权重。
在上述方法中,所述从所述目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为所述目标对象的导诊推荐结果,包括:
将所述目标图谱中,同一类型的实体划分到同一组,得到至少一个实体类型组;
针对所述至少一个实体类型组中每个实体类型组,从对应的实体类型组中选取出对应权重满足预设权重条件的实体,确定为所述导诊推荐结果。
在上述方法中,所述利用预设自注意力机制分类模型,基于所述连接关系矩阵和所述融合特征矩阵,确定所述目标图谱中每个实体对应的权重之前,还包括:
获取样本信息对应的样本融合矩阵和样本连接矩阵,并利用待训练自注意力机制分类模型,基于所述样本融合矩阵和样本连接矩阵,对所述样本信息进行预测,得到所述样本信息的预测结果;
计算所述预测结果与针对所述样本信息预设的目标结果之间的损失信息,得到损失信息;
基于所述损失信息,对所述待训练注意力机制分类模型进行模型参数调整,得到所述预设自注意力机制分类模型。
本发明提供了一种医疗导诊装置,包括:
获取模块,用于获取目标对象的主诉信息,并对所述主诉信息进行实体识别,得到至少一个实体;
处理模块,用于基于所述至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建所述目标图谱对应的连接关系矩阵;所述预设医疗关系图谱中设定有各种类型的各种实体之间的连接关系;
融合模块,用于将所述至少一个实体进行特征融合,得到对应的融合特征矩阵;
确定模块,用于利用预设自注意力机制分类模型,基于所述连接关系矩阵和所述融合特征矩阵,确定所述目标图谱中每个实体对应的权重;
选取模块,用于从所述目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为所述目标对象的导诊推荐结果。
在上述装置中,所述处理模块,具体用于将所述预设医疗关系图谱中,与所述至少一个实体相连的每一个实体,确定为目标实体;在基于所述目标实体确定出不满足预设实体查找停止条件的情况下,继续查找与所述目标实体相连的实体,并将查找到的实体继续确定为所述目标实体,直至基于所述目标实体确定出满足所述预设实体查找停止条件;从所述预设医疗关系图谱中,选取包含所述目标实体和所述至少一个实体的区域,确定为所述目标图谱。
在上述装置中,所述处理模块,具体用于针对所述目标图谱中每个实体,确定与所述目标图谱中每个实体之间的连接数量,并利用确定的连接数量生成对应的一个向量;将所述目标图谱中不同实体对应的向量进行组合,得到初始向量矩阵;根据所述初始向量矩阵的维度,确定单位矩阵,并将所述初始向量矩阵与所述单位矩阵之和确定为所述连接关系矩阵。
在上述装置中,所述融合模块,具体用于利用预设预训练语言模型,确定所述至少一个实体中每一个实体对应的特征向量,得到至少一个特征向量;将所述至少一个特征向量进行组合,得到所述至少一个实体对应的整体特征向量;将所述至少一个特征向量中每个特征向量与所述整体特征向量进行融合,得到所述融合特征矩阵。
在上述装置中,所述确定模块,具体用于将所述实体融合特征矩阵和所述连接关系矩阵之积,确定为联合特征矩阵;将所述联合特征矩阵输入所述预设自注意力机制分类模型,得到所述目标图谱中每个实体对应的权重。
在上述装置中,所述选取模块,具体用于将所述目标图谱中,同一类型的实体划分到同一组,得到至少一个实体类型组;针对所述至少一个实体类型组中每个实体类型组,从对应的实体类型组中选取出对应权重满足预设权重条件的实体,确定为所述导诊推荐结果。
在上述装置中,还包括训练模块,用于获取样本信息对应的样本融合矩阵和样本连接矩阵,并利用待训练自注意力机制分类模型,基于所述样本融合矩阵和样本连接矩阵,对所述样本信息进行预测,得到所述样本信息的预测结果;计算所述预测结果与针对所述样本信息预设的目标结果之间的损失信息,得到损失信息;基于所述损失信息,对所述待训练注意力机制分类模型进行模型参数调整,得到所述预设自注意力机制分类模型。
本发明提供了一种医疗导诊装置,包括:处理器、存储器和通信总线;
所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;
所述处理器,用于执行所述存储器中存储的医疗导诊程序,以实现上述医疗导诊方法。
本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可以被一个或者多个处理器执行,以实现上述医疗导诊方法。
本发明提供了一种医疗导诊方法、装置及存储介质,方法包括:获取目标对象的主诉信息,并对主诉信息进行实体识别,得到至少一个实体;基于至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建目标图谱对应的连接关系矩阵;将至少一个实体进行特征融合,得到对应的融合特征矩阵;利用预设自注意力机制分类模型,基于连接关系矩阵和融合特征矩阵,确定目标图谱中每个实体对应的权重;从目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为目标对象的导诊推荐结果。本发明提供的技术方案,基于预设医疗关系图谱,深度挖掘患者主诉信息中各实体之间的关系,并结合各实体对应的融合特征信息,利用预设自注意力机制分类模型,为患者推荐导诊方案,提高了医疗导诊的准确性。
附图说明
图1为本发明实施例提供的一种医疗导诊方法的流程示意图;
图2为本发明实施例提供的一种示例性的预设医疗关系图谱;
图3为本发明实施例提供的一种示例性医疗导诊的流程示意图;
图4为本发明实施例提供的一种医疗导诊装置的结构示意图一;
图5为本发明实施例提供的一种医疗导诊装置的结构示意图二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅仅用于解释相关申请,而非对该申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关申请相关的部分。
本发明提供了一种医疗导诊方法,通过医疗导诊装置来实现,图1为本发明实施例提供的一种医疗导诊方法的流程示意图。如图1所示,主要包括以下步骤:
S101、获取目标对象的主诉信息,并对主诉信息进行实体识别,得到至少一个实体。
在本发明的实施例中,医疗导诊装置获取目标对象的主诉信息,并对主诉信息进行实体识别,得到至少一个实体。
需要说明的是,在本发明的实施例中,主诉信息为目标对象针对自身疾病主诉的年龄、性别、发病部位、症状,以及常用药品等信息。
需要说明的是,在本发明的实施例中,医疗导诊装置在获取到目标对象的主诉信息之后,会识别主诉信息包括的实体,得到至少一个实体。
S102、基于至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建目标图谱对应的连接关系矩阵。
在本发明的实施例中,医疗导诊装置基于至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建目标图谱对应的连接关系矩阵。
需要说明的是,在本发明的实施例中,预设医疗关系图谱中设定有各种类型的各种实体之间的连接关系。
需要说明的是,在本发明的实施例中,预设医疗关系图谱是依据电子病历、医学书籍、文献等,通过命名实体识别技术,将文本中的疾病名称、发病部位、症状、多发人群、就诊科室、常用药品、检查项目、医生姓名、医生擅长方向等信息抽取出来,并利用关系抽取技术,抽取出这些实体之间的关系,构建的预设医疗关系图谱。
图2为本发明实施例提供的一种示例性的预设医疗关系图谱。如图2所示,包括症状、医生信息、就诊科室、常用药品,检查项目、疾病名称、发病部位等信息之间的关系,比如,李四擅长小儿癫痫,小儿癫痫属于神经内科、儿科,以及脑外科,小儿癫痫的症状为四肢抽搐、破伤风、范可尼综合征、反复高热以及昏睡,小儿癫痫可以检查的项目为神经系统免疫学检查、颅脑MRI,以及颅脑CT。
需要说明的是,在本发明的实施例中,医疗导诊装置在获取到目标对象主诉信息对应的至少一个实体后,会基于至少一个实体,从预设医疗关系图谱中,确定目标图谱。
具体的,在本发明的实施例中,医疗导诊装置基于至少一个实体,从预设医疗关系图谱中确定目标图谱,包括:将预设医疗关系图谱中,与至少一个实体相连的每一个实体,确定为目标实体;在基于目标实体确定出不满足预设实体查找停止条件的情况下,继续查找与目标实体相连的实体,并将查找到的实体继续确定为目标实体,直至基于目标实体确定出满足预设实体查找停止条件;从预设医疗关系图谱中,选取包含目标实体和至少一个实体的区域,确定为目标图谱。
需要说明的是,在本发明的实施例中,预设实体查找停止条件为医疗导诊装置未查找到实体,或者,查找到的实体达到预设阈值,其中,医疗导诊装置未查找到实体,说明查找到预设医疗关系图谱的边缘,预设阈值可以设置为1024、2048或者其他任意数值,具体的预设阈值可以根据实际情况和应用场景进行设定,对此,本发明不作限定。
需要说明的是,在本发明的实施例中,医疗导诊装置在得到至少一个实体的情况下,从预设医疗关系图谱中查找与至少一个实体相连的每一个实体,得到目标实体,此时需要判断是否查找到预设医疗关系图谱的边缘,或者至少一个实体和目标实体的数量之和是否达到预设阈值,如果满足任意一个条件,则判定满足预设实体查找停止条件,停止继续查找,将包含目标实体和至少一个实体的区域,确定为目标图谱。
需要说明的是,在本发明的实施例中,如果基于目标实体确定出不满足预设实体查找停止条件的情况下,继续查找与目标实体相连的实体,并将查找到的实体继续确定为目标实体,直至基于目标实体确定出满足预设实体查找停止条件,从预设医疗关系图谱中,选取包含目标实体和至少一个实体的区域,确定为目标图谱。
示例性的,以图2中的“四肢抽搐”为例,首先找出与该实体直接有连接的实体,“小儿癫痫”“李四”“破伤风”“范可尼综合征”,确定为目标实体,统计目标实体的个数,个数为4;然后,再找出和目标实体有连接的实体,如“神经内科”“颅脑CT”等实体,继续确定为目标实体,然后统计查找到的所有实体个数,此时,查找到的所有实体个数为4加3,再加至少一个实体的数量,直到基于目标实体确定出满足预设实体查找停止条件的情况下,停止查找,将预设医疗关系图谱中,包括至少一个实体和目标实体的区域,确定为目标图谱。
需要说明的是,在本发明的实施例中,医疗导诊装置在得到目标图谱之后,会构建目标图谱对应的连接关系矩阵。
具体的,在本发明的实施例中,医疗导诊装置构建目标图谱对应的连接关系矩阵,包括:针对目标图谱中每个实体,确定与目标图谱中每个实体之间的连接数量,并利用确定的连接数量生成对应的一个向量;将目标图谱中不同实体对应的向量进行组合,得到初始向量矩阵;根据初始向量矩阵的维度,确定单位矩阵,并将初始向量矩阵与单位矩阵之和确定为连接关系矩阵。
需要说明的是,在本发明的实施例中,医疗导诊装置对于目标图谱中包括的每个实体,均会计算与目标图谱中每个实体之间的连接关系,比如,对于目标有图谱中的第i个实体,会计算与第1,2,······,n个实体之间的连接数量,得到一个向量,见式(1):
Ai=[ai1,ai2,……,ain] (1)
其中,Ai为第i个实体对应的一个向量,n为预设阈值。
需要说明的是,在本发明的实施例中,医疗导诊装置在针对目标图谱中每个实体,确定与目标图谱中每个实体之间的连接数量,并利用确定的连接数量生成对应的一个向量之后,将目标图谱中不同实体对应的向量进行组合,得到初始向量矩阵,具体的初始向量矩阵见式(2):
其中,A为初始向量矩阵,aij为第i个实体和第j个实体之间的连接数量。由于A的对角线代表实体自身,因此全为0,但这样会损失实体自身信息,所以,医疗导诊装置会根据初始向量矩阵的维度,确定一个单位矩阵,然后将初始向量矩阵与单位矩阵之和确定为连接关系矩阵,具体的计算方法见式(3):
S103、将至少一个实体进行特征融合,得到对应的融合特征矩阵。
在本发明的实施例中,医疗导诊装置将至少一个实体进行特征融合,得到对应的融合特征矩阵。
需要说明的是,在本发明的实施例中,医疗导诊装置在得到至少一个实体之后,会对至少一个实体进行特征融合,得到对应的融合特征矩阵。
具体的,在本发明的实施例中,医疗导诊装置将至少一个实体进行特征融合,得到对应的融合特征矩阵,包括:利用预设预训练语言模型,确定至少一个实体中每一个实体对应的特征向量,得到至少一个特征向量;将至少一个特征向量进行组合,得到至少一个实体对应的整体特征向量;将至少一个特征向量中每个特征向量与整体特征向量进行融合,得到融合特征矩阵。
需要说明的是,在本发明的实施例中,预设预训练语言模型是基于电子病历和医学文献,利用自然语言处理技术对电子病历以及医学文献进行分词和实体识别,得到分词与实体识别结果,并基于分词与实体识别结果训练好的预设预训练语言模型,预设预训练语言模型为适应医学领域的预训练语言模型,能够更加准确的进行分词和实体识别。
需要说明的是,在本发明的实施例中,医疗导诊装置对获得的至少一个实体,利用预设预训练语言模型,查找至少一个实体中每个实体对应的特征向量,得到至少一个特征向量,见式(4):
其中,hi代表通过预设预训练语言模型查找到的每个实体对应的特征向量,假设每个向量为768维,则特征矩阵H的维度为n×768。
需要说明的是,在本发明的实施例中,医疗导诊装置在得到至少一个特征向量之后,将至少一个特征向量通过平均池化(mean pooling)的方式进行组合,得到至少一个实体对应的整体特征向量S,具体的S见式(5):
S=[h1,h2,…,hn] (5)
需要说明的是,在本发明的实施例中,医疗导诊装置在得到至少一个特征向量和整体特征向量之后,将至少一个特征向量中每个特征向量与整体特征向量进行融合,得到融合特征矩阵,具体的融合方式见式(6):
其中,hi代表通过预设预训练语言模型查找到的第i个实体对应的特征向量,Ω、H、S为设定的参数,Q为偏置量,具体的Ω、H、S的设定可以根据实际需求和应用场景进行设定,对此,本发明不作限定。
S104、利用预设自注意力机制分类模型,基于连接关系矩阵和融合特征矩阵,确定目标图谱中每个实体对应的权重。
在本发明的实施例中,医疗导诊装置利用预设自注意力机制分类模型,基于连接关系矩阵和融合特征矩阵,确定目标图谱中每个实体对应的权重。
具体的,在本发明的实施例中,医疗导诊装置利用预设自注意力机制分类模型,基于连接关系矩阵和融合特征矩阵,确定目标图谱中每个实体对应的权重,包括:将融合特征矩阵和连接关系矩阵之积,确定为联合特征矩阵;将联合特征矩阵输入预设自注意力机制分类模型,得到目标图谱中每个实体对应的权重。
需要说明的是,在本发明的实施例中,医疗导诊装置在得到融合特征矩阵和连接关系矩阵之后,将融合特征矩阵和连接关系矩阵相乘,得到联合特征矩阵,然后将联合特征矩阵输入预设自注意力机制分类模型中,进行目标图谱中每个实体的权重计算,具体的过程可以为:
其中,X为联合特征矩阵,Wq,Wk,Wv为预设自注意力机制分类模型中设定的参数,softmax为损失函数,Q、K和V为偏置量,Z为预设自注意力机制分类模型中的注意力头,为比例因子,假设预设自注意力机制分类模型有m个注意力头,则最终的结果为:
Z=[Z1 … Zi … Zm] (8)
其中,Zi为第i个注意力头的计算结果。
需要说明的是,在本发明的实施例中,医疗导诊装置对得到的注意力头的最终结果和输入的联合矩阵进行归一化处理,得到目标图谱中每个实体对应的权重,具体的计算方式:
O=softmax(Wf(Norm(X+ZWo))+b) (9)
其中,Wf,Wo为预设自注意力机制分类模型设定的参数,Norm函数用于获取X+ZWo矩阵的最大奇异值,b为偏置项,O为N维向量,分别代表目标图谱中每个实体对应的权重。
具体的,在本发明的实施例中,医疗导诊装置利用预设自注意力机制分类模型,基于连接关系矩阵和融合特征矩阵,确定目标图谱中每个实体对应的权重之前,还可以执行以下步骤:获取样本信息对应的样本融合矩阵和样本连接矩阵,并利用待训练自注意力机制分类模型,基于样本融合矩阵和样本连接矩阵,对样本信息进行预测,得到样本信息的预测结果;计算预测结果与针对样本信息预设的目标结果之间的损失信息,得到损失信息;基于损失信息,对待训练注意力机制分类模型进行模型参数调整,得到预设自注意力机制分类模型。
需要说明的是,在本发明的实施例中,样本信息可以是电子病历中的每条病历,然后,医疗导诊装置对样本信息进行实体识别,确定样本图谱,构建样本连接矩阵,利用预设预训练语言模型对识别出的实体进行特征融合,得到样本融合矩阵,然后利用待训练注意力机制分类模型,基于样本连接矩阵和样本融合矩阵,得到样本信息的预测结果,然后计算预测结果与针对样本信息预设的目标结果之间的损失信息,反向调整待训练注意力机制分类模型的模型参数,得到预设自注意力机制分类模型。
S105、从目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为目标对象的导诊推荐结果。
在本发明的实施例中,医疗导诊装置从目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为目标对象的导诊推荐结果。
需要说明的是,在本发明的实施例中,医疗导诊装置会基于不同实体对应的权重,从目标图谱中进行实体选取,并将选取出的实体确定为目标对象的导诊推荐结果。
具体的,在本发明的实施例中,医疗导诊装置从目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为目标对象的导诊推荐结果,包括:将目标图谱中,同一类型的实体划分到同一组,得到至少一个实体类型组;针对至少一个实体类型组中每个实体类型组,从对应的实体类型组中选取出对应权重满足预设权重条件的实体,确定为导诊推荐结果。
需要说明的是,在本发明的实施例中,医疗导诊装置将目标图谱中,同一类型的实体划分到同一组,得到至少一个实体类型组,具体的划分依据为:在医疗导诊装置获取得到目标图谱之后,会构造目标图谱中实体的类别矩阵,比如,医疗导诊装置基于一条电子病历确定的目标图谱中包括1024个实体,那么,该条电子病历期望得到的标准结果见式(10)为:
其中,yi可以为1或者0,代表第i个实体是不是医疗导诊装置对该电子病历识别的实体,如果是,则yi为1,如果不是,yi为0。
其中,m为类别信息,比如,1可以代表疾病,2代表症状,3代表医生,4代表科室。
需要说明的是,在本发明的实施例中,医疗导诊装置会根据类型记录向量将目标图谱中,同一类型的实体划分到同一组,得到至少一个实体类型组,然后,针对至少一个实体类型组中每个实体类型组,从对应的实体类型组中选取出对应权重满足预设权重条件的实体,确定为导诊推荐结果,其中,预设权重条件可以是每个实体类型组中权重最大的实体,也可以是权重前三名,这样,将多个可以选择的医生,科室推荐给目标对象,目标对象依据推荐的导诊结果,进行就医,能够解决患者不知道挂哪个科室的号,找哪位医生更合适的现状,提高了医疗资源的分配和利用效率。
图3为本发明实施例提供的一种示例性医疗导诊的流程示意图。如图3所示,医疗导诊装置会利用预设预处理语言模型对电子病历、医学文献进行分词和实体识别,利用关系抽取技术,抽取识别的实体之间的关系,构建预设医疗关系图谱;然后,针对患者主诉的信息,医疗导诊装置会对主诉信息进行实体识别,得到至少一个实体,进而基于至少一个实体从预设医疗关系图谱中确定目标图谱,并构建目标图谱的连接关系矩阵;接着,利用预设预处理语言模型对至少一个实体中每个实体,查找到对应的特征向量,并将至少一个实体对应的至少一个特征向量进行组合,得到整体特征向量,最后将整体特征向量,至少一个特征向量和连接关系矩阵进行融合,得到联合特征矩阵,将联合特征矩阵输入预设自注意力机制分类模型,得到目标图谱中每个实体对应的权重。
本发明提供了一种医疗导诊方法,方法包括:获取目标对象的主诉信息,并对主诉信息进行实体识别,得到至少一个实体;基于至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建目标图谱对应的连接关系矩阵;将至少一个实体进行特征融合,得到对应的融合特征矩阵;利用预设自注意力机制分类模型,基于连接关系矩阵和融合特征矩阵,确定目标图谱中每个实体对应的权重;从目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为目标对象的导诊推荐结果。本发明提供的医疗导诊方法,基于预设医疗关系图谱,深度挖掘患者主诉信息中各实体之间的关系,并结合各实体对应的融合特征信息,利用预设自注意力机制分类模型,为患者推荐导诊方案,提高了医疗导诊的准确性。
本发明提供了一种医疗导诊装置,图4为本发明实施例提供的一种医疗导诊装置的结构示意图一。如图4所示,包括:
获取模块401,用于获取目标对象的主诉信息,并对所述主诉信息进行实体识别,得到至少一个实体;
处理模块402,用于基于所述至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建所述目标图谱对应的连接关系矩阵;所述预设医疗关系图谱中设定有各种类型的各种实体之间的连接关系;
融合模块403,用于将所述至少一个实体进行特征融合,得到对应的融合特征矩阵;
确定模块404,用于利用预设自注意力机制分类模型,基于所述连接关系矩阵和所述融合特征矩阵,确定所述目标图谱中每个实体对应的权重;
选取模块405,用于从所述目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为所述目标对象的导诊推荐结果。
可选的,所述处理模块402,具体用于将所述预设医疗关系图谱中,与所述至少一个实体相连的每一个实体,确定为目标实体;在基于所述目标实体确定出不满足预设实体查找停止条件的情况下,继续查找与所述目标实体相连的实体,并将查找到的实体继续确定为所述目标实体,直至基于所述目标实体确定出满足所述预设实体查找停止条件;从所述预设医疗关系图谱中,选取包含所述目标实体的区域,确定为所述目标图谱。
可选的,所述处理模块402,具体用于针对所述目标图谱中每个实体,确定与所述目标图谱中每个实体之间的连接数量,并利用确定的连接数量生成对应的一个向量;将所述目标图谱中不同实体对应的向量进行组合,得到初始向量矩阵;根据所述初始向量矩阵的维度,确定单位矩阵,并将所述初始向量矩阵与所述单位矩阵之和确定为所述连接关系矩阵。
可选的,所述融合模块403,具体用于利用预设预训练语言模型,确定所述至少一个实体中每一个实体对应的特征向量,得到至少一个特征向量;将所述至少一个特征向量进行组合,得到所述至少一个实体对应的整体特征向量;将所述至少一个特征向量中每个特征向量与所述整体特征向量进行融合,得到所述融合特征矩阵。
可选的,所述确定模块404,具体用于将所述融合特征矩阵和所述连接关系矩阵之积,确定为联合特征矩阵;将所述联合特征矩阵输入所述预设自注意力机制分类模型,得到所述目标图谱中每个实体对应的权重。
可选的,所述选取模块405,具体用于将所述目标图谱中,同一类型的实体划分到同一组,得到至少一个实体类型组;针对所述至少一个实体类型组中每个实体类型组,从对应的实体类型组中选取出对应权重满足预设权重条件的实体,确定为所述导诊推荐结果。
可选的,所述医疗导诊装置还包括训练模块(图中未示出),用于获取样本信息对应的样本融合矩阵和样本连接矩阵,并利用待训练自注意力机制分类模型,基于所述样本融合矩阵和样本连接矩阵,对所述样本信息进行预测,得到所述样本信息的预测结果;计算所述预测结果与针对所述样本信息预设的目标结果之间的损失信息,得到损失信息;基于所述损失信息,对所述待训练注意力机制分类模型进行模型参数调整,得到所述预设自注意力机制分类模型。
本发明提供了一种医疗导诊装置,图5为本发明实施例提供的一种医疗导诊装置的结构示意图二。如图5所示,所述医疗导诊装置装置包括:处理器501、存储器502和通信总线503;
所述通信总线503,用于实现所述处理器501和所述存储器502之间的通信连接;
所述处理器501,用于执行所述存储器502中存储的医疗导诊程序,以实现上述医疗导诊方法。
本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可以被一个或者多个处理器执行,以实现上述医疗导诊方法。计算机可读存储介质可以是是易失性存储器(volatile memory),例如随机存取存储器(Random-Access Memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(Read-Only Memory,ROM),快闪存储器(flash memory),硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD);也可以是包括上述存储器之一或任意组合的各自设备,如移动电话、计算机、平板设备、个人数字助理等。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本实用申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种医疗导诊方法,其特征在于,所述方法包括:
获取目标对象的主诉信息,并对所述主诉信息进行实体识别,得到至少一个实体;
基于所述至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建所述目标图谱对应的连接关系矩阵;所述预设医疗关系图谱中设定有各种类型的各种实体之间的连接关系;
将所述至少一个实体进行特征融合,得到对应的融合特征矩阵;
利用预设自注意力机制分类模型,基于所述连接关系矩阵和所述融合特征矩阵,确定所述目标图谱中每个实体对应的权重;
从所述目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为所述目标对象的导诊推荐结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个实体,从预设医疗关系图谱中确定目标图谱,包括:
将所述预设医疗关系图谱中,与所述至少一个实体相连的每一个实体,确定为目标实体;
在基于所述目标实体确定出不满足预设实体查找停止条件的情况下,继续查找与所述目标实体相连的实体,并将查找到的实体继续确定为所述目标实体,直至基于所述目标实体确定出满足所述预设实体查找停止条件;
从所述预设医疗关系图谱中,选取包含所述目标实体和所述至少一个实体的区域,确定为所述目标图谱。
3.根据权利要求1所述的方法,其特征在于,所述构建所述目标图谱对应的连接关系矩阵,包括:
针对所述目标图谱中每个实体,确定与所述目标图谱中每个实体之间的连接数量,并利用确定的连接数量生成对应的一个向量;
将所述目标图谱中不同实体对应的向量进行组合,得到初始向量矩阵;
根据所述初始向量矩阵的维度,确定单位矩阵,并将所述初始向量矩阵与所述单位矩阵之和确定为所述连接关系矩阵。
4.根据权利要求1所述的方法,其特征在于,所述将所述至少一个实体进行特征融合,得到对应的融合特征矩阵,包括:
利用预设预训练语言模型,确定所述至少一个实体中每一个实体对应的特征向量,得到至少一个特征向量;
将所述至少一个特征向量进行组合,得到所述至少一个实体对应的整体特征向量;
将所述至少一个特征向量中每个特征向量与所述整体特征向量进行融合,得到所述融合特征矩阵。
5.根据权利要求1所述的方法,其特征在于,所述利用预设自注意力机制分类模型,基于所述连接关系矩阵和所述融合特征矩阵,确定所述目标图谱中每个实体对应的权重,包括:
将所述融合特征矩阵和所述连接关系矩阵之积,确定为联合特征矩阵;
将所述联合特征矩阵输入所述预设自注意力机制分类模型,得到所述目标图谱中每个实体对应的权重。
6.根据权利要求1所述的方法,其特征在于,所述从所述目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为所述目标对象的导诊推荐结果,包括:
将所述目标图谱中,同一类型的实体划分到同一组,得到至少一个实体类型组;
针对所述至少一个实体类型组中每个实体类型组,从对应的实体类型组中选取出对应权重满足预设权重条件的实体,确定为所述导诊推荐结果。
7.根据权利要求1所述的方法,其特征在于,所述利用预设自注意力机制分类模型,基于所述连接关系矩阵和所述融合特征矩阵,确定所述目标图谱中每个实体对应的权重之前,还包括:
获取样本信息对应的样本融合矩阵和样本连接矩阵,并利用待训练自注意力机制分类模型,基于所述样本融合矩阵和样本连接矩阵,对所述样本信息进行预测,得到所述样本信息的预测结果;
计算所述预测结果与针对所述样本信息预设的目标结果之间的损失信息,得到损失信息;
基于所述损失信息,对所述待训练注意力机制分类模型进行模型参数调整,得到所述预设自注意力机制分类模型。
8.一种医疗导诊装置,其特征在于,包括:
获取模块,用于获取目标对象的主诉信息,并对所述主诉信息进行实体识别,得到至少一个实体;
处理模块,用于基于所述至少一个实体,从预设医疗关系图谱中确定目标图谱,并构建所述目标图谱对应的连接关系矩阵;所述预设医疗关系图谱中设定有各种类型的各种实体之间的连接关系;
融合模块,用于将所述至少一个实体进行特征融合,得到对应的融合特征矩阵;
确定模块,用于利用预设自注意力机制分类模型,基于所述连接关系矩阵和所述融合特征矩阵,确定所述目标图谱中每个实体对应的权重;
选取模块,用于从所述目标图谱中,基于不同实体对应的权重进行实体选取,并将选取出的实体确定为所述目标对象的导诊推荐结果。
9.一种医疗导诊装置,其特征在于,包括:处理器、存储器和通信总线;
所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;
所述处理器,用于执行所述存储器中存储的医疗导诊程序,以实现权利要求1-7任一项所述的医疗导诊方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可以被一个或者多个处理器执行,以实现权利要求1-7任一项所述的医疗导诊方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111477377.2A CN116244492A (zh) | 2021-12-06 | 2021-12-06 | 一种医疗导诊方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111477377.2A CN116244492A (zh) | 2021-12-06 | 2021-12-06 | 一种医疗导诊方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116244492A true CN116244492A (zh) | 2023-06-09 |
Family
ID=86629989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111477377.2A Pending CN116244492A (zh) | 2021-12-06 | 2021-12-06 | 一种医疗导诊方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116244492A (zh) |
-
2021
- 2021-12-06 CN CN202111477377.2A patent/CN116244492A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Comparison of chest radiograph interpretations by artificial intelligence algorithm vs radiology residents | |
CN110781298B (zh) | 药品分类方法、装置、计算机设备及存储介质 | |
CA3137079A1 (en) | Computer-implemented machine learning for detection and statistical analysis of errors by healthcare providers | |
CN110504028A (zh) | 一种疾病问诊方法、装置、系统、计算机设备和存储介质 | |
CN114727766A (zh) | 从图像和专家知识收集和识别皮肤状况的系统 | |
CN108899064A (zh) | 电子病历生成方法、装置、计算机设备和存储介质 | |
WO2015134530A1 (en) | Personalized content-based patient retrieval system | |
CN110797101B (zh) | 医学数据处理方法、装置、可读存储介质和计算机设备 | |
CN112016295B (zh) | 症状数据处理方法、装置、计算机设备及存储介质 | |
CN112712879A (zh) | 医学影像报告的信息提取方法、装置、设备及存储介质 | |
CN112530550A (zh) | 影像报告生成方法、装置、计算机设备和存储介质 | |
CN114783580B (zh) | 一种医疗数据质量评估方法及系统 | |
CN110752027B (zh) | 电子病历数据推送方法、装置、计算机设备和存储介质 | |
CN114078593A (zh) | 临床决策支持 | |
CN112800173A (zh) | 标准化数据库和医学文本库的构建方法、装置及电子设备 | |
CN112447270A (zh) | 一种用药推荐方法、装置、设备及存储介质 | |
CN109997201A (zh) | 针对多种医学知识模块的利用数据驱动方法的精确临床决策支持 | |
JP2022504508A (ja) | モデル支援型事象予測のためのシステム及び方法 | |
CN113707304A (zh) | 分诊数据处理方法、装置、设备及存储介质 | |
Geetha et al. | Geospatial Data Exploration Using Machine Learning | |
WO2021052150A1 (zh) | 放疗计划推荐方法、装置、电子设备及存储介质 | |
CN116631614A (zh) | 治疗方案生成方法、装置、电子设备及存储介质 | |
CN116244492A (zh) | 一种医疗导诊方法、装置及存储介质 | |
US11783165B1 (en) | Generating vectors from data | |
CN115700826A (zh) | 单据处理、单据展示方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |