CN112349410A - 用于科室分诊的分诊模型的训练方法、分诊方法和系统 - Google Patents
用于科室分诊的分诊模型的训练方法、分诊方法和系统 Download PDFInfo
- Publication number
- CN112349410A CN112349410A CN202011275299.3A CN202011275299A CN112349410A CN 112349410 A CN112349410 A CN 112349410A CN 202011275299 A CN202011275299 A CN 202011275299A CN 112349410 A CN112349410 A CN 112349410A
- Authority
- CN
- China
- Prior art keywords
- department
- description text
- feature vector
- triage
- disease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000012549 training Methods 0.000 title claims abstract description 65
- 239000013598 vector Substances 0.000 claims abstract description 244
- 201000010099 disease Diseases 0.000 claims abstract description 160
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 160
- 230000004927 fusion Effects 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 6
- 206010011224 Cough Diseases 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 206010037660 Pyrexia Diseases 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 11
- 239000003814 drug Substances 0.000 description 7
- 230000000241 respiratory effect Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000029058 respiratory gaseous exchange Effects 0.000 description 5
- 230000005284 excitation Effects 0.000 description 4
- 238000013145 classification model Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 2
- 208000009205 Tinnitus Diseases 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 206010039083 rhinitis Diseases 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 231100000886 tinnitus Toxicity 0.000 description 2
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 201000008197 Laryngitis Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000399 orthopedic effect Effects 0.000 description 1
- 210000003695 paranasal sinus Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开提供了一种用于科室分诊的分诊模型的训练方法,包括:基于多个科室中每个科室的标注数据集以及科室在知识库中的科室描述文本,生成每个科室的关键词表;利用第一网络模型生成每个病情描述文本的第一特征向量,利用第二网络模型生成每个科室的关键词表向量;基于病情描述文本的第一特征向量与每个科室的关键词表向量,生成针对每个科室的第二特征向量;基于病情描述文本的第一特征向量与每个第二特征向量之间的相关性生成融合特征向量;基于每个病情描述文本的融合特征向量和病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的分诊模型。本公开还提供了一种分诊模型的训练装置、分诊方法和装置、系统和介质。
Description
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种用于科室分诊的分诊模型的训练方法和装置、分诊方法和装置、系统和介质。
背景技术
随着互联网和人工智能技术的快速发展,文本的识别和分类应用于越来越多的领域。例如,用于为医院提供智能导诊服务的分诊模型,其输入是病人的病情描述,输出是病人应该挂号的科室编号,是一个典型的文本分类问题。由于医院科室分诊业务的特殊性,不能误导病人去错误的科室,所以对分诊模型的准确性要求非常高。
在实现本公开构思的过程中,发明人发现目前通用的文本分类算法对整个输入语句进行特征提取,对于不同特征的重要性,模型很难做出精准的判断,如果输入的语句过长,特征过多,则不同特征之间会互相干扰,从而导致模型有可能忽略掉最重要的特征,最终输出错误的分类结果。
发明内容
有鉴于此,本公开提供了一种用于科室分诊的分诊模型的训练方法和装置、分诊方法和装置、系统和介质。
本公开的一个方面提供了一种用于科室分诊的分诊模型的训练方法,包括:基于多个科室中每个科室的标注数据集以及所述科室在知识库中的科室描述文本,生成所述每个科室的关键词表,其中,所述每个科室的标注数据集包括针对该科室的多个病情描述文本;针对每个科室的多个病情描述文本,利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量,并利用第二网络模型对所述每个科室的关键词表进行处理,得到针对每个科室的关键词表向量;针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的所述病情描述文本的第二特征向量;针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成所述病情描述文本的融合特征向量;基于所述每个病情描述文本的融合特征向量和所述病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的所述分诊模型。
根据本公开的实施例,所述基于多个科室中每个科室的标注数据集以及所述科室在知识库中的科室描述文本,生成所述每个科室的关键词表包括:针对每个科室的标注数据集中的多个病情描述文本,对每个病情描述文本进行划分,得到针对每个病情描述文本的多个分词;基于每个分词和所述科室描述文本共现的概率,计算所述每个分词与所述科室描述文本之间的相关性;基于所述相关性满足预设条件的分词,生成所述每个科室的关键词表。
根据本公开的实施例,所述第一网络模型包括词向量子模型和特征提取子模型;所述利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量包括:利用所述词向量子模型对所述每个病情描述文本进行处理,得到所述每个病情描述文本的的词向量;利用所述特征提取子模型对所述每个病情描述文本的词向量进行处理,得到所述每个病情描述文本的所述第一特征向量。
根据本公开的实施例,所述针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的所述病情描述文本的第二特征向量包括:基于所述病情描述文本的第一特征向量与每个科室的关键词表中的每个关键词之间的相关性,生成针对每个关键词的权重;基于针对所述每个关键词的权重中的最大值以及所述针对每个关键词的权重之和,确定针对每个关键词表的权重;基于针对每个关键词表的权重,对所述病情描述文本的第一特征向量进行处理,生成针对每个科室的所述病情描述文本的第二特征向量。
根据本公开的实施例,所述针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成所述病情描述文本的融合特征向量包括:基于所述病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成针对每个第二特征向量的权重;基于每个第二特征向量的权重,对所述每个第二特征向量进行处理,生成所述病情描述文本的融合特征向量。
根据本公开的实施例,所述基于所述每个病情描述文本的融合特征向量和所述病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的所述分诊模型包括:利用所述第三网络模型对任一病情描述文本的融合特征向量进行处理,得到所述任一病情描述文本的预测科室信息;基于所述任一病情描述文本的的科室信息与预测科室信息之间的误差,确定所述第三网络模型的损失;基于所述第三网络模型的损失调整所述第三网络模型的参数,以得到更新的第三网络模型;针对所述更新的第三网络模型,重复上述训练过程,直至所述第三网络模型的损失收敛,得到经训练的所述分诊模型。
本公开的另一个方面提供了一种分诊方法,包括:获取用户输入的病情描述文本;利用分诊模型对所述病情描述文本进行处理,得到针对所述病情描述文本的目标科室信息;其中,所述分诊模型是利用根据用于科室分诊的分诊模型的训练方法训练得到的。
本公开的另一个方面提供了一种用于科室分诊的分诊模型的训练装置,包括:第一生成模块,用于基于多个科室中每个科室的标注数据集以及所述科室在知识库中的科室描述文本,生成所述每个科室的关键词表,其中,所述每个科室的标注数据集包括针对该科室的多个病情描述文本;第一处理模块,用于针对每个科室的多个病情描述文本,利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量,并利用第二网络模型对所述每个科室的关键词表进行处理,得到针对每个科室的关键词表向量;第二生成模块,用于针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的所述病情描述文本的第二特征向量;第三生成模块,用于针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成所述病情描述文本的融合特征向量;训练模块,用于基于所述每个病情描述文本的融合特征向量和所述病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的所述分诊模型。
本公开的另一个方面提供了一种分诊装置,包括:获取模块,用于获取用户输入的病情描述文本;第二处理模块,用于利用分诊模型对所述病情描述文本进行处理,得到针对所述病情描述文本的目标科室信息;其中,所述分诊模型是利用根据用于科室分诊的分诊模型的训练方法训练得到的。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机系统,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
根据本公开的实施例,采用了基于多个科室中每个科室的标注数据集以及科室在知识库中的科室描述文本,生成每个科室的关键词表,针对每个科室的标注数据集中的多个病情描述文本,利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量,并利用第二网络模型对每个科室的关键词表进行处理,得到针对每个科室的关键词表向量,基于病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的病情描述文本的第二特征向量,基于病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成病情描述文本的融合特征向量,基于每个病情描述文本的融合特征向量和病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的分诊模型的技术手段。由于病情描述文本的融合特征向量融合了所有科室的知识,利用病情描述文本的融合特征向量进行训练,能够避免模型忽略掉重要的特征,所以至少部分地克服了相关技术中模型有可能忽略掉重要特征的技术问题,进而达到了提高分诊模型分类的准确性的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了可以应用本公开实施例的用于科室分诊的分诊模型的训练方法和装置以及分诊方法和装置的示例性系统架构;
图2示意性示出了根据本公开实施例的用于科室分诊的分诊模型的训练方法的流程图;
图3示意性示出了根据本公开实施例的利用第一网络模型对每个病情描述文本进行处理的方法的流程图;
图4示意性示出了根据本公开实施例的生成每个科室的关键词表的方法的流程图;
图5示意性示出了根据本公开实施例的生成针对每个科室的病情描述文本的第二特征向量的方法的流程图;
图6示意性示出了根据本公开实施例的生成病情描述文本的融合特征向量的方法的流程图;
图7示意性示出了根据本公开另一实施例的生成病情描述文本的融合特征向量的方法的示意图;
图8示意性示出了根据本公开实施例的对第三网络模型进行训练的方法的流程图;
图9示意性示出了根据本公开实施例的分诊方法的流程图;
图10示意性示出了根据本公开的实施例的用于科室分诊的分诊模型的训练装置的框图;
图11示意性示出了根据本公开的实施例的分诊装置的框图;以及
图12示意性示出了根据本公开实施例的计算机系统的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
Text-CNN(Convolutional neural networks,CNN)是利用卷积神经网络对文本进行分类的算法,是目前用于文本分类的主流算法。输入数据首先通过一个嵌入层(Embedding Layer),这一层的功能是将自然语言编码成分布式表达(DistributedRepresentation),得到输入语句的Embedding向量表示;然后通过卷基层(ConvolutionLayer),通过卷积提取输入语句不同的N-gram特征,其中,N-gram指的是将文本里面的内容按照字节进行大小为N的滑动窗口操作,形成长度是N的字节片段序列,每一个字节片段称为gram,每一种gram就是一个特征向量维度;然后通过最大值池化层(Max-poolingLayer),对卷积提取的N-gram特征进行选择,提取激活程度最大的特征。最后通过一个全连接层(Fully-connected Layer),得到最终的输出结果。
针对用于为互联网医院提供智能导诊服务的分诊模型,其输入是病人的病情描述,输出是病人应该挂号的科室编号,是一个典型的文本分类问题。因为业务的特殊性,不能误导病人去错误的科室,所以对分诊模型的准确性要求非常高。
为了提高分诊模型的准确性,本公开的实施例提供了一种用于科室分诊的分诊模型的训练方法,包括:基于多个科室中每个科室的标注数据集与知识库中该科室的科室描述文本之间的相关性,生成每个科室的关键词表,其中,每个科室的标注数据集包括针对该科室的多个病情描述文本;针对每个科室的标注数据集中的多个病情描述文本,利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量,其中,每个病情描述文本包括针对该病情描述文本的科室信息;针对每个病情描述文本,基于病情描述文本与每个科室的关键词表之间的相关性,对病情描述文本的第一特征向量进行处理,生成针对每个科室的病情描述文本的第二特征向量;基于每个病情描述文本的第一特征向量以及针对每个科室的第二特征向量,生成每个病情描述文本的融合特征向量;基于每个病情描述文本的融合特征向量以及针对该病情描述文本的科室信息,对第二网络模型进行训练,得到经训练的分诊模型。
图1示意性示出了可以应用本公开实施例的用于科室分诊的分诊模型的训练方法和装置以及分诊方法和装置的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、网络102和服务器103和数据库服务器104。网络102用以在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线和/或无线通信链路等等。
终端设备101可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。终端设备101上可以安装有各种客户端应用,例如医院挂号服务客户端等(仅为示例)。服务器103可以是具有一定计算能力的电子设备,例如可以对终端设备101办理挂号业务提供支持的后台管理服务器(仅为示例)。数据库服务器104可以是能够获取或能够存储医学知识相关的大规模数据库,如维基百科等,还可以用于获取或存储医生或护士等专业人员标注的每个科室的标注数据集等,数据库服务器104能够为服务器103执行分诊模型的训练方法提供大量的医学相关的训练语料。
示例性地,服务器103获取数据库服务器104存储的医学相关的训练语料,训练语料例如可以包括病人的病情描述、医生等专业人员对病情描述标注的分诊信息等,基于训练语料对文本分类模型进行训练,经训练的文本分类模型能够对病人新输入的病情描述文本进行处理,输出病人应该选择挂号的科室。
用户可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。示例性地,用户通过终端设备101输入病情描述信息,终端设备101将病情描述信息发送给服务器103,服务器103通过训练好的分诊模型对病情描述信息进行处理,得到针对该病情描述信息的科室编号,然后将科室编号发送给终端设备101,以便用户根据科室编号进行挂号。
需要说明的是,本公开实施例所提供的用于科室分诊的分诊模型的训练方法以及分诊方法可以由同一电子设备执行,也可以由不同的电子设备执行。例如,用于科室分诊的分诊模型的训练方法以及分诊方法均可以由服务器103执行。又例如,用于分诊方法可以由服务器103执行,用于科室分诊的分诊模型的训练方法可以由数据库服务器104执行。相应地,本公开实施例所提供的用于科室分诊的分诊模型的训练装置以及分诊装置可以设置于同一电子设备,也可以设置于不同的电子设备。例如,用于科室分诊的分诊模型的训练装置以及分诊装置均可以设置于服务器103中。又例如,用于分诊装置可以设置于服务器103中,用于科室分诊的分诊模型的训练装置可以设置于数据库服务器104中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的用于科室分诊的分诊模型的训练方法的流程图。
如图2所示,该方法包括操作S201~S205。
在操作S201,基于多个科室中每个科室的标注数据集以及科室在知识库中的科室描述文本,生成每个科室的关键词表,其中,每个科室的标注数据集包括针对该科室的多个病情描述文本。
示例性地,标注数据集可以是收集到的大量的病情症状描述文本,并且这些病症描述文本是通过医护专业人员标注好对应科室信息的,例如,病情描述文本[我最近有点咳嗽和发热]标注的科室信息为“呼吸内科”,[我手骨折了]标注的科室信息为“骨科”等等。每个科室的标注数据集中包括多个标注有该科室信息的病情描述文本。
示例性地,每个科室在知识库中的描述文本可以是各科室在维基百科、百度百度等知识库中的解释文本。
根据本公开的实施例,可以基于每个科室的标注数据集中的病情描述文本与该科室在百科中的解释文本之间的相关性,确定每个科室的关键词。示例性地,科室的关键词可以是病情描述文本中与该科室在百科中的解释文本之间的相关性较大的分词。例如,[我最近有点咳嗽和发热]中的分词[咳嗽]和[发热]与呼吸内科在百科中的解释文本之间的相关性较大,因此,[咳嗽]和[发热]可以作为呼吸内科的关键词,呼吸内科的关键词表可以是[咳嗽、发热……]。
在操作S202,针对每个科室的多个病情描述文本,利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量,并利用第二网络模型对每个科室的关键词表进行处理,得到针对每个科室的关键词表向量。
根据本公开的实施例,第一网络模型可以包括用于将自然语言编码成词向量的Embedding嵌入层以及用于获取隐层特征向量的LSTM(Long Short-Term Memory,长短期记忆)网络层。
下面结合图3对本公开实施例提供的操作S202,利用第一网络模型对每个病情描述文本进行处理的方法进行说明。
图3示意性示出了根据本公开实施例的利用第一网络模型对每个病情描述文本进行处理的方法的流程图。
如图3所示,操作S202包括操作操作S301~S302。
在操作S301,利用词向量子模型对每个病情描述文本进行处理,得到每个病情描述文本的的词向量。
在操作S302,利用特征提取子模型对每个病情描述文本的词向量进行处理,得到每个病情描述文本的第一特征向量。
根据本公开的实施例,将每个病情描述文本输入到Embedding嵌入层,通过Embedding嵌入层输出该病情描述文本的词向量表达,然后将该病情描述文本的词向量表达输入到LSTM网络层,LSTM网络层输出该病情描述文本的第一特征向量。
示例性地,Embedding层的输入为病情描述的文本x=[x1,X2,......,xn],其中,x1至xn为病情描述文本中的分词。Embedding层的输出为x的词向量表达,LSTM的输入是x的词向量表达,LSTM的输出是x的隐层特征向量,隐层特征向量能够表征x的每个分词的上下文关系。例如,x的隐层特征向量可以表示为h=[h1,h2,......,hn],其中,hs=LSTM(xs,hs-1),其中,s为大于等于1小于等于n的整数。
根据本公开的实施例,第二网络模型可以包括用于将自然语言编码成词向量的Embedding嵌入层,将科室的关键词表输入到第二网络模型,通过Embedding嵌入层对关键词表进行处理,得到该科室的关键词表向量。示例性地,呼吸内科的关键词表为[咳嗽、发热……],将[咳嗽、发热……]输入到Embedding层,Embedding层经处理输出呼吸内科的关键词表的向量表达。
示例性地,每个科室的关键词表向量可以表示为[v11,v12,……,v1m],[v21,v22,……,v2m']……[vi1,vi2,……,vim‘’]……。其中,i表示第i个科室。
在操作S203,针对每个病情描述文本,基于病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的病情描述文本的第二特征向量。
根据本公开的实施例,针对每个病情描述文本,可以基于每个病情描述文本的第一特征向量与每个科室的关键词表向量[vi1,vi2,……,vim,……]之间的相关性,确定针对每个科室的该病情描述文本的第二特征向量。
示例性地,针对任一病情描述文本x,其第一特征向量为h=[h1,h2,......,hn],针对第一特征向量h=[h1,h2,......,hn]与第一科室的关键词表向量[v11,v12,……,v1m]之间的相关性,可以计算第一特征向量h=[h1,h2,……,hn]与关键词表向量[v11,v12,……,v1m]中的每个关键词向量之间的相关度。其中,相关性的计算例如可以基于向量之间的距离等。然后,选取出与第一特征向量h=[h1,h2,……,hn]相关度最大的关键词,例如关键词表中的关键词向量v12为与第一特征向量h=[h1,h2,......,hn]相关度最大的关键词,可以将该关键词v12的相关度与所有关键词的相关度之和的比值作为第一科室的相关性权重,基于第一科室的相关性权重,对第一特征向量进行加权处理,得到该病情描述文本x的针对第一科室的第二特征向量,第二特征向量例如可以表示为rep_vi,其中,i表示第i个科室,则该任一病情描述文本x针对第一科室的第二特征向量可以是rep_v1,示例性地,rep_v1可以表示为[w11,w12,……,w1m],其中,w11是基于h1以及第一科室的相关性权重确定的。该任一病情描述文本x针对其他科室的第二特征向量rep_vi=[wi1,wi2,……,wim]的计算方法同上,这里不再赘述,最终可以得到病情描述文本x针对每个科室的第二特征向量rep_vi,每个第二特征向量融合了各自对应的科室的知识。
在操作S204,针对每个病情描述文本,基于病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成病情描述文本的融合特征向量。
示例性地,针对任一病情描述文本x,基于任一病情描述文本的第一特征向量h=[h1,h2,......,hn]与每个第二特征向量rep_vi之间的相关性,可以确定每个第二特征向量的权重。
示例性地,针对任一病情描述文本x,其第一特征向量为h=[h1,h2,......,hn],其针对第一科室的第二特征向量为rep_v1=[w11,w12,……,w1m],基于第一特征向量h与第二特征向量rep_v1之间的相关性,可以确定第二特征向量rep_v1的权重。同理,可以计算出针对每个科室的第二特征向量rep_vi的权重,然后基于每个第二特征向量rep_vi以及该第二特征向量的权重,可以对每个第二特征向量进行加权(例如进行加权求和),得到病情描述文本x的融合特征向量。示例性地,病情描述文本x的融合特征向量例如可以表示为rep,rep可以表示为∑irep_vi*βi,其中,βi为第i个第二特征向量的权重。
在操作S205,基于每个病情描述文本的融合特征向量和病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的分诊模型。
根据本公开的实施例,病情描述文本的融合特征向量融合了全部科室的知识,利用病情描述文本的融合特征向量进行训练,能够避免模型忽略掉重要的特征,进而能够提高分诊模型分类的准确性。
示例性地,将病情描述文本x的融合特征向量输入到预先构建的网络模型中,该网络模型输出病情描述文本x的预测科室信息。基于病情描述文本x的标注的科室信息与预测科室信息之间的误差,计算网络模型的损失函数,基于损失函数调整模型的参数,得到更新后的模型,利用更新后的模型重复上述训练步骤,直至损失函数收敛,得到经训练的分诊模型,该经训练的分诊模型可以对用户新输入的病情描述文本进行处理,输出该新输入的病情描述文本的科室信息,以便用户基于科室信息进行挂号。
根据本公开的实施例,基于多个科室中每个科室的标注数据集以及科室在知识库中的科室描述文本,生成每个科室的关键词表,针对每个科室的标注数据集中的多个病情描述文本,利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量,并利用第二网络模型对每个科室的关键词表进行处理,得到针对每个科室的关键词表向量,基于病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的病情描述文本的第二特征向量,基于病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成病情描述文本的融合特征向量,基于每个病情描述文本的融合特征向量和病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的分诊模型。由于病情描述文本的融合特征向量融合了所有科室的知识,利用病情描述文本的融合特征向量进行训练,能够避免模型忽略掉重要的特征,进而能够提高分诊模型分类的准确性。
下面参考图4~图8,结合具体实施例对图2所示的方法做进一步说明。
图4示意性示出了根据本公开实施例的生成每个科室的关键词表的方法的流程图。
如图4所示,操作S201包括操作操作S401~S403。
在操作S401,对每个病情描述文本进行划分,得到针对每个病情描述文本的多个分词。
根据本公开的实施例,对每个描述文本进行划分处理,得到的多个分词。例如,对病情描述文本[我最近有点咳嗽和发热]进行划分,可以得到分词[我]、[最近]、[有点]、[咳嗽]、[发热]。
在操作S402,基于每个分词和科室描述文本共现的概率,计算每个分词与科室描述文本之间的相关性。
根据本公开的实施例,基于[我]、[最近]、[有点]、[咳嗽]、[发热]中的每个分词与呼吸内科的解释文本之间的相关性,可以确定多个分词中与呼吸内科相关性最大的分词。
示例性地,可以用每个分词与呼吸内科的解释文本之间的点互信息(PointwiseMutual Information,PMI)表征每个分词与呼吸内科的解释文本之间的相关性。示例性地,点互信息每个分词x在大规模知识库每个科室的描述文本ti的PMI可以用如下公式一表示。
其中,p(x,ti)表示分词x与科室描述文本ti的联合分布概率,能够表征二者同时出现的频率。
在操作S403,基于相关性满足预设条件的分词,生成每个科室的关键词表。
示例性地,基于上述公式一,得出[我最近有点咳嗽和发热]中的[咳嗽]和[发热]是上述几个分词中相关性较大的分词,则可以确定[咳嗽]和[发热]为呼吸内科的关键词,[咳嗽、发热……]组成呼吸内科的关键词表。又例如,基于上述公式一,得到与“耳鼻喉科”的关键词表中包含:[鼻炎]、[鼻窦]、[耳鸣]、[喉炎]等。
图5示意性示出了根据本公开实施例的生成针对每个科室的病情描述文本的第二特征向量的方法的流程图。
如图5所示,操作S203包括操作操作S501~S503。
在操作S501,基于病情描述文本的第一特征向量与每个科室的关键词表中的每个关键词之间的相关性,生成针对每个关键词的权重。
根据本公开的实施例,x对应的隐层向量h与每个科室的关键词向量的相关性的计算公式可以如下公式二所示。
其中,tanh为计算相关性的激励函数,u1 T、w1以及w2为该激励函数的参数。hj为病情描述文本x中第j个分词的第一特征向量,vik为第i个科室的关键词表中第k个关键词的向量,k为大于1的整数。
在操作S502,基于针对每个关键词的权重中的最大值以及针对每个关键词的权重之和,确定针对每个关键词表的权重。
根据本公开的实施例,找出与病情描述文本x之间的相关性最大的关键词,该相关性最大的关键词的相关性程度可以用如下公式三表示。
根据本公开的实施例,可以对相关性程度进行正则化处理,如下公式四所示。
在操作S503,基于针对每个关键词表的权重,对病情描述文本的第一特征向量进行处理,生成针对每个科室的病情描述文本的第二特征向量。
根据本公开的实施例,利用正则化之后的相关性权重对h进行加权,获取到h针对每个科室的第二特征向量表达rep_vi,rep_vi可以如下公式五所示。
其中,hj为病情描述文本x中第j个分词的第一特征向量。
图6示意性示出了根据本公开实施例的生成病情描述文本的融合特征向量的方法的流程图。
如图6所示,操作S204包括操作操作S601~S602。
在操作S601,基于病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成针对每个第二特征向量的权重。
根据本公开的实施例,基于第一特征向量与第二特征向量之间的相关性,计算每个第二特征向量的权重的计算公式可以如下公式六表示。
其中,表示计算第一特征向量与第二特征向量之间的相关性程度的激励函数,u2 T、w3和w4为该激励函数的参数。Softmax为计算相关性程度最大的函数,针对每个第二特征向量,以计算与第一特征向量之间的相关性最大为目标,得到的相关性程度的值为该第二特征向量的权重βi。
在操作S602,基于每个第二特征向量的权重,对每个第二特征向量进行处理,生成病情描述文本的融合特征向量。
根据本公开的实施例,生成病情描述文本的融合特征向量的计算公式如下公式七所示。
rep=∑irep-vi*βi (公式七)
其中,rep_vi为病情描述文本x针对第i个科室的第二特征向量,βi为第二特征向量的权重,rep为病情描述文本x的融合特征向量。病情描述文本x的融合特征向量融合了全部科室知识的向量表达。
图7示意性示出了根据本公开另一实施例的生成病情描述文本的融合特征向量的方法的示意图。
如图7所示,病情描述文本x=[我最近有点咳嗽和发热]划分为多个分词:[我]、[最近]、[有点]、[咳嗽]……。病情描述文本x可以表示为x=[我,最近,有点,咳嗽…],可以将x=[我,最近,有点,咳嗽…]输入到LSTM,LSTM输出x的第一特征向量h=[h1,h2,......,hn]。
如图7所示,科室1的关键词表例如可以表示为[鼻炎,耳鸣,……],科室2的关键词表例如可以表示为[癌症,肿瘤,……],将每个科室的关键词表输入到Embedding层,Embedding层输出该科室的关键词表向量[v11,v12,……,v1m],[v21,v22,……,v2m’]等等。
参考图7,基于病情描述文本x的第一特征向量h=[h1,h2,......,hn]与每个科室的关键词表向量[v11,v12,……,v1m],[v21,v22,……,v2m’]……之间的相关性关系,可以生成病情描述文本x的多个第二特征向量,每个第二特征向量与一个科室对应。第二特征向量例如可以表示为[w11,w12,……,w1m],[w21,w22,……,w2m’]……。
继续参考图7,基于病情描述文本x的第一特征向量h=[h1,h2,......,hn]与每个第二特征向量[w11,w12,……,w1m],[w21,w22,……,w2m']……之间的相关性,可以生成病情描述文本x的融合特征向量。融合特征向量例如可以表示为rep,rep可以表示为∑irep_vi*βi,其中,βi为第i个第二特征向量的权重,βi是基于第一特征向量与第i个第二特征向量之间的相关性确定的。每个第二特征向量融合了各自对应的科室的知识,rep融合了全部科室的知识信息。
因此,基于融合了全部科室的知识信息的病情描述文本x的融合特征向量rep进行分类模型的训练,可以避免模型忽略掉重要的特征,进而能够提高分诊模型分类的准确性。
图8示意性示出了根据本公开实施例的对第三网络模型进行训练的方法的流程图。
如图8所示,操作S205包括操作操作S801~S804。
在操作S801,利用第三网络模型对任一病情描述文本的融合特征向量进行处理,得到任一病情描述文本的预测科室信息。
根据本公开的实施例,针对任一病情描述文本x,将x的融合特征向量输入到预先构建的第三网络模型,第三网络模型对x的融合特征向量进行处理,输出预测该病情描述文本x对应的科室信息。示例性地,第三网络模型的输出例如可以用如下公式八表示。
_y=softmax(w5*rep) (公式八)
其中,softmax可以是用于构造第三网络模型的函数,_y为该第三网络模型输出的预测值。
在操作S802,基于任一病情描述文本的的科室信息与预测科室信息之间的误差,确定第三网络模型的损失。
根据本公开的实施例,基于第三网络模型输出的预测值与病情描述文本x真实的科室信息之间的误差,利用交叉熵计算第三网络模型的损失。第三网络模型的损失可以用如下公式九表示。
其中,_y为该第三网络模型输出的病情描述文本x的预测科室的编号,y为病情描述文本x的真实科室的编号。lossp为该第三网络模型的损失值。
在操作S803,基于第三网络模型的损失调整第三网络模型的参数,以得到更新的第三网络模型。
在操作S804,针对更新的第三网络模型,重复上述训练过程,直至第三网络模型的损失收敛,得到经训练的分诊模型。
根据本公开的实施例,基于损失值调整模型的参数,得到更新后的模型,利用更新后的模型重复上述训练步骤,直至损失函数收敛,得到经训练的分诊模型,该经训练的分诊模型可以对用户新输入的病情描述文本进行处理,输出该新输入的病情描述文本的科室信息,以便用户基于科室信息进行挂号。
图9示意性示出了根据本公开实施例的分诊方法的流程图。
如图9所示,包括操作S901~S902。
在操作S901,获取用户输入的病情描述文本。
在操作S902,利用分诊模型对病情描述文本进行处理,得到针对病情描述文本的目标科室信息。
其中,分诊模型是利用根据上述分诊模型的训练方法训练得到的。
根据本公开的实施例,针对一个新的病情描述文本z,将该病情描述文本z输入到训练好的分诊模型中,分诊模型可以输出对应的科室编号,以指导用户到正确的科室进行挂号。
图10示意性示出了根据本公开的实施例的用于科室分诊的分诊模型的训练装置的框图。
如图10所示,用于科室分诊的分诊模型的训练装置1000包括第一生成模块1001、第一处理模块1002、第二生成模块1003、第三生成模块1004和训练模块1005。
第一生成模块1001用于基于多个科室中每个科室的标注数据集以及科室在知识库中的科室描述文本,生成每个科室的关键词表,其中,每个科室的标注数据集包括针对该科室的多个病情描述文本;
第一处理模块1002用于针对每个科室的多个病情描述文本,利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量,并利用第二网络模型对每个科室的关键词表进行处理,得到针对每个科室的关键词表向量;
第二生成模块1003用于针对每个病情描述文本,基于病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的病情描述文本的第二特征向量;
第三生成模块1004用于基于每个病情描述文本的第一特征向量以及针对每个科室的第二特征向量,生成每个病情描述文本的融合特征向量;
训练模块1005用于基于每个病情描述文本的融合特征向量和病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的分诊模型。
图11示意性示出了根据本公开的实施例的分诊装置的框图。
如图11所示,分诊装置1100包括获取模块1101和第二处理模块1102。
获取模块1101用于获取用户输入的病情描述文本。
第二处理模块1102用于利用分诊模型对病情描述文本进行处理,得到针对病情描述文本的目标科室信息。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一生成模块1001、第一处理模块1002、第二生成模块1003、第三生成模块1004和训练模块1005中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,第一生成模块1001、第一处理模块1002、第二生成模块1003、第三生成模块1004和训练模块1005中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一生成模块1001、第一处理模块1002、第二生成模块1003、第三生成模块1004和训练模块1005中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
需要说明的是,本公开的实施例中用于科室分诊的分诊模型的训练装置部分与本公开的实施例中用于科室分诊的分诊模型的训练方法部分是相对应的,用于科室分诊的分诊模型的训练装置部分的描述具体参考用于科室分诊的分诊模型的训练方法部分,在此不再赘述。
需要说明的是,本公开的实施例中分诊装置部分与本公开的实施例中分诊方法部分是相对应的,分诊装置部分的描述具体参考分诊方法部分,在此不再赘述。
图12示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机系统的框图。图12示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图12所示,根据本公开实施例的计算机系统1200包括处理器1201,其可以根据存储在只读存储器(ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(RAM)1203中的程序而执行各种适当的动作和处理。处理器1201例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器1201还可以包括用于缓存用途的板载存储器。处理器1201可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1203中,存储有系统1200操作所需的各种程序和数据。处理器1201、ROM1202以及RAM 1203通过总线1204彼此相连。处理器1201通过执行ROM 1202和/或RAM 1203中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 1202和RAM 1203以外的一个或多个存储器中。处理器1201也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,系统1200还可以包括输入/输出(I/O)接口1205,输入/输出(I/O)接口1205也连接至总线1204。系统1200还可以包括连接至I/O接口1205的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被处理器1201执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1202和/或RAM 1203和/或ROM 1202和RAM 1203以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (11)
1.一种用于科室分诊的分诊模型的训练方法,包括:
基于多个科室中每个科室的标注数据集以及所述科室在知识库中的科室描述文本,生成所述每个科室的关键词表,其中,所述每个科室的标注数据集包括针对该科室的多个病情描述文本;
针对每个科室的多个病情描述文本,利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量,并利用第二网络模型对所述每个科室的关键词表进行处理,得到针对每个科室的关键词表向量;
针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的所述病情描述文本的第二特征向量;
针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成所述病情描述文本的融合特征向量;
基于所述每个病情描述文本的融合特征向量和所述病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的所述分诊模型。
2.根据权利要求1所述的方法,其中,所述基于多个科室中每个科室的标注数据集以及所述科室在知识库中的科室描述文本,生成所述每个科室的关键词表包括:针对每个科室的标注数据集中的多个病情描述文本,
对每个病情描述文本进行划分,得到针对每个病情描述文本的多个分词;
基于每个分词和所述科室描述文本共现的概率,计算所述每个分词与所述科室描述文本之间的相关性;
基于所述相关性满足预设条件的分词,生成所述每个科室的关键词表。
3.根据权利要求1所述的方法,其中,所述第一网络模型包括词向量子模型和特征提取子模型;所述利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量包括:
利用所述词向量子模型对所述每个病情描述文本进行处理,得到所述每个病情描述文本的的词向量;
利用所述特征提取子模型对所述每个病情描述文本的词向量进行处理,得到所述每个病情描述文本的所述第一特征向量。
4.根据权利要求1所述的方法,其中,所述针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的所述病情描述文本的第二特征向量包括:
基于所述病情描述文本的第一特征向量与每个科室的关键词表中的每个关键词之间的相关性,生成针对每个关键词的权重;
基于针对所述每个关键词的权重中的最大值以及所述针对每个关键词的权重之和,确定针对每个关键词表的权重;
基于针对每个关键词表的权重,对所述病情描述文本的第一特征向量进行处理,生成针对每个科室的所述病情描述文本的第二特征向量。
5.根据权利要求1所述的方法,其中,所述针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成所述病情描述文本的融合特征向量包括:
基于所述病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成针对每个第二特征向量的权重;
基于每个第二特征向量的权重,对所述每个第二特征向量进行处理,生成所述病情描述文本的融合特征向量。
6.根据权利要求1所述的方法,其中,所述基于所述每个病情描述文本的融合特征向量和所述病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的所述分诊模型包括:
利用所述第三网络模型对任一病情描述文本的融合特征向量进行处理,得到所述任一病情描述文本的预测科室信息;
基于所述任一病情描述文本的的科室信息与预测科室信息之间的误差,确定所述第三网络模型的损失;
基于所述第三网络模型的损失调整所述第三网络模型的参数,以得到更新的第三网络模型;
针对所述更新的第三网络模型,重复上述训练过程,直至所述第三网络模型的损失收敛,得到经训练的所述分诊模型。
7.一种分诊方法,包括:
获取用户输入的病情描述文本;
利用分诊模型对所述病情描述文本进行处理,得到针对所述病情描述文本的目标科室信息;
其中,所述分诊模型是利用根据权利要求1~6中任一项所述的方法训练的。
8.一种用于科室分诊的分诊模型的训练装置,包括:
第一生成模块,用于基于多个科室中每个科室的标注数据集以及所述科室在知识库中的科室描述文本,生成所述每个科室的关键词表,其中,所述每个科室的标注数据集包括针对该科室的多个病情描述文本;
第一处理模块,用于针对每个科室的多个病情描述文本,利用第一网络模型对每个病情描述文本进行处理,得到每个病情描述文本的第一特征向量,并利用第二网络模型对所述每个科室的关键词表进行处理,得到针对每个科室的关键词表向量;
第二生成模块,用于针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个科室的关键词表向量之间的相关性,生成针对每个科室的所述病情描述文本的第二特征向量;
第三生成模块,用于针对每个病情描述文本,基于所述病情描述文本的第一特征向量与每个第二特征向量之间的相关性,生成所述病情描述文本的融合特征向量;
训练模块,用于基于所述每个病情描述文本的融合特征向量和所述病情描述文本的科室信息,对第三网络模型进行训练,得到经训练的所述分诊模型。
9.一种分诊装置,包括:
获取模块,用于获取用户输入的病情描述文本;
第二处理模块,用于利用分诊模型对所述病情描述文本进行处理,得到针对所述病情描述文本的目标科室信息;
其中,所述分诊模型是利用根据权利要求1~6中任一项所述的方法训练的。
10.一种计算机系统,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011275299.3A CN112349410B (zh) | 2020-11-13 | 2020-11-13 | 用于科室分诊的分诊模型的训练方法、分诊方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011275299.3A CN112349410B (zh) | 2020-11-13 | 2020-11-13 | 用于科室分诊的分诊模型的训练方法、分诊方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112349410A true CN112349410A (zh) | 2021-02-09 |
CN112349410B CN112349410B (zh) | 2024-04-09 |
Family
ID=74363858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011275299.3A Active CN112349410B (zh) | 2020-11-13 | 2020-11-13 | 用于科室分诊的分诊模型的训练方法、分诊方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112349410B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012822A (zh) * | 2021-03-23 | 2021-06-22 | 同济大学 | 一种基于生成式对话技术的医疗问答系统 |
CN113254649A (zh) * | 2021-06-22 | 2021-08-13 | 中国平安人寿保险股份有限公司 | 敏感内容识别模型的训练方法、文本识别方法及相关装置 |
CN115908943A (zh) * | 2022-12-16 | 2023-04-04 | 合肥本源量子计算科技有限责任公司 | 图像分类方法、装置、电子设备及计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210018A (zh) * | 2019-05-14 | 2019-09-06 | 北京百度网讯科技有限公司 | 挂号科室的匹配方法和装置 |
CN110246572A (zh) * | 2019-05-05 | 2019-09-17 | 清华大学 | 一种基于词向量的医疗分诊方法及系统 |
CN110287270A (zh) * | 2019-06-14 | 2019-09-27 | 北京百度网讯科技有限公司 | 实体关系挖掘方法及设备 |
CN110347838A (zh) * | 2019-07-17 | 2019-10-18 | 成都医云科技有限公司 | 线上科室分诊模型训练方法及装置 |
CN110648754A (zh) * | 2018-06-27 | 2020-01-03 | 北京百度网讯科技有限公司 | 科室推荐方法、装置及设备 |
CN110993078A (zh) * | 2019-11-27 | 2020-04-10 | 华中科技大学同济医学院附属协和医院 | 一种医疗分诊方法、装置和存储介质 |
US20200303072A1 (en) * | 2017-12-29 | 2020-09-24 | Obshchestvo S Ogranichennoj Otvetstvennostyu "Intellodzhik" | Method and system for supporting medical decision making |
-
2020
- 2020-11-13 CN CN202011275299.3A patent/CN112349410B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200303072A1 (en) * | 2017-12-29 | 2020-09-24 | Obshchestvo S Ogranichennoj Otvetstvennostyu "Intellodzhik" | Method and system for supporting medical decision making |
CN110648754A (zh) * | 2018-06-27 | 2020-01-03 | 北京百度网讯科技有限公司 | 科室推荐方法、装置及设备 |
CN110246572A (zh) * | 2019-05-05 | 2019-09-17 | 清华大学 | 一种基于词向量的医疗分诊方法及系统 |
CN110210018A (zh) * | 2019-05-14 | 2019-09-06 | 北京百度网讯科技有限公司 | 挂号科室的匹配方法和装置 |
CN110287270A (zh) * | 2019-06-14 | 2019-09-27 | 北京百度网讯科技有限公司 | 实体关系挖掘方法及设备 |
CN110347838A (zh) * | 2019-07-17 | 2019-10-18 | 成都医云科技有限公司 | 线上科室分诊模型训练方法及装置 |
CN110993078A (zh) * | 2019-11-27 | 2020-04-10 | 华中科技大学同济医学院附属协和医院 | 一种医疗分诊方法、装置和存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012822A (zh) * | 2021-03-23 | 2021-06-22 | 同济大学 | 一种基于生成式对话技术的医疗问答系统 |
CN113254649A (zh) * | 2021-06-22 | 2021-08-13 | 中国平安人寿保险股份有限公司 | 敏感内容识别模型的训练方法、文本识别方法及相关装置 |
CN113254649B (zh) * | 2021-06-22 | 2023-07-18 | 中国平安人寿保险股份有限公司 | 敏感内容识别模型的训练方法、文本识别方法及相关装置 |
CN115908943A (zh) * | 2022-12-16 | 2023-04-04 | 合肥本源量子计算科技有限责任公司 | 图像分类方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112349410B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109599185B (zh) | 疾病数据处理方法、装置、电子设备及计算机可读介质 | |
US10650102B2 (en) | Method and apparatus for generating parallel text in same language | |
Cornegruta et al. | Modelling radiological language with bidirectional long short-term memory networks | |
US20180025121A1 (en) | Systems and methods for finer-grained medical entity extraction | |
CN111753543A (zh) | 药物推荐方法、装置、电子设备及存储介质 | |
KR102424085B1 (ko) | 기계-보조 대화 시스템 및 의학적 상태 문의 장치 및 방법 | |
CN110442840B (zh) | 序列标注网络更新方法、电子病历处理方法及相关装置 | |
US12008313B2 (en) | Medical data verification method and electronic device | |
CN112329964A (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
WO2019208070A1 (ja) | 質問応答装置、質問応答方法及びプログラム | |
CN108509427B (zh) | 文本数据的数据处理方法及应用 | |
US20220229984A1 (en) | Systems and methods for semi-supervised extraction of text classification information | |
WO2022001724A1 (zh) | 一种数据处理方法及装置 | |
Ding et al. | An attentive neural sequence labeling model for adverse drug reactions mentions extraction | |
CN111881292B (zh) | 一种文本分类方法及装置 | |
CN112349410B (zh) | 用于科室分诊的分诊模型的训练方法、分诊方法和系统 | |
WO2023173823A1 (zh) | 药物对相互作用关系的预测方法、设备及介质 | |
Sun et al. | Study on medical image report generation based on improved encoding-decoding method | |
RU2720363C2 (ru) | Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта | |
CN115798661A (zh) | 临床医学领域的知识挖掘方法和装置 | |
WO2023168810A1 (zh) | 药物分子的性质预测方法、装置、存储介质及计算机设备 | |
CN113704415B (zh) | 医学文本的向量表示生成方法和装置 | |
Li et al. | An RG-FLAT-CRF model for named entity recognition of Chinese electronic clinical records | |
WO2022227171A1 (zh) | 关键信息提取方法、装置、电子设备及介质 | |
US11823775B2 (en) | Hashing electronic records |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |