CN114242267A - 基于神经网络的问诊回复方法、装置、设备及存储介质 - Google Patents
基于神经网络的问诊回复方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114242267A CN114242267A CN202111538780.1A CN202111538780A CN114242267A CN 114242267 A CN114242267 A CN 114242267A CN 202111538780 A CN202111538780 A CN 202111538780A CN 114242267 A CN114242267 A CN 114242267A
- Authority
- CN
- China
- Prior art keywords
- text
- inquiry
- reply
- patient
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Probability & Statistics with Applications (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及人工智能技术领域,适用于线上问诊,公开了一种基于神经网络的问诊回复方法、装置、设备及存储介质,其方法包括:获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词;基于预设规则查询与问诊关键词对应的话题标签;将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,文本生成模型基于患者的历史问诊信息和历史文本回复内容、以及历史文本回复内容对应的修改记录训练得到。本发明通过患者提供的问诊信息中的多个话题进行组合,再由文本生成模型根据组合话题生成回复内容,能够全面、精准对患者的问诊进行回复,且结合了文本回复内容修改记录训练的文本生成模型生成的文本更准确。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种基于神经网络的问诊回复方法、装置、设备及存储介质。
背景技术
随着互联网医疗的快速发展,线上问诊已经成为患者问诊的重要方式,可以支持疾病辅助诊断、健康管理、远程会诊等功能,线上问诊的优势有:减轻三甲医院医患压力,避免医患关系紧张,承担初步筛查作用,支持跨地域患者寻诊。
目前的线上问诊系统主要通过以下两种方式来实习问诊回复:其一是是根据前序的信息输入,进行关键症状信息的提取,再采用模板槽位填充的方式,得到相应的文本回复内容,这种方法需要依赖前期大量专家资源总结模板,并且由于模板的限定,使得生成的内容较死板。其二是通过设计带有编码器、解码器结构的深度神经网络,直接对输入文本进行编码,得到一个隐藏层的向量化表示,再由解码器对隐藏层表示解码得到对应的回复文本,然而,这种方法需要海量的平行语料支撑,其结果往往不具有可解释性。
因此,即便是实现了上述两种方法的系统,用户也不可避免地需要对生成的回复文本进行较大篇幅的修改调整,影响问诊的效率,若不考虑用户对回复文本进行修改,对于患者而言,采用模板填充的较为死板或纯粹基于端到端生成的杂乱的回复内容,会造成较差的用户体验,影响在线问诊产品客户的留存率。
发明内容
本申请提供一种基于神经网络的问诊回复方法、装置、设备及存储介质,以解决现有的智能问诊回复效果差、内容不够精确的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种基于神经网络的问诊回复方法,包括:获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词;基于预设规则查询与问诊关键词对应的话题标签;将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,文本生成模型基于患者的历史问诊信息和历史回复文本内容、以及历史回复文本内容对应的修改记录训练得到。
作为本申请的进一步改进,生成相应的文本回复内容之后,还包括:输出展示文本回复内容至医生终端;接收医生终端输入的修改请求,并根据修改请求进行修改,同时生成修改记录;将修改后的最终文本回复内容输出至患者终端。
作为本申请的进一步改进,将修改后的最终文本回复内容输出至患者之后,还包括:获取每进行一次修改时生成的中间文本;将中间文本和修改记录作为输入数据,输入至文本生成模型中,得到新的文本内容;利用最终文本回复内容作为真实结果,结合新的文本内容和损失函数反向传播更新文本生成模型。
作为本申请的进一步改进,修改记录包括修改的总时长、平均时长、修改字符总数中的至少一个。
作为本申请的进一步改进,获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词,包括:获取患者终端输入的问诊信息;对问诊信息进行预处理获得多个候选关键词;将问诊信息输入至Word2Vec模型,得到每个候选关键词对应的词向量表示;对候选关键词的词向量表示进行聚类,得到多个聚类以及每个聚类的聚类中心;计算每个聚类中的候选关键词的词向量表示与聚类中心的距离,按距离大小进行降序排序;将排名前预设数量个候选关键词作为问诊关键词。
作为本申请的进一步改进,文本生成模型包括变分自动编码器和解码器;将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,包括:将话题标签输入至预先训练好的变分自动编码器,得到中间层的参数表示;将中间层的参数表示输入至解码器中进行重构,得到文本回复内容。
作为本申请的进一步改进,基于预设规则查询与问诊关键词对应的话题标签之后,还包括:接收医生终端输入或选择的话题标签。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种基于神经网络的问诊回复装置,包括:获取模块,用于获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词;查询模块,用于基于预设规则查询与问诊关键词对应的话题标签;生成模块,用于将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,文本生成模型基于患者的历史问诊信息和历史回复文本内容、以及历史回复文本内容对应的修改记录训练得到。
为解决上述技术问题,本申请采用的再一个技术方案是:提供一种计算机设备,该计算机设备包括处理器、与处理器耦接的存储器,存储器中存储有程序指令,程序指令被处理器执行时,使得处理器执行如上述中任一项的基于神经网络的问诊回复方法的步骤。
为解决上述技术问题,本申请采用的再一个技术方案是:提供一种存储介质,存储有能够实现上述基于神经网络的问诊回复方法的程序指令。
本申请的有益效果是:本申请的基于神经网络的问诊回复方法通过针对患者提供的问诊信息筛选出所有相关的话题,再将相关的话题由文本生成模型生成合适的文本描述以供患者查看,该中话题标签组合生成回复内容的方式大大降低了遗漏话题的可能性,能根据问诊信息尽可能的给出合理、全面的回复内容,并且文本回复内容的生成不依赖于模板来实现,而是由根据历史问诊信息和历史文本回复内容、以及历史文本回复内容对应的修改记录训练得到文本生成模型来生成,使得生成的文本更为准确,表达效果更好。
附图说明
图1是本发明第一实施例的基于神经网络的问诊回复方法的流程示意图;
图2是本发明第二实施例的基于神经网络的问诊回复方法的流程示意图;
图3是本发明第三实施例的基于神经网络的问诊回复方法的流程示意图;
图4是本发明第四实施例的基于神经网络的问诊回复方法的流程示意图;
图5是本发明实施例的基于神经网络的问诊回复装置的功能模块示意图;
图6是本发明实施例的计算机设备的结构示意图;
图7是本发明实施例的存储介质的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
图1是本发明第一实施例的基于神经网络的问诊回复方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图1所示的流程顺序为限。如图1所示,该方法包括步骤:
步骤S101:获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词。
需要说明的是,随着互联网医疗的快速发展,为了提高医生的看诊效率,线上诊疗系统已经得到普遍使用。通过该线上诊疗系统,患者可输入自身的病症信息来进行问诊,医生在看到病症信息后进行问诊回复,可以大大提高看诊效率。本实施例的基于神经网络的问诊回复方法可应用于智能诊疗、远程会诊。
在步骤S101中,患者通过患者终端输入问诊信息,该问诊信息可包括症状信息,例如“晚上睡不好觉,梦多,经常醒,心慌”等,还可包括患者自身感觉的诱因信息,例如“最近工作压力大”等。本实施例中,在接收到患者终端输入的问诊信息后,从该问诊信息中提取得到问诊关键词,例如,从症状信息“晚上睡不好觉,梦多,经常醒,心慌”中可以提取的到问诊关键词“睡不好觉”、“心慌”,从“最近工作压力大”可以提取得到问诊关键词“压力大”。
进一步的,为了保证能够准确、全面提取到问诊信息中的问诊关键词,在一些实施例中,步骤S101具体包括:
1、获取患者终端输入的问诊信息。
需要说明的是,为了方便处理,该问诊信息为文本信息。可以理解的是,患者在患者终端输入的信息可以是文本信息也可以是语音信息,若是语音信息,则需要将该语音信息转换为文本信息。
2、对问诊信息进行预处理获得多个候选关键词。
具体地,通过分词算法对问诊信息进行分词处理,从而将问诊信息划分为多个候选关键词。其中,该分词算法可以是最大匹配分词算法、最短路径分词算法、基于生成式模型(n-gram模型、HMM隐马尔可夫模型、朴素贝叶斯分类模型等)的分词算法、基于判别式模型(感知机、SVM支持向量机、CRF条件随机场、最大熵模型等)的分词算法、基于循环神经网络的分词算法中的一种。例如,对于患者提交的问诊信息“晚上睡不好觉,梦多,经常醒,心慌,最近工作压力大”,通过分词算法可以得到以下候选关键词:“晚上”、“睡不好觉”、“梦多”、“经常醒”、“心慌”、“最近”、“工作”、“压力大”。
3、将问诊信息输入至Word2Vec模型,得到每个候选关键词对应的词向量表示。
需要说明的是,该Word2Vec模型需要预先构建并训练。word2vec(word tovector)是一个将文本转换成向量表示的工具,与传统的文本表示方式相比,Word2Vec生成的词向量表示,关键词之间的语义关系在高维空间中得到了较好的体现,即语义相近的关键词在高维空间中的距离更近,同时,使用词向量避免了词语表示的“维度灾难”问题。
4、对候选关键词的词向量表示进行聚类,得到多个聚类以及每个聚类的聚类中心。
具体地,在获取到候选关键词的词向量表示后,对所有的词向量表示进行K-Means聚类,从而得到多个聚类的簇,以及每个聚类簇的聚类中心。
5、计算每个聚类中的候选关键词的词向量表示与聚类中心的距离,按距离大小进行降序排序。
具体地,在聚类之后,对于每个聚类的簇而言,计算簇内每个词向量表示与聚类中心之间的距离。需要说明的是,该距离可以是欧氏距离、曼哈顿距离、切比雪夫距离、余弦距离中的一种。在得到距离后,按距离将词向量表示进行降序排序。
6、将排名前预设数量个候选关键词作为问诊关键词。
具体地,本实施例中,通过采用Word2Vec模型将文本转换为词向量表示后,来筛选出所需要的问诊关键词,从而过滤掉其中对问诊而言非必要的关键词,例如,“最近工作压力大”中的“最近”,再利用获取到的问诊关键词来进行问诊,有利于提高后续问诊结果的准确性,降低其他非必要关键词造成的干扰。
步骤S102:基于预设规则查询与问诊关键词对应的话题标签。
在步骤S102中,该预设规则预先设置,例如,问诊关键词“睡不好觉”对应话题标签“睡眠障碍”,问诊关键词“心慌”对应话题标签“心悸”等,通过建立问诊关键词和话题标签之间的对应关系,从而快速找到与问诊相关的话题标签。需要说明的是,当患者提交的问诊信息中的问诊关键词无法找到对应的话题标签时,提示患者补充更多的描述,以便定位到相应的话题标签。
步骤S103:将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,文本生成模型基于患者的历史问诊信息和历史回复文本内容、以及历史回复文本内容对应的修改记录训练得到。
在步骤S103中,在获取到话题标签后,将该话题标签输入至预先训练好的文本生成模型中,利用该文本生成模型生成相应的文本回复内容,再将该文本回复内容输出至患者终端进行输出展示。优选地,若患者是通过语音的方式输入的问诊信息,则还可将文本回复内容转换成语音后输出。
需要说明的是,该文本生成模型基于患者的历史问诊信息和历史回复文本内容、以及历史回复文本内容对应的修改记录训练得到。
具体地,文本生成模型的训练步骤如下:
1、获取问诊样本信息,并提取问诊样本信息中的样本关键词;
2、获取与样本关键词对应的样本话题标签;
3、将样本话题标签输入至待训练的文本生成模型中,输出样本回复文本;
4、接收医生对样本回复文本的修改,得到最终样本文本,且每次修改时均生成相应的中间文本,并保留修改记录;
5、对中间文本和修改记录进行特征化处理后再输入至文本生成模型中,得到新的样本回复文本;
6、根据最终样本文本和新的样本回复文本结合预设的损失函数反向传播更新该文本生成模型。
进一步的,文本生成模型包括变分自动编码器和解码器。步骤S103具体包括:
1、将话题标签输入至预先训练好的变分自动编码器,得到中间层的参数表示。
2、将中间层的参数表示输入至解码器中进行重构,得到文本回复内容。
具体地,该文本生成模型包括变分自动编码器和解码器,变分自动编码器具有独特的性质,其在潜在空间在设计上是连续的,允许随机采样和插值。本实施例中,利用变分自动编码器对话题标签进行处理,得到中间层的参数表示,再将该中间层的参数表示输入至解码器中进行重构,得到文本回复内容。
本发明第一实施例的基于神经网络的问诊回复方法通过针对患者提供的问诊信息筛选出所有相关的话题,再将相关的话题由文本生成模型生成合适的文本描述以供患者查看,该中话题标签组合生成回复内容的方式大大降低了遗漏话题的可能性,能根据问诊信息尽可能的给出合理、全面的回复内容,并且文本回复内容的生成不依赖于模板来实现,而是由根据历史问诊信息和历史文本回复内容、以及历史文本回复内容对应的修改记录训练得到文本生成模型来生成,使得生成的文本更为准确,表达效果更好。
图2是本发明第二实施例的基于神经网络的问诊回复方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图2所示的流程顺序为限。如图2所示,该方法包括步骤:
步骤S201:获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词。
在本实施例中,图2中的步骤S201和图1中的步骤S101类似,为简约起见,在此不再赘述。
步骤S202:基于预设规则查询与问诊关键词对应的话题标签。
在本实施例中,图2中的步骤S202和图1中的步骤S102类似,为简约起见,在此不再赘述。
步骤S203:将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,文本生成模型基于患者的历史问诊信息和历史回复文本内容、以及历史回复文本内容对应的修改记录训练得到。
在本实施例中,图2中的步骤S203和图1中的步骤S103类似,为简约起见,在此不再赘述。
步骤S204:输出展示文本回复内容至医生终端。
在步骤S204中,在生成文本回复内容后,将该文本回复内容在医生终端进行输出展示,以供医生验证该文本回复内容中的信息是否准确,能够帮助患者了解自身情况。
步骤S205:接收医生终端输入的修改请求,并根据修改请求进行修改,同时生成修改记录。
在步骤S205中,医生在文本回复内容存在问题时,可进行修改,以确保文本回复内容正确。本实施例中,在接收到医生通过医生终端输入的修改请求后,根据该修改请求对文本回复内容进行修改,其中,该修改的方式包括有新增、删除、调整顺序、替换等方式。并且,在对文本回复内容进行修改时,同时生成该文本回复内容的修改记录。
步骤S206:将修改后的最终文本回复内容输出至患者终端。
在步骤S206中,在修改完成后,将修改好的文本回复内容在患者终端进行输出展示,以帮助患者了解自身的病症情况。
本发明第二实施例的基于神经网络的问诊回复方法在第一实施例的基础上,通过将文本生成模型生成的文本回复内容展示给医生,由医生修改确认后,再展示给患者,从而保证了最终展示的文本回复内容是与患者提供的问诊信息相吻合的,避免出现误诊情况。
图3是本发明第三实施例的基于神经网络的问诊回复方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图3所示的流程顺序为限。如图3所示,该方法包括步骤:
步骤S301:获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词。
在本实施例中,图3中的步骤S301和图2中的步骤S201类似,为简约起见,在此不再赘述。
步骤S302:基于预设规则查询与问诊关键词对应的话题标签。
在本实施例中,图3中的步骤S302和图2中的步骤S202类似,为简约起见,在此不再赘述。
步骤S303:将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,文本生成模型基于患者的历史问诊信息和历史回复文本内容、以及历史回复文本内容对应的修改记录训练得到。
在本实施例中,图3中的步骤S303和图2中的步骤S203类似,为简约起见,在此不再赘述。
步骤S304:输出展示文本回复内容至医生终端。
在本实施例中,图3中的步骤S304和图2中的步骤S204类似,为简约起见,在此不再赘述。
步骤S305:接收医生终端输入的修改请求,并根据修改请求进行修改,同时生成修改记录。
在本实施例中,图3中的步骤S305和图2中的步骤S205类似,为简约起见,在此不再赘述。
步骤S306:将修改后的最终文本回复内容输出至患者终端。
在本实施例中,图3中的步骤S306和图2中的步骤S206类似,为简约起见,在此不再赘述。
步骤S307:获取每进行一次修改时生成的中间文本。
需要说明的是,当医生对文本回复内容的修改内容较多时,则说明文本生成模型的精度还不够,需要继续进行迭代训练,而为了降低工作量,本方案在实际使用该文本生成模型时,利用患者提供的问诊信息进行进一步的迭代训练。
在步骤S307中,当根据修改请求对文本回复内容进行修改时,每进行一次修改即生成一个中间文本,例如,医生的修改请求可能包括多处修改,如两个新增内容、三个删除内容,则每进行一次新增操作时均将该次新增内容后的文本作为一个中间文本保存,每进行一次删除操作时同样将该删除内容后的文本作为一个中间文本保存,根据用户的修改请求,即可得到至少一个中间文本。
步骤S308:将中间文本和修改记录作为输入数据,输入至文本生成模型中,得到新的文本内容。
具体地,修改记录包括修改的总时长、平均时长、修改字符总数中的至少一个。
步骤S309:利用最终文本回复内容作为真实结果,结合新的文本内容和损失函数反向传播更新文本生成模型。
在步骤S308~步骤S309中,在得到中间文本后,将该中间文本和修改记录进行特征化,再输入至文本生成模型中得到新的文本内容,结合该新的文本内容、最终文本回复内容、预设的损失函数反向传播更新该文本生成模型,从而实现对文本生成模型的迭代训练。
本发明第三实施例的基于神经网络的问诊回复方法在第二实施例的基础上,通过利用患者提供的问诊信息对文本生成模型进行进一步的迭代训练,从而进一步提升该文本生成模型的精确度,并且无需单独收集整理训练数据,直接利用问诊过程中产生的交互数据即可进行训练,大大降低了训练模型的工作量。
图4是本发明第四实施例的基于神经网络的问诊回复方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图4所示的流程顺序为限。如图4所示,该方法包括步骤:
步骤S401:获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词。
在本实施例中,图4中的步骤S401和图1中的步骤S101类似,为简约起见,在此不再赘述。
步骤S402:基于预设规则查询与问诊关键词对应的话题标签。
在本实施例中,图4中的步骤S402和图1中的步骤S102类似,为简约起见,在此不再赘述。
步骤S403:接收医生终端输入或选择的话题标签。
需要说明的是,实际使用过程中,有一些话题标签并不能通过患者提供的问诊信息中的问诊关键词得到,例如,疾病诊断方式可按中医和西医两种方式划分,该两种方式对应的诊断结果描述是完全不同的,当患者想了解中医诊断的结果时,则需要医生手动选择中医话题标签,使得最终生成的文本回复内容是站在中医角度的诊断结果,若是想看西医,则需要选择西医话题标签。
步骤S404:将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,文本生成模型基于患者的历史问诊信息和历史回复文本内容、以及历史回复文本内容对应的修改记录训练得到。
在本实施例中,图4中的步骤S404和图1中的步骤S103类似,为简约起见,在此不再赘述。
本发明第四实施例的基于神经网络的问诊回复方法在第一实施例的基础上,通过设定外部输入或选择话题标签的方式,使得最终输入至文本生成模型中的话题更为全面,进一步优化了最终的文本回复内容。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
图5是本发明实施例的基于神经网络的问诊回复装置的功能模块示意图。如图5所示,该基于神经网络的问诊回复装置50包括获取模块51、查询模块52和生成模块53。
获取模块51,用于获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词;
查询模块52,用于基于预设规则查询与问诊关键词对应的话题标签;
生成模块53,用于将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,文本生成模型基于患者的历史问诊信息和历史回复文本内容、以及历史回复文本内容对应的修改记录训练得到。
可选地,生成模块53执行生成相应的文本回复内容的操作之后,还用于:输出展示文本回复内容至医生终端;接收医生终端输入的修改请求,并根据修改请求进行修改,同时生成修改记录;将修改后的最终文本回复内容输出至患者终端。
可选地,生成模块53执行将修改后的最终文本回复内容输出至患者的操作之后,还用于:获取每进行一次修改时生成的中间文本;将中间文本和修改记录作为输入数据,输入至文本生成模型中,得到新的文本内容;利用最终文本回复内容作为真实结果,结合新的文本内容和损失函数反向传播更新文本生成模型。
可选地,修改记录包括修改的总时长、平均时长、修改字符总数中的至少一个。
可选地,获取模块51执行获取患者终端输入的问诊信息,并从问诊信息中提取得到问诊关键词的操作具体包括:获取患者终端输入的问诊信息;对问诊信息进行预处理获得多个候选关键词;将问诊信息输入至Word2Vec模型,得到每个候选关键词对应的词向量表示;对候选关键词的词向量表示进行聚类,得到多个聚类以及每个聚类的聚类中心;计算每个聚类中的候选关键词的词向量表示与聚类中心的距离,按距离大小进行降序排序;将排名前预设数量个候选关键词作为问诊关键词。
可选地,文本生成模型包括变分自动编码器和解码器;生成模块53执行将话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容的操作具体包括:将话题标签输入至预先训练好的变分自动编码器,得到中间层的参数表示;将中间层的参数表示输入至解码器中进行重构,得到文本回复内容。
可选地,查询模块52执行基于预设规则查询与问诊关键词对应的话题标签之后,还用于:接收医生终端输入或选择的话题标签。
关于上述实施例基于神经网络的问诊回复装置中各模块实现技术方案的其他细节,可参见上述实施例中的基于神经网络的问诊回复方法中的描述,此处不再赘述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
请参阅图6,图6为本发明实施例的计算机设备的结构示意图。如图6所示,该计算机设备60包括处理器61及和处理器61耦接的存储器62,存储器62中存储有程序指令,程序指令被处理器61执行时,使得处理器61执行上述任一实施例所述的基于神经网络的问诊回复方法的步骤。
其中,处理器61还可以称为CPU(Central Processing Unit,中央处理单元)。处理器61可能是一种集成电路芯片,具有信号的处理能力。处理器61还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
参阅图7,图7为本发明实施例的存储介质的结构示意图。本发明实施例的存储介质存储有能够实现上述所有方法的程序指令71,其中,该程序指令71可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等计算机设备设备。
在本申请所提供的几个实施例中,应该理解到,所揭露的计算机设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种基于神经网络的问诊回复方法,其特征在于,包括:
获取患者终端输入的问诊信息,并从所述问诊信息中提取得到问诊关键词;
基于预设规则查询与所述问诊关键词对应的话题标签;
将所述话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,所述文本生成模型基于患者的历史问诊信息和历史文本回复内容、以及历史文本回复内容对应的修改记录训练得到。
2.根据权利要求1所述的基于神经网络的问诊回复方法,其特征在于,所述生成相应的文本回复内容之后,还包括:
输出展示所述文本回复内容至医生终端;
接收所述医生终端输入的修改请求,并根据所述修改请求进行修改,同时生成修改记录;
将修改后的最终文本回复内容输出至所述患者终端。
3.根据权利要求2所述的基于神经网络的问诊回复方法,其特征在于,所述将修改后的最终文本回复内容输出至所述患者之后,还包括:
获取每进行一次修改时生成的中间文本;
将所述中间文本和所述修改记录作为输入数据,输入至所述文本生成模型中,得到新的文本内容;
利用所述最终文本回复内容作为真实结果,结合所述新的文本内容和损失函数反向传播更新所述文本生成模型。
4.根据权利要求3所述的基于神经网络的问诊回复方法,其特征在于,所述修改记录包括修改的总时长、平均时长、修改字符总数中的至少一个。
5.根据权利要求1所述的基于神经网络的问诊回复方法,其特征在于,所述获取患者终端输入的问诊信息,并从所述问诊信息中提取得到问诊关键词,包括:
获取所述患者终端输入的问诊信息;
对所述问诊信息进行预处理获得多个候选关键词;
将所述问诊信息输入至Word2Vec模型,得到每个所述候选关键词对应的词向量表示;
对所述候选关键词的词向量表示进行聚类,得到多个聚类以及每个聚类的聚类中心;
计算每个聚类中的候选关键词的词向量表示与所述聚类中心的距离,按距离大小进行降序排序;
将排名前预设数量个候选关键词作为所述问诊关键词。
6.根据权利要求1所述的基于神经网络的问诊回复方法,其特征在于,所述文本生成模型包括变分自动编码器和解码器;所述将所述话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,包括:
将所述话题标签输入至预先训练好的变分自动编码器,得到中间层的参数表示;
将所述中间层的参数表示输入至所述解码器中进行重构,得到所述文本回复内容。
7.根据权利要求1所述的基于神经网络的问诊回复方法,其特征在于,所述基于预设规则查询与所述问诊关键词对应的话题标签之后,还包括:
接收所述医生终端输入或选择的话题标签。
8.一种基于神经网络的问诊回复装置,其特征在于,包括:
获取模块,用于获取患者终端输入的问诊信息,并从所述问诊信息中提取得到问诊关键词;
查询模块,用于基于预设规则查询与所述问诊关键词对应的话题标签;
生成模块,用于将所述话题标签输入至预先训练好的文本生成模型中,生成相应的文本回复内容,所述文本生成模型基于患者的历史问诊信息和历史文本回复内容、以及历史文本回复内容对应的修改记录训练得到。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、与所述处理器耦接的存储器,所述存储器中存储有程序指令,所述程序指令被所述处理器执行时,使得所述处理器执行如权利要求1-7中任一项权利要求所述的基于神经网络的问诊回复方法的步骤。
10.一种存储介质,其特征在于,存储有能够实现如权利要求1-7中任一项所述的基于神经网络的问诊回复方法的程序指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111538780.1A CN114242267A (zh) | 2021-12-15 | 2021-12-15 | 基于神经网络的问诊回复方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111538780.1A CN114242267A (zh) | 2021-12-15 | 2021-12-15 | 基于神经网络的问诊回复方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114242267A true CN114242267A (zh) | 2022-03-25 |
Family
ID=80756611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111538780.1A Pending CN114242267A (zh) | 2021-12-15 | 2021-12-15 | 基于神经网络的问诊回复方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114242267A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116884648A (zh) * | 2023-05-23 | 2023-10-13 | 深圳汇医必达医疗科技有限公司 | 基于中医问诊的语音交互优化方法、装置、设备及介质 |
-
2021
- 2021-12-15 CN CN202111538780.1A patent/CN114242267A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116884648A (zh) * | 2023-05-23 | 2023-10-13 | 深圳汇医必达医疗科技有限公司 | 基于中医问诊的语音交互优化方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112131393B (zh) | 一种基于bert和相似度算法的医疗知识图谱问答系统构建方法 | |
US11226673B2 (en) | Affective interaction systems, devices, and methods based on affective computing user interface | |
CN111798941B (zh) | 用于生成临床查询的预测系统 | |
CN113836277A (zh) | 用于数字助理的机器学习系统 | |
WO2021169842A1 (zh) | 数据更新方法、装置、电子设备及计算机可读存储介质 | |
CN112330455B (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
KR20190016653A (ko) | 지능형 상담 서비스 제공 방법 및 시스템 | |
US11468989B2 (en) | Machine-aided dialog system and medical condition inquiry apparatus and method | |
CN113127605B (zh) | 一种目标识别模型的建立方法、系统、电子设备及介质 | |
CN109979568B (zh) | 心理健康预警方法、服务器、家属终端与系统 | |
KR102370729B1 (ko) | 문장 작성 시스템 | |
WO2023029501A1 (zh) | 智能问诊方法、装置、电子设备及存储介质 | |
CN114611735A (zh) | 就医的互联网挂号方法、装置、设备及存储介质 | |
CN113409907A (zh) | 一种基于互联网医院的智能预问诊方法及系统 | |
CN111755090A (zh) | 病历查找方法、病历查找装置、存储介质与电子设备 | |
CN114242267A (zh) | 基于神经网络的问诊回复方法、装置、设备及存储介质 | |
CN112349367B (zh) | 一种生成仿真病历的方法、装置、电子设备及存储介质 | |
EP3901875A1 (en) | Topic modelling of short medical inquiries | |
CN116956934A (zh) | 任务处理方法、装置、设备及存储介质 | |
Qin | Research on the application of intelligent speech recognition technology in medical big data fog computing system | |
CN114068028A (zh) | 医疗问诊数据处理方法及装置、可读存储介质及电子设备 | |
CN111339252B (zh) | 一种搜索方法、装置及存储介质 | |
Marchenko et al. | Examining the historical development of techno-scientific biomedical communication in Russia | |
CN113761899A (zh) | 一种医疗文本生成方法、装置、设备及存储介质 | |
FADHLALLAH | A Deep Learning-based approach for Chatbot: medical assistance a case study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |