CN113223735A

CN113223735A - 基于对话表征的分诊方法、装置、设备及存储介质

Info

Publication number: CN113223735A
Application number: CN202110489044.5A
Authority: CN
Inventors: 孙行智; 胡岗; 朱昭苇; 刘卓; 唐蕊; 姚海申
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-04-30
Filing date: 2021-04-30
Publication date: 2021-08-06
Also published as: WO2022227203A1

Abstract

本发明涉及大数据领域，公开了一种基于对话表征的分诊方法、装置、设备及存储介质。本方法包括：获取待分诊对象在各轮对话中录入的问诊数据并对问诊数据进行数据清洗，得到目标问诊数据；对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对；调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对向量和主诉向量；分别计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定多轮对话中每轮对话对应的对话表征向量；将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。本方案通过将主诉信息和多轮对话进行表征，解决了分诊准确率低的技术问题。本发明中的问诊数据可以存储于区块链中。

Description

基于对话表征的分诊方法、装置、设备及存储介质

技术领域

本发明涉及大数据领域，尤其涉及一种基于对话表征的分诊方法、装置、设备及存储介质。

背景技术

我国人口基数巨大，就医人数因此也位居世界前列，但受限于有限的医疗资源，目前国民就医流程中还存在较多问题，其中之一发生在就诊初期分诊时。分诊是根据病情将患者分至不同科室进行就诊，对于提升就诊效率有重要意义。

分诊是患者就医治疗的起始环节，选择恰当的科室，直接关系到治疗效果或能否得到有效治疗。然而随着医学研究的深入，医学分工也逐步细化，不同科室专精于某类疾病的诊治。而患者大都不具备深厚的医学知识，很难识别自己的病况并根据自己的状况选择最恰当的科室。医院分诊台工作人员数量有限，而医院接诊量又巨大，导致分诊台工作人员工作负荷大。此外分诊台面对的是全科就诊环境，进一步增大了误分诊的可能性，会产生较多二次转诊情况，影响就医效率。因此，如何提高分诊准确率成为了本领域技术人员需要面临的技术问题。

发明内容

本发明的主要目的是提高基于对话表征进行分诊的准确率，解决基于对话表征的分诊精准率低下的技术问题。

本发明第一方面提供了一种基于对话表征的分诊方法，包括：获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；对所述问诊数据进行数据清洗，得到目标问诊数据，其中，所述目标问诊数据包括所述用户的主诉信息；对所述目标问诊数据进行意图识别，得到所述目标问诊数据中包含的句对，其中，所述目标问诊数据中包含至少一个句对；调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取，得到所述句对的句对向量和所述主诉信息的主诉向量；计算所述主诉向量和所述句对向量之间的欧氏距离，并基于所述欧氏距离确定多轮对话中每轮对话对应的对话表征向量；将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。

可选地，在本发明第一方面的第一种实现方式中，所述对所述目标问诊数据进行意图识别，得到所述目标问诊数据中包含的句对包括：根据预设表征规则获取所述目标问诊数据中的所有问答句和与所述问答句对应对象的对象标识；基于各所述对象标识，对所述目标问诊数据中的各问答句分别进行意图识别，得到对应所述问诊数据的意图标识序列；根据所述意图标识序列，确定对应所述问句的目标答句意图标识；基于所述目标答句意图标识，得到所述目标问诊数据中包含的句对。

可选地，在本发明第一方面的第二种实现方式中，在所述调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取，得到所述句对的句对向量和所述主诉信息的主诉向量之前，还包括：建立预训练任务，调用预置向量化模型将历史用户问诊数据处理为若干个词向量，其中，所述词向量包括基于所述历史用户问诊数据词向量；将所述若干个词向量输入初始BERT网络模型，获取所述初始BERT网络模型输出的训练表征向量；根据所述训练表征向量计算所述初始BERT网络模型的损失值；根据所述初始BERT网络模型的损失值，调整所述初始BERT网络模型的模型参数，得到目标BERT网络模型。

可选地，在本发明第一方面的第三种实现方式中，所述计算所述主诉向量和所述句对向量之间的欧氏距离，并基于所述欧氏距离确定多轮对话中每轮对话对应的对话表征向量包括：计算所述主诉向量和每轮对话中每个句对向量两两之间的欧氏距离；基于所述欧氏距离，确定每个所述句对在对应的一轮对话中的权重；基于所述权重，对每个所述句对向量对应的权重进行加权平均，多轮对话中每轮对话对应的对话表征向量。

可选地，在本发明第一方面的第四种实现方式中，所述将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息包括：基于所述各轮对话对应的对话表征向量，确定所述目标问诊数据中的目标病症信息；对所述目标病症信息和所述各轮对话对应的主诉信息进行编码，得到所述目标问诊数据的病症实体向量；将所述病症实体向量输入预置分诊模型进行预测，得到不同科室的分诊概率；对所述分诊概率进行排序，得到分诊信息，其中，所述分诊信息包括预设数量个排序最高的推荐科室和所述推荐科室对应的分诊概率。

可选地，在本发明第一方面的第五种实现方式中，在所述将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息之前，还包括：从预置数据库中获取历史问诊数据；通过所述目标BERT网络模型对所述历史问诊数据进行表征学习，获取所述历史问诊数据的第二对话表征向量；获取预设训练病症和与所述训练病症对应的科室标签，基于所述训练病症对预置节点集关联向量进行筛选，获取与所述训练症状对应的目标向量；对所述第二对话表征向量和所述目标向量进行映射操作，获取对话嵌入向量和目标嵌入向量；基于所述训练症状对所述对话嵌入向量和所述目标嵌入向量进行拼接，获取拼接向量；在卷积层对所述拼接向量进行卷积操作，获取卷积关联向量，将所述卷积关联向量输入输出层，获取预测输出结果；基于所述预测输出结果与所述科室标签，计算预测误差损失，并根据所述预测误差损失更新所述目标BERT网络模型的参数，直到所述目标BERT网络模型收敛，获取基于对话表征的分诊模型。

可选地，在本发明第一方面的第六种实现方式中，所述对所述问诊数据进行数据清洗，得到目标问诊数据包括：获取所述问诊数据的清洗需求；根据所述问诊数据和所述清洗需求，确定用于对所述问诊数据进行数据清洗的目标清洗规则；根据所述目标清洗规则对所述问诊数据进行数据清洗，得到目标问诊数据。

本发明第二方面提供了一种基于对话表征的分诊装置，包括：获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；数据清洗模块，用于对所述问诊数据进行数据清洗，得到目标问诊数据，其中，所述目标问诊数据包括所述用户的主诉信息；

意图识别模块，用于对所述目标问诊数据进行意图识别，得到所述目标问诊数据中包含的句对，其中，所述目标问诊数据中包含至少一个句对；特征提取模块，用于调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取，得到所述句对的句对向量和所述主诉信息的主诉向量；第一计算模块，用于计算所述主诉向量和所述句对向量之间的欧氏距离，并基于所述欧氏距离确定多轮对话中每轮对话对应的对话表征向量；识别模块，用于将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。

可选地，在本发明第二方面的第一种实现方式中，所述意图识别模块包括：获取单元，用于根据预设表征规则获取所述目标问诊数据中的所有问答句和与所述问答句对应对象的对象标识；意图识别单元，用于基于各所述对象标识，对所述目标问诊数据中的各问答句分别进行意图识别，得到对应所述问诊数据的意图标识序列；第一确定单元，用于根据所述意图标识序列，确定对应所述问句的目标答句意图标识；基于所述目标答句意图标识，得到所述目标问诊数据中包含的句对。

可选地，在本发明第二方面的第二种实现方式中，所述基于对话表征的分诊装置还包括：向量化模块，用于建立预训练任务，调用预置向量化模型将历史用户问诊数据处理为若干个词向量，其中，所述词向量包括基于所述历史用户问诊数据词向量；第一获取模块，用于将所述若干个词向量输入初始BERT网络模型，获取所述初始BERT网络模型输出的训练表征向量；第二计算模块，用于根据所述训练表征向量计算所述初始BERT网络模型的损失值；根据所述初始BERT网络模型的损失值，调整所述初始BERT网络模型的模型参数，得到目标BERT网络模型。

可选地，在本发明第二方面的第三种实现方式中，所述第一计算模块具体用于：计算所述主诉向量和每轮对话中每个句对向量两两之间的欧氏距离；基于所述欧氏距离，确定每个所述句对在对应的一轮对话中的权重；基于所述权重，对每个所述句对向量对应的权重进行加权平均，得到多轮对话中每轮对话对应的对话表征向量。

可选地，在本发明第二方面的第四种实现方式中，所述识别模块具体用于：基于所述各轮对话对应的对话表征向量，确定所述目标问诊数据中的目标病症信息；对所述目标病症信息和所述各轮对话对应的主诉信息进行编码，得到所述目标问诊数据的病症实体向量；将所述病症实体向量输入预置分诊模型进行预测，得到不同科室的分诊概率；对所述分诊概率进行排序，得到分诊信息，其中，所述分诊信息包括预设数量个排序最高的推荐科室和所述推荐科室对应的分诊概率。

可选地，在本发明第二方面的第五种实现方式中，所述基于对话表征的分诊装置还包括：第二获取模块，用于从预置数据库中获取历史问诊数据；表征学习，用于通过所述目标BERT网络模型对所述历史问诊数据进行表征学习，获取所述历史问诊数据的第二对话表征向量；筛选模块，用于获取预设训练病症和与所述训练病症对应的科室标签，基于所述训练病症对预置节点集关联向量进行筛选，获取与所述训练症状对应的目标向量；映射模块，用于对所述第二对话表征向量和所述目标向量进行映射操作，获取对话嵌入向量和目标嵌入向量；拼接模块，用于基于所述训练症状对所述对话嵌入向量和所述目标嵌入向量进行拼接，获取拼接向量；卷积处理模块，用于在卷积层对所述拼接向量进行卷积操作，获取卷积关联向量，将所述卷积关联向量输入输出层，获取预测输出结果；更新模块，用于基于所述预测输出结果与所述科室标签，计算预测误差损失，并根据所述预测误差损失更新所述目标BERT网络模型的参数，直到所述目标BERT网络模型收敛，获取基于对话表征的分诊模型。

可选地，在本发明第二方面的第六种实现方式中，所述数据清洗模块具体用于：获取所述问诊数据的清洗需求；根据所述问诊数据和所述清洗需求，确定用于对所述问诊数据进行数据清洗的目标清洗规则；根据所述目标清洗规则对所述问诊数据进行数据清洗，得到目标问诊数据。

本发明第三方面提供了一种基于对话表征的分诊设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述基于对话表征的分诊设备执行上述的基于对话表征的分诊方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的基于对话表征的分诊方法。

本发明提供的技术方案中，通过获取待分诊对象在各轮对话中录入的问诊数据并对问诊数据进行数据清洗，得到目标问诊数据；对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对；调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对向量和主诉向量；分别计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定各轮对话对应的对话表征向量；将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。本方案通过将主诉信息和多轮对话进行表征，解决了分诊准确率低的技术问题。

附图说明

图1为本发明基于对话表征的分诊方法的第一个实施例示意图；

图2为本发明基于对话表征的分诊方法的第二个实施例示意图；

图3为本发明基于对话表征的分诊方法的第三个实施例示意图；

图4为本发明基于对话表征的分诊方法的第四个实施例示意图；

图5为本发明基于对话表征的分诊方法的第五个实施例示意图；

图6为本发明基于对话表征的分诊装置的第一个实施例示意图；

图7为本发明基于对话表征的分诊装置的第二个实施例示意图；

图8为本发明基于对话表征的分诊设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种基于对话表征的分诊方法、装置、设备及存储介质，本发明的技术方案中，首先获取待分诊对象在各轮对话中录入的问诊数据并对问诊数据进行数据清洗，得到目标问诊数据；对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对；调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对向量和主诉向量；分别计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定各轮对话对应的对话表征向量；将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。本方案通过将主诉信息和多轮对话进行表征，解决了分诊准确率低的技术问题。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中基于对话表征的分诊方法的第一个实施例包括：

101、获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；

本实施例中，获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据。其中，待分诊对象可以通过语音的形式向所述对话机器人(医生)下发分诊请求指令。所述对话机器人在接收到待分诊对象的语音时，可以判断其中是否包括预设的关键词，所述关键词包括但不限于“分诊”、“导诊”、“科室”等等词语，若待分诊对象的语音中包括所述关键词，则可以判定该语音即为待分诊对象下发的分诊请求指令。

待分诊对象还可以通过指定的人机交互界面中的实体按键或者虚拟按键向所述对话机器人下发分诊请求指令，例如，所述对话机器人可以包括一个触控屏幕，用于与待分诊对象进行交互，当待分诊对象需要向所述对话机器人下发分诊请求指令，可以点击其中显示的特定按键。所述对话机器人在接收到待分诊对象下发的分诊请求指令之后，可以按照预设的对话流程与所述待分诊对象进行N轮对话，并获取所述待分诊对象在各轮对话中的对话语句。其中，N为正整数，其具体取值可以根据实际情况进行设置，例如，可以将其设置为2、3、5或者其它取值。即所述对话机器人可以与所述待分诊对象进行N轮对话。例如，在第1轮对话中，所述对话机器人可以询问：“您哪里不舒服”，然后获取所述待分诊对象针对该问题所回答的对话语句，在第2轮对话中，所述对话机器人可以询问：“您有哪些主要症状”，然后获取所述待分诊对象针对该问题所回答的对话语句，在第N轮对话中，所述对话机器人可以询问：“您有哪些伴随症状”，然后获取所述待分诊对象针对该问题所回答的对话语句。

102、对问诊数据进行数据清洗，得到目标问诊数据；

本实施例中，通过待分诊对象与机器人(医生)的多轮交互获取用户问诊数据，其中，所述问诊数据包括所述用户的基础信息和主诉内容。

本发明实施例的执行主体为具有远程就诊功能的服务器端。需要说明的是，所述用户端可以为患者使用的PC端、手机、平板电脑、智能手表、智能手环等智能端，用户通过所述用户端录入问诊数据，其中，所述问诊数据信息可以包括：患者的基础信息和主诉内容。比如，主诉内容可以包括：患病时间(发病时间、持续时间或每次发病的持续时间)、患者症状、患者身份信息、患者基础病症(例如：除当前症状外患者已经患有何种慢性疾病)等。数据清洗(Data cleaning)对数据进行重新审查和校验的过程，目的在于删除重复信息、纠正存在的错误，并提供数据一致性。

本实施例中，数据清洗包括数据脱敏、数据校验和数据转换。其中，数据脱敏用于对源业务数据中的敏感数据进行加密处理。比如，该数据中包括个人的身份证号等，可对该身份证号进行加密。数据校验用于查询源业务数据中是否存在脏数据，并删除该脏数据，以消除脏数据对精算结果的影响。服务器针对各个类型的数据设置了脏数据判定方法，根据预设的判定方法检测是否为脏数据。比如，可设置每个类型的数据的字符长度范围或数值的大小范围等，当某一类型的数据的字符长度不处于预设范围之内，或数值的大小不处于预设的大小范围之内，则判定该数据为脏数据。数据校验是将存在多种不同表述方式的数据统一转换成同一种预设表述方式的过程。

数据清洗从名字上也看的出就是把“脏”的“洗掉”，指发现并纠正数据文件中可识别的错误的最后一道程序，包括检查数据一致性，处理无效值和缺失值等。因为数据仓库中的数据是面向某一主题的数据的集合，这些数据从多个业务系统中抽取而来而且包含历史数据，这样就避免不了有的数据是错误数据、有的数据相互之间有冲突，这些错误的或有冲突的数据显然是我们不想要的，称为“脏数据”。我们要按照一定的规则把“脏数据”“洗掉”，这就是数据清洗。而数据清洗的任务是过滤那些不符合要求的数据，将过滤的结果交给业务主管部门，确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。

103、对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对；

本实施例中，对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对。对目标问诊数据进行训练和分类，构建卷积神经网络，将替换实体后的目标问诊数据作为输入，将分词后的问题，每个词映射为词嵌入，和拼接的实体嵌入与实体位置嵌入一起，作为神经网络的输入，将标注的意图作为分类标签，进行分类问题的训练。

其次，根据意图和实体的组合，来配置后续的多轮对话流程，识别出意图和实体之后，针对所获取的值来进行后续的流程配置。这里采用将意图函数化，将实体参数化的处理方式，即将针对某一个意图所进行的后续操作视作一个函数，而将所需要抽取的实体视作这个函数的参数，根据不同的参数来调整函数的返回结果。

对新语句进行意图识别和实体抽取，将结果传递给流程配置引擎进行后续的多轮对话配置。对于识别到的意图，检测其对应的实体参数，并将抽取到的实体填充到对应的参数列表中。根据识别的意图和填充到的参数，触发后续的对话流程。如果必需的实体参数均满足，即可直接进行相应动作，如果必须实体为满足，即触发多轮的引导问答，引导用户对信息进行补全。

104、调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对的句对向量和主诉信息的主诉向量；

本实施例中，调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对的句对向量和主诉信息的主诉向量。本实施例中BERT网络模型全称是Pre-trainingof DeepBidirectional Transformers for Language Understanding。Pre-training表示BERT是一个预训练模型，通过前期的大量语料的无监督训练，为下游任务学习大量的先验的语言、句法、词义等信息。Bidirectional说明BERT采用的是双向语言模型的方式，能够更好的融合前后文的知识。简而言之，BERT是一个用Transformers作为特征抽取器的深度双向预训练语言理解模型。BERT在预训练过程中，学习到了丰富的语言学方面的信息。症状识别即命名实体识别，其本质属于序列化标注任务。上述语意编码的过程即为将病症信息向量化的过程，具体为：所述预训练模型BERT对所述病症信息中的每一个字符向量化，得到每一个字符的字符向量，以及给每一个字符标记位置向量，得到字符位置向量，将所述每一个字符向量及其对应的字符标记位置向量合并，得到每一个字符的编码向量，将所述每一个字符的编码向量组合得到所述病症编码。

本实施例中，采用图神经网络对目标问诊数据进行表征学习，以得到问诊数据中包含的得到所有句对的句对向量和主诉信息的主诉向量。其中，表征学习是采用计算机学习一个特征的技术的集合，是将数据转换成为能够被机器学习和开发的一种学习形式。

105、计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定多轮对话中每轮对话对应的对话表征向量；

本实施例中，计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定多轮对话中每轮对话对应的对话表征向量。其中，句对又叫问答对，是指医生和患者的对话组织成若干个句对，即一问一答形式。若某个角色连续多次发言，则将连续的发言进行拼接，作为一个整段的发言。比如，每个句对中，医生发言作为上句，患者发言作为下句，形如：<CLS>：【头痛多长时间了，伴有眩晕吗<SEP>一个多月了，没有眩晕。】<SEP>之前表示医生的发言，之后的表示患者的发言。该句对最终的表征取<CLS>的向量表示。度量主诉向量和每个句对向量的欧氏距。

本实施例中，在做分类时常常需要估算不同样本之间的相似性度量(SimilarityMeasurement)，这时通常采用的方法就是计算样本间的“距离”(Distance)。所述“距离”越小，则样本之间就越相似。最常见的两点之间或多点之间的距离表示法，又称之为欧几里得度量。它定义于欧几里得空间中，如x＝(x₁，x₂，...，x_n)和y＝(y₁，y₂，...，y_n)之间的距离为：

其中，两个n维向量a(x₁₁，x₁₂，…，x_1n)与b(x₂₁，x₂₂，…，x_2n)之间的欧氏距离：

106、将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。

本实施例中，将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。其中，分诊模型是用于根据用户的症状自动化为用户确定对应科室的模型。在该预测模型的全连接层采用不同的softmax分类器，将该全连接层的输出结果，输入到该softmax分类器得到该理赔数据集合的预测结果。

本发明实施例中，通过获取待分诊对象在各轮对话中录入的问诊数据并对问诊数据进行数据清洗，得到目标问诊数据；对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对；调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对向量和主诉向量；分别计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定多轮对话中每轮对话对应的对话表征向量；将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。本方案通过将主诉信息和多轮对话进行表征，解决了分诊准确率低的技术问题。

请参阅图2，本发明实施例中基于对话表征的分诊方法的第二个实施例包括：

201、获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；

202、获取问诊数据的清洗需求；

本实施例中，获取问诊数据的清洗需求。可以理解的是，现实世界的数据往往是多维度的、不完整的、有噪声的以及不一致的，数据清洗的目的就在于填充缺失的值、光滑噪声并识别离群点、纠正数据中的不一致等。

本实施例中，电子设备在获取到需要进行数据清洗的待清洗数据之后，进一步获取到待清洗数据的清洗需求。通俗的说，清洗需求描述了对待清洗数据进行数据清洗想要达到的清洗效果，比如，原始的待清洗数据含有多个维度的数据，而这些维度之间往往不是独立的，也就是说也许其中之间若干的维度之间存在关联，待执行数据的清洗需求可以是将待清洗数据降维到指定维度。

203、根据问诊数据和清洗需求，确定用于对问诊数据进行数据清洗的目标清洗规则；

本实施例中，根据问诊数据和清洗需求，确定用于对问诊数据进行数据清洗的目标清洗规则。可以预先整合所有可能的清洗规则，同时收集每个清洗规则对应的待清洗样本数据及其清洗效果；然后，获取能够表征清洗规则的清洗规则特征，以及获取能够表征待清洗样本数据及其清洗效果的联合特征；然后，将各联合特征作为训练输入、将各联合特征对应的清洗规则特征作为目标输出，按照预先设定的训练算法来进行模型训练，以训练得到用于选取何种清洗规则对待清洗数据进行数据清洗的清洗规则分类模型。

由此，电子设备在获取到需要进行数据清洗的待清洗数据，以及获取到待清洗数据的清洗需求之后，即可将待清洗数据和清洗需求输入到清洗规则分类模型，使得清洗规则分类模型输出能够对待清洗数据进行数据清洗且清洗效果满足清洗需求的清洗规则，将该清洗规则作为对待清洗数据进行数据清洗的目标清洗规则。

204、根据目标清洗规则对问诊数据进行数据清洗，得到目标问诊数据；

本实施例中，根据目标清洗规则对问诊数据进行数据清洗，得到目标问诊数据。在确定用于对待清洗数据进行数据清洗的目标清洗规则之后，即可根据该目标清洗规则对待清洗数据进行数据清洗，使得对待清洗数据的清洗效果满足前述清洗需求，最终得到所需的数据。

本实施例中，首先获取需要进行数据清洗的待清洗数据，以及获取待清洗数据的清洗需求，然后根据获取到的待清洗数据、清洗需求以及预先训练的清洗规则分类模型，确定出用于对待清洗数据进行数据清洗的目标清洗规则，最后根据确定出的目标清洗规则对待清洗数据进行数据清洗，得到符合要求的目标问诊数据。

205、根据预设表征规则获取目标问诊数据中的所有问答句和与问答句对应对象的对象标识；

本实施例中，根据预设表征规则获取目标问诊数据中的所有问答句和与问答句对应对象的对象标识。目标问诊数据是指机器人(医生)与病人的线上问诊记录，可以包括医生与病人的多个问答句，即可以包括对应医生或者是病人的问句或者答句。问答句是医生与病人的对话中对应医生或者是病人每一次对话的句子。

在本实施例中，对象标识是用于区分目标问诊数据中医生以及病人的标识，可以包括医生标识以及病人标识。其中，医生标识可以是指适用于所有目标问诊数据中统一医生标识指示，例如病人标识是指适用于所有目标问诊数据中统一病人标识指示。

206、基于各对象标识，对目标问诊数据中的各问答句分别进行意图识别，得到对应问诊数据的意图标识序列；

本实施例中，基于各对象标识，对目标问诊数据中的各问答句分别进行意图识别，得到对应问诊数据的意图标识序列。意图标识是指标识各问答句的意图的标识，例如，用药询问、挂号询问、用药应答、挂号应答等。在本实施例中，病人问句的意图标识可以通过P₁～P_n表示，病人回答的意图标识通过P_A表示，医生问句的意图标识记为D₁～D_n，医生回答的意图标识记为D_A1～D_An。

意图标识序列是指由多个意图标识组成的序列，例如，P₁，D_A1，D_A1，P₂，P₂，D_A2等。在本实施例中，服务器可以根据各问答句对应的对象标识，对各问答句进行意图识别，并生成对应的各意图标识，可以根据多个目标问诊数据，以得到对应各目标问诊数据的各意图标识序列。

207、根据意图标识序列，确定对应问句的目标答句意图标识；

本实施例中，根据意图标识序列，确定对应问句的目标答句意图标识。各问句意图标识对应的各初始答句的答句意图标识的数量，并基于各数量确定对应各问句意图标识对应的目标答句意图标识。进一步，服务器在确定各问句意图标识以及对应的目标答句意图标识后，可以根据问句意图标识以及对应的目标答句意图标识生成对应的目标句对。例如，服务器确定对应问句意图标识P₁对应目标答句意图标识为D_A1，则服务器可以生成目标句对为P₁-D_A1。

在本实施例中，目标句对也并不仅限于一个问句意图标识以及一个目标答句意图标识构成的二元组合关系，也可以是三元组合关系。

208、基于目标答句意图标识，得到目标问诊数据中包含的句对；

本实施例中，通过获取目标问诊数据，目标问诊数据中包括多个问答句以及对应各问答句的对象的对象标识，基于各对象标识，对目标问诊数据中的各问答句分别进行意图识别，得到对应目标问诊数据的意图标识序列，然后根据多个目标问诊数据对应的意图标识序列，确定意图标识序列中各问句的问句意图标识所对应的多个初始答句的答句识别标识，进一步，从各多个初始答句的答句识别标识中确定对应各问句的目标答句意图标识，并基于各问句意图标识以及对应的目标答句意图标识，生成各目标句对。从而，从而，可以使得目标句对是通过对多个目标问诊数据的问答句的意图识别处理后生成确定的，使得目标句对的生成可以覆盖多个不同形式的问答句，提升目标句对的覆盖率以及准确性。

在其中一个实施例中，基于各对象标识，对目标问诊数据中的各问答句分别进行意图识别，得到对应目标问诊数据的意图标识序列，可以包括：根据各对象标识，确定目标问诊数据中对应各对象的各问答句；对各对象的各问答句分别进行识别，确定各问答句为对应对象的问句或者对应对象的答句；对各对象的问句或者各对象的答句分别进行意图识别，得到对应的意图标识；根据所得到的意图标识，得到对应目标问诊数据的意图标识序列。如前所述，目标问诊数据中可以包括医生与病人的多个问答句，各问答句包括对应的对象标识，如医生标识，或者是病人标识等。

209、调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对的句对向量和主诉信息的主诉向量；

210、计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定多轮对话中每轮对话对应的对话表征向量；

211、将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。

本实施例中步骤201、209-211与第一实施例中的步骤101、104-106类似，此处不再赘述。

请参阅图3，本发明实施例中基于对话表征的分诊方法的第三个实施例包括：

301、获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；

302、对问诊数据进行数据清洗，得到目标问诊数据，其中，目标问诊数据包括所述用户的主诉信息；

303、对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对，其中，目标问诊数据中包含至少一个句对；

304、调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对的句对向量和主诉信息的主诉向量；

305、建立预训练任务，调用预置向量化模型将历史用户问诊数据处理为若干个词向量；

本实施例中，建立预训练任务，调用预置向量化模型将历史用户问诊数据处理为若干个词向量。其中，预训练任务主要用于执行步骤S305-S306的循环迭代计算。在循环迭代计算之前，需要通过向量化模型，比如word2vec模型等，将症状样本转化为词向量。其中，word2vec模型是一种用于产生词向量的模型。在一示例中，症状数据为{咳嗽：三天；带血丝}，经word2vec模型转换后可以得到词向量emb1(咳嗽)、emb2(三天)和emb3(带血丝)。在此处，emb1为第一词向量，emb2和emb3为第二词向量。症状样本指的是用于训练初始BERT网络模型的训练数据，一般为某个地区的历史症状数据。

306、将若干个词向量输入初始BERT网络模型，获取初始BERT网络模型输出的训练表征向量；

本实施例中，将若干个词向量输入初始BERT网络模型，获取初始BERT网络模型输出的训练表征向量。在获得词向量后，可以将各个词向量作为输入数据输入初始BERT网络模型，并生成训练表征向量，并计算相应的损失值。具体的，损失值可由损失函数计算获得。该损失函数定义为：

其中，L(Vs，sym⁽ⁿ⁾)为第n个症状的损失值；sym⁽ⁿ⁾表示症状列表中的第n个症状；Vs表示整体的表征向量；为第n个症状在表征向量中的损失项，为其他症状在表征向量中的损失项。通过损失函数可知，出现在表征向量里的症状，其损失值应该尽可能小，反之损失值应尽可能大。

307、根据训练表征向量计算初始BERT网络模型的损失值；

本实施例中，根据训练表征向量计算初始BERT网络模型的损失值，根据所述训练表征向量计算所述初始BERT网络模型的损失值，所获得的损失值可以用于调整模型参数及判断模型是否收敛。若所述损失值处于预设范围之外，调整所述初始BERT网络模型的模型参数，并重新计算所述症状样本的训练表征向量，以在模型未收敛时，进行迭代计算。

308、根据初始BERT网络模型的损失值，调整初始BERT网络模型的模型参数，得到目标BERT网络模型；

本实施例中，将所述若干个词向量输入初始BERT网络模型，获取所述初始BERT网络模型输出的训练表征向量，以执行初始BERT网络模型的训练步骤。根据所述训练表征向量计算所述初始BERT网络模型的损失值，所获得的损失值可以用于调整模型参数及判断模型是否收敛。若所述损失值处于预设范围之外，调整所述初始BERT网络模型的模型参数，并重新计算所述症状样本的训练表征向量，以在模型未收敛时，进行迭代计算。若所述损失值处于预设范围之内，则所述预训练任务训练完毕，训练完毕后的所述初始BERT网络模型即为目标BERT网络模型。

309、计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定多轮对话中每轮对话对应的对话表征向量；

310、将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。

本实施例中步骤301-304、309-310与第一实施例中的步骤101-104、105-106类似，此处不再赘述。

请参阅图4，本发明实施例中基于对话表征的分诊方法的第四个实施例包括：

401、获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；

402、对问诊数据进行数据清洗，得到目标问诊数据，其中，目标问诊数据包括所述用户的主诉信息；

403、对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对，其中，目标问诊数据中包含至少一个句对；

404、调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对的句对向量和主诉信息的主诉向量；

405、计算主诉向量和每轮对话中每个句对向量两两之间的欧氏距离；

本实施例中，计算主诉向量和每轮对话中每个句对向量两两之间的欧氏距离。分别计算问诊数据中所有句对与主诉向量两两之间的欧氏距离。

本实施例中，欧氏距离是指欧氏距离是一种有效的计算一个样本和一个样本集“重心”的最近距离，或者有效计算两个未知样本集的相似度的方法。它考虑到各种特性之间的联系，可以排除变量之间的相关性的干扰，并且欧氏距离是尺度无关的，即独立于测量尺度。当∑是单位矩阵的时候，欧氏距离即为欧氏距离。综上所述，欧氏距离能够很方便的度量观测样本与已知样本集间的距离，因而很适合用在故障诊断中。

406、基于欧氏距离，确定每个句对在对应的一轮对话中的权重；

本实施例中，基于欧氏距离，确定每个句对在对应的一轮对话中的权重。主诉的表征，基于预训练的词向量完成(向量表示)，通过计算各句对的向量和主诉向量的相关性，作为该句对重要性的评估依据。具体的计算方式是：

度量主诉向量和每个句对向量的欧氏距离，也即，计算出每个句对的权重ai。

407、基于权重，对每个句对向量对应的权重进行加权平均，得到多轮对话中每轮对话对应的对话表征向量；

本实施例中，基于权重，对每个句对向量对应的权重进行加权平均，得到多轮对话中每轮对话对应的对话表征向量。比如，在一轮对话中，句对(问答语句和答案语句)中答案语句是对问题语句的回答，则答案语句中通常会包含问题语句中的关键词；问题语句与答案语句之间共同关键词的数目越多越长，包含的有效信息越多，则对应的那轮对话重要性越强。比如，句对中答案语句是对问题语句的回答的可能性就越大；由于希望获取的目标问答对具有的是完整意义的问答，因此越长的问题语句能更好地描述一个完整的问题，而越长的答案语句能更好地描述一个完整的回答；若句对中答案语句是对问题语句的回答，则答案语句与问题语句之间主题通常是一致的；若句对中答案语句是对问题语句的回答，则答案语句与问题语句之间在句法上通常也有一定的联系。

本实施例中，考虑到对话过程中患者所说的并非每句话都包含有效信息，因此引入权重重要性度量模块(以下简称权重模块)评估每轮对话的重要性，对所有对话进行加权表征后进行判别。

408、基于各轮对话对应的对话表征向量，确定目标问诊数据中的目标病症信息；

本实施例中，基于各轮对话对应的对话表征向量，确定目标问诊数据中的目标病症信息。其中，所述目标病症信息是指待分诊者输入的文字信息或者语音信息，如果待分诊者输入的是语音信息，系统会现将语音信息转换成文字信息。

409、对目标病症信息和各轮对话对应的主诉信息进行编码，得到目标问诊数据的病症实体向量；

本实施例中，对目标病症信息和各轮对话对应的主诉信息进行编码，得到目标问诊数据的病症实体向量。其中，编码是信息从一种形式或格式转换为另一种形式的过程，也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码，或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码，是编码的逆过程。

410、将病症实体向量输入预置分诊模型进行预测，得到不同科室的分诊概率；

本实施例中，将病症实体向量输入预置分诊模型进行预测，得到不同科室的分诊概率。

本实施例中，在卷积层对拼接向量进行卷积操作，获取卷积关联向量，将卷积关联向量输入输出层，获取预测输出结果。基于预测输出结果与科室标签，计算预测误差损失，根据预测误差损失，更新神经网络模型的参数，在模型收敛时，得到分诊模型。将病症实体向量输入预置分诊模型进行预测，得到不同科室的分诊概率。

411、对分诊概率进行排序，得到分诊信息，其中，分诊信息包括预设数量个排序最高的推荐科室和所述推荐科室对应的分诊概率。

本实施例中，对分诊概率进行排序，得到分诊信息。根据每个不同科室的奋战概率，对各个科室的分诊概率进行排序，返回给患者排序最高的设定个数的推荐科室和对应的分诊概率。优选地，所述分诊模型包括：多个卷积层、多个池化层、全连接层和Softmax层。

本实施例中步骤401-404与第一实施例中的步骤101-104类似，此处不再赘述。

请参阅图5，本发明实施例中基于对话表征的分诊方法的第五个实施例包括：

501、获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；

502、对问诊数据进行数据清洗，得到目标问诊数据，其中，目标问诊数据包括用户的主诉信息；

503、对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对，其中，目标问诊数据中包含至少一个句对；

504、调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对的句对向量和主诉信息的主诉向量；

505、计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定多轮对话中每轮对话对应的对话表征向量；

506、从预置数据库中获取历史问诊数据；

本实施例中，从预置数据库中获取历史问诊数据。可以从预置数据库中获取按照预设的对话流程与所述历史患者进行N轮对话，并获取所述历史患者在各轮对话中的对话语句。其中，N为正整数，其具体取值可以根据实际情况进行设置，例如，可以将其设置为2、3、5或者其它取值。即所述对话机器人可以与所述历史患者进行N轮对话。例如，在第1轮对话中，所述对话机器人可以询问：“您哪里不舒服”，然后获取所述历史患者针对该问题所回答的对话语句，在第2轮对话中，所述对话机器人可以询问：“您有哪些主要症状”，然后获取所述历史患者针对该问题所回答的对话语句，在第N轮对话中，所述对话机器人可以询问：“您有哪些伴随症状”，然后获取所述历史患者针对该问题所回答的对话语句。

507、通过目标BERT网络模型对历史问诊数据进行表征学习，获取历史问诊数据的第二对话表征向量；

本实施例中，通过目标BERT网络模型对历史问诊数据进行表征学习，获取历史问诊数据的第二对话表征向量。目标BERT网络模型是经预训练任务训练后获得的。预训练任务为自定义任务，该预训练任务定义为根据当前的表征向量推测该表征向量包含的症状名称及症状属性。预训练任务可以确保目标BERT网络模型能够学习到输出的表征向量包含的信息，也即是，通过预训练任务确定表征向量与症状特征数据之间的关联关系。需要注意的是，在此处，关联关系体现在目标BERT网络模型的模型参数之中。这样，能够准确地将症状名称和症状属性转换成一个整体的向量，即表征向量。生成的表征向量的数量与症状数据中的症状数量相等。也即是，历史问诊数据中有多少个症状，则生成相同数量且对应的表征向量。

508、获取预设训练病症和与训练病症对应的科室标签，基于训练病症对预置节点集关联向量进行筛选，获取与训练症状对应的目标向量；

本实施例中，获取预设训练病症和与训练病症对应的科室标签，基于训练病症对预置节点集关联向量进行筛选，获取与训练症状对应的目标向量。其中，训练症状是指用于进行训练BERT网络模型的症状。科室标签是与训练症状对应的科室，该科室标签为训练标签，例如，若训练症状为皮肤问题，则对应的科室标签为皮肤科。

目标向量是指与训练症状相对应的向量，例如，训练症状对应的症状为咳嗽，则根据该症状从节点集关联向量中筛选出目标向量。本实施例中，根据训练症状对节点集关联向量进行筛选，以匹配出训练症状对应的目标向量，确保模型训练样本具有对应关系，保证模型训练的可行性。

509、对第二对话表征向量和目标向量进行映射操作，获取对话嵌入向量和目标嵌入向量；

本实施例中，对第二对话表征向量和目标向量进行映射操作，获取对话嵌入向量和目标嵌入向量。在第二对话表征向量对图谱症状向量进行映射操作，获取对话嵌入向量。其中，第一嵌入层是用于对第二对话表征向量进行降维处理的层，以使第二对话表征向量映射为维数较低的对话嵌入向量。

本实施例中，在第二嵌入层对目标向量进行映射操作，获取目标嵌入向量。其中，第二嵌入层是用于对目标向量进行降维处理的层，以使目标向量映射为维数较低的目标嵌入向量。具体地，在第二嵌入层中采用预先设置的映射表对目标向量进行处理，以得到目标嵌入向量，从而减少目标嵌入向量的维数，减低后续的运算难度。

510、基于训练症状对对话嵌入向量和目标嵌入向量进行拼接，获取拼接向量；

本实施例中，基于训练症状对对话嵌入向量和目标嵌入向量进行拼接，获取拼接向量。其中，拼接向量是根据对话嵌入向量和目标嵌入向量得到的向量，以形成具有深层意义的向量。

本实施例中，在分诊模型训练过程中充分利用获取信息更为全面的拼接向量，使得获取的分诊模型泛化能力强，鲁棒性高。本实施例中，采用TensorFlow的tf.concat()函数对对话嵌入向量和目标嵌入向量进行拼接，快速得到拼接向量。

511、在卷积层对拼接向量进行卷积操作，获取卷积关联向量，将卷积关联向量输入输出层，获取预测输出结果；

本实施例中，在卷积层对拼接向量进行卷积操作，获取卷积关联向量，将卷积关联向量输入输出层，获取预测输出结果。其中，预测输出结果是预测的与训练症状对应的科室结果。

本实施例中，采用输出层计算训练症状对应的可能的科室的概率，并将概率最大的科室作为预测输出结果，以实现依据模型训练样本得到对应的预测输出结果。

512、基于预测输出结果与科室标签，计算预测误差损失，并根据预测误差损失更新目标BERT网络模型的参数直到目标BERT网络模型收敛，获取基于对话表征的分诊模型；

本实施例中，基于预测输出结果与科室标签，计算预测误差损失，并根据预测误差损失更新目标BERT网络模型的参数直到目标BERT网络模型收敛，获取基于对话表征的分诊模型。具体地，对预测误差损失进行求偏导得到梯度值，根据梯度值更新目标BERT网络模型的参数，实现对目标BERT网络模型的调优，当预测误差损失小于预设阈值，则目标BERT网络模型收敛，将目标BERT网络模型确定为分诊模型。

513、将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。

本实施例中步骤501-505、513与第一实施例中的101-105、106类似，此处不再赘述。

在本发明实施例中，通过获取待分诊对象在各轮对话中录入的问诊数据并对问诊数据进行数据清洗，得到目标问诊数据；对目标问诊数据进行意图识别，得到目标问诊数据中包含的句对；调用预置目标BERT网络模型对句对和主诉信息进行特征提取，得到句对向量和主诉向量；分别计算主诉向量和句对向量之间的欧氏距离，并基于欧氏距离确定多轮对话中每轮对话对应的对话表征向量；将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。本方案通过将主诉信息和多轮对话进行表征，解决了分诊准确率低的技术问题。

上面对本发明实施例中基于对话表征的分诊方法进行了描述，下面对本发明实施例中基于对话表征的分诊装置进行描述，请参阅图6，本发明实施例中基于对话表征的分诊装置的第一个实施例包括：

数据提取模块601，用于获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；

数据清洗模块602，用于对所述问诊数据进行数据清洗，得到目标问诊数据，其中，所述目标问诊数据包括所述用户的主诉信息；

意图识别模块603，用于对所述目标问诊数据进行意图识别，得到所述目标问诊数据中包含的句对，其中，所述目标问诊数据中包含至少一个句对；

特征提取模块604，用于调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取，得到所述句对的句对向量和所述主诉信息的主诉向量；

第一计算模块605，用于计算所述主诉向量和所述句对向量之间的欧氏距离，并基于所述欧氏距离确定所述各轮对话对应的对话表征向量；

识别模块606，用于将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。

请参阅图7，本发明实施例中基于对话表征的分诊装置的第二个实施例，该基于对话表征的分诊装置具体包括：

本实施例中，所述意图识别模块603包括：

获取单元6031，用于根据预设表征规则获取所述目标问诊数据中的所有问答句和与所述问答句对应对象的对象标识；

意图识别单元6032，用于基于各所述对象标识，对所述目标问诊数据中的各问答句分别进行意图识别，得到对应所述问诊数据的意图标识序列；

确定单元6033，用于根据所述意图标识序列，确定对应所述问句的目标答句意图标识；基于所述目标答句意图标识，得到所述目标问诊数据中包含的句对。

本实施例中，所述基于对话表征的分诊装置还包括：

向量化模块607，用于建立预训练任务，调用预置向量化模型将历史用户问诊数据处理为若干个词向量，其中，所述词向量包括基于所述历史用户问诊数据词向量；

第一获取模块608，用于将所述若干个词向量输入初始BERT网络模型，获取所述初始BERT网络模型输出的训练表征向量；

第二计算模块609，用于根据所述训练表征向量计算所述初始BERT网络模型的损失值；根据所述初始BERT网络模型的损失值，调整所述初始BERT网络模型的模型参数，得到目标BERT网络模型。

本实施例中，所述第一计算模块605具体用于：

计算所述主诉向量和每轮对话中每个句对向量两两之间的欧氏距离；

基于所述欧氏距离，确定每个所述句对在对应的一轮对话中的权重；

基于所述权重，对每个所述句对向量对应的权重进行加权平均，得到多轮对话中每轮对话对应的对话表征向量。

本实施例中，所述识别模块606具体用于：

基于所述各轮对话对应的对话表征向量，确定所述目标问诊数据中的目标病症信息；

对所述目标病症信息和所述各轮对话对应的主诉信息进行编码，得到所述目标问诊数据的病症实体向量；

将所述病症实体向量输入预置分诊模型进行预测，得到不同科室的分诊概率；

对所述分诊概率进行排序，得到分诊信息，其中，所述分诊信息包括预设数量个排序最高的推荐科室和所述推荐科室对应的分诊概率。

本实施例中，所述基于对话表征的分诊装置还包括：

第二获取模块610，用于从预置数据库中获取历史问诊数据；

表征学习模块611，用于通过所述目标BERT网络模型对所述历史问诊数据进行表征学习，获取所述历史问诊数据的第二对话表征向量；

筛选模块612，用于获取预设训练病症和与所述训练病症对应的科室标签，基于所述训练病症对预置节点集关联向量进行筛选，获取与所述训练症状对应的目标向量；

映射模块613，用于对所述第二对话表征向量和所述目标向量进行映射操作，获取对话嵌入向量和目标嵌入向量；

拼接模块614，用于基于所述训练症状对所述对话嵌入向量和所述目标嵌入向量进行拼接，获取拼接向量；

卷积处理模块615，用于在卷积层对所述拼接向量进行卷积操作，获取卷积关联向量，将所述卷积关联向量输入输出层，获取预测输出结果；

更新模块616，用于基于所述预测输出结果与所述科室标签，计算预测误差损失，并根据所述预测误差损失更新所述目标BERT网络模型的参数，直到所述目标BERT网络模型收敛，获取基于对话表征的分诊模型。

本实施例中，所述数据清洗模块602具体用于：

获取所述问诊数据的清洗需求；

根据所述问诊数据和所述清洗需求，确定用于对所述问诊数据进行数据清洗的目标清洗规则；

根据所述目标清洗规则对所述问诊数据进行数据清洗，得到目标问诊数据。

上面图6和图7从模块化功能实体的角度对本发明实施例中的基于对话表征的分诊装置进行详细描述，下面从硬件处理的角度对本发明实施例中基于对话表征的分诊设备进行详细描述。

图8是本发明实施例提供的一种基于对话表征的分诊设备的结构示意图，该基于对话表征的分诊设备800可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)810(例如，一个或一个以上处理器)和存储器820，一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中，存储器820和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对基于对话表征的分诊设备800中的一系列指令操作。更进一步地，处理器810可以设置为与存储介质830通信，在基于对话表征的分诊设备800上执行存储介质830中的一系列指令操作，以实现上述各方法实施例提供的基于对话表征的分诊方法的步骤。

基于对话表征的分诊设备800还可以包括一个或一个以上电源840，一个或一个以上有线或无线网络接口850，一个或一个以上输入输出接口860，和/或，一个或一个以上操作系统831，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图8示出的基于对话表征的分诊设备结构并不构成对本申请提供的基于对话表征的分诊设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行上述基于对话表征的分诊方法的步骤。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所述领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于对话表征的分诊方法，其特征在于，所述基于对话表征的分诊方法包括：

获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；

对所述问诊数据进行数据清洗，得到目标问诊数据，其中，所述目标问诊数据包括所述用户的主诉信息；

对所述目标问诊数据进行意图识别，得到所述目标问诊数据中包含的句对，其中，所述目标问诊数据中包含至少一个句对；

调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取，得到所述句对的句对向量和所述主诉信息的主诉向量；

计算所述主诉向量和所述句对向量之间的欧氏距离，并基于所述欧氏距离确定多轮对话中每轮对话对应的对话表征向量；

将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。

2.根据权利要求1所述的基于对话表征的分诊方法，其特征在于，所述对所述目标问诊数据进行意图识别，得到所述目标问诊数据中包含的句对包括：

根据预设表征规则获取所述目标问诊数据中的所有问答句和与所述问答句对应对象的对象标识；

基于各所述对象标识，对所述目标问诊数据中的各问答句分别进行意图识别，得到对应所述问诊数据的意图标识序列；

根据所述意图标识序列，确定对应所述问句的目标答句意图标识；

基于所述目标答句意图标识，得到所述目标问诊数据中包含的句对。

3.根据权利要求1所述的基于对话表征的分诊方法，其特征在于，在所述调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取，得到所述句对的句对向量和所述主诉信息的主诉向量之前，还包括：

建立预训练任务，调用预置向量化模型将历史用户问诊数据处理为若干个词向量，其中，所述词向量包括基于所述历史用户问诊数据词向量；

将所述若干个词向量输入初始BERT网络模型，获取所述初始BERT网络模型输出的训练表征向量；

根据所述训练表征向量计算所述初始BERT网络模型的损失值；

根据所述初始BERT网络模型的损失值，调整所述初始BERT网络模型的模型参数，得到目标BERT网络模型。

4.根据权利要求1-2中任一项所述的基于对话表征的分诊方法，其特征在于，所述计算所述主诉向量和所述句对向量之间的欧氏距离，并基于所述欧氏距离确定多轮对话中每轮对话对应的对话表征向量包括：

5.根据权利要求1所述的基于对话表征的分诊方法，其特征在于，所述将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息包括：

6.根据权利要求5所述的基于对话表征的分诊方法，其特征在于，在所述将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息之前，还包括：

从预置数据库中获取历史问诊数据；

通过所述目标BERT网络模型对所述历史问诊数据进行表征学习，获取所述历史问诊数据的第二对话表征向量；

获取预设训练病症和与所述训练病症对应的科室标签，基于所述训练病症对预置节点集关联向量进行筛选，获取与所述训练症状对应的目标向量；

对所述第二对话表征向量和所述目标向量进行映射操作，获取对话嵌入向量和目标嵌入向量；

基于所述训练症状对所述对话嵌入向量和所述目标嵌入向量进行拼接，获取拼接向量；

在卷积层对所述拼接向量进行卷积操作，获取卷积关联向量，将所述卷积关联向量输入输出层，获取预测输出结果；

基于所述预测输出结果与所述科室标签，计算预测误差损失，并根据所述预测误差损失更新所述目标BERT网络模型的参数，直到所述目标BERT网络模型收敛，获取基于对话表征的分诊模型。

7.根据权利要求1所述的基于对话表征的分诊方法，其特征在于，所述对所述问诊数据进行数据清洗，得到目标问诊数据包括：

获取所述问诊数据的清洗需求；

8.一种基于对话表征的分诊装置，其特征在于，所述基于对话表征的分诊装置包括：

第一获取模块，用于获取待分诊对象在就诊时产生的多轮对话，并提取多轮对话中的问诊数据；

数据清洗模块，用于对所述问诊数据进行数据清洗，得到目标问诊数据，其中，所述目标问诊数据包括所述用户的主诉信息；

意图识别模块，用于对所述目标问诊数据进行意图识别，得到所述目标问诊数据中包含的句对，其中，所述目标问诊数据中包含至少一个句对；

特征提取模块，用于调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取，得到所述句对的句对向量和所述主诉信息的主诉向量；

第一计算模块，用于计算所述主诉向量和所述句对向量之间的欧氏距离，并基于所述欧氏距离确定多轮对话中每轮对话对应的对话表征向量；

识别模块，用于将每轮对话的对话表征向量输入预置分诊模型进行识别，得到分诊信息。

9.一种基于对话表征的分诊设备，其特征在于，所述基于对话表征的分诊设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述基于对话表征的分诊设备执行如权利要求1-7中任一项所述的基于对话表征的分诊方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于对话表征的分诊方法的步骤。