CN117059092B

CN117059092B - 基于区块链的智慧医疗交互式智能分诊方法及系统

Info

Publication number: CN117059092B
Application number: CN202311307846.5A
Authority: CN
Inventors: 于水娜
Original assignee: Shenzhen Puyi Tongchuang Technology Co ltd
Current assignee: Shenzhen Puyi Tongchuang Technology Co ltd
Priority date: 2023-10-11
Filing date: 2023-10-11
Publication date: 2024-06-04
Anticipated expiration: 2043-10-11
Also published as: CN117059092A

Abstract

本发明公开了一种基于区块链的智慧医疗交互式智能分诊方法及系统，涉及音视频数据分析技术领域。该方法包括：对预检测语音信号进行声源定位；若为近距离声源位置，则采集该患者的人脸图像，根据预检测语音信号和患者的人脸图像对患者的身份进行识别，以得到患者身份信息；获取该患者的病情描述语音信号，利用基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别，以得到病情描述语音信号识别结果；根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器，进行智能分诊提示；将核心数据上传至区块链。本发明结合多种智能模型，实现高效精准的医疗分诊；并将核心信息上链存储。

Description

基于区块链的智慧医疗交互式智能分诊方法及系统

技术领域

本发明涉及音视频数据分析技术领域，具体而言，涉及一种基于区块链的智慧医疗交互式智能分诊方法及系统。

背景技术

分诊工作能够为患者创造舒适、安静的候诊环境，消除患者就诊时的混乱、拥挤现象，提升患者的就诊效率，从而有效地增加患者就诊的满意度。然而，传统的分诊过程往往需要消耗巨大的人力资源。尽管部分分诊系统已经应用了信息技术，但仍然在精准度、便捷度、交互性等方面存在一定的局限性。

随着信息技术的不断更新换代，能够为交互式智能分诊提供直接的支持；同时，区块链技术作为近年来的新兴技术，能够有效提升分诊过程的安全性。因此，提出一种基于区块链的智慧医疗交互式智能分诊方法及系统有非常重要的价值和意义。

发明内容

为了解决现有技术中无法实现精准、便捷的医疗分诊的问题，本发明提供一种基于区块链的智慧医疗交互式智能分诊方法及系统，结合基于语音分段语谱图比对分析的多重校验式声源定位模型、基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型、基于语音分段自适应去噪的多范围语义校验式语音识别模型，对声源、人员身份、语音进行精准分析，实现高效精准的医疗分诊；并利用区块链技术将核心信息上链存储，提高数据安全性。

为解决上述技术问题，本发明采用的技术方案为：

第一方面，本发明提供一种基于区块链的智慧医疗交互式智能分诊方法，包括以下步骤：

获取并将患者的初始语音信号作为预检测语音信号，利用基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位，生成声源定位结果；

若声源定位结果为声源位置近，则采集该患者的人脸图像，利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，根据预检测语音信号和患者的人脸图像对患者的身份进行识别，以得到患者身份信息；

获取该患者的病情描述语音信号，利用基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别，以得到病情描述语音信号识别结果；

根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器，进行智能分诊提示；记录分诊结果和分诊时间；

分诊完成后，将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。

首先，本发明提出了基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位；该模型通过语音分段语谱图比对分析的方式，保留代表性较强的等分语音信号，并对它们分别进行声源定位，当每段等分语音信号的声源定位结果都是声源位置较近时才认定预检测语音信号声源位置较近，确保了声源定位的精准度。其次，本发明提出了基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，对患者的身份进行识别；该模型先对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别，初步识别出患者的身份信息，在此基础上利用多样性语音编码后验匹配的方式对身份识别结果进行验证，确保了患者身份识别的精准度。再次，本发明提出了基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别；该模型对峰值信噪比不同的等分语音信号使用更加匹配的语音去噪方式，在保证语音去噪效果的基础上充分降低了计算资源消耗；同时，该模型利用多范围语义校验的方式，对每个识别词汇的语义合理性进行充分校验，有效保证了语音识别的精准度。最后，本发明利用了区块链技术，将患者身份信息、病情描述语音信号识别结果、分诊结果、分诊时间等进行上链存储，提升了系统的安全性。

基于第一方面，进一步地，上述利用基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位的方法包括以下步骤：

将预检测语音信号进行多等分处理，以得到多段等分语音信号；

获取并将各段等分语音信号的语谱图两两进行比对，生成对应的多个相似度结果；

若任意两段等分语音信号的相似度结果大于预置的相似度阈值，则保留其中一段等分语音信号；

利用预置的声源定位模型对保留的每段等分语音信号进行声源定位，以得到并根据对应的定位结果确定最终的声源定位结果。

基于第一方面，进一步地，上述利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，根据预检测语音信号和患者的人脸图像对患者的身份进行识别的方法包括以下步骤：

对患者的人脸图像进行图像超分辨率重建，并利用预置的人脸识别模型对重建后的人脸图像进行识别，以得到患者的初步身份信息；

根据初步身份信息在预置的基准语音库中提取对应的基准语音信号；

分别利用多种编码方式对预检测语音信号和基准语音信号进行编码，并计算对应编码方式下预检测语音信号和基准语音信号之间的相似度，以得到多个语音相似度结果；

若多个语音相似度结果均大于预置的相似度阈值，则认定患者的初步身份信息准确，将初步身份信息作为最终的患者身份信息。

基于第一方面，进一步地，上述利用基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别的方法包括以下步骤：

将病情描述语音信号进行多等分处理，以得到多段等分病情描述语音信号；

对每段等分病情描述语音信号进行峰值信噪比检测，以得到并根据对应的峰值信噪比利用不同的语音去噪模型对对应的等分病情描述语音信号进行去噪处理；

利用预置的语音识别模型对去噪处理后的等分病情描述语音信号进行识别，以得到初始病情描述语音识别结果；

对初始病情描述语音识别结果中的每个词汇进行语义合理性校验，生成并根据对应的校验结果确定最终的病情描述语音信号识别结果。

基于第一方面，进一步地，上述根据对应的峰值信噪比利用不同的语音去噪模型对对应的等分病情描述语音信号进行去噪处理的方法包括以下步骤：

若峰值信噪比大于预置的信噪比阈值，则利用预置的简易语音去噪模型对对应的等分病情描述语音信号进行去噪处理；

若峰值信噪比小于预置的信噪比阈值，则利用预置的复杂语音去噪模型对对应的等分病情描述语音信号进行去噪处理。

基于第一方面，进一步地，上述对初始病情描述语音识别结果中的每个词汇进行语义合理性校验的方法包括以下步骤：

从短句、整句及段落多个方面对初始病情描述语音识别结果中的每个词汇进行语义合理性校验，以得到对应词汇的多个语义合理性校验结果；

若每个词汇的多个语义合理性校验结果均为语义合理，则认定初始病情描述语音识别结果为最终的病情描述语音信号识别结果。

第二方面，本发明提供一种基于区块链的智慧医疗交互式智能分诊系统，包括声源定位模块、身份识别模块、病情描述识别模块、分诊模块以及数据上链模块，其中：

声源定位模块，用于获取并将患者的初始语音信号作为预检测语音信号，利用基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位，生成声源定位结果；

身份识别模块，用于若声源定位结果为声源位置近，则采集该患者的人脸图像，利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，根据预检测语音信号和患者的人脸图像对患者的身份进行识别，以得到患者身份信息；

病情描述识别模块，用于获取该患者的病情描述语音信号，利用基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别，以得到病情描述语音信号识别结果；

分诊模块，用于根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器，进行智能分诊提示；记录分诊结果和分诊时间；

数据上链模块，用于分诊完成后，将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。

本系统通过声源定位模块、身份识别模块、病情描述识别模块、分诊模块以及数据上链模块等多个模块的配合，结合基于语音分段语谱图比对分析的多重校验式声源定位模型、基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型、基于语音分段自适应去噪的多范围语义校验式语音识别模型，对声源、人员身份、语音进行精准分析，实现高效精准的医疗分诊；并利用区块链技术将核心信息上链存储，提高数据安全性。首先，本发明提出了基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位；该模型通过语音分段语谱图比对分析的方式，保留代表性较强的等分语音信号，并对它们分别进行声源定位，当每段等分语音信号的声源定位结果都是声源位置较近时才认定预检测语音信号声源位置较近，确保了声源定位的精准度。其次，本发明提出了基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，对患者的身份进行识别；该模型先对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别，初步识别出患者的身份信息，在此基础上利用多样性语音编码后验匹配的方式对身份识别结果进行验证，确保了患者身份识别的精准度。再次，本发明提出了基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别；该模型对峰值信噪比不同的等分语音信号使用更加匹配的语音去噪方式，在保证语音去噪效果的基础上充分降低了计算资源消耗；同时，该模型利用多范围语义校验的方式，对每个识别词汇的语义合理性进行充分校验，有效保证了语音识别的精准度。最后，本发明利用了区块链技术，将患者身份信息、病情描述语音信号识别结果、分诊结果、分诊时间等进行上链存储，提升了系统的安全性。

第三方面，本申请提供一种电子设备，其包括存储器，用于存储一个或多个程序；处理器；当一个或多个程序被处理器执行时，实现如上述第一方面中任一项的方法。

第四方面，本申请提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。

本发明至少具有如下优点或有益效果：

1、本发明提出了基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位；该模型通过语音分段语谱图比对分析的方式，保留代表性较强的等分语音信号，并对它们分别进行声源定位，当每段等分语音信号的声源定位结果都是声源位置较近时才认定预检测语音信号声源位置较近，确保了声源定位的精准度。

2、本发明提出了基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，对患者的身份进行识别；该模型先对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别，初步识别出患者的身份信息，在此基础上利用多样性语音编码后验匹配的方式对身份识别结果进行验证，确保了患者身份识别的精准度。

3、本发明提出了基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别；该模型对峰值信噪比不同的等分语音信号使用更加匹配的语音去噪方式，在保证语音去噪效果的基础上充分降低了计算资源消耗；同时，该模型利用多范围语义校验的方式，对每个识别词汇的语义合理性进行充分校验，有效保证了语音识别的精准度。

4、本发明利用了区块链技术，将患者身份信息、病情描述语音信号识别结果、分诊结果、分诊时间等进行上链存储，提升了系统的安全性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例一种基于区块链的智慧医疗交互式智能分诊方法的流程图；

图2为本发明实施例一种基于区块链的智慧医疗交互式智能分诊系统的原理框图；

图3为本发明实施例提供的一种电子设备的结构框图。

附图标记说明：100、声源定位模块；200、身份识别模块；300、病情描述识别模块；400、分诊模块；500、数据上链模块；101、存储器；102、处理器；103、通信接口。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

在本发明实施例的描述中，“多个”代表至少2个。

实施例

如图1所示，第一方面，本发明实施例提供一种基于区块链的智慧医疗交互式智能分诊方法，包括以下步骤：

S1、获取并将患者的初始语音信号作为预检测语音信号，利用基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位，生成声源定位结果；

进一步地，包括：将预检测语音信号进行多等分处理，以得到多段等分语音信号；获取并将各段等分语音信号的语谱图两两进行比对，生成对应的多个相似度结果；若任意两段等分语音信号的相似度结果大于预置的相似度阈值，则保留其中一段等分语音信号；利用预置的声源定位模型对保留的每段等分语音信号进行声源定位，以得到并根据对应的定位结果确定最终的声源定位结果。

在本发明的一些实施例中，某位患者在分诊机器前，按照系统提示说出一段话（系统提示‘请您说出一段话，时间不低于3秒钟’），分诊机器的音视频设备自动提取该语音信号作为预检测语音信号。利用基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位。如果判定预检测语音信号声源的位置较近，则继续进行下一步。

基于语音分段语谱图比对分析的多重校验式声源定位模型具体包括：

把预检测语音信号等分为10段，将每段等分语音信号的语谱图两两进行比对。若任意两段等分语音信号的语谱图的相似度较高，则仅保留其中一段等分语音信号即可。对于保留的每段等分语音信号，分别利用声源定位模型进行声源定位，若每段等分语音信号的声源定位结果都是声源位置较近，则认定预检测语音信号声源位置较近。

S2、若声源定位结果为声源位置近，则采集该患者的人脸图像，利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，根据预检测语音信号和患者的人脸图像对患者的身份进行识别，以得到患者身份信息；

进一步地，包括：对患者的人脸图像进行图像超分辨率重建，并利用预置的人脸识别模型对重建后的人脸图像进行识别，以得到患者的初步身份信息；根据初步身份信息在预置的基准语音库中提取对应的基准语音信号；分别利用多种编码方式对预检测语音信号和基准语音信号进行编码，并计算对应编码方式下预检测语音信号和基准语音信号之间的相似度，以得到多个语音相似度结果；若多个语音相似度结果均大于预置的相似度阈值，则认定患者的初步身份信息准确，将初步身份信息作为最终的患者身份信息。

在本发明的一些实施例中，分诊机器的音视频设备自动提取一张患者的人脸图像，利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，对患者的身份进行识别。

基于多样性语音编码匹配后验的多维度鲁棒性身份识模型具体包括：

对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别，初步得到该患者的身份信息。根据初步得到的患者身份信息，在系统（预先构建的基准语音库）中找到对应的基准语音信号（例如，人脸识别过程中已经初步识别出患者的身份是‘张三’，系统自动提取张三前期录入在系统的语音信号作为基准语音信号）。将预检测语音信号和基准语音信号分别利用编码方式A进行编码，计算二者的相似度，得到相似度A；将预检测语音信号和基准语音信号分别利用编码方式B进行编码，计算二者的相似度，得到相似度B；将预检测语音信号和基准语音信号分别利用编码方式C进行编码，计算二者的相似度，得到相似度C。其中，编码方式A,B,C分别为不同的语音编码方式。如果所有的相似度结果（相似度A,B,C）均为较高，则最终认定前面得到的患者身份信息是准确的。

S3、获取该患者的病情描述语音信号，利用基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别，以得到病情描述语音信号识别结果；

进一步地，包括：将病情描述语音信号进行多等分处理，以得到多段等分病情描述语音信号；对每段等分病情描述语音信号进行峰值信噪比检测，以得到并根据对应的峰值信噪比利用不同的语音去噪模型对对应的等分病情描述语音信号进行去噪处理；利用预置的语音识别模型对去噪处理后的等分病情描述语音信号进行识别，以得到初始病情描述语音识别结果；对初始病情描述语音识别结果中的每个词汇进行语义合理性校验，生成并根据对应的校验结果确定最终的病情描述语音信号识别结果。

进一步地，包括：若峰值信噪比大于预置的信噪比阈值，则利用预置的简易语音去噪模型对对应的等分病情描述语音信号进行去噪处理；若峰值信噪比小于预置的信噪比阈值，则利用预置的复杂语音去噪模型对对应的等分病情描述语音信号进行去噪处理。

进一步地，包括：从短句、整句及段落多个方面对初始病情描述语音识别结果中的每个词汇进行语义合理性校验，以得到对应词汇的多个语义合理性校验结果；若每个词汇的多个语义合理性校验结果均为语义合理，则认定初始病情描述语音识别结果为最终的病情描述语音信号识别结果。

在本发明的一些实施例中，患者对自己的病情进行简单口述，分诊机器的音视频设备自动提取该语音信号作为病情描述语音信号。利用基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别，得到病情描述语音信号识别结果。

基于语音分段自适应去噪的多范围语义校验式语音识别模型具体包括：

把病情描述语音信号进行10等分，对每段等分语音信号进行峰值信噪比检测。对于峰值信噪比较高的等分语音信号，均利用简易的语音去噪模型进行语音去噪处理；对于峰值信噪比较低的等分语音信号，均利用复杂的语音去噪模型进行语音去噪处理。完成语音去噪处理之后，利用语音识别模型对病情描述语音信号进行语音识别，初步得到病情描述语音识别结果。对于识别结果的每个词汇，从整个短语、整个句子、整个段落等多个范围对词汇的语义合理性进行校验，若每个词汇均顺利通过多范围语义校验，则最终认定前面得到的病情描述语音信号识别结果是准确的。

S4、根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器，进行智能分诊提示；记录分诊结果和分诊时间；根据病情描述语音信号识别结果生成对应的分诊信息，对患者进行分诊（例如，分诊到神经内科、呼吸内科等），并通知患者（屏幕显示、语音播放等方式）。

S5、分诊完成后，将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。

如图2所示，第二方面，本发明实施例提供一种基于区块链的智慧医疗交互式智能分诊系统，包括声源定位模块100、身份识别模块200、病情描述识别模块300、分诊模块400以及数据上链模块500，其中：

声源定位模块100，用于获取并将患者的初始语音信号作为预检测语音信号，利用基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位，生成声源定位结果；

身份识别模块200，用于若声源定位结果为声源位置近，则采集该患者的人脸图像，利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，根据预检测语音信号和患者的人脸图像对患者的身份进行识别，以得到患者身份信息；

病情描述识别模块300，用于获取该患者的病情描述语音信号，利用基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别，以得到病情描述语音信号识别结果；

分诊模块400，用于根据病情描述语音信号识别结果生成并发送分诊信息给对应的分诊机器，进行智能分诊提示；记录分诊结果和分诊时间；

数据上链模块500，用于分诊完成后，将分诊结果、分诊时间、患者身份信息及病情描述语音信号识别结果上传至区块链。

本系统通过声源定位模块100、身份识别模块200、病情描述识别模块300、分诊模块400以及数据上链模块500等多个模块的配合，结合基于语音分段语谱图比对分析的多重校验式声源定位模型、基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型、基于语音分段自适应去噪的多范围语义校验式语音识别模型，对声源、人员身份、语音进行精准分析，实现高效精准的医疗分诊；并利用区块链技术将核心信息上链存储，提高数据安全性。首先，本发明提出了基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位；该模型通过语音分段语谱图比对分析的方式，保留代表性较强的等分语音信号，并对它们分别进行声源定位，当每段等分语音信号的声源定位结果都是声源位置较近时才认定预检测语音信号声源位置较近，确保了声源定位的精准度。其次，本发明提出了基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，对患者的身份进行识别；该模型先对提取的患者人脸图像进行图像超分辨率重建并进行人脸识别，初步识别出患者的身份信息，在此基础上利用多样性语音编码后验匹配的方式对身份识别结果进行验证，确保了患者身份识别的精准度。再次，本发明提出了基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别；该模型对峰值信噪比不同的等分语音信号使用更加匹配的语音去噪方式，在保证语音去噪效果的基础上充分降低了计算资源消耗；同时，该模型利用多范围语义校验的方式，对每个识别词汇的语义合理性进行充分校验，有效保证了语音识别的精准度。最后，本发明利用了区块链技术，将患者身份信息、病情描述语音信号识别结果、分诊结果、分诊时间等进行上链存储，提升了系统的安全性。

如图3所示，第三方面，本申请实施例提供一种电子设备，其包括存储器101，用于存储一个或多个程序；处理器102。当一个或多个程序被处理器102执行时，实现如上述第一方面中任一项的方法。

还包括通信接口103，该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块，处理器102通过执行存储在存储器101内的软件程序及模块，从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。

其中，存储器101可以是但不限于，随机存取存储器（Random Access Memory，RAM），只读存储器（Read Only Memory，ROM），可编程只读存储器（Programmable Read-OnlyMemory，PROM），可擦除只读存储器（Erasable Programmable Read-Only Memory，EPROM），电可擦除只读存储器（Electric Erasable Programmable Read-Only Memory，EEPROM）等。

处理器102可以是一种集成电路芯片，具有信号处理能力。该处理器102可以是通用处理器，包括中央处理器（Central Processing Unit，CPU）、网络处理器（NetworkProcessor，NP）等；还可以是数字信号处理器（Digital Signal Processing，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field－Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请所提供的实施例中，应该理解到，所揭露的方法及系统，也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

第四方面，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random AccessMemory）、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其它的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims

1.一种基于区块链的智慧医疗交互式智能分诊方法，其特征在于，包括以下步骤：

若声源定位结果为声源位置近，则采集该患者的人脸图像，利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，根据预检测语音信号和患者的人脸图像对患者的身份进行识别，以得到患者身份信息；包括：对患者的人脸图像进行图像超分辨率重建，并利用预置的人脸识别模型对重建后的人脸图像进行识别，以得到患者的初步身份信息；根据初步身份信息在预置的基准语音库中提取对应的基准语音信号；分别利用多种编码方式对预检测语音信号和基准语音信号进行编码，并计算对应编码方式下预检测语音信号和基准语音信号之间的相似度，以得到多个语音相似度结果；若多个语音相似度结果均大于预置的相似度阈值，则认定患者的初步身份信息准确，将初步身份信息作为最终的患者身份信息；

2.根据权利要求1所述的一种基于区块链的智慧医疗交互式智能分诊方法，其特征在于，所述利用基于语音分段语谱图比对分析的多重校验式声源定位模型，对预检测语音信号进行声源定位的方法包括以下步骤：

3.根据权利要求1所述的一种基于区块链的智慧医疗交互式智能分诊方法，其特征在于，所述利用基于语音分段自适应去噪的多范围语义校验式语音识别模型，对病情描述语音信号进行识别的方法包括以下步骤：

4.根据权利要求3所述的一种基于区块链的智慧医疗交互式智能分诊方法，其特征在于，所述根据对应的峰值信噪比利用不同的语音去噪模型对对应的等分病情描述语音信号进行去噪处理的方法包括以下步骤：

5.根据权利要求3所述的一种基于区块链的智慧医疗交互式智能分诊方法，其特征在于，所述对初始病情描述语音识别结果中的每个词汇进行语义合理性校验的方法包括以下步骤：

6.一种基于区块链的智慧医疗交互式智能分诊系统，其特征在于，包括声源定位模块、身份识别模块、病情描述识别模块、分诊模块以及数据上链模块，其中：

身份识别模块，用于若声源定位结果为声源位置近，则采集该患者的人脸图像，利用基于多样性语音编码匹配后验的多维度鲁棒性身份识别模型，根据预检测语音信号和患者的人脸图像对患者的身份进行识别，以得到患者身份信息；包括：对患者的人脸图像进行图像超分辨率重建，并利用预置的人脸识别模型对重建后的人脸图像进行识别，以得到患者的初步身份信息；根据初步身份信息在预置的基准语音库中提取对应的基准语音信号；分别利用多种编码方式对预检测语音信号和基准语音信号进行编码，并计算对应编码方式下预检测语音信号和基准语音信号之间的相似度，以得到多个语音相似度结果；若多个语音相似度结果均大于预置的相似度阈值，则认定患者的初步身份信息准确，将初步身份信息作为最终的患者身份信息；

7.一种电子设备，其特征在于，包括：

存储器，用于存储一个或多个程序；

处理器；

当所述一个或多个程序被所述处理器执行时，实现如权利要求1-5中任一项所述的方法。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。