CN112614584A

CN112614584A - 语音及文本转录的抑郁症辅助诊断方法、系统及介质

Info

Publication number: CN112614584A
Application number: CN202011466471.3A
Authority: CN
Inventors: 王迎雪; 邹博超; 王刚; 丰雷; 冯媛; 谢海永
Original assignee: Capital Medical University; Beijing Anding Hospital; Electronic Science Research Institute of CTEC
Current assignee: Capital Medical University; Beijing Anding Hospital; Electronic Science Research Institute of CTEC
Priority date: 2020-12-14
Filing date: 2020-12-14
Publication date: 2021-04-06

Abstract

本发明公开了一种结合语音及文本转录分析的抑郁症辅助诊断方法、系统及存储介质，其特征在于，包括：利用标准化问题对应的语音问题与目标用户进行交互，确定对应的问诊信息；基于所述问诊信息通过预设算法进行预测；根据预测结果判定所述目标用户是否为抑郁症患者。通过本发明能够实现辅助识别可能存在的抑郁症患者，减轻医疗工作人员的工作量，提高抑郁症诊断效率。

Description

语音及文本转录的抑郁症辅助诊断方法、系统及介质

技术领域

本发明涉及辅助诊疗技术领域，尤其涉及一种结合语音及文本转录分析的抑郁症辅助诊断方法、系统及存储介质。

背景技术

抑郁症(Major Depressive Disorder,MDD)全球患病率高达5％-12％，目前已经成为世界第四大疾病，仅次于心血管疾病、癌症、糖尿病，预计2020年后，它会超过癌症，成为仅次于心血管疾病的第二大疾病。抑郁症患者如果不能得到及时的治疗，病情就会持续继续恶化，引发严重的精神问题，甚至会出现自杀等危及生命的行为。抑郁症已经成为一个重大的公共卫生问题，具有迫切的临床研究需求。

目前，我国精神专科医院的医疗资源紧张，导致很多抑郁症患者无法及时的接受诊断和干预。同时，部分医生由于缺乏专科培训，特别是没有可操作性较强的、适合临床使用的规范化诊疗手段，导致我国的抑郁症的识别率的较低。

发明内容

本发明实施例提供一种语音及文本转录的抑郁症辅助诊断方法、系统及存储介质，用以辅助识别可能存在的抑郁症患者，减轻医疗工作人员的工作量，提高抑郁症诊断效率。

第一方面，本发明实施例提供一种结合语音及文本转录分析的抑郁症辅助诊断方法，包括：

利用标准化问题对应的语音问题与目标用户进行交互，确定用户对应的问诊信息；

基于所述问诊信息通过预设算法进行预测；

根据预测结果判定所述目标用户是否为抑郁症患者。

可选的，利用标准化问题对应的语音问题与目标用户进行交互之前，还包括：

验证所述目标用户的登录信息；

在验证通过后，对所述目标用户对应的基本信息进行分类存储。

可选的，利用标准化问题对应的语音问题与目标用户进行交互，包括：

根据数据库中的标准化问题进行语音合成，获得不同虚拟医生对应的语言问题；

基于目标用户选取的所述虚拟医生对应的语音问题向所述目标用户进行提问；

获取所述目标用户在答复提问过程中的问诊信息，所述问诊信息包括所述目标用户输入的文本答复信息，和/或语音答复信息。

可选的，若所述问诊信息为文本答复信息的情况下，基于所述问诊信息通过预设算法进行预测，包括：

将所述文本答复信息转化为文本嵌入向量；

利用预先训练好的深度神经网络模型对所述文本嵌入向量进行预测。

可选的，若所述问诊信息为语音答复信息的情况下，基于所述问诊信息通过预设算法进行预测，包括：

对所述语音答复信息进行端点检测，确定语音分包；

在对所述语音分包进行分帧和预加重处理之后，通过预先训练好的深度神经网络模型进行预测。

可选的，利用预设的标准化问题与目标用户进行交互之前，还包括：获取所述目标用户的PHQ9问卷结果。

可选的，根据预测结果判定所述目标用户是否为抑郁症患者，包括：

根据所述预测结果和所述PHQ9问卷结果判定所述目标用户是否为抑郁症患者。

可选的，根据所述预测结果和所述PHQ9问卷结果判定所述目标用户是否为抑郁症患者，包括：

根据预设权重值对所述预测结果和所述PHQ9问卷结果进行加权处理；

根据加权处理结果判定所述目标用户是否为抑郁症患者。

第二方面，本发明实施例还提出一种结合语音及文本转录分析的抑郁症辅助诊断系统，包括：

语音问诊模块，用于利用标准化问题对应的语音问题与目标用户进行交互，确定对应的问诊信息；

数据处理模块，用于基于所述文本和/或语音问诊信息通过预设算法进行预测；

判定模块，用于根据预测结果判定所述目标用户是否为抑郁症患者。

第三方面，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现前述的结合语音及文本转录分析的抑郁症辅助诊断方法的步骤。

本发明实施例利用预设的标准化问题对应的语音问题与目标用户进行交互，确定对应的问诊信息；基于所述问诊信息通过预设算法进行预测；根据预测结果判定所述目标用户为抑郁症患者，实现辅助识别可能存在的抑郁症患者，减轻医疗工作人员的工作量，提高抑郁症诊断效率。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本发明第一实施例流程图；

图2为本发明第二实施例装置结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明第一实施例提供一种结合语音及文本转录分析的抑郁症辅助诊断方法，如图1所示，包括以下具体步骤：

S101、利用标准化问题对应的语音问题与目标用户进行交互，确定对应的问诊信息；

具体的，例如可以通过用户交互界面向用户发出标准化问题对应的语音问题向目标用户进行提问，然后采集用户反馈的答复信息，其中答复信息可以是目标用户的语音答复信息或者文本答复信息，由此根据答复信息确认对应的问诊信息。

S102、基于所述问诊信息通过预设算法进行预测；

具体的，可以预先设置适配的预测算法，从而实现根据前述采集到的问诊信息进行预测。

S103、根据预测结果判定所述目标用户是否为抑郁症患者。

根据预测结果，例如在一些实施方式中例如可以根据预测结果与数据库中的实际抑郁症患者进行相似度匹配，然后输出对应的相似度百分比，当然也可以根据对应的不同的相似度百分比，根据预设的分级确定目标用户为不同等级的抑郁症患者，例如轻度、重度和严重等，具体的等级划分方式在此不做限定。

可选的，利用预设的标准化问题与目标用户进行交互之前，还包括：

验证所述目标用户的登录信息；

具体地说，在本实施例中，对于老用户的登录，可以在数据库中保存该用户的历史问诊数据，然后将最新的问诊数据与历史数据进行对比从而判定用户的抑郁症病情是否有所减轻。当然对于新用户可以通过新注册后登录。在登录完成后可以基于用于确定的基本信息进行分类存储，例如用户选择语音交互的方式，则可以将标准化问题转化为语音数据与目标用户进行交互，从而获得对应的用户答复数据，然后将用户答复数据转换为问诊信息。之后再根据问诊信息进行预测。也即本实施例通过分类存储能够更加方便的实现与目标用户的交互，提高问诊效率。

可选的，利用预设的标准化问题与目标用户进行交互，包括：

获取所述目标用户在答复提问过程中的问诊信息，所述问诊信息包括所述目标用户输入的文本信息，和/或语音信息。

具体地说，本实施例中，针对语音交互的方式进行举例说明。首先数据库中保存有预设的标准化问题，例如标准化问题为：您好，请您介绍一下自己，比如出生地、工作(或学业)，兴趣爱好等。

本实施例中具体地，在从数据库获取对应的标准化问题之后，进行语音合成，由此合成不同虚拟医生的声音，然后以语音的方式询问用户问题，并在询问问题的过程中收集用户的语音信息或/和文本信息。具体的在提问之前用户可以根据自己的喜好选择喜欢的虚拟医生的类型，也即不同的虚拟医生对应不同声线，和/或语气的语音问题，其中语音问题的内容可根据具体的声线做细微调整，但是相同问题的实质性内容保持一致。由此可以与目标用户更好地进行交流，提高辅助诊断的效率。在获得语音问题之后，则可以根据所述语音问题向目标用户进行提问，然后采集目标用户反馈的问诊信息，其中目标用户反馈的问诊信息包括目标用户输入的文本信息，和/或语音信息。

将所述文本答复信息转化为文本嵌入向量；

对所述语音答复信息进行端点检测，确定语音分包；

在一些实施方式中，当用户采用语音和文本的形式答复虚拟医生的问题时，通过语音转文本软件将目标用户的语音答复信息转换为文本信息，然后将转换的文本信息和用户输入的其他问题的文本信息一并转换为文本嵌入向量，基于得到的文本嵌入向量，采用深度神经网络模型对文本嵌入向量进行建模，获得预测结果。

在一些实施方式中，当用户仅采用语音的形式答复虚拟医生的问题时，数据处理模块通过对语音信号进行端点检测、分帧、预加重等预处理，然后采用深度神经网络模型对预处理后的语音进行预测，获得预测结果。

在一些实施方式中，当用户仅采用文本的形式答复虚拟医生的问题时，数据处理模块将获取的文本信息转换为文本嵌入向量，采用深度神经网络模型对文本嵌入向量进行预测，获得预测结果。

在一些具体的实施方式中，本实施例中还可以进一步设置PHQ9问卷。例如在用户登录完成后，采用问卷答复的方式采集目标用户的PHQ9问卷结果。

可选的，根据所述预测结果和所述PHQ9问卷结果判定所述目标用户为抑郁症患者，包括：

根据加权处理结果判定所述目标用户是否为抑郁症患者。

在一些具体的实施方式中，根据前述的初步预测结果和PHQ9问卷结果进行判定，一种具体的判定方式可以是，为PHQ9问卷结果和神经网络预测结果分别设置对应的权重值，由此可以根据具体的处理结果获得最终的预测值或者预测百分比，在获得的预测值超过预设阈值的情况下，则认为目标用户为抑郁症患者。当然在加权处理之前还可以对所述PHQ9问卷结果和神经网络预测结果进行归一化处理，这样更加便于获得易于处理的数据。

可选的，根据预测结果判定所述目标用户是否为抑郁症患者之后；根据判定结果进行可视化展示。

在一些实施方式中，在确定目标用户属于抑郁症患者之后，还可以进一步根据判定结果进行可视化展示，例如向患者展示抑郁症的发病原因、抑郁症的干预措施等相关的科普信息，便于用户了解抑郁症的相关知识，当然也可以根据抑郁症的病情严重程度向患者发送对应的诊疗手段等。

在另一些实施方式中，对于中间过程产生的数据进行存储，例如在用户登录之后，分类存储对应的用户基本信息，以及在用户交互过程中的问卷数据和问诊信息等。在存储容量达到限值之后，可以按照存储时间顺序，删除在前的历史用户数据，保留较新的用户数据。

本发明提供一种能在线记录抑郁症患者人员基本信息、问诊信息，且可通过用户的问诊信息，辅助判断用户是否患有抑郁症的辅助问诊系统。该系统可以减轻医生的工作量，减轻就医的盲目性，提供医生的工作效率。

实施例二

本发明第二实施例提供一种结合语音及文本转录分析的抑郁症辅助诊断系统，如图2所示，包括：

文本问诊模块，用于利用标准化问题对应的语音问题与目标用户进行交互，确定对应的问诊信息；

数据处理模块，用于基于所述问诊信息通过预设算法进行预测；

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现前述的结合语音及文本转录分析的抑郁症辅助诊断方法的步骤。

在一些可选的实施方式中，所述计算机程序被处理器执行时实现：

利用标准化问题对应的语音问题与目标用户进行交互，确定对应的问诊信息；

基于所述问诊信息通过预设算法进行预测；

根据预测结果判定所述目标用户是否为抑郁症患者。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.一种结合语音及文本转录分析的抑郁症辅助诊断方法，其特征在于，包括：

基于所述问诊信息通过预设算法进行预测；

根据预测结果判定所述目标用户是否为抑郁症患者。

2.如权利要求1所述的结合语音及文本转录分析的抑郁症辅助诊断方法，其特征在于，利用标准化问题对应的语音问题与目标用户进行交互之前，还包括：

验证所述目标用户的登录信息；

3.如权利要求1所述的结合语音及文本转录分析的抑郁症辅助诊断方法，其特征在于，利用标准化问题对应的语音问题与目标用户进行交互，包括：

4.如权利要求3所述的结合语音及文本转录分析的抑郁症辅助诊断方法，其特征在于，若所述问诊信息为文本答复信息的情况下，基于所述问诊信息通过预设算法进行预测，包括：

将所述文本答复信息转化为文本嵌入向量；

5.如权利要求3所述的结合语音及文本转录分析的抑郁症辅助诊断方法，其特征在于，若所述问诊信息为语音答复信息的情况下，基于所述问诊信息通过预设算法进行预测，包括：

对所述语音答复信息进行端点检测，确定语音分包；

6.如权利要求1-5任一项所述的结合语音及文本转录分析的抑郁症辅助诊断方法，其特征在于，利用预设的标准化问题与目标用户进行交互之前，还包括：获取所述目标用户的PHQ9问卷结果。

7.如权利要求6所述的结合语音及文本转录分析的抑郁症辅助诊断方法，其特征在于，根据预测结果判定所述目标用户是否为抑郁症患者，包括：

8.如权利要求7所述的结合语音及文本转录分析的抑郁症辅助诊断方法，其特征在于，根据所述预测结果和所述PHQ9问卷结果判定所述目标用户是否为抑郁症患者，包括：

根据加权处理结果判定所述目标用户是否为抑郁症患者。

9.一种结合语音及文本转录分析的抑郁症辅助诊断系统，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的结合语音及文本转录分析的抑郁症辅助诊断方法的步骤。