CN112614584A - 语音及文本转录的抑郁症辅助诊断方法、系统及介质 - Google Patents
语音及文本转录的抑郁症辅助诊断方法、系统及介质 Download PDFInfo
- Publication number
- CN112614584A CN112614584A CN202011466471.3A CN202011466471A CN112614584A CN 112614584 A CN112614584 A CN 112614584A CN 202011466471 A CN202011466471 A CN 202011466471A CN 112614584 A CN112614584 A CN 112614584A
- Authority
- CN
- China
- Prior art keywords
- target user
- voice
- depression
- information
- inquiry information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000003745 diagnosis Methods 0.000 title claims abstract description 24
- 208000020401 Depressive disease Diseases 0.000 title claims abstract description 20
- 238000013518 transcription Methods 0.000 title claims abstract description 15
- 230000035897 transcription Effects 0.000 title claims abstract description 15
- 238000012545 processing Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 238000009432 framing Methods 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 3
- 230000003001 depressive effect Effects 0.000 claims description 2
- 230000003993 interaction Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Primary Health Care (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Pathology (AREA)
- Molecular Biology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种结合语音及文本转录分析的抑郁症辅助诊断方法、系统及存储介质,其特征在于,包括:利用标准化问题对应的语音问题与目标用户进行交互,确定对应的问诊信息;基于所述问诊信息通过预设算法进行预测;根据预测结果判定所述目标用户是否为抑郁症患者。通过本发明能够实现辅助识别可能存在的抑郁症患者,减轻医疗工作人员的工作量,提高抑郁症诊断效率。
Description
技术领域
本发明涉及辅助诊疗技术领域,尤其涉及一种结合语音及文本转录分析的抑郁症辅助诊断方法、系统及存储介质。
背景技术
抑郁症(Major Depressive Disorder,MDD)全球患病率高达5%-12%,目前已经成为世界第四大疾病,仅次于心血管疾病、癌症、糖尿病,预计2020年后,它会超过癌症,成为仅次于心血管疾病的第二大疾病。抑郁症患者如果不能得到及时的治疗,病情就会持续继续恶化,引发严重的精神问题,甚至会出现自杀等危及生命的行为。抑郁症已经成为一个重大的公共卫生问题,具有迫切的临床研究需求。
目前,我国精神专科医院的医疗资源紧张,导致很多抑郁症患者无法及时的接受诊断和干预。同时,部分医生由于缺乏专科培训,特别是没有可操作性较强的、适合临床使用的规范化诊疗手段,导致我国的抑郁症的识别率的较低。
发明内容
本发明实施例提供一种语音及文本转录的抑郁症辅助诊断方法、系统及存储介质,用以辅助识别可能存在的抑郁症患者,减轻医疗工作人员的工作量,提高抑郁症诊断效率。
第一方面,本发明实施例提供一种结合语音及文本转录分析的抑郁症辅助诊断方法,包括:
利用标准化问题对应的语音问题与目标用户进行交互,确定用户对应的问诊信息;
基于所述问诊信息通过预设算法进行预测;
根据预测结果判定所述目标用户是否为抑郁症患者。
可选的,利用标准化问题对应的语音问题与目标用户进行交互之前,还包括:
验证所述目标用户的登录信息;
在验证通过后,对所述目标用户对应的基本信息进行分类存储。
可选的,利用标准化问题对应的语音问题与目标用户进行交互,包括:
根据数据库中的标准化问题进行语音合成,获得不同虚拟医生对应的语言问题;
基于目标用户选取的所述虚拟医生对应的语音问题向所述目标用户进行提问;
获取所述目标用户在答复提问过程中的问诊信息,所述问诊信息包括所述目标用户输入的文本答复信息,和/或语音答复信息。
可选的,若所述问诊信息为文本答复信息的情况下,基于所述问诊信息通过预设算法进行预测,包括:
将所述文本答复信息转化为文本嵌入向量;
利用预先训练好的深度神经网络模型对所述文本嵌入向量进行预测。
可选的,若所述问诊信息为语音答复信息的情况下,基于所述问诊信息通过预设算法进行预测,包括:
对所述语音答复信息进行端点检测,确定语音分包;
在对所述语音分包进行分帧和预加重处理之后,通过预先训练好的深度神经网络模型进行预测。
可选的,利用预设的标准化问题与目标用户进行交互之前,还包括:获取所述目标用户的PHQ9问卷结果。
可选的,根据预测结果判定所述目标用户是否为抑郁症患者,包括:
根据所述预测结果和所述PHQ9问卷结果判定所述目标用户是否为抑郁症患者。
可选的,根据所述预测结果和所述PHQ9问卷结果判定所述目标用户是否为抑郁症患者,包括:
根据预设权重值对所述预测结果和所述PHQ9问卷结果进行加权处理;
根据加权处理结果判定所述目标用户是否为抑郁症患者。
第二方面,本发明实施例还提出一种结合语音及文本转录分析的抑郁症辅助诊断系统,包括:
语音问诊模块,用于利用标准化问题对应的语音问题与目标用户进行交互,确定对应的问诊信息;
数据处理模块,用于基于所述文本和/或语音问诊信息通过预设算法进行预测;
判定模块,用于根据预测结果判定所述目标用户是否为抑郁症患者。
第三方面,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的结合语音及文本转录分析的抑郁症辅助诊断方法的步骤。
本发明实施例利用预设的标准化问题对应的语音问题与目标用户进行交互,确定对应的问诊信息;基于所述问诊信息通过预设算法进行预测;根据预测结果判定所述目标用户为抑郁症患者,实现辅助识别可能存在的抑郁症患者,减轻医疗工作人员的工作量,提高抑郁症诊断效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明第一实施例流程图;
图2为本发明第二实施例装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明第一实施例提供一种结合语音及文本转录分析的抑郁症辅助诊断方法,如图1所示,包括以下具体步骤:
S101、利用标准化问题对应的语音问题与目标用户进行交互,确定对应的问诊信息;
具体的,例如可以通过用户交互界面向用户发出标准化问题对应的语音问题向目标用户进行提问,然后采集用户反馈的答复信息,其中答复信息可以是目标用户的语音答复信息或者文本答复信息,由此根据答复信息确认对应的问诊信息。
S102、基于所述问诊信息通过预设算法进行预测;
具体的,可以预先设置适配的预测算法,从而实现根据前述采集到的问诊信息进行预测。
S103、根据预测结果判定所述目标用户是否为抑郁症患者。
根据预测结果,例如在一些实施方式中例如可以根据预测结果与数据库中的实际抑郁症患者进行相似度匹配,然后输出对应的相似度百分比,当然也可以根据对应的不同的相似度百分比,根据预设的分级确定目标用户为不同等级的抑郁症患者,例如轻度、重度和严重等,具体的等级划分方式在此不做限定。
本发明实施例利用预设的标准化问题对应的语音问题与目标用户进行交互,确定对应的问诊信息;基于所述问诊信息通过预设算法进行预测;根据预测结果判定所述目标用户为抑郁症患者,实现辅助识别可能存在的抑郁症患者,减轻医疗工作人员的工作量,提高抑郁症诊断效率。
可选的,利用预设的标准化问题与目标用户进行交互之前,还包括:
验证所述目标用户的登录信息;
在验证通过后,对所述目标用户对应的基本信息进行分类存储。
具体地说,在本实施例中,对于老用户的登录,可以在数据库中保存该用户的历史问诊数据,然后将最新的问诊数据与历史数据进行对比从而判定用户的抑郁症病情是否有所减轻。当然对于新用户可以通过新注册后登录。在登录完成后可以基于用于确定的基本信息进行分类存储,例如用户选择语音交互的方式,则可以将标准化问题转化为语音数据与目标用户进行交互,从而获得对应的用户答复数据,然后将用户答复数据转换为问诊信息。之后再根据问诊信息进行预测。也即本实施例通过分类存储能够更加方便的实现与目标用户的交互,提高问诊效率。
可选的,利用预设的标准化问题与目标用户进行交互,包括:
根据数据库中的标准化问题进行语音合成,获得不同虚拟医生对应的语言问题;
基于目标用户选取的所述虚拟医生对应的语音问题向所述目标用户进行提问;
获取所述目标用户在答复提问过程中的问诊信息,所述问诊信息包括所述目标用户输入的文本信息,和/或语音信息。
具体地说,本实施例中,针对语音交互的方式进行举例说明。首先数据库中保存有预设的标准化问题,例如标准化问题为:您好,请您介绍一下自己,比如出生地、工作(或学业),兴趣爱好等。
本实施例中具体地,在从数据库获取对应的标准化问题之后,进行语音合成,由此合成不同虚拟医生的声音,然后以语音的方式询问用户问题,并在询问问题的过程中收集用户的语音信息或/和文本信息。具体的在提问之前用户可以根据自己的喜好选择喜欢的虚拟医生的类型,也即不同的虚拟医生对应不同声线,和/或语气的语音问题,其中语音问题的内容可根据具体的声线做细微调整,但是相同问题的实质性内容保持一致。由此可以与目标用户更好地进行交流,提高辅助诊断的效率。在获得语音问题之后,则可以根据所述语音问题向目标用户进行提问,然后采集目标用户反馈的问诊信息,其中目标用户反馈的问诊信息包括目标用户输入的文本信息,和/或语音信息。
可选的,若所述问诊信息为文本答复信息的情况下,基于所述问诊信息通过预设算法进行预测,包括:
将所述文本答复信息转化为文本嵌入向量;
利用预先训练好的深度神经网络模型对所述文本嵌入向量进行预测。
可选的,若所述问诊信息为语音答复信息的情况下,基于所述问诊信息通过预设算法进行预测,包括:
对所述语音答复信息进行端点检测,确定语音分包;
在对所述语音分包进行分帧和预加重处理之后,通过预先训练好的深度神经网络模型进行预测。
在一些实施方式中,当用户采用语音和文本的形式答复虚拟医生的问题时,通过语音转文本软件将目标用户的语音答复信息转换为文本信息,然后将转换的文本信息和用户输入的其他问题的文本信息一并转换为文本嵌入向量,基于得到的文本嵌入向量,采用深度神经网络模型对文本嵌入向量进行建模,获得预测结果。
在一些实施方式中,当用户仅采用语音的形式答复虚拟医生的问题时,数据处理模块通过对语音信号进行端点检测、分帧、预加重等预处理,然后采用深度神经网络模型对预处理后的语音进行预测,获得预测结果。
在一些实施方式中,当用户仅采用文本的形式答复虚拟医生的问题时,数据处理模块将获取的文本信息转换为文本嵌入向量,采用深度神经网络模型对文本嵌入向量进行预测,获得预测结果。
可选的,利用预设的标准化问题与目标用户进行交互之前,还包括:获取所述目标用户的PHQ9问卷结果。
可选的,根据预测结果判定所述目标用户是否为抑郁症患者,包括:
根据所述预测结果和所述PHQ9问卷结果判定所述目标用户是否为抑郁症患者。
在一些具体的实施方式中,本实施例中还可以进一步设置PHQ9问卷。例如在用户登录完成后,采用问卷答复的方式采集目标用户的PHQ9问卷结果。
可选的,根据所述预测结果和所述PHQ9问卷结果判定所述目标用户为抑郁症患者,包括:
根据预设权重值对所述预测结果和所述PHQ9问卷结果进行加权处理;
根据加权处理结果判定所述目标用户是否为抑郁症患者。
在一些具体的实施方式中,根据前述的初步预测结果和PHQ9问卷结果进行判定,一种具体的判定方式可以是,为PHQ9问卷结果和神经网络预测结果分别设置对应的权重值,由此可以根据具体的处理结果获得最终的预测值或者预测百分比,在获得的预测值超过预设阈值的情况下,则认为目标用户为抑郁症患者。当然在加权处理之前还可以对所述PHQ9问卷结果和神经网络预测结果进行归一化处理,这样更加便于获得易于处理的数据。
可选的,根据预测结果判定所述目标用户是否为抑郁症患者之后;根据判定结果进行可视化展示。
在一些实施方式中,在确定目标用户属于抑郁症患者之后,还可以进一步根据判定结果进行可视化展示,例如向患者展示抑郁症的发病原因、抑郁症的干预措施等相关的科普信息,便于用户了解抑郁症的相关知识,当然也可以根据抑郁症的病情严重程度向患者发送对应的诊疗手段等。
在另一些实施方式中,对于中间过程产生的数据进行存储,例如在用户登录之后,分类存储对应的用户基本信息,以及在用户交互过程中的问卷数据和问诊信息等。在存储容量达到限值之后,可以按照存储时间顺序,删除在前的历史用户数据,保留较新的用户数据。
本发明提供一种能在线记录抑郁症患者人员基本信息、问诊信息,且可通过用户的问诊信息,辅助判断用户是否患有抑郁症的辅助问诊系统。该系统可以减轻医生的工作量,减轻就医的盲目性,提供医生的工作效率。
实施例二
本发明第二实施例提供一种结合语音及文本转录分析的抑郁症辅助诊断系统,如图2所示,包括:
文本问诊模块,用于利用标准化问题对应的语音问题与目标用户进行交互,确定对应的问诊信息;
数据处理模块,用于基于所述问诊信息通过预设算法进行预测;
判定模块,用于根据预测结果判定所述目标用户是否为抑郁症患者。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的结合语音及文本转录分析的抑郁症辅助诊断方法的步骤。
在一些可选的实施方式中,所述计算机程序被处理器执行时实现:
利用标准化问题对应的语音问题与目标用户进行交互,确定对应的问诊信息;
基于所述问诊信息通过预设算法进行预测;
根据预测结果判定所述目标用户是否为抑郁症患者。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (10)
1.一种结合语音及文本转录分析的抑郁症辅助诊断方法,其特征在于,包括:
利用标准化问题对应的语音问题与目标用户进行交互,确定对应的问诊信息;
基于所述问诊信息通过预设算法进行预测;
根据预测结果判定所述目标用户是否为抑郁症患者。
2.如权利要求1所述的结合语音及文本转录分析的抑郁症辅助诊断方法,其特征在于,利用标准化问题对应的语音问题与目标用户进行交互之前,还包括:
验证所述目标用户的登录信息;
在验证通过后,对所述目标用户对应的基本信息进行分类存储。
3.如权利要求1所述的结合语音及文本转录分析的抑郁症辅助诊断方法,其特征在于,利用标准化问题对应的语音问题与目标用户进行交互,包括:
根据数据库中的标准化问题进行语音合成,获得不同虚拟医生对应的语言问题;
基于目标用户选取的所述虚拟医生对应的语音问题向所述目标用户进行提问;
获取所述目标用户在答复提问过程中的问诊信息,所述问诊信息包括所述目标用户输入的文本答复信息,和/或语音答复信息。
4.如权利要求3所述的结合语音及文本转录分析的抑郁症辅助诊断方法,其特征在于,若所述问诊信息为文本答复信息的情况下,基于所述问诊信息通过预设算法进行预测,包括:
将所述文本答复信息转化为文本嵌入向量;
利用预先训练好的深度神经网络模型对所述文本嵌入向量进行预测。
5.如权利要求3所述的结合语音及文本转录分析的抑郁症辅助诊断方法,其特征在于,若所述问诊信息为语音答复信息的情况下,基于所述问诊信息通过预设算法进行预测,包括:
对所述语音答复信息进行端点检测,确定语音分包;
在对所述语音分包进行分帧和预加重处理之后,通过预先训练好的深度神经网络模型进行预测。
6.如权利要求1-5任一项所述的结合语音及文本转录分析的抑郁症辅助诊断方法,其特征在于,利用预设的标准化问题与目标用户进行交互之前,还包括:获取所述目标用户的PHQ9问卷结果。
7.如权利要求6所述的结合语音及文本转录分析的抑郁症辅助诊断方法,其特征在于,根据预测结果判定所述目标用户是否为抑郁症患者,包括:
根据所述预测结果和所述PHQ9问卷结果判定所述目标用户是否为抑郁症患者。
8.如权利要求7所述的结合语音及文本转录分析的抑郁症辅助诊断方法,其特征在于,根据所述预测结果和所述PHQ9问卷结果判定所述目标用户是否为抑郁症患者,包括:
根据预设权重值对所述预测结果和所述PHQ9问卷结果进行加权处理;
根据加权处理结果判定所述目标用户是否为抑郁症患者。
9.一种结合语音及文本转录分析的抑郁症辅助诊断系统,其特征在于,包括:
语音问诊模块,用于利用标准化问题对应的语音问题与目标用户进行交互,确定对应的问诊信息;
数据处理模块,用于基于所述问诊信息通过预设算法进行预测;
判定模块,用于根据预测结果判定所述目标用户是否为抑郁症患者。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的结合语音及文本转录分析的抑郁症辅助诊断方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011466471.3A CN112614584A (zh) | 2020-12-14 | 2020-12-14 | 语音及文本转录的抑郁症辅助诊断方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011466471.3A CN112614584A (zh) | 2020-12-14 | 2020-12-14 | 语音及文本转录的抑郁症辅助诊断方法、系统及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112614584A true CN112614584A (zh) | 2021-04-06 |
Family
ID=75234027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011466471.3A Pending CN112614584A (zh) | 2020-12-14 | 2020-12-14 | 语音及文本转录的抑郁症辅助诊断方法、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112614584A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113782200A (zh) * | 2021-08-19 | 2021-12-10 | 刘欣 | 心理风险筛查测定方法、装置及计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130138457A1 (en) * | 2011-11-28 | 2013-05-30 | Peter Ragusa | Electronic health record system and method for patient encounter transcription and documentation |
WO2018098442A1 (en) * | 2016-11-28 | 2018-05-31 | Google Llc | Generating structured text content using speech recognition models |
WO2019159007A1 (en) * | 2018-02-18 | 2019-08-22 | Cardio Holding Bv | A system and method for documenting a patient medical history |
CN110222827A (zh) * | 2019-06-11 | 2019-09-10 | 苏州思必驰信息科技有限公司 | 基于文本的抑郁判定网络模型的训练方法 |
CN111329494A (zh) * | 2020-02-28 | 2020-06-26 | 首都医科大学 | 基于语音关键词检索和语音情绪识别的抑郁症检测方法 |
CN111430033A (zh) * | 2020-03-24 | 2020-07-17 | 浙江连信科技有限公司 | 基于人机交互的心理评估方法及电子设备 |
CN111540440A (zh) * | 2020-04-23 | 2020-08-14 | 深圳市镜象科技有限公司 | 基于人工智能的心理体检方法、装置、设备和介质 |
-
2020
- 2020-12-14 CN CN202011466471.3A patent/CN112614584A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130138457A1 (en) * | 2011-11-28 | 2013-05-30 | Peter Ragusa | Electronic health record system and method for patient encounter transcription and documentation |
WO2018098442A1 (en) * | 2016-11-28 | 2018-05-31 | Google Llc | Generating structured text content using speech recognition models |
WO2019159007A1 (en) * | 2018-02-18 | 2019-08-22 | Cardio Holding Bv | A system and method for documenting a patient medical history |
CN110222827A (zh) * | 2019-06-11 | 2019-09-10 | 苏州思必驰信息科技有限公司 | 基于文本的抑郁判定网络模型的训练方法 |
CN111329494A (zh) * | 2020-02-28 | 2020-06-26 | 首都医科大学 | 基于语音关键词检索和语音情绪识别的抑郁症检测方法 |
CN111430033A (zh) * | 2020-03-24 | 2020-07-17 | 浙江连信科技有限公司 | 基于人机交互的心理评估方法及电子设备 |
CN111540440A (zh) * | 2020-04-23 | 2020-08-14 | 深圳市镜象科技有限公司 | 基于人工智能的心理体检方法、装置、设备和介质 |
Non-Patent Citations (1)
Title |
---|
潘玮等: "基于语音的抑郁症识别", 《科学通报》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113782200A (zh) * | 2021-08-19 | 2021-12-10 | 刘欣 | 心理风险筛查测定方法、装置及计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102237539B1 (ko) | 음성 대화 분석을 기반으로 하는 치매 및 인지 능력 판단 시스템 및 방법 | |
CN112818892B (zh) | 基于时间卷积神经网络的多模态抑郁症检测方法及系统 | |
EP3655947B1 (en) | Speaker diarization using speaker embedding(s) and trained generative model | |
CN107818798B (zh) | 客服服务质量评价方法、装置、设备及存储介质 | |
CN105931644B (zh) | 一种语音识别方法及移动终端 | |
US9300672B2 (en) | Managing user access to query results | |
CN113724695B (zh) | 基于人工智能的电子病历生成方法、装置、设备及介质 | |
CN111329494B (zh) | 抑郁症参考数据的获取方法及装置 | |
US9652999B2 (en) | Computer-implemented systems and methods for estimating word accuracy for automatic speech recognition | |
CN110782962A (zh) | 听力语言康复装置、方法、电子设备及存储介质 | |
WO2019080502A1 (zh) | 利用语音进行疾病预测的方法、应用服务器和计算机可读存储介质 | |
US11322172B2 (en) | Computer-generated feedback of user speech traits meeting subjective criteria | |
JP2004037721A (ja) | 音声応答システム、音声応答プログラム及びそのための記憶媒体 | |
CN110223134B (zh) | 基于语音识别的产品推荐方法及相关设备 | |
CN112614584A (zh) | 语音及文本转录的抑郁症辅助诊断方法、系统及介质 | |
CN113593565B (zh) | 一种智能家庭设备管控方法和系统 | |
US10446138B2 (en) | System and method for assessing audio files for transcription services | |
CN112087726B (zh) | 彩铃识别的方法及系统、电子设备及存储介质 | |
Debnath et al. | Study of speech enabled healthcare technology | |
CN112582060A (zh) | 一种面向抑郁症初筛的多媒体辅助问诊系统 | |
CN112582061A (zh) | 基于文本问答的抑郁症辅助筛查方法、系统及存储介质 | |
KR102306953B1 (ko) | 음성인식 기반 진료 지원 방법 | |
CN112101046A (zh) | 一种基于通话行为的会话分析方法、装置和系统 | |
CN113781998B (zh) | 基于方言纠正模型的语音识别方法、装置、设备及介质 | |
CN112885371B (zh) | 音频脱敏的方法、装置、电子设备以及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210406 |
|
RJ01 | Rejection of invention patent application after publication |