CN106725532B - 基于语音特征与机器学习的抑郁症自动评估系统和方法 - Google Patents
基于语音特征与机器学习的抑郁症自动评估系统和方法 Download PDFInfo
- Publication number
- CN106725532B CN106725532B CN201611147549.9A CN201611147549A CN106725532B CN 106725532 B CN106725532 B CN 106725532B CN 201611147549 A CN201611147549 A CN 201611147549A CN 106725532 B CN106725532 B CN 106725532B
- Authority
- CN
- China
- Prior art keywords
- feature
- voice
- depression
- validity
- grader
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/16—Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
- A61B5/165—Evaluating the state of mind, e.g. depression, anxiety
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Psychiatry (AREA)
- Engineering & Computer Science (AREA)
- Educational Technology (AREA)
- Biomedical Technology (AREA)
- Hospice & Palliative Care (AREA)
- Psychology (AREA)
- Social Psychology (AREA)
- Physics & Mathematics (AREA)
- Child & Adolescent Psychology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Developmental Disabilities (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提供一种基于语音特征与机器学习的抑郁症自动评估系统和方法,基于语音处理、特征提取、机器学习技术,寻找语音特征与抑郁症之间的联系,为抑郁症的临床诊断提供客观参考依据。本发明的系统包括(a)语音采集录音模块,用于记录被试者在不同情绪语料刺激下的语音信息;(b)语音特征计算模块,用于计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用于确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,依据机器学习模块确定的有效特征提取方式以及训练的分类器分类模式,将被试者有效语音特征进行抑郁程度分类。
Description
技术领域
本发明涉及计算机辅助医疗诊断技术领域,特别是涉及一种基于语音特征与机器学习的抑郁症自动评估系统和方法。
背景技术
抑郁症是一种普遍的心理疾病,影响着全世界约3.5亿人,世界卫生组织(WorldHealth Organization,WHO)预测到2020年抑郁症将成为全球第二大主要病因,因此找到一种有效的评估抑郁症的方法很有必要。目前,抑郁症的诊断和疗效评估缺少客观的测量方法和工具,主要依靠家属供史、患者自述以及临床量表等主观评估方法,从而造成早期情感障碍识别困难,患者常常因此失去最佳治疗时机。
随着语音信号分析与处理技术的发展,尤其是线性预测技术在语音处理中的应用,基音频率、共振峰、线性预测系数、线性预测倒谱系数、Mel频率倒谱系数等语音特征参数被证实与情感(尤其是抑郁症状)密切相关,因此,可以通过对用户语音信号特征的分析,为抑郁症的临床诊断提供一种基于被试实际表现的客观参考。
发明内容
本发明提供一种基于语音特征与机器学习的抑郁症自动评估系统和方法,基于语音处理、特征提取、机器学习技术,通过寻找语音特征与抑郁症之间的联系,从而实现以非侵入式的方式客观评估被试是否抑郁的目的。
本发明的技术方案是:
1.一种基于语音特征与机器学习的抑郁症自动评估系统,其特征在于,包括(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息;(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。
2.所述语音采集录音模块包括录音设备,采集设备有电脑控制端、噪声计、监听耳机、音箱、麦克风、声卡、防喷罩、话筒支架;所述监听耳机、音箱、麦克风、声卡均连接至电脑;录音设备采用NEUMANN TLM102麦克风和采样率为44.1kHz、数据长度为24位的RMEFIREFACE UCX声卡;采集的录音数据以.WAV格式保存。
3.所述语音特征计算模块包含预处理模块,所述预处理模块包括依次连接的预加重、降噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块采用k值为0.97的预加重滤波器,所述滤波模块采用通带频率为60~4500Hz的滤波器。
4.所述机器学习模块包括分类器,使用的分类器模型为支持向量机(SupportVector Machine,SVM);SVM使用LIBSVM来实现,选取的核函数为RBF(Radial BasisFunction)。
5.所述语音数据库模块运行在本系统的计算机上,用Microsoft SQL Server实现;包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据库只保存经过医生诊断的被试数据。
6.一种基于语音特征与机器学习的抑郁症自动评估方法,其特征在于,包括以下步骤:
1)语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同时,使用录音设备记录被试者的语音信息;
2)语音特征计算获取语音特征集:语音样本通过预处理后,计算语音的声学特征;将经过医生诊断的语音声学特征,包含诊断结果一起存入语音数据库;没有经过医生诊断的被试语音样本则进入步骤4);
3)依据存入语音数据库的语音声学特征进行机器学习,确定语音有效特征提取方式,训练用于自动评估的分类器;
4)提取有效特征并进行分类得出评估结论:提取出被试语音样本在评估抑郁症过程中最有效的语音特征,即有效特征;并通过训练好的分类器对提取的有效特征进行分类,实现依据输入的语音样本自动评估被试者的抑郁程度。
7.所述步骤1)中,包括以下步骤:首先测量现场噪音,排除噪声源,在噪声符合要求之后,开始语音采集;语音采集过程中分别施以不同的情绪语料刺激,包括“语音问答”、“文本朗读”、“图片描述”三个不同的实验情境。
8.所述步骤2)中,包括语音声学特征计算的步骤:第一步,将语音切分为帧,在单个语音帧中计算出局部声学特征;第二步,在多个语音帧之间,计算出统计学特征;第三步,若是已经过医生诊断的被试,将该被试的所有语音特征和人工诊断结果存入语音数据库;所述的特征提取算法包括但不限于:共振峰计算、有声段检测、MFCC、TEO、HNR、SNR、PPQ、APQ。
9.所述步骤3)中,包括特征有效性分析与分类器训练的步骤:第一步,使用语音样本库中的已有人工诊断结论的数据,先采用最小冗余最大相关的方式,去掉明显不相关的特征,从语音声学特征计算出的特征集中初步筛选出一个特征的子集,作为待选特征集;第二步,在待选特征集中,排除一个特征后,用剩余特征训练分类器,若分类率明显降低,则说明该特征有效,并重复第二步;多次循环,对待选特征集进行至少一次的遍历之后,保留下来的特征,即构成有效特征集;有效特征集包含的特征即为有效特征;通过所述步骤最终训练出的分类器,即为用于自动评估时使用的分类器。
10.所述步骤4)中,包括自动诊断的步骤:第一步,将没有人工诊断结果的被试语音样本,按照步骤3)确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输入由步骤3)训练好的分类器,由分类器进行抑郁程度的分类;所述分类是指以两种标签:正常、抑郁进行分类。
本发明的技术效果:
本发明提供的一种基于语音特征与机器学习的抑郁症自动评估系统和方法,是结合了语音信号处理、特征计算与提取、模式识别的,具有一定学习能力的抑郁症自动筛查系统和方法。基于语音处理、特征提取、机器学习等技术,通过对用户语音信号特征的分析,通过语音采集、特征计算,并结合医生的诊断结论,抑郁症量表评分之后,能够通过寻找语音特征与抑郁症之间的联系,通过非侵入的方式,实现自动评估抑郁症的功能,可以为临床诊断提供基于客观标准的参考。
附图说明
图1是本发明的系统总体框架示意图。
图2是本发明的方法流程示意图。
图3是语音采集流程示意图。
图4是语音预处理流程示意图。
图5是语音声学特征计算和特征提取流程示意图。
图6是特征有效性分析与分类器训练流程示意图。
具体实施方式
以下结合附图对本发明的实施例作进一步详细说明。
图1是本发明的系统总体框架示意图。一种基于语音特征与机器学习的抑郁症自动评估系统,包括(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息;(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。
其中,语音特征计算模块包含预处理模块,预处理模块包括依次连接的预加重、降噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块采用k值为0.97的预加重滤波器,所述滤波模块采用通带频率为60~4500Hz的滤波器。语音采集录音模块的硬件部分包括录音设备,采集设备有电脑控制端、噪声计、监听耳机、音箱、麦克风、声卡、防喷罩、话筒支架;所述监听耳机、音箱、麦克风、声卡均连接至电脑;录音设备采用NEUMANN TLM102麦克风和采样率为44.1kHz、数据长度为24位的RME FIREFACE UCX声卡;采集的录音数据以.WAV格式保存。机器学习模块包含一个分类器,该分类器在本系统中的作用为,通过分类正确率对样本有效性做出检验,以及在自动评估模块中,对抑郁症做出诊断。本系统中采用了一种已被广泛应用的分类器:支持向量机(Support Vector Machine,SVM),使用LIBSVM来实现,选取的核函数为RBF(Radial Basis Function)。训练和使用方式在下面说明,此处不再赘述。语音数据库模块运行在本系统的计算机上,用Microsoft SQLServer实现;包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据库只保存经过医生诊断的被试数据。
图2是本发明的方法流程示意图。一种基于语音特征与机器学习的抑郁症自动评估方法,包括以下步骤:
1)语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同时,使用录音设备记录被试者的语音信息;
2)语音特征计算获取语音特征集:语音样本通过预处理后,计算语音的声学特征;将经过医生诊断的语音声学特征,包含诊断结果一起存入语音数据库;没有经过医生诊断的被试语音样本则进入步骤4);
3)依据语音数据库的语音声学特征进行机器学习,确定语音有效特征提取方式,训练用于自动评估的分类器;
4)提取有效特征并进行分类得出评估结论:提取出被试语音样本在评估抑郁症过程中最有效的语音特征,即有效特征;并通过训练好的分类器对提取的有效特征进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。
图3是语音采集流程示意图。该部分作用在于:为实验采集初始数据,收集用于后续算法需要的语音文件。在获取算法训练所需数据,以及对待诊断患者进行诊断时,该部分的硬件构成、操作步骤应尽量保持一致。
首先由主持测试的人员测量现场噪音,若现场噪音在60dB以下,则须排除噪声源,或等待噪声降低至55dB以下之后,再开始语音采集。
语音采集过程分为“语音问答”、“文本朗读”、“图片描述”三个模块,分别对应不同的实验情境,实验采集时按照被试的编号规则显现情绪材料。问题的语音播放完,“叮”声后自动开始录音。被试回答完毕,点击“结束回答”按钮停止录音。此时按钮变为“继续”,点击“继续”按钮进入保存界面。如此反复,直到语音文件全部录制完成。
本过程中各模块的内容为:
语音问答:包含9个问题,其中包含正向、中性、负向三种情绪的问题各3个。由主试提出问题之后,对被试的回答进行录音。
文本朗读:包含3段文字,分别带有正向、中性、负向三种情绪。主试发出开始提示后,被试朗读文本。
图片描述:包含6张图片,其中包含正向、中性、负向三种情绪的图片各2张,主试发出开始提示后,由被试描述图片内容。
语音样本保存:每一位被试的所有录音文件将保存在与被试编号相同的文件夹下。保存过程中不带有个人信息,仅保留用以区分的编号以及诊断结论(正常、抑郁或未经诊断)。其中带有诊断结论的语音样本经特征提取后,存入语音数据库。
对采集的语音信息进行语音特征提取与选择,是实现抑郁诊断的重要环节,在这之前,首先需要对采集的语音信息进行预处理。
图4是语音预处理流程示意图。预处理是本系统中算法的第一部分,对采集的语音信号依次进行预加重、降噪和滤波。该部分的作用在于:提高信号的信噪比,增强某些频段的信号以便提取特征,提高后续特征计算部分的稳定性与准确性等。该部分中包含的操作:
预加重:语音信号存在低频信号能量高于高频信号能量的特点,为更好地对语音信号进行分析,须适当加强高频部分的能量。本系统中采用了k值为0.97的预加重滤波器。
降噪:因现场存在的噪音不可能完全消除,以及录音设备本身电路中可能存在噪音等原因,必须对采集的音频信号进行滤波降噪后,再进行处理。该操作能够提高后续的特征提取等算法的稳定性与准确性,在本系统中采用的降噪方式为:将录音中无声段作为噪声样本,并以此为依据来去除录音中的背景噪声。
滤波:通常认为,人类语音的能量集中在200Hz~4000Hz的频段中。因此需要设计一个带通滤波器,用以保留有效信息。本系统中采用了通带频率为60~4500Hz的滤波器来完成这一处理。
对采集的语音信息预处理后,进行特征提取还包括进行语音声学特征计算的步骤。图5是语音声学特征计算和特征提取流程示意图。
由于语音原始信号数据量庞大,不可能直接输入分类器进行训练、分类等操作,必须对语音信号进行特征提取,在保留语音样本主要信息的同时降低数据量,才能进行后续处理。语音的特征可以分为声学特征和语义特征,但本系统在设计时,希望能通过语音提取出与语言无关的、能有效区分抑郁的普适性特征,故本系统只对声学特征进行了提取,而没有进行语义分析的工作。同样的,声学特征也可以分为两个大类:局部特征(Low-levelDescriptor,LLD)与统计学特征。在计算局部特征时,通常采用将语音切分为帧的方式,对单个语音帧进行计算。而统计学特征通常是在多个语音帧之间进行计算。
切分帧:为尽量保证特征计算的精度与时间分辨率,本系统采用的切分方式为,以10毫秒为切分步长,每次切分出一段时间长度为25毫秒的语音片段作为语音帧。切分采用的窗函数为hamming窗。
特征计算:本部分中,计算出总计1753个局部特征和统计学特征,采用的特征计算方法包含但不限于:共振峰计算、有声段检测、MFCC、TEO、HNR、SNR、PPQ、APQ等。由于采用的特征提取算法及特征数目太多,此处不再详述。
考虑到某些语音特征与抑郁症并无明显相关性,而这些特征的存在可能会干扰到最终对于抑郁症的诊断,因此,在提取了语音信号的大量特征后,还应根据语音样本所对应的诊断结果,对每个特征与抑郁症诊断结果之间进行相关性分析,以保证最终保留下来的特征对于抑郁症的诊断是最有效的。这一步骤的作用在于:去除不相关的、冗余或无用的特征;减少数据量,提高系统运行效率。同时,筛选出与抑郁症相关的有效特征,对抑郁症的相关研究工作也有一定的促进作用。
步骤3)中,包括特征有效性分析与分类器训练的步骤,图6是机器学习模块中的特征有效性分析与分类器训练流程示意图。有效特征提取工作分为两步:第一步,先采用最小冗余最大相关(minimal-redundancy-maximal-relevance,mRMR)的方式,去掉明显不相关的特征,从语音数据库中保存的语音特征中初步筛选出一个特征的子集,作为待选特征集。第二步,在待选特征集中,排除一个特征后,用特征子集去训练一个分类器,计算出该特征子集的分类率。若分类率明显降低,则说明该特征有效,应作为有效特征;若分类率不改变或升高,说明该特征为无效特征。多次重复第二步操作,对待选特征集进行至少一次的遍历之后,保留下来的特征,即构成有效特征集。
预筛选:采用mRMR方法,来初步提取出一个特征子集,作为有效特征集的待选集合。该方法具有速度快的优点,面对大量特征,能够很快筛选出与分类标签相关性较高且冗余度较小的有效特征。因此,将该方法作为特征提取的前置步骤。
精确筛选:图6中除去预筛选之外的所有部分均为精确筛选的步骤。该步骤采取的是序列前向浮动选择(Sequential Forward Floating Selection,SFFS),即根据特征集与对应标签,训练一个分类器,并采用交叉排除验证(Leave-One-Out Cross-Validation,LOOCV)策略来验证每个特征与分类率之间的相关性。其实现方式为:使用待选特征集中的特征,训练一个分类器,并验证该分类器的分类率。然后,从待选特征集中排除一个特征,若分类率下降,则说明该特征是有效的特征,应将其作为一个有效特征,予以保留;若分类率上升或不改变,说明该特征为无效或冗余特征,将其从待选特征集中排除。最后,循环上述实现方式,直到满足下列两个条件:从待选特征集中排除任何一个特征,都会导致分类率下降;向待选特征集中添加任何一个特征,分类率都不会有明显提升。此时的待选特征集,即可视为最终筛选出的有效特征集。有效特征集中包含的特征,即为有效特征。在本系统用于抑郁症的诊断时,只需提取有效特征即可。而用于诊断时的分类器,也是本过程最后所训练得到的分类器。
最后,步骤4)中的自动诊断的步骤具体包括:第一步,将没有人工诊断结果的被试语音样本,按照步骤3)确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输入由步骤3)训练好的分类器,由分类器进行抑郁程度的分类;具体分类是以两种标签:正常、抑郁进行了分类。
本文虽然已经给出了本发明的一些实施例,但是本领域的技术人员应当理解,在不脱离本发明精神的情况下,可以对本文的实施例进行改变。上述实施例只是示例性的,不应以本文的实施例作为本发明权利范围的限定。
Claims (2)
1.一种基于语音特征与机器学习的抑郁症自动评估系统,其特征在于,包括
(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息;所述语音采集分为“语音问答”、“文本朗读”、“图片描述”三个模块,分别包含正向、中性、负向三种情绪的问题、文本和图片;
(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;所述语音特征计算模块包含预处理模块,所述预处理模块包括依次连接的预加重、降噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块采用k值为0.97的预加重滤波器,所述滤波模块采用通带频率为60~4500Hz的滤波器;所述语音的声学特征包括局部特征与统计学特征,计算局部特征时,将语音切分为帧,对单个语音帧进行计算;统计学特征是在多个语音帧之间进行计算;
(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;所述语音数据库模块运行在本系统的计算机上,用Microsoft SQL Server实现;包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据库只保存经过医生诊断的被试数据;
(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;所述机器学习模块包括分类器,使用的分类器模型为支持向量机;支持向量机使用LIB支持向量机来实现,选取的核函数为Radial Basis Function;
所述确定的有效特征提取方式是指:第一步,先采用最小冗余最大相关的方式,去掉明显不相关的特征,从语音数据库中保存的语音特征中初步筛选出一个特征子集,作为待选特征集;第二步,在待选特征集中,排除一个特征后,用特征子集去训练分类器,计算出该特征子集的分类率,若分类率明显降低,则说明该特征有效,应作为有效特征;若分类率不改变或升高,说明该特征为无效特征;多次重复第二步操作,对待选特征集进行至少一次的遍历之后,保留下来的特征,即构成有效特征集;
(e)自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度;具体包括:第一步,将没有人工诊断结果的被试语音样本,按照机器学习模块确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输入由机器学习模块训练好的分类器,由分类器进行抑郁程度的分类;
所述基于语音特征与机器学习的抑郁症自动评估系统的工作步骤为:
1)语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同时,使用录音设备记录被试者的语音信息;
2)语音特征计算获取语音特征集:语音样本通过预处理后,计算语音的声学特征;将经过医生诊断的语音声学特征,包含诊断结果一起存入语音数据库;没有经过医生诊断的被试语音样本则进入步骤4);
3)依据存入语音数据库的语音声学特征进行机器学习,确定语音有效特征提取方式,训练用于自动评估的分类器;
4)提取有效特征并进行分类得出评估结论:提取出被试语音样本在评估抑郁症过程中最有效的语音特征,即有效特征;并通过训练好的分类器对提取的有效特征进行分类,实现依据输入的语音样本自动评估被试者的抑郁程度;
其中,所述步骤1)中,包括以下步骤:首先测量现场噪音,排除噪声源,在噪声符合要求之后,开始语音采集;语音采集过程中分别施以不同的情绪语料刺激,包括“语音问答”、“文本朗读”、“图片描述”三个不同的实验情境;
所述步骤2)中,包括语音声学特征计算的步骤:第一步,将语音切分为帧,在单个语音帧中计算出局部声学特征;第二步,在多个语音帧之间,计算出统计学特征;第三步,若是已经过医生诊断的被试,将该被试的所有语音特征和人工诊断结果存入语音数据库;所述的特征提取算法包括但不限于:共振峰计算、有声段检测、MFCC、TEO、HNR、SNR、PPQ、APQ;
所述步骤3)中,包括特征有效性分析与分类器训练的步骤:第一步,使用语音样本库中的已有人工诊断结论的数据,先采用最小冗余最大相关的方式,去掉明显不相关的特征,从语音声学特征计算出的特征集中初步筛选出一个特征的子集,作为待选特征集;第二步,在待选特征集中,排除一个特征后,用剩余特征训练分类器,若分类率明显降低,则说明该特征有效,并重复第二步;多次循环,对待选特征集进行至少一次的遍历之后,保留下来的特征,即构成有效特征集;有效特征集包含的特征即为有效特征;通过所述步骤最终训练出的分类器,即为用于自动评估时使用的分类器;
所述步骤4)中,包括自动诊断的步骤:第一步,将没有人工诊断结果的被试语音样本,按照步骤3)确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输入由步骤3)训练好的分类器,由分类器进行抑郁程度的分类;所述分类是指以两种标签:正常、抑郁进行分类。
2.根据权利要求1所述的系统,其特征在于,所述语音采集录音模块包括采集设备、录音设备,采集设备有电脑控制端、噪声计、监听耳机、音箱、麦克风、声卡、防喷罩、话筒支架;所述监听耳机、音箱、麦克风、声卡均连接至电脑;录音设备采用NEUMANN TLM102麦克 风和采样率为44.1kHz、数据长度为24位的RME FIREFACE UCX声卡;采集的录音数据以.WAV格式保存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611147549.9A CN106725532B (zh) | 2016-12-13 | 2016-12-13 | 基于语音特征与机器学习的抑郁症自动评估系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611147549.9A CN106725532B (zh) | 2016-12-13 | 2016-12-13 | 基于语音特征与机器学习的抑郁症自动评估系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106725532A CN106725532A (zh) | 2017-05-31 |
CN106725532B true CN106725532B (zh) | 2018-04-24 |
Family
ID=58876597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611147549.9A Active CN106725532B (zh) | 2016-12-13 | 2016-12-13 | 基于语音特征与机器学习的抑郁症自动评估系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106725532B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3957244A1 (en) * | 2020-08-20 | 2022-02-23 | MINDPAX s.r.o. | Method for detection of a relapse into a depression or mania state based on activity data and/or data obtained by questioning the patient |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109394203A (zh) * | 2017-08-18 | 2019-03-01 | 广州市惠爱医院 | 精神障碍康复期情绪监测与干预方法 |
JP6722845B2 (ja) * | 2017-10-03 | 2020-07-15 | 株式会社国際電気通信基礎技術研究所 | 判別装置、うつ症状の判別方法、うつ症状のレベルの判定方法、うつ病患者の層別化方法、うつ症状の治療効果の判定方法及び脳活動訓練装置 |
CN108874879A (zh) * | 2018-05-04 | 2018-11-23 | 平安科技(深圳)有限公司 | 特征筛选方法、装置、计算机设备和存储介质 |
CN108888281A (zh) * | 2018-08-16 | 2018-11-27 | 华南理工大学 | 精神状态评估方法、设备及系统 |
WO2020044332A1 (en) * | 2018-08-26 | 2020-03-05 | Beyond Verbal Communication Ltd | System and method for measurement of vocal biomarkers of vitality and biological aging |
US11887622B2 (en) | 2018-09-14 | 2024-01-30 | United States Department Of Veteran Affairs | Mental health diagnostics using audio data |
CN109448820A (zh) * | 2018-10-10 | 2019-03-08 | 上海整合医学研究院有限公司 | 一种可穿戴的精神疾病语音辅助诊疗设备 |
CN109480864A (zh) * | 2018-10-26 | 2019-03-19 | 首都医科大学附属北京安定医院 | 一种基于神经认知功能与机器学习的精神分裂症自动评估系统 |
CN109599129B (zh) * | 2018-11-13 | 2021-09-14 | 杭州电子科技大学 | 基于注意力机制和卷积神经网络的语音抑郁症识别系统 |
CN109350051B (zh) * | 2018-11-28 | 2023-12-29 | 华南理工大学 | 用于精神状态评估与调节的头部可穿戴设备及其工作方法 |
CN109584861A (zh) * | 2018-12-03 | 2019-04-05 | 江苏师范大学 | 基于深度学习的阿尔茨海默症语音信号的筛查方法 |
CN109841231B (zh) * | 2018-12-29 | 2020-09-04 | 深圳先进技术研究院 | 一种针对汉语普通话的早期ad言语辅助筛查系统 |
CN110123343B (zh) * | 2019-04-19 | 2023-10-03 | 西北师范大学 | 基于语音分析的抑郁症检测设备 |
CN110532387A (zh) * | 2019-08-14 | 2019-12-03 | 成都中科云集信息技术有限公司 | 一种基于开放性问答文本的抑郁症辅助检测方法 |
CN110675953B (zh) * | 2019-09-23 | 2023-06-30 | 湖南检信智能科技有限公司 | 利用人工智能和大数据筛查识别精神病患者的系统 |
CN111329494B (zh) * | 2020-02-28 | 2022-10-28 | 首都医科大学 | 抑郁症参考数据的获取方法及装置 |
CN111462841B (zh) * | 2020-03-12 | 2023-06-20 | 华南理工大学 | 一种基于知识图谱的抑郁症智能诊断装置及系统 |
CN111462773B (zh) * | 2020-03-26 | 2023-05-05 | 心图熵动科技(苏州)有限责任公司 | 一种自杀风险预测模型的生成方法和预测系统 |
CN111415680B (zh) * | 2020-03-26 | 2023-05-23 | 心图熵动科技(苏州)有限责任公司 | 一种基于语音的焦虑预测模型的生成方法和焦虑预测系统 |
CN111603191B (zh) * | 2020-05-29 | 2023-10-20 | 上海联影医疗科技股份有限公司 | 医学扫描中的语音降噪方法、装置和计算机设备 |
CN112006697B (zh) * | 2020-06-02 | 2022-11-01 | 东南大学 | 一种基于语音信号的梯度提升决策树抑郁程度识别系统 |
CN113012720B (zh) * | 2021-02-10 | 2023-06-16 | 杭州医典智能科技有限公司 | 谱减法降噪下多语音特征融合的抑郁症检测方法 |
CN113633287A (zh) * | 2021-07-08 | 2021-11-12 | 上海市精神卫生中心(上海市心理咨询培训中心) | 一种基于语音分析的抑郁症识别方法、系统和设备 |
CN113555004A (zh) * | 2021-07-15 | 2021-10-26 | 复旦大学 | 基于特征选择与迁移学习的语音抑郁状态识别方法 |
CN114496221B (zh) * | 2022-01-17 | 2024-05-14 | 天津大学 | 基于闭环语音链和深度学习的抑郁症自动诊断系统 |
KR20230115068A (ko) * | 2022-01-26 | 2023-08-02 | 심심이(주) | 음성 분석을 이용하여 우울증을 검사하는 장치 |
KR20230115067A (ko) * | 2022-01-26 | 2023-08-02 | 심심이(주) | 음성 분석을 이용하여 우울증을 검사하는 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105473739A (zh) * | 2013-08-06 | 2016-04-06 | 深圳华大基因科技有限公司 | 结直肠癌生物标志物 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7272559B1 (en) * | 2003-10-02 | 2007-09-18 | Ceie Specs, Inc. | Noninvasive detection of neuro diseases |
AU2010357179A1 (en) * | 2010-07-06 | 2013-02-14 | Rmit University | Emotional and/or psychiatric state detection |
CN102339606B (zh) * | 2011-05-17 | 2014-02-26 | 首都医科大学宣武医院 | 一种抑郁情绪电话自动语音识别筛查系统 |
WO2016028495A1 (en) * | 2014-08-22 | 2016-02-25 | Sri International | Systems for speech-based assessment of a patient's state-of-mind |
CN105943065A (zh) * | 2016-06-29 | 2016-09-21 | 北京工业大学 | 一种基于脑信息学系统化方法学的人体可穿戴生理-心理-行为数据采集与分析系统 |
-
2016
- 2016-12-13 CN CN201611147549.9A patent/CN106725532B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105473739A (zh) * | 2013-08-06 | 2016-04-06 | 深圳华大基因科技有限公司 | 结直肠癌生物标志物 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3957244A1 (en) * | 2020-08-20 | 2022-02-23 | MINDPAX s.r.o. | Method for detection of a relapse into a depression or mania state based on activity data and/or data obtained by questioning the patient |
Also Published As
Publication number | Publication date |
---|---|
CN106725532A (zh) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106725532B (zh) | 基于语音特征与机器学习的抑郁症自动评估系统和方法 | |
Hassan et al. | COVID-19 detection system using recurrent neural networks | |
Alghowinem et al. | Detecting depression: a comparison between spontaneous and read speech | |
Al-Hameed et al. | Simple and robust audio-based detection of biomarkers for Alzheimer’s disease | |
Turan et al. | Monitoring Infant's Emotional Cry in Domestic Environments Using the Capsule Network Architecture. | |
Yildirim | Automatic classification and diagnosis of heart valve diseases using heart sounds with MFCC and proposed deep model | |
CN109346164A (zh) | 一种中医临床案例的自动采集设备及方法 | |
Al-Dhief et al. | Dysphonia detection based on voice signals using naive bayes classifier | |
Hemmerling | Voice pathology distinction using autoassociative neural networks | |
Milani et al. | A real-time application to detect human voice disorders | |
Radha et al. | Automated detection and severity assessment of dysarthria using raw speech | |
AL-Dhief et al. | Voice Pathology Detection Using Decision Tree Classifier | |
Shabber et al. | A review and classification of amyotrophic lateral sclerosis with speech as a biomarker | |
Wisler et al. | The effects of symptom onset location on automatic amyotrophic lateral sclerosis detection using the correlation structure of articulatory movements | |
Fernandes et al. | Voice pathologies: The most comum features and classification tools | |
Kalimuthukumar et al. | Early-detection of Parkinson’s disease by patient voice modulation analysis through MFCC Feature extraction technique | |
Milani et al. | Speech signal analysis of COVID-19 patients via machine learning approach | |
Poornima et al. | Deep Learning based Behavioral Analysis and Exploration of Emotions in ASD Children | |
Aluru et al. | Parkinson’s Disease Detection Using Machine Learning Techniques | |
Gaodida et al. | Aiding speech therapy using audio and video processing | |
Zaabi et al. | A comprehensive review of sound-based modalities for automatic covid-19 detection using deep learning-based techniques | |
KR102683005B1 (ko) | 음성 데이터를 이용한 ai 기반 난청 진단 방법 | |
Ramasubramanian | Diagnosing the Stage of COVID-19 using Machine Learning on Breath Sounds | |
Sriraam et al. | Infant Cry Detection and Pain Scale Assessment: A Pilot Study | |
VINOD et al. | Dysphonic Voice detection using MDVP Parameters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |