CN106725532B - 基于语音特征与机器学习的抑郁症自动评估系统和方法 - Google Patents

基于语音特征与机器学习的抑郁症自动评估系统和方法 Download PDF

Info

Publication number
CN106725532B
CN106725532B CN201611147549.9A CN201611147549A CN106725532B CN 106725532 B CN106725532 B CN 106725532B CN 201611147549 A CN201611147549 A CN 201611147549A CN 106725532 B CN106725532 B CN 106725532B
Authority
CN
China
Prior art keywords
feature
voice
step
depression
validity
Prior art date
Application number
CN201611147549.9A
Other languages
English (en)
Other versions
CN106725532A (zh
Inventor
胡斌
刘振宇
康环宇
Original Assignee
兰州大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 兰州大学 filed Critical 兰州大学
Priority to CN201611147549.9A priority Critical patent/CN106725532B/zh
Publication of CN106725532A publication Critical patent/CN106725532A/zh
Application granted granted Critical
Publication of CN106725532B publication Critical patent/CN106725532B/zh

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Detecting, measuring or recording for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety

Abstract

本发明提供一种基于语音特征与机器学习的抑郁症自动评估系统和方法,基于语音处理、特征提取、机器学习技术,寻找语音特征与抑郁症之间的联系,为抑郁症的临床诊断提供客观参考依据。本发明的系统包括(a)语音采集录音模块,用于记录被试者在不同情绪语料刺激下的语音信息;(b)语音特征计算模块,用于计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用于确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,依据机器学习模块确定的有效特征提取方式以及训练的分类器分类模式,将被试者有效语音特征进行抑郁程度分类。

Description

基于语音特征与机器学习的抑郁症自动评估系统和方法

技术领域

[0001] 本发明涉及计算机辅助医疗诊断技术领域,特别是涉及一种基于语音特征与机器 学习的抑郁症自动评估系统和方法。

背景技术

[0002] 抑郁症是一种普遍的心理疾病,影响着全世界约3.5亿人,世界卫生组织(World Health Organization,WHO)预测到2020年抑郁症将成为全球第二大主要病因,因此找到一 种有效的评估抑郁症的方法很有必要。目前,抑郁症的诊断和疗效评估缺少客观的测量方 法和工具,主要依靠家属供史、患者自述以及临床量表等主观评估方法,从而造成早期情感 障碍识别困难,患者常常因此失去最佳治疗时机。

[0003] 随着语音信号分析与处理技术的发展,尤其是线性预测技术在语音处理中的应 用,基音频率、共振峰、线性预测系数、线性预测倒谱系数、Mel频率倒谱系数等语音特征参 数被证实与情感(尤其是抑郁症状)密切相关,因此,可以通过对用户语音信号特征的分析, 为抑郁症的临床诊断提供一种基于被试实际表现的客观参考。

发明内容

[0004] 本发明提供一种基于语音特征与机器学习的抑郁症自动评估系统和方法,基于语 音处理、特征提取、机器学习技术,通过寻找语音特征与抑郁症之间的联系,从而实现以非 侵入式的方式客观评估被试是否抑郁的目的。

[0005] 本发明的技术方案是:

[0006] 1. 一种基于语音特征与机器学习的抑郁症自动评估系统,其特征在于,包括(a)语 音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息; ⑹语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;(c)语 音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据; (d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效 特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,提取被试者有效语音 特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。

[0007] 2•所述语音采集录音模块包括录音设备,采集设备有电脑控制端、噪声计、监听耳 机、音箱、麦克风、声卡、防喷罩、话筒支架;所述监听耳机、音箱、麦克风、声卡均连接至电 脑;录音设备采用NEUMA丽TLM102麦克风和采样率为44.1kHz、数据长度为24位的RME FIREFACE UCX声卡;采集的录音数据以.WAV格式保存。

[0008] 3 •所述语音特征计算模块包含预处理模块,所述预处理模块包括依次连接的预加 重、降噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块 采用k值为0.97的预加重滤波器,所述滤波模块采用通带频率为60〜4500Hz的滤波器。

[0009] 4.所述机器学习模块包括分类器,使用的分类器模型为支持向量机(Support Vector Machine,SVM);SVM使用LIBSVM来实现,选取的核函数为RBF (Radial Basis Function) 〇

[0010] 5 •所述语音数据库模块运行在本系统的计算机上,用Microsoft SQL Server实 现;包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据库只保存 经过医生诊断的被试数据。

[0011] 6. —种基于语音特征与机器学习的抑郁症自动评估方法,其特征在于,包括以下 步骤:

[0012] 1)语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同 时,使用录音设备记录被试者的语音信息;

[0013] 2)语音特征计算获取语音特征集:语音样本通过预处理后,计算语音的声学特征; 将经过医生诊断的语音声学特征,包含诊断结果一起存入语音数据库;没有经过医生诊断 的被试语音样本则进入步骤4);

[0014] 3)依据存入语音数据库的语音声学特征进行机器学习,确定语音有效特征提取方 式,训练用于自动评估的分类器;

[0015] 4)提取有效特征并进行分类得出评估结论:提取出被试语音样本在评估抑郁症过 程中最有效的语音特征,即有效特征;并通过训练好的分类器对提取的有效特征进行分类, 实现依据输入的语音样本自动评估被试者的抑郁程度。

[0016] 7 •所述步骤1)中,包括以下步骤:首先测量现场噪音,排除噪声源,在噪声符合要 求之后,开始语音采集;语音采集过程中分别施以不同的情绪语料刺激,包括“语音问答”、 “文本朗读”、“图片描述”三个不同的实验情境。

[0017] 8 •所述步骤2)中,包括语音声学特征计算的步骤:第一步,将语音切分为帧,在单 个语音帧中计算出局部声学特征;第二步,在多个语音帧之间,计算出统计学特征;第三步, 若是已经过医生诊断的被试,将该被试的所有语音特征和人工诊断结果存入语音数据库; 所述的特征提取算法包括但不限于:共振峰计算、有声段检测、MFCC、TEO、HNR、SNR、PPQ、 APQ〇

[0018] 9.所述步骤3)中,包括特征有效性分析与分类器训练的步骤:第一步,使用语音样 本库中的已有人工诊断结论的数据,先采用最小冗余最大相关的方式,去掉明显不相关的 特征,从语音声学特征计算出的特征集中初步筛选出一个特征的子集,作为待选特征集;第 二步,在待选特征集中,排除一个特征后,用剩余特征训练分类器,若分类率明显降低,则说 明该特征有效,并重复第二步;多次循环,对待选特征集进行至少一次的遍历之后,保留下 来的特征,即构成有效特征集;有效特征集包含的特征即为有效特征;通过所述步骤最终训 练出的分类器,即为用于自动评估时使用的分类器。

[0019] 10.所述步骤4)中,包括自动诊断的步骤:第一步,将没有人工诊断结果的被试语 音样本,按照步骤3)确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输入 由步骤3)训练好的分类器,由分类器进行抑郁程度的分类;所述分类是指以两种标签:正 常、抑郁进行分类。

[0020]本发明的技术效果:

[0021]本发明提供的一种基于语音特征与机器学习的抑郁症自动评估系统和方法,是结 合了语音信号处理、特征计算与提取、模式识别的,具有一定学习能力的抑郁症自动筛查系 统和方法。基于语音处理、特征提取、机器学习等技术,通过对用户语音信号特征的分析,通 过语音采集、特征计算,并结合医生的诊断结论,抑郁症量表评分之后,能够通过寻找语音 特征与抑郁症之间的联系,通过非侵入的方式,实现自动评估抑郁症的功能,可以为临床诊 断提供基于客观标准的参考。

附图说明

[0022] 图1是本发明的系统总体框架示意图。

[0023] 图2是本发明的方法流程示意图。

[0024] 图3是语音采集流程示意图。

[0025] 图4是语音预处理流程示意图。

[0026]图5是语音声学特征计算和特征提取流程示意图。

[0027]图6是特征有效性分析与分类器训练流程示意图。

具体实施方式

[0028]以下结合附图对本发明的实施例作进一步详细说明。

[0029]图1是本发明的系统总体框架示意图。一种基于语音特征与机器学习的抑郁症自 动评估系统,包括(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时, 记录被试者的语音信息;(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计 算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、 系统分类率的相关数据;(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的 相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模 块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被 试者的抑郁程度。

[0030]其中,语音特征计算模块包含预处理模块,预处理模块包括依次连接的预加重、降 噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块采用k 值为0.97的预加重滤波器,所述滤波模块采用通带频率为60〜4500Hz的滤波器。语音采集 录音模块的硬件部分包括录音设备,采集设备有电脑控制端、噪声计、监听耳机、音箱、麦克 风、声卡、防喷罩、话筒支架;所述监听耳机、音箱、麦克风、声卡均连接至电脑;录音设备采 用NEUMANN TLM102麦克风和采样率为44.1kHz、数据长度为24位的RME FIREFACE UCX声卡; 采集的录音数据以.WAV格式保存。机器学习模块包含一个分类器,该分类器在本系统中的 作用为,通过分类正确率对样本有效性做出检验,以及在自动评估模块中,对抑郁症做出诊 断。本系统中米用了一种已被广泛应用的分类器:支持向量机(Support Vector Machine, SVM),使用LIBSVM来实现,选取的核函数为RBF (Radial Basis Function)。训练和使用方式 在下面说明,此处不再赘述。语音数据库模块运行在本系统的计算机上,用Microsoft SQL Server实现;包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据 库只保存经过医生诊断的被试数据。

[0031]图2是本发明的方法流程示意图。一种基于语音特征与机器学习的抑郁症自动评 估方法,包括以下步骤:

[0032] 1)语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同 时,使用录音设备记录被试者的语音信息;

[0033] 2)语音特征计算获取语音特征集:语音样本通过预处理后,计算语音的声学特征; 将经过医生诊断的语音声学特征,包含诊断结果一起存入语音数据库;没有经过医生诊断 的被试语音样本则进入步骤4);

[0034] 3)依据语音数据库的语音声学特征进行机器学习,确定语音有效特征提取方式, 训练用于自动评估的分类器;

[0035] 4)提取有效特征并进行分类得出评估结论:提取出被试语音样本在评估抑郁症过 程中最有效的语音特征,即有效特征;并通过训练好的分类器对提取的有效特征进行抑郁 程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。

[0036] 图3是语音采集流程示意图。该部分作用在于:为实验采集初始数据,收集用于后 续算法需要的语音文件。在获取算法训练所需数据,以及对待诊断患者进行诊断时,该部分 的硬件构成、操作步骤应尽量保持一致。

[0037] 首先由主持测试的人员测量现场噪音,若现场噪音在60dB以下,则须排除噪声源, 或等待噪声降低至55dB以下之后,再开始语音采集。

[0038] 语音采集过程分为“语音问答”、“文本朗读”、“图片描述”三个模块,分别对应不同 的实验情境,实验采集时按照被试的编号规则显现情绪材料。问题的语音播放完,“叮”声后 自动开始录音。被试回答完毕,点击“结束回答”按钮停止录音。此时按钮变为“继续”,点击 “继续”按钮进入保存界面。如此反复,直到语音文件全部录制完成。

[0039] 本过程中各模块的内容为:

[0040] 语音问答:包含9个问题,其中包含正向、中性、负向三种情绪的问题各3个。由主试 提出问题之后,对被试的回答进行录音。

[0041] 文本朗读:包含3段文字,分别带有正向、中性、负向三种情绪。主试发出开始提示 后,被试朗读文本。

[0042]图片描述:包含6张图片,其中包含正向、中性、负向三种情绪的图片各2张,主试发 出开始提示后,由被试描述图片内容。

[0043]语音样本保存:每一位被试的所有录音文件将保存在与被试编号相同的文件夹 下。保存过程中不带有个人信息,仅保留用以区分的编号以及诊断结论(正常、抑郁或未经 诊断)。其中带有诊断结论的语音样本经特征提取后,存入语音数据库。

[0044]对采集的语音信息进行语音特征提取与选择,是实现抑郁诊断的重要环节,在这 之前,首先需要对采集的语音信息进行预处理。

[0045]图4是语音预处理流程示意图。预处理是本系统中算法的第一部分,对采集的语音 信号依次进行预加重、降噪和滤波。该部分的作用在于:提高信号的信噪比,增强某些频段 的信号以便提取特征,提高后续特征计算部分的稳定性与准确性等。该部分中包含的操作: [0046]预加重:语音信号存在低频信号能量高于高频信号能量的特点,为更好地对语音 信号进行分析,须适当加强高频部分的能量。本系统中采用了k值为0.97的预加重滤波器。 [0047]降噪:因现场存在的噪音不可能完全消除,以及录音设备本身电路中可能存在噪 音等原因,必须对采集的音频信号进行滤波降噪后,再进行处理。该操作能够提高后续的特 征提取等算法的稳定性与准确性,在本系统中采用的降噪方式为:将录音中无声段作为噪 声样本,并以此为依据来去除录音中的背景噪声。

[0048]滤波:通常认为,人类语音的能量集中在200Hz〜4000Hz的频段中。因此需要设计 一个市通滤波器,用以保留有效信息。本系统中采用了通带频率为60〜4500Hz的滤波器来 完成这一处理。

[0049]对采集的语音信息预处理后,进行特征提取还包括进行语音声学特征计算的步 骤。图5是语音声学特征计算和特征提取流程示意图。

[0050]由于语音原始信号数据量庞大,不可能直接输入分类器进行训练、分类等操作,必 须对语音信号进行特征提取,在保留语音样本主要信息的同时降低数据量,才能进行后续 处理。语首的特征可以分为声学特征和语义特征,但本系统在设计时,希望能通过语音提取 出与语言无关的、能有效区分抑郁的普适性特征,故本系统只对声学特征进行了提取,而没 有进行语义分析的工作。同样的,声学特征也可以分为两个大类:局部特征(L〇w-level DeScript〇r,LLD)与统计学特征。在计算局部特征时,通常采用将语音切分为帧的方式,对 单个语音帧进行计算。而统计学特征通常是在多个语音帧之间进行计算。

[0051]切分帧:为尽量保证特征计算的精度与时间分辨率,本系统采用的切分方式为,以 10毫秒为切分步长,每次切分出一段时间长度为25毫秒的语音片段作为语音帧。切分采用 的窗函数为hamming窗。

[0052]特征计算:本部分中,计算出总计I753个局部特征和统计学特征,采用的特征计算 方法包含但不限于:共振峰计算、有声段检测、]\^(:(:、1£0、服1?、3陬、??〇^?〇等。由于采用的 特征提取算法及特征数目太多,此处不再详述。

[0053]考虑到某些语音特征与抑郁症并无明显相关性,而这些特征的存在可能会干扰到 最终对于抑郁症的诊断,因此,在提取了语音信号的大量特征后,还应根据语音样本所对应 的诊断结果,对每个特征与抑郁症诊断结果之间进行相关性分析,以保证最终保留下来的 特征对于抑郁症的诊断是最有效的。这一步骤的作用在于:去除不相关的、冗余或无用的特 征;减少数据量,提高系统运行效率。同时,筛选出与抑郁症相关的有效特征,对抑郁症的相 关研宄工作也有一定的促进作用。

[0054]步骤3)中,包括特征有效性分析与分类器训练的步骤,图6是机器学习模块中的特 征有效性分析与分类器训练流程示意图。有效特征提取工作分为两步:第一步,先采用最小 冗余最大相关(minimal-redundancy-maximal-relevance,mRMR)的方式,去掉明显不相关 的特征,从语音数据库中保存的语音特征中初步筛选出一个特征的子集,作为待选特征集。 第二步,在待选特征集中,排除一个特征后,用特征子集去训练一个分类器,计算出该特征 子集的分类率。若分类率明显降低,则说明该特征有效,应作为有效特征;若分类率不改变 或升高,说明该特征为无效特征。多次重复第二步操作,对待选特征集进行至少一次的遍历 之后,保留下来的特征,即构成有效特征集。

[GG55]预筛选:采用mRMR方法,来初步提取出一个特征子集,作为有效特征集的待选集 合。该方法具有速度快的优点,面对大量特征,能够很快筛选出与分类标签相关性较高且冗 余度较小的有效特征。因此,将该方法作为特征提取的前置步骤。

[0056]精确筛选:图6中除去预筛选之外的所有部分均为精确筛选的步骤。该步骤采取的 是序列前向浮动选择(Sequential Forward Floating Selection,SFFS),即根据特征集与 对应标签,训练一个分类器,并采用交叉排除验证(Leave-One-Out Cross-Validation, L00CV)策略来验证每个特征与分类率之间的相关性。其实现方式为:使用待选特征集中的 特征,训练一个分类器,并验证该分类器的分类率。然后,从待选特征集中排除一个特征,若 分类率下降,则说明该特征是有效的特征,应将其作为一个有效特征,予以保留;若分类率 上升或不改变,说明该特征为无效或冗余特征,将其从待选特征集中排除。最后,循环上述 实现方式,直到满足下列两个条件:从待选特征集中排除任何一个特征,都会导致分类率下 降;向待选特征集中添加任何一个特征,分类率都不会有明显提升。此时的待选特征集,gp 可视为最终筛选出的有效特征集。有效特征集中包含的特征,即为有效特征。在本系统用于 抑郁症的诊断时,只需提取有效特征即可。而用于诊断时的分类器,也是本过程最后所训练 得到的分类器。

[0057]最后,步骤4)中的自动诊断的步骤具体包括:第一步,将没有人工诊断结果的被试 语音样本,按照步骤3)确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输 入由步骤3)训练好的分类器,由分类器进行抑郁程度的分类;具体分类是以两种标签:正 常、抑郁进行了分类。

[0058]本文虽然已经给出了本发明的一些实施例,但是本领域的技术人员应当理解,在 不脱离本发明精神的情况下,可以对本文的实施例进行改变。上述实施例只是示例性的,不 应以本文的实施例作为本发明权利范围的限定。

Claims (2)

1. 一种基于语音特征与机器学习的抑郁症自动评估系统,其特征在于,包括 (a) 语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的 语音信息;所述语音采集分为“语音问答”、“文本朗读”、“图片描述”三个模块,分别包含正 向、中性、负向三种情绪的问题、文本和图片; (b) 语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征; 所述语音特征计算模块包含预处理模块,所述预处理模块包括依次连接的预加重、降噪、滤 波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块采用k值为 0.97的预加重滤波器,所述滤波模块采用通带频率为60〜4500Hz的滤波器;所述语音的声 学特征包括局部特征与统计学特征,计算局部特征时,将语音切分为帧,对单个语音帧进行 计算;统计学特征是在多个语音帧之间进行计算; (c) 语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的 相关数据;所述语音数据库模块运行在本系统的计算机上,用Microsoft SQL Server实现; 包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据库只保存经 过医生诊断的被试数据; (d) 机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定 有效特征的提取方式,并训练用于自动评估的分类器;所述机器学习模块包括分类器,使用 的分类器模型为支持向量机;支持向量机使用LIB支持向量机来实现,选取的核函数为 Radial Basis Function; 所述确定的有效特征提取方式是指:第一步,先采用最小冗余最大相关的方式,去掉明 显不相关的特征,从语音数据库中保存的语音特征中初步筛选出一个特征子集,作为待选 特征集;第二步,在待选特征集中,排除一个特征后,用特征子集去训练分类器,计算出该特 征子集的分类率,若分类率明显降低,则说明该特征有效,应作为有效特征;若分类率不改 变或升高,说明该特征为无效特征;多次重复第二步操作,对待选特征集进行至少一次的遍 历之后,保留下来的特征,即构成有效特征集; (e) 自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语 音样本自动评估被试者的抑郁程度;具体包括:第一步,将没有人工诊断结果的被试语音样 本,按照机器学习模块确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输 入由机器学习模块训练好的分类器,由分类器进行抑郁程度的分类; 所述基于语音特征与机器学习的抑郁症自动评估系统的工作步骤为: 1) 语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同时, 使用录音设备记录被试者的语音信息; 2) 语音特征计算获取语音特征集:语音样本通过预处理后,计算语音的声学特征;将经 过医生诊断的语音声学特征,包含诊断结果一起存入语音数据库;没有经过医生诊断的被 试语音样本则进入步骤4); 3) 依据存入语音数据库的语音声学特征进行机器学习,确定语音有效特征提取方式, 训练用于自动评估的分类器; 4) 提取有效特征并进行分类得出评估结论:提取出被试语音样本在评估抑郁症过程中 最有效的语音特征,即有效特征;并通过训练好的分类器对提取的有效特征进行分类,实现 依据输入的语音样本自动评估被试者的抑郁程度; 其m^1)、中^^括以下步骤:首先测量现场噪音,排除噪声源,在噪声符合要求 ^后,开知1«曰米集;语首米集过程中分别施以不同的情绪语料刺激,包括“语音问答”、“文 本朗读”、“图片描述”三个不同的实验情境; 所述步骤I)中,包括语音声学特征计算的步骤:第一步,将语音切分为帧,在单个语音 巾贞中计算出局部声学特征;第二步,在多个语音巾贞之间,计算出统计学特征;第三步,若是已 经过医生诊断的被试,将该被试的所有语音特征和人工诊断结果存入语音数据库;所述的 特征提取算法包括但不限于:共振峰计算、有声段检测、 所述步骤3)中,包括特征有效性分析与分类器训练的步骤:第一步,使用语音样本库中 的已有人工诊断结论的数据,先采用最小冗余最大相关的方式,去掉明显不相关的特征,从 语音声学特征计算出的特征集中初步筛选出一个特征的子集,作为待选特征集;第二步,在 ,选特征集中,排除一个特征后,用剩余特征训练分类器,若分类率明显降低,则说明该特 征有效,并重复第二步;多次循环,对待选特征集进行至少一次的遍历之后,保留下来的特 征,即构成有效特征集;有效特征集包含的特征即为有效特征;通过所述步骤最终训练出的 分类器,即为用于自动评估时使用的分类器; 所述步骤4)中,包括自动诊断的步骤:第一步,将没有人工诊断结果的被试语音样本, 按照步骤3)确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输入由步骤3) 训练好的分类器,由分类器进行抑郁程度的分类;所述分类是指以两种标签:正常、抑郁进 行分类。
2.根f权利要求1所述的系统,其特征在于,所述语音采集录音模块包括采集设备、录 音设备,采集设备有电脑控制端、噪声计、监听耳机、音箱、麦克风、声卡、防喷罩、话筒支架; 所述监听耳机、音箱、麦克风、声卡均连接至电脑;录音设备采用NEUMANN TLM102麦克风和 采样率为44.1kHz、数据长度为24位的RME FIREFACE UCX声卡;采集的录音数据以.WAV格式 保存。
CN201611147549.9A 2016-12-13 2016-12-13 基于语音特征与机器学习的抑郁症自动评估系统和方法 CN106725532B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611147549.9A CN106725532B (zh) 2016-12-13 2016-12-13 基于语音特征与机器学习的抑郁症自动评估系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611147549.9A CN106725532B (zh) 2016-12-13 2016-12-13 基于语音特征与机器学习的抑郁症自动评估系统和方法

Publications (2)

Publication Number Publication Date
CN106725532A CN106725532A (zh) 2017-05-31
CN106725532B true CN106725532B (zh) 2018-04-24

Family

ID=58876597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611147549.9A CN106725532B (zh) 2016-12-13 2016-12-13 基于语音特征与机器学习的抑郁症自动评估系统和方法

Country Status (1)

Country Link
CN (1) CN106725532B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874879A (zh) * 2018-05-04 2018-11-23 平安科技(深圳)有限公司 特征筛选方法、装置、计算机设备和存储介质
WO2020044332A1 (en) * 2018-08-26 2020-03-05 Beyond Verbal Communication Ltd System and method for measurement of vocal biomarkers of vitality and biological aging
CN109584861A (zh) * 2018-12-03 2019-04-05 江苏师范大学 基于深度学习的阿尔茨海默症语音信号的筛查方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105473739A (zh) * 2013-08-06 2016-04-06 深圳华大基因科技有限公司 结直肠癌生物标志物

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7272559B1 (en) * 2003-10-02 2007-09-18 Ceie Specs, Inc. Noninvasive detection of neuro diseases
WO2012003523A1 (en) * 2010-07-06 2012-01-12 Rmit University Emotional and/or psychiatric state detection
CN102339606B (zh) * 2011-05-17 2014-02-26 首都医科大学宣武医院 一种抑郁情绪电话自动语音识别筛查系统
US10478111B2 (en) * 2014-08-22 2019-11-19 Sri International Systems for speech-based assessment of a patient's state-of-mind
CN105943065A (zh) * 2016-06-29 2016-09-21 北京工业大学 一种基于脑信息学系统化方法学的人体可穿戴生理-心理-行为数据采集与分析系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105473739A (zh) * 2013-08-06 2016-04-06 深圳华大基因科技有限公司 结直肠癌生物标志物

Also Published As

Publication number Publication date
CN106725532A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
Karam et al. Ecologically valid long-term mood monitoring of individuals with bipolar disorder using speech
Lopez-de-Ipiña et al. On automatic diagnosis of Alzheimer’s disease based on spontaneous speech analysis and emotional temperature
Schuller et al. The interspeech 2017 computational paralinguistics challenge: Addressee, cold & snoring
Roark et al. Spoken language derived measures for detecting mild cognitive impairment
Das A comparison of multiple classification methods for diagnosis of Parkinson disease
Canault et al. Reliability of the language environment analysis system (LENA™) in European French
Barry et al. The automatic recognition and counting of cough
Jarrold et al. Aided diagnosis of dementia type through computer-based analysis of spontaneous speech
Matos et al. Detection of cough signals in continuous audio recordings using hidden Markov models
Gómez-Vilda et al. Glottal source biometrical signature for voice pathology detection
KR20140142330A (ko) 환자 소리들을 처리하기 위한 방법 및 장치
CN105023573B (zh) 使用听觉注意力线索的语音音节/元音/音素边界检测
Vanello et al. Speech analysis for mood state characterization in bipolar patients
Lansford et al. Vowel acoustics in dysarthria: Speech disorder diagnosis and classification
Scherer et al. Self-reported symptoms of depression and PTSD are associated with reduced vowel space in screening interviews
Syed et al. A framework for the analysis of acoustical cardiac signals
Shama et al. Study of harmonics-to-noise ratio and critical-band energy spectrum of speech as acoustic indicators of laryngeal and voice pathology
Mekyska et al. Robust and complex approach of pathological speech signal analysis
CN103458777B (zh) 用于吞咽损伤检测的方法和设备
Khan et al. Classification of speech intelligibility in Parkinson's disease
US10010288B2 (en) Screening for neurological disease using speech articulation characteristics
Sturim et al. Automatic detection of depression in speech using gaussian mixture modeling with factor analysis
Delgado-Trejos et al. Digital auscultation analysis for heart murmur detection
JP4495907B2 (ja) 音声の分析の方法及び装置
US10278637B2 (en) Accurate analysis tool and method for the quantitative acoustic assessment of infant cry

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant