CN109171644A - 基于声音识别的健康管理方法、装置、计算机设备和存储介质 - Google Patents

基于声音识别的健康管理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109171644A
CN109171644A CN201810652310.XA CN201810652310A CN109171644A CN 109171644 A CN109171644 A CN 109171644A CN 201810652310 A CN201810652310 A CN 201810652310A CN 109171644 A CN109171644 A CN 109171644A
Authority
CN
China
Prior art keywords
health
data
sound
feature
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810652310.XA
Other languages
English (en)
Inventor
王健宗
黄章成
蔡元哲
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810652310.XA priority Critical patent/CN109171644A/zh
Priority to PCT/CN2018/108388 priority patent/WO2019242155A1/zh
Publication of CN109171644A publication Critical patent/CN109171644A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4803Speech analysis specially adapted for diagnostic purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明提出的基于声音识别的健康管理方法、装置、计算机设备和存储介质,其中方法包括:获取声音信息;提取所述声音信息的目标声音特征;将所述目标声音特征输入到预设的健康数据库中进行匹配,其中,所述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据;所述健康数据库中的声音特征对应的健康状态数据为所述声音特征经健康状态模型预测得到的预测结果;所述健康状态模型为多个已知健康状态数据的声音特征训练得到的模型;获取匹配结果,并根据所述匹配结果输出所述声音信息对应的目标发声生物的健康状态,当用户用于管理自己的身体健康时,不需贴身穿戴采集仪器,不会给用户带来不适感,推广面拓宽。

Description

基于声音识别的健康管理方法、装置、计算机设备和存储介质
技术领域
本发明涉及到健康管理技术领域,特别是涉及到一种基于声音识别的健康管理方法、装置、计算机设备和存储介质。
背景技术
现在人们对于自身健康安全越来越关注,大部分都希望对自身健康有实时的监控,此外保险行业对于投保人的健康问题难以监测,每年都会存在大量投保人隐瞒自身健康问题而进行骗保的现象,因此健康管理系统应运而生。
但是目前健康管理系统大多采用传感器作为可穿戴设备穿戴于用户身上,进而采集心跳、血压等数据来分析,这样不但成本昂贵、会给用户带来不适感,推广面窄,且传感器仅是采集到穿戴者的信息,难以判断采集对象身份是否属实,可能采集到虚假数据,如应用在保险行业,容易造成被骗保的后果,另外,传感器应用在动物养殖健康管理中,成本花费极大,会影响养殖场的经济效益。
发明内容
本发明的主要目的为提供一种成本低、推广面宽的基于声音识别的健康管理方法、装置、计算机设备和存储介质。
本发明提出一种基于声音识别的健康管理方法,包括:
获取声音信息;
提取所述声音信息的目标声音特征;
将所述目标声音特征输入到预设的健康数据库中进行匹配,其中,所述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据;
所述健康数据库中的声音特征对应的健康状态数据为所述声音特征经健康状态模型预测得到的预测结果;所述健康状态模型为多个已知健康状态数据的声音特征训练得到的模型;
获取匹配结果,并根据所述匹配结果输出所述声音信息对应的目标发声生物的健康状态。
进一步地,所述获取所述声音信息的步骤之后,包括:
提取所述声音信息的声纹特征;
将所述声纹特征输入声纹识别模型中获取所述声音信息对应的目标发声生物的身份;
将所述目标发声生物的身份以及所述目标发声生物的健康状态结合,并输出结合结果。
进一步地,所述预设的健康数据库包括多个,各健康数据库与生物种类一一对应,所述将所述目标声音特征输入到预设的健康数据库中进行匹配的步骤之前,包括:
根据所述声纹特征判断所述声音信息对应的目标发声生物的生物种类;
调用与所述声音信息对应的生物种类对应的健康数据库。
进一步地,所述健康状态数据包括疾病数据、亚健康数据、完全健康数据;所述将所述目标声音特征输入到预设的健康数据库中进行匹配的步骤,包括:
判断所述目标声音特征与所述健康数据库的疾病数据是否匹配;
若所述目标声音特征与所述疾病数据匹配,则确定所述声音信息对应的所述目标发声生物为疾病状态;若所述目标声音特征与所述疾病数据不匹配,则判断所述目标声音特征与所述健康数据库的亚健康数据是否匹配;
若所述目标声音特征与所述亚健康数据匹配,则确定所述声音信息对应的所述目标发声生物为亚健康状态;若所述目标声音特征与所述健康数据库的亚健康数据不匹配,则判断所述目标声音特征与所述健康数据库的完全健康数据是否匹配;
若所述目标声音特征与所述完全健康数据匹配,则确定所述声音信息对应的所述目标发声生物为健康状态。
进一步地,所述判断所述目标声音特征与所述健康数据库的完全健康数据是否匹配的步骤之后,包括:
若所述目标声音特征与所述完全健康数据不匹配,则将所述目标声音特征输入所述健康状态模型以得到所述目标声音特征对应的健康状态数据,并将所述目标声音特征以及对应的健康状态数据添加到所述健康数据库。
进一步地,所述根据所述匹配结果输出所述声音信息对应的目标发声生物的健康状态的步骤之后,包括:
根据所述健康状态对所述目标发声生物的身体健康程度打分,并匹配对应所述身体健康程度的休养建议。
进一步地,所述方法,还包括:
获取指定量的样本数据,并将样本数据分成训练集和测试集,其中,所述样本数据包括已提取出的声音特征,以及与所述声音特征对应的健康状态数据;
将训练集的样本数据输入到预设的HMM中进行训练,得到结果训练模型;
利用所述测试集的样本数据验证所述结果训练模型;
如果验证通过,则将所述结果训练模型记为所述健康状态模型。
本发明还提供了一种基于声音识别的健康管理装置,包括:
获取单元,用于获取声音信息;
提取单元,用于提取所述声音信息的目标声音特征;
匹配单元,用于将所述目标声音特征输入到预设的健康数据库中进行匹配,其中,所述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据;所述健康数据库中的声音特征对应的健康状态数据为所述声音特征经健康状态模型预测得到的预测结果;所述健康状态模型为多个已知健康状态数据的声音特征训练得到的模型;
输出单元,用于获取匹配结果,并根据所述匹配结果输出所述声音信息对应的目标发声生物的健康状态。
本发明还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明的有益效果为:这样成本大大降低;当用户用于管理自己的身体健康时,不需贴身穿戴采集仪器,不会给用户带来不适感,推广面拓宽;另一方面,可通过声音信息进行身份识别,杜绝出现虚假数据。
附图说明
图1为本发明一实施例中的基于声音识别的健康管理方法的步骤示意图;
图2为本发明另一实施例中的基于声音识别的健康管理方法的步骤示意图;
图3为本发明一实施例中的基于声音识别的健康管理装置的结构示意框图;
图4为本发明另一实施例中的基于声音识别的健康管理装置的结构示意框图;
图5为本发明另一实施例中的基于声音识别的健康管理装置的结构示意框图;
图6为本发明另一实施例中的基于声音识别的健康管理装置的结构示意框图;
图7为本发明一实施例中的匹配单元的结构示意框图;
图8为本发明一实施例的计算机设备的结构示意框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,本实施例中的基于声音识别的健康管理方法,包括:
步骤S1:获取声音信息;
步骤S2:提取所述声音信息的目标声音特征;
步骤S3:将所述目标声音特征输入到预设的健康数据库中进行匹配,其中,所述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据;所述健康数据库中的声音特征对应的健康状态数据为所述声音特征经健康状态模型预测得到的预测结果;所述健康状态模型为多个已知健康状态数据的声音特征训练得到的模型;
步骤S4:获取匹配结果,并根据所述匹配结果输出所述声音信息对应的目标发声生物的健康状态。
在步骤S1中,本实施例中的基于声音识别的健康管理方法,需要获得待测的声音信息,具体的说,可以通过声音采集器采集声音,为了保证声音被准确完全采集,可以在上述声音的主人的活动区域放置多个声音采集器,且多个声音采集器放置在活动区域内的不同位置。这样,无需如传统采集数据仪器一样佩戴于被采集者身上即可获得声音,避免了给声音主人带来不适,扩宽了推广面,上述声音采集器包括麦克风阵列。通过声音采集器获得声音后,对上述声音进行降噪处理得到可以提取特征的声音信息。
在步骤S2中,对声音进行检测匹配之前,需要对声音信息进行声音特征提取,提取出的特征记为目标声音特征,上述目标声音特征包括时域特征参数和频域特征参数,其中,时域特征参数包括短时平均能量、短时平均幅度、短时平均过零率、共振峰、基音频率等,频域特征参数包括线性预测系数、线性预测倒谱系数、梅尔频率倒谱系数等。上述共振峰体现声道响应的特性,基音频率体现声门激励特征,线性预测系数、线性预测倒谱系数同时体现声门激励和声道响应的特性,梅尔频率倒谱系数模拟了人耳听觉特性,由于提取上述参数的方法为现有技术,故这里不再赘述,而不同健康状态对应不同的特征参数值,即对应不同的目标声音特征,因此,经过特征提取得到的目标声音特征能够反映健康状态。
在步骤S3中,将待测的声音信息经过特征提取后得到目标声音特征,然后输入到预设的健康数据库中进行匹配,其中,上述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据,当将目标声音特征输入健康数据库进行匹配,则可以匹配到对应的健康状态数据,具体的说,上述健康数据库中的健康状态数据由上述声音特征经健康状态模型预测得到的预测结果,其中健康状态模型为多个已知健康状态数据的声音特征训练得到的模型,具体地,上述健康状态模型由指定样本集通过隐马尔可夫模型(HiddenMarkov Model,HMM)进行训练得到,该指定样本集包括已知健康状态数据的声音特征、以及与声音特征一一对应的健康状态数据,上述健康状态数据包括完全健康数据、多种不同的疾病数据、多种不同的亚健康数据。
在步骤S4中,将目标声音特征输入到健康数据库后获得匹配结果,根据该匹配结果可输出声音信息对应的目标发声生物的健康状态。其中健康状态包括完全健康状态、多种不同的亚健康状态、多种不同的疾病状态。举例地,当将对应患有心脏病患者的目标声音特征输入到上述健康数据库中进行匹配,则该目标声音特征会与健康数据库的心脏病数据匹配,输出该匹配结果,即可输出声音信息对应的目标发声生物患有心脏病。
在一实施例中的基于声音识别的健康管理方法,所述获取所述声音信息的步骤S1之后,包括:
步骤S10:提取所述声音信息的声纹特征;
步骤S11:将所述声纹特征输入声纹识别模型中获取所述声音信息对应的目标发声生物的身份;
步骤S12:将所述目标发声生物的身份以及所述目标发声生物的健康状态结合,并输出结合结果。
在步骤S10中,在根据声纹特征分析声音信息对应的发声生物的身份之前,首先将获得的声音进行降噪处理得到声音信息,将上述声音信息分割为帧,然后对分割为帧的声音信息进行MFCC(Mel-Frequency Cepstral Coefficients)特征提取,本步骤中,具体提取过程为,先将分割为帧的声音信息转化成梅尔频率,然后进行倒谱分析,最后将声纹特征提取出来。
在步骤S11中,先将上述声纹特征以及声纹纹征对应的目标发声生物的身份进行训练得到声纹识别模型。当再次采集到该声纹特征时,即可将该声纹特征输入声纹识别模型中进行匹配,进而可以匹配出该声纹特征的目标发声生物的身份。对上述目标发声生物进行身份识别,其原因在于需要确定上述声音信息的目标发声生物,由于每个生物经过MFCC特征提取后的声纹特征都是不同且唯一的,所以能避免获得发出该声音的生物与其健康状态虚假匹配的结果。
其中,训练声纹识别模型具体如下:将大量声纹特征以及上述声纹特征对应的发声生物的身份作为样本,上述声纹特征由对已降噪的声音进行MFCC特征提取得到,然后将上述声纹特征以及对应该特征的目标发声生物身份输入预设的基于声纹识别神经网络进行训练,从而得到声纹识别模型。
在步骤S21中,当识别出上述目标发声生物的身份,以及获得目标发声生物的健康状态之后,可以将上述目标发声生物的身份以及健康状态结合,然后输出结合结果,如输出张三身体完全健康、李四患有心脏病等。
上述方法可以应用于人类或动物,例如应用在保险行业,当被投保的为一个宠物狗,在投保之前先采集该宠物狗的声音,用于训练声纹识别模型,若该宠物狗的主人申请疾病理赔,但是该宠物狗并没有患病时,则可通过对该宠物狗的声纹特征进行身份识别,同时将对应的目标声音特征输入健康数据库匹配出宠物狗的健康状态,能确保被投保对象与对应采用上述声音信息得到的健康状态的发声生物一致,从而杜绝该宠物狗的主人通过各种手段表明该宠物狗患病而成功骗保;同理,当被投保的为人类,在投保之前先采集该被保人的声音,用于训练声纹识别模型,若投保人申请疾病理赔,但是被保人并没有患病时,则可通过对该被保人的声纹特征进行身份识别,以及通过将对应的目标声音特征输入健康数据库匹配出被保人的健康状态,能确保被投保对象与对应采用上述声音信息得到的健康状态的发声人一致,从而杜绝该投保人通过各种手段表明被保人患病而成功骗保。
在一具体实施例中,A需要实时监控自己的身体健康状态,以便在患病时得到及时治疗或休养,可在活动区域内放置声音采集器,如大厅或卧室等,声音采集器可采集A日常生活的说话声音,无需刻意对着声音采集器说话,当声音采集器采集到A的声音,将该声音输送至系统,然后对该声音进行特征提取得到声纹特征,并将该声纹特征输入声纹识别模型中进行匹配,得到A的身份,且将A的目标声音特征输入健康数据库中进行匹配,从而获得A的身体健康状态,这时结合A的身份以及健康状态结合,并将上述结合结果发送到A的手机上,从而让A实时了解自己的身体健康状态。让待测者可以监控自己的健康状态,同时避免诸如传统的佩戴设备采集数据的不适感。
参照图2,在另一实施例中的基于声音识别的健康管理方法,所述预设的健康数据库包括多个,各健康数据库与生物种类一一对应,所述将所述目标声音特征输入到预设的健康数据库中进行匹配的步骤S3之前,包括:
步骤S30’:根据所述声纹特征判断所述声音信息对应的目标发声生物的生物种类;
步骤S31’:调用与所述声音信息对应的生物种类对应的健康检数据库。
在步骤S30’中,不管是人类还是不同种类的动物均可以发出声音,且由于生理原因均有可能患有疾病,所以上述基于声音识别的健康管理方法可以应用于人类,也可以应用于动物。对于人类与不同种类的动物,实现上述方法的采用不一样的检测系统。本步骤中,需要指出的是,用于训练不同物种的健康状态模型的数据不同,其预测得到的健康数据库也不同,故不同物种之间不能采用同一个检测系统,所以依据发声生物的种类将上述声音信息分配到对应的检测系统中,以便进行下一个步骤。举例地,上述检测系统具有多个,如人类检测系统、动物检测系统,其中动物检测系统包括各种动物的检测系统,如狗检测系统、羊检测系统、牛检测系统、鸡检测系统等等,对应的,健康数据库也有多个,且各健康数据库与上述检测系统一一对应,即与生物种类一一对应。具体地,根据声纹特征判断声音信息对应的目标发声生物的生物种类,可采用物种数据库进行匹配,如当上述声纹特征为动物狗的声纹特征时,该声纹特征与物种数据库中的动物狗的数据匹配,即可判断该声纹特征的发声生物为动物狗,这时可将上述提取出的目标声音特征分配到狗检测系统,上述物种数据库可通过神经网络模型训练生成,其中用于训练的数据包括不同生物的声纹特征以及对应声纹特征的生物种类。
在步骤S31’中,当根据声纹特征判断声音信息对应的目标发声生物的生物种类时,将该声音特征分配至对应的检测系统,然后调用与上述声音信息对应的生物种类对应的健康数据库,由于用于训练不同物种的健康状态模型的数据不同,所以预测得到的健康数据库也不一样,即每一个生物种类均对应有一个相应的健康数据库,如,当判断出发声生物为动物狗时,将其声音特征分配至狗检测系统,调用动物狗的健康数据库,其中动物狗的健康数据库是由动物狗的声音特征以及对应该声音特征的健康状态数据输入隐马尔可夫模型进行训练得到。
在一具体实施例中,上述方法可以应用在养殖场,如在养殖场的不同空间位置放置分别放置声音采集器,通过声音采集器采集养殖场内各种动物的声音,并经处理即可通过上述方法得出不同动物的健康状态:健康或患有某种疾病。这样大大地降低养殖成本,及时了解养殖场的动物健康状态,避免瘟疫发生。
本实施例中的基于声音识别的健康管理方法,所述健康状态数据包括疾病数据、亚健康数据、完全健康数据;所述将所述目标声音特征输入到预设的健康数据库中进行匹配的步骤S3,包括:
步骤S30:判断所述目标声音特征与所述健康数据库的疾病数据是否匹配;
步骤S31:若所述目标声音特征与所述疾病数据匹配,则确定所述声音信息对应的所述目标发声生物为疾病状态;若所述声音目标特征与所述疾病数据不匹配,则判断所述目标声音特征与所述健康数据库的亚健康数据是否匹配;
步骤S32:若所述目标声音特征与所述亚健康数据匹配,则确定所述声音信息对应的所述目标发声生物为亚健康状态;若所述目标声音特征与健康数据库的亚健康数据不匹配,则判断所述目标声音特征与所述健康数据库的完全健康数据是否匹配;
步骤S33:若所述目标声音特征与所述完全健康数据匹配,则确定所述声音信息对应的所述目标发声生物为完全健康状态。
在步骤S30中,上述健康数据库中包括多个声音特征以及与上述各声音特征对应的健康状态数据,该健康状态数据包括疾病数据以及健康数据,其中由于疾病的多样性,每一种疾病的数据都不一样,所以疾病数据包括多种不同的疾病数据;由于健康包括亚健康以及完全健康,即上述健康数据包括多种不同的亚健康数据以及完全健康数据,而多种不同的亚健康数据以及完全健康数据具有共性,即声音特征对应的亚健康数据以及完全健康数据具有部分相同的数据,为便于表述将上述部分相同的数据称为共同数据。本步骤中,将上述目标声音特征与上述健康数据库的多种疾病数据进行对比,进而判断是否匹配。
在步骤S31中,若上述目标声音特征与上述健康数据库的其中一种疾病数据匹配,则可确定该目标声音特征对应的目标发声生物为疾病状态,且患有该疾病,可以结合上述通过声纹识别模型识别出的目标发声生物身份输出结果,如可输出该声音主人的名字以及患有的疾病类型。若判定上述目标声音特征与上述健康数据库的所有疾病数据均不匹配,则进一步地判断上述目标声音特征与上述健康数据库的亚健康数据是否匹配。
在步骤S32中,若上述目标声音特征与上述健康检测模型的其中一种亚健康数据匹配,则可以确定声音信息对应的目标发声生物为亚健康状态,举例地,采集B的声音,对B的声音进行特征提取,若该目标声音特征对应的健康状态数据为有睡眠紊乱的亚健康数据,当在上述健康数据库中进行匹配时,则与上述健康数据库里亚健康状态的睡眠紊乱数据匹配,这时即可输出B具有亚健康睡眠紊乱的结果。当上述声音特征与健康数据库的亚健康数据不匹配,则判断目标声音特征与健康数据库的完全健康数据是否匹配。
在步骤S33中,当上述目标声音特征与上述健康数据库的完全健康数据匹配时,则表明这个声音特征对应的健康状态数据为完全健康数据,则确定该声音特征的目标发声生物完全健康,没有患病也没有亚健康,这时输出上述声音信息对应的目标发声生物的健康状态,即完全健康,没有患病的状态。
进一步地,所述判断所述目标声音特征与所述健康数据库的完全健康数据是否匹配的步骤S32之后,包括:
步骤S34:若所述目标声音特征与所述完全健康数据不匹配,则将所述目标声音特征输入所述健康状态模型以得到所述目标声音特征对应的健康状态数据,并将所述目标声音特征以及对应的健康状态数据添加到所述健康数据库。
本步骤中,若目标声音特征与完全健康数据不匹配,则获取现实中的该目标声音特征对应的发声生物的健康状态,该健康状态的数据与上述目标声音特征相对应,将该目标声音特征以及上述对应的健康状态数据输入上述健康状态模型,从而预测得到可以添加进健康数据库中的与上述目标声音特征对应的健康状态数据,最后将上述目标声音特征以及对应的健康状态数据添加到健康数据库。
具体的说,由于健康数据包括多种不同的亚健康数据以及完全健康数据,而多种不同的亚健康数据以及完全健康数据均具有共同数据,而疾病数据具有不确定性,完全健康数据与亚健康数据的共同数据具有确定性,由于疾病多种多样,且相差极大,使得每一种疾病数据都不一样,故而疾病数据具有不确定性;而每个人不患病时,且完全健康时,这时身体表现出的只有一种状态,所以完全健康数据具有确定性,且亚健康也属于身体健康的范畴,故而亚健康数据带有与完全健康数据部分相同的数据,该部分相同的数据即为上述共同数据,也必具有确定性,且由于每个人健康时身体表现出的状态为确定的,所以该共同数据可用于判断上述目标声音特征对应的健康状态数据是否属于健康数据。所以若上述目标声音特征与健康数据库的所有疾病数据以及亚健康数据均不匹配,且这时上述目标声音特征与健康数据库的安全健康数据也不匹配,那么则需判断目标声音特征对应的健康状态数据的部分数据是否与上述共同数据匹配,若匹配,则表明与上述目标声音特征对应的健康状态数据仍属于健康数据,且由于完全健康数据为确定的,所以该健康状态数据为新型亚健康数据,即该目标声音特征的发声生物的身体处于没有患病的健康状态,且处于新型的亚健康状态。由于训练健康状态模型的样本有限,故而在上述健康数据库中并没有这种数据,这时,将上述声音特征输送至后台系统,训练健康状态模型,把预测得到的声音特征以及对应的新型亚健康数据增加到上述健康数据库中去,避免前期健康数据库没有匹配到全部身体情况而造成误判断。当判断与目标声音特征对应的健康状态数据中的部分数据与上述共同数据不匹配,由于共同数据确定,即发声生物的没有患病的健康状态是确定的,这时若不匹配,则表明与上述目标声音特征对应的健康状态数据为新型疾病数据,由于训练健康状态模型的样本有限,故而在上述健康数据库中并没有这种数据,这时,将上述声音特征输送至后台系统,用于训练上述健康状态模型,把得到的声音特征以及对应的新型疾病数据增加到上述健康数据库中去,避免前期健康数据库没有匹配到新型疾病而造成误判断。
本实施例中的基于声音识别的健康管理方法,所述根据所述匹配结果输出所述声息信息对应的目标发声生物的健康状态的步骤S4之后,包括:
步骤S5:根据所述健康状态对所述目标发声生物的身体健康程度打分,并匹配对应所述身体健康程度的休养建议。
在步骤S5中,系统设置有与上述健康数据库中每种亚健康类型以及疾病类型配对的休养建议以及分数的表格,当根据匹配结果判断出上述声音信息对应的目标发声生物的健康状态时,不同的健康状态表明发声生物身体健康程度的不同,系统根据上述身体健康程度在表格中查寻对应的休养建议以及分数,如针对判断为完全健康状态时,建议为保持现状,分数为100分;针对判断出为疲劳过度睡眠紊乱的亚健康,对应的休养建议为合理饮食、适量运动、作息规律,其分数为85分等。
进一步地,系统将上述目标发声生物身份与上述亚健康类型、对应的休养建议及分数输出到指定地方,如输送到上述声音信息的主人的邮箱上,打分使得用户更直观知道身体的健康程度情况,同时用户可以通过执行休养建议有针对性地休养身体,使身体更健康,且该方法方便直观便捷。
在另一实施例中,由于疾病数据具有不确定性,完全健康数据与亚健康数据的共同数据具有确定性,所以基于声音识别的健康管理方法还包括通过以下步骤实现:获取目标声音特征,将该目标声音特征输入到的疾病资料库中进行匹配,若该目标声音特征与疾病资料库中的某种疾病数据匹配,则可根据该匹配结果确定该目标声音特征的目标发声生物患有某种疾病;若该目标声音特征与疾病资料库中的疾病数据不匹配,则将目标声音特征输入到健康资料库中匹配,若目标声音特征与健康资料库中的共同数据匹配,则可根据该匹配结果确定该声音特征的目标发声生物处于为不患病的健康状态。进一步地,若上述目标声音特征既不与疾病资料库的疾病数据匹配,也不与健康资料库的共同数据匹配,则判断与该目标声音特征对应的健康状态数据为新型疾病数据,可通过上述新型疾病数据以及对应的声音特征再次训练疾病检测模型,将该声音特征以及对应的新型疾病数据添加至疾病资料库,当上述目标声音特征与健康资料库中的共同数据匹配,且不与完全健康数据匹配时,即判断该声音特征的发声生物为亚健康状态,进一步,当上述目标声音特征与健康资料库中的共同数据匹配,但却与完全健康数据以及所有的亚健康数据均不匹配时,则判断与该目标声音特征对应的健康状态数据为新型亚健康数据,可通过上述新型亚健康数据以及对应的声音特征再次训练健康检测模型,将该声音特征以及对应新型亚健康数据添加至健康资料库。
上述疾病资料库以及健康资料库均可参照上述健康数据库的生成过程而得到,具体地,可以将声音特征以及声音特征对应的疾病数据输入预设的HMM模型进行训练,得到疾病检测模型,从而预测得到疾病资料库;将声音特征以及声音特征对应的健康数据输入到预设的HMM模型进行训练,得到健康检测模型,从而预测得到健康资料库。
本实施例中,所述方法还包括:
获取指定量的样本数据,并将样本数据分成训练集和测试集,其中,所述样本数据包括已提取出的声音特征,以及与所述声音特征对应的健康状态数据;
将训练集的样本数据输入到预设的HMM中进行训练,得到结果训练模型;
利用所述测试集的样本数据验证所述结果训练模型;
如果验证通过,则将所述结果训练模型记为所述健康状态模型。
对于健康状态模型,只有在训练完成之后,才能预测得到用于匹配对应的身体健康状态的健康数据库。而在对健康状态模型进行训练时,需要获取大量的样本数据,并将上述样本数据分成训练集和测试集,其中上述样本数据包括已提取的声音特征,以及与上述已提取的声音特征对应的健康状态数据。将上述训练集的样本数据输入到预设的隐马尔可夫模型中进行训练,得到用于进行健康检测的结果训练模型。
综上所述,通过上述基于声音识别的健康管理,只需安装声音采集器即可采集声音,然后将声音处理得到声音特征,并输入健康数据库中匹配得到匹配结果,可根据匹配结果判断发声生物的健康状态,这样成本大大降低;当用户用于管理自己的身体健康时,不需贴身穿戴采集仪器,不会给用户带来不适感,推广面拓宽;另一方面,可通过声音信息进行身份识别,杜绝出现虚假数据。
参照图3,本实施例中的基于声音识别的健康管理装置,包括:
获取单元100,用于获取声音信息;
提取单元200,用于提取所述声音信息的目标声音特征;
匹配单元300,用于将所述目标声音特征输入到预设的健康数据库中进行匹配,其中,所述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据;所述健康数据库中的声音特征对应的健康状态数据为所述声音特征经健康状态模型预测得到的预测结果;所述健康状态模型为多个已知健康状态数据的声音特征训练得到的模型;
输出单元400,用于获取匹配结果,并根据所述匹配结果输出所述声音信息对应的目标发声生物的健康状态。
本实施例中的基于声音识别的健康管理方法,获取单元100需要获得待测的声音信息,具体的说,可以通过声音采集器采集声音,为了保证声音被准确完全采集,可以在上述声音的主人的活动区域放置多个声音采集器,且多个声音采集器放置在活动区域内的不同位置。这样,无需如传统采集数据仪器一样佩戴于被采集者身上即可获得声音,避免了给声音主人带来不适,扩宽了推广面,上述声音采集器包括麦克风阵列。获取单元100通过声音采集器获得声音后,对上述声音进行降噪处理得到可以提取特征的声音信息。
在对声音进行检测匹配之前,提取单元200对声音信息进行声音特征提取,提取出的特征记为目标声音特征,上述目标声音特征包括时域特征参数和频域特征参数,其中,时域特征参数包括短时平均能量、短时平均幅度、短时平均过零率、共振峰、基音频率等,频域特征参数包括线性预测系数、线性预测倒谱系数、梅尔频率倒谱系数等。上述共振峰体现声道响应的特性,基音频率体现声门激励特征,线性预测系数、线性预测倒谱系数同时体现声门激励和声道响应的特性,梅尔频率倒谱系数模拟了人耳听觉特性,由于提取上述参数的方法为现有技术,故这里不再赘述,而不同健康状态的对应有不同的特征参数值,即对应不同的声音特征,因此,经过特征提取得到的目标声音特征能够反映健康状态。
匹配单元300将待测的声音信息经过特征提取后得到目标声音特征,然后输入到预设的健康数据库中进行匹配,其中,上述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据,当将目标声音特征输入健康数据库进行匹配,则可以匹配到对应的健康状态数据,具体的说,上述健康健康数据库的健康状态数据由上述声音特征经健康状态模型预测得到的预测结果,其中健康状态模型为多个已知健康状态数据的声音特征训练得到的模型,具体地,上述健康状态模型由指定样本集通过隐马尔可夫模型(HiddenMarkov Model,HMM)进行训练得到,该指定样本集包括已知健康状态数据的声音特征、以及与声音特征一一对应的健康状态数据,上述健康状态数据包括与完全健康数据、多种不同的疾病数据、多种不同的亚健康数据。
将目标声音特征输入到训练成功后的健康数据库则获得匹配结果,输出单元400根据该匹配结果可输出声音信息对应的目标发声生物的健康状态。其中健康状态包括完全健康状态、多种不同的亚健康状态、多种不同的疾病状态。举例地,当将对应患有心脏病患者的目标声音特征输入到上述健康数据库中进行匹配,则该目标声音特征会与健康数据库的心脏病数据匹配,输出该匹配结果,即可输出声音信息对应的发声生物患有心脏病。
参照图5,在一实施例中的基于声音识别的健康管理装置,还包括包括:
声纹单元500:用于提取所述声音信息的声纹特征;
身份单元510:用于将所述声纹特征输入声纹识别模型中获取所述声音信息对应的目标发声生物的身份;
结合单元520:用于将所述目标发声生物的身份以及所述目标发声生物的健康状态结合,并输出结合结果。
在根据声纹特征分析声音信息对应的发声生物的身份之前,首先将获得的声音进行降噪处理得到声音信息,将上述声音信息分割为帧,然后对分割为帧的声音信息进行MFCC(Mel-Frequency Cepstral Coefficients)特征提取,本步骤中,具体提取过程为,先将分割为帧的声音信息转化成梅尔频率,然后进行倒谱分析,最后将声纹特征提取出来。
在获取上述目标发声生物的身份之前,先采用上述声纹特征以及声纹特征对应的目标发声生物的身份进行训练得到声纹识别模型。当再次采集到该声纹特征时,即可将该声纹特征输入声纹识别模型中进行匹配,进而可以通过声纹识别库匹配出该声纹特征的发声生物的身份。当匹配单元300将目标声音特征输入健康数据库进行匹配得到匹配结果,最后结合上述发声生物身份,输出最终结果。对上述目标发声生物进行身份识别,其原因在于需要确定上述声音信息的目标发声生物,由于每个生物经过MFCC特征提取后的声纹特征都是不同且唯一的,所以能避免获得发出该声音的生物与其健康状态虚假匹配的结果。
其中,训练声纹识别模型具体如下:将大量声纹特征以及上述声纹特征对应的发声生物的身份作为样本,上述声纹特征由对已降噪的声音进行MFCC特征提取得到,然后将大量的上述MFCC特征以及对应该特征的发声生物身份输入预设的基于声纹识别神经网络进行训练,从而得到声纹识别模型。
当身份单元500识别出上述目标发声生物的身份,以及获得出发声生物的健康状态之后,结合单元510可以将上述目标发声生物的身份以及健康状态结合,然后输出结合结果,如输出张三身体完全健康、李四患有心脏病等
上述装置可以应用于人类或动物,例如应用在保险行业,当被投保的为一个宠物狗,在投保之前先采集该宠物狗的声音,用于训练声纹识别模型,若该宠物狗的主人申请疾病理赔,但是该宠物狗并没有患病时,则可通过对该宠物狗的声纹特征进行身份识别,同时通过将对应的目标声音特征输入健康数据库匹配出宠物狗的健康状态,能确保被投保对象与对应采用上述声音信息得到的健康状态的发声生物一致,从而杜绝该宠物狗的主人通过各种手段表明该宠物狗患病而成功骗保;同理,当被投保的为人类,在投保之前先采集该被保人的声音,用于训练声纹识别模型,若投保人申请疾病理赔,但是被保人并没有患病时,则可通过对该被保人的声纹特征进行身份识别,以及通过将对应的目标声音特征输入健康数据库匹配出被保人的健康状态,能确保被投保对象与对应采用上述声音信息得到的健康状态的发声人一致,从而杜绝该投保人通过各种手段表明被保人患病而成功骗保。
在一具体实施例中,A需要实时监控自己的身体健康状态,以便在患病时得到及时治疗或休养,可在活动区域内放置声音采集器,如大厅或卧室等,声音采集器可采集A日常生活的说话声音,无需刻意对着声音采集器说话,当声音采集器采集到A的声音,将该声音输送至系统,然后对该声音进行特征提取得到声纹特征,并将该声纹特征输入声纹识别模型中进行匹配,得到A的身份,且将A的目标声音特征输入健康数据库中进行匹配,从而获得A的身体健康状态,这时结合A的身份以及健康状态结合,并将上述结合结果发送到A的手机上,从而让A实时了解自己的身体健康状态。让待测者可以监控自己的健康状态,同时避免诸如传统的佩戴设备采集数据的不适感。
参照图4,在另一实施例中的基于声音识别的健康管理装置,所述预设的健康数据库包括多个,各健康数据库与生物种类一一对应,还包括:
分类单元600,用于根据所述声纹特征判断所述声音信息对应的目标发声生物的生物种类;
调用单元700,用于调用与所述声音信息对应的生物种类对应的健康数据库。
不管是人类还是不同种类的动物均可以发出声音,且由于生理原因均有可能患有疾病,所以上述基于声音识别的健康管理装置可以应用于人类,也可以应用于动物。对于人类与不同种类的动物,实现上述装置采用不一样的检测系统。需要指出的是,用于训练不同物种的健康状态模型的数据不同,其预测得到的健康数据库也不同,故不同物种之间不能采用同一个检测系统,所以依据发声生物的种类将上述声音信息分配到对应的检测系统中,以便进行下一个步骤。举例地,上述检测系统具有多个,如人类检测系统、动物检测系统,其中动物检测系统包括各种动物的检测系统,如狗检测系统、羊检测系统、牛检测系统、鸡检测系统等等,对应的,健康数据库也有多个,且各健康数据库与上述检测系统一一对应,即与生物种类一一对应。具体地,分类单元600根据上述声纹特征判断声音信息对应的发声生物的生物种类,可采用物种数据库进行匹配,如当上述声纹特征为动物狗的声纹特征时,该声纹特征与物种数据库中的动物狗的数据匹配,即可判断该声纹特征的发声生物为动物狗,这时可将上述提取出的目标声音特征分配到狗检测系统,上述物种数据库可通过神经网络模型训练生成,其中用于训练的数据包括不同生物的声纹特征以及对应声纹特征的生物种类。
当分类单元600根据声纹特征判断声音信息对应的目标发声生物的生物种类时,将该声音特征分配至对应的检测系统,然后调用单元700调用与上述声音信息对应的生物种类对应的健康数据库,由于用于训练不同物种的健康状态模型的数据不同,所以预测得到的健康数据库也不一样,即每一个生物种类均对应有一个相应的健康数据库,如,当判断出发声生物为动物狗时,将其声音特征分配至狗检测系统,从而调用动物狗的健康数据库,其中动物狗的健康数据库是由动物狗的声音特征以及对应该声音特征的健康状态数据输入隐马尔可夫模型进行训练得到。
在一具体实施例中,上述装置可以应用在养殖场,如在养殖场的不同空间位置放置分别放置声音采集器,通过声音采集器采集养殖场内各种动物的声音,并经处理即可通过上述方法得出不同动物的健康状态:健康或患有某种疾病。这样大大地降低养殖成本,及时了解养殖场的动物健康状态,避免瘟疫发生。
参照图7,本实施例中的基于声音识别的健康管理装置,所述健康状态数据包括疾病数据、亚健康数据、完全健康数据;所述匹配单元300包括:
第一判断子单元310,用于判断所述目标声音特征与所述健康数据库的疾病数据是否匹配;
第二判断子单元320,用于判定所述目标声音特征与所述疾病数据匹配时,确定所述声音信息对应的所述目标发声生物为疾病状态;所述目标声音特征与所述疾病数据不匹配时,判断所述目标声音特征与所述健康数据库的亚健康数据是否匹配;
第三判断子单元330,用于判定所述目标声音特征与所述亚健康数据匹配时,确定所述声音信息对应的所述目标发声生物为亚健康状态;所述声音特征与健康数据库的亚健康数据不匹配时,则判断所述目标声音特征与所述健康数据库的完全健康数据是否匹配;
输出子单元340,用于判定所述目标声音特征与所述完全健康数据匹配,则确定所述声音信息对应的所述目标发声生物为完全健康状态。
上述健康数据库中包括多个声音特征以及与上述各声音特征对应的健康状数据,该健康状态数据包括疾病数据以及健康数据,其中由于疾病的多样性,每一种疾病的数据都不一样,所以疾病数据包括多种不同的疾病数据;由于健康包括亚健康以及完全健康,即上述健康数据包括多种不同的亚健康数据以及完全健康数据,而多种不同的亚健康数据以及完全健康数据具有共性,即声音特征对应的亚健康数据以及完全健康数据具有部分相同的数据,为便于表述将上述部分相同的数据称为共同数据。将提取出的声音特征输入到上述健康数据库中,第一判断子单元310将上述声音目标特征与上述健康数据库的多种疾病数据进行对比,进而判断是否匹配。
若上述目标声音特征与上述健康数据库的其中一种疾病数据一致,则可确定该目标声音特征对应的目标发声生物为疾病状态,且患有该疾病,可以结合上述通过声纹识别模型识别出的目标发声生物身份输出结果,如可输出该声音主人的名字以及患有的疾病类型。若在判定上述目标声音特征与上述健康数据库的所有疾病数据均不匹配,第二判断子单元320进一步地判断上述目标声音特征与上述健康数据库的亚健康数据是否匹配。
若上述目标声音特征与上述健康检测模型的其中一种亚健康数据匹配,则可以确定声音信息对应的目标发声生物为亚健康状态,举例地,采集B的声音,对B的声音进行特征提取,若提取到的目标声音特征对应的健康状态数据为有睡眠紊乱的亚健康数据,当将目标声音特征在上述健康数据库中进行匹配时,则与上述健康数据库里亚健康状态的睡眠紊乱数据匹配,这时即可输出B具有亚健康睡眠紊乱的结果。当上述目标声音特征与健康数据库的亚健康数据不匹配,则第三判断子单元330判断目标声音特征与健康数据库的安全健康数据是否匹配。
当上述目标声音特征与上述健康数据库的完全健康数据匹配时,则表明这个声音特征对应的健康状态数据为完全健康数据,则确定该声音特征的目标发声生物完全健康,没有患病也没有亚健康,这时输出子单元340输出上述声音信息对应的目标发声生物的健康状态,即完全健康,没有患病的状态。
进一步地,所述匹配单元300包括还包括:
添加子单元350,用于判定所述目标声音特征与所述完全健康数据不匹配时,则将所述目标声音特征输入所述健康状态模型以得到所述目标声音特征对应的健康状态数据,并将所述目标声音特征以及对应的健康状态数据添加到所述健康数据库。
当判定所述目标声音特征与所述完全健康数据不匹配时,获取现实中的该目标声音特征对应的发声生物的健康状态,该健康状态的数据与上述目标声音特征对应,将该目标声音特征以及健康状态数据输入上述健康状态模型,从而预测得到可以添加进健康数据库中的与上述目标声音特征对应的健康状态数据,最后将上述目标声音特征以及对应的健康状态数据添加到健康数据库。
具体的说,由于健康数据包括多种不同的亚健康数据以及完全健康数据,而多种不同的亚健康数据以及完全健康数据均具有共同数据,而疾病数据具有不确定性,完全健康数据与亚健康数据的共同数据具有确定性,由于疾病多种多样,且相差极大,使得每一种疾病数据都不一样,故而疾病数据具有不确定性;而每个人不患病时,且完全健康时,这时身体表现出的只有一种状态,所以完全健康数据具有确定性,且亚健康也属于身体健康的范畴,故而亚健康数据带有与完全健康数据部分相同的数据,该部分相同的数据即为上述共同数据,也必具有确定性,且由于每个人健康时身体表现出的状态为确定的,所以该共同数据可用于判断上述目标声音特征对应的健康状态数据是否属于健康数据。所以若上述目标声音特征与健康数据库的所有疾病数据以及亚健康数据均不匹配,且这时上述目标声音特征与健康数据库的安全健康数据也不匹配,那么则需判断目标声音特征对应的健康状态数据的部分数据是否与上述共同数据匹配,若匹配,则表明上述目标声音特征对应的健康状态数据仍属于健康数据,且由于完全健康数据为确定的,所以该健康状态数据为新型亚健康数据,即该目标声音特征的发声生物的身体处于没有患病的健康状态,且处于新型的亚健康状态。由于训练健康检测模型的样本有限,故而在上述健康数据库中并没有这种数据,这时,添加子单元350将上述声音特征输送至后台系统,训练上述健康状态模型,把预测得到的声音特征以及对应的新型亚健康数据增加到上述健康数据库中去,避免前期健康数据库没有匹配到全部身体情况而造成误判断。当判断与目标声音特征对应的健康状态数据的部分数据与上述共同数据不匹配,由于共同数据确定,即发声生物的没有患病的健康状态是确定的,这时若不匹配,则表明与上述目标声音特征对应的健康状态数据为新型疾病数据,由于训练健康检测模型的样本有限,故而在上述健康数据库中并没有这种数据,这时,添加子单元350将上述声音特征输送至后台系统,训练上述健康状态模型,把预测得到的声音特征以及对应的新型疾病数据增加到上述健康数据库中去,避免前期健康数据库没有匹配到新型疾病而造成误判断。
参照图6,本实施例中的基于声音识别的健康管理装置,还包括:
打分单元800,用于根据所述健康状态对所述目标发声生物的身体健康程度打分,并匹配对应所述身体健康程度的休养建议。
系统设置有与上述健康数据库中每种亚健康类型以及疾病类型配对的休养建议以及分数的表格,当根据匹配结果判断出上述声音信息对应的目标发声生物的健康状态时,不同的健康状态表明发声生物身体健康程度的不同,打分单元800根据上述身体健康程度在表格中查寻对应的休养建议以及分数,如针对判断为完全健康状态时,建议为保持现状,分数为100分;针对判断出为疲劳过度睡眠紊乱的亚健康,对应的休养建议为合理饮食、适量运动、作息规律,其分数为85分等。
进一步地,系统将上述目标声音特征的发声生物身份与上述亚健康类型、对应的休养建议及分数输出到指定地方,如输送到上述声音信息的主人的邮箱上,打分使得用户更直观知道身体的健康程度情况,同时用户可以通过执行休养建议有针对性地休养身体,使身体更健康,且该方法方便直观便捷。
在另一实施例中,由于疾病数据具有不确定性,完全健康数据与亚健康数据的共同数据具有确定性,所以基于声音识别的健康管理方法还包括通过以下步骤实现:获取目标声音特征,先将目标声音特征输入疾病资料库中进行匹配,若该目标声音特征与疾病资料库中的某种疾病数据匹配,则可根据该匹配结果确定该目标声音特征的目标发声生物患有某种疾病;若该目标声音特征与疾病资料库中的疾病数据不匹配,则将目标声音特征输入健康资料库中匹配,若目标声音特征与健康资料库中的共同数据匹配,则可根据该匹配结果确定该声音特征的目标发声生物处于为不患病的健康状态。进一步地,若上述目标声音特征既不与疾病资料库的疾病数据匹配,也不与健康资料库的共同数据匹配,则判断与该目标声音特征对应的健康状态数据为新型疾病数据,可通过上述新型疾病数据以及对应的声音特征再次训练疾病检测模型,将该目标声音特征以及对应的新型疾病数据添加至疾病资料库,当上述目标声音特征与健康资料库中的共同数据匹配,且不与完全健康数据匹配时,即判断该声音特征的发声生物为亚健康状态,进一步,当上述目标声音特征与健康资料库中的共同数据匹配,但却与完全健康数据以及所有的亚健康数据均不匹配时,则判断与该目标声音特征对应的健康状态数据为新型亚健康数据,可通过上述新型亚健康数据以及对应的声音特征再次训练健康检测模型,将该目标声音特征以及对应新型亚健康数据添加至健康资料库。
上述疾病资料库以及健康资料库均可参照上述健康数据库的生成过程而得到,具体地,可以将声音特征以及声音特征对应的疾病数据输入预设的HMM模型进行训练,得到疾病检测模型,从而预测得到疾病资料库;将声音特征以及声音特征对应的健康数据输入到预设的HMM模型进行训练,得到健康检测模型,从而预测得到健康资料库。
本实施例中,所述的方法还包括:
获取指定量的样本数据,并将样本数据分成训练集和测试集,其中,所述样本数据包括已提取出的声音特征,以及与所述声音特征对应的健康状态数据;
将训练集的样本数据输入到预设的HMM中进行训练,得到结果训练模型;
利用所述测试集的样本数据验证所述结果训练模型;
如果验证通过,则将所述结果训练模型记为所述健康状态模型。
对于健康检状态模型,只有在训练完成之后,才能预测得到用于匹配对应的身体健康状态的健康数据库。而在对健康检状态模型进行训练时,需要获取大量的样本数据,并将上述样本数据分成训练集和测试集,其中上述样本数据包括已提取的声音特征,以及与上述已提取的声音特征对应的健康状态数据。将上述训练集的样本数据输入到预设的隐马尔可夫模型中进行训练,得到用于进行健康检测的结果训练模型。
参照图8,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于预设的健康状态模型等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于声音识别的健康管理方法。
上述处理器执行上述基于声音识别的健康管理方法的步骤:获取声音信息;提取所述声音信息的目标声音特征;将所述目标声音特征输入到预设的健康数据库中进行匹配,其中,所述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据;所述健康数据库中的声音特征对应的健康状态数据为所述声音特征经健康状态模型预测得到的预测结果;所述健康状态模型为多个已知健康状态数据的声音特征训练得到的模型;获取匹配结果,并根据所述匹配结果判断所述声息信息对应的目标发声生物的健康状态。
上述计算机设备,基于隐马尔可夫模型,训练得到健康状态模型,对于待测声音信息特征提取得到目标声音特征,将上述声音特征输入到预设的健康数据库中进行匹配,获取匹配结果,可根据该匹配结果判断上述声音信息对应的发声生物的健康状态。
在一个实施例中,所述获取所述声音信息之后,包括:提取所述声音信息的声纹特征;将所述声纹特征输入通过声纹识别模型中获取所述声音信息对应的目标发声生物的身份;将所述目标发声生物的身份以及所述目标发声生物的健康状态结合,并输出结合结果。
在一个实施例中,所述预设的健康数据库包括多个,各健康数据库与生物种类一一对应,所述将所述目标声音特征输入到预设的健康数据库进行匹配之前,包括:根据所述声纹特征判断所述声音信息对应的目标发声生物的生物种类;调用与所述声音信息对应的生物种类对应的健康数据库。
在一个实施例中,所述健康状态数据包括疾病数据、亚健康数据、完全健康数据;上述将上述声音特征输入到预设的健康数据库中进行匹配的步骤,包括:判断上述目标声音特征与上述健康数据库的疾病数据是否匹配;若所述目标声音特征与所述疾病数据匹配,则确定所述声音信息对应的所述目标发声生物为疾病状态;若上述目标声音特征与所述疾病数据不匹配,则判断上述目标声音特征与上述健康数据库的亚健康数据是否匹配;若所述目标声音特征与所述亚健康数据匹配,则确定所述声音信息对应的所述目标发声生物为亚健康状态;若上述目标声音特征与所述健康数据库的亚健康数据不匹配,则判断上述目标声音特征与所述健康数据库的完全健康数据是否匹配;若上述目标声音特征与上述完全健康数据匹配,则确定上述声音信息对应的上述目标发声生物为完全健康状态。
在一个实施例中,判断上述目标声音特征与健康数据库的完全健康数据是否匹配之后,包括:若所述目标声音特征与所述完全健康数据不匹配,则将所述目标声音特征输入所述健康状态模型以得到所述目标声音特征对应的健康状态数据,并将所述目标声音特征以及对应的健康状态数据添加到所述健康数据库,避免前期健康数据库匹配不到新的声音特征而造成误判断。
在一个实施例中,所述根据所述匹配结果输出所述声息信息对应的目标发声生物的健康状态的步骤之后,包括:根据所述健康状态对所述目标发声生物的身体健康程度打分,并匹配对应所述身体健康程度的休养建议,用户更直观知道身体的健康程度情况。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本发明一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于声音识别的健康管理方法,具体为:获取声音信息;提取所述声音信息的目标声音特征;将所述目标声音特征输入到预设的健康数据库中进行匹配,其中,所述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据;所述健康数据库中的声音特征对应的健康状态数据为所述声音特征经健康状态模型预测得到的预测结果;所述健康状态模型为多个已知健康状态数据的声音特征训练得到的模型;获取匹配结果,并根据所述匹配结果判断所述声息信息对应的目标发声生物的健康状态。
上述计算机可读存储介质,基于隐马尔可夫模型,训练得到健康状态模型,对于待预测声音信息特征提取得到目标声音特征,将上述声音特征输入到预设的健康数据库中进行匹配,获取匹配结果,可根据该匹配结果判断上述声音信息对应的发声生物的健康状态。
在一个实施例中,所述获取所述声音信息之后,包括:提取所述声音信息的声纹特征;将所述声纹特征输入声纹识别模型中获取所述声音信息对应的目标发声生物的身份;将所述目标发声生物的身份以及所述目标发声生物的健康状态结合,并输出结合结果。
在一个实施例中,所述预设的健康数据库包括多个,各健康数据库与生物种类一一对应,所述将所述目标声音特征输入到预设的健康数据库进行匹配之前,包括:根据所述声纹特征判断所述声音信息对应的目标发声生物的生物种类;调用与所述声音信息对应的生物种类对应的健康数据库。
在一个实施例中,所述健康状态数据包括疾病数据、亚健康数据、完全健康数据;上述将上述声音特征输入到预设的健康数据库中进行匹配的步骤,包括:判断上述目标声音特征与上述健康数据库的疾病数据是否匹配;若所述目标声音特征与所述疾病数据匹配,则确定所述声音信息对应的所述目标发声生物为疾病状态;若上述目标声音特征与所述疾病数据不匹配,则判断上述目标声音特征与上述健康数据库的亚健康数据是否匹配;若所述目标声音特征与所述亚健康数据匹配,则确定所述声音信息对应的所述目标发声生物为亚健康状态;若上述目标声音特征与所述健康数据库的亚健康数据不匹配,则判断上述目标声音特征与所述健康数据库的完全健康数据是否匹配;若上述目标声音特征与上述完全健康数据匹配,则确定上述声音信息对应的上述目标发声生物为完全健康状态。
在一个实施例中,判断上述目标声音特征与健康数据库的完全健康数据是否匹配之后,包括:若所述目标声音特征与所述完全健康数据不匹配,将所述目标声音特征输入所述健康状态模型以得到所述目标声音特征对应的健康状态数据,并将所述目标声音特征以及对应的健康状态数据添加到所述健康数据库,避免前期健康数据库匹配不到新的声音特征而造成误判断。
在一个实施例中,所述根据所述匹配结果输出所述声息信息对应的目标发声生物的健康状态的步骤之后,包括:根据所述健康状态对所述目标发声生物的身体健康程度打分,并匹配对应所述身体健康程度的休养建议,用户更直观知道身体的健康程度情况。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM一多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于声音识别的健康管理方法,其特征在于,包括:
获取声音信息;
提取所述声音信息的目标声音特征;
将所述目标声音特征输入到预设的健康数据库中进行匹配,其中,所述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据;
所述健康数据库中的声音特征对应的健康状态数据为所述声音特征经健康状态模型预测得到的预测结果;所述健康状态模型为多个已知健康状态数据的声音特征训练得到的模型;
获取匹配结果,并根据所述匹配结果输出所述声音信息对应的目标发声生物的健康状态。
2.根据权利要求1所述的基于声音识别的健康管理方法,其特征在于,所述获取声音信息的步骤之后,包括:
提取所述声音信息的声纹特征;
将所述声纹特征输入声纹识别模型中获取所述声音信息对应的目标发声生物的身份;
将所述目标发声生物的身份以及所述目标发声生物的健康状态结合,并输出结合结果。
3.根据权利要求2所述的基于声音识别的健康管理方法,其特征在于,所述预设的健康数据库包括多个,各健康数据库与生物种类一一对应,所述将所述目标声音特征输入到预设的健康数据库中进行匹配的步骤之前,包括:
根据所述声纹特征判断所述声音信息对应的目标发声生物的生物种类;
调用与所述声音信息对应的生物种类对应的健康数据库。
4.根据权利要求1所述的基于声音识别的健康管理方法,其特征在于,所述健康状态数据包括疾病数据、亚健康数据、完全健康数据;所述将所述目标声音特征输入到预设的健康数据库中进行匹配的步骤,包括:
判断所述目标声音特征与所述健康数据库的疾病数据是否匹配;
若所述目标声音特征与所述疾病数据匹配,则确定所述声音信息对应的所述目标发声生物为疾病状态;若所述目标声音特征与所述疾病数据不匹配,则判断所述目标声音特征与所述健康数据库的亚健康数据是否匹配;
若所述目标声音特征与所述亚健康数据匹配,则确定所述声音信息对应的所述目标发声生物为亚健康状态;若所述目标声音特征与所述健康数据库的亚健康数据不匹配,则判断所述目标声音特征与所述健康数据库的完全健康数据是否匹配;
若所述目标声音特征与所述完全健康数据匹配,则确定所述声音信息对应的所述目标发声生物为完全健康状态。
5.根据权利要求4所述的基于声音识别的健康管理方法,其特征在于,所述判断所述目标声音特征与所述健康数据库的完全健康数据是否匹配的步骤之后,包括:
若所述目标声音特征与所述完全健康数据不匹配,则将所述目标声音特征输入所述健康状态模型以得到所述目标声音特征对应的健康状态数据,并将所述目标声音特征以及对应的健康状态数据添加到所述健康数据库。
6.根据权利要求1所述的基于声音识别的健康管理方法,其特征在于,所述根据所述匹配结果输出所述声音信息对应的目标发声生物的健康状态的步骤之后,包括:
根据所述健康状态对所述目标发声生物的身体健康程度打分,并匹配对应所述身体健康程度的休养建议。
7.根据权利要求1所述的基于声音识别的健康管理方法,其特征在于,所述方法还包括:
获取指定量的样本数据,并将样本数据分成训练集和测试集,其中,所述样本数据包括已提取出的声音特征,以及与所述声音特征对应的健康状态数据;
将训练集的样本数据输入到预设的HMM中进行训练,得到结果训练模型;
利用所述测试集的样本数据验证所述结果训练模型;
如果验证通过,则将所述结果训练模型记为所述健康状态模型。
8.一种基于声音识别的健康管理装置,其特征在于,包括:
获取单元,用于获取声音信息;
提取单元,用于提取所述声音信息的目标声音特征;
匹配单元,用于将所述目标声音特征输入预设的健康数据库中进行匹配,其中,所述健康数据库包括多个声音特征以及各声音特征分别对应的健康状态数据;所述健康数据库中的声音特征对应的健康状态数据为所述声音特征经健康状态模型预测得到的预测结果;所述健康状态模型为多个已知健康状态数据的声音特征训练得到的模型;
输出单元,用于获取匹配结果,并根据所述匹配结果输出所述声音信息对应的目标发声生物的健康状态。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201810652310.XA 2018-06-22 2018-06-22 基于声音识别的健康管理方法、装置、计算机设备和存储介质 Pending CN109171644A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810652310.XA CN109171644A (zh) 2018-06-22 2018-06-22 基于声音识别的健康管理方法、装置、计算机设备和存储介质
PCT/CN2018/108388 WO2019242155A1 (zh) 2018-06-22 2018-09-28 基于声音识别的健康管理方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810652310.XA CN109171644A (zh) 2018-06-22 2018-06-22 基于声音识别的健康管理方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN109171644A true CN109171644A (zh) 2019-01-11

Family

ID=64948728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810652310.XA Pending CN109171644A (zh) 2018-06-22 2018-06-22 基于声音识别的健康管理方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN109171644A (zh)
WO (1) WO2019242155A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136743A (zh) * 2019-04-04 2019-08-16 平安科技(深圳)有限公司 基于声音采集的健康状态监控方法、装置及存储介质
CN110189757A (zh) * 2019-06-27 2019-08-30 电子科技大学 一种大熊猫个体识别方法、设备及计算机可读存储介质
CN110368005A (zh) * 2019-07-25 2019-10-25 深圳大学 一种智能耳机及基于智能耳机的情绪及生理健康监控方法
CN110473616A (zh) * 2019-08-16 2019-11-19 北京声智科技有限公司 一种语音信号处理方法、装置及系统
CN110853294A (zh) * 2019-10-29 2020-02-28 广东美的白色家电技术创新中心有限公司 利用家用电器进行监控的方法、装置和计算机存储介质
CN111210915A (zh) * 2020-04-17 2020-05-29 北京海益同展信息科技有限公司 一种疫情管控方法及系统
CN112509697A (zh) * 2020-12-04 2021-03-16 南京大学 一种多模块智慧健康管理信息系统
CN116030562A (zh) * 2022-11-17 2023-04-28 北京声智科技有限公司 数据处理方法、装置、设备及介质
CN116439661A (zh) * 2023-03-24 2023-07-18 中国人民解放军总医院第六医学中心 一种围产期的产妇生理状态监测评估方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222500A (zh) * 2011-05-11 2011-10-19 北京航空航天大学 结合情感点的汉语语音情感提取及建模方法
US20120220899A1 (en) * 2011-02-28 2012-08-30 Samsung Electronics Co., Ltd. Apparatus and method of diagnosing health by using voice
CN105895105A (zh) * 2016-06-06 2016-08-24 北京云知声信息技术有限公司 语音处理方法及装置
CN106725329A (zh) * 2016-12-30 2017-05-31 天津森宇科技发展有限公司 根据发音判别人体健康状态的智能识别系统
CN107704549A (zh) * 2017-09-26 2018-02-16 百度在线网络技术(北京)有限公司 语音搜索方法、装置及计算机设备
CN107967917A (zh) * 2016-10-19 2018-04-27 福特全球技术公司 通过神经网络机器学习的车辆周围音频分类

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005002433A1 (en) * 2003-06-24 2005-01-13 Johnson & Johnson Consumer Compagnies, Inc. System and method for customized training to understand human speech correctly with a hearing aid device
CN103810374B (zh) * 2013-12-09 2017-04-05 中国矿业大学 一种基于mfcc特征提取的机器故障预测方法
CN106847293A (zh) * 2017-01-19 2017-06-13 内蒙古农业大学 设施养殖羊应激行为的声信号监测方法
CN106941005A (zh) * 2017-02-24 2017-07-11 华南理工大学 一种基于语音声学特征的声带异常检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120220899A1 (en) * 2011-02-28 2012-08-30 Samsung Electronics Co., Ltd. Apparatus and method of diagnosing health by using voice
CN102222500A (zh) * 2011-05-11 2011-10-19 北京航空航天大学 结合情感点的汉语语音情感提取及建模方法
CN105895105A (zh) * 2016-06-06 2016-08-24 北京云知声信息技术有限公司 语音处理方法及装置
CN107967917A (zh) * 2016-10-19 2018-04-27 福特全球技术公司 通过神经网络机器学习的车辆周围音频分类
CN106725329A (zh) * 2016-12-30 2017-05-31 天津森宇科技发展有限公司 根据发音判别人体健康状态的智能识别系统
CN107704549A (zh) * 2017-09-26 2018-02-16 百度在线网络技术(北京)有限公司 语音搜索方法、装置及计算机设备

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136743A (zh) * 2019-04-04 2019-08-16 平安科技(深圳)有限公司 基于声音采集的健康状态监控方法、装置及存储介质
CN110189757A (zh) * 2019-06-27 2019-08-30 电子科技大学 一种大熊猫个体识别方法、设备及计算机可读存储介质
CN110368005A (zh) * 2019-07-25 2019-10-25 深圳大学 一种智能耳机及基于智能耳机的情绪及生理健康监控方法
CN110473616B (zh) * 2019-08-16 2022-08-23 北京声智科技有限公司 一种语音信号处理方法、装置及系统
CN110473616A (zh) * 2019-08-16 2019-11-19 北京声智科技有限公司 一种语音信号处理方法、装置及系统
CN110853294A (zh) * 2019-10-29 2020-02-28 广东美的白色家电技术创新中心有限公司 利用家用电器进行监控的方法、装置和计算机存储介质
WO2021082196A1 (zh) * 2019-10-29 2021-05-06 广东美的白色家电技术创新中心有限公司 利用家用电器进行监控的方法、装置和计算机存储介质
CN111210915A (zh) * 2020-04-17 2020-05-29 北京海益同展信息科技有限公司 一种疫情管控方法及系统
CN112509697A (zh) * 2020-12-04 2021-03-16 南京大学 一种多模块智慧健康管理信息系统
CN112509697B (zh) * 2020-12-04 2023-08-22 南京大学 一种多模块智慧健康管理信息系统
CN116030562A (zh) * 2022-11-17 2023-04-28 北京声智科技有限公司 数据处理方法、装置、设备及介质
CN116439661A (zh) * 2023-03-24 2023-07-18 中国人民解放军总医院第六医学中心 一种围产期的产妇生理状态监测评估方法及系统
CN116439661B (zh) * 2023-03-24 2023-09-29 中国人民解放军总医院第六医学中心 一种围产期的产妇生理状态监测评估方法及系统

Also Published As

Publication number Publication date
WO2019242155A1 (zh) 2019-12-26

Similar Documents

Publication Publication Date Title
CN109171644A (zh) 基于声音识别的健康管理方法、装置、计算机设备和存储介质
JP6858316B2 (ja) 認知機能リハビリテーション訓練方法および装置
WO2019144658A1 (zh) 智能便器及电器系统
CN110192252A (zh) 用于评估发育状况并提供覆盖度和可靠性控制的方法和装置
KR102301143B1 (ko) 맞춤형 인지 기능 검사 및 재활 훈련 평가 방법
CN111933291A (zh) 医疗信息推荐装置、方法、系统、设备及可读存储介质
CN103251388A (zh) 基于智能手机平台的打鼾监测和防治方法及系统
CN108154927A (zh) 一种智能中医机器人软件架构
WO2021047190A1 (zh) 基于残差网络的报警方法、装置、计算机设备和存储介质
CN105528611A (zh) 用于疼痛识别的分类器训练方法及其装置
CN111091884B (zh) 一种医院信息集成平台的患者主索引匹配系统及方法
CN109448758A (zh) 语音韵律异常评估方法、装置、计算机设备和存储介质
CN103258545A (zh) 一种病理嗓音细分方法
DE102015218948A1 (de) Vorrichtung und Verfahren zur Bestimmung eines medizinischen Gesundheitsparameters eines Probanden mittels Stimmanalyse
CN110755091A (zh) 一种个人心理健康监测系统及方法
CN110473631B (zh) 基于真实世界研究的智能睡眠监测方法和系统
CN117497141A (zh) 一种针对患者的心理干预智能交互系统以及方法
Carneiro et al. Predicting completion time in high-stakes exams
CN110909621A (zh) 一种基于视觉的健身指导系统
CN108962397B (zh) 一种基于笔和语音的协同任务神经系统疾病辅助诊断系统
JP2014518579A (ja) マルチモーダル情報に基づく人口学的分析方法及びシステム
AU2021101097A4 (en) A system and method for automatic playlist generation by analysing human emotions through physiological signals
CN113380418A (zh) 一种通过对话文本分析识别抑郁症的系统
CN110909566A (zh) 健康分析方法、移动终端和计算机可读存储介质
KR101274431B1 (ko) 설문 정보를 이용한 건강 상태 판단 장치 및 방법, 건강 분류 함수 생성 장치 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190111