CN110494916A

CN110494916A - 用于心脏疾病的口头定期筛查

Info

Publication number: CN110494916A
Application number: CN201880024171.4A
Authority: CN
Inventors: 伊尔米亚胡·豪普特曼; 阿龙·戈伦; 伊莱·阿塔尔; 平哈斯·萨巴赫
Original assignee: Cardioco Co Ltd
Current assignee: Cardioco Co Ltd
Priority date: 2017-02-12
Filing date: 2018-02-12
Publication date: 2019-11-22
Also published as: EP3580754A4; IL268664B2; IL268664A; KR20190113968A; US20220375491A1; US11398243B2; JP7353592B2; WO2018146690A1; EP3580754A1; US20190362740A1; JP2020507437A

Abstract

一种用于分析一对象的一语音样本以决定一心脏状况例如一心律失常状况的方法，包括从所述语音样本提取至少一个语音特征，检测所述心脏状况对所述至少一个语音特征的一影响，及基于所述影响决定所述心脏状况。还公开一种用于由所述对象提供的所述语音样本决定所述心脏状况的系统。还描述多个相关的装置及方法。

Description

用于心脏疾病的口头定期筛查

相关申请案

本申请主张于2017年2月12日提交的美国临时专利申请案第62/457,914号的优先权，其内容通过引用整体并入本文。

发明领域及背景技术

本发明在其一些实施例中涉及使用语音的医学诊断，特别地但非排他地涉及基于人类语音(human voice)估计多种的心脏状况(cardiac conditions)。

美国专利申请公开第US2012/0220899号公开一种用于诊断一用户的健康状态的方法及装置。所述装置包括一语音检测单元，其检测及监视一用户的语音；一语音分析单元，其基于待诊断的一健康状态，其从由所述语音检测单元被检测到的一语音提取一语音特征；一语音诊断单元，其通过将由所述语音分析单元提取的所述语音特征与一异常状态参考进行比较来诊断所述用户的一健康状态，并且监视处于所述健康状态的一变化；及一诊断输出单元，其输出关于所述健康状态的信息及由所述语音诊断单元诊断的一健康状态变化。

美国专利申请公开第US2014/0122063号公开一种用于记录及分析语音的方法及计算系统，所述语音允许计算一系列待计算的发声参数。这些传递关于由有机疾患(影响喉部生理)或神经疾患(影响言语大脑中枢，cerebral centers of speech)造成影响的相关信息。诸多分类方法也被认为是本发明的一基本部分，允许获得对待获得的现有功能障碍的估计及个性的分配。

附加的背景技术包括：

葡萄牙波尔图的波尔图大学工程学院电气与计算机工程系的桑德拉·迪亚斯(Sandra Dias)及阿尼巴尔·费雷拉(Anibal Ferreira)撰写的一文章的标题为：“声门脉波估计-一频域方法”，被发布在万维网上，网址为www.ortra.com/events/Portals/16/Dias％20et％20al_AfekaConfSP2014.pdf；

于2012年7月由桑德拉·德·奥利维埃拉·迪亚斯(Sandra de Oliviera Dias)提交给波尔图大学工程学院的一硕士论文，标题为：“从言语或歌声中估计声门脉波”。

雷磊、王超、刘鑫，题为“利用稀疏度测量的离散小波变换分解水平决定”的一文章发表在国际电气、计算机、能量、电子及通信工程期刊：第7卷，编号9，2013年；

由托马斯·迪格莫尔(Thomas Drugmore)撰写的一博士论文的标题为“声门分析及其应用的进展”，获得蒙斯大学应用科学博士学位；

美国专利号US 8,078,470；

美国专利申请公开号US 2008/0045805；

美国专利号US 7,917,366；

美国专利号US 8,249,875；

美国专利号US 8,768,708；

国际申请公开号WO 2016/035070；

国际申请公开号WO 2014/037937；及

美国专利号US 7,398,213。

发明内容

示例1：一种分析一对象的一语音样本以决定一心律失常的心脏状况的方法，包括：

从所述语音样本中提取至少一个语音特征；

检测一血流对至少一个语音特征的一影响；

基于所述影响决定一心律失常的心脏状况。

示例2：根据示例1的所述方法，其中决定一心律失常的心脏状况包括对多个被识别的影响进行整合。

示例3：根据示例1至示例2中任一者所述的方法，其中所述识别一影响包括识别所述血流的一节奏、所述血流的一周期性及所述血流的一幅度或幅度变化中的至少一个的一影响。

示例4：根据示例1的所述方法，还包括对所述语音样本进行分类以识别多个浊音段。

示例5：根据示例4的所述方法，还包括串接所述多个浊音段，使得至少一些段被移除并且剩余的多个段末端被平滑化。

示例6：根据示例1至5中任一者的所述方法，还包括将与在从所述语音样本被移除的多个段中的所述血流有关的数据进行外推。

示例7：根据示例1至6中任一者的所述方法，其中所述被检测的影响包括心脏脉搏的一节奏。

示例8：根据示例7的所述方法，其中所述检测一影响包括识别心脏脉搏至少连续发生三次。

在一些实施例中，通过识别心脏脉搏连续发生三次以检测一影响潜在地花费大约相当于心脏脉搏连续发生三次的一时间，或大约2至3秒。将所述检测一心脏状况在2至3秒内的一影响与通过一ECG的检测进行比较，所述ECG的检测通常仅需要持续超过2至3秒的一设置(放置多个电极)。

示例9：根据示例8的所述方法，其中所述决定一心律失常的心脏状况包括计算在所述心脏脉搏至少连续发生三次之间的多个时间间隔。

示例10：根据示例9的所述方法，其中所述决定一心律失常的心脏状况包括将所述多个时间间隔与从一参考心脏状况被获得的多个参考时间间隔进行匹配。

示例11：根据示例10所述的所述方法，其中所述决定还包括：

决定所述匹配的一概率；及

将所述概率与用于决定所述心律失常的心脏状况的一阈值进行比较。

示例12：根据示例11的所述方法，其中所述参考心脏状况是健康的或心律失常的。

示例13：根据示例7至12中任一者的所述方法，其中一心脏脉搏发生至少三次没有在相同的浊音段中被识别。

示例14：根据示例7至13中任一者的所述方法，其中所述检测一影响包括识别心脏脉搏连续发生至少两次。

在一些实施例中，通过识别心脏脉搏连续发生两次以检测一影响潜在地花费大约相当于心脏脉搏连续发生两次的一时间，或大约2秒。

示例15：根据示例1至14中任一者的所述方法，其中所述被检测的影响包括一心脏脉搏的一幅度或在一幅度中的一变化的一影响。

示例16：根据示例15的方法，其中所述检测一影响包括计算所述至少一个语音特征的多个值的一分布。

示例17：根据示例16的方法，其中所述分布包括标准偏差。

示例18：根据示例16至17中任一者的所述方法，其中所述基于所述影响决定一心律失常的心脏状况包括将所述分布的一表征参数与一阈值进行比较。

示例19：根据示例18的所述方法，其中所述表征参数包括所述分布的一形状。

示例20：根据示例19的所述方法，其中所述值包括所述形状的一宽度。

示例21：根据示例1至20中任一者的所述方法，其中所述被检测的影响包括心脏脉搏的一周期性的一影响。

示例22：根据示例1至21中任一者的所述方法，还包括估计所述对象的一心率。

示例23：根据示例22的所述方法，其中所述决定一心律失常的心脏状况包括在所述心率的一频率周围的一预定范围处表征所述周期性。

示例24：根据示例23的所述方法，其中所述表征包括计算在所述预定范围处的一波峰的一带宽。

示例25：根据示例24的所述方法，其中所述决定所述心律失常的心脏状况包括将所述带宽与一阈值进行比较。

示例26：根据示例1至25中任一者的所述方法，还包括验证所述决定一心律失常的心脏状况。

示例27：根据示例26的所述方法，其中所述验证包括获得一第二语音样本，所述第二语音样本包括一预定发声(predetermined vocalization)。

示例28：根据示例26的方法，其中所述验证包括对所述对象的一心电图测试及一光电容积描记测试中的至少一种。

示例29：根据示例1至28中任一者的所述方法，其中所述心律失常的心脏状况包括心房颤动(atrial fibrillation)。

示例30：根据示例1至29中任一者的所述方法，其中所述语音样本是自发的言语。

示例31：根据示例1至30中任一者的所述方法，其中所述语音样本包括多个对象的多个语音。

示例32：根据示例31的所述方法，还包括从所述语音样本提取所述对象的多个语音段。

示例33：根据示例1至32中任一者的所述方法，其中所述语音特征包括一音高。

示例34：根据示例1至33中任一者的所述方法，其中提取所述语音特征包括提取梅尔频率倒谱系数(MFCC)。

示例34.1：根据示例1至34中任一者的所述方法，其中提取所述语音特征包括计算交叉相干性。在一些实施例中，所述交叉相干性在所述音高及/或多个共振峰频率处被计算。在一些实施例中，交叉相干性可选地在所述言语信号中的两个段的一组或多组之间被计算。在一些实施例中，具备较低相干性的一组(两个段)可以可选地用作在所述多个段期间发生的心脏脉搏的指示。

在一些实施例中，交叉相干性被计算如下：

Speech_frame(m)＝

{Speech(t+Ts*m),Speech((t+1)+Ts*m)…Speech((t+Tw)+Ts*m)}

其中：

“Ts”-在多个帧之间的一时间步长[秒(sec)]

“Tw”-是每帧的一持续时间[秒]

“m”-是一帧编号

“t”-时间

“Speech”-是所述多个言语样本

“Speech_frame(m)”-是在时间Ts*m的多个言语样本的一帧(frame)

Coh(m,m+T)＝CrossCoherence(Speech_frame(m),Speech_frame(m+T))

Coh(m,m+T)是在时间((m+T)*Ts)的帧“m”(在时间m*Ts)与帧“m+T”之间的一交叉相干性

所述相干性的多个值在0到1的一范围内，其中1是一完美匹配。

上述方法可选地包括针对每个帧m(在Ts*m[秒(sec)]的一时间)找到一帧距离T，其中所述相干性下降到一阈值以下。在一些实施例中，所述阈值为0.1至0.98，例如：0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、0.95、0.97及0.98。

在一些实施例中，时间T*Ts是RR间隔的一估计。

在一些实施例中，所述整体交叉相干性扰动(分布的宽度)可选地用作AF的一指示。那就是具备AF的言语会有一更广泛的分布、一更大的标准偏差。

示例34.2：根据示例1至33中任一示例的所述方法，其中提取所述语音特征包括所述调制频谱的多个特定特性(specific properties)。

在一些实施例中，所述声学特征的所述频谱的所述属性可选地在每个帧中被计算用作病理的言语的指示。

34.3根据示例1至34.2中任一者的所述方法，其中提取所述语音特征包括进行从下列组成的群组中被选择的言语信号的分析：

小波分析；

声门脉波分析；及

线性预测编码(LPC)分析。

示例35：根据示例1至33中任一者的所述方法，其中所述语音特征包括进行在所述言语信号的一周期与所述言语信号的另一周期之间的交叉相干性。

示例36：根据示例1至35中任一者的所述方法，其中提取所述语音特征包括进行小波变换(WT)。

示例35：一种用于由一对象提供的一语音样本决定一心律失常的心脏状况的系统，包括：

一语音输入，用于获得所述语音样本的一数字语音样本；

一语音特征提取器，从所述数字语音样本提取至少一个语音特征；

一语音特征处理器，用于识别心脏活动对至少一个语音特征的一影响；

一心脏状况分类器，基于所述影响决定心律失常的心脏状况。

示例36：根据示例35的所述系统，其中所述语音输入形成一移动电话的一部分。

示例37：根据示例35的所述系统，其中所述语音输入形成一汽车多媒体系统的一部分。

示例38：根据示例35至37中任一者的所述系统，其中所述语音特征提取器、语音特征处理器及心脏状况分类器中的至少一个位于一服务器处。

示例39：根据示例38的所述系统，其中所述服务器与一电话交换机并置并从所述交换机获取数据。

示例40：根据示例35至39中任一者的所述系统，其中所述语音输入被配置为根据一预定调度获得所述数字语音样本。

示例41：根据示例35至40中任一者的所述系统，还包括一永久的内存(permanentmemory)。

示例42：根据示例41的所述系统，其中所述内存存储从与一心律失常的心脏状况或一健康的心脏状况相关联的多个语音样本派生的多个参考语音特征。

示例43：根据示例42的所述系统，其中所述心脏状况分类器基于表征所述多个参考语音特征的一训练阶段以决定所述心律失常的心脏状况。

示例44：根据示例41所述的系统，其中所述永久的内存存储来自所述对象的至少一个先前收集的语音样本。

示例45：根据示例44所述的系统，其中所述心脏状况分类器基于所述先前收集的语音样本与所述数字语音样本之间的一变化以决定所述心律失常的心脏状况。

示例46：一种分析一对象的一语音样本以决定一心脏状况的方法，包括：

从语音样本中提取至少一个语音特征；

检测一血流对至少一个语音特征的一影响，所述影响是所述血流的一节奏、所述血流的一周期性及所述血流的一幅度或幅度变化中的至少一个；

基于所述影响决定一心脏状况。

示例47：根据示例46的所述方法，其中所述被决定的心脏状况包括一异常心率。

示例48：根据示例47的所述方法，其中所述异常心率包括心室心动过速(ventricle tachycardia)。

示例49：根据示例46的所述方法，其中所述被决定的心脏状况包括异位搏动(ectopic beats)。

示例50：根据示例49的所述方法，其中所述被决定的具备所述异位搏动的心脏状况包括室性早搏(premature ventricular contraction)。

示例51：一种用于分析一对象的一语音样本以重建一心脏行为的方法，包括：

从所述语音样本中提取至少一个语音特征；

检测一血流对至少一个语音特征的一影响；及

从所述被检测的影响重建所述心脏行为的一个或多个参数。

示例52：根据示例51的方法，其中所述心脏行为包括一心脏颤动发生(anoccurrence of cardiac fibrillation)。

示例53：根据示例52的所述方法，包括：当识别心脏颤动发生多于一预定数量时，决定一心律失常的心脏状况的一存在性。

示例54：根据示例52的所述方法，包括：当识别心脏颤动发生少于一预定数量时，排除一心律失常的心脏状况的一存在性。

示例55：根据示例51的所述方法，其中心脏行为的一个或多个参数指示一非心律失常的心脏状况。

示例56：根据示例51的所述方法，其中所述一个或多个参数包括一脉波形状。

根据本发明的一些实施例的一个方面，提供一种用于分析一对象的一语音样本以决定一心律失常的心脏状况的方法，所述方法包括从所述语音样本中提取至少一个语音特征、检测一心脏状况对所述至少一个语音特征的一影响，基于所述影响决定一心律失常的心脏状况。

根据本发明的一些实施例，所述检测一心脏状况对至少一个语音特征的一影响包括检测一心脏状况被至少一个影响语音的起因(cause affecting voice)选自于由血流、心室搏动(ventricular beat)及心房搏动(atrial beat)组成的一群组对所述至少一个语音特征所造成的一影响。

根据本发明的一些实施例，所述检测一影响包括识别所述影响语音的起因的一节奏(timing)、所述影响语音的起因的一周期性及所述影响语音的起因的一幅度或幅度变化中的至少一个的一影响。

根据本发明的一些实施例，所述决定一心律失常的心脏状况包括整合多个所述被识别的影响。

根据本发明的一些实施例，还包括对所述语音样本进行分类以识别多个浊音段(voiced segments)。

根据本发明的一些实施例，还包括串接(concatenating)所述多个浊音段，使得至少一些段被移除并且剩余的多个段末端被平滑化(smoothed)。

根据本发明的一些实施例，还包括将与在从所述语音样本被移除的多个段中的所述影响语音的起因有关的数据进行外推。

根据本发明的一些实施例，所述被检测的影响包括心脏脉搏的一节奏。

根据本发明的一些实施例，所述检测一影响包括识别心脏脉搏连续发生三次(three consecutive occurrences of heart pulses)。

根据本发明的一些实施例，所述决定一心律失常的心脏状况包括计算在心脏脉搏的连续多次发生之间的多个时间间隔，并将所述多个时间间隔与从一参考心脏状况获得的多个参考时间间隔进行匹配。

根据本发明的一些实施例，所述决定还包括决定所述匹配的一概率，并将所述概率与用于决定所述心律失常的心脏状况的一阈值进行比较。

根据本发明的一些实施例，所述参考心脏状况是健康的或心律失常的。

根据本发明的一些实施例，一心脏脉搏发生所述发生三次没有在相同的浊音段中被识别出。

根据本发明的一些实施例，所述检测一影响包括识别心脏脉搏连续发生两次。

根据本发明的一些实施例，所述被检测的影响包括一心脏脉搏的一幅度或在一幅度中的一变化的一影响。

根据本发明的一些实施例，所述检测一影响包括计算所述至少一个语音特征的多个值的一分布。

根据本发明的一些实施例，所述基于所述影响决定一心律失常的心脏状况包括将所述分布的一表征参数与一阈值进行比较。

根据本发明的一些实施例，所述表征参数包括所述分布的一形状。

根据本发明的一些实施例，所述值包括所述形状的一宽度。

根据本发明的一些实施例，所述被检测的影响包括对心脏脉搏的一周期性的一影响。

根据本发明的一些实施例，还包括估计所述对象的一心率。

根据本发明的一些实施例，决定一心律失常的心脏状况包括表征在所述心率的一频率周围的一预定范围的所述周期性，所述特征包括计算在所述预定范围的一波峰的一带宽，并且决定所述心律失常的心脏状况包括将所述带宽与一阈值进行比较。

根据本发明的一些实施例，还包括验证所述决定一心律失常的心脏状况。

根据本发明的一些实施例，所述验证包括获得一第二语音样本，所述第二语音样本包括一预定发声。

根据本发明的一些实施例，所述验证包括对所述对象的一心电图测试及一光电容积描记测试中的至少一种。

根据本发明的一些实施例，所述心律失常的心脏状况包括心房颤动。

根据本发明的一些实施例，所述语音样本是自发的言语。

根据本发明的一些实施例，所述语音特征包括一音高。

根据本发明的一些实施例，提取所述语音特征包括进行在所述语音样本的一第一段与所述语音样本的一第二段之间的交叉相干性。

根据本发明的一些实施例，提取所述语音特征包括执行选自于以下组成的一群组中的所述语音信号的分析：小波分析、梅尔频率倒谱系数(MFCC)分析、声门脉波分析及线性预测编码分析(LPC)。

根据本发明的一些实施例的一个方面，提供一种用于由一对象提供的一语音样本决定一心律失常的心脏状况的系统，包括：一语音输入，用于获得所述语音样本的一数字语音样本；一语音特征提取器，从所述数字语音样本提取至少一个语音特征；一语音特征处理器，识别心脏活动对所述至少一个语音特征的一影响；及一心脏状况分类器，基于所述影响决定心律失常的心脏状况。

根据本发明的一些实施例，所述语音输入形成一移动电话、一数字助理及一汽车多媒体系统中的至少一个的一部分。

根据本发明的一些实施例，所述语音特征提取器、所述语音特征处理器及所述心脏状况分类器中的至少一个位在一服务器处。

根据本发明的一些实施例，所述服务器与一电话交换机并置且从所述交换机获取所述数据。

根据本发明的一些实施例，所述语音输入被配置为根据一预定时间表获得所述数字语音样本。

根据本发明的一些实施例，还包括一永久的内存，其中所述内存存储多个参考语音特征，所述多个参考语音特征从与一心律失常的心脏状况或一健康的心脏状况相关的多个语音样本被派生。

根据本发明的一些实施例，所述心脏状况分类器基于表征所述多个参考语音特征的一训练阶段决定所述心律失常的心脏状况。

根据本发明的一些实施例，所述永久的内存存储来自所述对象的至少一个先前收集的语音样本。

根据本发明的一些实施例，所述心脏状况分类器基于所述先前收集的语音样本与所述数字语音样本之间的一变化决定所述心律失常的心脏状况。

根据本发明的一些实施例的一个方面，提供一种用于由一对象提供的一语音样本决定一心脏状况的系统，包括：一语音输入，用于获得所述语音样本的一数字语音样本；一语音特征提取器，从所述数字语音样本提取至少一个语音特征；一语音特征处理器，识别一心脏状况对所述至少一个语音特征的一影响；及一心脏状况分类器，基于所述影响决定所述心脏状况。

根据本发明的一些实施例的一个方面，提供一种用于分析一对象的一语音样本以决定一心脏状况的方法，包括：从所述语音样本提取至少一个语音特征；检测一血流对所述至少一个语音特征的一影响，所述影响是所述血流的一节奏、所述血流的一周期性及所述血流的一幅度或幅度变化中的至少一种；及基于所述影响决定一心脏状况。

根据本发明的一些实施例，所述被决定的心脏状况包括一异常心率。

根据本发明的一些实施例，所述异常心率包括心室心动过速。

根据本发明的一些实施例，所述被决定的心脏状况包括异位搏动及室性早搏中的至少一种。

根据本发明的一些实施例的一个方面，提供一种用于分析一对象的一语音样本以重建一心脏行为的方法，包括：从所述语音样本提取至少一个语音特征；检测一血流对所述至少一个语音特征的一影响；及从所述被检测的影响重建所述心脏行为的一个或多个参数。

根据本发明的一些实施例，所述心脏行为包括一心脏颤动发生。

根据本发明的一些实施例，当识别心脏颤动发生多于一预定数量时，决定一心律失常的心脏状况的一存在性。

根据本发明的一些实施例，当识别心脏颤动发生少于一预定数量时，排除一心律失常的心脏状况的一存在性。

根据本发明的一些实施例，所述心脏行为的一个或多个参数指示一非心律失常的心脏状况。

根据本发明的一些实施例，所述一个或多个参数包括一脉波形状。

如本领域技术人员将理解的，本发明的一些实施例可以被实施为一系统、方法或计算机程序产品。因此，本发明的一些实施例可以采用一完全为硬件的实施例、一完全为软件的实施例(包括固件、常驻软件、微代码等)的形式或者组合软件及硬件方面的一实施例，这通常都可以引用在本文中被称为一“电路(circuit)”、“模块(module)”或“系统(system)”。此外，本发明的一些实施例可以采取被实施在一个或多个计算机可读介质中的计算机程序产品的形式，所述计算机可读介质具有被实施在其上的计算机可读程序代码。本发明的一些实施例的方法及/或系统的实现方案可以涉及手动地、自动地或其一组合进行及/或完成多个被选的任务。此外，根据本发明的方法及/或系统的一些实施例的实际仪器及设备，几个被选的任务可以由硬件、由软件或由固件及/由或其一组合被实现，例如：使用一操作系统。

例如：根据本发明的一些实施例的用于进行多个被选的任务的硬件可以被实现为一芯片或一电路。作为软件，根据本发明的一些实施例的多个被选的任务可以被实现为由一计算机使用任何合适的操作系统执行的多个软件指令。在本发明的一示例性实施例中，根据在本文中被描述的方法及/或系统的一些示例性实施例的一个或多个任务由一数据处理器进行，诸如用于执行多个指令的一计算平台，甚至是一蜂窝电话。可选地，所述数据处理器包括用于存储指令及/或数据的一易失性内存(volatile memory)及/或用于存储指令及/或数据的一非易失性存储器(non-volatile storage)，例如一磁性硬盘及/或可移动介质。可选地，一网络连接被提供为佳。一显示器及/或一用户输入设备诸如一键盘或鼠标可选地被提供为佳。

一个或多个计算机可读介质的任何组合可以被用于本发明的一些实施例。所述计算机可读介质可以是一计算机可读信号介质或一计算机可读存储器介质。一计算机可读存储器介质可以是例如但不限于一电子式、磁性式、光学式、电磁式、红外式或半导体系统、设备或装置，或前述的任何适当组合。所述计算机可读存储器介质的多个更具体的示例(一非详尽列表)将包括如下内容：具有一条或多条线的一电连接件、一便携式计算机磁盘、一硬盘、一随机存取内存(RAM)、一只读内存(ROM)、一可擦除可编程只读内存(EPROM或闪存)、一光纤、一便携式光盘只读内存(CD-ROM)、一光学存储器装置、一磁存储器装置或任何上述的适当组合。在本文中文件的上下文中，一计算机可读存储器介质可以是任何有形介质，其可以包含或存储一程序以供一指令执行系统、设备或装置使用或与其结合使用。

一计算机可读信号介质可以包括一被传播的数据信号，所述被传播的数据信号具备被实施在其中的计算机可读程序代码，例如：在基带中或作为一载波的一部分。这样的一种被传播的信号可以采用多种形式中的任何一种，包括但不限于电磁式、光学式或其任何合适的组合。一计算机可读信号介质可以为的任何计算机可读介质，所述的任何计算机可读介质不是计算机可读存储器介质并且可以通信、传播或传输程序以供一指令执行系统、设备或装置使用或与其结合使用。

在一计算机可读介质上被实施的程序代码及/或由此被使用的数据可以使用任何适当的介质被传输，包括但不限于无线、有线、光纤电缆、RF等，或者前述的任何合适的组合。

用于进行本发明的一些实施例的多个操作的计算机程序代码可以用一种或多种编程语言的任何组合被编写，包括一面向对象编程语言诸如Java、Smalltalk、C++等，以及传统流程编程语言诸如“C”编程语言或类似的编程语言。所述程序代码可以完全地在所述用户的计算机上执行、部分地在所述用户的计算机上执行、作为一独立的软件包执行、部分地在所述用户的计算机上执行、部分地在一远程计算机上执行或完全地在所述远程计算机或服务器上执行。在后一种情境下，所述远程计算机可以通过任何类型的网络被连接到所述用户的计算机，包括一局域网(LAN)或一广域网(WAN)，或者可以连接到一外部计算机(例如：通过使用一互联网服务提供商的所述互联网)。

本发明的一些实施例可以参考根据本发明实施例的方法、装置(系统)及计算机程序产品的流程图例及/或框图被描述如下。将被理解的是，所述流程图例及/或框图的每个框及在流程图例及/或框图中的多个框的组合可以由多个计算机程序指令实现。这些计算机程序指令可以被提供给一通用计算机、专用计算机或其他可编程数据处理设备的一处理器以产生一机器，使得所述多个指令通过所述计算机或其他可编程数据处理设备的处理器执行创建手段，用于实现在所述流程图及/或框图的块或多个块中被指定的功能/动作。

这些计算机程序指令还可以被存储在一计算机可读介质中，所述计算机可读介质可以指导一计算机、其他可编程数据处理装置或其他装置以一特定方式起作用，使得被存储在所述计算机可读介质中的多个指令产生一制品(article of manufacture)，所述制品包括多个指令，所述多个指令实现在所述流程图及/或框图的块或多个块中被指定的功能/动作。

所述计算机程序指令还可以被加载到一计算机、其他可编程数据处理装置或其他装置上，以引起一系列操作步骤在所述计算机、其他可编程装置或其他装置上被进行，以产生一计算机被实现的过程，使得在所述计算机或其他可编程装置上执行的所述多个指令提供多个过程，用于实现在所述流程图及/或框图的块或多个块中被指定的功能/动作。

在本文中描述的一些方法通常仅被设计用于一计算机，并且纯粹由一人类专家手动地进行可能不是可行的或实用的。一人类专家想要手动地进行类似任务，例如识别及匹配多个声学模式，可能需要使用完全不同的方法，譬如：利用专家知识及/或人脑的模式识别能力，这将会比手动地完成本文所述方法更为有效。

如在本文中所使用的，所述术语电路或电路(circuit or circuitry)意指的是具有进行多个被选的任务的多个指令的硬件及/或软件，例如：进行某些计算的具有一内存的一控制器(软件或算法)，或进行某些信号处理任务的一芯片，例如：目的为进行语音分析。

附图说明

本发明的一些实施例仅通过举例的方式在本文参考附图被描述。现在具体参考附图，要被强调的是，所示的细节是作为示例并且出于说明性讨论本发明的实施例的目的。在这方面，通过附图被进行的描述使得本领域技术人员清楚本发明的实施例如何可以被实践。

在附图中：

图1A是根据本发明的一些实施例以图解说明一般语音检测及分析构件及在它们之间的所述数据流的一高阶流程图。

图1B是根据本发明的一些实施例的小波分解的一简化图例；

图2是根据本发明的一些实施例以图解说明在多个可选的语音分析站之间的数据流的一数据流映射图。

图3是根据本发明的一些实施例的基于一语音样本的心脏状况估计的一总体高阶概述；

图4A至图4B是根据本发明的一些实施例示意性地以图解说明在多个示例性平台中的语音采样及/或分析，其中图4A以图解说明一移动电话平台，及图4B以图解说明一车辆平台；

图5A至图5C以图解说明根据本发明一些实施例的示例性语音处理，其中图5A以图解说明语音样本处理以获得声学矢量，图5B以图解说明语音特征标准化过程，及图5C以图解说明一归一化示例；

图6A是根据本发明的一些实施例以图解说明通过分布分析从一语音样本估计一心脏状况的一总体高阶概述；

图6B是根据本发明的一些实施例以图解说明对于特征分布分析示出所述音高作为语音特征的一示例的一详细过程的一流程图。

图6C是根据本发明的一些实施例的一种用于学习诊断心脏状况的方法的一简化流程图例；

图6D是根据本发明的一些实施例的一种用于对心脏状况进行分类的方法的一简化流程图例。

图7A至图7B呈现根据本发明的一些实施例的一语音样本已经在图7A中被分类以去除多个段，并且所述剩余的多个段已经在图7B中被串接；

图8A至图8B示出根据本发明的一些实施例从已被平滑化的一语音样本提取的音高数据的一示例，其中图8A以图解说明将所述语音的“自然(natural)”波动进行平滑，及图8B以图解说明被平滑化的数据；

图9A至图9B示出根据本发明的一些实施例在被滤波及平滑化后从一语音样本提取的音高数据的一示例，其中图9A示出多个串接的语音段的一示例，及图9B示出用于音高提取的一示例；

图10A至图10D示出根据本发明的一些实施例在AF(图10B及图10D)期间以及在健康的人的言语期间(图10A及图10C)被记录言语的一音高的所述多个归一化标准偏差值的所述分布的直方图的一示例；

图11A至图11C以图解说明根据本发明的一些实施例的脉搏间隔分析形式的心脏节奏分析(cardiac timing analysis)，其中图11A示出一总体流程图，图11B示出一详细流程图，及图11C示出随时间的示例性脉搏决定；

图11D示出根据本发明一些实施例的RR间隔估计的一示例性图形。

图12A示出根据本发明的一些实施例的MFCC类型语音特征的所述帧到帧距离的一示例，其中上部图形示出帧到帧距离图案(frame to frame distance pattern)，及下部图形示出一ECG图形作为一参考。

图12B示出根据本发明一些实施例的相干性计算的一示例性图形；

图13示出根据本发明的一些实施例在灵敏度的变化相对心脏状况决定的所述特异性随着增加发生多个连续脉搏的一示例；

图14A至图14B示出根据本发明的一些实施例用于决定在所述心率的周期性以被用于决定的一心脏状况的一过程，其中图14A是一高阶概述，及图14B是一详细流程图；

图14C是根据本发明的一些实施例的一声门波的一简化图例；

图15A至图15D示出根据本发明的一些实施例的使用语音特征的频谱特性决定用于心率病理学的概率，其中图15A及15C示出一健康图案，及图15B及图15D示出AF图案；

图16示出根据本发明的一些实施例的可能的治疗及监测的一时间线；

图17是根据本发明的一些实施例的用于从一语音样本提取心率的一示例；

图18A是根据本发明的一些实施例示出与谈话者无关的检测结果的一图形；及

图18B是根据本发明的一些实施例示出与谈话者相关的检测结果的一图形。

具体实施方式

本发明在一些实施例中，涉及使用语音的医学诊断，更特别地但非排它地，涉及基于人类语音估计心脏状况。

概述：

本发明的一些实施例的一个方面涉及决定一心脏活动诸如血流对一语音样本的一影响的节奏及/或幅度的影响。

所述心脏活动可能影响在下列任何一个或多个中的所述语音样本：

影响血流，所述血流会影响所述声音样本；

将一心跳的一影响转移到所述会影响所述声音样本的肺部。值得注意的是，所述左肺与所述心脏共用在一胸腔中的空间；

将一心跳的一影响转移到所述会影响所述声音样本的支气管；

将一心跳的一影响转移到会影响所述声音样本的胸膜液；及

在沿着所述喉部的动脉及肌肉中的心跳相关机械变化(所述“语音箱(voicebox)”)及潜在地引起语音可检测调制的所述声道。

在一些实施例中，通过检测一心脏状况对一语音样本的一影响，一对象的所述语音样本被分析以决定一心律失常的心脏状况，

在一些实施例中，所述分析包括检测影响所述语音样本的一起因(cause)的一影响。

这样的起因的一些非限制性示例包括：

血流量；

心室搏动；及

心房搏动

在本申请中，影响所述语音样本的血流的示例影响被描述，并且在说明书及权利要求中的所述术语“血流(blood flow)”意谓着包括一心跳对所述语音样本的所述影响。

在一些实施例中，一心脏活动影响包括受心脏脉搏的所述节奏影响的血流。可选地或附加地，一心脏活动影响包括受心脏脉搏的所述幅度影响的血流。在一些实施例中，所述对所述语音样本的影响被用于决定一心律失常的心脏状况，例如心房颤动(AF或Afib)。可选地或附加地，所述对所述语音样本的影响被用于决定一异常心脏状况，例如心动过速(VT)。可选地或附加地，所述对所述语音样本的影响被用于决定一健康的心脏状况，譬如在节奏及/或幅度上具有足够周期性的一心脏状况。

在一些实施例中，通过在可选的自发的言语期间采样语音作为一数字格式，使对一对象的语音的一影响被决定，并分析所述数字语音样本以识别一心脏状况。可选地或附加地，所述效果基于多个预定的浊音(voiced sounds)被决定。在一些实施例中，所述对象的言语被动地被采样，而不是由所述对象本身采取主动的行动。在一些实施例中，所述语音样本被分析以从中提取多个语音特征。例如：多个语音特征可以包括音高及/或梅尔频率倒谱系数(MFCC)。替代地或附加地，所述语音样本或语音特征本身被分析以提取心脏数据，诸如RR间隔，譬如在连续的心脏脉搏之间的时间间隔。

在一些实施例中，在所述心率的一变异性或变化被检测及/或被测量。

如在本文中所使用的，所述术语“语音特征(voice features)”包括可以从所述言语被计算的任何值，除了此值的任何统计及/或数学运算，诸如导数、标准偏差、自相关、相干性、交叉相干性、小波变换、偏斜等。所述术语“语音特征(voice features)”还包括言语特征(speech characteristics)随时间的变化值，诸如其他语音特征随着时间的变化。

通常地，在言语产生期间，所述声带褶皱振动产生空气搏动。所述声带褶皱的质量及张力以及所述肺部气压决定所述音高。空气搏动根据口腔/咽喉结构及容积改变它的频谱密度及组成，并产生各种声音。

值得注意的是，所述心跳会在几种机制中潜在地影响所述语音：

改变所述暂时性血压及/或所述血管容积(temporal blood pressure and/orthe blood vessels volume)。在所述声带褶皱组织(vocal-folds tissue)中的这些变化引起声带质量(vocal cord mass)的微小变化，从而影响所述语音；

此外，血压及心跳也可能引起所述鼻腔及/或口腔容积的微小变化，这也可能影响所述言语；

所述心跳会产生一“机械性搏动(mechanical pulse)”，振动所述肺部、声带及/或嘴巴，潜在地导致所述言语的调制；

穿过所述颈部的大动脉的所述脉动潜在地导致所述声带褶皱的机械性振动。

心房颤动(AF)通常通过不规则心律被识别，临床上被定义为所述心房的不协调收缩。AF可能是无症状的。所述AF的存在使得中风的可能性提高五倍。目前的医疗实践设法防止大约80％的AF相关的中风。因此，一潜在的优点是早期识别患有AF的对象，以便开始医学治疗。

一些检测AF的方法主要依赖使用连续ECG记录(例如心脏动态心电监测器、移动式心脏遥测监测器等)。通常需要连续测量，因为AF可能每天仅发生几分钟并且是无症状的。然而，通过ECG进行的连续心脏监测可能带来挑战，诸如各种电极的精确应用、一不舒服的设备、布线、可穿戴传感器以及电池的更换或充电问题。一被动监测具有识别心脏状况的潜在优势，而不会煽动来自被筛查对象的主动行动步骤，并且不须偏离日常例程。

在一些实施例中，一语音通过一语音输入器诸如：麦克风设备被采样。可选地，所述语音输入器形成一电话的一部分。可选地或附加地，所述语音输入器形成一计算机及/或智能手机的一部分。可选地或附加地，所述语音输入器形成一汽车多媒体系统及/或扬声器电话及/或在汽车处的其他相关系统的一部分。可选地或附加地，一语音输入器包括一语音服务(例如替代地或附加地，一语音输入器形成一智能手表及/或具有一麦克风的其他可佩戴装置及/或个人监视器(蜂窝式及/或便携式)的一部分。在一些实施例中，一语音采样及/或分析模块形成具有一麦克风的一紧急警报按钮的一部分，所述紧急警报按钮可选地是一私有应用或有关于一医疗紧急服务。

在一些实施例中，语音采样由所述对象发起(initiated)。替代地或附加地，语音采样由具有语音输入器的所述采样装置发起，可选地，根据一预定的时间表，例如，每5分钟、每小时一次、每天两次，以及任何或多或少频繁的方案获得一语音样本。在一些实施例中，多个语音样本随时间被获得及被分析。获得多个测试的一潜在优点是所述测试结果及诊断的所述特异性及/或灵敏度的改善。在一些实施例中，基于所述被估计的检测所述心脏状况的概率以决定多个语音样本的数量及/或在采样之间的时间间隔。例如：当寻找一AF的发作被怀疑每周发生一次时，与寻找一AF的发作每小时发生一次相比，将提供一种可能更频繁的不同测试方案(regimen)。

在一些实施例中，一私有云及/或公共云服务器被用于分析所述语音样本。在一些实施例中，例如当一对象打电话寻求一心脏状况估计服务时，语音在一电话交换机或一呼叫中心被采样且至少部分地被分析。在一些实施例中，一服务器与所述电话交换机并置且从所述交换机获取所述数据。

替代地，一对象呼叫以寻求一差异服务，但通过相同的呼叫接收心脏状况估计服务。可选地，多个分析结果被发送给所述对象。可选地或附加地，它们被发送给一护理人员。可选地或附加地，它们被存储在一数据库中直到被要求或支付(paid for)。在一些实施例中，所述数据库及/或一永久的内存被用作一参考，用于被分析的浊音样本。

在一些实施例中，分析由在一智能手机及/或基于CPU的装置及/或服务器中的电路及/或软件进行。在一些实施例中，所述电路具有指令以处理所述语音样本并估计所述谈话者的心脏状况。被动地使用现有基础设施的一潜在优点是心脏疾病的被动监测可以被进行，可选地在潜在关注的情况下提供警告指示及/或推荐被用于进一步的体检，潜在地没有由被采样的对象采取一主动行动。另一个潜在的优势是，由于日常生活中进行测试的可达成性，因此有高的机会被用于早期侦测。早期侦测可以提供早期干预，以预防中风及其他并发症，潜在地防止再次住院及/或死亡。

在一些实施例中，电话交谈在一第一站被加密并在一第二站被解密。在这样的实施例中，所述语音的分析可选地由在所述第一站或第二站中的电路及/或软件进行，可选地分析所述未被加密的言语。

在一些实施例中，将一影响的一表征参数与一阈值或一参考进行比较。在一些实施例中，所述参考值取自相同的对象，但是来自已知健康及/或病理的样本。将一影响与一自我参考进行比较的一潜在优点是识别在所述被采样的个体中发生的变化的能力，并且可选地基于这些变化决定一心脏状况。可选地或附加地，所述参考是从具有与健康及/或具有一心脏病理学相关的多个参考的一数据库被提供的。可选地或附加地，将所述表征参数与一阈值进行比较，所述阈值被预先决定为具有一截止值以决定一心脏状况，例如低于所述阈值将被决定为一健康状况并且高于所述阈值将被决定为一病理状况。在一些实施例中，一截止值可被用于计算所述对象具有病理征候的概率。

在一些实施例中，可选地基于机器学习，可选地使用从所述语音样本派生的其他数据，动态地决定一阈值或一多维阈值。在一些实施例中，一训练集包含从具有病理征候及不具病理征候的其他患者被计算的多个语音特征。在一些实施例中，一分类器被选择以被用于所述训练集的最佳地分离及对一分离的测试集的高度分离。例如：这些方法可以包括SVM、回归、PCA KNN等。

在一些实施例中，几个语音样本分析方法的集成被进行。在一些实施例中，可选地基于所述分析结果的特异性及/或敏感性，将一不同的权重分配给每种分析方法。在一些实施例中，机器学习被用于动态地决定每个分析的所述权重。可选地，在整合过程中使用其他数据，例如所述对象的病史及/或家族史，及/或生理测试结果。

在一些实施例中，可选地基于所述被整合的结果决定一心律失常的心脏状况的一严重性。可选地，根据被识别的发作次数例如被识别的AF发作次数决定一心律失常的一严重性。可选地或附加地，基于被识别的发作之间的时间间隔及/或它们的持续时间以决定严重性。可选地或附加地，基于所述被决定的影响对所述语音样本的程度以决定严重性，例如：一语音样本越不规则，被决定的所述病理状况越严重。

在一些实施例中，在决定一心脏状况后，一验证测试被进行，可选地以一第二语音样本的形式。在一些实施例中，一第二语音样本包括被预定的单词或元音(words orvowels)。可选地或附加地，一验证测试包括被用于进行ECG及/或PPG测试的一心电图(ECG)测试及/或一光电容积描记(PPG)测试及/或指定的移动应用。使用补体测试的一潜在优势是提高所述诊断的特异性及敏感性。

在一些实施例中，所述血流对语音的影响被用于识别所述心率及/或在所述心率中的变异性或变化，这被用于识别一情绪状况，诸如压力、愤怒、神经质、兴奋等等。可选地或附加地，语音分析被用于决定所述被采样的对象的所述适合程度。可选地或附加地，所述语音分析被用于决定所述被采样的对象的一般健康状况及/或一临床状态。

提取所述心脏活动的所述节奏对所述语音的影响：

本发明的一些实施例的一个方面涉及基于检测所述心脏活动的所述节奏对所述语音的所述影响以决定一心脏状况，例如：通过检测所述心脏脉搏的所述节奏对所述影响所述声音的血流的影响。被估计的是，一不规则的心脏脉搏率会不规律地出现心脏脉搏影响，这将影响将在所述语音中显现的所述血流。

在一些实施例中，节奏化的心脏数据从一语音样本的浊音段被提取。例如：节奏化的心脏数据包括至少一个RR间隔。可选地，所述R个顶点是非连续的。如在本文被使用的，所述术语“R”是指在心脏脉搏期间的所述血压的所述波峰的所述节奏。RR是连续两次心脏脉搏之间的时间距离。

在一些实施例中，心脏参数从自发的言语被提取。自发的言语通常由多个浊音(voiced sounds)、多个清音(unvoiced sounds)及静默(silence)组成。如本文中所使用的，多个浊音是言语中的声带闭合并振动的部分诸如在“猫(cat)”中的\a\音素(phoneme)，多个清音是言语中的声带打开的部分诸如在“羞耻(shame)”中\sh\音素，静默时期则是无言语被呈现的部分(诸如停顿)。被估计的是，心脏活动主要影响所述浊音，而清音则受心脏活动影响较小，而静默时期则完全不受影响。在自发的言语期间的浊音段相对较短，通常持续不到3秒。在一些实施例中，心脏状况从非连续的、分段化的言语数据被估计。可选地，分段化言语数据从自发的言语的浊音段中被提取。在一些实施例中，所述语音样本被分类以识别浊音段，并且可选地，所述浊音段被串接，使得至少一些段被移除并且剩余的段的末端被平滑化。

在一些实施例中，多个浊音通过标准言语分类方法被分类，例如引用在齐英勇(Yingyong Qi)及鲍比·R·亨特(Bobby R.Hunt)所述的，使用混合特征及一网络分类器的浊音-清音-静默言语分类，Yingyong Qi及Bobby R.Hunt，1993，其全部内容在本文中被引用作为参考文献。

在一些实施例中，心脏脉搏数据是从间歇性浊音段被派生的。在一些实施例中，心搏数据及/或血流行为从清音段被外推，可选地发现在两个浊音段之间具有被用于发生一脉搏的暗示性趋势。在一些实施例中，R脉搏发生两次之间的一时间间隔足以决定一心脏状况。例如：当识别表征一异常高心率状况的一时间间隔时，诸如室性心动过速(ventriculartachycardia)。可选地或附加地，R脉搏发生至少三次足以决定一心律失常，诸如AF。在一些实施例中，一心律失常的心脏状况通过计算心脏脉搏连续发生三次之间的多个时间间隔被决定。在一些实施例中，连续多个R脉博发生的一较大次数提供一更高的测试灵敏度及/或特异性，例如：一次数大于四个，及/或大于五个，及/或大于六个，及/或大于七个，及/或大于八个及/或连续发生的较大次数。在一些实施例中，所述被识别的心脏脉搏之间的所述时间间隔与从一参考心脏状况获得的参考时间间隔相匹配，所述参考心脏状况已知为健康的或病理的及/或心律失常的。可选地，一匹配概率被计算并将其与被用于决定所述心脏状况的阈值进行比较。

本发明的一些实施例的一个方面涉及通过随时间查找从所述语音携带相关信息的多个特定参数的多个变化以估计一心脏状况。例如：通过随时间分析多个语音特征并且计算所述多个语音特征的所述多个值的一周期性。在一些实施例中，多个语音特征从一浊音样本(voiced sample)被提取，可选地是一自发的言语(spontaneous speech)。在一些实施例中，语音特征包括例如一加权频谱及/或基于线性预测系数(LPC)及/或基于LPC的频谱，和/或梅尔频率倒谱系数(MFCC)及/或基频(音高，pitch)，及/或能量，及/或零交越(zero crossing)，及/或共振峰(formants)，及/或声门脉波(声带脉波)及/或抖动(jitter)，及/或闪烁(shimmer)及/或分形维数及/或相干性，及/或小波分析，或所述言语样本的任何其他数学\统计表示形式。

在一些实施例中，一对象的一心率被估计，可选地通过分析他的语音样本。在一些实施例中，所述语音特征的一不均匀性被用于识别所述心脏活动的所述节奏中的不规则性，例如通过识别围绕所述心率的频率的一预定范围处对频率的一周期性。在一些实施例中，频谱分析及/或自相关被用于识别在所述语音样本中的周期的及/或半周期的变化。在一些实施例中，一语音特征的周期性在所述语音特征的所述心率的所述预定范围处的一频谱波峰的一带宽中被计算。通常地，所述带宽越宽，所述周期性越低，因此一心律失常的可能性越高。在一些实施例中，为了决定所述心脏状况，将所述带宽与一预定阈值进行比较。

在一些实施例中，将所述周期性的一表征参数与一阈值进行比较以决定所述心脏状况。例如：围绕所述心率的所述频率的(一语音特征诸如音高的)一自相关函数的一波峰可以通过它的带宽被表征，并且具有一值高于一预定阈值的所述自相关函数的一带宽将是与一心律失常的心脏状况的一高概率相关。

在一些实施例中，所述言语的频谱交叉相干性在所述言语的多个段之间被计算，所述段可选地在所述音高周围及/或共振峰频率周围及/或在潜在地受所述心脏脉搏影响的任何频率周围。在短时间内达到较低值的一致性可以是心脏脉搏的一指示。以此方式，心脏脉搏可以位于所述言语时间线上。

提取心脏活动的幅度对所述语音的影响：

本发明的一些实施例的一方面涉及基于提取所述心脏活动的所述幅度对所述语音的所述影响以决定一心脏状况。如在本文中被使用的，所述术语“幅度(magnitude)”是指所述血液的机械作用的程度，诸如血压及/或血管容积及/或心室及/或心房搏动的一作用。被估计的是，一不规则的心率会导致流向发声区域(vocal region)的所述血流的幅度的变异性，因此会导致它对所述语音的影响幅度的变异性。被估计的是，所述心跳调制所述言语，导致所述声学信号的一变化。因此，被预期的是，定期的心脏脉搏，例如由一窦性心律(sinus rhythm)为表征，引起周期性调制(periodic modulation)，可能是由于通过所述言语器官的血流的周期性变化引起的。另一方面，不规则的心跳，例如AF，引起血流的混乱变化并引起所述声学信号的较大变化。

在一些实施例中，决定所述语音特征的所述多个值的所述分布，例如标准偏差。在一些实施例中，将所述分布的所述形状的一表征参数(characterizing parameter)与一阈值进行比较以决定所述心脏状况。例如：可以将所述分布的所述形状的一大的宽度及/或频谱波峰与一预定阈值进行比较，所述预定阈值与一心律失常的心脏状况的一高概率相关联。

在一些实施例中，一多特征分类器(组合几个特征)可选地被使用，并且所述多个语音特征的多个值的多个多维分布上的一可选的多维阈值被决定，例如使用一支持矢量机(SVM)方法及/或矢量量化方法诸如K-MEANS聚类分析。

在一些实施例中，将所述多维分布的所述形状的一表征参数(characterizingparameter)与一多维阈值(multi-dimensional threshold)进行比较，以决定所述心脏状况。

检测心房颤动：

本发明的一些实施例的一个方面涉及通过它对一患者的语音的影响以检测心房颤动。

在一些实施例中，慢性病理状况通过多个语音参数的变化被潜在地检测。在某些情况下，心房颤动(AF)导致左心房扩张(在大多数病理性AF病例中发生)。所述扩张影响着所述喉返神经，导致所述语音不断变化。这些变化潜在地表现在所述多个音高信号的所述多个参数中，并且可以被进行分析及检测。

这使得即使在所述心脏以正常速率跳动的情况下也能够检测患有慢性病的AF患者。

在详细解释本发明的至少一个实施例之前，应被理解的是，本发明不必然限于它的应被用于以下描述中阐述的构造细节及构件及/或方法的布置及/或在附图及/或实施例中以图解说明。本发明能够具有其他实施例或以各种方式被实践或被进行。

示例性语音采样及分析：

现在参考附图，图1A是根据本发明的一些实施例的一高阶框图及示例从人类语音决定心脏状况的数据流，以图解说明参与的元件及在它们之间的数据流。

在一些实施例中，一模拟语音样本1由语音输出102生成，所述语音输出102可包括一个或多个谈话对象。在一些实施例中，模拟语音样本1由语音输入104例如：具有麦克风的电子装置采样，并且被转换为数字语音样本3。在一些实施例中，数字语音样本3由语音分析器106处理。在一些实施例中，由分析器106进行的处理识别多个语音特征5a及/或多个心脏特征5b。例如：多个心脏特征可以包括多个RR间隔，及/或心率，及/或心率变异性。多个语音特征的示例可以包括音高，及/或多个共振峰，及/或多个Mel频率倒谱系数(MFCC)及/或在多个帧之间的多个交叉相干性值，及/或基于小波的多个特征，及/或多个频谱带能量及一个或多个上述参数的带宽，及/或在发声期间的波动及/或这些特征的衍生物。

作为一言语特征的交叉相干性：对在时间(t)的多个言语样本的一特定帧-交叉相干性被计算为在时间(t+Δn)的一帧。此值可选地被存储在包含N个值的一矢量中：

CohVec(t)＝[CrossCoh(frame(t),frame(t+Δ)),

CrossCoh(fame(t),frame(t+Δ*2)),

….

CrossCoh(fame(t),frame(t+Δ*N))]

小波作为一项特征：

所述小波变换可选地以几种方式被用作一言语特征。

在第一种方式中，在一些实施例中，小波分解被使用，可选地使用高通滤波器(HPF)及/或低通滤波器(LPF)分解。

现在参考图1B，这是根据本发明的一些实施例通过一离散小波变换(DWT)进行一小波分解的一简化图例。

图1B示出一信号x(n)120，产生级别1的多个DWT系数h(n)124及g(n)122。

图1B还示出级别1的DWT系数g(n)122，可选地产生级别2的多个DWT系数h(n)126及g(n)128。

图1B示出一示例实施例，其中每个滤波器的输出能量被用作所述输出特征矢量的一分量。

在第二种方式中，在一些实施例中，每帧的“比例(scale)”及“系数(coefficient)”值可选地被计算，类似于使用频谱的能量及频率，并使用这些值作为特征。

波动特征的频谱能量及BW：

在一些实施例中，以下两步计算被进行：

计算每帧的所述言语发声的一特征矢量；及

使用频谱估计方法计算所述特征矢量的所述频谱。

作为一些非限制性示例的方法，在一特征矢量是所述音高频率(每帧)的情况下：

FtrVec(n)＝Pitch(n),n＝1,2,…，其中N是一帧数，

所述频谱是：

SpecVec＝Spectrum_Estimation(FtrVec(1)…..FtrVec(n))。

在一些实施例中，所述SpecVec可选地被用于表示所述特征矢量随时间变化的一频率。由于所述心跳调制所述语音信号的某些特征，所述SpecVec潜在地示出在一心率频率下的一频率波峰。

在一些实施例中，频谱估计可选地通过诸如以下方法进行：

一傅立叶变换(Fourier transform)；

一协方差法(covariance method)；

一周期图方法(periodogram method)；

一尤勒-沃克方法(Yule-Walker method)；

一多重信号分类方法(Multiple SIgnal Classification(MUSIC)method)；及

一特征矢量方法(eigenvector method)。

在一些实施例中，所述频谱估计方法可选地对每个发声产生几个值：

频谱波峰的位置[赫兹(Hz)]；

谱峰的带宽[秒(s)][Hz]；及

频谱波峰(s)的能量，可选地为带宽*高度[瓦特(Watt)]。

所述以上的多个值可选地被用作心率状态的一指示。

在一些实施例中，心脏/语音特征由心脏状况分类器108分析以估计心脏状况7。例如：一心脏状况可以是一健康的心脏状况，或一病理的心脏状况，例如：被识别为心律失常及/或AF。可选地，心脏状况7由心脏状况输出110呈现，例如屏幕。

在一些实施例中，语音输出102包括生成模拟语音样本1的一人类对象。所述人类对象可以是使用语音进行心脏状况诊断作为一候选者的任何人。可选地，语音输出102包括生成语音样本1的多于一个的人类对象，例如当语音样本1包含两个或多个对象之间的一交谈(conversation)时。在一些实施例中，仅有被识别的谈话者被分析。在一些实施例中，语音样本1包括自发的言语，例如：一序列可以包括用户谈话及/或用户交谈，及/或静默时期及/或背景噪声，及/或背景谈话者的多个段。可选地或附加地，语音样本1包括有限的言语，例如：特定的单词及/或元音，可选地被预先决定或从一查找表(look-up table)中被选择。

在一些实施例中，语音输入104通过将模拟语音样本1转换为数字语音样本3来记录模拟语音样本1。在一些实施例中，语音输入104是具有一麦克风的一装置。例如：语音输入104可以是一陆线电话及/或一蜂窝电话，及/或一计算机，及/或扬声器电话，及/或一录音机。可选地或附加地，语音输入104是记录数字语音样本3的一服务器，可选地为远程服务器，例如位于一呼叫中心。

可选地，语音输入104包括一数据库，被用于存储数字语音样本3。替代地或附加地，语音输入104仅转换声音并发送声音而不用长期存储声音。在一些实施例中，数字声音样本3以一语音数据格式被存储，例如PCM，及/或WAV，及/或ADPCM。可选地或附加地，模拟声音不被转换成数字格式，而是由模拟分析电路分析，然后模拟分析电路将模拟声音转换成数字格式。

在一些实施例中，通过语音输入104进行采样是被自动提供的，即，没有由所述对象进行关于所述采样的主动行动。可选地或附加地，通过由所述对象的一主动行动操作来手动提供采样，例如通过主动呼叫一专用呼叫中心，或通过按下在一装置上的一记录按钮。替代地或附加地，采样以一预先安排的配置被提供，可选地，在所述用户被要求说及/或对某些单词或声音进行发音的地方。例如：一服务可以在预先安排的时间呼叫一用户并对交谈进行采样。替代地，一对象可以在他的空闲时间记录数字语音样本3，然后将此语音样本发送到一服务器，例如通过上传到一服务器。

在一些实施例中，在检测到可能的风险后，预先安排的操作可以从一监控基础设施及/或从一监控应用程序，及/或从医疗辅助及/或从所述软件应用程序被初始化。在一些实施例中，一预先安排的操作包括定期筛查。一定期筛查的一潜在优势是持续监测所述对象的状况。在一些实施例中，所述预先安排的操作包括进行诱导人对特定言语进行发音，可选地通过发送一通知。在一些实施例中，所述通知包括口头及/或文本警报及/或一蜂鸣声及/或给一智能手机的一文本消息及/或多个浊音指令(voiced instructions)。在一些实施例中，一用户使用所述系统的手动激活来为他及/或他的亲属启动一测试。可选地，在所述用户同意的情况下，在一些实施例中，一装置可以被编程以自动激活所述麦克风。在一些实施例中，所述装置可以从一远程位置被激活，例如通过一医疗保健服务。

在一些实施例中，数字样本3在进入语音分析器106中的分析之前被分类。例如：对于交换机/服务器应用(大规模中央筛查)，仅有被选择的呼叫可以被分析。可选地，选择基于多个样本特性被进行，所述样本特性例如呼叫持续时间及/或噪声水平，及/或特定谈话者的浊音段的持续时间，及/或浊音段的持续时间，及/或谈话者识别数据，及/或可能影响诊断的敏感性及/或特异性的任何其他标准(criteria)。

在一些实施例中，语音分析器106进行谈话者识别。所述谈话者的一识别可能是重要的，原因有多种，诸如所述分析结果应发送给谁。替代地或附加地，谈话者识别可以与所述谈话者的个人信息相关联，可选地被用于辅助临床诊断。例如：个人信息可以包括体重，及/或吸烟习惯，及/或先前已知的病状，及/或先前的医学诊断。在一些实施例中，用户识别有助于从多个谈话者及/或从在一交谈中的多个参与者之间交替出现的多个语音样本识别单个谈话者。可选地，在所述识别后，语音分析器106将一对象的所述多个语音段与具有其他谈话者的语音段分离。

在一些实施例中，仅有被识别的多个谈话者被分析。可选地，一谈话者将根据要求被分析。替代地，一旦已经接收到所述服务的付款，就可以分析一谈话者。替代地，如果谈话者被识别为一群组的一成员，例如：是保险或一健康维护组织的一成员，则将对所述谈话者进行分析。

可选地，一对象的语音使用具有多个被预先识别的谈话者的一数据库被识别。在一些实施例中，例如：在几个用户使用同一分析装置的情况下，多个用户之间的隔离可以通过建立一语音签名及/或使用与所述言语有关的其他细节及/或其他参数诸如例如一来电显示号码被获得。替代地或附加地，所述用户通过对一预定单词或单词列表进行发音(pronouncing)被识别。

在一些实施例中，对于某些应用(诸如电信网络中的监视)，如果所述谈话者识别结果是未知的，但是所述系统发现心脏病理学的一可能性，则所述分析结果被存储，可选地在所述系统数据库中。在这样的情况下，在一些实施例中，结果使用多个替代分类被存储，诸如例如一电话号码及/或一呼叫者ID及/或国际移动设备标识等。例如：在一呼叫中心进行大规模筛查期间，当一诊断结果被存储在所述系统数据库中时，如果所述谈话者已被注册，则根据一讲话者个人文件保存所述诊断结果；如果所述讲话者是未知的，则将所述诊断结果保存在呼叫者信息下。

在一些实施例中，数字语音样本3被存储以供将来使用，而不是估计所述扬声器的所述心脏状况。可选地，包含多个语音样本及/或多个被分析的语音样本及/或多个诊断结果的一数据库被用于多个其他语音样本的未来分析中。替代地或附加地，诸如这样的一数据库被用于流行病学研究(epidemiological research)，例如：以便具有关于所述被监视的病理的统计知识。

在一些实施例中，处理语音样本3由语音分析器106进行，包括例如智能电话电路及/或远程服务器(云计算)及/或在一独立装置(诸如PC，及/或平板电脑)及/或在一呼叫中心的一服务器，例如：一个人可以发起一呼叫并且他的语音将被记录及被分析的位置)。

在一些实施例中，语音分析器106被嵌入与语音输入104相同的装置中。例如：一智能手机可以具有一麦克风104，被用于采样一模拟语音样本1，将所述模拟语音样本1转换为数字语音样本3，并且还可以具有语音分析器106(诸如进行信号处理的电路及/或软件)被用于分析所述语音，可选地派生多个语音特征5a及/或多个心脏特征5b。

替代地或附加地，语音分析器106与语音输入104位于不同的装置中，及/或位于一不同的地理位置。例如：一智能电话可以具有一语音输入104(诸如一麦克风)，但是数字语音样本3可以被发送到具有语音分析器106电路的一远程服务器。

替代地或附加地，语音输入104及语音分析器106两者都远离所述语音输出102。例如：当一对象呼叫一呼叫中心，并且他的语音被记录在所述电信网络上的一台服务器中，并且也被所述服务器分析时。

在一些实施例中，语音分析器106从数字语音样本3中提取多个语音特征5a。例如：多个语音特征5a可以包括一加权频谱及/或线性预测系数(LPC)及/或基于LPC的频谱，及/或梅尔频率倒谱系数(MFCC)及/或基频(音高)，及/或能量，及/或零交越(zero crossing)，及/或多个共振峰，及/或声门脉波(声带脉波)，及/或抖动(jitter)，及/或闪光(shimmer)，及/或分形维数(fractal dimension)，及/或相干性、小波分析，或从所述多个言语样本中提取相关信息的任何其他特征(诸如：能量及/或平均功率及/或熵等)。

替代地或附加地，语音分析器106从所述数字语音样本3及/或多个语音特征5a提取多个心脏特征5b。在一些实施例中，多个心脏特征5b包括脉搏数据，例如多个RR间隔(RRintervals)。替代地或附加地，多个心脏特征包括心率及/或心率变异性。

在一些实施例中，一心脏状况分类器108处理多个语音特征5a及/或多个心脏特征5b并且估计一心脏状况7。在一些实施例中，心脏状况分类器108决定对象患有心律失常的可能性。替代地或附加地，心脏状况分类器108决定一对象患有心房颤动的可能性。替代地或附加地，其他心脏状况被决定，例如：急性冠状动脉综合征及/或栓塞性中风的警告信号，及/或心肌梗塞及/或心脏骤停，及/或心室扑动，及/或心房扑动，及/或房性心动过速，及/或室性心动过速，及/或心动过缓，及/或呼吸困难，及/或胸痛。

可选地，所述被估计的心脏状况7及/或所述多个语音特征5a及/或所述多个心脏特征5b被呈现在心脏状况输出110中。在一些实施例中，心脏状况输出110包括一屏幕，例如一装置的一监视器及/或一显示器。在一些实施例中，心脏状况输出110包括对所述谈话者及/或所述谈话者的护理者的一通知。被用于通知的示例可以包括文本消息，及/或电子邮件，及/或电话呼叫，及/或消息收发应用程序(例如WhatsApp、Facebook及由用户选择的其他方式)。替代地或附加地，一通知可以是一图形呈现方式。替代地或附加地，一通知可以是视觉及/或音频通知的形式。例如：根据本发明的一些实施例，被嵌入在一车辆中并且具有提供扬声器分析的一应用程序的一扬声器电话可以被连接至所述车辆的一通知基础设施，诸如一闪烁的灯或通过在所述车辆中的所述扬声器的一声音通知。

示例性数据流：

现在参考图2，这是以图解说明根据本发明一些实施例在多个可选的语音分析站之间传输数据的一些选项的一数据流的图。

在一些实施例中，至少一个对象220在一语音输入的一范围内输出一模拟语音样本1，例如：具有一麦克风的一装置，诸如一语音记录器及/或一功能电话，被示例在功能电话(feature phone)240中。替代地或附加地，语音输入可以是一智能装置的一模块，例如一个人计算机及/或一智能电话及/或任何其他电话装置(诸如一无线电话及/或扬声器电话)及/或一平板电脑，被示例如平板电脑260。在一些实施例中，在240及/或260中的所述语音输入将模拟语音样本1转换为数字语音样本3。

在一些实施例中，所述语音输入可选地连接到一可佩戴式麦克风(未示出)，可选地通过有线或无线方式连接到一计算单元被用于分析，或者连接到一传输单元被用于传输到一计算单元以进行分析。

在一些实施例中，数字样本3被发送到一分析器，诸如服务器262，可以是一远程服务器或一云服务器。替代地或附加地，数字样本3被发送到呼叫中心，在该处可选地数字样本3被记录然后被分析。替代地或附加地，例如：通过将数字样本3配置为在被引导到一呼叫中心290之前先通过一电话交换机265，将数字样本3发送到一电话交换机265。例如：一对象可以呼叫以与位于290处的一政府或私营部门客户服务进行通话，但是一旦同意，他的声音将通过开关265传输而被分析以评估一心脏状况。在一些实施例中，一呼叫中心包括对于想要被分析的人的一服务。替代地或附加地，一呼叫中心包括一服务，被用于除了心脏状况诊断之外的其他目的。例如：被用于政府服务的一呼叫中心可以包括被用于诊断目的语音采样及一从旁服务(side service)。多个电信服务的多个其他示例包括多个健康电信服务，及/或多个紧急呼叫中心，及/或多个医疗服务，及/或多个保险服务，及/或多个个人虚拟助手。

替代地或附加地，智能设备260还具有多个指令，被用于分析数字样本3及可选地发送输出，例如以多个心脏及/或语音特征5及/或一被估计的心脏状况7的形式。在一些实施例中，输出被直接传送到护理者280。替代地或附加地，被发送到一服务器262以被用于进一步分析及/或存储。替代地或附加地，在有或没有经过开关265的情况下，输出被发送到一呼叫中心290，并且可选地，从那里被发送到护理人员280。在一些实施例中，输出被提供回所述被分析的对象220。

在一些实施例中，电路被配置成向所述用户报告心房纤颤的当前状态。这样的电路可以在私有的及/或公共的智能电话240及/或云服务器262中被实现。与例如被用于记录及/或分析及/或发送的一外部无线装置相反，使用现有基础设施的一潜在优势是没有被用于感测及/或数据传输的附加辐射。

在一些实施例中，本地评估(local assessment)被提供。例如：当同一装置既对语音采样及分析时，则本地评估被提供，诸如一智能手机对所述语音进行采样及分析，以提取多个特征及/或心脏状况。可选地，本地评估通过手动操作被提供。替代地或附加地，本地评估被自动地运作，例如：通过对象每次使用他的电话进行运作及/或通过所述装置定期地采样语音。

替代地或附加地，远程评估(remote assessment)被提供。例如：当语音采样发生在一个地理位置上而在另一地理位置上提供所述语音样本的所述分析的至少一部分时，远程评估被提供。例如：一对象可以通过一电话被采样，但是所述被采样的语音可以被发送以由一远程服务器(云、蜂窝、座机)进行分析。在一些实施例中，电信网络构件诸如BTS及/或MSC或服务器\云，及/或交换机被配备有分析电路。在一些实施例中，分析电路在VoIP服务器中被提供，例如Skype、WhatsApp、Viber、电话会议、视频消息及/或记录等。在被加密通信的情况下，在一些实施例中，包含心脏信息的相关语音特征在加密之前在所述装置处被计算并且可选地在当地被分析，或替代地或附加地被发送到在一服务器中的远程分析。

在一些实施例中，谈话者识别被用于通过他的语音以识别所述对象。例如：当一人呼叫一呼叫中心290以获取服务时，适被用于语音分析的电路也可以被配置为识别所述对象，例如：用户电话号码还可以被使用，以便于追溯并通知他被侦测的情况。在一些实施例中，至少一个对象或多个对象可以从多个同时采样的语音中被检测，诸如当采样一交谈及/或一电话会议时。

示例性高阶概述：

现在参考图3以图解说明根据本发明的一些实施例被用于基于一语音样本的心脏状况估计的常规高阶流程图。

在一些实施例中，在302处，分析通过获取一语音样本开始，所述语音样本可选地被分段及/或被分类，例如如图5A所示。在一些实施例中，语音特征在304处被提取，可选地以所述语音样本的每个段的多个语音特征矢量的形式。

在一些实施例中，在306处，一语音样本及/或多个语音特征被用于计算语音特征分布，及/或计算任何数学运算以揭示相关信息。例如：一分布诸如一语音特征的多个值的所述变异性被计算。被估计的是，多个语音特征受到流至所述发声器官的血流的影响，而所述发声器官受到脉搏节奏及功率\强度的影响。因此，被估计的是，诸如在心律失常中被发现的一不规则脉搏将导致对所述语音特征的多个不规则影响，这将表现出所述多个语音特征值的一高度变异性。语音特征分布还进一步被详细及示例在图6A至图6B、图7A至图7B、图8A至图8B、图9A至图9C及图10A至图10D中。

替代地或附加地，在308处，一语音样本及/或多个语音特征被用于计算在所述心脏脉搏发生之间的所述时间间隔。

在一些实施例中，在语音特征值的暂时性变化被用作心脏脉搏的指示。在一时间尺度上定位的多个暂时性变化给出心脏脉搏位置的近似值。

在一些实施例中，一语音样本被用于识别多个脉搏发生并计算在连续发生多次之间的多个时间间隔。在一些实施例中，多个时间间隔被放在一起作为一序列。在一些实施例中，一心脏状况基于所述序列被估计。脉搏提取被进一步详细及示例在图11A至图11D、图12A至图12B及图13中。

替代地或附加地，在310处，一语音样本及/或多个语音特征被使用以计算所述心率周围的语音特征周期性。例如：一语音特征可以被提交以在所述心率值处进行自相关计算。被估计的是，当所述心脏脉搏处于一健康状态时，所述脉搏对所述语音特征的影响将是周期性的，但是当所述心脏脉律是不规则的时，所述脉搏对所述语音特征的影响将是不规则的。诸如自相关的一周期性计算可以揭示语音特征受到多大程度的影响。进一步的细节及示例在图14A至图14B、图15A至图15D中。

在一些实施例中，所述多个被分析的图案(patterns)的结果在362处被整合以提供一心脏状况的一总体概率，并且在364处达到一心脏状况评估(cardiac conditionassessment)。

在一些实施例中，所述分析模块(362)以本文列出的三种方法中的每一种持续存储从所述言语分析被获得的所述多个值。可选地，所述系统学习这些值；它们被定义为“正常值(normal values)”，所述“正常值”定义被用于所述特定受监控的人的一健康状况。在一些实施例中，在持续监视所述特定的人的期间，所述系统将所述多个被存储的(正常)值与所述所述当前的值进行比较，并测量所述相对变化水平。在一些实施例中，与所述“正常值”相比，所述多个值的所述多个变化量与患病(having the pathology)的概率成正比。

可选地，在370处，心脏状况评估还考虑所述被检查的对象的所述医学及/或个人历史数据。替代地或附加地，生物标记测试(biomarker tests)在380处被考虑。

生物标记的示例包括体重、性别、职业、历史诊断疾病及AF发作、吸烟习惯、CHADS2(充血性心力衰竭史)、高血压病史、年龄，糖尿病史、中风及TIA(短暂性脑缺血发作)症状中的任何一种或一组合。

在一些实施例中，心脏状况评估通过一输出390例如一显示器被呈现给一用户。

可选地，被获得的数据在395处被用于机器学习。例如：在362处，多个语音样本、经处理的语音数据、多个语音特征、历史数据、生物标记数据及/或心脏状况可被用于生成规则及统计特征，以在未来的过程中进行更准确的诊断，并协助进行整合(integration)。

在一些实施例中，所述机器学习包括训练阶段。例如：在训练阶段，多个语音样本及/或多个语音特征及/或多个心脏特征可取自多个健康的对象及已知具有一心脏病理的对象，并被用作一参考。例如：基于此数据，所述阶段将提供最合适的算法以隔开健康的与病理的言语。在操作阶段，所述机器学习模型将从所述用户的语音(及/或特征)计算出病理的可能性，并且将有助于进行决策。

附加地或可选地，多个语音特征然后可以对于所述语音样本的所选的帧被计算，并且频谱表现(spectral representation)可以对于每个特征被计算。基于每个人群的所述频谱分析，训练统计模型可以被形成以表征多个健康概况(healthy profiles)，并且训练统计模型可以被形成以表征非健康概况。

可选地，一分类器被提供以区分两个训练统计模型。替代地或附加地，所述多个概率被比较并据此做出一决定。

在一些实施例中，在图3的流程图中被公开的过程可以被用于识别各种心脏状况，无论是心律失常的还是其他情况。例如：诊断心室扑动(atrial flutter)及/或室性心动过速(ventricle tachycardia)及/或室性早搏(premature ventricular contractions，PVC)及/或异常心律及/或异位搏动是基于先前描述的类似评估，可选地以在362处调整所述整合过程及/或在364处对所述被决定的特定异常心律的进行评估。替代地或附加地，对在306处被用于评估特征分布，及/或在308处被用于脉搏间隔，及/或在310处被用于周期性的所述阈值及/或参考进行调整。

在一些实施例中，当检测异常的心律，例如心室心动过速或心动过缓时，该过程与以上描述的过程相似，但是有一些变化。例如：在308处，在一些实施例中，通过寻找非常高或很低的脉搏间隔，例如：高于200BPM(心动过速)或低于60BPM(心动过缓)。在一些实施例中，在306处，计算表征所述分布的其他参数。在一些实施例中，在380处，重要的输入是被监视的人的年龄(60岁以上)。

在一些实施例中，为了检测心房扑动及/或PVC及/或任何其他类型的心律失常，在图3中所示的过程可以被遵循，但是具有不同的阈值及参数值。

在一些实施例中，为了检测呼吸困难及/或胸痛，使用相同的过程，但是具有不同的语音特征及/或阈值及/或参数值。

例如：对于所有上述病理，所述检测可以基于：

(1)估计被用于检测心律的心搏脉搏节奏(RR间隔)，并将所述被用于检测心律的心搏脉搏节奏与已知为病理的/健康的一心律进行比较。

(2)计算言语特征的周期性(自相关及/或频域)，并将所述言语特征的周期性与已知为病理的/健康的一周期性进行比较。

(3)使用机器学习策略从健康谈话者的语音特征及/或患病的谈话者训练统计模型。

在一些实施例中，所述过程被用于识别一健康的心脏状况，例如通过识别一窦性心律。

在一些实施例中，对于未知的谈话者，所述病理将通过比较被侦测，例如通过概率计算，将所述声学特征与多个病理的及/或健康的模型(诸如在所述训练阶段中被计算出的所述多个模型)中的每个进行比较，并采用最高的概率模型作为所述结果。

被用于语音采样及/或分析的示例性装置：

现在参考图4A至图4B示意性地以图解说明根据本发明的一些实施例在示例性平台诸如图4A中的一移动电话及图4B中的一车辆中的语音采样及/或分析。可选地，所述系统可以在任何语音平台及/或语音辅助平台中被实现。

在一些实施例中，车辆被用于嵌入采样及/或分析电路。例如：一语音输入及/或分析器可以被嵌入在一汽车多媒体系统及/或扬声器系统中；例如：通过采样一对象何时在所述汽车上的所述电话/扬声器上讲话，及/或输出语音命令，及/或在汽车内自发地谈话。

在一些实施例中，一电话及/或智能电话被用于使用一语音输入422例如一麦克风以采样一语音样本。可选地，所述语音样本的分析也可以在所述电话中通过具有被用于这样的一分析的多个指令的电路来进行。在一些实施例中，一语音处理器420被用于处理所述语音样本，如图5A至图5C进一步所示。在一些实施例中，语音处理器420例如通过滤波及/或分类及/或分段成多个段以在语音滤波单元424处清洁所述语音样本。例如：滤波单元424可以去除噪声并且“清洁”所述被采样的语音的所述信号。在一些实施例中，对被滤波的或未被滤波的语音进一步进行分类。可选地，所述语音样本被分类为言语及/或非言语部分及/或静默部分及/或过渡部分(speech and/or non-speech parts and/or silence partsand/or transition parts)。在一些实施例中，滤波单元424被用于可选地通过使用一声音标准以从所述语音流中检测并标记相关言语数据的位置。例如：一声音标准(soundcriterion)可以是一能量及/或零交越及/或共振峰及/或音高。例如：在所述浊音部分中，一自相关分析在所述音高频率上显示出一明显的波峰，所述波峰可选地被用于浊音/清音分类。

在一些实施例中，特征提取器426从所述语音样本中提取数据，例如语音特征及/或声学矢量及/或心脏特征。在一些实施例中，每帧计算一语音特征的至少一个值。例如：多个语音特征可以包括一加权频谱及/或线性预测系数(LPC)及/或基于LPC的频谱，及/或梅尔频率倒谱系数(MFCC)及/或基频(音高)，及/或能量，及/或零交越，及/或共振峰，及/或声门脉波(声带脉波)，及/或抖动，及/或闪烁，及/或分形维数，及/或相干及/或小波分析，或从所述言语样本的相关信息提取的任何其它特征。替代地或附加地，多个语音特征中的一些或全部的一组合被用于包含多个特征的单个高维矢量(single high dimensionvector)，所述多个特征可选地包括每个参数的多个统计权重，如图5A进一步所示。

在一些实施例中，多个语音特征及/或多个声学矢量及/或多个心脏特征在特征处理器440处被分析。在一些实施例中，脉搏间隔计算器442被用于计算在心脏脉搏之间的多个时间间隔。替代地或附加地，语音特征分布计算器444被用于表征至少一个语音特征的所述分布及/或变异性。替代地或附加地，语音特征周期性计算器446被用于识别至少一个语音特征随时间变化的规律性。

在一些实施例中，心脏状况分类器460分析特征处理器440的结果，以使用各种统计方法来估计一心脏病理的所述概率。在一些实施例中，概率整合模块462被用于权衡(weigh)特征处理器440的各种结果，这些结果可以是计算器442、444及446的所述多个结果的任何组合。在一些实施例中，一心脏状况评估模块464使用概率整合模块462的所述加权结果来派生心脏状况估计。在一些实施例中，概率整合模块462及/或心脏状况评估模块464与机器学习模块466交换、发送及/或接收数据。

可选地，如图4B所示，用于决定心脏状况的系统400被嵌入用于容纳一对象450诸如车辆402的一隔室(compartment)。在一些实施例中，系统400与所述汽车的所述多媒体系统及/或任何其他计算硬件被集成在一起。在一些实施例中，系统400被配置为输入来自对象450的一语音样本420。在一些实施例中，系统400包括用于进行所述心脏病理的所述分析的至少一些的电路。替代地或附加地，所述语音样本及/或至少部分地被分析的声音样本，例如通过一被连接的汽车的一多媒体系统，被传输到一服务器以用于进一步的分析。在一些实施例中，结果被直接发送给对象450，例如通过一智能手机及/或电子邮件。替代地或附加地，输出通过所述汽车接口被呈现给所述用户，诸如例如通过所述多媒体系统，及/或扬声器，及/或仪表板接口(诸如以一警示灯的形式)。替代地或附加地，结果被发送给一护理人员。

示例性语音样本处理：

现在参考图5A，以图解说明根据本发明一些实施例的示例性语音处理。在一些实施例中，将被获得的语音样本划分成多个帧潜在地具有心脏及/或语音特征信息，并且可能去除不太可能提供这种信息的帧，是潜在地有益的。

在一些实施例中，一语音样本在502处被进行滤波，例如去除噪声及/或失真。可选地，进行语音滤波包括声音降低(sound reduction)及/或主动噪声消除(active noisecancellation)技术。例如通过衰减背景噪声及/或语音失真来进行滤波的一潜在优势是潜在地提高后续处理的效率。在一些实施例中，进行滤波是通过主动噪声消除被完成的，其中所述噪声从所述言语中被减去。替代地或附加地，进行滤波通过在时域或频域中的噪声滤波被完成。

在一些实施例中，所述语音样本在504处被分类。被估计的是，在一心跳后的血流会引起所述言语信号的调制。在一些实施例中，为了从所述言语信号中提取心脏及/或声学信息，所述言语信号可选地被分为四类：(i)静默\多个背景噪声段–通常没有相关信息，(ii)多个清音段–通常具有少数的信息，(iii)多个浊音段，被估计具有相关的信息，并且(iv)多个过渡部分，被定义为所述言语在所述多个出声器官改变它从一种声音到另一种声音之间的结构(例如：所述口腔的方向，及/或所述舌头的位置，及/或所述嘴唇的位置，及/或所述声带的结构)处的部分。可选地，在分类后，多个非言语(及/或噪声)段被去除。替代地或附加地，多个清音段被去除。在一些实施例中，在所述多个浊音段上进行分类以包括或排除一特定的元音，例如：仅/ah/元音，或仅/eh/元音，或仅/oh/元音，或仅/uh/元音，或仅/eeh/元音。

在一些实施例中，所述言语样本在506处被划分为{m}个帧，例如：具有约0.1毫秒(msec)至约400毫秒的长度。替代地或附加地，多个帧具有约20毫秒至约40毫秒的长度。可选地，所述多个帧是重叠的，例如10％及/或20％，及/或30％，及/或40％，及/或50％，及/或60％的一重叠，或一重叠范围从1％到99％。

在一些实施例中，对于每个帧{m}，{j}个语音特征在508处被计算，使得例如：

在帧{m}处从多个言语样本被计算出的语音特征矢量{j,m}＝Fj{Speech_frame(m)}

Speech_frame(m)＝{Speech(t+Ts*m),Speech((t+1)+Ts*m)…Speech((t+Tw)+Ts*m)}

其中：

(m)–帧号

(t)–多个采样的时间索引(t＝1/Fs，其中Fs＝通常在6Khz至100Khz之间的采样频率)

(Ts)–帧步长(如果Ts＝Tw没有重叠，则Ts＝0.5*Tw是50％重叠)

(Tw)–帧大小(持续时间)

(Speech)–言语的多个样本

F{}是多个言语样本的功能＝多个语音特征，它们是所述言语的所述信息的替代表现(alternative representation)。例如：频谱及/或MFCC，及/或LPC，及/或自相关、小波特征等。

在一些实施例中，在510处，还为每个特征计算所述时间导数(任何顺序)，例如：

一阶导数：

二阶导数：

在一些实施例中，所述多个特征值之间的所述差异是沿着所述言语信号的各个点之间被计算的。作为一非限制性实例，心跳潜在地以可被用于定位所述多个RR脉搏的一图案改变所述多个特征值。

作为一非限制性示例：所述心跳潜在地改变在所述音高及多个共振峰频率处的频谱交叉相干性，使得所述言语在相干性最小处的两个部分之间的时间差可被用于估计RR间隔。

在一些实施例中，一些特征在整个发声上被平均。

在一些实施例中，在整个发声上计算一些特征的一些统计值。可选地，对于某些语音特征，使用清音部分。替代地或附加地，对于某些语音特征，仅有浊音部分被使用(例如：通过选择诸如共振峰及/或音高的特征)。在一些实施例中，在多个连续段之间的多个小的间隙(譬如小于一BPM约20％的长度，小于一BPM约15％的长度，及/或小于一BPM约10％的长度，及/或小于一BPM约5％的长度)被忽略，例如：从所述特征序列被省略。潜在地，小的间隙并不重要，因为所述心脏脉搏对血压的影响被估计要比所述多个间隙更长。替代地或附加地，在所述段之间的一间隙被重构及/或被外推，例如：当识别在所述段的所述末端处的一斜率及在下一段上的一互补斜率时，则可以一次发生的语音特征及/或心脏特征可以被外推。

可选地，一语音特征在512处被归一化，例如如图5B至图5C所示。归一化的一潜在优势是将对潜在地具有较少信息的帧诸如过渡帧的分析最少化。在一些实施例中，多个帧在514处根据多个预定的规则被去除，所述多个规则可选地与所述帧指示心脏信息的概率有关。

在一些实施例中，在516处，将所述多个被计算出的语音特征组合成一声学矢量以表示每个帧。可选地，所述声学矢量包含多个语音特征(诸如MFCC、LPC、小波、音高等，通常被称为声学参数)及/或语音特征统计信息及/或导数(在以下等式中被称为“DIFF”)，其被组合成单个矢量，例如：

其中所述声学矢量包含一系列声学参数及其导数，对于一阶导数，被标记为Diff1，及对于二阶导数，被标记为Diff2。

作为一非限制性示例，帧“m”的所述声学矢量可以是：

Acoustic_parameter(1..12,m)＝LPC(1..12,m)

Acoustic_parameter(13..26,m)＝MFCC(1..13,m)

Acoustic_parameter(27,m)＝Pitch(m)

Acoustic_parameter(28,m)＝RMS_ENERGY(m)

Acoustic_parameter(29..TBD,m)＝SPECTRAL_COHERENCE_PITCH(m,t)

备注：在多个音高频率下的多个相邻帧的相干值|

Acoustic_parameter(29..TBD,m)＝SPECTRAL_COHERENCE_FORMANTS(m,t)

备注：在多个共振峰频率下的多个相邻帧的相干值|

Acoustic_parameter(TBD..TBD,m)＝WAVELET_TRANSFORM(m)

Diff1(1..12,m)＝LPC(1..12,m)的一阶导数

Diff2(1..13,m)＝MFCC(1..13,m)的二阶导数

可选地，对每帧的所述语音特征矢量进行后续分析，例如派生心率信息。替代地或附加地，后续分析包括分布及/或周期性计算。替代地或附加地，可选地在滤波及/或分类后，所述语音样本被用于后续分析，而不是所述多个语音特征或所述多个声学矢量。

现在参考图5B，示例根据本发明的一些实施例的一语音样本的归一化。由于所述声学矢量包含关于心脏状况及言语语音学的信息，因此去除(例如标准化)所述言语语音学信息以强调所述心脏信息潜在地是有益的。图5B及图5C示例一种用于归一化在所述言语中的“自然”变化(由于语音学信息)的方法。

在一些实施例中，所述归一化算法使用多项式回归曲线拟合方法来估计在所述言语中的所述“自然”变化，例如：如下所述。

在一些实施例中，在542处，一旦多个语音特征矢量被获得，则多个声学矢量系数被派生。在一些实施例中，在544处，对所述多个系数进行多项式逼近。所述多项式函数估计所述多个特征的时间波动，即参数作为所述时间的函数。由一多项式表示的所述波动函数是一“平滑”函数，其仅考虑“自然”的长变化而不是源于一心脏脉搏影响的短变化。

在一些实施例中，一斜率变化在546处被计算。可选地，在548处，所述多个特征矢量(每帧)基于其斜率值及其相对于预定阈值或范围的位置进行带通滤波。在一些实施例中，所述多项式估计反映言语的一“自然”波动，即，由于发声(phonation)而引起的言语变化，并且可选地从所述语音特征中被减去。例如：

令x(i)为言语i＝1…N的一段的所述语音特征矢量系数，

这在时间t(i)i＝1..N被采样的。

所述帧采样间隔为：Ts等于1/Fr

其中Fr是帧率

M阶多项式被用于估计，导致估计误差ε(i)：

这可以写成

或者

所述多项式系数可以使用最小二乘估计被估计：

所述多项式估计反映所述言语的所述“自然”波动，并从所述语音特征被减去：

图5C以图解说明一示例性归一化过程，其中黑线示出随时间变化的所述语音特征值(上图)。蓝色(虚线)是归一化校正函数，使用三阶多项式。上图示出所述原始信号及所述校正函数，下图示出在所述归一化后的所述信号。在一些实施例中，所述言语在多个恒定声音周期之间的部分从所述分析被去除。

被估计的是，在言语期间，所述语音特征既反映发声信息又反映心脏信息。由于估计所述心脏脉搏对所述言语信号的影响是微妙的，因此在一些实施例中，一归一化算法被使用以减少在所述多个“自然”的语音特征中的自然变化，可选地在恒定的声音周期内。

在本发明的一些实施例中，可选地进行这样的一种声音的归一化处理。在一些实施例中，一归一化算法减少所述过渡部分及/或“平滑”所述单个声音部分，以便将更多数据考虑在内用于分析。图8A至图8B示出使用所述音高参数的另一示例。

分布分析的示例性高阶概述：

现在参考图6A是以图解说明根据本发明一些实施例的通过分布分析从一语音样本估计一心脏状况的一总体高阶概述。

在一些实施例中，一语音在602处被采样，以及，在604处被分析以提取至少一个语音特征。在一些实施例中，所述语音特征随时间的分布在606处被计算，以及，在608处被用于决定一心脏状况。可选地，分布计算包括计算所述被提取的语音特征的所述变异性。被估计的是，受所述心脏脉搏影响的血流会影响所述语音，并且当发生一心律失常时，这种影响估计是不规则的。因此，被估计的是，在病理的心脏状况中，所述多个语音特征值的分布将改变。

示例性分布分析的示例性详细流程图：

现在参考图6B，以图解说明根据本发明的一些实施例示出被用于特征分布分析的一详细过程示出所述音高作为语音特征的一示例的一流程图。

在一些实施例中，所述被选择的语音特征是所述音高。计算所述音高的一潜在优势在于，由于心跳导致的所述声带质量变化，所述音高是示出心脏脉搏的主要语音特征之一。被估计的是，在所述恒定言语信号期间，所述音高参数仅具有相对较小的“自然”变化。如在本文中被使用的，自然变化意指在多个语音过渡期间，例如在多个声音及/或多个音素之间及中间，包括例如呼吸，在多个语音特征中发生的变化。所述自然变化与所述心跳无关，并且在一些实施例中，通过归一化算法将所述自然变化最小化，如图5B至图5C所示。与其他更倾向于非心脏变动的声音特征相比，将所述音高用于语音分析是一个潜在的优势。所述音高特征的其他潜在好处在于，所述音高特征通常会在所述语音信号出现时间的40％以上被发现，并且有可能在不同的自发的言语中保持稳定的值。

在一些实施例中，一语音在612处被采样，以及，多个浊音段在614处被分类。在一些实施例中，在616处，将经分类的浊音段被串接(concatenated)以接收连续数据。在一些实施例中，在618处，从所述被串接的浊音段中提取音高。

可选地，例如使用图5B至图5C中所描述及以图解说明的多个过程以去除所述音高的自然波动，所述音高的自然波动例如是由所述多个发声器官的运动及/或操作引起而不是由所述血流引起的。在一些实施例中，在多个段被去除后，剩余的多个浊音段在622处被串接，以及，在624处可选地被平滑化。在一些实施例中，进行平滑包括进行平滑在不同段之间的多个融合点处的所述过渡。

在一些实施例中，所述音高分布在626处被计算。例如：分布计算包括所述多个音高值的一统计变化及/或从对所述多个语音特征进行数学运算所获得的任何其他统计信息，例如诸如标准偏差，及/或高阶矩，及/或偏斜偏差，及/或平均值等。

在一些实施例中，在628处，将所述分布值与一预定阈值进行比较，以决定在630处的一健康状况或在632处的一病理状况。例如：一高的分布暗示不规则影响，因此高于所述阈值的一分布值可能被视为一病理状况。在一些实施例中，所述分布的所述值可以是它的形状。

一示例性的单个扬声器方法：

在一些实施例中，可选地通过测量一次单个患者的语音与另一次的相同患者的语音之间的一变化以检测在脉律(pulse rhythm)的变化。

在一些实施例中，一患者被要求在不同次发出相同的(多个)声音及/或相同的(多个)音素，特别是在所述患者的心脏是心律失常的一次以及在所述患者的心跳是正常的时候。

心律的变化可以通过分析所述语音信号被检测。

在一些实施例中，所述分析是在不同时间记录一患者的音调及/或音素及/或单词及/或话语，以及可选地与所述患者的相同音调及/或音素及/或单词及/或话语的现场发音(live voicing)进行比较。

在一些实施例中，当他们的脉搏正常时，可选地分析具有慢性疾病诸如慢性心脏疾病的患者的相同音素，并且所述分析的声学特征可选地被保存，以与相同患者在其他时间的现场发音或其他记录的声学特征进行比较。

所述声学功能可选地包括以下的一项或多项：

多个基于频谱的参数，诸如能量的频谱分布、波峰、波峰能量、波峰带宽、频谱斜率等；

多个梅尔频率倒谱系数(MFCC)；

多个LPC系数；

多个声门脉波参数(声门脉波上升时间、声门脉波下降时间、声门脉波打开周期、声门脉波关闭周期、声门脉波频率、声门脉波波峰位置、声门脉波频谱、声门脉波周期的抖动、声门脉波幅度的抖动等)；

(多个)音高参数(pitch parameter)；

多个偏相关系数(partial correlation coefficients)，被缩写为PARCOR，这是在所述多个参数之间的相关性的一度量(measure)，但不一定是在所有参数之间的相关性；及

多个小波分析参数。

在一些实施例中，计算所述声学特征包括以下的一项或多项：

特征空间的多个质心，可选地使用K-MEANS聚类分析；

多个特征的多个变化的一直方图及/或概率密度函数(PDF)。在一些实施例中，对于一发声计算一个或多个声学特征，并且所述(多个)声学特征的一分布(诸如最小和最大值、标准偏差、分布形状等)可选地被使用作为在言语的心律病理学的一指示；

多个调制参数，在计算所述发声的(多个)声学参数后，可选地使用参数的及/或非参数的方法来计算所述(多个)参数的一频谱。来自所述被使用的频谱的所述多个参数是以下的一项或多项：

(多个)波峰位置、(多个)波峰带宽、波峰能量、(多个)频谱斜率等。

使用一支持矢量机(SVM)计算特征空间的子空间；及

来自一机器学习方法的其他聚类方法。

上述多个声学特征的多个计算可选地对于一健康的人的言语及具有一病理的心脏状况的人的言语产生不同特征的分布。

在一些实施例中，一声学信号的一统计模型的一初始学习/训练阶段可选地被计算，可选地包括对于一健康规则的心律及对于一病理性的心律的多个RR间隔的多个长度的多个分布，并且一阈值被决定用于区分所述多个声学特征的一项或多项统计度量的一健康值及一病理值。

在一些实施例中，一统计心脏状况分类器可选地由以下的方式训练：

收集心脏健康及心脏不健康的谈话者的多个语音记录；

计算在本文中所述的用于所述多个记录的一个或多个声学特征；

使用如上所述的技术及/或其他机器学习技术训练一统计分类器。

在一些实施例中，对于不同的人收集所述多个语音记录，可选地甚至是大量健康的及/或大量不健康的谈话者。

在一些实施例中，对于为单个人收集所述多个语音记录，例如：在一个人已知是健康的时候。

在一些实施例中，当检测到在所述健康言语的一改变时，所述的人可选地被分类为潜在地具有一不健康的心脏状况。

在一些实施例中，可选地还对于单个人收集所述多个语音记录，例如当某人已知是不健康时，可选地在一已知心脏状况的情况下。

在一些实施例中，当所述言语被检测为类似于所述(多个)不健康的记录时，所述的人可选地被分类为潜在地具有一不健康的心脏状况。

在一些实施例中，一声学信号的一统计模型的一初始学习/训练阶段可选地被计算，可选地包括对于一健康规则的心律及对于一病理性心律的多个RR间隔的多个长度的多个分布，并且一阈值被决定用于区分所述多个声学特征的一项或多项统计度量的一健康值及一病理值。

现在参考图6C，这是根据本发明一些实施例的一种用于学习诊断多个心脏状况的方法的一简化流程图例。

图6C示出一种方法，包括：

采样声音(640)；

提取多个语音特征(642)；

可选地组合几种发声的多个语音特征(644)；

进行聚类分析(646)；

可选地产生一码本(648)。

在一些实施例中，所述采样可选地通过在包括6Hz到100KHz的频率的一范围内的数字化语音被进行。

在一些实施例中，可选地对于已知由心脏健康的一个或多个谈话者说出的言语及/或至少在所述(多个)谈话者具有一非病理性心律的一时间段做完所述语音的所述采样。

在一些实施例中，所述语音的所述采样可选地包括已知由具有一病理性心律的一个或多个谈话者说出的言语，可选地被识别为具有一病理性心律的一个或多个谈话者的多个言语示例。

在一些实施例中，对于(多个)健康的谈话者的多个发声及/或当所述(多个)谈话者具有一非病理性心律时，来自几个发声的多个语音特征的所述可选的组合可选地被进行。

在一些实施例中，对于(多个)健康的谈话者的多个发声及/或当所述(多个)谈话者具有一非病理性心律时及/或对于具有一病理性心律的一个或多个谈话者的言语，来自几个发声的多个语音特征的所述可选的组合可选地被分离地进行。

在一些实施例中，对于(多个)健康的谈话者的多个发声及/或当所述(多个)谈话者具有一非病理性心律时，所述聚类分析可选地被进行。

在一些实施例中，对于(多个)健康谈话者的多个发声及/或当所述(多个)谈话者具有一非病理性心律时，所述聚类分析可选地被分离地进行，并且对于具有一病理性心律的一个或多个谈话者，所述聚类分析可选地被分离地进行。

在一些实施例中，所述码本可选地是(多个)健康的谈话者的及/或代表所述(多个)谈话者何时具有一非病理性心律。

在一些实施例中，所述码本可选地包括对于(多个)健康谈话者的言语及具有一病理性心律的一个或多个谈话者的言语的多个分类。

在一些实施例中，所述聚类分析可选地通过K-均值(K-means)分析被进行。

现在参考图6D，这是根据本发明一些实施例的一种用于分类心脏状况的方法的一简化流程图例。

图6D示出一种方法，包括：

采样声音(650)；

提取多个语音特征(652)；

可选地选择一语音特征(654)；

从一个或多个码本值计算语音特征的距离(656)；

将距离与阈值进行比较(658)；及

分类心脏状况(659)。

在一些实施例中，所述采样可选地通过在包括6Hz到100KHz的多个频率的一范围内的数字化语音被进行。

在一些实施例中，所述分类心脏状况可选地基于与一健康心脏状况的一个或多个码本值相距大于一阈值而被决定。

在一些实施例中，所述分类心脏状况可选地基于与一健康心脏状况的一个或多个码本值相距小于一阈值而被决定。

在一些实施例中，所述分类心脏状况可选地基于与一患病的心脏状况的一个或多个码本值相距大于一阈值而被决定。

在一些实施例中，所述分类心脏状况可选地基于与一患病的心脏状况的一个或多个码本值相距小于一阈值而被决定。

被串接的浊音段的示例：

现在参考图7A至图7B，示出根据本发明的一些实施例，如图7A中所示的一语音样本的一示例，其已经被分类以去除多个语音段，然后剩余的段在图7B中被串接。

在所述示例性的分类中，图7A的所述语音样本是已经对于浊音段702及清音段704进行分类。如图7B所示的图形示出剩余的浊音段702已经被串接。应被注意的是，多个段的串接仅在本发明的一些实施例中被进行，并且通常在所述语音特征的所述时间顺序不太重要，但是在每个点及/或整体上所有点处的所述行为不太重要时才被提供，以进行分析。

数据平滑示例：

现在参考图8A至图8B示出从已经被平滑化的一语音样本提取的音高数据的一示例，其中图8A及图8B以图解说明所述语音的“自然”波动的平滑。红线表示随时间变化的所述语音特征，在这种情况下，所述音高随时间变化，蓝线表示所述校正功能。

图8B示出在所述归一化后的所述音高信号。通常地，在从所述语音特征中删除所述“自然”变化后，提取心脏信息的更高准确性可以被获得。

音高提取的示例：

现在参考图9A至图9C示出根据本发明一些实施例的从一语音样本被提取的音高数据在被滤波及被平滑化后的一示例，其中图9A示出多个被串接的浊音段的一示例，及图9B示出如果是图9A的所述多个被串接的语音段的音高提取的一示例。所述虚线部分是在各个段之间的多个“融合(fusion)”点，由于所述“自然”变化是显著的且可能掩盖所述心脏贡献的变化，因此从所述分析被省略。

使用多个语音特征统计分析方法对于心率病理的概率的示例性决定：

在一些实施例中，所述“健康的”语音特征(及/或它的统计的及/或数学的运算)分布是从多个健康谈话者的一训练集(即，一谈话者独立模型)被计算的。替代地或附加地，在已知的健康状态，譬如足够周期性的状态(即，与一谈话者相关的模型)期间，从所述被测试的谈话者计算所述“健康的”语音特征分布(及/或它的统计的及/或数学的运算)。

现在参考图10A至图10D，示出在AF期间(图10B及图10D)期间及在健康的人的言语期间(图10A及图10C)被记录的言语的一音高的所述归一化标准偏差值的所述分布的直方图的一示例。根据本发明的一些实施例，示例使用多个语音特征分布分析决定心率病理的概率。

被示例的从图10A中的多个健康对象派生的言语的一训练集上的一音高的被计算的正规化标准偏差(及图10C是以更高的分辨率示出图10A的相同分布)及图10B中的多个经AF诊断的对象(及图10D是以更高的分辨率示出图10B的相同分布)。在本文中示例中，所述音高参数被选择是因为它对不同声音的相对较高的稳定性，并且它在自然言语周期的40％以上都存在。

在一些实施例中，所述音高的所述归一化标准偏差的一阈值被用于检测AF。替代地或附加地，一被训练的统计分布被形成用于多个健康对象，并且一被训练的统计分布被行程用于多个非健康对象，并且可选地当前分布与每个训练分布在统计上匹配。可选地，诊断基于对匹配的较高统计概率被估计。

例如：对于为第i个言语帧被计算的多个音高值，i＝1…N：

所述标准偏差被计算所述言语信号的总体上的几个部分。根据被使用的所述声学参数的所述变异性，所述多个部分的持续时间被选择为最小(以便检测短的病理发作)。

对于此示例可被看出的是，对于常规脉搏，85％的STD＜0.02；及对于所述AF记录，60％的STD>0.02。

示例性心率提取：

在一些计算中，在一些实施例中，所述被分析的对象的所述心率被使用。根据本发明的一些实施例，从所述对象的所述语音样本提取一示例性心跳频率如下。

在一些实施例中，所述心率基于频谱分析(例如：如图14B所示，框1416)被计算，例如对多个语音特征的离散傅立叶变换。在如下示例中，表示T个连续言语段(譬如无噪声及/或静默的多个言语帧的多个段)的p个语音特征的矩阵：

所述矩阵可以在特定时间包括各种语音特征，例如：

V(t,1)–可以是在时间t的音高值。

V(t,2)–可以是在时间t的音高导数

V(t,3)–可以是在时间t的多个MFCC系数

对于每个系数(所述矩阵的原始值(raw))计算一离散傅里叶变换，可以使用以下方法：

每个原始值等于一个语音特征参数的所述傅立叶变换的所述绝对值。所述心率将在所述频域中以所述心率频率的一波峰被示出。可选地，对于多个语音特征计算BPM(心率的每分钟跳动数)，然后通过平均化并使用所述平均值，或在所有被计算出的特征系数中的最普遍的数值(most common value)的一多数表决选择后的一值。在一些实施例中，多个不合理的值(例如：低于约30bmp且高于约300bpm)被滤波。替代地或附加地，对于高度不规则的心跳，所述频谱能量不受频带限制。

示例性脉搏间隔提取：

现在参考图11A以图解说明根据本发明一些实施例的用于计算脉搏间隔的一般流程图。

在一些实施例中，一语音样本1102被用于在1104处识别至少两个心脏脉搏。在一些实施例中，在1106处，计算在所述多个脉搏发生(pulse occurrences)之间的时间间隔。在一些实施例中，在1108处，心脏状况基于所述被提取的时间间隔被估计。

可选地，所述多个脉搏是彼此连续的。替代地，如果所述时间间隔被计算为足够短的，则多个非连续脉搏足以决定一心脏状况。

在一些实施例中，对每个帧分离地执行分析。替代地或附加地，对多个帧的一组成序列执行分析。在一些实施例中，被识别的多个脉搏的一序列被编译(compiled)，可选地维持所述多个脉搏的所述时间序列，即使它们出现在不同的帧上。在一些实施例中，将所述被识别的多个脉搏之间的所述多个时间间隔与一参考及/或一阈值进行比较，以便决定所述心脏状况。

示例性详细脉搏间隔提取：

现在参考图11B，示出根据本发明一些实施例的示例详细脉搏间隔提取的一流程图。

在一些实施例中，一语音样本1112在1114处被分类以提取多个浊音段。在一些实施例中，多个浊音段包括大约0.5秒至大约3秒的长度。在一些实施例中，在1116处，所述多个浊音段被用于识别心脏脉搏，诸如多个R脉搏，如在图11C及图11D中进一步被详细描述的。在一些实施例中，在1118处，在所述多个被识别的脉搏之间的所述时间间隔被计算。

在一些实施例中，在单个语音段中被识别至少两个脉搏。替代地，每个语音段被识别至少三个脉搏，或至少四个或至少五个，或至少六个，或至少七个或至少八个脉搏。在一些实施例中，此段包括多个非连续部分。在一些实施例中，仅有彼此连续的多个脉搏被考虑。替代地，仅有等于或小于所述对象的所述心率的多个时间间隔被考虑。

可选地，在1120处，将所述被识别的多个脉搏之间的时间间隔的短序列与一参考进行匹配，并且计算与所述参考匹配的所述概率。在一些实施例中，一参考是在相同对象中但是在一健康状况期间被识别的多个脉搏的多个时间间隔。替代地或附加地，一参考包含已知为一健康及/或一病理状况的特征的多个脉搏的多个时间间隔。替代地或附加地，一参考包括从其他健康及/或病理性语音样本被派生的多个时间间隔序列的一数据库。在一些实施例中，所述多个参考图案是在一初始阶段使用多个健康及病理性言语样本的多个数据库被获得的。

在一些实施例中，在1122处将所述匹配值的概率与一阈值进行比较，其中例如：当与一病理序列匹配时，低于所述阈值的一值将导致在1130处的健康状况决定，而高于所述阈值的一值将导致在1132的病理状况决定。在一些实施例中，所述阈值是一预定的固定值。替代地，所述阈值是基于多个数据源诸如通过使用机器学习被动态决定的一变量。例如：如果在另一测试中，决定一心律失常的一高可能性被检测，则在1122处基于所述多个时间间隔用于决定一心律失常的所述阈值可以更低。

示例性R脉搏位置识别：

现在参考图11C，示出在一时间轴上的多个R脉搏位置的示例性识别的一流程图。

因此，在一些实施例中，在将所述多个言语帧(如图5A至图5C所示)进行分类后，并且可选地省略静默，及/或多个没有信息的帧及/或所述过渡帧。

在一些实施例中，对于言语的一连续段，表示多个言语帧的所述声学矢量被获得。在一些实施例中，从每个帧的声学矢量到在所述段中所有其他帧的一距离被计算。可能地，所述距离保存有关所述言语信号变化的信息，所述信息是由反映组织柔韧性的多个言语器官组织的不连续/未知微小变化所引起，及/或由于肌肉张力变化及/或血管质量及体积变化所引起的自然变化。在多个连续的帧之间的距离被预期较小，而对于更多被分离的帧，则较大。

在一些实施例中，在1150处，对于每个帧(t)，可选地对于所有言语帧，计算到先前(向后)帧及前进(向前)帧的一距离。

例如：在两个声学矢量之间的所述距离函数可以通过以下公式被计算：

{其中所述声学矢量包含一系列声学参数及其导数，对于一阶导数，被标记为Diff1，且对于二阶导数，被标记为Diff2}

其中W(p)是权重系数，被用于归一化及缩放。

在一些实施例中，在1152处，在所述前向距离系列中及/或在所述后向距离系列中的局部最小值被识别。

在从点(t＝t1)沿一前向方向被测量的一距离(t>t1)中找到局部最小值：

t2＝ARGMIN_i{D(t,j)},j>t1

并且沿一后向方向(t＜t1)

t3＝ARGMIN_j{D(t,k)},k＜t1

在一些实施例中，在1154处，基于帧t，到所述局部最小值的多个距离的总和被用于估计RR间隔：

其中α是一常数。

现在参考图11D，这示出根据本发明一些实施例的RR间隔估计的一示例性图形。

图11D包括一图形1100，所述图形1100示出在一Y轴1106的D(t)作为沿一X轴1107的时间t的一函数。

所述图形1100示出在一时间t1的D(t1)1101，在t1之前的一时间t2的D(t)1102的一第一最小值，以及在t1后的一时间t3的D(t)1103的一第二最小值。

图11D示出基于检测所述最小值1102、1103被估计的所述RR间隔，作为RR_interval＝(t3-t2)。

在一些实施例中，几个RR间隔被估计。

在一些实施例中，根据诸如以下的一个或多个标准，仅有一些被估计的RR间隔被使用：

(1)局部极小值的所述形状(“深的”或“平坦的”)

(2)所述RR间隔的有效性。在一些实施例中，所述RR间隔仅在适合于在合理范围内估计BPM值的情况下才可选地被使用。例如：作为一非限制性示例，大于45BPM且小于250BPM)

(3)选择一些最可能的RR间隔。在一些实施例中，多个RR间隔长度可选地被计算，并且所述多个RR间隔长度的一分布可选地被计算。可选地，多个RR间隔被选择，所述多个RR间隔落在围绕一平均RR间隔长度的一特定阈值内，诸如在所述平均值的大约+/-5％、10％、20％、33％、50％内。可选地，多个RR间隔被选择落在多个RR间隔长度的一特定范围内，所述多个RR间隔长度的特定范围相应于围绕一平均心率的多个心率，诸如在所述平均的大约+/-5％、10％、20％、33％、50％之内。在一些实施例中，在分析言语的一段，可选地为一整个交谈并获得可能的多个RR间隔的一列表后，可选地进行这样的一种分析。

在一些实施例中，进行所述序列分析，寻找最可能的图案。对于一正常的心率，将会发现相似的RR间隔。对于不规则的心率，将找不到或几乎没有类似的RR间隔。

(4)使用其他标准来估计与“心脏脉搏”无关的自然言语变化的概率。

在一些实施例中，当局部最小值不是尖锐的(譬如更长的时间段)时，所述被估计的距离从随后的分析中被去除并且考虑下一个最小值。在一些实施例中，通常对于短帧段，计算每帧段的一个RR间隔。替代地，通常对于更长的段，计算多个RR间隔。

在一些实施例中，对于所有帧{t＝0,1,…T}估计RR间隔。可选地，从一整个言语样本派生的所述多个RR间隔在1156处计算的所有特征被平均化，并且可选地在1158处派生所述整个言语样本的RR间隔的一整体估计。

在一语音样本中的RR间隔识别的示例：

现在参考图12A，根据本发明的一些实施例，呈现在一恒定元音中的多个MFCC型语音特征的所述帧到帧距离的一示例，其中所述上图示出(在每个帧中被计算的多个MFCC声学特征的)所述帧到帧距离图案，而所述下图示出一ECG图形作为一参考。在图12A中所示的箭头指示两个帧：帧(t)及帧(i)。对于一给定的帧{t}，所述到帧{i}的帧到帧距离将具有周期性质，其中可能在每个RR间隔出现的一局部最小值，即D(t,i)，在以下的多个点处具有局部最小值：在它们之间的时间距离等于所述多个RR间隔。从所述上图到所述下图的所述箭头示出的是，所述帧到帧距离的所述局部最小值(上图)出现在周期性类似于所述多个RR间隔(下图)的多个位置。

使用相干性在一语音样本中识别RR间隔的示例：

在一些实施例中，使用一相干值作为言语的多个波动的一量度可选地使用上述方法。

使用上述方法及定义：

对于相干性：

D(t1,t2)＝Coherence(Speech(t1:t1+tw),Speech(t2:t2+tw))

在一些实施例中，频谱交叉相干性在两个言语帧之间被计算，一个在一时间t1开始，另一个在一时间t2开始。

X(n)＝speech(t1,t1+1,t1+2,…t1+Tw))

Y(n)＝speech(t2,t2+1,t2+2,…t2+Tw)

其中Tw＝分析的帧幅度

现在参考图12B，这示出根据本发明的一些实施例的相干性计算的一示例性图形。

图12B包括一图形1230，所述图形1230是沿一X轴1237在一Y轴上的一相干值作为时间t的一函数，以毫秒为单位。

所述图形1230示出从在时间t1的一点1231到达在820毫秒(msec)的一时间t21232处相应于频率的一最大偏移的一最小值的距离在音高频率的相干性。所述时间t2接近一患者的855毫秒的脉搏周期。

RR间隔数据的示例：

现在参考图13，呈现根据本发明的一些实施例在灵敏度的变化相对心脏状况决定的所述特异性随着增加发生多个连续脉搏的一示例。

所述图形示出被正确诊断为在所述Y轴上作为P(D)的具有一病理的人的百分比与被错误诊断为在X轴上作为P(FA)的具有一病理的人的概率(被示出为以1减去所述概率)。所示的图形示例当脉搏连续次数增加时，所述灵敏度如何增加。它还表明的是，当连续脉搏数量增加时，特异性及灵敏度也都增加。

应被注意的是，所述计算是基于以下在所述整体心律失常概率整合的部分下被示出的算法，所述算法包括一种仅从几个RR脉搏进行AF评估的方法。

示例性周期性决定概述：

现在参考图14A，呈现根据本发明的一些实施例的一流程图以图解说明用于决定在所述被用于决定一心脏状况的心率处的周期性的一过程。假设心率是周期性的，则预期血管质量及/或体积的变化是半周期的(或正常窦性心率是周期性的)。因此，通过找到所述帧到帧距离图案中的周期性变化，有可能检测到心脏活动的节奏。

在一些实施例中，在1402处对一语音进行采样，及在1404处提取至少一个语音特征。在一些实施例中，在1406处，例如使用频谱分析及/或自相关来计算至少一个语音特征的周期性。在一些实施例中，在1408处，心脏状况基于所述语音特征的所述周期性被估计。这意谓的是，由于大多数能量被估计为被集中在所述心率频率，因此常规脉搏频率被估计在(一语音特征随时间变化的)频谱\自相关域中创建“窄的(narrow)”能量。不规则脉搏(主要是AF)可能不会在一个频率上集中能量，并且接近所述平均心率的所述频谱\自相关值可能会不太集中。

所述语音特征的示例性详细周期性决定：

现在参考图14B，示出根据本发明的一些实施例的一流程图用于基于心脏活动对所述语音样本的影响的节奏以决定心脏活动的节奏。

在一些实施例中，在1412处对语音进行采样，并且在1414处提取至少一个语音特征。在一些实施例中，所述语音样本被用于提取所述被采样的对象的所述心率。替代地或附加地，心率通过一心率监测器被测量。在一些实施例中，在1418处，以包括所述心率频率的多个频率来计算所述语音特征的自相关。所述自相关可选地在所述心率频率周围的一预定范围被表征。在一些实施例中，在1420处通过识别一波峰形状参数并决定其值来提供表征。例如：一波峰形状参数可以是所述波峰的一带宽及/或其振幅。在一些实施例中，在1422处，将所述参数值与一阈值进行比较，以在1430处决定一健康状况或在1432处决定一病理状况。

语音特征的声门脉波分析的示例：

声门脉波分析是一种计算产生于声门线的移动的一脉搏可能不受其他言语器官诸如例如嘴、舌、唇及/或口腔/鼻腔)的影响的技术。

现在参考图14C是根据本发明一些实施例的一声门波的一简化图例。

图14C示出一喉部及多个声门的横截面1441、1442、1443、1444、1445的图例1440。

图14C还包括示出一线1453的一图形1450以示出沿一X轴1452的时间t的函数在一Y轴1451上的气流值。

喉部及声门的横截面1441、1442、1443、1444、1445的图例1440示出声门的不同状态，图形1450示出与上述状态对应的气流值。

通过一些示例，图14C示出：

在所述线1453上相应于一关闭的声门的一第一位置1454；

在所述线1453上相应于一开启的声门的一第二位置1455；

在所述线1453上相应于一开启的声门的一第三位置1456；及

在所述线1453上相应于一关闭的声门的一第四位置1457，在本文中位置的声门关闭的速度比所述线1453示出在位置1454前的声门关闭的速度快。

在所述线1453上相应于一关闭的声门的一第五位置1458；

一声门脉波可选地从所述言语信号中被提取。

在一些实施例中，从一言语信号的一声门脉波计算可选地被用于决定一心率状况。一第一阶段可选地是获得所述声门脉波。

在一些实施例中，如上述标题为“从言语或歌声估计所述声门脉波”所述，所述声门脉波可选地被计算。

在一些实施例中，从所述声门脉波信号计算出以下参数中的一个或多个：

一声门上升时间(从10％增加到90％)；

一声门下降时间(从90％降低到10％)；

所述声门的一开启/关闭持续时间；

一周期(在所述声门脉波信号的多个波峰之间的距离)；

所述声门脉波信号的波峰高度及/或宽度；及

所述声门脉波信号的几个周期的一频谱。

在一些实施例中，所述多个参数的统计量可选地被比较，并且可选地决定心率变异性。

在一些实施例中，上述参数中的一个或多个在本文中所述的处理技术中被用于作为“言语特征(speech features)”。

使用一声门信号的一潜在优势在于，与心脏脉搏无关的多个言语器官的“自然”变化(诸如舌头及/或嘴巴的运动)可能不被考虑，并且有可能获得一更准确的估计。

用于语音特征频谱分析的示例：

现在参考图15A至图15D，呈现根据本发明的一些实施例的使用多个语音特征的多个频谱特性决定用于心率病理的概率，其中图15A及图15C示出一健康图案，其特征在于一高振幅、低宽度的波峰，且图15B及图15D以图解说明AF图案，其特征在于一低振幅、高宽度的波峰。红色圆圈表示心率的频谱波峰(由上述方法计算得出)

由于心脏脉搏被估计以调制所述言语，因此不同心律被预期会在所述多个语音特征的频谱图案中创建不同图案。所述频谱波峰的所述带宽被预期与所述心脏参数的所述周期性范围匹配。例如：AF脉搏是高度不规则的，将在频域中产生各种波峰，因此具有一较宽的带宽。所述多个波峰的带宽将相对较大，反映出AF及其他心律失常中常见的非周期性变化。相比之下，常规脉搏即周期性脉搏被预期会引起所述言语的恒定调制，通常会在频域中可能正好在所述心率中生成一个主波峰。所述波峰可能会变窄以反映一周期性变化(譬如一窦型心脉搏)。

使用多个MFCC参数的一阶导数来计算图15A至图15D所示的示例。所述导数运算潜在地会有用，因为它会删除大多数所述“自然”(语音学的)言语信息及内容。应被注意的是，此方法可以使用自相关系数对频谱分析进行替代地或附加地使用。

示例性整体心律失常概率整合：

在一些实施例中，在一心脏脉搏中的不规则性的一被计算的概率，例如如图3所示的框362至364及如图4所示的框460至466，基于以下的至少一个：(i)语音特征分配(ii)语音特征周期性，(iii)脉搏间隔数据。

一些心脏病理通常表现为一高的心率。在一些实施例中，一高的心率被定义为高于70BPM，或高于90BPM，或高于100BPM，或高于120BPM。在一些实施例中，对于这些病理，当检测到一低且稳定的BPM时(譬如在所述频域中的高能量集中在单个频率周围)，可以估计出这些特定病理的一较低概率。

可选地，计算多个脉搏数据间隔的所述系列的一总变化，例如使用：

diff(i)＝(T_i+1-T_i)/average(T_i)

心脏脉搏i的时间：在两个脉搏之间的距离(RR)为：|T_i+1-T_i

实验发现的是，AF心率及正常心率的多个TV值具有不同的值。这导致基于一短系列的心脏脉搏的AF检测的一阈值(例如：如图11B中的框1122至框1130、框1132所示例)

在一些实施例中，如果所述总变化超过一预定阈值，则检测到AF。可选地，对于某些肯定的估计(例如：心脏病理的高可能性)，建议进一步的医学检查，例如：通过向所述用户发送一通知及/或通知一护理人员。

在一些实施例中，可选地，对于不太确定的估计(譬如心脏病理的中等概率)，发起附加的语音测试。在一些实施例中，所述对象被要求对一些预定的言语信号进行发音(pronounce)以供进一步检查。可选地，使用多个预选的言语声音(诸如例如：长时间重复3至6秒的浊音\ah\)，以检索更多信息。

在一些实施例中，对于表现出心脏病理学的一低概率的对象，存储所述对象的数据，可选地被用于在随后的测试中进一步分析，或者被用于附加到所述健康训练模型数据库。

在一些实施例中，一旦具有一病理状况的一可能性被确定，就将所述对象转诊至进一步的诊断方法，从而潜在地增加所述检测的所述灵敏度。例如：一对象可以被意指为具有一基于医院的核查(hospital based checkup)，及/或被意指为使用多个补充的家庭应用程序(complementary home-use applications)，诸如光体积描记法(PPG)及/或一便携式ECG监视器，这例如被用于一智能手机中。在一些实施例中，在一状况被识别出时，通知所述对象应用所述多个补充的家用应用程序中的一个，从而增加一正确诊断的可能性。

在一些实施例中，多个补充应用程序是手动操作的。可选地，所述补充应用程序根据一预定方案被进行操作，例如：每天一次、每天两次、一天三次，依此类推，可选地根据一患病的可能性。例如：如果具有一状况的一可能性更高，则需要更多数量的补充应用程序操作。替代地或附加地，在病理状况估计后，补充应用程序立即被操作。

示例性治疗监测：

现在参考图16，示出根据本发明一些实施例的由本文公开的所述系统及方法提供的一可能的治疗及监测的一时间表。

在一些实施例中，筛查1602被提供给大量人群或单身人群。在一些实施例中，在以一足够的预定概率决定一心脏状况后，给定治疗。替代地或附加地，在以一足够的预定概率决定一心脏状况后，进行一第二诊断测试或一验证测试，例如诸如ECG监测及/或光电容积描记(PPG)及/或一第二语音样本包括一预定的发声(predetermined vocalization)。可选地，一治疗包括一药物治疗1630，通常在一段时间内。替代地或附加地，治疗包括通常单次提供的一程序性治疗1640。

在一些实施例中，一旦对象将要开始治疗，则在1604处，在治疗开始之前对其心脏状况进行监测。可选地，所述病情的严重性被监测，并且在这种监测后治疗可能会改变。替代地或附加地，在1606处，在所述治疗期间提供监视，以可选地监视一药物的效果。替代地或附加地，在1608处，在一治疗后可选地提供监测以识别所述状况的复发。

在一些实施例中，监视时间表是基于所述对象的诊断状况。例如：在一严重的心房颤动每天发生数小时的情况下，每天对对象进行一次采样就足够。另一方面，如果所述对象被诊断为患有一轻度AF，则可能需要更频繁地采样以实现检测。

一般的：

如本文所用，所述术语“约(about)”是指±25％。

所述术语“包括(comprises)”、“包括(comprising)”、“包含(includes)”、“包含(including)”、“具有(having)”及其词性变化意指“包括但不限于(including but notlimited to)”。

所述术语“由...组成(consisting of)”意指“包括并限于(including andlimited to)”。

所述术语“基本上由……组成(consisting essentially of)”是指所述组合物、方法或结构可包括附加的成分、步骤及/或部件，但前提是所述附加的成分、步骤及/或部件不会重大改变所要求保护的组成物、方法或结构的基础及新颖特征。

如在本文中被使用的，所述单数形式“一(a)”、“一(an)”及“所述(the)”包括复数引用，除非上下文另外明确指出。

在整个申请中，本发明的各种实施例可以用一范围格式被呈现。应被理解的是，所述用范围格式的描述仅是为了方便及简洁，而不应被解释为对本发明的范围的一不灵活限制。据此，一范围的所述描述应该被认为已经具体公开所有可能的子范围以及所述范围内的各个数值。例如：对范围从1到6的描述应被视为已明确公开子范围，例如从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等，以及所述范围内的单个数字，例如1、2、3、4、5及6。无论所述范围的广度如何，这都适用。

每当一数值范围在本文中被指示时，其意图包括在所述指示范围内的任何被引用的数字(分数或整数)。所述短语一第一指示数字与一第二指示数字“之间的范围/范围(ranging/ranges between)”及“范围/范围从(ranging/ranges from)一第一指示数字“到(to)”一第二指示数字在本文中可互换使用，并且意在包括所述第一及第二指示数字以及它们之间的所有小数及整数。

应被理解的是，为了清楚起见，在单独的实施例的上下文中被描述的本发明的某些特征也可以在单个实施例中以组合方式被提供。相反地，为了简洁起见，在单个实施例的上下文中被描述的本发明的各种特征也可以单独地或以任何合适的子组合或在本发明的任何其他所述的实施例中被合适地提供。在各种实施例的上下文中被描述的某些特征不应被认为是那些实施例的必要特征，除非所述实施例没有那些元件就不能工作。

如上文所述且如以下权利要求书中所要求保护的本发明的各种实施例及方面在以下示例中找到被计算的支持。

示例：

使用一语音样本用于心脏状况决定的示例：

现在参考以下实施例，其与以上描述一起以一非限制性方式例示本发明的一些实施例。

在一些实施例中，一人声被采样。在一些实施例中，所述语音样本被分析以提取多个被期望的语音段。例如：静默期间可以被取出及/或仅有浊音段被保持。可选地，仅有一特定种类的元音被维护，例如仅/ah/元音，或仅/eh/元音，或仅/oh/元音，或仅/uh/元音，或仅/eeh/元音。在一些实施例中，被保持的语音段被串接，潜在地导致连续数据而不是遵循一时间序列。替代地，被维持的语音段随时间保持它的顺序，从而保留所述多个段的所述节奏的所述信息。

在一些实施例中，一语音特征诸如音高从已经被滤波以获得浊音段并被串接的多个语音段中被提取。在一些实施例中，所述音高值的自然波动被去除，所述自然波动是所述言语的发声变化及由于声带及声腔的自然波动而引起的变化。在一些实施例中，所述自然波动可选地被滤波以在检测心跳相关变化中获得更高的灵敏度。在一些实施例中，在所述自然波动被去除后，将具备被调整的音高的语音段串接。可选地，多个连续语音段的所述融合点被平滑化。

在一些实施例中，所述音高的所述平滑的串接数据被分析以派生所述归一化标准偏差(N-STD)。在一些实施例中，将所述N-STD的所述值与一阈值进行比较，在所述阈值以上，所述被采样的对象被决定为具有一病理的心脏状况，而在所述阈值以下，所述被采样的对象被决定为具有一健康的心脏状况。

在一些实施例中，相同的语音样本经过一第二道分析(second analysis)。可选地，多个语音段被提取。在一些实施例中，R脉搏在每个被维持的语音段中被识别。可选地，通过识别一R脉搏与一被去除的语音段连续的至少一部分外推多个R脉搏。在一些实施例中，通过定位连续的多个R脉搏计算多个RR间隔。例如：通过在同一语音段中定位一个以上的R脉搏，及/或通过将多个R脉搏定位在具有可被忽略的一短间隙的不同语音段上，及/或通过识别与一被外推的脉搏连续的一R脉搏。

在一些实施例中，将多个RR间隔与一参考进行比较，例如：一参考具有多个RR间隔已知为一病理的心脏状况诸如AF的特征。替代地或附加地，一参考包括相同被采样的对象的一健康RR间隔序列。替代地或附加地，一参考包括不同健康及/或病理的多个对象的多个样本。

在一些实施例中，将所述RR间隔序列与一参考匹配的所述概率与一阈值进行比较。例如：如果一RR间隔的一概率在与一病理的序列比较时高于所述阈值，及/或在与一健康的序列比较时低于所述阈值，则一病理状况被决定。替代地或附加地，如果在一RR间隔的一概率与一病理序列比较时低于一阈值，及/或在所述RR间隔的所述概率与一健康序列比较时高于所述阈值，则一健康状况被决定。

在一些实施例中，所述语音样本经过一第三道分析(third analysis)。应被注意的是，进行所述分析的顺序可以被改变，并且每种分析可以与其他两个分析以组合或单独的方式独立进行。

在一些实施例中，一语音样本被分析以提取多个语音特征。在一些实施例中，心率被决定，可选地通过从所述语音样本本身提取所述心率。在一些实施例中，在所述心率频率处的所述语音特征的一自相关及/或频谱被计算。被注意的是，流入及流出所述声带区域的血液可能与心脏脉搏有关。被估计的是，一语音特征的所述变异性的至少一部分将受到这种血流及/或心室搏动及/或心房搏动的影响。因此，如果存在一健康的周期性心率，则被估计的是在所述心率处的一自相关分析及/或频谱分析将提供一波峰形状，所述波峰形状指示在所述心率处的声血影响(vocal blood influence)的一高周期性。另一方面，如果有心律失常，则在所述心率处的一自相关将提供一被涂抹的波峰(smeared peak)，指示血液影响不是很有周期性。

在一些实施例中，所述波峰的一参数与一阈值进行比较。例如：所述波峰形状的一参数可以包括它的带宽及/或所述波峰的高度及/或总面积。在一些实施例中，将一波峰参数与一阈值比较以决定一健康或病理的心脏状况。

在一些实施例中，用于健康及/或病理的心脏状况的一加权概率基于以上分析被计算。

在一些实施例中，多个慢性状况潜在地通过多个语音参数的变化被检测。在一些情况下，心房颤动(AF)会导致所述左心房扩张(这在大多数病理性AF病例中都会发生)。所述扩张会影响所述喉返神经，导致所述语音不断变化。这些变化可能会在所述多个音高信号的所述多个参数中被体现出来，并且可以被分析及被检测。

这样即使在所述心跳处在一正常速率情况下，也可以检测出患有慢性疾病的AF患者。

用于心率提取的示例：

现在参考图17，以图解说明根据本发明一些实施例的用于从一语音样本提取心率的一示例。与所述心跳相关的多个语音特征被估计在所述心跳的频率处具有波波峰。例如：图17示例一对象的\ah\声音的一言语样本的一分析具有74BPM。所述用于所述分析的被选择的语音特征为dMFCC：在0.84Hz的MFCC矢量高能量(波峰)的一阶导数的绝对值为74bpm。

在从每一帧派生多个语音特征后，在一些实施例中，至少一个语音特征的多个周期性图案在所述语音特征随时间的一序列中被识别。例如：多个周期性图案的识别可以使用频谱分析及/或自相关分析被进行。在一些实施例中，每分钟心跳(BPM)的心率可选地是最大的从所述被识别的周期性图案被估计。

如上文所述且如以下权利要求书所述，本发明的各种实施例及方面在以下实施例中得到实验及被计算支持。

示例

现在参考以下实施例，与以上描述一起以一非限制性方式例示本发明的一些实施例。

在以色列一家领先的医疗中心，处于AF状况及处于心律正常状况的AF患者均进行一IRB批准的临床研究。

在58例AF患者中，有26例经历心脏复律(cardioversion)并被记录两次(a)在一AF发作期间及(b)在心脏复律(post-cardioversion)后的两个小时的正常心率状况下。心脏复律是一种医疗程序，通过这医疗程序，一异常快的心律或其他心律失常可以使用电能或药物被转换为正常心律。下表总结迄今为止已被收集的成对的ECG/语音记录(ECG/voicerecorded pairs)的数量：

现在参考图18A，这是示出根据本发明一些实施例的与谈话者无关的检测结果的一图形。

图18A示出一实验的一图形1801，其中通过本发明的一示例实施例处于AF或正常心律的不同判定阈值分析有一AF状况的58位患者及有一正常心律(窦性心律)的23位患者的记录。

所述图形1801具有一X轴1802及一Y轴1803，所述X轴1802相应于所述阈值的一定性值，所述Y轴1803相应于所述患者的状况被正确分析的所述患者记录在0至1的一范围内的一部分。

图18A示出真阳性(具有AF状态)心脏状况分类的一第一线1804及真阴性(窦性心律)心脏状况分类的一第二线1805。

图18A还示出两个示例点，其中一相同的特定阈值提供现在被具体描述的结果：一第一点1806示出基于语音分析的AF的92％的真阳性识别，及一第二点1807示出基于语音分析的AF的70％的真阴性识别，即是识别为正常窦性心律。

图18A示出与谈话者无关的结果，即是对大量谈话者训练并被用于对一未知患者检测心脏状况的一系统的结果。所述被示出的结果被认为可以成功地根据人的语音估计多个心脏状况。

现在参考图18B，这是示出根据本发明一些实施例的与谈话者相关的检测结果的一图形。

图18B示出一实验的一图形1811，其中通过本发明的一示例实施例处于AF或正常心律的不同判定阈值分析在AF状况及在正常窦性心律状况下被记录的有一AF状况的32位患者的记录。

所述图形1811具有一X轴1812及一Y轴1813，所述X轴1812相应于所述阈值的一定性值，所述Y轴1813相应于所述患者的状况被正确分析的所述患者记录的一部分。

图18B示出真阳性(具有AF状态)心脏状况分类的一第一线1814及真实阴性(窦性心律)心脏状况分类的一第二线1815。

图18B还示出两个示例点，其中一相同的特定阈值提供现在被具体描述的结果：一第一点1816示出基于语音分析的AF的92％真阴性(窦性心律)识别，及一第二点1817示出击于语音分析的AF的77％的真阳性识别，即是识别为AF节律。

图18B示出取决于谈话者的结果，即是由单个谈话者的一个或多个语音记录训练的一系统的结果，这是在健康的或AF的特定已知心脏状况下被获取的，被用于检测相同谈话者的心脏状况。所述被示出的结果被认为可以成功地基于人的语音估计心脏状况。

比较基准：

与本发明的一些实施例相比，现在被做出的一估计在一机会性基础上诸如每周一次使用单个时间点ECG装置(或一事件记录器)捕获一AF发作所花费的时间量。下表总结在不同的AF负担及测试频率情境下运行一仿真时的计算结果。

当在至少两个非自发的言语样本中检测到所述AF语音生物标记时，将一模拟器配置为注册AF检测。在这样的配置中，本发明的实施例导致94％的检测灵敏度(真阳性)及92％的一检测特异性(窦性心律的真阴性检测)。

如下表所示，基于每天六次10分钟发作的AF负担，所述模拟显示一基于ECG的每周监视将在163天内检测到所述AF，而本发明的实施例将在8天内检测所述AF。

尽管本发明已经结合其特定实施例被描述，但是显然对于本领域技术人员而言，许多替代、修改及变化将是显而易见的。因此，旨在涵盖落入所附权利要求书的精神及广泛范围内的所有这样的替代、修改及变化。

本说明书中提及的所有出版物、专利及专利申请都通过引用整体并入本文，其程度如同每个单独的出版物、专利或专利申请被具体地及单独地指示通过引用并入本文的程度。此外，在本申请中对任何参考文献的引用或标识均不应被解释为承认此参考文献可作为本发明的现有技术。在章节标题被使用的程度上，不应将其解释为必然的限制。

Claims

1.一种用于分析一对象的一语音样本以决定一心律失常的心脏状况的方法，其特征在于：包括：

从所述语音样本提取至少一个语音特征；

检测一心脏状况对所述至少一个语音特征的一影响；

基于所述影响决定一心律失常的心脏状况。

2.根据权利要求1所述的方法，其特征在于：所述检测一心脏状况对所述至少一个语音特征的一影响的步骤包括检测一心脏状况的一影响是被选自于以下组成的一群组的至少一种影响语音的起因所影响：

血流量；

心室搏动；及

对所述至少一个语音特征的心房搏动。

3.根据权利要求2所述的方法，其特征在于：所述检测一影响的步骤包括识别所述影响语音的起因的一节奏、所述影响语音的起因的一周期性及所述影响语音的起因的一幅度或幅度变化中的至少一个的一影响。

4.根据权利要求1所述的方法，其特征在于：所述决定一心律失常的心脏状况的步骤包括整合多个所述被识别的影响。

5.根据权利要求1所述的方法，其特征在于：还包括将所述语音样本进行分类以识别多个浊音段。

6.根据权利要求5所述的方法，其特征在于：还包括串接所述多个浊音段，使得至少一些段被移除并且剩余的多个段末端被平滑化。

7.根据权利要求2所述的方法，其特征在于：还包括将与在从所述语音样本被移除的多个段中的所述影响语音的起因有关的数据进行外推。

8.根据权利要求1所述的方法，其特征在于：所述被检测的影响包括心脏脉搏的一节奏。

9.根据权利要求8所述的方法，其特征在于：所述检测一影响的步骤包括识别心脏脉搏连续发生三次。

10.根据权利要求9所述的方法，其特征在于：所述决定一心律失常的心脏状况的步骤包括计算在所述心脏脉搏连续发生多次之间的多个时间间隔，并将所述多个时间间隔与从一参考心脏状况获得的多个参考时间间隔进行匹配。

11.根据权利要求10所述的方法，其特征在于：所述决定的步骤还包括：

决定所述匹配的一概率；及

12.根据权利要求11所述的方法，其特征在于：所述参考心脏状况是健康的或心律失常的。

13.根据权利要求9所述的方法，其特征在于：所述一心脏脉搏发生三次没有在相同的浊音段中被识别。

14.根据权利要求1所述的方法，其特征在于：所述检测一影响的步骤包括识别心脏脉搏连续发生两次。

15.根据权利要求1所述的方法，其特征在于：所述被检测的影响包括一心脏脉搏的一幅度或一幅度变化的一影响。

16.根据权利要求15所述的方法，其特征在于：所述检测一影响的步骤包括计算所述至少一个语音特征的多个值的一分布。

17.根据权利要求16所述的方法，其特征在于：所述基于所述影响决定一心律失常的心脏状况的步骤包括将所述分布的一表征参数与一阈值进行比较。

18.根据权利要求17所述的方法，其特征在于：所述表征参数包括所述分布的一形状。

19.根据权利要求18所述的方法，其特征在于：所述值包括所述形状的一宽度。

20.根据权利要求1所述的方法，其特征在于：所述被检测的影响包括对心脏脉搏的一周期性的一影响。

21.根据权利要求20所述的方法，其特征在于：还包括估计所述对象的一心率。

22.根据权利要求21所述的方法，其特征在于：

所述决定一心律失常的心脏状况的步骤包括表征在所述心率的一频率周围的一预定范围的所述周期性；

所述表征的步骤包括计算在所述预定范围的一波峰的一带宽；及

所述决定所述心律失常的心脏状况的步骤包括将所述带宽与一阈值进行比较。

23.根据权利要求1所述的方法，其特征在于：还包括验证所述决定一心律失常的心脏状况。

24.根据权利要求23所述的方法，其特征在于：所述验证的步骤包括获得一第二语音样本，所述第二语音样本包括一预定发声。

25.根据权利要求23所述的方法，其特征在于：所述验证的步骤包括对所述对象的一心电图测试及一光电容积描记测试中的至少一种。

26.根据权利要求1所述的方法，其特征在于：所述心律失常的心脏状况包括心房颤动。

27.根据权利要求1所述的方法，其特征在于：所述语音样本是自发的言语。

28.根据权利要求1所述的方法，其特征在于：所述语音特征包括一音高。

29.根据权利要求1所述的方法，其特征在于：提取所述语音特征的步骤包括进行在所述语音样本的一第一段与所述语音样本的一第二段之间的交叉相干性。

30.根据权利要求1所述的方法，其特征在于：提取所述语音特征的步骤包括进行选自于以下组成的一群组中的所述言语信号的分析：

小波分析；

梅尔频率倒谱系数分析；

声门脉波分析；及

线性预测编码分析。

31.一种用于由一对象提供的一语音样本决定一心律失常的心脏状况的系统，其特征在于：包括：

一语音输入，用于获得所述语音样本的一数字语音样本；

一语音特征处理器，识别心脏活动对所述至少一个语音特征的一影响；

32.根据权利要求31所述的系统，其特征在于：所述语音输入形成一移动电话、一数字助理及一汽车多媒体系统中的至少一个的一部分。

33.根据权利要求31所述的系统，其特征在于：所述语音特征提取器、所述语音特征处理器及所述心脏状况分类器中的至少一个位在一服务器处。

34.根据权利要求33所述的系统，其特征在于：所述服务器与一电话交换机并置且从所述交换机获取所述数据。

35.根据权利要求31所述的系统，其特征在于：所述语音输入被配置为根据一预定时间表获得所述数字语音样本。

36.根据权利要求31所述的系统，其特征在于：还包括一永久的内存，其中所述内存存储多个参考语音特征，所述多个参考语音特征从与一心律失常的心脏状况或一健康的心脏状况相关的多个语音样本被派生。

37.根据权利要求36所述的系统，其特征在于：所述心脏状况分类器基于表征所述多个参考语音特征的一训练阶段决定所述心律失常的心脏状况。

38.根据权利要求36所述的系统，其特征在于：所述永久的内存存储来自所述对象的至少一个先前收集的语音样本。

39.根据权利要求38所述的系统，其特征在于：所述心脏状况分类器基于所述先前收集的语音样本与所述数字语音样本之间的一变化决定所述心律失常的心脏状况。

40.一种用于由一对象提供的一语音样本决定一心脏状况的系统，其特征在于：包括：

一语音输入，用于获得所述语音样本的一数字语音样本；

一语音特征处理器，识别一心脏状况对所述至少一个语音特征的一影响；

一心脏状况分类器，基于所述影响决定所述心脏状况。

41.一种用于分析一对象的一语音样本以决定一心脏状况的方法，其特征在于：包括：

从所述语音样本提取至少一个语音特征；

检测一血流对所述至少一个语音特征的一影响，所述影响是所述血流的一节奏、所述血流的一周期性及所述血流的一幅度或幅度变化中的至少一种；

基于所述影响决定一心脏状况。

42.根据权利要求41所述的方法，其特征在于：所述被决定的心脏状况包括一异常心率。

43.根据权利要求42所述的方法，其特征在于：所述异常心率包括心室心动过速。

44.根据权利要求41所述的方法，其特征在于：所述被决定的心脏状况包括异位搏动及室性早搏中的至少一种。

45.一种用于分析一对象的一语音样本以重建一心脏行为的方法，其特征在于：包括：

从所述语音样本提取至少一个语音特征；

检测一血流对所述至少一个语音特征的一影响；及

从所述被检测的影响重建所述心脏行为的一个或多个参数。

46.根据权利要求45所述的方法，其特征在于：所述心脏行为包括一心脏颤动发生。

47.根据权利要求46所述的方法，其特征在于：包括：当识别心脏颤动发生多于一预定数量时，决定一心律失常的心脏状况的一存在性。

48.根据权利要求46所述的方法，其特征在于：包括：当识别心脏颤动发生少于一预定数量时，排除一心律失常的心脏状况的一存在性。

49.根据权利要求45所述的方法，其特征在于：所述心脏行为的一个或多个参数指示一非心律失常的心脏状况。

50.根据权利要求45所述的方法，其特征在于：所述一个或多个参数包括一脉波形状。