CN112105297A

CN112105297A - 健康相关信息生成和存储

Info

Publication number: CN112105297A
Application number: CN201980031172.6A
Authority: CN
Inventors: J·P·莱索
Original assignee: Cirrus Logic International Semiconductor Ltd
Current assignee: Cirrus Logic International Semiconductor Ltd
Priority date: 2018-05-08
Filing date: 2019-05-07
Publication date: 2020-12-18
Also published as: GB202210385D0; WO2019215433A1; GB202016163D0; US20230377602A1; KR20210006419A; GB2605929B; US20190348064A1; GB2605930B; GB2587108B; GB2587108A; GB2605929A; GB2605930A; US11749298B2; GB202210386D0

Abstract

所检测到的声音信号可包括言语或非话语声音，并且许多非话语声音包含健康信息。如果言语或包含健康信息的非话语声音是由注册用户产生，则与所述声音相关的数据可存储在存储元件中。系统还包括用于混淆所接收数据以提供所存储数据的混淆版本的数据修改块。然后，系统具有：第一访问机构，其用于控制对所存储数据的访问，使得仅被授权用户可获得对所述所存储数据的访问权；以及第二访问机构，其用于控制对所述所存储数据的访问，使得第二访问机构仅提供对所存储数据的混淆版本的访问权。

Description

健康相关信息生成和存储

技术领域

本申请涉及医学信息的生成和存储。

背景技术

已知可从一个人的言语以及他们产生的非言语声音(non-speech sound)(诸如咳嗽、喷嚏等)中获得医学相关信息。

当然，智能电话设置有传声器，并且由于智能电话通常被携带，因此智能电话具有检测其所有者产生的言语和非言语声音的潜力。然而，为了与医学相关，有必要确保所检测到的声音实际上是由正被分析其健康状况的人产生的。此外，有必要确保以适当的安全方式存储在装置内生成的任何健康相关信息。

发明内容

根据本发明的第一方面，提供了一种获得与用户的健康相关的信息的方法，所述方法包括：检测声音；确定所检测到的声音是否包括包含健康信息的非话语声音(non-verbal sound)；如果确定所检测到的声音包括包含健康信息的非话语声音，则确定所述非话语声音是否由所述用户产生；并且如果确定所述非话语声音是由所述用户产生，则存储与所述非话语声音相关的数据。

根据本发明的第二方面，提供了一种监测注册用户(enrolled user)的健康的方法，其包括：接收表示言语的音频信号；对所接收音频信号执行说话人辨识过程以识别说话人；如果确定所识别说话人是注册用户，则从由所述音频信号表示的所述言语获得健康标记特征；以及将所获得健康标记特征连同指示所识别说话人的数据一起存储在安全存储元件中。

根据本发明的第三方面，提供了一种用于健康相关数据的数据存储系统，其包括：存储元件，其用于存储输入数据，其中在确定输入数据与注册用户相关之后存储所述输入数据；数据修改块，其用于接收所述输入数据，并且用于混淆所述所接收输入数据以提供所述所存储数据的混淆版本；第一访问机构，其用于控制对所述所存储数据的访问，使得仅被授权用户可获得对所述所存储数据的访问权；以及第二访问机构，其用于控制对所述所存储数据的访问，使得所述第二访问机构仅提供对所述所存储数据的所述混淆版本的访问权。

附图说明

为了更好地理解本发明并且更清楚地示出可对其进行实施的方式，现将仅通过举例的方式对附图进行参考，在附图中：

图1示出智能电话；

图2示出智能电话的示意图；

图3是框图，其示出第一处理系统；

图4是流程图，其示出第一方法；

图5是框图，其示出第二处理系统；

图6是流程图，其示出第二方法；

图7是框图，其示出第三处理系统；并且

图8是处理和存储装置的示意性框图。

具体实施方式

以下描述阐述了根据本公开的示例性实施方案。其他示例性实施方案和实现方式对于本领域技术人员将显而易见。此外，本领域技术人员将认识到，可代替以下论述的实施方案或与它们结合地应用各种等效技术，并且所有此类等效形式应视为由本公开涵盖。

为了清晰起见，这里应注意，本说明书引用说话人辨识和言语辨识，它们意图具有不同含义。说话人辨识是指提供关于说话的人的身份的信息。例如，说话人辨识可从一组先前登记的个人中确定说话人的身份(说话人识别)，或者可提供指示说话人是否为特定个人的信息(说话人验证)，例如用于认证目的。言语辨识是指用于确定所说内容和/或含义而非辨识说话的人的技术。

图1示出智能电话10，其具有用于检测周围声音的传声器12。智能电话10仅为其中可实现本文所描述的系统并且可执行本文所描述的方法的电子装置的一个示例。其中可实现本文所描述的系统并且可执行本文所描述的方法的电子装置的其他示例是平板计算机或膝上型计算机、游戏控制台、家庭控制系统、家庭娱乐系统、车载娱乐系统以及家用器具。

图2是示意图，其示出智能电话10或其他电子装置的形式。

具体地，图2示出智能电话10的各种互连部件。应了解，智能电话10实际上将包含许多其他部件，但以下描述足以理解本发明。

因此，图2示出上文提及的传声器12。在某些实施方案中，智能电话10设置有多个传声器12、12a、12b等。

图2还示出实际上可被设置为单个部件或多个部件的存储器14。存储器14被提供用于存储数据和程序指令。

图2还示出同样实际上可被设置为单个部件或多个部件的处理器16。例如，处理器16的一个部件可以是智能电话10的应用程序处理器。

图2还示出被提供用于允许智能电话10与外部网络进行通信的收发器18。例如，收发器18可包括用于通过WiFi局域网或者通过蜂窝网络建立互联网连接的电路。

图2还示出用于视需要对由传声器12检测到的音频信号执行操作的音频处理电路20。例如，音频处理电路20可过滤音频信号或者执行其他信号处理操作。

图2还示出用于将信息提供给用户和/或从用户接收输入的用户界面22。例如，用户界面22可包括触摸屏显示器。

在一些实施方案中，智能电话10设置有说话人辨识功能和控制功能。因此，智能电话10能够响应于注册用户所说的命令而执行各种功能。说话人辨识功能能够区分注册用户所说的命令和由不同的人所说的相同命令。因此，本发明的某些实施方案涉及操作具有某类语音可操作性的智能电话或另一便携式电子装置，例如，平板计算机或膝上型计算机、游戏控制台、及家庭控制系统、家庭娱乐系统、车载娱乐系统、家用器具等，其中在意图执行所说命令的装置中执行说话人辨识功能。某些其他实施方案涉及其中在智能电话或其他装置上执行说话人辨识功能的系统，如果说话人辨识功能能够确认说话人是注册用户，则所述系统将命令传输到单独的装置。

在一些实施方案中，在于智能电话10或靠近用户定位的其他装置上执行说话人辨识功能的同时，所说命令使用收发器18传输到确定所说命令的含义的远程言语辨识系统。例如，言语辨识系统可位于云计算环境中的一个或多个远程服务器上。然后，将基于所说命令的含义的信号传回到智能电话10或其他本地装置。

在其他实施方案中，说话人辨识功能的第一部分在智能电话10或靠近用户定位的其他装置上执行。然后，如下文更详细地描述，信号可使用收发器18传输到远程系统，所述远程系统执行说话人辨识功能的第二部分。

显而易见，智能电话在理论上可用于基于用户的言语并且基于他们产生的非言语声音来提供关于用户的可能的医学相关信息。然而，在这些领域中进行的工作通常是在非自然情形下进行的，例如，要求特定用户在特定时间说话，或者可假设检测到的声音是由所述特定用户产生。下文所描述的方法允许在自然情形下更连续地生成信息。

本文所描述的实施方案涉及由用户产生的非言语声音，并且涉及用户的言语。

图3是可在智能电话10上实现的系统的示意性框图，并且图4是示出由系统执行以用于获得与用户的健康相关的信息的方法的流程图。

图3示出智能电话10上的传声器12中的一个。如图4的步骤50处所示，传声器10将检测智能电话10附近的声音。虽然在图3中示出了仅一个传声器10，但在方法中可使用由多个传声器检测到的声音。

由传声器10生成的信号传递到预处理块30。例如，如果由传声器10生成的信号是模拟信号，则预处理块30可执行模/数转换。信号也可被划分成例如20ms持续时间的帧，使得可单独地考虑每个帧。

预处理的信号被传递到声音分析块32，所述声音分析块32在图4所示的过程的步骤52中确定所检测到的声音是否包括包含健康信息的非话语声音。

例如，在一些实施方案中，非话语声音是咳嗽；在一些实施方案中，非话语声音是喷嚏；并且在一些实施方案中，非话语声音是可听呼吸声音。在一些实施方案中，声音分析块32被配置为检测多种非话语声音。

这些声音中的每一种包含健康信息。因此，可使用用户咳嗽这一事实来推断关于用户的医学病症的信息。声音分析块还可提取关于咳嗽的类型的另外的信息。例如，声音分析块32可能够区分排痰性咳嗽、非排痰性咳嗽和顿咳。类似地，可使用用户打喷嚏这一事实来推断关于用户的医学病症的信息。同样，还可使用可听到用户的呼吸这一事实来推断关于用户的医学病症的信息。声音分析块还可提取关于呼吸声音的另外的信息。

因此，声音分析块32可设置有表示其所涉及的具体非话语声音(诸如咳嗽、喷嚏、鼾声或其他可听呼吸声音、放屁(因嗳气或肠胃气胀)或打嗝)的模型。然后，预处理信号可在声音分析块32中与这些模型进行比较，以便确定是否已经检测到这些声音中的一种。

另外，声音分析块32可生成将与关于非话语声音的信息相关联的与声音产生的时间相关的时间戳数据。另外或替代地，声音分析块32可生成与声音的持续时间相关的数据。另外或替代地，声音分析块32可保持对产生的所述非话语声音的数目的计数。

另外，声音分析块32可生成与声音的可听特征相关的数据。另外或替代地，声音分析块32可执行对非话语声音的分析，并且生成与所述分析的结果相关的数据。

在图4所示的过程的步骤54中，如果确定所检测到的声音包括包含健康信息的非话语声音，则确定非话语声音是否由用户产生。

确定非话语声音是否由用户产生的过程可采取若干不同形式中的一种或多种。

例如，由预处理块30输出的预处理信号可传递到生物计量分析块34，并且确定非话语声音是否由用户产生的步骤可包括对所检测到的声音执行生物计量过程。

更具体地，在一个示例中，已经认识到，人在咳嗽时发出的声音可用作所述人的生物计量识别符。因此，当非话语声音是咳嗽时，执行生物计量过程可包括将所检测到的声音与先前由用户产生的咳嗽进行比较。一种可能性是要求用户通过故意咳嗽来执行注册过程，因为已经表明，这种强迫性咳嗽具有非强迫性咳嗽的许多特性。然后所述用户咳嗽的特征可以常规方式提取并存储，并且用作模型。例如，所提取的特征可包括表示也可用于执行说话人辨识的输入音频的特征。例如，所提取的特征可能包括梅尔频率倒谱系数(MFCC)。

注册过程可能持续很长时间(例如，若干天)，因此它可使用注册用户产生声音的若干示例。系统可要求用户在一个或多个场合产生声音。替代地或另外，当系统检测到相关声音(例如，咳嗽或喷嚏)时，它可提示用户确认他们发出过所述声音。然后，由用户产生的多个声音可用于注册目的。

而且，注册可包括充实阶段，其中即使在注册之后，也分析后续声音并将其用于改善所述特定用户的模型。这有助于允许系统识别特定用户的咳嗽(或其他声音)之间的差异，以及所述用户与其他用户之间的差异。

然后，当用户已经在系统中注册并且已经创建模型时，将所检测到的声音与用户先前产生的对应非话语声音进行比较可包括：从表示咳嗽(或其他声音)的所接收音频信号的一部分提取相同的特征，并且将所提取咳嗽特征与注册期间产生的模型进行比较。如果类似程度足够，则可确定咳嗽是由注册用户产生的。不管是否执行初始注册，都可将由声音分析块32检测到的咳嗽或其他非话语声音与被辨识为用户先前已产生的对应非话语声音进行比较。

在另一示例中，确定非话语声音是否由用户产生的步骤可包括：请求用户确认他们是否产生了所述非话语声音。

例如，如果声音分析块32确定已检测到喷嚏，则它可向智能电话的用户界面22发送信号，例如，致使触摸屏显示如下消息：

“刚才打喷嚏的是你吗？按下按钮“是”或“否””。

然后，确定非话语声音是否由用户产生的步骤可包括：仅在按下屏幕上显示的“是”按钮的情况下将喷嚏记录为是由用户产生的。

在另一示例中，确定非话语声音是否由用户产生的步骤可包括：接收与用户所穿戴或携带的装置的移动相关的信息。

例如，如果人打喷嚏，则这通常使他们的头部稍微移动。因此，声音分析模块可接收由设置在用户所佩戴的耳机中的加速度计36生成的信号。耳机可具有与耳机10的有线或无线连接。如果具有人打喷嚏特有的头部移动的特性的信号与喷嚏的声音同时被接收到，则可确定打喷嚏的是智能电话10的用户。

在图4所示的过程的步骤56中，如果确定非话语声音是由用户产生的，则存储与所述非话语声音相关的数据。例如，如图3所示，数据可存储在存储器38中。当需要时，包含声音的音频信号也可存储在存储器38中。如下文更详细地描述，存储器38可以是安全存储装置，其可与在片上系统中执行分析和分类的处理器集成，或者可牢固地连接到处理器。

因此，此方法和系统具有可存储关于非话语声音的信息的优点。所存储的信息是临床上相关的。例如，在怀疑患有慢性胸病的人的情况下，可获得关于人咳嗽次数的准确信息，并且还可获得咳嗽的其他相关可听特征。对于患有阻塞性睡眠呼吸暂停等病症的人，可获得有关可听呼吸效应的持续时间和频率的信息。

另外，方法和系统能够区分使用装置的人的咳嗽和喷嚏与可能由传声器检测到的其他咳嗽和喷嚏。这避免了例如因检测到其他人咳嗽而使用户咳嗽次数的计数出错的情形。

图5是可在智能电话10上实现的系统的示意性框图，并且图6是示出由所述系统执行以用于获得与用于监测用户的健康相关的信息的方法的流程图。

图5示出智能电话10上的传声器12中的一个。传声器10将检测智能电话10附近的声音。虽然在图5中示出了仅一个传声器10，但在方法中可使用由多个传声器检测到的声音。

由传声器10生成的信号被传递到预处理块70。例如，如果由传声器10生成的信号是模拟信号，则预处理块70可执行模/数转换。信号也可划分成例如20ms持续时间的帧，使得可单独地考虑每个帧。

预处理信息被传递到语音活动检测(VAD)块72，所述VAD块72确定所检测到的声音是否包括言语。可以以先进先出的方式，将所接收音频信号的表示言语的部分存储在缓冲区中达固定的时间段。例如，缓冲区可能够存储至少5秒或至少10秒的言语。

因此，在图6所示的过程的步骤90中，图5的系统接收表示言语的音频信号。所接收音频信号将取决于传声器12检测到的声音，所述声音可包括一个或多个人的言语外加相关联背景声音。

然后，表示言语的所接收音频信号被传递到特征提取块74。

由特征提取块74提取的特征包括表示可用于执行说话人辨识的输入音频的特征。例如，所提取的特征可能包括梅尔频率倒谱系数(MFCC)。可从言语信号提取的其他特征包括感知线性预测(PLP)特征、线性预测(LPC)特征以及用深度神经网络(DNN)提取的瓶颈或串联特征。诸如MFCC、PLP特征和LPC特征的声学特征可与DNN提取的特征组合。

另外，由特征提取块74提取的特征包括表示可用于监测说话人的健康的输入音频的特征。可用于监测说话人的健康的一些特征也是可用于执行说话人辨识的特征，而可用于监测说话人的健康的其他特征不同于可用于执行说话人辨识的特征。例如，可用于监测说话人的健康的特征除其他之外包括言语的频率分量、言语的振幅以及音高周期。

因此，在图6的流程图中，在步骤92中，对由特征提取块74从所接收音频信号提取的特征中的至少一些或全部执行说话人辨识过程。说话人辨识过程在说话人辨识块76中执行。

在下文所描述的一个示例中，假设存在系统的已经通过注册过程的至少一个登记用户。注册过程通常涉及用户说出一些预定词语或语句，然后用户的言语的所提取特征用于形成用户的言语的模型。

在此情况下，注册过程可涉及通知用户：注册是为了启用将用作用于监测他们的健康的方法的一部分的说话人辨识过程。以此方式，可获得用户对这种监测的同意。

然后，步骤92中所执行的说话人辨识过程涉及将从所接收音频信号提取的特征与模型进行比较。如果通过了类似性测试，则确定所接收言语是注册用户的言语。

如果在步骤92中确定说话人是监测健康的方法的注册用户，则过程转到步骤94，其中由特征提取块74提取的特征被传递到健康标记块78，其中基于由特征提取块74从由音频信号表示的言语提取的特征来获得健康标记特征。用于获得健康标记特征的特征可包括所提取特征中用于执行说话人辨识过程的一些或全部特征，和/或可包括不用于执行说话人辨识过程的一些所提取特征。

例如，所获得的健康标记特征可包括以下中的一者或多者：言语的基本频率；基频微扰(jitter)，即，基本频率的周期对周期变化的度量；振幅微扰(shimmer)，即，信号的振幅的周期对周期变化的度量；言语的长时平均频谱；语速；最大发声时间(MPT)；噪声谐波比(NHR)；谐波噪声比(HNR)；倒谱峰值突出(CPP)；最大流量衰减率(MFDR)；声门接触商或闭商(CQ)，它是在声门脉冲周期(GPP)期间声门闭合多少的度量；一阶谐波分量与二阶谐波分量(H1-H2)之间的相对功率(或幅度)的度量。研究已经识别了与所有这些标记特征相关联的医学病症。

例如，US2003/0078768的标题为“Method for Analysis of Vocal Jitter forNear-Term Suicidal Risk Assessment”，并且存在用于基于人的言语的特征来诊断医学病症的许多其他已发布技术。此类技术的一个问题是难以在自然条件下获得人的言语样本，同时要确定所检测到的言语实际上是感兴趣的人的言语。

另外，健康标记块78可生成与健康标记信息相关联的时间戳数据，所述时间戳数据与引起健康标记的言语产生的特定时间相关。另外或替代地，健康标记块78可生成与相关言语的持续时间相关的数据。另外或替代地，健康标记块78可记录应用于特定时间间隔的健康标记值。仅作为一个说明性示例，健康标记块78可记录星期一09:00-12:00、星期一12:00-15:00等时段的基频微扰值，并且可类似地记录星期一09:00-12:00、星期一12:00-15:00等时段的振幅微扰值。

在图6所示的过程的步骤96中，连同指示所识别说话人的数据一起存储任何所获得健康标记。例如，如图5所示，数据存储在存储器80中。如下文更详细地描述，存储器80可以是安全存储装置，其可与在片上系统中执行分析和分类的处理器集成，或者可牢固地连接到处理器。

在一些情况下，所接收信号的相关部分可整体地存储，使得临床医生可听到人的言语。

如上所述，仅在言语被识别为注册用户的言语时，才获得健康标记。在其他示例中，为了避免任何处理延迟，可在不等待确定言语是注册用户的言语的情况下执行获得健康标记的过程。在所述情况下，如果获得了健康标记，但确定言语并非注册用户的言语，则可丢弃健康标记。

作为另一替代方案，为了避免执行不必要的计算，仅当已经确定言语是注册用户的言语时才提取用于获得健康标记的特征。为此，可在提取特征之前缓冲言语，并且仅当已经确定言语是注册用户的言语时才可开始提取将用于获得健康标记的特征的过程。

无论如何，仅在确定导出健康标记的言语是已注册到健康监测系统中的用户的言语的情况下才存储健康标记。

因此，此方法和系统具有可存储关于用户言语的临床相关信息的优点。特别地，方法和系统能够区分已经注册到监测健康的方法中的使用装置的人的言语，使得所存储的临床相关信息仅与所述注册人相关。

如图3和图4的实施方案以及图5和图6的实施方案所示，生成和存储医学相关信息。

本公开的一个方面涉及限制对所述所存储信息的访问的方式。在生成并存储医学相关信息后，存在如何将所述信息发布到其他相关服务的问题。例如，用户可能很乐意让他们认可的执业医师获得所有数据。然而，对于这样的执业医师来说，审查可能生成的大量数据通常并不高效。准确地说，以下做法可能更高效：对所有数据进行初始评估，只有当数据引起特殊关注时，才警示合格的执业医师。所述初始评估可能例如由软件程序自动地执行。在智能电话上运行的系统的情况下，软件程序可能在智能电话中的单独处理器上运行，并且所述程序可访问的数据然后也可被其他程序访问，而用户可能不想发生这种情况。

图7是示意性框图，其示出用于医学相关信息的数据存储系统100的一种形式。

系统100包括用于存储已经被识别为与特定人相关的医学相关信息的存储器110。当与如图3所示的系统结合使用时，存储器110可与图3所示的存储器38相同。因此，在从人的言语导出信息的情况下，可能已经对言语执行语音生物计量过程。当与如图5所示的系统结合使用时，存储器110可与图5所示的存储器80相同。因此，在从非言语声音导出的信息的情况下，可能已经对声音执行了生物计量处理，或者可能已经接收到身份的某种其他确认。

因此，到存储器100的输入端118可来自提供身份信息的系统。另外，存储器100还可具有用于从可提供医学相关信息的单独的装置(例如，心率监测器或活动监测器)接收输入数据的输入端120。

存储在存储器110中的数据可通过安全接口112来读取。例如，安全接口112可连接到已认证或密码保护链路(例如，使用具有公共/专用密钥加密的安全套接字层(SSL))，使得只有被授权用户才可询问所存储的数据和/或使得所存储的数据只能发送给被授权用户。被授权用户可以是例如由智能电话的所有者授权的临床医生。

另外，存储在存储器110中的数据可被传递到修改块114，然后通过不安全接口116来读取。由修改块114执行的修改以及不安全接口116的操作使得数据被混淆。例如，在一些实施方案中，应用差分隐私技术。

例如，数据修改块114可被配置用于对从存储器110接收的数据的全部或子集进行二次采样。这具有以下效果：可通过不安全接口116访问的数据被混淆(例如统计上被混淆)，并且不可能访问全部数据。

作为另一示例，数据修改块114可被配置用于将噪声添加到从存储器110接收的数据中。

作为又一示例，数据修改块114可被配置用于生成关于从存储器110接收的数据的聚合统计数据。

结合这些技术中的一些或全部，将不安全接口116配置成使得对由数据修改块114生成的数据仅允许预定最大数目的访问。这可仅允许预定最大数目的总访问，或者可在给定时间段仅允许预定最大数目的访问。数据修改块的目的是修改数据，使得不可能获得可与特定人相关联的准确信息。然而，如果允许的数据访问的数目不受限，则怀有恶意者可通过组合从这些重复访问获得的部分或嘈杂数据来推断出所述准确信息。类似地，由数据修改块114生成的数据的传输数目也可受限。

输出数据可提供到执行对数据的初始自动化分析的健康决策引擎。在适当的情况下，健康决策引擎可直接向用户生成输出(例如，“寻求紧急医疗建议”、“安排例行医疗咨询”、“检查您的药物”、“无忧”等)。在其他情况下，健康决策引擎可决定应传输数据以供临床医生进行全面审查和分析。因此，如果健康决策引擎相对不安全，则它可以以不允许推断用户身份和/或不允许获得关于用户的健康的详细信息的形式对所存储的数据进行部分访问。然而，健康决策引擎可具有足够的信息使得其可在对数据的部分访问表明提示用户寻求更详细建议可取的情况下如此做。

健康决策引擎可作为可下载的应用程序设置在智能电话10上，例如在到处理原始健康相关信息的处理器的单独处理器上运行，或者健康决策引擎可设置在远程服务器上，其中定期地从装置传输输出数据。

图8是示意图，其示出根据本公开的各方面的健康相关信息生成和存储系统的替代形式。具体地，图8示出可例如呈数字信号处理器(DSP)形式的处理装置130。处理装置连接到存储器装置132。

输入端134允许向处理装置130供应数据，而接口136允许以安全或不安全的方式从处理装置130供应数据。

在一些实施方案中，处理装置130和存储器装置132被封装为单个集成电路，其中存储器例如设置为非易失性RAM。

在其他实施方案中，存储器装置132可设置为来自处理装置130的单独芯片，在这种情况下，数据可在从处理装置130写入到存储器装置132之前进行加密，以便防止对与存储器的通信的拦截。

在一些实施方案中，处理装置130可以是接收预处理音频信号并且执行后续处理和分析的单个集成电路。例如，在如图3所示的系统的情况下，声音分析块32和生物计量分析块34可都在处理装置130中实现。类似地，在如图5所示的系统的情况下，特征提取块74、说话人辨识块76和健康标记块78可全部在处理装置130中实现。

在其他实施方案中，处理装置130可接收音频信号的所提取特征。例如，在如图3所示的系统的情况下，特征提取可在单独装置上执行，而声音分析块32和生物计量分析块34的分析元件在处理装置130中实现。类似地，在如图5所示的系统的情况下，特征提取块74可在单独装置中实现，而说话人辨识块76和健康标记块78可在处理装置130中实现。

在又其他实施方案中，处理装置130管理从单独块接收的数据的存储，并且控制对所述数据的访问。例如，在如图3所示的系统的情况下，处理装置130可从声音分析块32和生物计量分析块34接收输出数据。类似地，在如图5所示的系统的情况下，处理装置130可从特征提取块74、说话人辨识块76和健康标记块78接收输出数据。

在所有这些实施方案中，处理装置130可控制对存储在存储器装置132中的数据的访问。

因此，例如，处理装置130可控制对所存储数据的安全访问和不安全访问两者。安全和不安全接口可设置在单独的通信线路或同一通信线路上。

如上文参考图7更详细地描述，处理装置可确保仅被授权用户可通过密码保护链路获得对所存储数据的完全访问。仅以保护用户的隐私的方式允许通过不安全接口对所存储数据的访问。例如，仅可允许对数据的部分访问，使得用户的隐私不受所述部分数据损害。例如，数据可以不公布用户身份而且公布的数据量不足以允许推断用户身份的方式来访问。

因此，系统能够以允许获得关于用户的病症的详细信息但限制对所述信息的访问以在可接受的程度上保护用户隐私的方式获得并存储健康相关信息。

技术人员将认识到，上述设备和方法的一些方面可体现为例如非易失性载体介质(诸如磁盘、CD-ROM或DVD-ROM)、经编程存储器(诸如只读存储器(固件))或数据载体(诸如光学或电气信号载体)上的处理器控制代码。对于许多应用，本发明的实施方案将在DSP(数字信号处理器)、ASIC(专用集成电路)或FPGA(现场可编程门阵列)上实现。因此，代码可包括常规程序代码或微代码或者例如用于设置或控制ASIC或FPGA的代码。代码还可包括用于动态地配置诸如可再编程逻辑门阵列的可再配置设备的代码。类似地，代码可包括用于硬件描述语言(诸如Verilog TM或VHDL(超高速集成电路硬件描述语言))的代码。如技术人员应了解，代码可在彼此通信的多个耦接的部件之间分布。在适当的情况下，实施方案还可使用在现场可(再)编程模拟阵列或类似装置上运行以便配置模拟硬件的代码来实现。

注意，如本文中所使用，术语“模块”将用于指代可至少部分地由专用硬件部件(诸如定制限定的电路)实现和/或至少部分地由一个或多个软件处理器或在合适的通用处理器上运行的适当代码等实现的功能单元或块。模块本身可包括其他模块或功能单元。模块可由不必同地协作并且可设置在不同的集成电路上和/或在不同处理器上运行的多个部件或子模块提供。

实施方案可在主机装置(特别是便携式和/或电池供电的主机装置)中实现，所述主机装置诸如移动计算装置(例如膝上型计算机或平板计算机)、游戏控制台、远程控制装置、家庭自动化控制器或家用器具(包括家用温度或照明控制系统)、玩具、诸如机器人的机器、音频播放器、视频播放器或例如智能电话的移动电话。

应注意，上述实施方案说明而非限制本发明，并且本领域技术人员将能够在不脱离随附权利要求的范围的情况下设计许多替代实施方案。词语“包括”并不排除存在除权利要求中所列出的那些之外的元件或步骤，“一个”或“一种”并不排除多个，并且单个特征或其他单元可实现权利要求中叙述的若干单元的功能。权利要求中的任何附图标记或标签不应被解释为限制其范围。

Claims

1.一种获得与用户的健康相关的信息的方法，所述方法包括：

检测声音；

确定所检测到的声音是否包括包含健康信息的非话语声音；

如果确定所述所检测到的声音包括包含健康信息的非话语声音，则确定所述非话语声音是否由所述用户产生；以及

如果确定所述非话语声音是由所述用户产生，则存储与所述非话语声音相关的数据。

2.根据权利要求1所述的方法，其中确定所述非话语声音是否由所述用户产生的步骤包括对所述所检测到的声音执行生物计量过程。

3.根据权利要求2所述的方法，其中执行所述生物计量过程包括将所述所检测到的声音与先前由所述用户产生的对应非话语声音进行比较。

4.根据权利要求3所述的方法，其中执行所述生物计量过程包括将所述所检测到的声音与先前由所述用户在注册过程期间产生的对应非话语声音进行比较。

5.根据权利要求1所述的方法，其中确定所述非话语声音是否由所述用户产生的步骤包括请求所述用户确认他们是否产生了所述非话语声音。

6.根据权利要求1所述的方法，其中确定所述非话语声音是否由所述用户产生的步骤包括接收与由所述用户穿戴或携带的装置的移动相关的信息。

7.根据权利要求6所述的方法，其中所述装置包括由所述用户佩戴的耳机。

8.根据任一前述权利要求所述的方法，其中存储与所述非话语声音相关的数据的步骤包括存储与所述声音产生的时间相关的数据。

9.根据任一前述权利要求所述的方法，其中存储与所述非话语声音相关的数据的步骤包括存储与所述声音的持续时间相关的数据。

10.根据任一前述权利要求所述的方法，其中存储与所述非话语声音相关的数据的步骤包括存储与所述声音的可听特征相关的数据。

11.根据权利要求10所述的方法，其包括执行对所述非话语声音的分析，并且存储与所述分析的结果相关的数据。

12.根据任一前述权利要求所述的方法，其中存储与所述非话语声音相关的数据的步骤包括保持对产生的所述非话语声音的数目的计数。

13.根据权利要求1至12中任一项所述的方法，其中所述非话语声音是咳嗽。

14.根据权利要求1至12中任一项所述的方法，其中所述非话语声音是喷嚏。

15.根据权利要求1至12中任一项所述的方法，其中所述非话语声音是可听呼吸声音。

16.一种系统，其包括：

输入端，所述输入端用于接收表示声音的信号；以及

处理器，所述处理器用于确定所检测到的声音是否包括包含健康信息的非话语声音；如果确定所述所检测到的声音包括包含健康信息的非话语声音，则确定所述非话语声音是否由用户产生；并且如果确定所述非话语声音是由所述用户产生，则存储与所述非话语声音相关的数据。

17.一种包括权利要求16所述的系统的装置，其中所述装置包括：移动计算装置；游戏控制台；远程控制装置；家庭自动化控制器或家用器具、玩具、机器、音频播放器、视频播放器或移动电话。

18.一种计算机程序产品，其包括用于致使经编程处理器执行权利要求1至15中任一项所述的方法的计算机可读代码。

19.根据权利要求18所述的计算机程序产品，其包括用于存储所述代码的有形计算机可读介质。

20.一种监测注册用户的健康的方法，其包括：

接收表示言语的音频信号；

对所接收音频信号执行说话人辨识过程以识别说话人；

如果确定所识别说话人是注册用户，从由所述音频信号表示的所述言语获得健康标记特征；以及

将所获得健康标记特征连同指示所述所识别说话人的数据一起存储在安全存储元件中。

21.根据权利要求20所述的方法，其包括提取所述所接收音频信号的特征，并且从所提取特征获得所述健康标记特征。

22.根据权利要求21所述的方法，其包括使用与用于获得所述健康标记的特征相同的所提取特征来执行所述说话人辨识过程。

23.根据权利要求20、21或22所述的方法，其包括将时间戳应用于每个健康标记特征，并且将所述时间戳与所述健康标记特征一起存储在所述安全存储元件中。

24.根据权利要求20、21或22所述的方法，其包括在至少一个时间段内获得所述健康标记特征，并且将识别所述时间段的数据与所述健康标记特征一起存储在所述安全存储元件中。

25.根据任一前述权利要求所述的方法，其中所述健康标记特征包括以下中的一者或多者：所述言语的基本频率；基频微扰；振幅微扰；所述言语的长时平均频谱；语速；最大发声时间；噪声谐波比(NHR)；谐波噪声比(HNR)；以及倒谱峰值突出。

26.一种系统，其包括：

输入端，所述输入端用于接收表示言语的音频信号；以及

处理器，所述处理器用于对所接收音频信号执行说话人辨识过程以识别说话人；如果确定所识别说话人是注册用户，则从由所述音频信号表示的所述言语获得健康标记特征；并且将所获得健康标记特征连同指示所述所识别说话人的数据一起存储在安全存储元件中。

27.一种包括权利要求26所述的系统的装置，其中所述装置包括：移动计算装置；游戏控制台；远程控制装置；家庭自动化控制器或家用器具、玩具、机器、音频播放器、视频播放器或移动电话。

28.一种计算机程序产品，其包括用于致使经编程处理器执行权利要求20至25中任一项所述的方法的计算机可读代码。

29.根据权利要求28所述的计算机程序产品，其包括用于存储所述代码的有形计算机可读介质。

30.一种用于健康相关数据的数据存储系统，其包括：

存储元件，所述存储元件用于存储输入数据，其中在确定输入数据与注册用户相关之后存储所述输入数据；

数据修改块，所述数据修改块用于接收所述输入数据，并且用于混淆所述所接收输入数据以提供所述所存储数据的混淆版本；

第一访问机构，所述第一访问机构用于控制对所述所存储数据的访问，使得仅被授权用户能够获得对所述所存储数据的访问权；以及

第二访问机构，所述第二访问机构用于控制对所述所存储数据的访问，使得所述第二访问机构仅提供对所述所存储数据的所述混淆版本的访问权。

31.根据权利要求30所述的系统，其还包括：

数据检查机构，所述数据检查机构用于确定数据是否与注册用户相关联，其中仅存储与所述注册用户相关联的数据。

32.根据权利要求31所述的系统，其中所述数据检查机构是语音生物计量处理块。

33.根据权利要求30至32中任一项所述的系统，其中所述第一访问机构包括密码保护链路，使得仅被授权用户能够询问所述所存储数据。

34.根据权利要求30至32中任一项所述的系统，其中所述第一访问机构包括密码保护链路，使得所述所存储数据仅能够被发送到被授权用户。

35.根据权利要求30至34中任一项所述的系统，其中所述第二访问机构在预定时间段内仅允许对所述所修改数据的预定最大数目的访问。

36.根据权利要求30至34中任一项所述的系统，其中所述第二访问机构将所述所修改数据传输到单独的装置，并且其中第二访问机构在预定时间段内仅允许所述所修改数据的预定数目的传输。

37.根据权利要求30至36中任一项所述的数据存储系统，其中所述数据修改块被配置用于对所述所接收输入数据进行二次采样。

38.根据权利要求30至37中任一项所述的数据存储系统，其中所述数据修改块被配置用于向所述所接收输入数据添加噪声。

39.根据权利要求30至38中任一项所述的数据存储系统，其中所述数据修改块被配置用于生成关于所述所接收输入数据的聚合统计数据。

40.根据权利要求30至39中任一项所述的数据存储系统，其包括用于从音频信号提取所述输入数据的特征提取块。

41.根据权利要求40所述的数据存储系统，其中所述输入数据包括与所述所提取输入数据相关联的时间戳。

42.根据权利要求30至41中任一项所述的数据存储系统，其包括用于从单独的装置接收所述输入数据的输入端。