CN116600698A - 用于呼吸道状况监视和护理的计算机化决策支持工具和医疗设备 - Google Patents

用于呼吸道状况监视和护理的计算机化决策支持工具和医疗设备 Download PDF

Info

Publication number
CN116600698A
CN116600698A CN202180074228.3A CN202180074228A CN116600698A CN 116600698 A CN116600698 A CN 116600698A CN 202180074228 A CN202180074228 A CN 202180074228A CN 116600698 A CN116600698 A CN 116600698A
Authority
CN
China
Prior art keywords
user
phoneme
human subject
respiratory
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180074228.3A
Other languages
English (en)
Inventor
S·帕特尔
P·W·瓦克尼克
K·查皮
R·马瑟
B·特雷西
M·D·M·S·塞拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pfizer Inc
Original Assignee
Pfizer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pfizer Inc filed Critical Pfizer Inc
Priority claimed from PCT/US2021/048242 external-priority patent/WO2022047311A1/en
Publication of CN116600698A publication Critical patent/CN116600698A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

公开了一种用于通过分析用户的音频数据来监视用户的呼吸道状况并提供决策支持的技术。可以检测在音频数据内的口头语言音素,并且可以针对音素提取声学特征。可以计算距离度量以比较用户的音素特征集。基于该比较,可以进行关于用户的呼吸道状况的确定,例如,用户是否具有呼吸道状况(例如,感染)和/或该状况是否正在改变。一些方面包括利用音素特征集预测用户未来的呼吸道状况。以计算机应用或服务形式的决策支持工具可以利用检测到的或预测的呼吸道状况信息来发起用于治疗当前状况或减轻未来风险的动作。

Description

用于呼吸道状况监视和护理的计算机化决策支持工具和医疗 设备
背景技术
病毒和细菌呼吸道感染(例如,流感)每年影响大量人口,并且其症状的范围从轻微到严重。典型地,感染者体内的病毒或细菌水平在自我报告症状之前达到峰值,从而使得个人没有意识到感染。此外,大多数个人典型地发现难以检测新的或轻微的呼吸道症状或量化症状的任何改变(无论是当症状恶化或改善时)。然而,对呼吸道感染的早期检测可能会导致更高效的干预,这减少了感染的持续时间和/或严重性。此外,早期检测在临床试验中是有益的,因为如果检测得太晚,以至于潜在试验参与者中的感染剂(infectiousagent)负荷下降得太低,可能无法确认潜在参与者的与感兴趣感染相关的症状。因此,需要在症状上升到典型地要求提示访问保健提供者的水平之前,利用客观措施来检测和监视呼吸道感染症状的工具。
发明内容
提供本发明内容是为了以简化形式介绍对概念的选择,其在下面的详细描述中进一步描述。本发明内容既不旨在识别所要求保护的主题的关键特征或基本特征,也不是孤立地用作确定所要求保护的主题的范围的辅助。
本公开中描述的技术的实施例实现了用于例如通过确定和量化个人的呼吸道状况发生的改变、确定个人具有呼吸道状况(可能是呼吸道感染)的可能性、或预测个人未来的呼吸道状况,来监视个人的呼吸道状况的改进的计算机化决策支持工具。
在高级别处,这些实施例可以包括利用由传感器设备(例如,麦克风)获取的音频数据,该传感器设备可以集成到用户计算设备(例如,智能电话)中,以自动检测指示个人的呼吸道状况的数据。例如,可以由这些技术的实施例的用户提供音频数据作为音频样本,该音频样本的形式可以是在与计算设备(例如,智能扬声器)的随意交互期间获取的持续发声(例如,“aaaaaaaa”)、脚本语音或非脚本语音。一些实施例还可以提供指令以引导用户通过用于提供音频数据的过程,该音频数据可用于监视用户的呼吸道状况。以这种方式,当用户正在进行日常活动时(包括在用户家中时),可以在非实验室环境中并且以非强迫的方式可靠地获得用于监视呼吸道状况的数据。因此,本文描述的实施例增加了用户依从性的可能性,同时仍然提供可靠的数据以准确且高效地监视用户的呼吸道状况。
根据实施例,可以从用户的所记录的音频数据中检测音素,并且可以提取或确定检测到的音素的声学特征。这些特征可以包括表征用户以特定时间间隔(例如,日期时间)的呼吸道状况的音素特征集或特征向量,因此该音素特征集或特征向量可以被认为与该特定时间间隔相关联。用户可以以多个时间间隔(例如,每天,或数日的每天早上和晚上)提供多个音频话音样本,使得每个确定出的音素特征集与用户提供音频样本数据的特定时间间隔相关联。例如,在一个方面,检测到的音素可以包括/a/、/e/、/m/或/n/或其任何组合。在另一方面,检测到的音素可以包括基本元音音素中的一个或多个,例如,/i/、/e/、/ε/、/a/、/ɑ/、/o/和/u/,并且还可以包括音素/n/和/或/m/。检测到的音素可以由本文所描述的技术的实施例利用,以确定呼吸道状况的生物标志物。在另一方面,可以利用这些音素或其特征中的一个或多个的组合以确定生物标志物。在又一方面,可以利用其他音素或音素特征和/或呼吸道或话音相关的数据来确定生物标志物。
可以比较针对不同时间间隔的音素特征集以确定音素特征的值之间的差。例如,可以在音素特征集之间确定Euclidian距离测量。类似地,在一些实施例中,可以例如对于比较大声朗读段落的用户的实现方式确定Levenshtein距离。基于来自不同时间间隔的音素特征集之间的差,可以提供关于用户的呼吸道状况的确定。例如,本公开的实施例可以确定用户通常具有呼吸道状况、用户具有特定类型的呼吸道状况(例如,流感)、和/或用户的呼吸道状况在一段时间内恶化、改善和/或没有改变。以这种方式,本文公开的技术可以用于基于用户的呼吸道状况的客观数据(例如,音素特征中可量化的检测到的改变)来自动提供关于用户的呼吸道状况的确定,例如,呼吸道感染的可能性。在一些实施例中,音素特征之间的这些确定出的差异可以用于预测用户的未来呼吸道状况(即,在未来时间)。在一些实施例中,上下文信息(例如,用户的生理数据、自我报告症状、睡眠数据、位置和/或天气相关信息)也可以与音素特征数据结合使用,以确定或预测用户的呼吸道状况。
基于对用户的呼吸道状况的确定,计算设备可以发起动作。通过示例而非限制的方式,动作可以包括以电子方式向用户、用户的临床医生或护理人员传送警报或通知。该通知可以包括关于用户的呼吸道状况的信息,并且在一些实例中可以包括用户的呼吸道状况的检测到的改变和/或用户的呼吸道状况在未来的预测。动作的另一示例可以包括基于用户的确定出的或预测的呼吸道状况来传送对于治疗或支持的推荐。例如,该推荐可以包括咨询保健提供者、继续现有处方或非处方药物(例如,重新补充处方)、修改当前治疗方案的剂量或药物和/或继续监视呼吸道状况。在一些方面,动作可以包括发起这些或其他推荐中的一个或多个,例如,自动安排与用户的保健提供者的预约和/或向药房传送通知以重新补充处方。
在一些实例中,利用来自用户的话音样本的声学特征信息,即使用户没有感觉到症状,也可以确定呼吸道状况(例如,用户可能有感染)。如本文所公开的技术的一些实施例所提供的这种能力是相对于常规技术的优点和改进,常规技术可能仅依赖于从症状发作后访问临床医生所获取的主观或客观数据。对呼吸道状况的这种早期检测和警告可以实现更有效的治疗以减少状况的持续时间和/或严重性。此外,通过提供比常规方法更早的呼吸道状况的警告,实现早期检测的这些实施例对于对抗基于呼吸道的流行病(例如,严重急性呼吸综合征冠状病毒2(SARS-CoV-2)或冠状病毒疾病(COVID-19)可能特别有用。在状况是由病毒或细菌引起的情况下,早期警告可以使用户能够更快地采取预防措施防止传播(例如,戴口罩、自我隔离或保持社交距离),并且因此降低传播给他人的可能性。通过本公开的实施例提供的早期检测在研究疫苗和/或呼吸道感染的治疗的临床试验中也可能是有用的。一些实施例可以使参与者能够在感染剂负荷下降得太低之前确认关于与感兴趣的感染相关的任何症状,这是临床试验中使用的常规技术经常出现的问题。
此外,利用来自话音记录的声学特征来监视呼吸道状况使得能够改进治疗具有呼吸道状况的个人的准确度。例如,根据本公开,可以利用话音记录在家中跟踪个人的潜在呼吸道状况,以更精确地确定何时需要诸如抗生素之类的治疗,而不是过早地和/或过长时间地给个人开处方治疗。此外,跟踪根据本公开的实施例的正在治疗的个人的状况的进展可以有助于确定是否推荐改变治疗,例如,改变药物和/或剂量。以这种方式,本文公开的技术可以促进对抗生素/抗微生物药物的更精确的使用,因为这种药物需要基于在个人的呼吸道状况中检测到的客观的可量化的改变来开处方或继续使用。
附图说明
下面参考附图详细描述本公开的方面,在附图中:
图1是适于实现本公开的方面的示例操作环境的框图;
图2是描绘适合于实现本公开的方面的示例计算架构的图;
图3A说明性地描绘了根据本公开的实施例的用于监视呼吸道状况的示例过程的示意表示;
图3B说明性地描绘了根据本公开的实施例的收集用于监视呼吸道状况的数据的示例过程的示意表示;
图4A-图4F说明性地描绘了利用本公开的各种实施例的示例场景;
图5A-图5E说明性地描绘了根据本公开的各种实施例的来自计算设备的示出示例图形用户界面(GUI)的方面的示例性截图;
图6A说明性地描绘了根据本公开的实施例的用于监视呼吸道状况的示例方法的流程图;
图6B说明性地描绘了根据本公开的另一实施例的用于监视呼吸道状况的示例方法的流程图;
图7说明性地描绘了根据本公开的实施例的示例声学特征随时间的改变的表示;
图8说明性地描绘了根据本公开的实施例的呼吸道感染症状的衰减常数(decayconstant)的图形表示;
图9说明性地描绘了根据本公开的实施例的在声学特征与呼吸道感染症状之间的相关性的图形表示;
图10说明性地描绘了根据本公开的实施例的例如个人的自我报告症状分数随时间的改变的图形表示;
图11A-图11B说明性地描绘了根据本公开的实施例的在针对不同声学特征计算的距离度量与自我报告症状分数之间的等级相关性的图形表示;
图12A说明性地描绘了根据本公开的实施例的跨不同个人的在距离度量与自我报告症状分数之间的等级相关性的图形表示;
图12B说明性地描绘了根据本公开的实施例的在声学特征类型与音素之间的统计上显著的相关性;
图13说明性地描绘了根据本公开的实施例的对于三个示例个人的声学特征和自我报告症状随时间的相对改变的图形表示;
图14说明性地描绘了根据本公开的实施例的呼吸道感染检测器的性能的示例表示;
图15A-图15M描绘了根据本公开的各种实施例的用于提取声学特征以监视呼吸道状况的示例计算机程序例程;以及
图16是适于在实现本公开的实施例中使用的示例性计算环境的框图。
具体实施方式
本公开的主题在本文借助不同方面来具体描述以满足法定要求。然而,说明书本身不旨在限制本专利的范围。所要求保护的主题可以结合其他现当前或未来技术以其他方式体现,以包括与本公开中描述的步骤不同的步骤或相似的步骤的组合。此外,虽然术语“步骤”和/或“块”在本文可以用于表示所采用的方法的不同元素,但术语不应被解释为暗示在本文公开的各种步骤之中或之间的任何特定次序,除非以及除了个别步骤的次序被明确说明。本文描述的每个方法可以包括可以使用硬件、固件和/或软件的任何组合来执行的计算过程。例如,各种功能可以由执行存储在计算机存储器中的指令的处理器来执行。方法还可以体现为存储在计算机存储介质上的计算机可用指令。这些方法可以由独立应用、服务或托管服务(独立的或与另一托管服务组合)或到另一产品的插件提供,仅举几例。
本公开的方面涉及用于呼吸道状况监视和护理的计算机化决策支持工具。呼吸道状况每年影响大量人口,并且其症状的范围从轻微到严重。这种呼吸道状况可能包括由细菌或病毒剂引起的呼吸道感染(例如,流感),或者可能包括非感染性呼吸道系统症状。虽然本公开的一些方面描述了呼吸道感染,但预期这种方面可以普遍适用于呼吸道状况。
个人典型地发现难以检测新的或轻微的呼吸道症状以及量化症状的任何改变(无论是当症状恶化或改善时)。对呼吸道状况的客观测量通常只在个人看保健专业人员并且样品分析被执行时才确定。然而,可能导致呼吸道感染的病毒或细菌水平典型地在感染者体内在自我报告症状之前达到峰值,从而通常使个人在接受任何诊断之前没有意识到感染。例如,具有流感或冠状病毒疾病2019(COVID-19)的个人可能会在感觉到症状之前感染他人。不能在早期客观地测量呼吸道状况的轻微症状(例如,感染)增加了将感染传播给其他个人、呼吸道状况的更长持续时间、以及更加严重的呼吸道状况的可能性。
为了改进对呼吸道状况的监视和护理,本公开的实施例可以提供一个或多个决策支持工具,该一个或多个决策支持工具用于基于来自用户的话音记录的声学数据来确定用户的呼吸道状况和/或预测用户未来的呼吸道状况。例如,用户可以通过话音记录提供音频数据,使得可以确定音频数据中音素的声学特征(在本文也可以称为音素特征)。在实施例中,可以接收多个话音记录,使得每个记录对应于不同的时间间隔(例如,可以针对连续几天中的每一天获得话音记录)。可以比较来自不同时间间隔的音素特征值,以确定关于用户的呼吸道状况的信息,例如,随着时间的推移,用户的呼吸道状况是否已经发生了改变。基于对用户的呼吸道状况的确定,可以自动向用户和/或用户的临床医生提供诸如警报或决策支持推荐之类的动作。
在一个实施例中,并且如在本文进一步描述的,可以通过利用诸如麦克风之类的传感器从被监视的个人(在本文也可以称为用户)接收声学信息。声学信息可以包括用户的话音(例如,发声或其他呼吸音)的一个或多个记录。例如,话音记录可以包括持续发声(例如,“aaaaaaaa”)、脚本语音或非脚本语音的音频样本。麦克风可以集成到用户计算设备中或以其他方式耦合到用户计算设备,例如,智能电话、智能手表或智能扬声器。在一些实例中,话音音频样本可以在用户的家中或在用户日常活动期间被记录,并且可以包括在用户与智能扬声器或其他用户计算设备的随意交互期间记录的数据。
一些实施例还可以生成和/或提供指令,以引导用户通过用于提供音频数据的过程,该音频数据可用于监视用户的呼吸道状况。例如,图4A、图4B和图4C各自示出了其中用户计算设备(或用户设备)正在向用户输出指令(例如,以文本和/或可听指令的形式)作为评估练习的一部分的场景。指令可以提示用户发出某些声音,并且在一些实施例中提示发声的持续时间(例如,“请发出‘aah’的声音并保持五秒。)在一些实施例中,指令可以要求用户尽可能长地保持或持续发声,例如,对诸如/a/之类的基本元音中的一个的发声。并且在一些实施例中,指令包括要求用户大声朗读书面段落。一些实施例还可以包括向用户提供反馈以确保话音样本是可用的,例如,指示用户何时开始/停止、说话时间更长、保持更长的持续时间、减少背景噪声和/或用于质量控制的其他反馈。
在一些实施例中,可以从接收自用户的音频数据中检测诸如音素之类的声学和话音信息。在一个实施例中,检测到的音素可以包括音素/a/、/m/和/n/。在另一实施例中,检测到的音素包括/a/、/e/、/m/和/n/。在本文所描述的技术的一些实施例中,检测到的音素可以用于确定用于呼吸道状况检测和监视的生物标志物。一旦检测到音素,就可以从音频数据中提取或确定检测到的音素的声学特征。声学特征的示例可以包括但不限于表征功率和功率可变性、音高和音高可变性、频谱结构和/或共振峰的测量的数据。在一些实施例中,可以针对在音频数据中检测到的不同音素确定不同的特征集(即,声学特征的不同组合)。在示例性实施例中,针对/n/音素确定12个特征,针对/m/音素确定12个特征,并且针对/a/音素确定8个特征。在一些实施例中,可以执行预处理或信号调节操作以促进检测音素和/或确定音素特征。这些操作可以包括例如修剪音频样本数据、频率滤波、归一化、去除背景噪声、间歇性尖峰、其他声学伪影或如本文所描述的其他操作。
随着时间的推移从用户获取音频数据,多个音素特征集可以被生成并与不同的时间间隔相关联,其中,这些音素特征集可以包括音素特征向量。在一些实施例中,可以根据与特征集相关联的时间信息,以时间次序或反时间次序为用户组装连续音素特征集的时间序列。可以确定在不同时刻或时间间隔处相关联的特征集内的特征的值的差异或改变。例如,可以通过比较与不同时刻或时间间隔相关联的两个或更多个音素特征向量来确定用户的音素特征向量的差异。在一个实施例中,可以通过计算距离度量(例如,特征向量之间的Euclidian距离)来确定差异。在一些实例中,用于比较的音素特征集中的一个音素特征集表示用户的健康基线。可以基于当用户已知没有呼吸道状况或假定用户没有呼吸道状况时获取的音频数据来确定健康基线特征集。类似地,可以利用基于当用户已知具有呼吸道状况或假定用户具有呼吸道状况时获取的音频数据来确定的生病基线特征集。
基于来自不同时间的音素特征集之间的差异,可以提供关于用户对呼吸道状况的确定的信息。在一些实施例中,如本文进一步描述的,该确定可以作为呼吸道状况分数提供。呼吸道状况分数可以对应于用户具有(或不具有)诸如感染之类的呼吸道状况的可能性或概率(例如,通常对于任何呼吸道状况或对于特定呼吸道状况)。可替代地或另外地,呼吸道状况分数可以指示用户的呼吸道状况是在改善、恶化还是没有改变。例如,图4F的示例场景描绘了其中基于对用户的话音信息的分析来确定用户没有从呼吸道状况中恢复的实施例,如本文所描述的。在进一步的实施例中,呼吸道状况分数可以指示用户在未来时间间隔内将发展呼吸道状况、仍将具有呼吸道状况或将从呼吸道状况中恢复的可能性。图4E的示例场景描绘了其中预测正在患感冒的用户在接下来的三天内好转的实施例。
在一些实施例中,除了用户的话音信息之外,还可以利用上下文信息来确定或预测用户的呼吸道状况。如本文进一步描述的,上下文信息可以包括但不限于用户的生理数据,例如,体温、睡眠数据、移动性信息、自我报告症状、位置或天气相关的信息。自我报告症状数据可以包括例如用户是否感觉到特定症状(例如,充血),并且还可以包括体验该症状的严重性的程度或评级。在一些实例中,症状自我报告工具可以用于获取用户症状信息。在一些实施例中,可以基于对用户的话音相关数据的分析或用户的确定的呼吸道状况来自动提示提供自我报告信息(或请求用户报告症状数据的通知)。图4D的示例场景描绘了其中基于对用户的话音的分析来确定用户可能生病的实施例。在该实施例中,监视软件应用可以询问用户,例如,用户是否正在感觉到特定的呼吸道相关的症状(例如,充血、疲劳等)。图4D的示例进一步描绘了一旦用户确认充血,就提示用户对充血的严重性进行评级。该用户的自我报告症状可以用于对用户的呼吸道状况做出附加的确定或预测。在一些实施例中,可以利用其他上下文信息,例如,用户的生理数据(例如,心率、体温、睡眠或其他数据)、天气相关的信息(例如,湿度、温度、污染或类似数据)、位置或本文描述的其他上下文信息,例如,关于用户所在的区域中呼吸道感染爆发的信息。
基于对用户呼吸道状况(其可以包括状况的改变(或缺乏改变))的确定,计算设备可以发起动作。该动作可以包括例如以电子方式向用户、用户的临床医生或护理人员传送警报或通知。在一些实施例中,通知或警报可以包括关于用户的呼吸道状况的信息,例如,呼吸道状况分数、量化或表征用户的呼吸道状况的改变的信息、呼吸道状况的当前状态和/或对用户的呼吸道状况在未来的预测。在一些实施例中,动作还可以包括处理呼吸道状况信息以进行决策,其可以包括基于用户的呼吸道状况提供对于治疗和支持的推荐。例如,该推荐可以包括咨询保健提供者、继续现有处方或非处方药物(例如,重新补充处方)、修改当前治疗方案的剂量或药物和/或修改或不修改(即,继续)对呼吸道状况的监视。在一些方面,该动作可以包括发起这些或其他推荐中的一个或多个,例如,自动安排与用户的保健提供者的预约和/或向药房传送通知以重新补充处方。图4F的示例场景描绘了其中基于确定用户的呼吸道状况没有改善来通知用户的医生,并且重新补充抗生素处方并安排递送给用户的实施例。
又一类型的动作可以包括自动发起或执行与对用户的呼吸道状况的监视或治疗相关联的操作。通过示例而非限制的方式,该操作可以包括自动安排与用户的保健提供者的预约、向药房发送通知以重新补充处方、或者修改与监视用户的呼吸道状况相关联的过程或用于监视用户的呼吸道状况的计算机操作。在示例动作的一个实施例中,修改话音分析过程,例如,用于获得或分析用户话音相关的数据的计算机编程操作。在一个这样的实施例中,例如,在其中从与计算设备的随意交互中收集话音信息的实施例中,可以更频繁地(例如,每天两次)提示用户提供话音样本,或者可以更频繁地收集话音信息。在另一这种实施例中,可以修改由呼吸道状况监视应用收集或分析的特定音素或特征信息。在一个实施例中,可以修改计算机编程操作,使得可以指示用户发出与他们先前已经提供的声音不同的声音集。类似地,在另一类型的动作中,可以修改计算机编程操作以提示用户提供症状数据,如先前所描述的。
此外,可以由本文公开的技术的实施例提供的一个益处是对诸如感染之类的呼吸道状况的早期检测。根据这些实施例,用户发声(包括呼吸声)的声学特征可以用于检测甚至轻微的呼吸道症状或呼吸道状况的临床表现,并在个人怀疑疾病之前(例如,在用户感觉到症状之前)向个人或保健提供者警告状况。对呼吸道状况的早期检测可能导致更高效的干预,这减少感染的持续时间和/或严重性。对呼吸道状况的早期检测也可以降低传播给其他人的风险,因为这使感染者能够比其他情况下更早采取预防措施防止传播,例如,戴口罩或自我隔离。以这种方式,这些实施例提供了对用于呼吸道状况(包括呼吸道感染)检测的常规方法的改进,该常规方法取决于用户报告症状,并且因此使得状况较晚被检测(或者根本不被检测)。由于用户自我报告数据的主观性,这些常规的方法也不太准确或不精确。
对呼吸道感染的早期检测在临床试验中也能是有益的。例如,在针对疫苗的临床试验中,要求确认个人的症状与感兴趣的感染之间的相关性。如果个人没有得到足够早的诊断,那么个人体内的感染剂负荷下降得太低,使得可能无法确认个人的症状与感兴趣的感染之间的相关性。在不进行确认的情况下,个人不能参加试验。因此,本文描述的实施例不仅可以用于进行早期检测以进行更高效的治疗,而且当用于临床试验时,这些实施例可以实现针对开发新的潜在治疗或疫苗的更高的试验参与度。
可以由本文公开的技术的实施例提供的另一益处是用于监视呼吸道状况的用户依从性的增加的可能性。例如,并且如本文进一步描述的,可以在家中或远离医生诊所的地方,以及在某些方面在个人正在执行日常惯例的时间期间(例如,在个人负担很小的情况下进行日常对话期间),非强迫地获得用户的话音记录。用于监视呼吸道状况(包括获得用户数据)的负担较轻的方式可以增加用户依从性,这进而可以有助于确保早期检测,并且可以提供对监视呼吸道状况的常规方法的另一种改进。
可以由本文公开的技术的实施例提供的又一益处是改进治疗具有呼吸道状况的个人的准确度。特别地,本公开的实施例中的一些实施例使得能够跟踪潜在的呼吸道状况(例如,感染),以确定该状况是恶化、改善还是未改变,这可能影响个人的治疗。例如,最初症状轻微的个人可能不需要立即用药或接受治疗。本公开的一些实施例可以用于监视状况的进展,并且如果状况恶化到可能需要或推荐治疗(例如,药物)的程度,则警告个人和/或保健提供者。此外,本公开的实施例可以确定个人是否正在从诸如感染之类的呼吸道状况中恢复,以及因此是否推荐改变治疗,例如,改变药物和/或剂量。在另一示例中,本公开的实施例可以在给用户开出具有潜在的呼吸道相关的副作用的药物(例如,某些癌症治疗药物)时确定用户的呼吸道状况,并基于用户是否正在经历呼吸道相关的副作用以及在多大程度上正在经历呼吸道相关的副作用来确定是否推荐改变治疗。以这种方式,本文描述的技术的一些实施例可以通过使得能够更精确地使用药物(特别是诸如抗生素/抗微生物药物之类的药物)来提供对常规技术的改进,因为可以基于个人的呼吸道状况中的客观的、可定量检测到的改变来对这种药物开处方或继续使用。
现在转向图1,提供了示出其中可以采用本公开的一些实施例的示例操作环境100的框图。应当理解,本文描述的这种和其他布置仅作为示例进行阐述。为了清楚起见,除了或代替图1以及其他附图中所示的布置和元素,可以使用其他布置和元素(例如,机器、接口、功能、次序和功能分组),并且可以完全省略一些元素。此外,本文描述的元素中的许多元素是功能实体,其可以被实现为分立的或分布式组件,或者与其他组件结合,并且以任何合适的组合和位置实现。本文描述的各种功能或操作由包括硬件、固件、软件及其组合的一个或多个实体执行。例如,一些功能可以由执行存储在存储器中的指令的处理器来实现。
如图1所示,示例操作环境100包括多个用户设备,例如,用户计算机设备(可互换地称为“用户设备“)102a、102b、102c至102n和临床医生用户设备108;一个或多个决策支持应用,例如,决策支持应用105a和105b;电子健康记录(EHR)104;一个或多个数据源,例如,数据储存库150;服务器106;一个或多个传感器,例如,传感器103;以及网络110。应当理解,图1中所示的操作环境100是一个合适的操作环境的示例。图1中所示的组件中的每一个可以经由任何类型的计算设备(例如,结合图16所描述的计算设备1700)来实现。这些组件可以经由网络110彼此通信,该网络110可以包括但不限于一个或多个局域网(LAN)和/或广域网(WAN)。在示例性实现方式中,网络110可以包括互联网和/或蜂窝网络,其中包括各种可能的公共和/或专用网络中的任何一个。
应当理解,在本公开的范围内的操作环境100内可以采用任何数量的用户设备(例如,102a-102n和108)、服务器(例如,106)、决策支持应用(例如,105a-105b)、数据源(例如,数据储存库150)和EHR(例如,104)。每个元件可以包括单个设备或组件,或者在分布式环境中协作的多个设备或组件。例如,服务器106可以经由布置在分布式环境中的多个设备来提供,这些设备共同提供本文描述的功能。另外,在本文未示出的其他组件也可以被包括在分布式环境内。
用户设备102a、102b、102c到102n和临床医生用户设备108可以是操作环境100的客户端侧的客户端用户设备,而服务器106可以在操作环境100的服务器侧。服务器106可以包括服务器侧软件,其被设计为与用户设备102a、102b、102c至102n和108上的客户端侧软件结合工作,以实现本公开中讨论的特征和功能的任何组合。提供操作环境100的这种划分以说明合适环境的一个示例,并且不要求服务器106和用户设备102a、102b、102c至102n和108的任何组合保持为独立的实体。
用户设备102a、102b、102c至102n和108可以包括能够由用户使用的任何类型的计算设备。例如,在一个实施例中,用户设备102a、102b、102c至102n和108可以是关于本文的图16描述的类型的计算设备。通过示例而非限制的方式,用户设备可以体现为个人计算机(PC)、膝上型计算机、移动件或移动设备、智能电话、智能扬声器、平板计算机、智能手表、可穿戴计算机、个人数字助理(PDA)设备、音乐播放器或MP3播放器、全球定位系统(GPS)、视频播放器、手持通信设备、游戏设备、娱乐系统、车辆计算机系统、嵌入式系统控制器、相机、遥控器、电器、消费者电子设备、工作站或这些描述的设备的任何组合,或任何其他合适的计算机设备。
一些用户设备(例如,用户设备102a、102b、102c至102n)可以旨在由用户使用,该用户正在经由一个或多个传感器(例如,传感器103)被观察。在一些实施例中,用户设备可以包括集成传感器(类似于传感器103),或者与外部传感器(类似于103)结合操作。在示例性实施例中,传感器103感测声学信息。例如,传感器103可以包括一个或多个麦克风(或麦克风阵列),该一个或多个麦克风(或麦克风阵列)与智能设备(例如,智能扬声器、智能移动设备、智能手表)一起实现或通过智能设备实现或通信地耦合到智能设备,或作为独立的麦克风设备实现。其他类型的传感器(例如,生理传感器(例如,检测心率、血压、血氧水平、温度和相关数据的传感器))也可以集成到用户设备中或与用户设备结合工作。然而,根据本公开的实施例,可以设想关于个人的生理信息也可以从EHR 104中的个人历史数据接收或从人类测量或人类观察接收。可以在操作环境100中实现的附加类型的传感器包括被配置为检测用户位置的传感器(例如,室内定位系统(IPS)或全球定位系统(GPS));大气信息(例如,温度计、湿度计或气压计);环境光(例如,光电探测器);以及运动(例如,陀螺仪或加速度计)。
在一些方面中,传感器103可以与用户携带的智能电话(例如,用户设备102c)或定位在个人可以位于其中的一个或多个区域中的智能扬声器(例如,用户设备102b)一起操作或通过其进行操作。例如,传感器103可以是集成到位于个人家中的智能扬声器中的麦克风,其可以感测在距智能扬声器的最大距离内发生的声音信息,包括用户的话音。可以设想,传感器103可以可替代地以其他方式集成,例如,传感器集成到位于佩戴者身体上或附近的设备中。在其他方面,传感器103可以是粘附到用户皮肤的皮肤贴片传感器;可吸收的或皮下传感器,或集成到用户生活环境(包括电视、恒温器、门铃、相机或其他电器)中的传感器组件。
数据可以由传感器103连续地、周期性地、根据需要或当数据变为可用时获取。此外,由传感器103获取的数据可以与时间和日期信息相关联,并且可以被表示为测量变量的一个或多个时间序列。在实施例中,传感器103可以收集原始传感器信息,并且可以执行信号处理、形成可变决策统计、累积求和、趋势、小波处理、阈值化、对决策统计的计算处理、对决策统计的逻辑处理、预处理和/或信号调节。在一些实施例中,传感器103可以包括模数转换器(ADC)和/或用于执行对模拟音频信息的数字音频采样的处理功能。在一些实施例中,用于执行数字音频采样以确定数字音频信息的模数转换器和/或处理功能可以在用户设备102a-102n中的任何一个或服务器106上实现。可替代地,这些信号处理功能中的一个或多个可以由用户设备(例如,用户设备102a-102n或临床医生用户设备108、服务器106和/或决策支持应用(app)105a或105b)执行。
一些用户设备(例如,临床医生用户设备108)可以被配置为由正在治疗或以其他方式监视与传感器103相关联的用户的临床医生使用。临床医生用户设备108可以体现为一个或多个计算设备(例如,用户设备102a-102n或服务器106),并且通过网络110通信地耦合到EHR 104。操作环境100描绘了在临床医生用户设备108与EHR 104之间通过网络110的间接通信耦合。然而,可以设想临床医生用户设备108的实施例可以直接通信地耦合到EHR104。临床医生用户设备108的实施例可以包括由临床医生用户设备108上的软件应用或应用集合操作的用户界面(图1中未示出)。在一个实施例中,应用可以是基于Web的应用或小程序。该应用的一个示例包括临床医生仪表板,例如,结合图3A所描述的示例仪表板3108。根据本文描述的实施例,保健提供者应用(例如,可以在临床医生用户设备108上操作的诸如仪表板应用之类的临床医生应用)可以促进访问和接收关于可以针对其确定声学特征和/或呼吸道状况数据的特定患者或患者集合的信息。临床医生用户设备108(或在其上操作的临床医生应用)的一些实施例可以进一步促进访问和接收关于特定患者或患者集合的信息,该信息包括患者历史;保健资源数据;生理变量或数据(例如,生命体征);测量;时间序列;稍后描述的预测(包括绘制或显示确定出的结果和/或发出警报);或其他与健康相关的信息。例如,临床医生用户设备108可以进一步促进对结果、推荐或医嘱(order)的显示。在实施例中,临床医生用户设备108可以基于本文描述的对呼吸道状况的监视的结果和确定或预测来促进接收针对患者的医嘱。临床医生用户设备108还可以用于结合各种实施例提供诊断服务或对本文所描述的技术的性能的评估。
决策支持应用105a和105b的实施例可以包括软件应用或应用集合(其可以包括程序、例程、功能或计算机执行的服务),其驻留在一个或多个服务器上、分布在云计算环境(例如,决策支持应用105b)中、或驻留在一个或多个客户端计算设备(例如,决策支持应用105a)上,该一个或多个客户端计算设备例如个人计算机、膝上型计算机、智能电话、平板计算机、移动计算设备、或与后端计算系统通信的前端终端、或用户设备102a-102n中的任一个。在实施例中,决策支持应用105a和105b可以包括基于客户端和/或基于Web的应用(或app)或应用(或app)集合,其可用于访问由本公开的实施例提供的用户服务。在一个这种实施例中,决策支持应用105a和105b中的每一个都可以促进对从用户设备102a-102n、临床医生用户设备108、传感器103、EHR 104或数据储存库150获取的信息的处理、解释、访问、存储、取回和通信,包括由本公开的实施例确定的预测和评估。
通过决策支持应用105a和105b利用和取回信息或者利用相关联的功能可能要求用户(例如,患者或临床医生)利用凭证登录。此外,决策支持应用105a和105b可以根据由临床医生、患者、相关联的保健机构或系统定义的隐私设置和/或关于保护健康信息的适用的地方和联邦规则和条例(例如,健康保险携带和责任法案(HIPAA)规则和条例)来存储和传输数据。
在实施例中,决策支持应用105a和105b可以通过网络110将通知(例如,警报或指示)直接传送给临床医生用户设备108或用户设备102a-102n。如果这些应用没有在这些设备上操作,则它们可以在决策支持应用105a和105b正在其上操作的任何其他设备上显示通知。决策支持应用105a和105b还可以向临床医生用户设备108或用户设备102a-102n发送或显示维护指示。此外,界面组件可以用于决策支持应用105a和105b以促进用户(包括临床医生/护理人员或患者)访问传感器103上的功能或信息,例如,操作设置或参数、用户标识、存储在传感器103上的用户数据以及针对传感器103的诊断服务或固件更新。
此外,决策支持应用105a和105b的实施例可以直接或间接地从传感器103收集传感器数据。如关于图2所描述的,决策支持应用105a和105b可以利用传感器数据来提取或确定声学特征并确定呼吸道状况和/或症状。在一个方面,决策支持应用105a和105b可以经由用户设备(例如,用户设备102a-102n和108)(包括通过各种图形、音频或其他用户界面,例如,如图5A-图5E描绘的示例图形用户界面(GUI))向用户显示或以其他方式向用户提供这种过程的结果。以这种方式,下面关于图2讨论的一个或多个组件的功能可以由与决策支持应用105a或105b结合操作或作为决策支持应用105a或105b的一部分或由决策支持应用105a或105b控制的计算机程序、例程或服务来执行。另外地或可替代地,决策支持应用105a和105b可以包括决策支持工具,例如,图2的决策支持工具290。
如上面所提及的,操作环境100包括一个或多个EHR 104,该一个或多个EHR 104可以与被监视的个人相关联。EHR 104可以经由网络110直接或间接通信地耦合到用户设备102a-102n和108。在一些实施例中,EHR 104可以表示来自不同源的健康信息,并且可以体现为不同的记录系统,例如,独立的EHR系统用于不同的临床医生用户设备(例如,108)。因此,临床医生用户设备(例如,108)可以供不同提供者网络或护理机构的临床医生使用。
EHR 104的实施例可以包括健康记录或健康信息的一个或多个数据储存库,其可以存储在数据储存库150上,并且还可以包括促进存储和取回健康记录的一个或多个计算机或服务器(例如,服务器106)。在一些实施例中,EHR 104可以被实现为基于云的平台或者可以跨多个物理位置分布。EHR 104还可以包括可以实时或接近实时地存储患者(或用户)信息的记录系统,例如,可穿戴、床边或家庭患者监视器。
数据储存库150可以表示一个或多个数据源和/或计算机数据存储系统,其被配置为使数据可用于结合图2描述的操作环境100或系统200的各种组件中的任一个。在一个实施例中,数据储存库150可以提供(或使其可用于访问)传感器数据,该传感器数据可用于系统200的数据收集组件210。数据储存库150可以包括单个数据储存库或多个数据储存库,并且可以位于本地和/或远程定位。数据储存库150的一些实施例可以包括联网的存储装置或分布式存储装置,包括位于云环境中的服务器(例如,服务器106)上的存储装置。数据储存库150可以与用户设备102a-102n和108以及服务器106是分离的,或者可以与这些设备中的至少一个合并和/或集成。
操作环境100可以用于实现系统200的一个或多个组件(结合图2示出和描述)或由这些组件执行的操作,包括用于以下各项的组件或操作:收集话音数据或上下文信息;促进与用户的交互以收集这种数据;跟踪可能或已知的呼吸道状况(例如,呼吸道感染或非感染性呼吸道症状);和/或实现决策支持工具(例如,图2的决策支持工具290)。操作环境100还可以用于实现方法6100和6200的方面,如分别结合图6A和图6B所描述的。
现在参考图2并继续参考图1,提供了示出适合于实现本公开的实施例的示例计算系统架构的方面的框图,并且该示例计算系统架构通常被指定为系统200。系统200仅表示合适的计算系统架构的一个示例。为了清楚起见,除了或代替所示的布置和元件,可以使用其他布置和元件,并且可以完全省略一些元件。此外,类似于图1的操作环境100,本文描述的许多元件是功能实体,这些元件可以被实现为分立的或分布式组件或者与其他组件结合,并且以任何合适的组合和位置实现。
示例系统200包括结合图1描述的网络110,并且该网络110通信地耦合系统200的组件,包括数据收集组件210、呈现组件220、用户话音监视器260、用户交互管理器280、呼吸道状况跟踪器270、决策支持工具290和存储装置250。这些组件中的一个或多个可以体现为在一个或多个计算机系统(例如,结合图16描述的计算设备1700)上执行的编译的计算机指令或功能的集合、程序模块、计算机软件服务或进程的布置。
在一个实施例中,由系统200的组件执行的功能与一个或多个决策支持应用、服务或例程(例如,图1的决策支持应用105a-105b)相关联。特别地,这样的应用、服务或例程可以在一个或多个用户设备(例如,用户设备102a和/或临床医生用户设备108)或服务器(例如,服务器106)上操作、跨一个或多个用户设备和服务器分布、或者在云环境(未示出)中实现。此外,在一些实施例中,系统200的这些组件可以跨网络分布,从而连接云环境中的一个或多个服务器(例如,服务器106)和客户端设备(例如,用户计算机设备102a-102n或临床医生用户设备108),或者可以驻留在用户设备(例如,用户设备102a-102n或临床医生用户设备108中的任何一个)上。此外,由这些组件执行的功能或服务可以在适当的抽象层(例如,计算系统的操作系统层、应用层、硬件层等)处实现。可替代地或另外地,这些组件和/或本文描述的实施例的功能可以至少部分地由一个或多个硬件逻辑组件来执行。例如,在不进行限制的情况下,可以使用的说明性类型的硬件逻辑组件包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SoC)、复杂可编程逻辑器件(CPLD)等。此外,虽然本文针对示例系统200中所示的特定组件描述了功能,但可以设想,在一些实施例中,这些组件的功能可以跨其他组件共享或分布。
继续图2,数据收集组件210通常负责访问或接收(以及在一些情况下识别)来自一个或多个数据源的数据(例如,来自图1的传感器103和/或数据储存库150的数据),以在本公开的实施例中使用。在一些实施例中,可以采用数据收集组件210以促进对针对特定用户(或在一些情况下,包括众包数据的多个用户)获取的传感器数据的累积以用于系统200的其他组件(例如,用户话音监视器260、用户交互管理器280和/或呼吸道状况跟踪器270)。该数据可以由数据收集组件210接收(或访问)、累积、重新格式化和/或组合,并存储在诸如存储装置250之类的一个或多个数据储存库中,其中该数据可用于系统200的其他组件。例如,如本文所描述的,用户数据可以存储在个人记录240中或与个人记录240相关联。另外地或可替代地,在一些实施例中,任何个人可识别数据(即,具体识别特定用户的用户数据)不被上传、以其他方式从一个或多个数据源提供、不被永久存储和/或不可用于系统200的其他组件。在一个实施例中,对用户相关的数据进行加密,或实现其他安全措施以维护用户隐私。在另一实施例中,用户可以选择加入或退出由本文描述的技术提供的服务和/或选择哪些用户数据和/或用户数据的哪些源将由这些技术利用。
在本公开的实施例中利用的数据可以从各种源接收并且可以以各种格式可用。例如,在一些实施例中,经由数据收集组件210接收到的用户数据可以经由一个或多个传感器(例如,图1的传感器103)来确定,该用户数据可以存储在一个或多个用户设备(例如,用户设备102a)、服务器(例如,服务器106)和/或其他计算设备上或与其相关联。如本文所使用的,传感器可以包括用于感测、检测或以其他方式获得信息(例如,来自数据储存库150的用户数据)的功能、例程、组件或其组合,并且可以体现为硬件、软件或两者。如较早所提及的,通过示例而非限制的方式,从一个或多个传感器感测到的或确定出的数据可以包括声学信息(包括来自用户语音、话语、呼吸、咳嗽或其他口音(vocal sound)的信息);可以根据移动设备确定的位置信息,例如,室内定位系统(IPS)或全球定位系统(GPS)数据;大气信息,例如,温度、湿度和/或污染;生理信息,如体温、心率、血压、血氧水平、睡眠相关的信息;运动信息,例如,加速度计或陀螺仪数据;和/或环境光信息,例如,光电检测器信息。
在一些方面,由数据收集组件210收集的传感器信息可以包括用户设备的进一步属性或特性(例如,设备状态、充电数据、日期/时间或从用户设备(例如,移动设备或智能扬声器)导出的其他信息);用户活动信息(例如,app使用、在线活动、在线搜索、话音数据(例如,自动语音识别)或活动日志),在一些实施例中,该用户活动信息包括在多于一个用户设备上发生的用户活动;用户历史;会话日志;申请数据;联系人;日历和时间表数据;通知数据;社交网络数据;新闻(包括例如搜索引擎上的流行或趋势项目、社交网络、卫生部门通知,这些可能提供关于地理区域内的呼吸道感染数量或比率的信息);电子商务活动(包括来自诸如Amazon. 等在线账户的数据);用户帐户数据(其可以包括来自用户偏好或与个人助理应用或服务相关联的设置的数据);家庭传感器数据;电器数据;车辆信号数据;交通数据;其他可穿戴设备数据;其他用户设备数据(例如,设备设置、简档、网络相关的信息(例如,网络名称或ID、域信息、工作组信息、连接数据、无线保真(Wi-Fi)网络数据或配置数据、关于型号、固件、设备、设备配对的数据,(例如,在用户将移动电话与蓝牙耳机配对的情况下)或其他网络相关的信息));支付或信用卡使用数据(例如,其可以包括来自用户/>帐户的信息);购买历史数据(例如,来自用户的Amazon./>或在线药店帐户的信息);可以由传感器(或其他检测器)组件感测到的或以其他方式检测到的其他传感器数据,包括从与用户相关联的传感器组件导出的数据(包括位置、运动、定向、定位、用户访问、用户活动、网络访问、用户设备充电、或能够由一个或多个传感器组件提供的其他数据);基于其他数据导出的数据(例如,可以从Wi-Fi、蜂窝网络或互联网协议(IP)地址数据导出的位置数据);以及可以被感测或确定的数据的几乎任何其他源,如本文所述。
在一些方面,数据收集组件210可以提供以数据流或信号形式收集的数据。“信号”可以是来自对应的数据源的数据馈送或流。例如,用户信号可以是从智能扬声器、智能电话、可穿戴设备(例如,健身跟踪器或智能手表)、家庭传感器设备、GPS设备(例如,用于位置坐标)、车辆传感器设备、用户设备、日历服务、电子邮件帐户、信用卡帐户、订阅服务、新闻或通知馈送、网站、门户或任何其他数据源获取的用户数据。在一些实施例中,数据收集组件210连续地、周期性地或根据需要接收或访问数据。
此外,操作环境200的用户话音监视器260可能通常负责收集或确定用户话音相关的数据,该用户话音相关的数据可以用于检测或监视呼吸道状况。术语“话音相关的数据”(在本文可互换地称为“话音数据”或“话音信息”)在本文被宽泛使用,并且通过示例而非限制,可以包括与用户语音、包括发声或口音的话语或由用户的嘴或鼻子生成的其他声音(例如,呼吸、咳嗽、打喷嚏或嗅闻)相关的数据。用户话音监视器260的实施例可以促进获得音频或声学信息(例如,发声或话音样本的音频记录),以及在一些方面,用户话音监视器260的实施例可以促进获得可以由数据收集组件210接收的上下文信息。用户话音监视器260的实施例可以根据该音频数据确定相关的话音相关的信息,例如,音素特征。用户话音监视器260可以连续地、周期性地或根据需要接收数据,并且类似地,可以提取或以其他方式确定用于连续地、周期性地或根据需要监视呼吸道状况的话音信息。
在系统200的示例实施例中,用户话音监视器260可以包括声音记录优化器2602、话音样本收集器2604、信号准备处理器2606、样本记录审计器2608、音素分割器2610、声学特征提取器2614和上下文信息确定器2616。在用户话音监视器260的另一实施例(未示出)中,可以仅包括这些子组件中的一些,或者可以添加附加的子组件。如本文进一步解释的,用户话音监视器260的一个或多个组件(例如,信号准备处理器2606)可以对音频数据(例如,原始声学数据)执行预处理操作。在一些实施例中,可以设想可以根据数据收集组件210进行附加的预处理。
声音记录优化器2602可以通常负责确定用于获得可用音频数据的适当的或优化的配置。如上面所描述的,可以设想,本文描述的技术的实施例可以在家庭环境中利用,或者由最终用户在除了受控环境之外的环境(例如,实验室或医生的诊所办公室)中使用。因此,一些实施例可以包括用于促进获得具有足够质量的用于监视用户的呼吸道状况的质量的音频数据的功能。特别地,在一个实施例中,声音记录优化器2602可以用于通过提供用于获得音频数据话音相关信息的优化的配置来提供这种功能。在一个示例性实施例中,可以通过调整传感器或修改诸如信号强度、方向性、灵敏度、频率和信噪比(SNR)之类的其他声学参数(例如,麦克风参数)来提供优化的配置。声音记录优化器2602可以确定设置在适当配置的预定范围内或满足预定阈值(例如,麦克风灵敏度或级别被充分调整以使用户的话音数据能够从音频数据中获得)。在一些实施例中,声音记录优化器2602可以确定是否发起记录。在一些实施例中,声音记录优化器2602还可以确定采样率是否满足阈值采样率。在一个示例性实施例中,声音记录优化器2602可以确定以Nyquist速率采样的音频信号,在一些实例中,该Nyquist速率包括44.1千赫兹(kHz)的最小速率。另外地,声音记录优化器2602可以确定比特深度满足阈值,例如,16比特。此外,在一些实施例中,声音记录优化器2602可以确定麦克风是否被调整。
在一些实施例中,声音记录优化器2602可以执行初始化模式以针对麦克风所在的特定环境优化麦克风级别。初始化模式可以包括提示用户播放声音或发出噪声,以便声音记录优化器2602确定针对特定环境的适当级别。在初始化模式下,声音记录优化器2602还可以提示用户在请求用户输入时相对于麦克风站立或定位在用户通常站立或定位的位置。基于用户反馈(即,话音记录),在初始化模式期间,声音记录优化器2602可以确定范围、阈值和/或其他参数来配置音频收集和处理组件,以为未来记录会话提供优化的配置。在一些实施例中,声音记录优化器2602可以另外地或可替代地确定信号处理功能或配置(例如,噪声消除,如下面所描述的)以促进获得可用的音频数据。
在一些实施例中,声音记录优化器2602可以与用于预处理的信号准备处理器2606结合工作,以进行优化调整(例如,调整或放大级别)以实现合适的配置。可替代地,声音记录优化器2602可以配置传感器以实现在针对特定参数(例如,信号强度)的预定范围或阈值内的级别。
如图2所示,声音记录优化器2602可以包括背景噪声分析器2603,该背景噪声分析器2603可以通常负责识别背景噪声,以及在一些实施例中负责去除或降低背景噪声。在一些实施例中,背景噪声分析器2603可以检查噪声强度级别是否满足最大阈值。例如,背景噪声分析器2603可以确定在用户的记录环境中的环境噪声小于30分贝(dB)。背景噪声分析器2603可以检查语音(例如,来自电视或收音机)。背景噪声分析器2603还可以检查间歇性尖峰或类似的声学伪影,例如,其可能是由于儿童的喊叫、响亮的钟滴答声或移动设备上的通知而导致的。
在一些实施例中,背景噪声分析器2603可以在已经发起记录之后执行背景噪声检查。在一个这样的实施例中,在检测记录中的第一音素(其可以如结合音素分割器2610所描述的那样被检测)之前,对在预定时间间隔内接收到的音频数据的一部分进行背景噪声检查。例如,背景噪声分析器2603可以在音频数据中的第一音素开始之前执行五秒的背景噪声检查。
如果检测到背景噪声,则背景噪声分析器2603可以处理(或尝试处理)音频数据以减少或消除噪声。可替代地,可以将由背景噪声分析器2603确定出的噪声的指示提供给信号准备处理器2606,以执行滤波和/或减法过程来减少或消除噪声。在一些实施例中,除了或替代自动减少或消除背景噪声,背景噪声分析器2603可以发送指示以通知用户(或系统200的其他组件,例如,用户交互管理器280)背景噪声正在干扰或潜在地干扰话音收集,并请求用户采取动作以消除背景噪声。例如,可以向用户提供通知(例如,经由用户交互管理器280或呈现组件220)以移动到更安静的环境。
在一些实例中,在获得音频数据之后,背景噪声分析器2603可以重新检查该音频数据是否存在背景噪声。例如,在声音记录优化器2602(或在一些实施例中,信号准备处理器2606)自动调整设置以减少或消除噪声之后,可以执行另一检查。在一些方面,后续检查可以在需要时、在记录会话开始、自上次检查以来的预定时间段之后和/或如果接收到例如来自用户的指示采取动作以减少或消除背景噪声的指示时执行。
在用户话音监视器260内,话音样本收集器2604可以通常负责以音频样本或记录的形式获得用户的话音相关数据。话音样本收集器2604可以与数据收集组件210和用户交互管理器280结合操作,以获得用户的语音或其他话音信息的样本。音频样本的形式可以是一个或多个音频文件,该音频文件包括持续音素、脚本语音和/或非脚本语音的记录或样本。本文使用的术语“音频记录”通常指代数字记录(例如,音频采样,其可以通过利用模数转换(ADC)进行音频采样来确定)。
在一些实施例中,话音样本收集器2604可以包括用于从模拟音频(其可以从传感器103或模拟记录接收)捕获和处理数字音频的功能,例如,ADC转换功能。以这种方式,话音样本收集器2604的一些实施例可以提供或促进确定数字音频样本。在一些实施例中,话音样本收集器2604还可以将日期时间信息与对应于获得音频数据的时间帧的音频样本相关联(例如,利用日期和/或时间对音频样本进行时间戳)。在一个实施例中,音频样本可以存储在与用户相关联的个人记录(例如,个人记录240中的话音样本242)中。
如关于用户交互管理器280所描述的和在图4A-图4C和图5B的示例中所描绘的,响应于用户参与语音相关任务,可以获得话音样本242。例如但不限于,可以要求用户说话并在一段时间间隔内或尽可能长时间地保持特定声音(例如,“mmmm”)、重复某些单词或短语、朗读段落或者被提示回答问题或参与对话,使得可以获得话音样本242。可以在同一收集会话中从用户获得表示各种类型的语音相关任务的话音样本242。例如,可以要求用户说话并在一定的时间间隔内保持一个或多个音素,以及要求用户说话并尽可能长时间地保持一个或多个音素,其中后者的音素可以与在指定的时间间隔内保持的音素相同或不同。在一些实施例中,还可以要求用户读出具有各种音素的书面段落。
如本文所描述的,本文的话音样本指代音频样本中的话音相关信息,并且可以根据音频样本来确定。例如,音频样本可以包括与用户的话音无关的其他声学信息,例如,背景噪声。因此,在一些实例中,话音样本可以指代音频样本的具有话音相关信息的一部分。在一个实施例中,可以根据在用户与用户计算设备(例如,图1的用户设备102a)的随意或日常交互期间收集的音频来确定话音样本。例如,当用户向智能扬声器陈述自发命令或通过电话交谈时,可以收集话音样本。在一些实施例中,在话音样本信息是从用户与用户设备的随意交互中获得的情况下,提示用户参与语音相关任务可能是不必要的。类似地,在一些实施例中,例如,当关于特定音素的信息尚未从随意交互语音中获得时,可以提示用户完成语音相关任务以获得尚未经由用户的语音从随意交互中获得的话音样本信息。
如上面所提及的,本文描述的技术提供维护和保护用户隐私。可以预期,从与用户设备的随意交互获得音频样本的实施例可以在一旦确定了用于呼吸道状况监视的话音相关数据之后就删除音频数据。类似地,音频数据可以被加密和/或用户可以“选择加入”以从所谓的随意交互中收集话音相关数据(用于监视呼吸道状况)。
信号准备处理器2606可以通常负责准备用于提取话音相关信息(例如,用于进一步分析的音素特征)的音频样本。因此,信号准备处理器2606可以对由话音样本收集器2604获得或确定的音频数据执行信号处理、预处理和/或调节。在一个实施例中,信号准备处理器2606可以从话音样本收集器2604接收音频数据,或者可以访问来自与用户相关联的个人记录240中的话音样本242的话音样本数据。由信号准备处理器2606准备或处理的音频数据可以被存储为话音样本242和/或提供给用户话音监视器260的其他子组件或系统200的其他组件。
在一些实施例中,用于监视用户的呼吸道状况的特定音素特征或话音信息可以存在于音频数据的一些频带中而不是所有频带中。因此,信号准备处理器2606的一些实施例可以执行频率滤波(例如,高通滤波或带通滤波),以去除或衰减音频信号的不那么有用的频率,例如,低频背景噪声。信号频率滤波还可以通过减小音频样本大小来改进计算效率以及改进针对样本的处理时间。在一个实施例中,信号准备处理器2606可以应用1.5千赫兹(kHz)至6.4千赫兹(kHz)的带通滤波器。在图15A-图15M中提供的计算机程序例程的一个示例性实施例中,使用Butterworth带通滤波器(如图15A所示)。在一个示例中,信号准备处理器2606可以应用滚动中值滤波器来对离群值进行平滑并对特征进行归一化。可以应用滚动中值滤波器,从而使用三个样本的窗口。可以利用z分数来对特征值进行归一化。
信号准备处理器2606还可以执行音频归一化以通过应用频带滤波器和/或放大器或其他信号调节或预处理来实现目标信号幅度级别、信噪比(SNR)改进。在一些实施例中,信号准备处理器2606可以处理音频数据以去除或衰减背景噪声,例如,由背景噪声分析器2603确定的背景噪声。例如,在一些实施例中,信号准备处理器2606可以使用由背景噪声分析器2603确定的背景噪声信息来执行噪声消除操作(或以其他方式减去或衰减包括噪声伪影的背景噪声)。
在用户话音监视器260中,样本记录审计器2608可以通常负责确定是否获得足够的音频样本(或话音样本)。因此,样本记录审计器2608可以确定样本记录具有最小的时间长度和/或包括特定的话音相关信息,例如,发声或其他口音。在一些实施例中,样本记录审计器2608可以应用标准来基于要检测的特定音素或音素特征来检查音频样本。以这种方式,样本记录审计器2608的一些实施例可以对音频数据执行音素检测,或者与音素分割器2610或用户话音监视器260的其他子组件结合操作。在一些实施例中,样本记录审计器2608可以确定音频样本(或在一些实例中,音频记录内的话音样本)是否满足阈值时间长度。阈值时间长度可以基于所记录的特定类型的语音相关任务而变化,或者可以基于旨在从话音样本中获得的特定音素或音素特征,以及这些特征在当前会话或时间帧中已经被确定的程度。在一个实施例中,在获得用户话音样本的会话中,如果(例如,由用户交互管理器280)提示用户记录段落朗读,则样本记录审计器2608可以确定所记录的后续话音样本是否长度至少为15秒。而且,在一个实施例中,样本记录审计器2608可以确定特定音频样本是否包括足够持续时间的持续发声,例如,长度至少为4.5秒。类似地,对于从与用户计算设备(例如,用户设备102a)的随意交互中获得音频数据或话音样本(例如,242)的实施例,样本记录审计器2608可以确定要用于进一步分析(例如,确定音素或音素特征)的特定话音样本满足阈值持续时间和/或包括特定声音或音素信息。不满足审计标准(例如,最小阈值持续时间)的记录或话音样本可以被认为是不完整的,并且可以被删除或不进一步处理。在一些实施例中,样本记录审计器2608可以向用户(或用户交互管理器280、呈现组件220或系统200的其他组件)提供特定样本不完整或以其他方式不足的指示,并且可以进一步指示用户需要重新记录特定话音样本。
在一些实施例中,样本记录审计器2608可以从多个话音样本(其可以从话音样本242接收)中选择话音样本,该多个话音样本中的每一个可以表示在时间帧内(即,在会话内)的相同(或相似)的话音相关信息。在一些实例中,在该选择之后,其他未选择的样本可能被删除或丢弃。例如,在给定时间点或间隔(其可能已经由用户重复特定语音相关任务而生成)内存在期望的音素的多个完整记录的情况下,样本记录审计器2608可以选择最近期获得的记录(最后记录的一个记录)用于分析,这可以在假设由于在先前记录期间遇到技术问题而导致用户重新记录脚本语音的情况下进行。可替代地,样本记录审计器2608可以基于声音参数来选择话音样本,例如,具有最低噪声量和/或最高音量的话音样本。
确定用于进一步处理的足够的话音样本记录还可以包括确定不存在噪声伪影、确定仅存在最小量的噪声伪影和/或确定记录包含至少大致正确的声音或遵循指示的指令。在一些实施例中,样本记录审计器2608可以确定话音样本的SNR是否满足最大允许SNR,例如,20分贝(dB)。例如,样本记录审计器2608可以确定记录的SNR大于20dB的阈值,并且可以向用户(或向系统200的另一组件,例如,用户交互管理器280)提供请求从用户获得新话音样本的指示。
样本记录审计器2608的一些实施例可以确定是否存在对应于所请求的语音相关任务的样本声音,例如,特定持续发声(例如,/a/、/e/、/n/、/m/)。特别地,在从执行语音相关任务(例如,“说出‘mmm’并保持五秒”)的用户获得话音样本的情况下,可以检查或审计话音样本以确定样本包括在任务中请求的声音(或音素)。在一些实施例中,该检查操作可以利用自动语音识别(ASR)功能来确定话音样本中的音素,并将样本中确定出的音素与所请求的声音或音素(即,“标记的”音素或声音)进行比较。在确定不匹配或在样本中未检测到标记的音素或声音的情况下,样本记录审计器2608可以向用户(或向系统200的另一组件,例如,用户交互管理器280)提供指示,使得可以重新获得正确的话音样本。下面结合音素分割器2610描述ASR的附加细节。
样本记录审计器2608的一些实施例可以不一定确定音频样本中特定音素的存在,但可以确定在该样本中捕获了持续音素或音素的组合。样本记录审计器2608还可以确定音素是否已经在话音样本中持续了最小持续时间。在一个实施例中,最小持续时间可以是4.5秒。
样本记录审计器2608还可以执行修整、剪切或过滤以去除话音样本记录的不必要和/或不可用的部分。在一些实施例中,样本记录审计器2608可以与信号准备处理器2606一起工作以执行这样的动作。例如,样本记录审计器2608可以从每个记录中修整开始部分和结束部分(例如,0.25秒)。话音样本的可用部分可以包括足以进行进一步处理以确定音素或特征信息的话音相关数据。在一些实施例中,样本记录审计器2608(或话音样本收集器2604和/或用户话音监视器260的其他子组件)可以修剪或修整话音样本以仅保留被确定为可用的部分。类似地,样本记录审计器2608可以促进从可以在相同时间帧内(即,在记录会话内)获得的多个样本(例如,话音样本242)中确定音频样本的可用部分。
样本记录审计器2608可以从话音样本242或从用户话音监视器260的另一子组件接收音频样本数据,并且可以将它已经处理或修改的话音样本数据存储在话音样本242中或者将经处理或修改的话音样本数据提供给用户话音监视器260的另一子组件。在一些实例中,例如,在记录或去除不可用部分之后记录不完整的情况下,样本记录审计器2608可以确定是否需要获得新的记录或话音样本,并且向用户提供指示,这在下面关于用户交互管理器280进行描述。
音素分割器2610可以通常负责检测话音样本中独立音素的存在和/或确定在话音样本中存在独立音素期间的时序信息。例如,时序信息可以包括话音样本中音素出现的开始时间(即,起始时间)、持续时间和/或结束时间(即,停止时间),其可用于促进识别和/或隔离用于特征分析的音素。在一些实例中,起始和停止时间信息可以被称为音素的边界。如先前所提及的,话音样本可以包括用户发出持续的独立音素或音素组合(例如,脚本和非脚本语音)的记录(例如,音频样本)。例如,当用户说出单词“spring”时可以创建话音样本,并且该话音样本可以被分割为独立音素(例如,/s/、/p/、/r/、/i/和/ng/)。在一些实例中,可以对持续的独立音素的话音样本进行分割,以将该音素与样本的其余部分隔离开来。
在一些方面,音素分割器2610可以检测音素,并且可以进一步隔离音素(例如,要么在逻辑上使用时序信息(其可以用作到音频样本中的音素的指针或引用),要么在物理上例如通过从音频样本中复制或提取音素相关数据)。由音素分割器2610进行的音素检测可以包括确定话音样本(或话音样本的一部分)具有特定音素或音素的特定集合中的一个音素。可以从话音样本242或从用户话音监视器260的另一子组件接收话音样本数据。由音素分割器2610检测到的特定音素可以基于针对用户的呼吸道状况分析的音素。例如,在一些实施例中,音素分割器2610可以检测样本(或多个样本)是否包括对应于/n/、/m/、/e/和/或/a/的音素。在另一实施例中,音素分割器2610可以确定样本(或多个样本)是否包括对应于/a/、/e/、/i/、/u/、/ae/、/n/、/m/和/或/ng/的音素。在其他实施例中,音素分割器2610可以检测其他音素或音素集合,其可以包括来自任何口头语言的音素。
在音素分割器2610的一些实施例中,利用自动语音识别(ASR)(称为“语音识别”)功能以根据话音样本的一部分确定音素。ASR功能还可以利用一个或多个声学模型或语音语料库(speech corpora)。在实施例中,隐马尔可夫模型(HMM)可以用于处理对应于用户的话音样本的语音信号以确定一个或多个可能的音素的集合。在另一实施例中,可以利用人工神经网络(ANN)(其有时在本文中被称为“神经网络”)、用于ASR的其他声学模型或使用这些模型的组合的技术。例如,神经网络可以用作ASR的预处理步骤,以在应用HMM之前执行降维或特征变换。由音素分割器2610执行的用于从话音样本中检测或识别音素的操作的一些实施例可以利用经由语音识别引擎或ASR软件工具包提供的ASR功能或声学模型,该ASR软件工具包可以包括用于处理语音数据的软件包、模块或库。这种语音识别软件工具的示例包括:经由kaldi-asr.org可用的Kaldi语音识别工具包;由Carnegie Mellon University开发的CMU Sphinx;以及由Cambridge University开发的隐马尔可夫模型工具包(HTK)。
如本文所描述的,在用于获得话音样本的一些实现方式中,用户可以执行语音相关任务,其可以是诸如结合图5B描述的重复声音练习之类的评估练习的一部分。这些语音相关任务中的一些可以请求用户说出并保持特定的声音或音素。另外地或可替代地,语音相关任务可以请求用户说出并尽可能长时间地维持特定声音或音素。各种任务可以用于不同的音素。例如,在一个实施例中,可能要求用户说出并尽可能长时间地保持“aaaa”(或/a/音素),但也可能要求用户说出并保持其他声音或音素(例如,/e/、/n/或/m/)达预定的时间段,例如,五秒。在一些实施例中,可以针对同一音素收集多种类型的语音相关任务。
通过执行该任务生成的音频样本可以被标记或以其他方式与用户被请求发出的声音或音素相关联。例如,如果提示用户说出并保持“mmm”五秒,则所记录的音频样本可以被标记或与“mmm”声音(或/m/音素)相关联。
在一些实施例中,音素分割器2610可以利用ASR功能来确定音频样本中的特定声音或音素,该特定声音或音素可以通过执行语音相关任务获得或可以从经由与用户设备的随意交互获得的用户语音中接收。在这些实施例中,一旦音频样本的声音或音素被确定,音频样本(或样本的一部分)就可以被标记或与该声音或音素相关联。在一个示例实施例中,如果音素分割器2610确定从用户获得的音频样本具有出现在样本的特定部分处的“aaa”声音,则音素分割器2610可以检测“aaa”声音(或/a/音素)并相应地标记音频样本的该部分(例如,通过将标签与音频样本或数据库中的一部分相关联)。在另一实施例中,音素分割器2610可以隔离音素以确定音频样本中的时序或音素边界。
在一些实施例中,音素分割器2610可以通过识别音素边界或捕获音素的话音样本内的间隔的起始时间、持续时间和/或停止时间来隔离音素。在一些实施例中,音素分割器2610首先检测特定音素的存在,然后隔离该特定音素,例如,/n/、/m/、/e/和/a/。在替代实施例中,音素分割器2610可以检测特定音素存在于话音样本中并隔离所有检测到的音素。音素分割器2610的一些实施例可以利用语音学分割或语音学对齐工具,以促进确定音频样本中的音素或音素边界的时间位置。这种工具的示例被包括在由University ofAmsterdam开发的用于语音分析和语音学的Praat计算机软件包提供的功能和/或与Praat一起操作的软件模块(例如,University of Geneva开发的用于执行语音学对齐的EasyAlign)中。
在示例性方面,音素分割器2610可以通过将阈值应用于话音样本中检测到的强度水平来执行自动分割。例如,可以贯穿记录计算声学强度,并且可以应用用于从样本中更高能的事件(表示语音事件)中分离背景噪声的阈值。在实施例中,可以利用由用于语音分析和语音学的Praat计算机软件包提供的功能来执行对声学强度的计算。图15A-图15M说明性地提供了使用Praat的一个这种示例,其被示为使用Parselmouth Python库。根据实施例,可以使用Otsu的方法来确定用于音素分割的阈值。在一些实施例中,可以针对每个话音样本确定该阈值,使得可以针对同一用户确定不同的阈值并将其应用于不同的话音样本。一旦计算出声学强度水平并确定阈值,则音素分割器2610就可以将阈值应用于计算出的强度水平以检测音素的存在,并且还可以识别分别对应于检测到的音素的开始和结束的起始时间和停止时间。一些实施例包括对话音样本中的至少一些使用手动分割以验证由音素分割器2610执行的自动分割。
在一些实施例中,可以使用形态学“填充”操作来填充被检测为音素的分段内的间隙。可以在间隙的持续时间小于最大阈值(例如,0.2秒)的情况下填充间隙。另外地,音素分割器2610的实施例可以修整检测到的音素的一个或多个部分。例如,音素分割器2610可以修整或忽略每个检测到的音素的初始持续时间(例如,前0.75秒),以避免瞬态影响。因此,可以改变检测到的音素的起始时间,使得检测到的音素不包括前0.75秒。另外地,在一些实施例中,每个检测到的音素可以被修整,使得音素的总持续时间为2秒或其他设置的持续时间。
在一些实施例中,可以对分割的音素执行数据质量检查。这些数据质量检查可以由音素分割器2610或用户话音监视器260的另一组件(例如,信号准备处理器2606和/或样本记录审计器2608)执行。在一个实施例中,针对每个音素分段估计信噪比(SNR)作为检测到的分段中的平均强度除以检测到的分段之外的平均强度的比率。此外,可以应用预定的分段持续时间阈值来确定检测到的音素是否满足最小持续时间。另一质量检查可以包括通过将检测到的音素的数量与音素的预期数量进行比较来确定音素的正确数量,该音素的正确数量可以基于触发来自用户的话音样本的提示。例如,在一个实施例中,音素的正确数量可以包括用于持续鼻辅音记录的三个分割音素和用于持续元音记录的四个分割音素。在示例性方面,如果找到音素的正确数量(例如,用于持续鼻辅音记录的三个和用于持续元音记录的四个),SNR大于9分贝,并且每个音素具有2秒或更长的持续时间,则可以将已经被分割的话音样本确定为良好质量。在一些实施例中,可以针对元音话音样本执行附加的质量检查,其可以包括确定第一共振峰频率是否在可接受的范围内。如果在可接受的范围内,则样本被确定为质量良好。如果不在可接受的范围内,则提供指示(其可以被提供给用户交互管理器280)表示样本不足、不完整或应该重新获得样本。
继续用户话音监视器260,声学特征提取器2614可以通常负责提取(或以其他方式确定)话音样本内的音素的特征。可以以预定的帧速率从话音样本中提取音素的特征。在一个示例中,以10毫秒的速率提取特征。所提取的特征可以用于跟踪用户的呼吸道状况,例如,关于呼吸道状况跟踪器270进一步描述的。通过示例而非限制的方式,所提取的声学特征的示例可以包括表征功率和功率可变性、音高和音高可变性、频谱结构和/或共振峰的测量的数据。
与功率和功率可变性相关的特征(也可以称为幅度相关特征)的其他示例可以包括每个分割的音素的声学功率的均方根(RMS)、微扰和1/3-倍频带(即,第三倍频带)中的功率波动。在一些实施例中,在提取任何其他声学特征之前计算并利用声学功率的RMS来归一化数据。此外,RMS可以转换为分贝,以考虑作为功率相关特征本身。微扰捕获以声门脉冲间隔测量的波形幅度的快速变化。可以在各种频率处计算1/3倍频带滤波器的输出内的功率波动。在示例实施例中,所提取的特征可以指示在200赫兹(Hz)第三倍频带中的波动,这可以通过应用178Hz-224 Hz的通带频率来确定。
与音高和音高可变性相关的特征的其他示例可以包括音高和抖动的变异系数(COV)。为了提取音高的变异系数,可以跨每个分段确定平均音高(pitchmn)和音高标准差(pitchsd),并且音高的变异系数(pitchcov)可以计算为copitchcov=pitchsd/pitchmn。在一些实施例中,特别是在话音样本有噪声的情况下,可以应用变异系数阈值以确保针对用户的话音数据的适当频率计算估计的音高值。例如,可以确定变异系数是否低于变异系数值的10%的阈值(根据经验确定),并且可以将值大于阈值的分段视为缺失数据。抖动可以在较短的时间尺度上捕获音高可变性。抖动可以以局部抖动或局部绝对抖动的形式被提取。在一些方面,使用自相关方法从每个分段中提取音高相关特征。由University ofAmsterdam开发的用于语音分析和语音学的Praat计算机软件包提供了用于确定音高相关特征的自相关的一个示例。图15E和图15F描绘了用于以这种方式利用Praat功能的实施例的示例计算机编程例程的方面。
声学特征提取器2614(或用户话音监视器260)的一些实施例可以在声学特征提取器2614提取音高相关特征之前执行调整音高下限(pitch floor)的处理操作。例如,对于男性用户,音高下限可以增加到80Hz,并且对于女性用户,音高下限可以增加到100Hz,以防止错误的音高检测。根据实施例,在存在低频周期性背景噪声的情况下,可以保证提高音高下限。确定是否调整音高下限可以基于收集话音数据的系统、收集话音数据的环境和/或应用设置(例如,设置249)而改变。
与频谱结构相关的特征可以包括谐波噪声比(HNR,有时称为“谐度”)、频谱熵、频谱对比度、频谱平坦度、话音低高比(VLHR)、梅尔频率倒谱系数(MFCC)、倒谱峰值突出(CPP)、浊音(或清音)帧的百分比或比例以及线性预测系数(LPC)。HNR或谐度是谐波分量中的功率与非谐波分量中的功率的比率,并且表示声学周期性的程度。确定HNR的示例在图15E的计算机编程例程中示出,其利用由Praat计算机软件包提供的功能来确定谐度。频谱熵指示特定频带中频谱的熵。频谱对比度可以通过按特定频带中的强度对功率频谱值进行分类并计算频带中最高四分位数值(峰)与最低四分位数值(谷值)的比率来确定。频谱平坦度可以通过计算给定频带中频谱值的几何平均与算术平均的比率来确定。可以针对特定频带计算频谱熵、频谱对比度和频谱平坦度。在一个实施例中,频谱熵在1.5千赫兹(kHz)-2.5kHz和1.6kHz-3.2kHz处确定;频谱平坦度在1.5kHz-2.5kHz处确定;频谱对比度在1.6kHz至3.2kHz和3.2kHz-6.4kHz处确定。
VLHR可以通过计算集成的低高频能量的比率来确定。在一个实施例中,在低频和高频之间的间隔固定在600Hz。因此,该特征可以表示为VLHR600。
梅尔频率倒谱系数(MFCC)表示缩放的功率频谱的离散余弦变换,并且MFCC共同构成梅尔频率倒谱(MFC)。MFCC典型地对频谱中的改变敏感并且对环境噪声具有鲁棒性。在示例性方面,确定平均MFCC值和标准差MFCC值。在一个实施例中,针对梅尔频率倒谱系数MFCC6和MFCC8确定平均值,并且针对梅尔频率倒谱系数MFCC1、MFCC2、MFCC3、MFCC8、MFCC9、MFCC10、MFCC11和MFCC12确定标准差值。
浊音指代所记录的发声中的周期性,并且本公开的一些方面包括确定发声记录中发浊音的帧的百分比、比例或比率。可替代地,可以使用清音帧来确定该特征。在确定浊音(或清音)帧的一些实例中,可以应用预定的音高阈值,使得浊音帧或清音帧的百分比被称为具有可疑语音的帧。在一些实施例中,可以使用用于话音处理的Praat计算机软件包工具包来确定浊音(或清音)帧的百分比或比例。
由声学特征提取器2614提取或确定的其他特征可以与一个或多个声学共振峰相关,该一个或多个声学共振峰表示声道的共振。特别地,对于话音样本的音素,可以针对一个或多个共振峰计算平均共振峰频率和共振峰带宽的标准差。在示例性方面,针对共振峰1(表示为F1)计算平均共振峰频率和共振峰带宽的标准差;然而,可以设想,可以使用另外的或替代的共振峰,例如,共振峰2和3(表示为F2和F3)。在一些方面,共振峰特征可以通过促进自动检查来作为数据质量控制操作,该自动检查可以由样本记录审计器2608执行,以确保用户正确地发出声音。
预期在一些实施例中,可以针对不同音素提取或确定所描述的声学特征中的每一个。例如,在一个实施例中,针对七个音素(/a/、/e/、/i/、/u/、/ae/、/n/、/m/和/ng/)确定上述特征中的23个(不包括幅度的RMS),从而产生161个唯一的音素特征。本公开的一些实施例可以包括识别或选择用于进一步分析的特征集。例如,一个实施例可以包括根据一个或多个话音样本或参考话音数据来确定所有161个特征,以及选择或以其他方式确定被认为与监视用户的呼吸道感染疾病相关的特定特征。
另外,这些声学特征中的一个或多个可以从仅来自特定类型的语音相关任务的话音样本中提取。例如,可以针对从预定持续时间的发声中提取的音素确定上述特征。可以针对从用户朗读段落提取的发声来确定这些上述特征中的一个或多个。在一些实施例中,可以从特定类型的语音相关任务中提取其他特征。例如,在示例方面,可以从用户尽可能长时间地保持声音的持续发声话音样本中确定可以用作呼吸量的测量的最大发声时间。如本文所使用的,最大发声时间指代用户持续特定发声的持续时间。
此外,在一些实施例中,还可以为这些类型的话音样本确定持续发声内幅度的改变。在一些示例实施例中,根据段落话音样本确定其他声学特征。例如,根据用户朗读段落的记录或监视,可以确定说话速率、平均停顿长度、停顿计数和/或全局SNR。说话速率可以被确定为每秒的音节或单词的数量。停顿长度可以指代用户的语音中至少为预定最小持续时间(例如,200毫秒)的停顿。在一些方面,用于确定平均停顿长度和/或停顿计数的停顿可以通过以下方式来确定:利用自动语音到文本算法以根据用户的话音样本生成文本、确定用户何时开始单词和用户何时结束单词的时间戳,以及使用该时间戳,确定单词之间的持续时间。全局SNR可以是包括非说话时间的记录上的信噪比。
可以进一步设想,特定特征或特征的组合比其他特征更适合于监视某些类型的呼吸道感染。特征选择的实施例可以包括识别可能的特征组合,计算不同天的特征集或向量之间的距离度量,以及将用于呼吸症状的自我报告评级的距离度量进行相关。在一个示例中,利用主成分分析(PCA)来计算可能的音素组合的前六个主成分(例如,图11A和图11B所示的音素组合),并计算距离度量,例如,在收集话音数据的每一对日子中表示音素组合的声学特征的向量之间的Euclidean距离。Spearman的等级相关性可以在每天相对于表示良好状态的最后一天的距离度量与自我报告症状评级之间计算。
此外,在一些实施例中,还通过应用稀疏PCA来执行无监督特征选择以进一步降低数据集的维数。可替代地,在一些实施例中,线性判别分析(LCA)可以用于降低维数。在一些实施例中,可以选择具有非零权重的最大量的主成分(根据经验确定)中的特征(具体地,音素和特征组合)用于进一步分析。结合图7-14进一步讨论特征选择的方面。
在示例性方面中,根据结合图7-图14所描述的特征选择来确定的代表性音素特征集包括32个音素特征,其中包括12个/n/音素特征、12个/m/音素特征和8个/a/音素特征。下表列出了这些示例32个特征。
/>
如上表所指示的,一个或多个特征的值可以由声学特征提取器2614变换为正太。例如,日志变换(表示为LG)可以应用于特征的子集。其他特征可能不包括变换。此外,虽然未被包括在上表中,但可以设想可以应用诸如平方根变换(SRT)之类的其他变换。在一个实施例中,特征选择包括针对各种一个或多个特征选择变换。在一个示例中,对一个或多个特征测试不同类型的变换(例如,SRT、LG或无变换),并且Shapiro-Wilk测试可以用于选择给出针对该特定特征的最正态分布数据的变换类型。
在一些实施例中,声学特征提取器2614、音素分割器2610或用户话音监视器260的其他子组件可以利用话音-音素提取逻辑233(如图2中的存储装置250中所示)来确定音素或提取音素的特征。话音-音素提取逻辑233可以包括指令、规则、条件、关联、机器学习模型或用于从对应于分段音素的声学数据中识别和提取声学特征值的其他标准。在一些实施例中,话音-音素提取逻辑233利用ASR功能、声学模型或结合音素分割器2610描述的相关功能。例如,可以利用各种分类模型或软件工具(例如,HMM、神经网络模型和先前描述的其他软件工具)来识别音频样本中的特定音素并确定对应的声学特征。声学特征提取器2614或话音-音素提取逻辑233的一个示例实施例可以包括或利用在用于语音分析和语音学的Praat计算机软件包中提供的功能。一个这样的实施例的方面(包括计算机程序例程)在图15A-图15M中说明性地提供,其示为使用Parselmouth Python库来访问Praat软件包。
在确定音素特征之后,声学特征提取器2614可以确定音素特征集,该音素特征集可以包括根据对应于记录会话或时间帧的用户话音样本确定的音素的音素特征向量(或音素特征向量的集合)。例如,用户可以每天提供两次话音样本(例如,早上会话和晚上会话),并且每个会话可以对应于音素特征向量或表示从在该会话期间捕获的话音样本中检测到的音素中提取或确定的特征的向量的集合。音素特征集可以存储在与用户相关联的个人记录240中(例如,音素特征向量244),并且可以被存储或以其他方式与获得用于确定音素特征的话音样本的日期或时间相对应的日期时间信息相关联。
在一些实例中,术语“特征集”和“特征向量”可以在本文中可互换地使用。例如,为了促进在两个特征集之间执行比较,或者促进将其他操作应用于特征,可以将集合中的成员特征考虑为特征向量,使得可以在每个向量中的对应特征之间确定距离测量(即,特征向量比较)。在一些实施例中,音素特征向量244可以被归一化。在一些实例中,特征向量可以是多维向量,其中每个音素具有表示特征的维度。在一些实施例中,多维向量可以例如在确定两个特征向量之间的比较之前被展平,如结合呼吸道状况跟踪器270所描述的。
除了确定声学特征之外,用户话音监视器260的一些实施例可以包括上下文信息确定器2616,以确定与从其确定特征的话音样本相关的上下文信息。上下文信息可以指示例如话音样本记录时的条件。在示例实施例中,上下文信息确定器2616可以确定记录的日期和/或时间(即,时间戳)或者记录的持续时间,该记录可以被存储或以其他方式与由声学特征提取器2614生成的音素特征向量相关联。除了所提取的声学特征之外,由上下文信息确定器2616确定的信息可以与跟踪用户的呼吸道状况相关。例如,上下文信息确定器2616还可以确定获得话音样本的一天中的特定时间(例如,早上、下午或晚上)和/或从其可以确定环境或大气相关信息(例如,天气、湿度和/或污染水平)的用户位置。在一个实施例中,话音样本的持续时间也可以用于跟踪用户的呼吸道状况。例如,可以要求用户说出并尽可能长时间地保持声音“aaaa”(即,音素/a/),并且可以使用测量用户能够保持声音的持续时间的持续时间度量来确定用户的呼吸道状况。
在一些实施例中,上下文信息确定器2616可以确定或接收关于用户的生理信息,该生理信息可以与获得话音样本的时间帧相关联。例如,用户可以提供关于他或她正在感觉的症状的信息,如图4D、图5D和图5E中描绘的实施例中所示和描述的。在一些实例中,上下文信息确定器2616可以结合用户交互管理器280操作以获得症状数据,如下面所描述的。在一些实施例中,上下文信息确定器2616可以从用户的简档/健康数据(EHR)241或传感器(例如,图1的103)接收生理数据,例如,可穿戴用户设备(例如,健身跟踪器)上的体温或血氧水平。
在一些实施例中,上下文信息确定器2616可以确定用户是否正在服药和/或用户是否已经服用了药物。这种确定可以基于用户提供明确的信号(例如,选择数字应用上的指示符),该信号表示用户已经服药或响应来自智能设备的询问用户是否服用了药物的提示;或者这种确定可以由另一传感器(例如,智能药盒或药物容器)提供;或者这种确定来自另一用户,例如,用户的护理人员。在一些实施例中,上下文信息确定器2616可以基于由用户、医生或保健提供者或护理人员通过访问用户的电子健康记录(EHR)241、指示处方或购买的电子邮件或消息和/或购买信息提供的信息,来确定用户正在服药。例如,用户或护理提供者可以经由数字应用(例如,结合图5D描述的示例呼吸道感染监视app 5101)指定用户正在服用的特定药物或治疗方案。
上下文信息确定器2616还可以(例如,通过用户设备上的位置传感器或用户输入的位置信息,例如,邮政编码)确定用户的地理区域。在一些实施例中,上下文信息确定器2616还可以确定在用户的地理区域中存在的已知的特定病毒或细菌导致呼吸道感染(例如,流感或COVID-19)的程度。这种信息可以从政府或保健网站或门户网站(例如,由美国疾病控制和预防中心(CDC)、世界卫生组织(WHO)、州卫生部门或国家卫生机构运营的那些网站)获得。
由上下文信息确定器2616确定的信息可以存储在个人记录240中,并且在一些实施例中,该信息可以存储在关系数据库中,使得上下文信息与特定的话音样本或根据该话音样本确定的特定音素特征向量相关联,该话音样本也可以存储在个人记录240中。
如上面所描述的,用户话音监视器260可以通常负责从用户的话音的音频样本获得相关声学信息。该数据的收集可能涉及指导与用户的交互。因此,系统200的实施例还可以包括用户交互管理器280,以促进对用户数据的收集,包括获得话音样本和/或用户症状信息。因此,用户交互管理器280的实施例可以包括用户指令生成器282、自我报告工具284和用户输入响应生成器286。用户交互管理器280可以结合用户话音监视器260(或其子组件中的一个或多个)、呈现组件220以及在一些实施例中如本文稍后所描述的自我报告数据评估器276来工作。
用户指令生成器282可以通常负责引导用户提供话音样本。用户指令生成器282可以向用户提供(例如,促进经由图形用户界面显示(例如,图5A的示例中所示)或经由音频或话音用户界面说话(例如,图4C的示例交互中所示))用于捕获话音数据的过程。此外,用户指令生成器282可以为用户朗读和/或说出指令231(例如,“请说‘aaa’5秒。”)。指令231可以是预编程的并且特定于音素、话音相关数据或从预期来自用户的其他用户信息。在一些实例中,指令231可以由用户的临床医生或护理人员确定。以这种方式,根据一些实施例,指令231可以特定于用户(例如,作为患者的治疗的一部分)和/或特定于呼吸道感染或药物。可替代地或另外地,可以自动生成(例如,合成或组装)指令231。例如,可以基于确定关于特定音素的特征信息是确定用户的呼吸道状况所需要或有帮助的而生成请求特定音素的指令231。类似地,预定的指令231或操作的集合可以被提供(例如,来自临床医生、护理人员,或被编程到决策支持应用(例如,105a或105b)中)并用于为用户组装特定的或定制的指令。
预编程的或生成的指令231可以涉及执行特定语音相关任务,例如,在设定的持续时间内说出特定音素、说出并尽可能长时间地保持特定音素、说出特定单词或单词的组合或者大声朗读段落。在其中请求用户大声朗读段落的一些实施例中,可以向用户提供该段落的文本,使得用户可以大声朗读所提供的段落。另外地或可替代地,段落的部分可以被可听地输出给用户,使得用户可以重复该可听段落而不朗读文本。在一个实施例中,请求用户大声说出(通过朗读书面文本或重复口头指令)预定的语音平衡的段落(例如,彩虹段落),并且可以请求用户朗读段落的特定部分,例如,彩虹段落的五行。在一些实例中,可以给用户预定的时间量(例如,两分钟)以完成朗读文章。
在一些实施例中,指令231可以提供针对被指示为要由用户提供的音素的样本声音。在一些实施例中,用户指令生成器282可以仅提供针对用于呼吸道状况分析的音素或声音的指令231,这可以包括仅提供指令231的一部分。例如,在用户话音监视器260尚未获得包括给定时间帧的特定音素的话音样本的情况下,用户指令生成器282可以提供指令231以促进获得具有该音素信息的话音样本。描绘并进一步结合图4A、图4B和图5B描述了示出可以由用户指令生成器282(或用户交互管理器280)提供的指令231的附加示例。
用户指令生成器282的一些实施例可以提供针对特定用户定制的指令231。因此,基于特定用户的健康状况、临床医生的医嘱、处方或针对用户的推荐、用户的人口统计数据或EHR信息(例如,如果确定用户是吸烟者,则修改指令),或基于先前从用户捕获的话音/音素信息,用户指令生成器282可以生成指令231。例如,对由用户提供的先前音素的分析可以指示在呼吸道感染的全部或部分期间(例如,在恢复期间)表现更多改变的特定音素。另外地或可替代地,可以确定用户具有这样的呼吸道状况:与其他特征相比,通过一些音素特征更容易检测或跟踪该呼吸道状况。在这些实例中,用户指令生成器282的实施例可以指示用户捕获该感兴趣的音素的附加样本,或者可以生成或修改指令231以移除(或不提供)用于获得具有对该特定用户不那么有用的音素的话音样本的指令。在用户指令生成器282的一些实施例中,可以基于对用户的呼吸道状况的先前确定(例如,用户是否生病或正在恢复)来修改指令231。
自我报告工具284可以通常负责引导用户提供可能与他们的呼吸道状况相关的数据和其他上下文信息。自我报告工具284可以与自我报告数据评估器276和数据收集组件210接合。自我报告工具284的一些实施例可以与用户指令生成器282结合操作,以提供指令231来引导用户提供用户相关数据。例如,自我报告工具284可以利用指令231来提示用户提供关于用户正在经历的与呼吸道状况相关的症状的信息。在一个实施例中,自我报告工具284可以提示用户对症状的集合内的每个症状的严重性进行评级,该症状的集合可以是充血相关的或非充血相关的。另外地或可替代地,自我报告工具284可以利用指令231或要求用户提供关于该用户的健康或他总体感觉如何的信息。在一个实施例中,自我报告工具284可以提示用户指示鼻后流涕、鼻塞、流鼻涕、带粘液的浓鼻涕、咳嗽、喉咙痛和需要擤鼻涕的严重性。在一些实施例中,自我报告工具284可以包括用户界面元件,以促进提示用户或从用户接收数据。例如,用于提供自我报告工具284的GUI的方面在图5D和图5E中描绘。示出用于提供自我报告工具284的话音用户界面(VUI)的方面的示例用户交互在图4D、图4E和图4F中描绘。
在一些实施例中,自我报告工具284可以利用指令231提示用户一天多次提供症状或一般状况输入,并且所请求的输入可以基于一天中的时间而变化。在一些实施例中,输入时间可以对应于获得用户话音样本的时间帧或会话。在一个示例中,自我报告工具284可以提示用户在早上对19个症状的感知严重性进行评级,并且在晚上对16个症状的感知严重性进行评级。另外地或可替代地,自我报告工具284可以提示用户在早上回答四个睡眠相关问题并在晚上回答一个一天结束时的疲倦度问题。下表示出了针对用户输入的提示的示例列表,这些提示可以由自我报告工具284利用指令231确定并由自我报告工具284或用户交互管理器280的其他子组件输出。
在一些实施例中,自我报告工具284可以基于用户的检测到的音素特征(即,基于可疑的呼吸道状况)、先前捕获的音素数据和/或其他自我报告输入来提供后续问题或提供后续提示。在一个示例性实施例中,如果对音素特征的分析指示用户可能正在发展呼吸道感染或仍在从呼吸道感染中恢复,则自我报告工具284可以促进提示用户报告症状。例如,可以利用指令231和/或与用户交互管理器280结合操作的自我报告工具284可以询问用户关于用户的症状(或显示征求用户的症状的请求)。在该实施例中,可以询问用户关于用户感觉如何的问题,例如“您是否感到充血?”。在类似的示例中,如果用户报告用户充血或具有特定症状,则自我报告工具284可以通过询问“在1-10的范围内,您的充血程度如何?”或提示用户提供该后续细节来跟进。
在一些实施例中,自我报告工具284可以包括使用户能够通信地耦合可穿戴设备、健康监视器或生理传感器以促进自动收集用户的生理数据的功能。在一个这样的实施例中,数据可以由上下文信息确定器2616或系统200的其他组件接收,并且可以存储在个人记录240中。在一些实施例中,如先前所描述的,从自我报告工具284接收到的该信息可以存储在关系数据库中,使得其与特定话音样本或根据从会话获得的话音样本确定的特定音素特征向量相关联。在一些实施例中,基于接收到的生理数据,自我报告工具284可以提示或请求用户自我报告症状信息,如上面所描述的。
根据各种实施例,用户输入响应生成器286可以通常负责向用户提供反馈。在一个这样的实施例中,用户输入响应生成器286可以分析用户对用户数据的输入(例如,语音或话音记录),并且可以与用户指令生成器282和/或样本记录审计器2608结合操作,以基于用户的输入向用户提供反馈。在一个实施例中,用户输入响应生成器286可以分析用户的响应以确定用户是否提供了良好的话音样本,然后向用户提供该确定的指示。例如,可以向用户提供绿灯、对勾、笑脸、竖起大拇指、铃声或啁啾声或者类似的指示符,以指示所记录的样本是良好的。同样地,可以提供红灯、皱眉脸、蜂鸣声或类似的指示符来通知用户样本是不完整或有缺陷的。在一些实施例中,用户输入响应生成器286可以确定用户是否未能遵守来自用户指令生成器282的指令231。如果检测到问题,用户输入响应生成器286的一些实施例可以调用聊天机器人软件代理以向用户提供上下文中的帮助或协助。
如果先前话音样本的声音水平或其他声学特性不足、背景噪声太多、或者样本中记录的声音不够长,则用户输入响应生成器286的实施例可以通知用户。例如,在用户提供初始话音样本之后,用户输入响应生成器286可以输出“我没有听到;请再试一次。请说‘aaaa’5秒”。在一个实施例中,用户输入响应生成器286可以指示用户在记录期间应该尝试实现的响度水平和/或向用户提供关于话音样本是否可接受的反馈,其可以根据样本记录审计器2608来确定。
在一些实施例中,用户输入响应生成器286可以利用用户界面的方面来向用户提供关于声音级别、背景噪声或获得话音样本的定时持续时间的反馈。例如,可以使用视觉或音频倒计时时钟或定时器以用信号通知用户何时开始或停止说话以记录话音样本。定时器的一个实施例被描绘为图5A中的GUI元素5122。用于提供用户输入响应的类似示例被描绘为图5B中的GUI元素5222,该GUI元素5222包括定时器和背景噪声的指示符。其他示例(未示出)可以包括用于音频输入级别、背景噪声、改变单词颜色的GUI元素或者随着单词被说出而沿着用户朗读的单词跳跃的球,或者类似的音频或视觉指示符。
用户输入响应生成器286可以向用户提供特定的语音相关任务(例如,发声)或话音会话的进展的指示。例如,如上面所描述的,用户输入响应生成器286可以对(显示在图形用户界面上或通过音频用户界面的)用户提供持续语音的秒数进行计数,或者可以告诉用户何时开始和/或停止。用户输入响应生成器286(或用户指令生成器282)的一些实施例可以提供关于要完成的语音相关任务或对于特定会话、时间帧或一天已经完成的语音相关任务的指示。
如先前所描述的,用户输入响应生成器286的一些实施例可以为用户生成可视指示符,使得用户可以看到所提供的话音样本的反馈,例如,关于样本的音量水平、样本是否可接受和/或样本是否被正确捕获的指示符。
利用由用户话音监视器260(独立地或结合用户交互管理器280)或呼吸道状况跟踪器270收集和确定的话音信息可以确定关于用户的呼吸道状况的信息和/或关于用户的未来呼吸道状况的预测。在一个实施例中,呼吸道状况跟踪器270可以接收与特定时间或时间帧相关联的音素特征集(例如,一个或多个音素特征向量),并且该音素特征集可以利用日期和/或时间信息进行时间戳。例如,音素特征集可以从用户话音监视器260或从与用户相关联的个人记录240(例如,音素特征向量244)接收。如本文所描述的,与音素特征集相关联的时间信息可以对应于从用户获得用于确定音素特征集的话音样本(或话音相关数据)的日期和/或时间。呼吸道状况跟踪器270还可以接收与根据其确定音素特征的音频记录或话音样本相关的上下文信息,该上下文信息还可以从个人记录240和/或用户话音监视器260(或具体地,上下文信息确定器2616)接收。呼吸道状况跟踪器270的实施例可以利用一个或多个分类器来基于音素特征集(向量)以及在一些实施例中基于上下文信息来多次生成用户可能存在的呼吸道状况的分数或确定。另外地或可替代地,呼吸道状况跟踪器270可以利用预测器模型来预测用户未来可能的呼吸道状况。呼吸道状况跟踪器270的实施例可以包括特征向量时间序列组装器272、音素特征比较器274、自我报告数据评估器276和呼吸道状况推断引擎278。
特征向量时间序列组装器272可以用于为用户组装连续音素特征向量(或特征集)的时间序列。可以根据与特征向量相关联的时间信息(或时间戳)以时间次序或反时间次序组装时间序列。在一些实施例中,时间序列可以包括针对为用户或个人收集的话音样本生成的所有音素特征向量、针对在其中个人生病(即,患有呼吸道感染)的时间间隔内收集的样本生成的音素特征向量、或与设定或预定时间间隔(例如,过去3-5周、过去两周或过去一周)内的时间相关联的音素特征向量。在其他实施例中,时间序列仅包括两个特征向量。在一个这样的实施例中,时间序列的第一音素特征向量可以根据对应的时间戳与近期的时间段或时刻相关联,并因此表示关于用户当前呼吸道状况的信息,而第二特征向量可以与较早的时间段或时刻相关联。在一些实施例中,较早的时间段对应于用户的呼吸道状况与近期的时间段或时刻不同的时间间隔(即,用户生病或健康的时间)。
此外,音素特征比较器274可以通常负责针对用户确定音素特征向量244中的差异(或不同特征集中的特征的值的差异)。音素特征比较器274可以通过比较两个或更多个音素特征向量来确定差异。例如,可以在与任何两个不同时刻或时间段相关联的音素特征向量244之间执行比较,或者在与近期的时间段或时刻相关联的特征向量和与较早的时间段或时刻相关联的特征向量之间执行比较。每个比较的音素特征集(或向量)可以与不同的时间段或时刻相关联,使得由音素特征比较器274进行的比较可以提供关于跨不同时间段或时刻的特征的改变(表示用户的呼吸道状况的改变)的信息。在一些实施例中,预期要比较的两个或更多个特征向量可以具有相同的持续时间或者每个向量具有用于比较的对应特征(即,相同的维度)。在一些实例中,可以仅比较特征向量的一部分(或特征的子集)。在一个实施例中,音素特征比较器274可以使用多个特征向量(其可以包括三个或更多个向量,其中每个向量与不同的时间段或时刻相关联),以执行表征在跨越不同时间段或时刻的时间帧上的特征改变的分析。例如,该分析可以包括确定改变速率、回归或曲线拟合、聚类分析、判别分析或其他分析。如先前所描述的,尽管术语“特征集”和“特征向量”在本文中可以可互换地使用以促进执行特征集之间的比较,但是特征集的各个特征可以被认为是特征向量。
在一些实施例中,可以在近期的时间段或时刻的特征向量(例如,根据最近期获得的话音样本确定的特征向量)与对应于多个较早时间段或时刻的特征向量的平均值或综合(例如,基于多个先前特征向量或话音样本的车厢(boxcar)移动平均值)之间执行比较。在一些实例中,平均值可以考虑多达与用户的先前时间段或时刻相关联的特征向量(例如,来自对应于获得话音样本的10个先前会话的特征向量的平均值)或来自预定的较早的时间间隔(例如,过去一周或两周)的特征向量的最大数量。音素特征比较器274可以可替代地或另外地将近期时间间隔的用户的特征向量与音素特征基线进行比较,如本文进一步描述的,该音素特征基线可以基于用户或其他用户,例如,总体人口或类似于被监视用户的其他用户(例如,具有类似呼吸道状况的人群或类似于被监视用户的其他人群)。此外,在一些实例中,比较可以利用关于基线(或在不利用基线的实施例中是关于特征集)的统计信息,例如,对应于基线(或对应于特征集)的特征集的统计方差或标准差。在一些实施例中,可以考虑采用平均值,特别是滚动平均值或移动平均值,作为对先前特征向量(即,对应于从较早时间段或时刻获得的话音样本的特征向量)进行的平滑函数来操作。以这种方式,可以使较早样本中可能发生的不考虑为呼吸道感染的话音相关数据的变化(例如,无论话音样本是在早上用户第一次醒来时、在漫长第一天的结束时还是在用户已经大声欢呼或唱歌后的时间获得的)最小化。还设想音素特征比较器274的一些实施例可以将近期特征向量的平均值与较早特征向量的平均值或与单个较早时间段或时刻相关联的特征向量进行比较。类似地,可以在近期特征的特征值(或特征值的一部分)中确定统计方差,并将该统计方差与较早特征值(或其部分)的方差进行比较。
音素特征比较器274的一些实施例可以利用音素特征比较逻辑235来确定音素特征向量的比较。音素特征比较逻辑235可以包括计算机指令(例如,函数、例程、程序、库等),并且可以包括但不限于一个或多个规则、条件、过程、模型或用于执行特征或特征向量的比较或者用于促进比较或比较的处理以进行解释的其他逻辑。在一些实施例中,由音素特征比较器274利用音素特征比较逻辑235来计算音素特征向量的距离度量或差异测量。在示例性方面,距离测量可以被视为量化用户的话音信息的声学特征空间随时间经过的改变。以这种方式,可以基于在两次或更多次获得用户的话音信息之间在声学特征空间(例如,音素特征)中检测到的可量化改变,来观察和量化用户的呼吸道状况的改变。在一个实施例中,音素特征比较器274可以确定两个特征向量(或特征向量的平均值)的Euclidian测量或L2距离,以确定距离测量。在一些实例中,音素特征比较逻辑235可以包括用于在比较操作之前或作为比较操作的一部分,在多维向量的情况下执行平坦化、归一化或其他处理操作的逻辑。在一些实施例中,音素特征比较逻辑235可以包括用于执行其他距离度量(例如,Manhattan距离)的逻辑。例如,Mahalanobis距离可以用于确定在近期特征向量和与较早时间段或时刻相关联的特征向量的集合之间的距离。在一些实施例中,例如,对于比较大声朗读段落的用户的实现方式,可以确定Levenshtein距离。例如,根据实施例,语音到文本算法可以用于根据用户对段落的朗诵生成文本。可以确定一个或多个条目的时间序列,该时间序列包括段落的音节或单词以及用户何时朗读这些单词的对应时间戳。时间序列(或时间戳)信息可以用于生成特征向量(或以其他方式可以用作特征),以(例如,使用Levenshtein距离算法)与以类似方式确定的基线特征向量进行比较。
在一些实施例中,可以针对个人的多对时间确定音素特征差异(或距离度量)。例如,可以计算从最近期的一天的音素特征向量到最近期的一天之前的一天的音素特征向量之间的距离,和/或可以计算从最近期的一天的音素特征向量到来自一周前收集的样本的音素特征向量或到表示基线的音素特征向量之间的距离。此外,在一些实施例中,可以针对不同音素特征向量或特征计算不同类型的距离测量。
在一些实施例中,音素特征差异(或距离度量)可以指示特定声学特征在时间段或时刻上的差异。例如,音素特征比较器274可以针对音素/n/的谐度计算距离度量,并且可以针对音素/m/的微扰计算另一距离度量。另外地或可替代地,可以确定声学特征的组合在时间段或时刻上的距离度量(或改变的指示)。
在一些实施例中,音素特征比较逻辑235(或音素特征比较器274)包括用于针对用户生成或利用特征基线的计算机指令。基线可以表示用户的健康状态、生病状态(例如,流感状态或呼吸道感染状态)、恢复状态或任何其他状态。其他状态的示例可以包括用户在一时刻或时间间隔(例如,30天前)处的状态;与事件相关联的(例如,在手术或受伤之前)用户的状态;根据条件的用户的状态(例如,从用户服药时开始的用户的状态,或者在用户生活在污染城市期间时的用户的状态);或与其他标准相关联的状态。例如,可以利用与用户健康时的一个或多个时间间隔(例如,天)相对应的一个或多个特征集来确定针对健康状态的基线。
基于多个特征集(其中每个特征集对应于不同的时间间隔)确定的基线在本文可以称为多参考或多天基线。在一些实例中,多参考基线包括多个或多组特征集,每个特征集对应于不同的时间间隔。可替代地,多参考的基线可以包括基于来自多个时间间隔的多个特征集中的单个代表性特征集(例如,包括来自不同时间段或时刻的特征集值的平均值或综合,如先前所描述的)。在一些实施例中,基线可以包括关于特征的统计或补充数据或元数据。例如,基线可以包括特征集(其可以代表多个时间间隔)和统计方差、或者特征值的标准差,其中使用多个特征集(例如,多参考基线)。补充数据可以包括上下文信息,该上下文信息可以与用于确定基线的特征集的时间间隔相关联。元数据可以包括关于用于确定基线的特征集的信息,例如,关于在时间间隔处用户的呼吸道状况的信息(例如,用户是健康的、生病的、正在恢复的等等)、或者关于基线的其他信息。在一些实施例中,可以确定基线的集合以基于各种标准执行不同的比较,如本文所描述的。
对根据收集的话音样本生成的特征向量与针对特定状态的基线的比较可以指示用户的状况或状态如何与已知的状况或状态进行比较。在示例性实施例中,针对特定用户确定基线,使得与基线的比较将指示用户的状况或状态是否已经改变。可替代地或另外地,可以针对一般人群或从类似用户的群体中确定基线。在一些实施例中,不同类型的基线用于不同的特征集。例如,可以将一些特征与特定于用户的基线进行比较,而可以将其他特征与根据来自个人群体的数据确定的标准基线进行比较。在一些实施例中,用户可以(例如,经由设置249)指定用于确定基线的特定话音样本、日期或时间间隔。例如,用户可以经由GUI(例如,通过在日历上选择与用户的已知状态或状况相对应的天)指定日期或天的范围,并且还可以提供关于已知状态或状况的信息(例如,“请选择至少一个您健康的较早日期”)。类似地,在获得话音样本的记录会话期间,用户可以指示应该使用话音样本来确定基线,并且可以提供用户的状况或状态的对应指示。例如,可以在记录会话期间呈现GUI复选框,以使用样本作为针对健康(或生病或恢复)状态的基线。
在一些实施例中,音素特征比较逻辑235可以包括用于生成和利用多天或多参考基线的计算机指令。例如,多天基线可以是滚动的或固定的。具体地,通过执行对近期特征向量与该基线的比较,音素特征比较器274可以确定指示用户的呼吸道状况已经改变以及用户是生病还是健康的信息。关于基于由音素特征比较器274执行的比较来确定用户呼吸道状况的细节结合呼吸道状况推断引擎278来描述。类似地,音素特征比较逻辑235可以包括用于利用近期音素特征向量和较早向量的集合(或多参考基线)执行多个比较的指令,以及用于将差异测量值相互比较的指令,从而可以(例如,由呼吸道状况推断引擎278)确定用户的呼吸道状况已经改变,并且还确定用户是生病(或健康)的或用户的状况正在变好或变坏。结合呼吸道状况推断引擎278描述执行多个比较的附加细节,多个比较包括对距离测量的比较。
在一些实施例中,当获得关于用户的更多信息时,可以动态地自动定义基线。例如,当用户的话音信息中的正常可变性(normal variability)随时间改变时,用户的基线也可以改变以反映用户当前的正常可变性。一些实施例可以利用自适应基线,该自适应基线可以根据近期的特征集或多个近期的特征集(对应于多个时间间隔(例如,天))确定,并且在确定适合基线标准(例如,健康、生病、正在恢复)的新特征集时更新。例如,用于自适应基线的多个特征集可以跟随先进先出(FIFO)数据流,使得来自较旧时间的特征集不再被考虑,因为用于基线的新特征集(例如,来自最近几天)被确定。以这种方式,由于自适应基线,可以排除用户话音中可能发生的较小变化或缓慢改变和适应。在利用自适应基线的一些实施例中,可以在应用设置(例如,设置249)中配置针对基线的参数(例如,要包括的特征集的数量或针对要包括的近期特征集的时间窗口)。在其中将来自多个时间间隔(例如,天)的特征集用于基线的实施例的一些实例中,最近期确定的特征集可以被加权以携带更多的重要性,使得基线是最新的。可替代地或另外地,对应于较早时间段或时刻的较旧(即,“陈旧”)特征集可被加权以随时间衰减或对基线贡献较少。
在一些实施例中,用户的基线内的特定特征可以针对该特定用户定制。以这种方式,不同的用户可以在其相应的基线内具有音素特征的不同组合,因此,不同的音素特征可以被确定并用于监视每个用户的呼吸道状况。例如,在第一用户的健康话音样本中,特定声学特征(通常的或对于特定音素的)可以自然波动,使得该特征对于检测用户的呼吸道状况的改变可能没有用,而该特征对于另一用户可能是有用的并包含于基线中。
在一些实施例中,用户的基线可以与诸如天气、一天中的时间和/或季节(即,一年中的时间)之类的上下文信息相关。例如,可以根据在高湿度时段期间记录的样本创建用户的基线。该基线可以与根据高湿度时段期间记录的样本创建的音素特征向量进行比较。相反,可以将不同的基线与根据相对低湿度时段期间获得的样本创建的音素特征向量进行比较。以这种方式,可以为给定用户确定多个基线并在不同的上下文中使用。
此外,在一些实施例中,可以不为特定用户确定基线,而是为特定人群(例如,共享公共特性集合的个人)确定基线。在示例性实施例中,基线可能特定于呼吸道状况,因为可以利用来自已知具有相同呼吸道状况(例如,流感、鼻病毒、COVID-19病毒、哮喘、慢性阻塞性肺疾病(COPD)等)的个人的数据来确定基线。在其中可以在获得关于用户的更多信息时动态地定义基线的一些实施例中,可以提供基于来自与用户相似的群体或人群的音素特征数据的初始基线。随着时间的推移,当确定用户的更多音素特征集时,可以使用该用户的音素特征集来更新基线,从而使针对该用户的基线个性化。
呼吸道状况跟踪器270的一些实施例可以包括自我报告数据评估器276,其可以从用户收集自我报告信息,该自我报告信息可以是相关的或考虑用于用户诊断(例如,确定用户当前的呼吸道状况)和/或预测未来状况。自我报告数据评估器276可以从自我报告工具284和/或上下文信息确定器2616收集该信息。该信息可以是关于用户当前的感觉或用户的当前状况的用户提供的数据或用户导出的数据(例如,来自指示温度、呼吸速率、血氧等的传感器)。在一个实施例中,该信息包括与呼吸道状况相关的用户自我报告的各种症状的感知严重性。例如,信息可能包括针对鼻后流涕、鼻塞、流鼻涕、带粘液的浓鼻涕、咳嗽、喉咙痛和需要擤鼻涕的用户的严重性分数。
自我报告数据评估器276可以利用输入数据来确定指示呼吸道状况或症状的严重性的症状分数。例如,自我报告数据评估器276可以输出可以通过组合针对多个症状的分数来计算的综合症状分数(CSS)。可以对单独的症状分数进行求和或平均以获得综合症状分数。例如,在一个实施例中,可以通过对七个呼吸道状况相关症状的症状分数(范围从0-5)进行求和来确定综合症状分数,从而产生范围在0-35之间的综合症状分数。较高的症状分数可以表示更严重的症状。在一个实施例中,症状可以包括鼻后流涕、鼻塞、流鼻涕、带粘液的浓鼻涕、咳嗽、喉咙痛和需要擤鼻涕。在一些实施例中,可以针对所有症状(例如,充血相关症状和非充血相关症状)生成单独的症状分数。
在一些实施例中,自我报告数据评估器276可以将确定出的症状分数与根据话音样本确定的音素特征进行关联,该话音样本对应于与生成分数的用户输入相同的时间窗口。在其他实施例中,自我报告数据评估器276可以将症状分数与音素特征向量或通过比较音素特征向量确定的距离度量相关。通过拟合指数衰减模型并将声学特征值与衰减速率相关,可以将症状分数(例如,针对所有症状(包括充血相关症状或非充血相关症状)的综合症状分数)与音素特征相关。衰减模型可用于估计症状改变的幅度和速率。在一个实施例中,score~ae-b(day-1)+∈用于指数衰减模型,其中a表示变化幅度,b表示衰减速率。指数衰减模型可以使用非线性混合效应模型来实现,其中主题是R系统(用于统计计算的R项目,可通过综合R档案网络(CRAN)访问)的nlme包(版本3.1.144)中的随机效应。在音素特征向量和症状分数之间以及在音素特征向量和或导出的距离度量之间的相关性的示例在图9和图11A-图11B中分别描绘。由自我报告数据评估器276生成的症状分数,以及在一些实施例中与音素特征向量或距离测量的关联和/或相关性可以存储在用户的个人记录240中。
在一些实施例中,基于检测到的改变(例如,用户的状况正在恶化)而发起自我报告,或者当用户已经生病时发起自我报告。自我报告的发起也可以基于用户设置偏好,例如,个人记录240中的设置249。在一些实施例中,基于从用户收集的话音样本中检测到的呼吸道状况来发起自我报告。例如,自我报告数据评估器276可以基于从话音分析中对用户状况的检测来确定或提示用户获得自我报告症状信息,该话音分析可以基于由音素特征比较器274执行的对特征向量的比较来确定。
此外,呼吸道状况推断引擎278可以通常负责确定或推断用户当前的呼吸道状况和/或预测用户未来的呼吸道状况。该确定可以基于用户的声学特征,包括在特征值中检测到的改变。因此,呼吸道状况推断引擎278可以接收关于用户的音素特征和/或检测到的特征改变(其可以被确定为距离度量)的信息。呼吸道状况推断引擎278的一些实施例还可以利用可以由上下文信息确定器2616确定的上下文信息,和/或用户的自我报告数据或对自我报告数据的分析,例如,由自我报告数据评估器276确定的综合症状分数。在一个实施例中,最大发声时间或用户维持一个或多个特定音素(例如,/a/)、另一个基本元音发声或其他发声的持续时间可以由呼吸道状况推断引擎278用作用户呼吸道状况的指示符。例如,短的最大发声时间可能指示呼吸急促和/或肺活量下降,这可能与恶化的呼吸道状况相关联。此外,呼吸道状况推断引擎278可以将声学特征与一个或多个基线进行比较,以确定用户的呼吸道状况。例如,可以将用户的最大发声时间与用户的基线最大发声时间进行比较,以确定用户的呼吸量是增加还是减少,其中减少的最大发声时间可以指示恶化的呼吸道状况。类似地,从预定持续时间的话音样本中提取的音素中浊音帧的百分比的减少可能指示恶化的呼吸道状况。对于段落朗读话音样本,通过检查但不限于以下特征可以指示恶化的呼吸道状况:说话速率的降低、平均停顿长度的增加、停顿计数的增加和/或全局SNR的降低。可以通过将例如本文所描述的近期样本与诸如特定于用户的基线之类的基线进行比较来完成确定这些改变中的任何一个。
呼吸道状况推断引擎278可以利用该输入信息来生成表示用户当前呼吸道状况和/或未来状况(即,预测)的一个或多个呼吸道状况分数或分类。来自呼吸道状况推断引擎278的输出可以存储在用户的个人记录240的结果/推断状况246中,并且可以呈现给用户,如结合图5C的示例GUI 5300所描述的。
在一些实施例中,呼吸道状况推断引擎278可以确定呼吸道状况分数,其对应于在用户呼吸道状况中检测到的量化改变。可替代地或另外地,呼吸道状况分数或对用户的呼吸道感染状况的推断可以基于一个或多个特定音素特征的检测值(即,单个读数,而不是改变),或者基于一个或多个特定特征值、检测到的特征值的改变和不同改变率的组合。在一个实施例中,呼吸道状况分数可以指示用户具有(或不具有)呼吸道状况(例如,通常对于任何状况或对于特定的呼吸道感染)的可能性或概率。例如,呼吸道状况分数可以指示用户有60%的可能性患有呼吸道感染。在一些方面,呼吸道状况分数可以包括综合分数或分数的集合(例如,用户具有呼吸道状况的集合的概率的集合)。例如,呼吸道状况推断引擎278可以生成特定呼吸道状况的向量,其具有用户具有状况中的每种状况的可能性,例如,过敏,0.2;鼻病毒,0.3;COVID-19,0.04;诸如此类。可替代地或另外地,呼吸道状况分数可以指示用户的当前状况与已知健康状况的差异,或者可以基于用户的当前状况与用户的基线或健康状况的比较,如本文所描述的。
在许多实例中,当用户没有感觉到症状时,呼吸道状况推断引擎278可以确定(或者呼吸道状况分数可以指示)与用户的健康状态的改变或差异(或者呼吸道感染的概率)。与依赖主观数据的常规技术相比,这种能力是一种优势和改进。另一方面,本文提供的技术的实施例可以在用户感觉到症状之前检测呼吸道感染的发作,而不是依赖于主观数据。通过提供比常规方法更早的对呼吸道感染的警告,这些实施例对于对抗基于呼吸道的流行病(例如,SARS-CoV-2(COVID-19))可能特别有用。例如,指示可能感染的呼吸道状况分数(或通过呼吸道状况推断引擎278确定用户的呼吸道状况)可以通知用户比其他情况下更早地自我隔离、保持社交距离、戴口罩或采取其他预防措施。
在一些实施例中,可以指示或对应于用户具有呼吸道感染的概率的呼吸道状况分数可表示为相对于用户的健康状态的值。例如,呼吸道状况分数为100分中90分(100表示健康状态)可以指示检测到的用户呼吸道状况的改变是用户正常或健康状态的90%(即,10%的改变)。在该示例中,在呼吸道状况分数为90的情况下用户可能感到健康,但该分数可能表明用户正在发展呼吸道感染(或仍在从呼吸道感染中恢复)。类似地,呼吸道状况分数为20可以指示用户可能生病(即,用户可能患有呼吸道感染),而呼吸道状况分数为40也可以指示用户可能生病,但不太可能(或可能不如)呼吸道状况分数为20所指示的那样生病。例如,在呼吸道状况分数对应于概率的情况下,呼吸道状况分数为20可以指示用户具有比呼吸道状况分数为40更高的感染概率。但是,在呼吸道状况分数反映用户当前状态与健康基线之间的差异的情况下,呼吸道状况分数40可以对应于比呼吸道状况分数为20从基线检测到的改变更小,并且因此可以指示用户可能没有那样生病。在一些实例中,不同于或除了数字外,可以使用颜色或符号来指示用户的呼吸道状况分数。例如,绿色可以指示用户是健康的,而黄色、橙色和红色可以表示与用户健康状态的差异越来越大,这可以指示用户患有呼吸道感染的可能性越来越大。类似地,表情符号(例如,微笑与皱眉头或生病脸)可以用于表示呼吸道状况分数。
应当理解,本文的实施例可用于基于音素特征信息(包括音素特征的改变)以及在一些实施例中还基于上下文信息(例如,测量的生理数据)和/或来自用户的自我报告症状分数来表征用户的呼吸道感染状态。因此,在一些实例中,严重的呼吸道感染和轻微的呼吸道感染两者可能表现出相同的音素特征(或特征的改变)。因此,在这些实例中,不同的呼吸道状况分数可能对于指示用户“病情较重”或“病情较轻”不是有用的,而是可能仅指示用户具有(或不具有)呼吸道感染(即,二进制指示)或指示用户生病的概率,或者可以表示用户当前状态与健康状态之间的差异,这可以指示呼吸道感染的迹象。
此外,当与用户对呼吸道感染的治疗(可作为上下文信息接收)(例如,服用处方药)相关时,监视呼吸道状况分数的改变可指示治疗的疗效。例如,被诊断为具有呼吸道感染的用户由他们的临床医生开出抗生素,并被指示使用他们的智能电话上的呼吸道感染监视应用,例如,结合图5A描述的呼吸道感染监视应用5101。初始呼吸道状况分数(或呼吸道状况分数的第一集合)可以根据收集的用户话音样本确定,如本文所描述的。在一段时间间隔(例如,一周)之后,第二呼吸道状况分数可以指示用户呼吸道状况的改变。指示用户状况正在改善的改变(可以如下所述确定)可能暗示抗生素正在起作用。指示用户状况没有改善或保持不变的改变可能暗示抗生素不起作用,在这种情况下,用户的临床医生可能希望开出不同的治疗。以这种方式,本文所描述的技术的实施例可以确定目标(例如,关于用户呼吸道状况的改变的可量化信息),可以更仔细和更谨慎地使用为治疗呼吸道感染而开出的抗生素,从而延长它们的疗效并最小化抗微生物耐药性。
在一些实施例中,呼吸道状况推断引擎278可以利用用户状况推断逻辑237来确定呼吸道状况分数或作出关于用户呼吸道状况的推断和/或预测。用户状况推断逻辑237可以包括用于根据话音相关数据推断和/或预测可能的呼吸道状况的规则、条件、关联、机器学习模型或其他标准。用户状况推断逻辑237可以取决于所使用的机构和预期输出来采取不同的形式。在一个实施例中,用户状况推断逻辑237可以包括用于确定或推断用户当前(或近期)呼吸道状况的一个或多个分类器模型和/或用于预测用户未来可能的呼吸道状况的一个或多个预测器模型。分类器模型的示例可以包括但不限于决策树或随机森林、朴素贝叶斯、神经网络、模式识别模型、其他机器学习模型、其他统计分类器或组合(例如,总体)。在一些实施例中,用户状况推断逻辑237可以包括用于执行聚类或无监督分类技术的逻辑。预测模型的示例可以包括但不限于回归技术(例如,线性或逻辑回归、最小二乘法、广义线性模型(GLM)、多元自适应回归样条(MARS)或其他回归过程)、神经网络、决策树或随机森林、或其他预测模型或模型的组合(例如,总体)。
如上所述,呼吸道状况推断引擎278的一些实施例可以确定用户具有或发展为呼吸道感染的概率。在一些实例中,概率可以基于用户的声学特征,包括在特征中检测到的改变和分类器或预测模型的输出,或者满足的规则或条件。例如,根据实施例,用户状况推断逻辑237可以包括用于基于满足特定阈值(例如,如本文所述的状况改变阈值)的音素特征值的改变或基于一个或多个音素特征值发生的检测到的改变程度来确定呼吸道感染的概率的规则。在一个实施例中,用户状况推断逻辑237可以包括用于解释在用户当前呼吸道状况与基线之间的检测到的变化或差异以确定用户具有呼吸道感染的可能性的规则。在另一实施例中,对用户呼吸道状况的多个近期评估(即,从近期时间到较早时间的多个比较)可以对概率做出贡献。通过示例而非限制的方式,如果用户连续两天显示呼吸道状况的改变,则与仅在一天后显示改变的用户相比,可以提供更高的呼吸道感染概率。在一个实施例中,可以将检测到的改变和/或改变速率与特定呼吸道感染的已知音素特征改变的一个或多个模式的集合或应用于特征改变并且对应于已知呼吸道感染的阈值的集合进行比较,以及基于比较确定感染的可能性。此外,在一些实施例中,用户状况推断逻辑237可以利用上下文信息(例如,生理信息或关于呼吸道感染疾病的区域爆发的信息),以确定用户具有呼吸道感染的概率。
用户状况推断逻辑237可以包括计算机指令和规则或条件,以执行对声学特征信息的确定出的改变(例如,特征集值、特征向量距离测量和其他数据的改变)或声学特征信息的确定改变速率与一个或多个阈值的比较,该一个或多个阈值在本文可以被称为状况改变阈值。例如,可以将分别对应于近期和较早时间间隔的两个特征向量的距离测量与状况改变阈值进行比较。状况改变阈值可用作检测器(例如,作为离群值检测器),使得基于比较,如果满足(例如,超过)阈值,则认为检测到用户呼吸道状况的改变。可以确定状况改变阈值,使得可以检测到用户的状况的有意义的改变,但是不将微小的变化(其是微不足道的,但的确发生了改变)检测为(或确定为)用户呼吸道状况的改变。例如,利用多天基线的一些实施例可以采用被确定为多天基线特征值的两个标准差的状况改变阈值,如本文进一步描述的。
在一些实施例中,状况改变阈值特定于用户状况的状态(例如,感染或未感染),并且如果在特征向量之间的改变的幅度满足状况改变阈值,则可以确定用户的状况已经改变。阈值也可用于确定呼吸道状况的总体趋势以及确定呼吸道状况的可能存在。在一个实施例中,如果比较(其可由音素特征比较器274执行)满足(例如,超过)状况改变阈值,则可以确定用户的呼吸道状况正在改变某一幅度(由状况改变阈值指定),因此用户的状况正在改善或恶化(即,趋势)。以这种方式,在本实施例中,不满足状况改变阈值的微小变化可以不被考虑或者可以指示用户的状况实际上没有改变。
在一些实施例中,状况改变阈值可以被加权、仅应用于音素特征的一部分、和/或可以包括用于表征特征向量(或音素特征集)的每个音素特征的改变的阈值集合或用于特征的子集的阈值集合。例如,第一音素特征的较小改变可能是显著的,而第二音素特征的较小改变可能不那么显著或者甚至可能经常发生。因此,知道第一特征值已经改变(即使只改变一点)是有帮助的,并且知道第二特征值已经在更大程度上改变也是有帮助的。因此,较小的第一状况改变阈值(或加权阈值)可以用于该第一音素特征,使得甚至较小改变都可以满足该第一状况改变阈值,并且更高(第二)状况改变阈值(或具有不同权重的阈值)可以用于第二音素特征。这种加权或变化的状况改变阈值应用可用于检测或监视某些呼吸道感染,其中特定音素特征被确定为更敏感(即,该音素特征的改变更能指示用户呼吸道状况的改变)。
在一些实施例中,状况改变阈值基于用于与用户的近期声学特征值进行比较的基线的标准差。例如,基线(例如,多天基线)可以被确定(例如,通过音素特征比较逻辑235)以包括例如从用户健康(或生病)时开始的多个时间间隔的特征信息。可以基于来自基线中使用的不同时间间隔(例如,天)的特征的特征值来确定标准差。可以基于标准差来确定状况改变阈值(例如,使用两个标准差的阈值)。例如,如果近期的音素特征集与健康基线(或用户的音素特征值随时间段或时刻检测到的类似改变)的比较满足距离基线的两个标准差,则可以确定用户患有呼吸道感染或其他状况。以这种方式,比较更加鲁棒。通过示例而非限制的方式,当用户健康时可能每天发生的用户声学特征的微小改变被纳入状况改变阈值中。在一些实例中,可以基于标准差使用多个阈值,以便确定或量化用户当前呼吸道状况与基线之间的差异程度。例如,在一个实施例中,如果与健康基线的比较(或用户的音素特征值随时间检测到的类似改变)满足距离基线的两个标准差,则可以确定用户具有呼吸道感染的低概率,并且如果比较满足距离基线的三个标准差,则可以确定用户具有呼吸道感染的高概率。
在一些实施例中,可以修改(例如,由用户、用户的临床医生或护理人员)或者可以预先确定(例如,由临床医生、护理人员或应用开发人员)根据用户状况推断逻辑237确定的状况改变阈值。状况改变阈值还可以基于参考人口数据或为特定用户确定。例如,可以基于用户的特定健康信息(例如,健康诊断、药物或健康记录数据)和/或个人信息(例如,年龄、用户行为或活动,例如,唱歌或吸烟)来设置状况改变阈值。另外地或可替代地,用户(或护理人员)可以将状况改变阈值设置或调整为例如在个人记录240的设置249中的设置。在一些方面,状况改变阈值可以基于正在被监视或检测的特定呼吸道感染。例如,用户状况推断逻辑237可以包括利用不同阈值(或阈值集合)来监视不同可能的呼吸道感染或状况的逻辑。因此,当已知(例如,在诊断之后)或怀疑用户状况时,可以使用特定阈值,在一些实例中,可以根据上下文信息或自我报告症状信息来确定该特定阈值。在一些实施例中,可以应用多于一个状况改变阈值。
在一些实施例中,用户状况推断逻辑237可以包括用于执行离群值(或异常)检测的计算机指令,并且可以采取离群值检测器的形式(或利用离群值检测模型)来检测用户呼吸道感染的可能发生率。例如,在一个实施例中,用户状况推断逻辑237可以包括规则集合,以确定和利用基线特征集(例如,多天基线)的标准差作为离群值检测的阈值,如本文进一步描述的。在其他实施例中,用户状况推断逻辑237可以采用利用离群值检测算法的一个或多个机器学习模型的形式。例如,用户状况推断逻辑237可以包括一个或多个概率模型、线性回归模型或基于接近度的模型。在一些方面,可以在用户的数据上训练这样的模型,使得模型检测特定于用户的可变性。在其他实施例中,可以训练模型以利用特定于呼吸道状况的人群的参考信息。例如,用于检测特定呼吸道状况(例如,流感、哮喘和慢性阻塞性肺疾病(COPD))的模型是利用已知具有这种状况的个人的数据来训练的。以这种方式,用户状况推断逻辑237可以特定于被监视、确定或预测的呼吸道状况的类型。
在一些实施例中,利用用户状况推断逻辑237的呼吸道状况推断引擎278的输出是预测或预报。预测可以基于在音素特征或呼吸道状况分数中检测到的改变、改变速率和/或改变模式来确定的,并且可以利用趋势分析、回归或本文描述的其他预测模型。在一些实施例中,预测可以包括对应的预测概率和/或用于预测的未来时间间隔(例如,用户在下周之前有70%的可能性发展呼吸道感染)。一个实施例基于示出用户呼吸道状况改善趋势的用户音素特征中检测到的改变速率来预测用户何时可能再次健康(参见例如图4E的描述该实施例的示例)。在一些实例中,预测可以以针对用户的趋势或展望(例如,用户正在恢复或恶化)的形式提供,或者可以作为用户将生病或恢复的概率/可能性提供。一些实施例可以将改变的模式与用户的音素特征或呼吸道状况分数进行比较,以从参考人群(例如,总体人群或类似于用户的人群,例如,具有类似呼吸道状况的人群)确定模式,以便确定用户呼吸道状况的可能的未来预测。在一些实施例中,呼吸道状况推断引擎278或用户状况推断逻辑237可以包括用于组装用户音素特征向量的一个或多个模式的功能。这些模式可能与自我报告输入或与症状分数或根据自我报告输入生成的确定(例如,综合症状分数)相关。然后可以分析用户音素特征模式以预测特定用户的未来呼吸道状况。可替代地,来自其他用户(代表总体人群的参考人群,具有特定呼吸道状况的个人的人群(例如,具有流感、哮喘、鼻病毒、慢性阻塞性肺疾病(COPD)、COVD-19等的人群)或是与用户相似的个人的人群)的用户模式可用于预测特定用户的未来呼吸道状况。示出呼吸道状况的预测的示例说明在图4E(元素447)和图5C(元素5316)中提供。
在一些实施例中,用户状况推断逻辑237可以考虑音素特征向量的改变模式或速率,和/或可以考虑地理定位信息,例如,用户所在区域中的感染爆发。例如,所有或某些音素特征的改变的特定模式(或速率)可以指示特定的呼吸道感染,例如,表现出呼吸道状况或症状的进展的那些感染(例如,典型地伴随喉咙痛的充血数天,典型地伴随喉炎)。
在一些实施例中,用户状况推断逻辑237可以包括用于确定和/或比较音素特征信息的多个改变或改变速率的计算机指令。例如,在近期音素特征向量与第一较早音素特征向量之间的第一比较(或比较的集合)可以指示用户的呼吸道状况已经改变。在实施例中,可以通过执行附加比较来确定该改变是指示用户的状况正在改善还是恶化。例如,可以确定近期音素特征向量与健康基线特征向量或来自已知用户健康的时间段或时刻的第二较早的音素特征向量的第二比较。此外,可以确定在第一较早音素特征向量与基线或第二较早音素特征向量之间的第三比较。可以对第二比较与第三比较之间检测到的改变进行比较(在第四比较中)以确定用户的呼吸道状况是在改善(例如,近期音素特征向量与健康基线之间的差异小于第一较早音素特征向量与健康基线之间的差异)还是在恶化(例如,近期音素特征向量与健康基线之间的差异大于第一较早音素特征向量与健康基线之间的差异)。此外,可利用与指示改变程度的阈值的附加比较来确定用户的呼吸道状况已经恶化或改善的程度、用户距离恢复有多近(例如,音素特征值返回到或接近健康基线的音素特征值)、或者何时用户可能期望处于恢复状态(例如,基于示出改善的趋势的用户状况的改变速率或改变)。
在一些实施例中,用户状况推断逻辑237可以包括一个或多个决策树(或随机森林或其他模型),以合并用户的自我报告和/或上下文数据,在一些实例中,该上下文数据可以包括生理数据,例如,用户睡眠信息(如果可用)、关于近期用户活动的信息或用户位置信息。例如,如果用户的话音相关数据指示话音嘶哑,并且根据上下文信息确定用户的位置前一天晚上在竞技场场地,并且前一天晚上有一个名为“季后赛锦标赛”的日历条目,则用户状况推断逻辑237可以确定用户的话音数据中观察到的改变更有可能是用户参加体育赛事而不是呼吸道感染的结果。
在一些实施例中,用户状况推断逻辑237可以包括用于确定用户传播检测到的呼吸道相关感染剂的可能风险的计算机指令。例如,可以基于应用于呼吸道状况或由呼吸道状况推断引擎278确定的未来可能的状况的规则或条件,或者临床医生对具有呼吸道感染的用户的诊断,来确定传播风险。传播风险可以是二进制的(例如,用户可能是/不是具有传染性的)、分类的(例如,传播的低、中或高风险),或者可以被确定为概率或传播风险分数,其可以指示传播的可能性。在一些实例中,传播风险可能基于用户具有或可能具有的特定呼吸道感染(例如,流感、鼻病毒、COVID-19、某些类型的肺炎等)。因此,规则可以指定具有特定状况(例如,COVID-19)的用户在设定的持续时间内是具有传染性的,该持续时间可以是固定的或基于用户的状况而改变。例如,规则可以指定在由呼吸道状况推断引擎278确定用户可能不再经历呼吸道感染之后的24小时内用户是具有传染性的。此外,传播风险在用户经历(或可能经历)呼吸道感染的整个持续时间内可能是静态的,或者可以基于用户的状态或呼吸道感染的进展而改变。例如,传播风险可以基于检测到的改变、趋势、模式、改变速率或在近期时间间隔内(例如,在过去一周内或从用户首次被呼吸道状况推断引擎278确定可能患有呼吸道感染的时间起)对用户呼吸道状况(或话音相关数据)的检测到的改变的分析而改变。可以向用户提供传播风险或(例如,由呼吸道状况推断引擎278、系统200的另一组件或临床医生)利用传播风险以确定对用户的推荐,例如,避免与他人密切接触或戴口罩。在图5C的元素5314中描绘了由呼吸道状况推断引擎278根据用户状况推断逻辑237的实施例确定的传播风险的一个示例。
在一些实施例中,用户状况推断逻辑237可以包括规则、条件或指令,以确定和/或提供与呼吸道状况、预测、传播风险或由呼吸道状况推断引擎278的其他确定相对应的推荐。该推荐可被提供给最终用户,例如,与用户相关联的患者、护理人员或临床医生(例如,决策支持推荐)。例如,为用户或护理人员确定的推荐可以包括一个或多个推荐实践,以最小化传播、管理呼吸道感染或最小化感染恶化的可能性。在一些实施例中,用户状况推断逻辑237可以包括用于访问健康信息的数据库并将该信息的至少一部分提供给用户、护理人员或临床医生的计算机指令,该健康信息的数据库可与确定的呼吸道感染或由呼吸道状况推断引擎278进行的其他确定相关联。另外地或可替代地,可以利用健康信息数据库中的信息(或者从健康信息数据库中的信息中选择或组合)来确定推荐。
在一些实施例中,可以基于用户的当前和/或历史信息(例如,历史话音相关数据、先前确定的呼吸道状况、用户呼吸道状况的趋势或改变等)和/或上下文信息(例如,症状、生理数据或地理位置)来为用户定制推荐。例如,在一个实施例中,关于用户的信息可用作选择或过滤标准,以识别健康信息的数据库中的相关信息,以用于确定为用户定制的推荐。
推荐可以被提供给用户、护理人员或临床医生,和/或存储在与用户相关联的个人记录240中,例如,在结果/推断状况246中。在访问健康信息数据库的一些实施例中,数据库可以存储在存储装置250上和/或远程服务器上或云环境中。在图5C的元素5315中描绘了由呼吸道状况推断引擎278根据用户状况推断逻辑237的实施例确定的推荐的示例。
如图2所示,示例系统200还包括决策支持工具290,其可以包括用于消费系统200组件的输出确定(例如,由呼吸道状况跟踪器270(或其子组件中的一个,例如,呼吸道状况推断引擎278)或从存储装置(例如,从用户的个人记录240中的结果/推断状况246)确定的用户呼吸道状况或预测)的各种计算应用或服务。根据一些实施例,决策支持工具290可以利用该信息来启用治疗和/或预防动作。以这种方式,决策支持工具290可由被监视用户和/或被监视用户的护理人员使用。该决策支持工具290可以采取客户端设备上的独立应用、web应用、分布式应用或服务和/或现有计算应用上的服务的形式。在一些实施例中,一个或多个决策支持工具290是呼吸道感染监视或跟踪应用(例如,结合图5A描述的呼吸道感染监视应用5101)的一部分。
一个示例性决策支持工具包括生病监视器292。生病监视器292可以包括在用户的智能电话(或智能扬声器或其他用户设备)上操作的应用。生病监视器292应用可以监视用户的语音,并通知用户和/或用户的护理提供者用户是否正在生病或从呼吸道感染(例如,鼻病毒或流感)中恢复。在一些实施例中,生病监视器292可以请求允许收听用户以收集话音相关数据,或者在一些方面中收集其他数据。生病监视器292可以生成到用户的通知或警报,从而指示用户是否正在生病、可能生病或正在恢复。在一些实施例中,生病监视器292可以基于呼吸道状况确定和/或预测来发起和/或安排治疗推荐。该通知或警报可以包括基于呼吸道状况确定和/或预测的用于诸如治疗之类的干预动作的推荐动作。通过示例而非限制的方式,治疗推荐可以包括推荐用户采取的动作(例如,戴口罩)、非处方药物、咨询临床医生、和/或推荐用于确认呼吸道感染的存在和/或治疗呼吸道感染和/或由此产生的症状的测试。例如,生病监视器292可以推荐用户安排访问保健提供者的和/或接受测试以确认呼吸道状况。在一些实施例中,生病监视器292可以发起或促进医生预约和/或测试预约的安排。可替代地或另外地,生病监视器292可以推荐或命令治疗,例如,非处方药物。
生病监视器292的实施例可以推荐用户通知用户家中的其他个人采取预防措施,例如,保持最小距离,以防止感染传播。在一些实施例中,生病监视器292可以推荐该通知,并且在用户肯定地授权该通知时,生病监视器292可以向与感染用户的家中的其他用户相关联的用户设备发起通知。生病监视器292可以根据存储在用户的个人记录240中的信息(例如,根据用户帐户/设备248)识别相关用户设备。在一些实施例中,生病监视器292可以将其他感测数据(例如,生理数据,例如,心率、温度、睡眠等)、其他上下文数据(例如,关于用户区域中呼吸道感染爆发的信息)或者来自用户的数据输入(例如,经由自我报告工具284提供的症状信息)与呼吸道状况的确定和/或预测进行关联,以做出推荐。
在一个实施例中,生病监视器292可以是感染接触跟踪应用的一部分,或者与感染接触跟踪应用结合操作。以这种方式,关于第一用户可能的呼吸道感染的早期检测的信息可以自动地传送到第一用户所接触的其他个人。另外地或可替代地,该信息可用于发起对这些其他个人的呼吸道感染监视。例如,其他个人可以被通知可能与感染者接触,并被提示下载和使用生病监视器292或呼吸道感染监视应用,例如,结合图5A描述的呼吸道感染监视应用5101。以这种方式,甚至在第一用户感到生病之前(即,在第一用户有症状之前)就可以通知其他个人并开始监视。
另一示例决策支持工具290是处方监视器294,如图2所示。处方监视器294可以利用关于用户的呼吸道状况的确定和/或预测(例如,用户是否有呼吸道感染),以确定是否应该重新补充处方。例如,处方监视器294可以根据用户的个人记录240来确定用户是否具有用于检测到或预测的呼吸道状况的当前处方。处方监视器294还可以确定针对服用药物的频率、药物的最后补充日期和/或有多少重新补充可用的处方方向。处方监视器294可以基于确定用户当前有呼吸道感染或预测用户将具有呼吸道感染或将在不久的将来表现出症状来确定是否需要重新补充处方。
处方监视器294的一些实施例还可以通过感测的数据或用户经由自我报告工具284的输入来确定用户是否正在服药。指示用户是否正在服用处方药物的信息由处方监视器294使用以确定当前处方是否不足或何时不足。处方监视器294可以向用户发出指示处方被重新补充的警报或通知。在一个实施例中,处方监视器294在用户采取肯定步骤请求重新补充之后发出推荐重新补充处方的通知。处方监视器294可以通过药房发起要求重新补充,其信息可以存储在用户的个人记录240中或由用户在重新补充时输入。示例处方监视服务(例如,处方监视器294)的方面在图4F中描绘。
另一示例决策支持工具290是药物疗效跟踪器296,如图2所示。药物疗效跟踪器296可以利用关于用户呼吸道状况的确定和/或预测(例如,用户的状况是在改善还是恶化),来确定用户正在服用的药物的效力是否有效。因此,药物疗效跟踪器296可以根据用户的个人记录240来确定用户是否具有当前处方。药物疗效跟踪器296可以通过感测到的数据或用户经由自我报告工具284的输入来确定用户是否实际服用药物。药物疗效跟踪器296还可以确定处方方向,并且可以确定用户是否根据处方方向服用药物。
在一些实施例中,药物疗效跟踪器296可以基于利用话音相关数据来关联关于呼吸道状况的推断或预测,以确定用户是否正在服用药物,并进一步确定药物是否有效。例如,如果用户按处方服药但呼吸道状况恶化或没有改善,则可以确定处方药物在该实例中对特定用户无效。因此,药物疗效跟踪器296可以推荐用户咨询临床医生以改变处方,或者可以将电子通知自动地传送到用户的医生或临床医生,使得临床医生可以考虑修改处方治疗。
在一些实施例中,药物疗效跟踪器296另外地或可替代地在被监视用户的临床医生的设备(例如,图1的临床医生用户设备108)上操作或与该设备结合操作。例如,根据本公开的实施例,临床医生可以为患病患者开出针对呼吸道感染的药物(例如,抗生素),并且可以结合给患者开出药物疗效跟踪应用(例如,296)来监视患者的话音相关数据。在确定用户正在恶化或没有改善时,药物疗效跟踪器296可以通知临床医生患者呼吸道状况的推断或预测。在一些实例中,药物疗效跟踪器296还可以提出推荐以改变患者的处方治疗。
在另一实施例中,药物疗效跟踪器296可用作药物研究或试验的一部分,并且可以分析多个参与者的呼吸道状况的确定和/或预测,以确定所研究的药物是否对该组参与者有效。另外地或可替代地,在一些实施例中,药物疗效跟踪器296可以与传感器(例如,传感器103)和/或自我报告工具284结合使用作为研究或试验的一部分,以确定是否存在药物的副作用,例如,呼吸道相关的副作用(例如,咳嗽、充血、流鼻涕)或非呼吸道相关的副作用(例如,发烧、恶心、发炎、肿胀、瘙痒)。
上面描述的决策支持工具290的一些实施例包括用于治疗用户的呼吸道状况的方面。治疗可以有针对性地降低呼吸道状况的严重性。治疗呼吸道状况可以包括确定新的治疗方案,该新的治疗方案可以包括新的治疗剂、新剂的剂量或用户正在服用的现有剂的新剂量或新剂的剂量,和/或新剂的给药方式或用户服用的现有剂的新给药方式。可以向用户或用户的护理人员提供关于新治疗方案的推荐。在一些实施例中,可以将处方发送给用户、用户的护理人员或用户的药房。在一些实例中,治疗可能包括重新补充现有的处方而不做改变。进一步的实施例可以包括根据推荐治疗方案向用户给予推荐治疗剂和/或跟踪推荐治疗剂的应用或使用。以这种方式,本公开的实施例可以更好地实现对用于治疗呼吸道状况的治疗剂的使用或应用的控制、监视和/或管理,这不仅对用户的状况有益,而且可以帮助保健提供者和药物制造商以及供应链中的其他人更好地遵守由食品和药物管理局和其他管理机构设置的法规和建议。
在示例方面,治疗包括来自以下的一种或多种治疗剂:
·PLpro抑制剂、Apilomod、EIDD-2801、利巴韦林、缬更昔洛韦、β-胸苷、阿斯巴甜、氧烯洛尔、多西环素、醋奋乃静、碘普胺、核黄素、瑞普特罗、2,2’-环胞苷、氯霉素、氨基甲酸氯苯甘醚、左羟丙哌嗪、头孢孟多、氟尿苷、替加环素、培美曲塞、L(+)-抗坏血酸、谷胱甘肽、橙皮素、腺苷蛋氨酸、马索罗酚、异维甲酸、丹曲林、柳氮磺吡啶抗菌剂、水飞蓟宾、尼卡地平、西地那非、桔梗皂苷、白杨素、新橙皮苷、黄芩苷、苏葛三醇-3,9-二乙酸酯、(-)表没食子儿茶素没食子酸酯、Phaitanthrin D、2-(3,4-二羟基苯基)-2-[[2-(3,4-二羟基苯基)-3,4-二氢-5,7-二羟基-2H-1-苯并吡喃-3-基]氧基]-3,4-二氢-2H-1-苯并吡喃-3,4,5,7-四醇、2,2-二(3-吲哚基)-3-吲哚酮、(S)-
(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯
基)十氢萘-2-基-2-氨基-3-苯基丙酸酯、白皮杉醇、迷迭香酸和/或厚朴酚;
·3CLpro抑制剂、赖甲四环素、氯己定、阿呋唑嗪、西司他丁、法莫替丁、阿米曲林、普罗加胺、奈帕芬胺、卡维地洛、氨普那韦、替加环素、孟鲁司特、胭脂红酸、含羞草氨酸、黄素、叶黄素、头孢匹胺、非奈西林、坎沙曲、尼卡地平、戊酸雌二醇、吡格列酮、考尼伐坦、替米沙坦、多西环素、土霉素、(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢萘-2-基5-((R)-1,2-二硫杂环戊烷-3-基)戊酸酯、白杨醛、白杨素-7-O-β-葡萄糖醛酸、雄酮酰胺、(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢萘-2-基2-硝基苯甲酸酯、2β-羟基-3,4-开环-软木三萜酮内酯-27-酸(S)-(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢萘-2-基-2-氨基-3-苯基丙酸酯、异赤霉醇、酒酵母甾醇、橙皮苷、新橙皮苷、穿心莲素、2-((1R,5R,6R,8aS)-6-羟基-5-(羟甲基)-5,8a-二甲基-2-亚甲基十氢萘-1-基)乙基苯甲酸酯、大波斯菊苷、Cleistocaltone A、2,2-二(3-吲哚基)-3-吲哚酮、Biorobin、格尼迪木素、Phyllaemblinol、茶黄素3,3’-二-没食子酸酯、迷迭香酸、苦菜苷I、齐墩果酸、柱头菊-5-烯-3-醇、Deacetylcentapicrin和/或Berchemol;
·RdRp抑制剂、缬更昔洛韦、氯己定、头孢布烯、非诺特罗、氟达拉滨、伊曲康唑、头孢呋辛、阿托伐醌、鹅去氧胆酸、色甘酸钠、泮库溴铵、可的松、替勃龙、新生霉素、水飞蓟宾、伊达比星、溴隐亭、地芬诺酯、苄基青霉酰G、达比加群酯、桦木酮、格尼迪木素、2β,30β-二羟基-3,4-开环-软木三萜酮内酯-27-内酯、14-脱氧-11,12-二脱氢穿心莲内酯、格尼迪木素、茶黄素3,3’-二没食子酸酯、(R)-((1R,5aS,6R,9aS)-1,5a-二甲基-7-亚甲基-3-氧代-6-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢-1H-苯并[c]氮杂卓-1-基)甲基2-氨基-3-苯基丙酸酯、2β-羟基-3,4-开环-软木三萜酮内酯-27-酸、2-(3,4-二羟基苯基)-2-[[2-(3,4-二羟基苯基)-3,4-二氢-5,7-二羟基-2H-1-苯并吡喃-3-基]氧基]-3,4-二氢-2H-1-苯并吡喃-3,4,5,7-四醇、叶甲素B、14-羟基香附烯酮、穿心莲内酯苷、2-
((1R,5R,6R,8aS)-6-羟基-5-(羟甲基)-5,8a-二甲基-2-亚甲基十氢萘-1-基)乙基苯甲酸酯、穿心莲内酯、苏葛三醇-3,9-二乙酸酯、黄芩苷、(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-
((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢萘-2-基5-((R)-1,2-二硫杂环戊烷-3-基)戊酸酯、1,7-二羟基-3-甲氧基氧杂蒽酮、1,2,6-三甲氧基-8-[(6-O-β-D-吡喃木糖基-β-D-吡喃葡萄糖基)氧基]-9H-氧杂蒽-9-酮和/或1,8-二羟基-6-甲氧基-2-[(6-O-β-D-吡喃木糖基-β-D-吡喃葡萄糖基)氧基]-9H-氧杂蒽-9-酮、8-(β-D-吡喃葡萄糖基氧基)-1,3,5-三羟基-9H-氧杂蒽-9-酮。
在示例方面,治疗包括用于治疗病毒感染(例如,引起COVID-19的SARS-CoV-2)的一种或多种治疗剂。因此,治疗剂可以包括一种或多种SARS-CoV-2抑制剂。在一些实施例中,治疗包括一种或多种SARS-CoV-2抑制剂与上面列出的治疗剂中的一种或多种的组合。
在一些实施例中,治疗包括选自先前识别的药剂以及以下药剂中的任一种的一种或多种治疗剂:
·地奥司明、橙皮苷、MK-3207、Venetoclax、二氢麦角克碱、勃拉嗪、R428、Ditercalinium、依托泊苷、替尼泊苷、UK-432097、伊立替康、Lumacaftor、Velpatasvir、Eluxadoline、Ledipasvir、洛匹那韦/利托那韦和利巴韦林的组合、Alferon和强的松;
·地塞米松、阿奇霉素和瑞德西韦,以及boceprevir、umifenovir和法匹拉韦;
·α-酮酰胺化合物11r、13a和13b,如在Zhang,L.;Lin,D;Sun,X;Rox,K;Hilgenfeld,R.的X-ray Structure of Main Protease of the Novel CoronavirusSARS-CoV-2Enables Design ofα-Ketoamide Inhibitors中所述;bioRxiv预印本doi:https://doi.org/10.1101/2020.02.17.952879;
·RIG 1通路激活剂,例如,美国专利号9,884,876中描述的那些;
·蛋白酶抑制剂,例如,Dai W、Zhang B、Jiang X-M等人的Structure-baseddesign of antiviral drug candidates targeting the SARS-CoV-2main protease(Science.2020;368(6497):1331-1335)中所描述的那些,包括指定为DC402234的化合物;和/或
·抗病毒药物,例如,瑞德西韦、galidesivir、favilavir/avifavir、莫努匹拉韦(MK-4482/EIDD 2801)、AT-527、AT-301、BLD-2660、法匹拉韦、卡莫司他、SLV213恩曲他滨/替诺非韦、克来夫定、dalcetrapib、boceprevir、ABX464、(3S)-3-({N-[(4-甲氧基-1H-吲哚-2-基)羰基]-L-亮氨酰基}氨基)-2-氧代-4-[(3S)-2-氧代吡咯烷-3-基]丁基磷酸二氢酯;和/或其药学上可接受的盐、溶剂合物或水合物(PF-07304814)、(1R,2S,5S)-N-{(1S)-1-氰基-2-[(3S)-2-氧代吡咯烷-3-基]乙基}-6,6-二甲基-3-
[3-甲基-N-(三氟乙酰基)-L-缬氨酰基]-3-氮杂双环[3.1.0]己烷-2-甲酰胺或其溶剂合物或水合物(PF-07321332)、和/或S-217622、糖皮质激素(例如,地塞米松和氢化可的松)、恢复期血浆、重组人血浆(例如,凝溶胶蛋白(Rhu-p65N))、单克隆抗体(例如,regdanvimab(Regkirova)、ravulizumab(Ultomiris))、VIR-7831/VIR-7832、BRII-196/BRII-198、COVI-AMG/COVI滴剂(STI-2020)、bamlanivimab(LY-CoV555)、mavrilimab、leronlimab(PRO140)、AZD7442、lenzilumab、英夫利昔单抗、阿达木单抗、JS 016、STI-1499(COVIGUARD)、lanadelumab(Takhzyro)、卡那单抗(Ilaris)、gimsilumab和otilimab、抗体鸡尾酒合剂(例如,casirivimab/imdevimab(REGN-Cov2))、重组融合蛋白(例如,MK-7110(CD24Fc/SACCOVID))、抗凝血剂(例如,肝素和阿哌沙班)、IL-6受体激动剂(例如,tocilizumab(Actemra)和/或sarilumab(Kevzara))、PIKfyve抑制剂(例如,apilimoddimesylate)、RIPK1抑制剂(例如,DNL758、DC402234)、VIP受体激动剂(例如,PB1046)、SGLT2抑制剂(例如,达格列净)、TYK抑制剂(例如,阿比维替尼)、激酶抑制剂(例如,ATR-002)、bemcentinib、阿卡替尼、losmapimod、阿卡替尼和/或托法替布、H2阻滞剂(例如,法莫替丁)、驱虫剂(例如,氯硝柳胺)和弗林蛋白酶抑制剂(例如,二咪那嗪)。
例如,在一个实施例中,治疗选择包括由以下各项构成的组:(3S)-3-({N-[(4-甲氧基-1H-吲哚-2-基)羰基]-L-亮氨酰基}氨基)-2-氧代-4-[(3S)-2-氧代吡咯烷-3-基]丁基磷酸二氢酯,以及其药学上可接受的盐、溶剂合物或水合物(PF-07304814)。在另一实施例中,治疗包括(1R,2S,5S)-N-{(1S)-1-氰基-2-[(3S)-2-氧代吡咯烷-3-基]乙基}-6,6-二甲基-3-[3-甲基-N-(三氟乙酰基)-L-缬氨酰基]-3-氮杂双环[3.1.0]己烷-2-甲酰胺或其溶剂合物或水合物(PF-07321332)。
继续图2和系统200,系统200的呈现组件220可以通常负责提供检测到的呼吸道状况信息、用户指令和/或用于获得用户话音数据和/或自我报告数据的反馈以及相关信息。呈现组件220可以包括在用户设备上、跨多个用户设备或在云环境中的一个或多个应用或服务。例如,在一个实施例中,呈现组件220可以跨与用户相关联的多个用户设备来管理向该用户提供信息,例如,通知和警报。基于呈现逻辑、上下文和/或其他用户数据,呈现组件220可以确定通过哪个(哪些)用户设备提供内容,以及提供的上下文,例如,如何(例如,格式和内容,其可以取决于用户设备或上下文)提供、何时提供或提供信息的其他这种方面。
在一些实施例中,呈现组件220可以生成与系统200的其他组件相关联或用于促进向用户(可以是被监视的个人或被监视的个人的临床医生)呈现系统200的其他组件(例如,用户话音监视器260、用户交互管理器280、呼吸道状况跟踪器270和决策支持工具290)的方面的用户界面特征。这种特征可以包括图形或音频界面元素(例如,图标或指示符、图形按钮、滑块、菜单、声音、音频提示、警报、警告、振动、弹出窗口、通知栏或状态栏项目、应用内通知,或用于与用户交互的其他类似特征)、查询和提示。呈现组件220的一些实施例可以采用语音合成、文本到语音或类似功能来生成和呈现语音给用户,例如,在智能扬声器上操作的实施例。图形用户界面(GUI)的示例和示例音频用户界面元素的表示可以由呈现组件220生成并提供给用户(即,被监视的个人或临床医生),这结合图5A-图5E进行描述。使用音频用户界面功能的实施例在图4C-图4F的示例中描述。呈现组件220提供的音频用户界面的一些实施例包括话音用户界面(VUI),例如,智能扬声器上的VUI。还结合可穿戴设备(例如,图4B中的智能手表402a)示出和描述了可由呈现组件220生成并提供给用户(即,被监视的个人或临床医生)的图形用户界面(GUI)的示例和示例音频用户界面元素的表示。
示例系统200的存储装置250通常可以存储信息,包括在本文描述的实施例中使用的数据、计算机指令(例如,软件程序指令、例程或服务)、逻辑、简档和/或模型。在实施例中,存储装置250可以包括数据储存库(或计算机数据存储器),例如,图1的数据储存库150。此外,虽然被描绘为单个数据存储组件,但存储装置250可以体现为一个或多个数据储存库或在云环境中。
如示例系统200所示,存储装置250包括话音音素提取逻辑233、音素特征比较逻辑235和用户状况推断逻辑237,所有这些都是先前描述的。此外,存储装置250可以包括一个或多个个人记录(例如,个人记录240,如图2所示)。个人记录240可以包括与特定被监视的个人/用户相关联的信息,例如,简档/健康数据(EHR)241、话音样本242、音素特征向量244、结果/推断状况246、用户帐户/设备248和设置249。存储在个人记录240中的信息可用于数据收集组件210、用户话音监视器260、用户交互管理器280、呼吸道状况跟踪器270、决策支持工具290或示例系统200的其他组件,如本文所描述的。
简档/健康数据(EHR)241可以提供与被监视个人的健康相关的信息。简档/健康数据(EHR)241的实施例可以包括个人的EHR的一部分或全部,或者仅包括与呼吸道状况相关的一些健康数据。例如,简档/健康数据(EHR)241可以指示过去或当前诊断的状况,例如,流感、鼻病毒、COVID-19、慢性阻塞性肺疾病(COPD)、哮喘或影响呼吸道系统的状况;与治疗呼吸道状况或呼吸道状况的潜在症状相关联的药物;体重;或者年龄。简档/健康数据(EHR)241可以包括用户的自我报告信息,例如,结合自我报告工具284描述的自我报告症状。
话音样本242可以包括原始和/或经处理的话音相关数据,例如,从传感器103(图1所示)接收的数据。该传感器数据可以包括用于呼吸道感染跟踪的数据,例如,所收集的话音记录或样本。在一些实例中,话音样本242可以被临时存储,直到对所收集的样本执行了特征向量分析和/或直到已经经过预定时间段。
此外,音素特征向量244可以包括针对特定用户的确定的音素特征和/或音素特征向量。音素特征向量244可以与个人记录240中的其他信息(例如,上下文信息或自我报告信息或综合症状分数(其可以是简档/健康数据(EHR)241的一部分))相关。此外,音素特征向量244可以包括用于为特定用户建立音素特征基线的信息,如结合音素特征比较逻辑235所描述的。
结果/推断状况246可以包括用户预测和用户的推断的呼吸道状况。结果/推断状况246可以是呼吸道状况推断引擎278的输出,并且因此可以包括当前或未来时间间隔内被监视用户的呼吸道状况的分数和/或可能性。如先前所描述的,结果/推断状况246可由决策支持工具290利用。
用户帐户/设备248通常可以包括关于被访问、使用或以其他方式与用户相关联的用户计算设备的信息。这样的用户设备的示例可以包括图1的用户设备102a-102n,因此可以包括智能扬声器、移动电话、平板计算机、智能手表或具有集成话音记录能力或可以通信地连接到这种设备的其他设备。
在一个实施例中,用户账户/设备248可以包括涉及与用户相关联的账户(例如,在线或基于云的账户(例如,在线健康记录门户、网络/健康提供人员、网络网站、决策支持应用、社交媒体、电子邮件、电话、电子商务网站等))的信息。例如,用户帐户/设备248可以包括用于决策支持应用(例如,决策支持工具290)的被监视个人的帐户;护理提供人员站点的帐户(例如,可用于实现预约的电子安排);以及在线电子商务帐户,例如,Amazon.或药店(例如,可用于支持在线医嘱治疗)。
另外,用户帐户/设备248还可以包括用户的日历、预约、应用数据、其他用户帐户等。用户帐户/设备248的一些实施例可以跨一个或多个数据库、知识图或数据结构来存储信息。如前所述,存储在用户帐户/设备248中的信息可以从数据收集组件210确定。
此外,设置249通常可以包括与用于监视用户话音数据的一个或多个步骤(包括收集话音数据,收集自我报告信息,或推断和/或预测用户的呼吸道状况)相关联的用户设置或偏好或一个或多个决策支持应用,例如,决策支持工具290。例如,在一个实施例中,设置249可以包括用于收集话音相关数据的配置设置,例如,用于在用户随意说话时收集话音信息的设置。设置249可以包括针对上下文信息的配置或偏好,包括用于获得生理数据(例如,链接可穿戴传感器设备的信息)的设置。设置249还可以包括隐私设置,如本文所述。设置249的一些实施例可以指定特定音素或音素特征以检测或监视呼吸道状况,并且还可以指定检测或推断阈值(例如,状况改变阈值)。设置249还可以包括用户设置其呼吸道状况的基线状态的配置,如本文所述。通过示例而非限制的方式,其他设置可以包括用户通知容限阈值,其可定义用户希望何时以及如何被通知用户的呼吸道状况确定或预测。在一些方面,设置249可以包括针对应用的用户偏好,例如,通知、优选护理人员、优选药房或其他商店以及非处方药。设置249可以包括用于用户治疗的指示,例如,处方药物。在一个实施例中,传感器(例如图1中描述的传感器103)的校准、初始化和设置也可以存储在设置249中。
现在转向图3A,描绘了并入系统200的组件中的至少一些组件的示例过程3100的示意表示。示例过程3100示出一个或多个用户3102经由话音症状应用3104提供数据,该话音症状应用3104可以在用户设备(例如,智能移动设备和/或智能扬声器)上操作。经由话音症状应用3104提供的数据可以包括可从中提取音素的声音记录(例如,图2的话音样本242),如图2中关于用户话音监视器260所述。此外,接收到的数据包括症状评级值,其可以由用户手动输入,如结合用户交互管理器280所述。
基于接收所记录的话音样本和症状值,可以驻留在服务器(例如,图1的服务器106)上并通过网络(例如,图1的网络110)访问的计算机系统可以执行操作3106,该操作3106包括与用户通信、执行症状算法、提取话音特征和应用话音算法。与用户通信可以包括提供提示和反馈以收集可用数据,如结合用户交互管理器280所述。症状算法可以包括基于用户的自我报告症状值来生成综合症状分数(CSS),如结合自我报告数据评估器276所述。话音特征提取可以包括针对话音样本中检测到的音素提取的声学特征值,如结合用户话音监视器260以及更具体地结合声学特征提取器2614所述。话音算法可以应用于所提取的声学特征,其可以包括比较来自不同天的个人的特征向量(即,计算距离度量),如结合音素特征比较器274所述。
基于至少一些操作3106,提醒和通知可以经由用户设备(例如,图1中的用户设备102a)以电子方式发送到一个或多个用户3102。提醒可以提醒用户知道可能需要话音样本或附加信息,例如,自我报告症状评级。当提供话音样本时,通知可以向用户提供反馈,例如,指示是否需要更长的持续时间、更大的音量或更少的背景噪声,如结合用户交互管理器280所述。通知还可以指示用户是否以及在多大程度上遵循了用于提供话音样本和在一些实例中提供症状信息的规定协议。例如,通知可以指示用户已经完成50%的话音练习以提供话音样本。
此外,基于操作3106中的至少一些,收集的信息和/或其结果分析可被发送到与临床医生相关联的一个或多个用户设备,例如,图1中的临床医生用户设备108。临床医生仪表板3108可以由在临床医生用户设备108(图1)上或与临床医生用户设备108一起操作的计算机软件应用(例如,决策支持应用105a或105b)生成。临床医生仪表板3108可以包括图形用户界面(GUI),该GUI使得能够访问和接收关于特定患者或被监视的患者(即,被监视的用户3102)的集合的信息,并且在一些实施例中,直接或间接地与患者通信。临床医生仪表板3108可以包括呈现多个用户的信息的视图(例如,其中每一行包含关于不同用户的信息的图表)。另外地或可替代地,临床医生仪表板3108可以呈现被监视的单个用户的信息。
在一个实施例中,临床医生可以利用临床医生仪表板3108以经由话音症状应用3104来监视用户3102的数据收集。例如,临床医生仪表板3108可以指示用户是否一直在提供可用的话音样本,以及在一些实施例中是否提供症状严重性评级。如果用户没有遵守用于提供话音样本和/或其他信息的规定协议,则临床医生仪表板3108可以通知临床医生。在一些实施例中,临床医生仪表板3108可以包括使临床医生能够与用户通信(例如,发送电子消息)并提醒用户遵循用于收集数据的协议或遵循修订协议的功能。
在一些实施例中,操作3106可以包括从收集的话音样本确定用户的呼吸道状况(例如,确定用户是否生病),这通常可以由呼吸道状况跟踪器270的实施例执行,更具体地可以由呼吸道状况推断引擎278执行,如结合图2所述。在这些实施例中,可以向用户3102发送指示确定的呼吸道状况的通知。在一些实施例中,对用户3102的通知可以包括动作推荐,如结合决策支持工具290所述。此外,在利用用户的话音相关信息来确定用户的呼吸道状况的情况下,临床医生仪表板3108的一些实施例可由临床医生用来跟踪用户的呼吸道状况。临床医生仪表板3108的一些实施例可以指示用户的呼吸道状况的状态(例如,呼吸道状况分数、用户是否具有呼吸道感染)和/或用户状况的趋势(例如,用户的状况是否恶化、改善或保持不变)。可以向临床医生提供警报或通知,以指示用户的状况是否特别糟糕(例如,当呼吸道状况分数低于阈值分数时)、是否针对用户检测到新的感染和/或用户的状况是否已经改变。
在一些实施例中,临床医生仪表板3108可用于专门监视已经被开出用于呼吸道感染的药物和/或已经被临床医生诊断出患有呼吸道状况的用户,使得临床医生可以监视处方治疗的状况和疗效,包括这种治疗的副作用,如结合决策支持工具290和药物疗效跟踪器296所讨论的。因此,临床医生仪表板3108的实施例可以识别处方药物或治疗以及用户是否正在服用处方药物或治疗。
此外,在一些实施例中,临床医生仪表板3108可以包括使临床医生能够设置推荐的或所要求的话音样本收集协议(例如,用户应提供话音样本的频率)、用户的处方治疗或药物以及对用户的附加推荐(例如,是否喝酒、休息、避免运动、自我隔离)的功能。临床医生仪表板3108还可由临床医生用来设置或调整监视设置(例如,设置用于生成对临床医生的警报以及在一些实施例中生成对用户的警报的阈值)。在一些实施例中,临床医生仪表板3108还可以包括使临床医生能够确定话音症状应用3104是否正确操作以及在话音症状应用3104上执行诊断的功能。
图3B说明性地描绘了用于收集用于监视呼吸道状况的数据的示例过程3500的示意表示。在该示例过程3500中,被监视的个人可以执行若干收集检查点,在这些检查点上提供话音样本和症状评级。收集检查点可以包括:一次在实验室内的“生病”访问,在此期间个人已经经历呼吸道感染的症状,或者在一些实施例中具有呼吸道感染的诊断;以及一次在实验室内“健康”访问,在此期间个人已经从呼吸道感染中康复。此外,在两次实验室内访问之间,个人可能会在家里有每天两次(或每天或定期)的收集检查点。在家检查点可能在至少两周的时段内发生,并且如果个人的恢复时间超过两周,则可能会在更长的时段内发生。在每个收集检查点期间,个人可以提供话音样本并对症状进行评级。
实验室内访问可以是与临床医生的访问,例如,在临床医生的办公室或在进行研究的实验室中。在实验室内访问期间,可以通过智能电话和耦合到耳机的计算机同时记录被监视个人的话音样本。然而,可以设想,过程3500的实施例可以仅利用这些方法中的一种来在实验室内访问期间收集话音样本。个人可以利用智能电话、智能手表和/或用于家中收集的智能扬声器来记录话音样本并提供症状评级。
对于实验室内访问和家中访问的话音样本,个人可以被提示记录鼻辅音和基本元音两者的持续发声,每次5-10秒。在一个实施例中,记录四个元音和三个鼻辅音。使用国际音标字母(IPA)的四个元音可以是/a/、/i/、/u/和/ae/,其中可以提示个人使用更多的本地提示“o”、“E”、“OO”和“a”来发音。三个鼻辅音可以是/n/、/m/和/ng/。此外,个人可能被要求记录脚本语音和非脚本语音。话音记录系统可以使用无损耗压缩,并具有比特深度16。在一些实施例中,话音数据可以在44.1千赫兹(kHz)处被采样。在另一实施例中,话音数据可以在48kHz处被采样。
在家中恢复期间,个人可能被要求提供话音样本,并每天早上和晚上报告症状。对于在家期间的症状评级,个人可能被要求在早上对与呼吸道疾病相关的19个症状的感知症状严重性(0-5)进行评级,并且在晚上对与呼吸道疾病相关的16个症状的感知症状严重性(0-5)进行评级。在一个实施例中,在早上列表中仅包括四个睡眠问题,并且仅在晚上询问一天结束时的疲倦度问题。可以结合自我报告工具284提供症状问题的示例列表。可以通过对症状中的至少一些的分数进行求和来确定综合症状分数(CSS)。在一个实施例中,CSS是7个症状的总和(鼻后流涕、鼻塞、流鼻涕、带粘液的浓鼻涕、咳嗽、喉咙痛和需要擤鼻涕)。
图4A-图4F各自说明性地描绘了利用本公开实施例的个人(即,用户410)的示例场景。用户410可以与在用户设备(例如,用户计算机设备102a-102n中的任一个)上运行的计算机软件应用(例如,图1中的决策支持应用105a)的一个或多个用户界面(例如,图形用户界面和/或话音用户界面)交互,如结合图2的呈现组件220所述。每个场景由场景(框)的序列表示,这些场景(框)旨在按时间次序排列(从左到右)。不同场景(框)不一定是不同的离散交互,而是可以是用户410与用户界面组件之间的一个交互的一部分。
图4A、图4B和图4C描绘了数据,例如通过与在一个或多个用户设备上运行的应用或程序(例如,图3A中的话音症状应用3104和/或图5A-图5E中的呼吸道感染监视应用5101的实施例)的交互从用户410收集的用户话音信息,如下所述。图4A-图4C所描绘的实施例可以由系统200的一个或多个组件(例如,用户交互管理器280、数据收集组件210和呈现组件220)执行。
转向图4A,例如,在场景401中,向使用智能电话402c(其可以是图1中的用户设备102c的实施例)的用户410提供用于提供持续发声的指令405。指令405说明:“让我们开始您的话音状况评估。请说出并保持声音‘mmm’5秒,现在开始。”这些指令405可以由图2的用户指令生成器282的实施例提供。指令405可以经由智能电话402c的显示屏上的图形用户界面显示为文本。另外地或可替代地,指令405也可以被提供为可听指令,以利用智能电话402c上的话音用户界面。在场景402中,示出用户410通过在智能电话402c上口头陈述“mmmmmmmm……”来提供话音样本407,使得智能电话402c中的麦克风(未示出)可以拾取并记录话音样本407。
图4B类似地描绘了在场景411中向用户410提供指令415。指令415可以由用户指令生成器282的实施例生成,并经由智能手表402a提供,该智能手表402a可以是图1中的用户设备102a的示例实施例。因此,指令415可以经由智能手表402a上的图形用户界面显示为文本。另外地或可替代地,指令415可以经由话音用户界面提供为可听指令。在场景412中,用户410通过向智能手表402a说话来响应指令415并生成话音样本417(“aaaaaaaa……”)。
图4C描绘了通过来自智能扬声器402b的一系列指令(其也可以称为提示)引导用户410提供话音样本,该智能扬声器402b可以是图1中的用户设备102b的实施例。指令可以经由话音用户界面从智能扬声器402b输出,并且来自用户410的响应可以是由智能扬声器402b上的麦克风(未示出)或通信地耦合到智能扬声器402b的另一设备拾取的可听响应。
另外,根据本公开的一些实施例,图4C描绘了由在智能扬声器402b上运行或与智能扬声器402b结合运行的应用或程序发起的话音记录会话。例如,在场景421中,智能扬声器402b大声陈述发起话音记录会话的意图424。意图424陈述:“让我们开始您的语音状况评估。现在是合适的时间吗?”,用户410向其提供可听响应425:“是的”。
在场景422中,智能扬声器402b提供可听指令426供用户410跟随以提供话音样本,并且用户410提供可听响应427,其包括一般确认(“好的”)和所指示的声音(“aaaaa……”)。一旦确定用户提供了响应,就可以确定应该针对另一话音样本给出指令的下一集合。确定用户410的响应和提供用户410或下一步骤的适当反馈可以由用户输入响应生成器286的实施例执行。在场景423中,从智能扬声器402b发出针对下一话音样本的指令428,用户410利用可听话音样本429“mmmmm……”对其进行响应。在智能扬声器402b与用户410之间的指令的这种来回可以继续,直到收集了所有所需的话音样本为止。
如本文所述,可以利用从用户收集的话音信息来监视或跟踪用户的呼吸道状况。因此,图4D、图4E和图4F描绘了其中向用户通知关于跟踪用户呼吸道状况的各种方面的场景。在图4D-图4F中用于推断和预测的音频数据可以在各种设备上和在不同的日子里收集,如图4A-图4C所示。在一些实施例中,在图4D-图4F的场景下的推断和预测的确定可以由图2中的呼吸道状况推断引擎278进行,并且这种确定的通知和对进一步信息的请求可以由用户交互管理器280和/或决策支持工具290的实施例(例如,生病监视器292)提供。
图4D描绘了通知用户410呼吸道状况确定。在场景431中,智能扬声器402b提供可听消息433,指示基于近期的语音数据,确定用户410可能正在生病。可以根据呼吸道状况跟踪器270的实施例来确定用户可能生病。可听消息433还请求确认与呼吸道状况一致的症状(例如,“您是否感到充血、疲劳或……?”),这可以根据自我报告工具284和/或用户输入响应生成器286的实施例来完成。用户410可以提供可听响应435“有一点”。在图4D的场景432中,响应于用户410感到充血的响应435,由智能扬声器402b提供后续消息437。后续消息437通过请求用户410对用户的充血进行评级来请求来自用户的症状反馈。图4D中的该场景可以在用户提供响应时继续,从而对用户的充血和/或任何其他症状进行评级。
图4E描绘了在用户410和智能扬声器402b之间的进一步交互,因为可以经由用户410的话音数据继续监视用户410的呼吸道状况。在场景441中所示的可听消息443中,智能扬声器402b提醒用户410正在跟踪先前检测到的呼吸道状况(即,感冒),并通知用户410根据较为近期的数据做出的更新后的呼吸道状况确定。具体地,消息443陈述:“……您咳嗽的频率看起来下降了,并且我对您话音的分析表示改善。您现在感觉好点吗?”。然后,用户410提供指示用户410现在感觉好点的可听响应445。在场景442中,智能扬声器402b提供音频消息447,通知用户410对用户410未来呼吸道状况的预测。具体地,消息447通知用户410预测用户410的呼吸道状况将在三天内恢复正常。消息447还提供了继续休息和遵循医嘱的推荐。在图4E中确定用户410的话音正在改善以及确定用户可以在三天内恢复可以由呼吸道状况推断引擎278的实施例来实现,如结合图2所述。
图4F描绘了其中继续监视用户410的呼吸道状况的场景(例如,如场景451中的消息455所指示的:“您仍然处于疾病监视模式……”)。在场景451中,智能扬声器402b输出可听消息455,指示基于对过去几天内收集的话音样本的分析,智能扬声器402b仍处于疾病监视模式下,并且用户410似乎没有好转。在消息455中,智能扬声器402b还询问用户410是否正在服用他的抗生素药物。可以通过处方监视器294的实施例来确定向用户410开了药物。用户410提供响应457(“是的”),指示用户410正在服用药物。在场景452中,智能扬声器402b基于确认用户410正在服药的用户410的响应457,通过网络与一个或多个其他计算系统或设备(如由云458所示)通信。在一个实施例中,智能扬声器402b可以直接或间接地与用户410的护理提供者通信,以重新补充用户410的处方,因为用户410仍然生病。因此,在场景453中,智能扬声器402b输出可听消息459,告诉用户410已经联系了用户的护理提供者并且已经要求重新补充抗生素处方。
图5A-图5E描绘了来自计算设备的各种示例截图,示出了用于计算机软件应用(或app)的示例图形用户界面(GUI)的方面。特别地,在图5A-图5E的截图中描绘的GUI(例如,图5A的GUI 5100)的示例实施例用于计算机软件应用5101,该计算机软件应用5101在这些示例中被称为“呼吸道感染监视应用”。尽管在图5A-图5E中描绘的示例应用被描述为监视呼吸道感染,但也预期本公开类似地一般适用于监视呼吸道状况和呼吸道状况的改变的应用。
示例呼吸道感染监视应用5101可以包括用户话音监视器260、用户交互管理器280和/或其他组件或子组件的实现方式,如结合图2所述。另外地或可替代地,呼吸道感染监视应用5101的一些方面可以包括决策支持应用105a或105b的实现方式和/或可以包括一个或多个决策支持工具290的实现方式,如分别结合图1和图2所述。示例呼吸道感染监视应用5101可以在用户计算设备(或用户设备)5102a上操作(并且可以在其上显示GUI),该用户计算设备(或用户设备)5102a可以体现为用户设备102a-102n中的任何一个,如结合图1所述。图5A-图5E的屏幕截图中描绘的示例GUI的GUI元素中的一些(例如,图5A的汉堡菜单图标5107)可以由用户例如通过触摸或点击GUI元素来选择。例如,用户计算设备5102a的一些实施例可以包括触摸屏或与触控笔或鼠标结合操作的显示器,以促进用户与GUI的交互。
在一些方面,可以设想的是,对诊断患有呼吸道状况(例如,流感、鼻病毒、COVID-19、哮喘等)的患者的规定的或推荐的护理标准可以包括利用呼吸道感染监视应用5101的实施例,该呼吸道感染监视应用5101(如本文所述)可以在用户/患者自己的计算设备(例如,移动设备,或者其他用户设备102a-102n)上操作,或者可以经由用户/患者的保健提供者或药房提供给用户/患者。特别地,用于监视和跟踪呼吸道状况的常规解决方案可能具有主观性(即,来自自我跟踪症状),并且不能够早期检测或对于早期检测是不实用的,以及其他缺陷。但是本文描述的技术的实施例可以为用户提供监视、检测和跟踪呼吸道状况数据的客观、非侵入性和更精确的手段。因此,这些实施例由此实现针对被开有针对呼吸道状况的某些药物的患者可靠地使用技术。以这种方式,医生或保健提供者可以发布医嘱,该医嘱可以包括用户服药和使用计算机决策支持应用(例如,呼吸道感染监视应用5101),以及跟踪和确定处方治疗的更精确的疗效。类似地,医生或保健提供者可以发布医嘱,该医嘱包括(或护理标准可以指定)患者使用计算机决策支持应用以在服用药物之前监视或跟踪用户的呼吸道状况,使得可以基于对提供给计算机决策支持应用的分析、推荐或输出的考虑来开药。例如,在计算机决策支持应用确定用户可能具有呼吸道状况并且似乎没有恢复的情况下,医生可能会开特定的抗生素。此外,通过使保健提供者能够更好地理解处方药的疗效(包括副作用)、修改剂量或改变特定的处方药、或指示用户/患者停止使用(因为由于患者状况改善而不再需要),使用计算机决策支持应用(例如,呼吸道感染监视应用5101)作为针对服用或开具特定药物的患者的护理标准的一部分支持对患者的高效治疗。
参考图5A,示例GUI 5100被描述为示出示例呼吸道感染监视应用5101的方面,该呼吸道感染监视应用5101可用于监视用户的呼吸道状况并提供决策支持。例如,除其他目的外,呼吸道感染监视应用5101的实施例可用于促进获取呼吸道状况数据和/或确定、查看、跟踪、补充或报告关于用户的呼吸道状况的信息。GUI 5100中描绘的示例呼吸道感染监视应用5101可以包括位于GUI 5100顶部附近的标题区域5109,其包括汉堡菜单图标5107、描述符5103、共享图标5104、听诊器图标5106和循环图标5108。选择汉堡菜单图标5107可以为用户提供对呼吸道感染监视应用5101的其他服务、特征或功能的菜单的访问,并且可以进一步包括对帮助、应用版本信息和安全用户帐户登录/注销功能的访问。描述符5103可以在该示例GUI 5100中指示当前日期。如果用户要在这一天开始话音数据收集过程,则该日期是将与用户获取的任何话音相关数据相关联的日期时间,如结合话音分析器5120和图5B所述。在一些实例中,描述符5103可以指示过去的日期(例如,在用户访问历史数据的情况下)、呼吸道感染监视应用5101的模式或功能、对用户的通知,或者可以是空白的。
可以选择共享图标5104以经由电子通信共享各种数据、分析或诊断、报告、用户提供的注释或观察(例如,笔记)。例如,共享图标5104可以促进使用户能够发送电子邮件、上传或传输近期音素特征数据、呼吸道状况改变、推断或预测或其他数据的报告给用户的护理人员。在一些实施例中,共享图标5104可以促进在社交媒体上或与其他类似用户共享经由呼吸道感染监视应用5101捕获、确定、显示或访问的各种数据的方面。在一个实施例中,共享图标5104可以促进与政府机构或卫生部门共享用户的呼吸道状况数据,以及在一些实例中,共享相关数据(例如,位置、历史数据或其他信息),以促进监视呼吸道感染的爆发。该共享信息可能会被去识别以保护用户隐私并在通信之前进行加密。
选择听诊器图标5106可以为用户提供与用户的保健提供者的各种通信或连接选项。例如,选择听诊器图标5106可以发起功能以促进安排远程预约(或请求亲自预约)、共享数据或将数据上传到用户的医疗记录(例如,图2的简档/健康数据(EHR)241)以供用户的保健提供者访问、或者访问保健提供者的在线门户以获取附加服务。在一些实施例中,选择听诊器图标5106可以发起用户向用户的保健提供者传送特定数据(例如,用户当前正在查看的数据)的功能,或者可以ping用户的保健提供者以请求保健提供者查看用户的数据。最后,选择循环图标5108可导致对经由呼吸道感染监视应用5101显示的视图和/或数据的刷新或更新,使得视图是关于可用数据的最新视图。在一些实施例中,选择循环图标5108可以刷新从传感器(或从与来自传感器(例如,图1中的传感器103)的数据收集相关联的计算机应用)和/或从与用户相关联的云数据储存库(例如,在线数据帐户)拉取的数据。
示例GUI 5100还可以包括图标菜单5110,该图标菜单5110包括各种用户可选择的图标5111、5112、5113、5114和5115,这些图标对应于由呼吸道感染监视应用5101的该示例实施例提供的各种附加功能。特别地,选择这些图标可以将用户导航到经由呼吸道感染监视应用5101提供的各种服务或工具。通过示例而非限制的方式,选择主页图标5111可将用户导航到主页屏幕,该主页屏幕可以包括:结合图5A-图5E描述的示例GUI中的一个;欢迎屏幕(例如,图5E中的GUI 5510),其可以包括由呼吸道感染监视应用5101提供的一个或多个共同使用的服务或工具;用户的帐户信息;或任何其他视图(未示出)。
在一些实施例中,对在示例GUI 5100中示为被选择的“话音记录”图标5112的选择可将用户导航到诸如话音分析器5120之类的话音数据获取模式,该话音分析器5120包括应用功能以促进从用户获取话音样本。话音分析器5120的实施例可由包括用户话音监视器260的系统200的一个或多个组件(或其子组件中的一个或多个)执行,如图2所述,并且在一些实例中,话音分析器5120的实施例可由用户交互管理器280(或其子组件中的一个或多个)执行,也如图2所述。例如,用于获取用户话音样本数据的话音分析器5120的功能可以如结合话音样本收集器2604所述的那样执行。
在一些实施例中,话音分析器5120可以提供指令以引导用户通过话音数据收集过程,如图5A中在GUI元素5105上所示,并结合图5B进一步描述。特别地,GUI元素5105描绘了提示用户在一段设定的持续时间内重复声音的重复声音练习的方面。例如,这里要求用户说出5秒的“mmm”声音。在一些实施例中,由话音分析器5120提供的指令可以根据用户交互管理器280或子组件中的一个或多个(例如,用户指令生成器282)来确定或生成。
描述符5103指示当前日期,该日期将与所收集的话音样本相关联。可以提供定时器(GUI元素5122)以促进指示用户何时开始或结束记录话音样本。还可以显示视觉话音样本记录指示符(GUI元素5123)以向用户提供关于话音样本记录的反馈。在实施例中,用于GUI元素5122和5123的操作由结合图2所述的用户输入响应生成器286执行。其他视觉指示符(未示出)可以包括但不限于背景噪声级别、麦克风级别、音量、进度指示符或结合用户输入响应生成器286描述的其他指示符。
在一些实施例(未示出)中,话音分析器5120可以显示用户在时间间隔(例如,一天或半天)内获取话音相关数据的进度。例如,在通过随意交互或通过朗读段落获取话音相关数据的情况下,话音分析器5120可以描绘用户进度的指示(例如,接近完成的百分比、钟面(dial)或滑动进度条),或者已经成功地从用户的语音中获得或尚未获得的音素的指示。针对由话音分析器5120执行的示例话音数据收集过程的附加GUI和细节将结合图5B描述。
再次参考图5A,继续GUI 5100和图标菜单5110,选择展望图标5113可将用户导航到用于向用户提供关于用户呼吸道状况的工具和信息的GUI和功能。这可以包括例如关于用户当前呼吸道状况、趋势、预测或推荐的信息。与展望图标5113相关联的功能的附加细节将结合图5C描述。选择日志图标5114(图5A)可将用户导航到日志工具,该日志工具包括用于促进呼吸道状况跟踪或监视的功能,如结合图5D和图5E所描述的。在实施例中,与日志工具或日志图标5114相关联的功能可以包括用于接收和查看用户生理数据、症状数据或其他上下文信息的GUI和工具或服务。例如,日志工具的一个实施例包括用于记录用户症状的自我报告工具,如结合图5D和图5E所述。
在一些实施例中,选择设置图标5115可将用户导航到用户设置配置模式,该用户设置配置模式可以实现指定呼吸道感染监视应用5101的各种用户偏好、设置或配置、话音相关数据的方面(例如,灵敏度阈值、音素特征比较设置、关于音素特征的配置、或关于话音相关数据的获取或分析的其他设置)、用户帐户、关于用户的护理提供者、护理人员、保险、诊断或状况、用户护理/治疗或其他设置的信息。在一些实施例中,设置的至少一部分可以由用户的保健提供者或临床医生配置。经由设置图标5115可访问的一些设置可以包括结合图2的设置249讨论的设置。
现在转向图5B,提供了示例GUI 5210、5220、5230和5240的序列5200,示出了用于获取话音相关数据的示例过程的方面,其中用户被引导提供各种发声的话音样本。在序列5200的GUI中描绘的过程可以由在用户计算设备5102a上操作的呼吸道感染监视应用5101提供,该用户计算设备5102a可以显示GUI 5210、5220、5230和5240。在实施例中,在GUI5210、5220、5230和5240中描绘的功能由呼吸道感染监视应用5101的话音数据获取模式(例如,图5A中描述的话音分析器5120)提供,并且可以通过选择GUI 5100的语音识别图标5112(图5A)来访问或发起。在GUI 5210、5220、5230和5240中描绘的用于引导用户的指令(例如,指令5213)可以根据用户交互管理器280或者子组件中的一个或多个(例如,用户指令生成器282)来确定或生成。
如GUI 5210所示,指令5213被示为引导用户发出连续声音作为重复声音练习的一部分。重复声音练习可以包括由用户执行的一个或多个发声任务。在该示例中,用户可以通过选择启动按钮5215来开始练习(或练习中的任务)。GUI 5210还描绘了进度指示符5214,该进度指示符5214是指示用户针对该会话或时间间隔提供话音样本数据的进度(例如,60%完成)的滑动条。
GUI 5220、5230和5240继续描绘引导用户发出连续声音作为重复声音练习的一部分的方面。如序列5200所示,示例GUI 5220、5230和5240包括各种视觉指示符,以促进引导用户或向用户提供反馈。例如,GUI 5220包括GUI元素5222,其示出了倒计时定时器和背景噪声检查的指示符。GUI元素5222的倒计时定时器指示直到用户应该开始发声的时间。GUI5230包括GUI元素5232,其示出定时器的另一示例,在该实例中,定时器指示用户已经持续发出“ahhh”声音的持续时间。类似地,GUI 5240包括GUI元素5242,其示出定时器的示例,在该实例中,定时器指示用户已经发出“mmm”声音5秒。GUI 5240还包括GUI元素5243,其向用户提供关于“mmm”声音的话音样本记录的反馈。如前所述,可以由用户输入响应生成器286提供与视觉指示符相关联的功能,该视觉指示符例如为进度指示符5214、GUI元素5222的倒计时定时器和背景噪声指示符、GUI元素5232和5242的定时器或GUI元素5243的话音样本记录指示符。结合用户输入响应生成器286描述了可提供的视觉指示符和用户反馈操作的附加示例。
继续序列5200,GUI 5240可以表示用于获取话音样本数据的重复声音练习的最后阶段,或者可以表示用于获取话音样本数据的过程的多个阶段中的一个阶段的结束。例如,随后可能执行附加的发声任务或练习。在提供话音样本时,用户可以通过选择完成按钮5245来结束练习(或练习内的任务)。可替代地,如果用户期望重做任务并提供另一话音样本,则用户可以选择GUI元素5244以重新开始任务。在一些实施例中,例如,在话音样本被确定为不足的情况下,可以向用户提供重做任务的指示或指令,如结合样本记录审计器2608和用户输入响应生成器286所述。
序列5200中示出的用于收集话音相关数据的示例过程涉及利用指令提示用户作为重复声音练习的一部分。然而,如本文所述,呼吸道感染监视应用5101的其他实施例可以从随意交互中获取话音相关数据。此外,在一些实施例中,可以从随意交互的组合和从重复声音练习中收集话音相关数据,例如,图5B中的示例。例如,在随意交互对于给定时间间隔(例如,对于该天或半天)没有产生足够的或特定类型的可用话音相关数据的情况下,可以(例如,经由呼吸道感染监视应用5101)通知用户经由重复声音练习或类似交互来提供附加的话音相关数据。在一些实施例中,用户可以配置用于如何获取其话音相关数据的选项,例如,经由设置图标5115或如结合图2的设置249所述。
现在转向图5C,描绘了包括GUI 5300的呼吸道感染监视应用5101的另一方面。GUI5300包括用于显示用户的呼吸道状况展望(例如,展望5301)的各种用户界面(UI)元素,并且可以通过选择GUI 5100的展望图标5113(图5A)来访问或发起GUI 5300中描绘的功能。示例GUI 5300还包括描述符5303,该描述符5305指示用户正在访问呼吸道感染监视应用5101的展望功能的当前日期(例如,今天5月4日)和用户的展望5301,其指示用户处于呼吸道感染监视应用5101的展望操作模式下(或正在访问展望功能)。如图5C所示,图标菜单5110指示选择了展望图标5113,其可以向用户呈现描绘用户的展望5301的GUI 5300。展望5301可以包括用户的呼吸道状况确定和/或预测和相关信息。例如,展望5301可以包括呼吸道状况分数5312、传播风险5314(其可包括相关推荐5315)以及趋势信息(例如,趋势描述符5316和GUI元素5318)。
如本文所述,呼吸道状况分数5312可量化或表征用户的呼吸道状况,其可表示用户当前的呼吸道状况、用户呼吸道状况的改变或者用户未来可能的呼吸道状况。如本文进一步描述的,呼吸道状况分数5312可以基于用户的话音相关数据,例如通过图5B所示的示例过程获取的或者结合图2中的用户话音监视器260描述的话音相关数据。在一些实例中,呼吸道状况分数5312还可以基于上下文信息,例如,用户观察(例如,自我报告症状分数)、健康或生理数据(例如,由可穿戴传感器或用户的健康记录提供的数据)、天气、位置、社区感染信息(例如,用户地理位置中的当前感染率)或其他上下文。结合图2的呼吸道状况推断引擎278和图6B的方法6200提供确定呼吸道状况分数5312的附加细节。
GUI 5300中的传播风险5314可以指示用户传播检测到的呼吸道相关感染剂的风险。可以如结合图2的呼吸道状况推断引擎278和用户状况推断逻辑237所描述的那样确定传播风险5314。传播风险可以是定量或分类指示符,例如,在示例GUI 5300中指示中到高风险的“中-高”。除了传播风险5314之外,展望5301可以提供推荐5315,其可以包括减少传播风险的推荐做法,例如,戴口罩、保持社交距离、自我隔离(呆在家里)或咨询保健提供者。
这些推荐5315可以包括预先确定的推荐,并且在一些实施例中,可以根据规则集合基于特定检测到的呼吸道状况和/或传播风险5314来确定这些推荐5315。在一些实施例中,可以基于用户的历史信息(例如,历史话音相关信息)和/或上下文信息(例如,地理位置)来为用户定制推荐5315。用于确定推荐5315的附加细节将结合图2的呼吸道状况推断引擎278和用户状况推断逻辑237来描述。
展望5301可以提供趋势信息(例如,趋势描述符5316),以及在一些实施例中,展望5301可以提供GUI元素5318,该GUI元素5318提供用户呼吸道状况随时间的趋势或改变的可视化。趋势描述符5316可以指示先前或当前检测到的用户呼吸道状况的改变。这里,趋势描述符5316表示用户的呼吸道状况正在恶化。此外,GUI元素5318可以包括用户数据的图或图表,或者示出用户呼吸道状况的改变(例如,从过去14天的话音样本中检测到的音素特征的改变)的其他视觉指示。在其他实施例中,展望5301另外地或可替代地提供对用户呼吸道状况未来可能趋势的预测。例如,在一些实施例中,GUI元素5318可指示未来日期并预测用户呼吸道状况的未来改变,如结合呼吸道状况推断引擎278所述。在一个实施例中,展望5301提供预测,指示用户何时可能从呼吸道感染中恢复(例如,“您应该将在3天内恢复正常。”)。可由展望5301提供的另一示例预测包括早期警告预测(例如,在第一次检测到可能的呼吸道感染时),该早期警告预测是指示用户可能预期在未来时间间隔处生病的预测(例如,“您似乎正在发展呼吸道感染,并且可能在周末感到生病。”)。
在一些实例中,呼吸道感染监视应用5101可以生成或向用户(或护理人员或临床医生)提供关于预测或关于由展望5301提供的其他信息的电子通知。由展望5301提供的信息可以包括用于生成趋势描述符5316和/或GUI元素5318的趋势或预测信息,该信息可以由呼吸道状况跟踪器270或其子组件中的一个或多个(例如,图2中的呼吸道状况推断引擎278)的示例实施例确定。结合图2中的呼吸道状况跟踪器270描述了确定呼吸道状况信息、传播风险5314、推荐5315、预测或趋势信息5316的附加细节。
现在转向图5D,描绘了包括GUI 5400的呼吸道感染监视应用5101的另一方面。GUI5400包括用于显示或接收呼吸道状况相关信息(例如,呼吸道症状)的UI元素,并且对应于由日志图标5114指示的日志功能。特别地,GUI 5400描绘了用于记录、查看以及在一些方面注释当前或历史用户数据的日志工具5401的示例。可以通过从图标菜单5110中选择日志图标5114来访问日志工具5401。在一些实施例中,在确定用户正在或可能患有呼吸道感染时,可以将日志工具5401(或下文描述的自我报告工具5415)呈现给用户(或者用户可以接收访问日志工具5401的通知)。示例GUI 5400还包括描述符5403,其指示由日志工具5401显示的信息是针对5月4日星期一的日期。在日志工具5401的一些实施例中,用户可以例如通过选择日期箭头5403a或通过选择历史选项卡5440然后从日历视图(未示出)中选择特定日历日期,以导航到先前日期访问历史数据。
如呼吸道感染监视应用5101的该示例GUI 5400所示,日志工具5401包括五个可选选项卡:添加症状5410、笔记5420、报告5430、历史5440和治疗5450。这些选项卡可以对应于日志工具5401提供的附加功能。例如,如GUI 5400所示,选择用于添加症状5410的选项卡,因此向用户呈现各种UI组件以自我报告可能与他们的呼吸道状况相关的症状。特别地,对应于添加症状5410的功能包括自我报告工具5415,其包括症状列表和用于接收关于用户正在经历每个症状的严重性的用户输入的用户可选滑块。例如,GUI 5400中示出的自我报告工具5415描绘了用户正在经历中等水平的呼吸急促和充血以及严重咳嗽。在一些实施例中,用户可以利用自我报告工具5415每天或一天多次(例如,每天早上和每天晚上)输入该症状数据。在一些实例中,症状数据可以在或接近从用户收集话音相关数据的时间间隔被键入。
在一些实施例中,添加症状5410(或日志工具5401)还可以包括可选选项5412,其用于用户从诸如可穿戴智能设备或类似传感器之类的另一计算设备输入数据。例如,用户可以选择从健身跟踪器输入数据,使得日志工具5401可以接收数据。在一些实施例中,可以直接和/或自动地从智能设备或从与设备相关联的数据库(例如,在线帐户)接收数据。在一些实例中,用户可能需要将设备与其呼吸道感染监视应用5101(或与关联于呼吸道感染监视应用5101的用户帐户)链接或相关联,以便输入数据。在一些实施例中,用户可以(例如,通过选择设置图标5115,如图5A所述)在应用设置中配置用于从另一设备输入数据的各种参数。例如,当要输入数据时,用户可以指定要输入哪些数据(例如,由智能手表获取的用户睡眠数据),或者可以配置许可设置、帐户链接或其他设置。
通过示例而非限制的方式,输入这样的数据以利用可选选项5412可以结合或不结合自我报告工具5415使用。例如,从链接的智能设备导入的数据可以基于用户输入到链接的智能设备中的信息来提供症状的初始严重性评级,但是用户可以利用自我报告工具5415来调整这些初始评级。另外,添加症状5410可以包括另一可选选项5418,以指示自用户上次记录症状(例如,前一天)以来症状没有改变。与GUI 5400中的添加症状5410相关联的功能和UI元素可以通过利用用户交互管理器280或者一个或多个子组件(例如,结合图2描述的自我报告工具284)的实施例来生成。
继续图5D所示的GUI 5400,用于笔记5420的选项卡可将用户导航到用于呼吸道感染监视应用5101的功能(或更具体地,与日志工具5401相关联的日志功能),以接收或显示来自用户或护理人员针对该特定日期(此处为5月4日)的观察数据。观察数据的示例可以包括记录或涉及用户的呼吸道状况(例如,症状)的笔记5420。在一些实施例中,笔记5420包括用于从用户接收文本(或音频或视频记录)的UI。在一些方面中,笔记5420的UI功能可以包括示出人体的GUI元素,其被配置为从用户接收指示受潜在或已知呼吸道状况、症状或副作用影响的用户身体区域的输入。在一些实施例中,用户可以键入上下文信息,例如,用户的地理位置、天气和用户在一天中参与的任何体育活动。
用于报告5430的选项卡可将用户导航到用于查看和生成由本文描述的实施例检测到的呼吸道状况相关数据的各种报告的GUI。例如,报告5430可以包括关于用户的呼吸道状况或用户的呼吸道状况的预测的历史或趋势信息。在另一示例中,报告5430可以包括更大人群的呼吸道状况信息的报告。例如,报告5430可以示出呼吸道感染监视应用5101的大量其他用户,其中针对这些用户检测到相同或类似的呼吸道状况。在一些实施例中,由报告5430提供的功能可以包括用于格式化或准备要传送到护理人员或临床医生或与其共享(例如,经由图5A的共享图标5104或听诊器图标5106)的呼吸道状况相关数据的操作。
用于历史5440的选项卡可将用户导航到用于查看与呼吸道状况监视相关的用户历史数据的GUI。例如,选择历史5440可以显示具有日历视图的GUI。日历视图可以促进访问或显示用户在不同日期检测和解释的呼吸道状况相关数据。例如,通过选择显示的日历内的特定先前日期,可以向用户呈现该日期的数据摘要。在选择用于历史5440的选项卡时显示的日历视图GUI的一些实施例中,指示符或信息可以在日历的日期上显示,指示与该日期相关联的检测或预测的呼吸道状况信息。
在GUI 5400上选择指示治疗5450的选项卡可将用户导航到呼吸道感染监视应用5101内的GUI,该GUI具有用于用户指定细节(例如,用户在该日期是否接受了任何治疗和/或有任何副作用)的功能。例如,用户可以指定用户在特定日期服用了处方抗生素或接受了呼吸治疗。还可以设想,在一些实施例中,可以包括所谓物联网(IoT)功能的智能药箱或智能容器可以自动检测用户已经提取了存储在容器内的药物,并且可以向呼吸道感染监视应用5101传送指示用户在该日期接受了治疗的指示。在一些实施例中,用于治疗5450的选项卡可以包括UI,使得用户(或用户的护理人员或临床医生)能够例如通过选择指示用户在该日期遵循的治疗种类(例如,服用处方药、服用非处方药、饮用大量清澈液体、休息等)的复选框来指定他们的治疗。
转向图5E,提供示例GUI 5510、5520和5530的序列5500,示出了用于用户发起的症状报告的示例过程的方面。GUI 5510、5520和5530可以根据结合图2所描述的自我报告工具284的实施例来生成。在一些实例中,当用户在用户计算设备5102a上启动呼吸道感染监视应用5101时,GUI5510可被提供为欢迎/登录屏幕。如本文所述,呼吸道感染监视应用5101可与特定用户相关联,该特定用户可由用户帐户指示。如所描绘的,GUI 5510包括用于用户输入用户凭证(即,用户标识符,例如,电子邮件地址和密码)以识别用户的UI元素,使得可以访问特定于用户的信息,并且可以与用户相关联地适当存储用户输入。在用户经由GUI5510登录之后,可以向GUI 5520提供提示用户报告症状的初始指令。GUI 5520可以包括可选的“症状报告”按钮,该按钮可以导致呈现具有用于促进用户症状信息的输入的UI元素的GUI 5530。在GUI 5530的示例实施例中,用户可以通过针对GUI 5530内显示的每个症状将滑块移动到的适当严重性级别来对症状的严重性进行评级。结合图5D的GUI 5400描述症状信息的用户输入的进一步细节。
图6A和图6B描绘了用于监视用户呼吸道状况的示例方法的流程图。例如,图6A描绘了示出根据本公开的实施例的用于获得音素特征的示例方法6100的流程图。图6B描绘了示出根据本公开的实施例的用于基于音素特征监视用户的呼吸道状况的示例方法6200的流程图。方法6100和6200的每个框或步骤包括可以使用硬件、固件和/或软件的任何组合来执行的计算过程。例如,各种功能可以由执行存储在存储器中的指令的处理器来实施。这些方法还可以体现为存储在计算机存储介质上的计算机可用指令。这些方法可以由独立应用、服务或托管服务(独立的或与另一托管服务组合)或到另一产品的插件提供,仅举几例。因此,方法6100和6200可以由一个或多个计算设备(例如,智能电话或其他用户设备、服务器或分布式计算平台,例如,在云环境中)执行。覆盖音素特征提取的实现方式的计算机程序例程的示例方面在图15A-图15M中被说明性地描绘。
转向图6A的方法6100,根据本公开的实施例,方法6100包括用于检测音素特征的步骤,并且方法6100的实施例可以由系统200的一个或多个组件(例如,结合图2描述的用户话音监视器260)的实施例执行。在步骤6110处,接收音频数据。在一些实施例中,步骤6110由结合图2描述的话音样本收集器2604的实施例执行。结合话音样本收集器2604和用户话音监视器260描述步骤6110的附加实施例。
在步骤6110中接收到的音频数据可以包括用户发出单独的音素声音或音素的组合(例如,脚本或非脚本语音)的记录(例如,音频样本、话音样本)。以这种方式,音频数据包括关于用户的话音信息。音频数据可以在用户与用户设备(例如,图1的用户设备102a-102n)的随意或日常交互期间收集,该用户设备具有诸如麦克风之类的传感器(例如,图1的传感器103的实施例)。
方法6100的一些实施例包括在步骤6110中接收音频数据之前执行的操作。例如,可以执行用于确定用于获得可用音频数据的适当或优化配置的操作,例如,确定传感器(例如,麦克风)的声学参数和/或修改声学参数,例如,信号强度、方向性、灵敏度、频率和信噪比(SNR)。这些操作可以结合图2的声音记录优化器2602。类似地,这些操作可以包括识别以及在一些方面移除或降低背景噪声,如结合图2的背景噪声分析器2603所述。这些步骤可以包括将噪声强度级别与最大阈值进行比较、检查预定频率内的语音、以及检查间歇性尖峰或类似的声学伪影。
在一些实施例中,可以提供用户指令以促进接收音频数据。例如,可以通过跟随语音相关任务来引导用户提供音频数据。用户指令还可以包括基于最近期提供的样本的反馈,例如,指示用户大声说话或长时间保持发声音素。与用户交互以促进接收音频数据可以通常通过结合图2描述的用户交互管理器280或其子组件(用户指令生成器282)的实施例来执行。
在步骤6120处,确定对应于时间间隔的日期时间值。日期时间值可以是从用户的发声接收或记录音频数据的时间。在一些实施例中,步骤6120由结合图2描述的话音样本收集器2604的实施例执行。
在步骤6130处,处理音频数据的至少一部分以确定音素。步骤6130的一些实施例可以通过结合图2所描述的音素分割器2610的实施例来执行。根据音频数据的一部分来确定音素可以包括对音频数据的一部分执行自动语音识别(ASR)以检测音素,并将检测到的音素与音频数据的一部分进行关联。ASR可以根据音频数据的一部分确定文本(例如,单词),并且可以基于识别出的文本来确定音素。可替代地,确定音素可以包括接收对应于音频数据的一部分的音素的指示,并且将音素与音频数据的一部分进行关联。在音频数据是基于给用户的语音相关任务的持续音素发声的情况下,该过程可能特别有用。例如,可以指示用户说“aaa”5秒,然后说“eee”5秒,然后说“nnnn”5秒,然后说“mmm”5秒,并且这些指令可以指示音频数据所期望的音素(即/a/、/e/、/n/和/m/)的次序。
处理音频数据以确定音素可以包括检测和隔离特定音素。在一个实施例中,检测对应于/a/、/e/、/i/、/u/、/ae/、/n/、/m/和/ng/的音素。在另一实施例中,仅检测/a/、/e/、/m/和/n/。可替代地,处理音频数据可以包括检测存在哪些音素和隔离所有检测到的音素。可以通过应用强度阈值来从用户的话音中分离背景噪声来检测音素,如结合图2的音素分割器2610进一步描述的。
在步骤6130中处理音频数据的一些方面可以包括附加处理步骤,其可由图2的信号准备处理器2606的实施例执行。例如,可以应用频率滤波(例如,高通或带通滤波)以去除或衰减音频数据中表示背景噪声的频率。在一个实施例中,例如,应用1.5千赫兹(kHz)至6.4kHz的带通滤波器。步骤6130还可以包括执行音频归一化以实现目标信号幅度级别、通过应用频带滤波器和/或放大器实现SNR改进、或实现其他信号调节或预处理。
在步骤6140处,基于确定出的音素,确定音素特征集。步骤6140的一些实施例由结合图2所描述的声学特征提取器2614的实施例来执行。音素特征集包括表征音频数据的经处理的部分的至少一个声学特征。特征集可以包括功率和功率可变性、音高和音高可变性、频谱结构和/或共振峰的测量,这些将结合声学特征提取器2614进一步描述。在一些实施例中,针对在音频数据中检测到的不同音素确定不同的特征集(即,声学特征的不同组合)。例如,在示例性实施例中,针对/n/音素确定12个特征,针对/m/音素确定12个特征,以及针对/a/音素确定8个特征。检测到的/a/音素的特征集可以包括:共振峰1(F1)带宽的标准差;音高四分位距;针对1.6千赫兹(kHz)至3.2kHz频率确定的频谱熵;抖动;梅尔频率倒谱系数MFCC9和MFCC12的标准差;梅尔频率倒谱系数MFCC6的平均值;以及针对3.2kHz至6.4kHz频率确定的频谱对比度。检测到的/n/音素的特征集可以包括:谐度;F1带宽的标准差;音高四分位距;针对1.5kHz至2.5kHz和1.6kHz至3.2kHz频率确定的频谱熵;针对1.5kHz至2.5kHz频率确定的频谱平坦度;梅尔频率倒谱系数MFCC1、MFCC2、MFCC3和MFCC11的标准差;梅尔频率倒谱系数MFCC8的平均值;以及针对1.6kHz至3.2kHz频率确定的频谱对比度。检测到的/m/音素的特征集可以包括:谐度;F1带宽的标准差;音高四分位距;针对1.5kHz至2.5kHz和1.6kHz至3.2kHz频率确定的频谱熵;针对1.5kHz至2.5kHz频率确定的频谱平坦度;梅尔频率倒谱系数MFCC2和MFCC10的标准差;梅尔频率倒谱系数MFCC8的平均值;微扰;针对3.2kHz至6.4kHz频率确定的频谱对比度;以及200赫兹(Hz)第三倍频带的标准差。另外,在一些实施例中,可以变换特征集中的一个或多个特征的值。在示例实施例中,将对数变换应用于音高四分位距、MFCC的标准差、频谱对比度、抖动和200Hz第三倍频带内的标准差。
在步骤6155处,确定是否存在要处理的附加音频数据。在一些实施例中,步骤6155由用户话音监视器260的实施例执行。如所描述的,接收到的音频数据可以是多个持续音素或语音(脚本或非脚本)的记录,并且因此可以具有多个音素。以这种方式,可以处理音频数据的不同部分以检测不同的音素。例如,第一部分可被处理以确定第一音素,第二部分可被处理以确定第二音素,并且第三部分可被处理以检测第三音素,其中第一音素、第二音素和第三音素可分别对应于/a/、/n/和/m/。在一些方面,第四部分被处理以检测第四音素,其中第四音素可以是/e/。这些音素可以由在一个记录中发出这三个音素的用户来记录。因此,步骤6155中的附加音频数据可以包括已经被部分处理的相同话音样本的附加部分。另外地或可替代地,步骤6155可以包括根据在相同会话中记录的(即,在相同时间帧中获取的)附加话音样本确定是否存在要处理的附加音频数据。例如,这三个音素可以记录在来自同一会话的独立记录中。
如果在步骤6155处存在要处理的剩余附加音频数据,则可以对附加音频数据部分执行步骤6130和6140。图6A描绘了在处理音频数据的初始部分并且针对检测到的音素确定特征集之后发生的步骤6155;然而,可以设想,方法6100的实施例可以包括在提取任何特征集之前,在步骤6155中确定是否存在要处理的用于检测附加音素的附加音频数据。
当不存在要处理的剩余附加音频数据和要确定的剩余特征集时,方法6100进行到步骤6160,其中从音频数据提取的音素特征集存储在与用户相关联的记录中。所存储的音素特征集包括日期时间值的指示。在一些实施例中,步骤6160由用户话音监视器260或更具体地由声学特征提取器2614的实施例执行。音素特征集可以存储在用户的个人记录(例如,个人记录240)中。更具体地,音素特征集可以存储为向量并存储为图2中的音素特征向量244。
方法6100的一些实施例包括用于随时间监视用户呼吸道状况以及在一些方面用于检测用户呼吸道状况的改变的附加操作。例如,对于在第一时间间隔内记录的第一音频数据样本可执行步骤6110至6160,并且对于在第二后续的时间间隔内记录的第二音频数据样本可重复步骤6110至6160。因此,可以针对第一时间间隔确定并存储第一音素特征集,并且可以针对第二时间间隔确定并存储第二音素特征集。然后,方法6100可以包括利用第一音素特征集和第二音素特征集来监视用户随时间的呼吸道状况的操作。例如,可以比较第一音素特征集和第二音素特征集以检测改变。该比较操作可以由音素特征比较器274的实施例执行,并且可以包括确定第一时间间隔和第二时间间隔的特征集向量之间的特征距离测量(例如,Euclidean距离)。基于特征距离测量(例如,测量的幅度和/或它是正的还是负的),可以确定用户的呼吸道状况在第二时间间隔与第一时间间隔之间是否已经改变。
在一些实施例中,方法6100还包括接收与时间间隔(例如,第一时间间隔和/或第二时间间隔)相关联的上下文信息,并将上下文信息与针对相关时间间隔确定的特征集相关联地存储在记录中。这些操作可以由图2的上下文信息确定器2616的实施例执行。上下文信息可以包括用户的生理数据,其可以是自我报告的、从一个或多个生理传感器接收的、和/或根据用户的电子健康记录(例如,图2中的简档/健康数据(EHR)241)确定的。另外地或可替代地,上下文信息可以包括用户在相关时间间隔期间的位置信息或者与第一时间间隔相关联的其他上下文信息。步骤6140的实施例可以包括确定音素特征集,该音素特征集还是基于相关时间间隔的上下文数据来确定的。
转向图6B,根据本公开的实施例,方法6200包括用于基于音素特征来监视用户的呼吸道状况的步骤。方法6200可以由系统200的一个或多个组件(例如,结合图2描述的呼吸道状况跟踪器270)的实施例执行。步骤6210包括接收表示用户在不同时间的话音信息的音素特征向量(也可称为音素特征集)。因此,第一音素特征向量(即,第一音素特征集)与第一日期时间值相关联,并且第二音素特征向量(即,第二音素特征集)与在第一日期时间值之后发生的第二日期时间值相关联。例如,第一音素特征向量可以基于在第一间隔(其对应于第一时间日期值)期间捕获的音频数据,该第一间隔位于捕获用于在第二间隔(其对应于第二时间日期值)期间确定第二音素特征向量的音频数据的大约24小时内(例如,在18至36小时之间)。可以预期,在第一时间日期值与第二时间日期值之间的时间可以更短(例如,8到12小时)或更长(例如,3天、5天、1周、2周)。步骤6210通常可以由呼吸道状况跟踪器270执行,或者更具体地由特征向量时间序列组装器272或音素特征比较器274来执行。
可以根据图6A的方法6100的实施例来执行对第一音素特征向量和第二音素特征向量的确定。在一些实施例中,确定第一音素特征集和/或第二音素特征集可以通过以下来完成:处理包括话音信息的音频信息来确定第一音素集和/或第二音素集,并且对于集合内的每个音素提取表征音素的特征集。在一些实施例中,第一特征向量和第二特征向量包括表征音素/a/、/m/和/n/的声学特征值。在示例性实施例中,第一特征向量和第二特征向量各自包括用于音素/a/的8个特征、用于音素/n/的12个特征和用于音素/m/的12个特征。音素/a/的特征可以包括:共振峰1(F1)带宽的标准差;音高四分位距;针对1.6千赫兹(kHz)至3.2kHz频率确定的频谱熵;抖动;梅尔频率倒谱系数MFCC9和MFCC12的标准差;梅尔频率倒谱系数MFCC6的平均值;以及针对3.2kHz至6.4kHz频率确定的频谱对比度。音素/n/的特征可以包括:谐度;F1带宽的标准差;音高四分位距;针对1.5kHz至2.5kHz和1.6kHz至3.2kHz频率确定的频谱熵;针对1.5kHz至2.5kHz频率确定的频谱平坦度;梅尔频率倒谱系数MFCC1、MFCC2、MFCC3和MFCC11的标准差;梅尔频率倒谱系数MFCC8的平均值;以及针对1.6kHz至3.2kHz频率确定的频谱对比度。因素/m/的特征可以包括:谐度;F1带宽的标准差;音高四分位距;针对1.5kHz至2.5kHz和1.6kHz至3.2kHz频率确定的频谱熵;针对1.5kHz至2.5kHz频率确定的频谱平坦度;梅尔频率倒谱系数MFCC2和MFCC10的标准差;梅尔频率倒谱系数MFCC8的平均值;微扰;针对3.2kHz至6.4kHz频率确定的频谱对比度;以及200赫兹(Hz)第三倍频带的标准差。在一些实施例中,这些特征中的一个或多个被提取到表征的/e/音素。
在一些实施例中,针对第一时间间隔确定的第一音素特征向量基于来自在第二日期时间值之前捕获的多个音频样本的多个音素特征集。第一特征向量可以表示多个音素特征向量的组合,例如,平均值。这些多个音频样本可以取自已知或假定个人是健康的(即,没有呼吸道感染)的时间,使得第一特征向量可以表示健康基线。可替代地,用于确定第一音素特征向量的音频样本可以取自已知或假定个人生病(即,具有呼吸道感染)的时间,并且第一音素特征向量可以表示生病基线。
步骤6220包括执行对第一音素特征向量和第二音素特征向量的比较以确定音素特征集距离。在一些实施例中,步骤6220可以由图2的音素特征比较器274的实施例来执行。在一些实施例中,该比较包括确定在第一音素特征集与第二音素特征集之间的Euclidean距离。可以将由特征向量表示的每个特征与另一特征向量内的对应特征进行比较。例如,可以将第一音素特征向量中的第一特征(例如,音素/a/的抖动)与第二音素特征向量中的对应特征(例如,音素/a/的抖动)进行比较。
在步骤6230处,基于在第一音素特征向量与第二音素特征向量之间的音素特征集距离来确定用户的呼吸道状况已经改变。在一些实施例中,步骤6230由结合图2所述的呼吸道状况推断引擎278的实施例执行。确定用户的呼吸道状况已经改变可以是确定音素特征集距离满足阈值距离(例如,状况改变阈值),该阈值距离可以由护理人员或临床医生预先确定,或者基于用户的生理数据(例如,自我报告的)、用户设置或用户的历史呼吸道状况信息来确定。可替代地,状况改变阈值可以基于被监视个人的参考人群来预先设置。
在一些实施例中,确定用户的呼吸道状况已经改变可以包括确定用户的呼吸道状况是改善、恶化还是根本没有改变(例如,没有改善也没有恶化)。这可以包括将确定出的音素特征集距离与状况变化基线进行比较,该状况变化基线可以是根据关于参考群体的信息确定的通用基线,或者可以是基于先前的用户数据针对用户确定的。例如,可以根据在确定用户没有呼吸道感染时捕获的音频数据来确定表示健康基线的第三音素特征向量,并且通过在第二(即,最近期的)音素特征向量与第三(即,基线)音素特征向量之间执行第二比较来确定第二音素特征集距离。还可以通过在第一(即,较早)音素特征向量与第三(即,基线)音素特征向量之间执行第三比较来确定第三音素特征集距离。将第三音素特征集距离(表示健康基线与第一音素特征向量之间的改变)与第二音素特征集距离(表示健康基线与来自第一因素特征向量之后捕获的数据的第二音素特征向量之间的改变)进行比较。如果第二音素特征集距离小于第三特征集距离(使得来自最近期获得的数据的向量更接近健康基线),则可以确定用户的呼吸道状况正在改善。如果第二音素特征集距离大于第三特征集距离(使得来自最近期获得的数据的向量远离健康基线),则可以确定用户的呼吸道状况正在恶化。如果第二音素特征集距离等于第三特征集距离,则可以确定用户的呼吸道状况没有改变(或至少没有总体改善或恶化)。
在步骤6240处,基于确定出的用户呼吸道状况的改变而发起动作。示例动作可以包括用于治疗呼吸道状况和/或该状况的症状的动作和推荐。步骤6240可由图2中的决策支持工具290(包括生病监视器292、处方监视器294和/或药物疗效跟踪器296)和/或呈现组件220的实施例执行。
动作可以包括经由用户设备(例如,图1中的用户设备102a-102n)向用户或者经由临床医生用户设备(例如,图1中的临床医生用户设备108)向临床医生发送或以其他方式电子传送警报或通知。通知可以指示用户的呼吸道状况是否存在改变,以及在一些实施例中,通知可以指示该变化是否是改善。通知或警报可以包括量化或表征用户的呼吸道状况和/或呼吸道状况的当前状态的改变的呼吸道状况分数。
在一些实施例中,动作还可以包括处理用于决策制订的呼吸道状况信息,其可以包括基于用户的呼吸道状况提供治疗和支持的推荐。这种推荐可以包括推荐咨询保健提供者、继续现有处方或非处方药(例如,重新补充处方)、修改当前治疗的剂量和药物和/或继续监视呼吸道状况。推荐中的这些动作中的一个或多个可以响应于检测到的呼吸道状况的改变(或缺乏改变)而执行。例如,通过本公开的实施例,可以基于确定出的改变(或缺乏改变)来安排与用户的保健提供者的预约和/或可以重新补充处方。
图7至图14描绘了实际上付诸实践的本公开的示例实施例的各种方面。例如,图7至图14示出了分析的声学特征的方面、在声学特征与用户呼吸道状况(包括症状)之间的相关性、以及自我报告信息。图中反映的信息可能已经通过多个收集的检查点(例如,在诊所/实验室和/或在家中)针对多个用户收集。结合图3B描述了收集信息的示例过程。
在一个实施例中,图7描绘了示例声学特征随时间的代表性改变。在该实施例中,从在两个收集检查点(访问1和访问2)中获得的话音样本中提取声学特征。访问1可以表示用户生病期间的收集检查点,而访问2可以表示用户健康期间(即,已经从生病中恢复)的收集检查点。如图7所示,针对七个音素测量特征,并且图710、720和730描绘了在两次访问之间每个音素的声学特征的改变。图710描绘了抖动(音高不稳定性的测量)的改变;图720描绘了微扰(幅度的测量)的改变;以及图730描绘了频谱对比度的改变。图710和720示出了对于所有音素,在恢复期间(即,在访问1和访问2之间)的抖动和微扰减小,从而指示个人在从呼吸道感染恢复后可能具有更好的声音稳定性。图730示出了对于鼻音(/n/、/m/和/ng/),在较高频率处的频谱对比度增加,这与鼻腔共振在恢复期间随着充血减少而更加明显是一致的。
图8描绘了呼吸道感染症状衰减常数的图形表示。直方图810示出了针对所有症状的衰减常数,直方图820示出了针对充血症状的衰减常数,以及直方图830示出了针对非充血症状的衰减常数。充血症状的示例可以包括需要擤鼻涕、鼻塞和鼻后流涕,而非充血症状的示例可以包括流鼻涕、咳嗽、喉咙痛和浓鼻涕。用于直方图810、820和830的指数衰减模型是score~ae-b(day-1)+∈,其被拟合为一组被监视用户的每日症状表型(即,充血、非充血或全部)。直方图810、820和830中的正值对应于症状的减少;零值对应无改变;而负值对应于症状的恶化。直方图810、820和830示出了自我报告症状的恢复简档是可变的。结合图10描述了恢复简档的两个示例。
图9描绘了声学特征与自我报告呼吸道感染症状之间的相关性。图900是基于针对所有症状的评级的总和(例如,综合症状分数)、所有充血相关症状评级的总和以及所有非充血相关症状评级的总和计算出的独立的衰减常数的。计算Spearman相关性系数,并且具有显著性趋势(p<0.1)的所有相关性值在图900被示为症状组的函数。相关性的绝对值如图900所示。
对于大多数声学特征,相关性的方向在症状组之间是相同的。然而,共振峰1带宽可变性(bw1sdF)与非充血症状呈正相关,而与充血症状呈负相关(因此与所有相加症状不相关)。与非充血表型相比,图900示出了在较高频谱结构的改变和与充血表型相关联的自我报告症状的变化之间的相关性更强。
图10描绘了两个个人的自我报告症状分数随时间的改变。图1010描绘了一个个人(主体26)的改变,其在恢复期间的综合症状分数(CSS)缓慢衰减。相比之下,图1020示出了另一个人(主体14)在恢复期间具有CSS的相对快速的衰减。
图11A-图11B描绘了针对不同声学特征计算的距离度量与自我报告症状分数之间的等级相关性的图形表示。图11A中的图1100表示第一声学特征集的等级相关性,而图11B中的图1150表示第二声学特征集的等级相关性。图1100和图1150示出了对于七个音素(/a/、/e/、/i/、/u/、/ae/、/n/、/m/和/或/ng/)的每个可能的组合,跨一组被监视的个人在特征向量的距离度量与自我报告症状分数(例如,CSS)之间的Spearman等级相关性的分布。基于四分位变异系数(IQR/中间值)按升序排序音素组合。
根据本公开的实施例,图1100和图1150中的这些声学特征可以从在不同天收集的话音样本中提取。可以在个人生病的一天从每个个人收集一个话音样本,并且可以在个人健康(即,没有生病)的稍后一天从每个个人收集另一话音样本。可以进行距离方法的计算,如结合音素特征比较器274所述。将距离度量与个人的自我报告症状的分数相关(例如,Spearman的r),该分数可以如结合自我报告数据评估器2746所描述的那样确定。图1100和图1150示出了包括音素/n/、/m/和/a/的子集导致四分位变异系数的最低值,从而指示与检测呼吸道状况相关。在本公开的一个实施例中,基于图1100和图1150中所示的结果,可以使用稀疏PCA执行进一步的向下选择,以识别三个音素中的每一个音素的声学特征子集,并且可以选择32个总特征的子集(来自/n/的12个特征,来自/m/的12个特征,以及来自/a/的8个特征)用于对个人的呼吸道状况进行推断和/或预测。
图12A描绘了图1200,其示出了跨不同个人的在距离度量与自我报告症状分数之间的等级相关性值。用于计算等级相关性值的距离度量可以基于从三个音素(例如/n/、/m/和/a/)导出的32个音素特征。在图1200中,个人按照症状改变最大的次序从左到右排序(这可能不一定对应于图1200中由条线示出的等级相关程度),并且(*)指示示出的等级相关性被确定为统计显著(例如,p<0.05)。图1200示出了对于表现出更快恢复(即,b为更高值)的个人,相关性通常更高。具有高于中间值的b值的个人的平均等级相关性为0.7(±0.13),与之相比,具有低于中间值的b值的个人的平均等级相关性为0.46(±0.33)。在计算出的距离度量与自我报告综合症状分数(CSS)之间的中间相关性为0.63。
图12B描绘了根据本公开的一个实施例的用于生病访问和健康访问之间的改变的配对T测试(p值)的结果,以示出统计上显著的相关性。只有p<0.05的值才包括在表1210中。表1210示出了针对所有研究的个人和仅在高恢复组(如由衰减常数b测量的)中的个人的结果。在表910中,标准差用“sd”表示,并且对数变换用“LG”表示。
图13描绘了根据一些实施例的针对被识别为主体17、20和28的三个示例个人的声学特征和自我报告症状随时间的相对改变的图形表示。图1310、1320和1330各自描绘了针对每个个人的自我报告综合症状分数(CSS)(由竖线表示)和根据音素特征向量计算出的距离度量(由虚线表示)随时间的改变。图1310示出了主体17随时间表现出显著且相对单调的症状减少,这也反映在距离度量中。图1320示出了与主体17相比,主体28的症状的减少更渐进和更不单调,并且主体28的恢复在第13天症状轻微下降之前在第7-12天左右稳定。图1320还示出了与距离度量的一致是适度的,以及从疾病到康复的可观察的转变。与图1310和图1320相反,图1330示出了主体20的自我报告症状开始时是轻微的(第1天CSS=5),并且随着时间非充血症状(咳嗽和喉咙痛)恶化。因此,相对于图1310和图1320而言,与图1330中的距离度量的一致性较小。
图13中的图1340包括跨一组被监视个人(其包括主体17、20和28)随时间计算出的距离度量的箱线图。图1340示出当个人接近恢复(或“健康”)状态时,距离趋于减小,这可能是14天左右。
图14描绘了呼吸道感染检测器的性能的示例表示。具体地,图14示出了通过自我报告症状分数(例如,CSS)测量的对本公开的实施例检测呼吸道状况的改变的能力的量化。图1410绘制了距离度量的改变与自我报告症状分数的改变,表明随着在给定一天的自我报告症状的差异增加,在音素特征向量之间的距离也增加。根据本公开的实施例,图1420描绘了接收机操作特性(ROC)曲线和相关联的曲线下面积(AUC)值,用于利用音素特征(和在音素特征向量之间计算出的距离)来检测自我报告症状分数中不同幅度的改变。如所描绘的,对于7点改变,AUC值为0.89(代表从0到35的综合症状评分数范围的20%)。
图15A-图15M描绘了用于从话音数据中提取音素特征以跟踪呼吸道状况的计算机程序例程的示例实施例,如本文所述。因此,在图15A-图15M中的计算机程序例程可由用户话音监视器260或其子组件中的一个或多个使用。此外,在图15A-图15M中的计算机程序例程可分别用于执行图6A的方法6100和图6B的方法6200的一个或多个方面。
因此,提供了针对用于监视用户的呼吸道状况的系统和方法的技术的各种方面。应当理解,本文描述的实施例的各种特征、子组合和修改具有实用性,并且可以在不参考其他特征或子组合的情况下在其他实施例中使用。此外,在示例方法或过程中示出的步骤的次序和序列并不意味着以任何方式限制本公开的范围,并且事实上,在本公开的实施例中,步骤可以以各种不同的序列发生。这些变化及其组合也被预期在本公开的实施例的范围内。
在描述了各种实现方式之后,现在描述适合于实现本公开的实施例的示例计算环境。参考图16,提供了示例性计算设备,并通常将其称为计算设备1700。计算设备1700是合适的计算环境的一个示例,并且不旨在建议对本公开的实施例的使用范围或功能的任何限制。计算设备1700不应被解释为具有与所示的组件的任何一个或组合相关的任何依赖性或要求。
本公开的实施例可以在计算机代码或机器可用指令的一般上下文中描述,该计算机代码或机器可用指令包括由计算机或其他机器执行的计算机可用或计算机可执行指令(例如,程序模块),其他机器例如为个人数据助理、智能电话、平板PC或其他手持或可穿戴设备(例如,智能手表)。通常,程序模块(包括例程、程序、对象、组件、数据结构等)指代执行特定任务或实现特定抽象数据类型的代码。本公开的实施例可在多种系统配置中实践,这些系统配置包括手持设备、消费者电子设备、通用计算机或专用计算设备。本公开的实施例还可以在分布式计算环境中实践,其中任务由通过通信网络链接的远程处理设备执行。在分布式计算环境中,程序模块可以位于本地和包括存储器存储设备的远程计算机存储介质中。
参考图16,计算设备1700包括直接或间接耦合各种设备的总线1710,这些设备包括存储器1712、一个或多个处理器1714、一个或多个呈现组件1716、一个或多个输入/输出(I/O)端口1718、一个或多个I/O组件1720和说明性电源1722。计算设备1700的一些实施例还可以包括一个或多个无线电设备1724。总线1710表示一条或多条总线(例如,地址总线、数据总线或其组合)。虽然图16的各种框为了清楚起见以线条示出,但实际上这些框表示逻辑组件,而不一定是实际的组件。例如,可以将诸如显示设备之类的呈现组件视为I/O组件。而且,处理器可以具有存储器。图16仅示出可结合本公开的一个或多个实施例使用的示例性计算设备。没有区分如“工作站”、“服务器”、“膝上型计算机”或“手持设备”的这种类别,因为所有这些类别都被设想在图16的范围内并称为“计算设备”。
计算设备1700典型地包括各种计算机可读介质。计算机可读介质可以是可由计算设备1700访问的任何可用介质,并且包括易失性和非易失性以及可移除和不可移除介质。通过示例而非限制的方式,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储信息(例如,计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪速存储器或其他存储器技术、压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)或其他光盘存储装置、盒式磁带、磁带、磁盘存储装置或其他磁存储设备或任何其他介质,其可用于存储期望的信息并且可以由计算设备1700访问。计算机存储介质不包括信号本身。通信介质典型地体现计算机可读指令、数据结构、程序模块或调制数据信号(例如,载波或其他传输机制)中的其他数据,并包括任何信息递送介质。术语“调制数据信号”表示具有以编码信号中的信息的方式设置或改变其特性中的一个或多个特性的信号。通过示例而非限制的方式,通信介质包括有线介质(例如,有线网络或直接有线连接)以及无线介质(例如,声学、射频(RF)、红外和其他无线介质)。上述内容中任一种的组合也应包括在计算机可读介质的范围内。
存储器1712包括易失性和/或非易失性存储器形式的计算机存储介质。存储器可以是可移除的、不可移除的或其组合。示例性硬件设备包括例如固态存储器、硬盘驱动器和光盘驱动器。计算设备1700包括从诸如存储器1712或I/O组件1720之类的各种设备读取数据的一个或多个处理器1714。呈现组件1716向用户或其他设备呈现数据指示。示例性呈现组件1716可以包括显示设备、扬声器、打印组件、振动组件等。
I/O端口1718允许计算设备1700逻辑地耦合到其他设备(包括I/O组件1720),这些设备中的一些可以是内置的。说明性组件包括麦克风、操纵杆、游戏手柄、卫星天线、扫描仪、打印机或无线设备。I/O组件1720可以提供处理由用户生成的空中手势、话音或其他生理输入的自然用户界面(NUI)。在一些实例中,输入可以被传输到适当的网络元件以进行进一步处理。NUI可以实现与计算设备1700上的显示器相关联的语音识别、触摸和触控笔识别、面部识别、生物特征识别、(屏幕上和屏幕附近的)手势识别、空中手势、头部和眼睛跟踪以及触摸识别的任何组合。计算设备1700可以配备有用于手势检测和识别的深度相机,例如,立体相机系统、红外相机系统、RGB相机系统以及这些系统的组合。此外,计算设备1700可以配备有使得能够检测运动的加速度计或陀螺仪。可以将加速度计或陀螺仪的输出提供给计算设备1700的显示器以渲染沉浸式增强现实或虚拟现实。
计算设备1700的一些实施例可以包括一个或多个无线电设备1724(或类似的无线通信组件)。无线电设备1724发送并接收无线电或无线通信。计算设备1700可以是适于通过各种无线网络接收通信和媒体的无线终端。计算设备1700可以经由无线协议(例如,码分多址(“CDMA”)、全球移动系统(“GSM”)、时分多址(“TDMA”)或其他无线方法)进行通信,以与其他设备进行通信。无线电通信可以是短距离连接、长距离连接或两者的组合。这里,“短”和“长”类型的连接不是指两个设备之间的空间关系。相反,这些连接类型通常指代短距离和长距离作为不同类别或类型的连接(即,主要连接和次要连接)。通过示例而非限制的方式,短距离连接可以包括到提供对无线通信网络的访问的设备(例如,移动热点)的连接,例如,使用802.11协议的无线局域网(WLAN)连接;到另一计算设备的蓝牙连接是短距离连接的另一示例;或者是近场通信。通过示例而非限制的方式,长距离连接可以包括使用CDMA、通用分组无线电业务(GPRS)、GSM、TDMA和802.16协议中的一个或多个的连接。
在不脱离以下权利要求的范围的情况下,所描绘的各种组件以及未示出的组件的许多不同布置是可能的。描述本公开的实施例的意图是说明性的而不是限制性的。对于本公开的读者而言,在阅读本公开之后并因为阅读本公开,替代实施例将变得显而易见。在不脱离以下权利要求的范围的情况下,可以完成实现前述内容的替代方法。某些特征和子组合具有实用性,并且可以在不参考其他特征和子组合的情况下使用,并且是在权利要求的范围内设想的。

Claims (47)

1.一种用于监视人类主体的呼吸道状况的计算机化系统,所述系统包括:一个或多个处理器;以及计算机存储器,其上存储有计算机可执行指令,所述计算机可执行指令用于在由所述一个或多个处理器执行时执行操作,所述操作包括:接收包括所述人类主体的话音信息的第一音频数据,确定包括表征所述第一音频数据的第一部分的至少一个声学特征的第一音素特征集,所述第一部分包括第一音素;通过将所述第一音素特征集与根据第二音频数据确定的第二音素特征集进行比较来监视所述呼吸道状况。
2.根据权利要求1所述的计算机化系统,还包括:声学传感器,其被配置为捕获音频信息。
3.根据权利要求2所述的计算机化系统,其中,所述声学传感器被集成到智能扬声器中。
4.根据权利要求1所述的计算机化系统,其中,所述第一音素特征集包括声学特征,所述声学特征表征包括以下各项的至少一个音素:/a/、/e/、/n/或/m/。
5.根据权利要求1所述的计算机化系统,其中,所述第一音素特征集包括表征以下各项的声学特征:与所述第一音频数据的第一部分相关联的第一音素、与所述第一音频数据的第二部分相关联的第二音素以及与所述第一音频数据的第三部分相关联的第三音素,其中,所述第一音素包括/a/,所述第二音素包括/n/,并且所述第三音素包括/m/。
6.根据权利要求5所述的计算机化系统,其中:/a/音素的所述声学特征包括以下各项中的至少一个:共振峰1(F1)带宽的标准差、音高四分位距、针对1.6千赫兹(kHz)至3.2kHz频率确定的频谱熵、抖动、梅尔频率倒谱系数MFCC9和MFCC12的标准差、梅尔频率倒谱系数MFCC6的平均值以及针对3.2kHz至6.4kHz频率确定的频谱对比度;/n/音素的所述声学特征包括以下各项中的至少一个:谐度、F1带宽的标准差、音高四分位距、针对1.5kHz至2.5kHz和1.6kHz至3.2kHz频率确定的频谱熵、针对1.5kHz至2.5kHz频率确定的频谱平坦度、梅尔频率倒谱系数MFCC1、MFCC2、MFCC3和MFCC11的标准差、梅尔频率倒谱系数MFCC8的平均值以及针对1.6kHz至3.2kHz频率确定的频谱对比度;以及/m/音素的所述声学特征包括以下各项中的至少一个:谐度、F1带宽的标准差、音高四分位距、针对1.5kHz至2.5kHz和1.6kHz至3.2kHz频率确定的频谱熵、针对1.5kHz至2.5kHz频率确定的频谱平坦度、梅尔频率倒谱系数MFCC2和MFCC10的标准差、梅尔频率倒谱系数MFCC8的平均值、微扰、针对3.2kHz至6.4kHz频率确定的频谱对比度以及200赫兹(Hz)第三倍频带的标准差。
7.根据权利要求1所述的计算机化系统,其中,所述操作还包括:对所述第一音频数据的第一部分执行自动语音识别以确定第一音素;以及将所述第一音频数据的第一部分与所述第一音素进行关联。
8.根据权利要求7所述的计算机化系统,其中,执行自动语音识别包括:确定对应于所述第一音频数据的第一部分的文本;以及基于所述文本来确定所述第一音素。
9.根据权利要求1所述的计算机化系统,其中,所述第一音频数据与对应于第一日期时间值的第一时间间隔相关联,并且所述第二音频数据与对应于第二日期时间值的第二时间间隔相关联,并且其中,监视所述人类主体的呼吸道状况包括:确定在所述第一音素特征集和所述第二音素特征集中的特征的至少一部分的特征距离测量;以及基于所述特征距离测量,确定所述人类主体的呼吸道状况在所述第二日期时间值与所述第一日期时间值之间已经改变。
10.根据权利要求9所述的计算机化系统,其中,所述第二日期时间值发生在所述第一日期时间值之后18小时至36小时之间。
11.根据权利要求1所述的计算机化系统,其中,所述操作还包括:接收针对所述人类主体的第一生理数据,所述第一生理数据与第一时间间隔相关联,所述第一时间间隔与所述第一音频数据相关联;以及将所述生理数据存储在记录中。
12.根据权利要求1所述的计算机化系统,其中,所述第一音频数据与第一时间间隔相关联,并且其中,所述操作还包括确定针对所述人类主体的第一上下文数据,所述第一上下文数据与第一时间间隔相关联,并且包括以下各项中的至少一个:关于所述人类主体的生理数据、关于所述人类主体在所述第一时间间隔期间的位置的信息或者与所述第一时间间隔相关联的上下文信息,其中,所述第一音素特征集还基于所述第一上下文数据来确定。
13.根据权利要求1所述的计算机化系统,其中,所述第一音素特征集是根据多个其他音素特征集确定的,所述其他音素特征集中的每一个音素特征集与在第二时间间隔之前发生的第一日期时间值相关联,其中,所述第二时间间隔与所述第二音频数据相关联。
14.根据权利要求1所述的计算机化系统,其中,将所述第一音素特征集与所述第二音素特征集进行比较包括:确定所述第一音素特征集的至少一部分与所述第二音素特征集的至少一部分之间的Euclidian距离或Levenshtein距离。
15.根据权利要求1所述的计算机化系统,其中,将所述第一音素特征集与所述第二音素特征集进行比较包括:在所述第一音素特征集中的至少第一特征与所述第二音素特征集中的对应的第二特征之间进行比较。
16.根据权利要求1所述的计算机化系统,其中,监视所述人类主体的呼吸道状况包括:执行对所述第一音素特征集与所述第二音素特征集的比较以确定第一特征集距离;以及通过将所述第一特征集距离与阈值距离进行比较来确定所述人类主体的呼吸道状况已经改变。
17.根据权利要求16所述的计算机化系统,其中,所述阈值距离是由临床医生预先确定的,或者是基于以下各项中的一个或多个自动确定的:用户的生理数据、用户设置或用户的历史呼吸道状况信息。
18.根据权利要求16所述的计算机化系统,其中,所述操作还包括:在确定所述人类主体不具有所述呼吸道状况时接收表示基线的第三音素特征集;以及其中,监视所述人类主体的呼吸道状况包括:执行对所述第一音素特征集与所述第二音素特征集的比较以确定第一特征集距离;执行对所述第二音素特征集与所述第三音素特征集之间的第二比较以确定第二特征集距离;执行对所述第一音素特征集与所述第三音素特征集之间的第三比较以确定第三特征集距离;执行对所述第二特征集距离与所述第三特征集距离的第四比较;以及基于所述第四比较,执行以下各项中的一个:如果所述第二特征集距离小于所述第三特征集距离,则提供所述人类主体的呼吸道状况正在改善的指示;如果所述第二特征集距离大于所述第三特征集距离,则提供所述人类主体的呼吸道状况正在恶化的指示;或者如果所述第二特征集距离等于所述第三特征集距离,则提供所述人类主体的呼吸道状况没有改变的指示。
19.根据权利要求2所述的计算机化系统,其中,表示基线的第三音素特征集包括具有特征值的音素特征,所述特征值是基于音素特征值的集合的平均值确定的,在所述音素特征值的集合中的每个音素特征值是在确定所述人类主体不具有所述呼吸道状况的时间期间根据不同的时间间隔确定的。
20.根据权利要求1所述的计算机化系统,其中,所述操作还包括:基于通过将所述第一音素特征集与所述第二音素特征集进行比较而确定的所述呼吸道状况的改变而发起动作。
21.根据权利要求20所述的计算机化系统,其中,基于所述人类主体的呼吸道状况的改变发起动作包括:向与所述人类主体相关联的用户设备或者所述人类主体的临床医生中的至少一个发出通知;在所述人类主体与所述人类主体的临床医生之间安排预约;提供对修改所述呼吸道状况的治疗的推荐;以及请求重新补充处方药物。
22.根据权利要求1所述的计算机化系统,还包括与所述人类主体相关联的用户设备,其中,监视所述人类主体的呼吸道状况包括至少基于将所述第一音素特征集与所述第二音素特征集进行比较来确定呼吸道状况分数,并且其中,所述操作还包括使得在所述用户设备的用户界面上显示所述呼吸道状况分数。
23.根据权利要求1所述的计算机化系统,还包括与所述人类主体相关联的用户设备,其中,监视所述人类主体的呼吸道状况包括至少基于将所述第一音素特征集与所述第二音素特征集进行比较来确定传播风险水平,所述传播风险水平指示所述人类主体传播与所述呼吸道状况相关联的感染剂的风险,并且其中,所述操作还包括使得在所述用户设备的用户界面上显示所述传播风险水平。
24.根据权利要求1所述的计算机化系统,还包括与所述人类主体相关联的用户设备,其中,监视所述人类主体的呼吸道状况包括至少基于将所述第一音素特征集与所述第二音素特征集进行比较来确定所述人类主体的呼吸道状况的趋势,并且其中,所述操作还包括使得在所述用户设备的用户界面上显示所述人类主体的呼吸道状况的所述趋势。
25.根据权利要求1所述的计算机化系统,其中,所述第一音频数据的第一部分包括基本元音音素的持续发声,并且其中,所述第一音素特征集是基于最大发声时间的。
26.根据权利要求1所述的计算机化系统,其中,所述第一音频数据包括包含多个音素的口头语言段落的记录,并且其中,所述第一音素特征集包括以下各项中的一个或多个:说话速率、平均停顿长度、停顿计数和全局信噪比。
27.一种利用声学传感器设备治疗呼吸道状况的方法,所述方法包括:接收与第一时间间隔相关联的第一音频数据,所述第一音频数据包括人类主体的话音信息;确定第一音素特征集,所述第一音素特征集包括表征所述第一音频数据的第一部分的至少一个声学特征,所述第一部分包括第一音素;执行对所述第一音素特征集与第二音素特征集的比较,所述第二音素特征集是根据与第二时间间隔相关联的第二音频数据确定的;以及至少基于所述比较,发起用于所述人类主体的治疗方案以治疗所述呼吸道状况。
28.根据权利要求27所述的方法,其中,发起所述治疗方案包括确定以下各项中的至少一个:治疗剂、剂量以及所述治疗剂的给药方法。
29.根据权利要求28所述的方法,其中,所述治疗剂选自由以下各项组成的组:
PLpro抑制剂、Apilomod、EIDD-2801、利巴韦林、缬更昔洛韦、β-胸苷、阿斯巴甜、氧烯洛尔、多西环素、醋奋乃静、碘普胺、核黄素、瑞普特罗、2,2’-环胞苷、氯霉素、氨基甲酸氯苯甘醚、左羟丙哌嗪、头孢孟多、氟尿苷、替加环素、培美曲塞、L(+)-抗坏血酸、谷胱甘肽、橙皮素、腺苷蛋氨酸、马索罗酚、异维甲酸、丹曲林、柳氮磺吡啶抗菌剂、水飞蓟宾、尼卡地平、西地那非、桔梗皂苷、白杨素、新橙皮苷、黄芩苷、苏葛三醇-3,9-二乙酸酯、(-)表没食子儿茶素没食子酸酯、Phaitanthrin D、2-(3,4-二羟基苯基)-2-[[2-(3,4-二羟基苯基)-3,4-二氢-5,7-二羟基-2H-1-苯并吡喃-3-基]氧基]-3,4-二氢-2H-1-苯并吡喃-3,4,5,7-四醇、2,2-二(3-吲哚基)-3-吲哚酮、(S)-(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢萘-2-基-2-氨基-3-苯基丙酸酯、白皮杉醇、迷迭香酸和厚朴酚;3CLpro抑制剂、赖甲四环素、氯己定、阿呋唑嗪、西司他丁、法莫替丁、阿米曲林、普罗加胺、奈帕芬胺、卡维地洛、氨普那韦、替加环素、孟鲁司特、胭脂红酸、含羞草氨酸、黄素、叶黄素、头孢匹胺、非奈西林、坎沙曲、尼卡地平、戊酸雌二醇、吡格列酮、考尼伐坦、替米沙坦、多西环素、土霉素、(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢萘-2-基5-((R)-1,2-二硫杂环戊烷-3-基)戊酸酯、白杨醛、白杨素-7-O-β-葡萄糖醛酸、雄酮酰胺、(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢萘-2-基2-硝基苯甲酸酯、2β-羟基-3,4-开环-软木三萜酮内酯-27-酸(S)-(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢萘-2-基-2-氨基-3-苯基丙酸酯、异赤霉醇、酒酵母甾醇、橙皮苷、新橙皮苷、穿心莲素、2-((1R,5R,6R,8aS)-6-羟基-5-(羟甲基)-5,8a-二甲基-2-亚甲基十氢萘-1-基)乙基苯甲酸酯、大波斯菊苷、Cleistocaltone A、2,2-二(3-吲哚基)-3-吲哚酮、Biorobin、格尼迪木素、Phyllaemblinol、茶黄素3,3’-二-没食子酸酯、迷迭香酸、苦菜苷I、齐墩果酸、柱头菊-5-烯-3-醇、Deacetylcentapicrin和Berchemol;RdRp抑制剂、缬更昔洛韦、氯己定、头孢布烯、非诺特罗、氟达拉滨、伊曲康唑、头孢呋辛、阿托伐醌、鹅去氧胆酸、色甘酸钠、泮库溴铵、可的松、替勃龙、新生霉素、水飞蓟宾、伊达比星、溴隐亭、地芬诺酯、苄基青霉酰G、达比加群酯、桦木酮、格尼迪木素、2β,30β-二羟基-3,4-开环-软木三萜酮内酯-27-内酯、14-脱氧-11,12-二脱氢穿心莲内酯、格尼迪木素、茶黄素3,3’-二没食子酸酯、(R)-((1R,5aS,6R,9aS)-1,5a-二甲基-7-亚甲基-3-氧代-6-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢-1H-苯并[c]氮杂卓-1-基)甲基2-氨基-3-苯基丙酸酯、2β-羟基-3,4-开环-软木三萜酮内酯-27-酸、2-(3,4-二羟基苯基)-2-[[2-(3,4-二羟基苯基)-3,4-二氢-5,7-二羟基-2H-1-苯并吡喃-3-基]氧基]-3,4-二氢-2H-1-苯并吡喃-3,4,5,7-四醇、叶甲素B、14-羟基香附烯酮、穿心莲内酯苷、2-((1R,5R,6R,8aS)-6-羟基-5-(羟甲基)-5,8a-二甲基-2-亚甲基十氢萘-1-基)乙基苯甲酸酯、穿心莲内酯、苏葛三醇-3,9-二乙酸酯、黄芩苷、(1S,2R,4aS,5R,8aS)-1-甲酰胺基-1,4a-二甲基-6-亚甲基-5-((E)-2-(2-氧代-2,5-二氢呋喃-3-基)乙烯基)十氢萘-2-基5-((R)-1,2-二硫杂环戊烷-3-基)戊酸酯、1,7-二羟基-3-甲氧基氧杂蒽酮、1,2,6-三甲氧基-8-[(6-O-β-D-吡喃木糖基-β-D-吡喃葡萄糖基)氧基]-9H-氧杂蒽-9-酮和/或1,8-二羟基-6-甲氧基-2-[(6-O-β-D-吡喃木糖基-β-D-吡喃葡萄糖基)氧基]-9H-氧杂蒽-9-酮、8-(β-D-吡喃葡萄糖基氧基)-1,3,5-三羟基-9H-氧杂蒽-9-酮;地奥司明、橙皮苷、MK-3207、Venetoclax、二氢麦角克碱、勃拉嗪、R428、Ditercalinium、依托泊苷、替尼泊苷、UK-432097、伊立替康、Lumacaftor、Velpatasvir、Eluxadoline、Ledipasvir、洛匹那韦/利托那韦和利巴韦林的组合、Alferon和强的松;地塞米松、阿奇霉素、瑞德西韦、boceprevir、umifenovir和法匹拉韦;α-酮酰胺类化合物;RIG 1通路激活剂;蛋白酶抑制剂;以及瑞德西韦、galidesivir、favilavir/avifavir、莫努匹拉韦(MK-4482/EIDD 2801)、AT-527、AT-301、BLD-2660、法匹拉韦、卡莫司他、SLV213恩曲他滨/替诺非韦、克来夫定、dalcetrapib、boceprevir、ABX464、(3S)-3-({N-[(4-甲氧基-1H-吲哚-2-基)羰基]-L-亮氨酰基}氨基)-2-氧代-4-[(3S)-2-氧代吡咯烷-3-基]丁基磷酸二氢酯;以及其药学上可接受的盐、溶剂合物或水合物(PF-07304814),(1R,2S,5S)-N-{(1S)-1-氰基-2-[(3S)-2-氧代吡咯烷-3-基]乙基}-6,6-二甲基-3-[3-甲基-N-(三氟乙酰基)-L-缬氨酰基]-3-氮杂双环[3.1.0]己烷-2-甲酰胺或其溶剂合物或水合物(PF-07321332),S-217622、糖皮质激素、恢复期血浆、重组人血浆、单克隆抗体、依库珠单抗、VIR-7831/VIR-7832、BRII-196/BRII-198、COVI-AMG/COVI滴剂(STI-2020)、bamlanivimab(LY-CoV555)、mavrilimab、leronlimab(PRO140)、AZD7442、lenzilumab、英夫利昔单抗、阿达木单抗、JS016、STI-1499(COVIGUARD)、lanadelumab(Takhzyro)、卡那单抗(Ilaris)、gimsilumab、otilimab、抗体鸡尾酒合剂、重组融合蛋白、抗凝血剂、IL-6受体激动剂、PIKfyve抑制剂、RIPK1抑制剂、VIP受体激动剂、SGLT2抑制剂、TYK抑制剂、激酶抑制剂、bemcentinib、阿卡替尼、losmapimod、巴瑞克替尼、托法替布、H2阻滞剂、驱虫剂和弗林蛋白酶抑制剂。
30.根据权利要求28所述的方法,其中,所述治疗剂是(3S)-3-({N-[(4-甲氧基-1H-吲哚-2-基)羰基]-L-亮氨酰基}氨基)-2-氧代-4-[(3S)-2-氧代吡咯烷-3-基]丁基磷酸二氢酯,或其药学上可接受的盐、溶剂合物或水合物(PF-07304814)。
31.根据权利要求38所述的方法,其中,所述治疗剂是(1R,2S,5S)-N-{(1S)-1-氰基-2-[(3S)-2-氧代吡咯烷-3-基]乙基}-6,6-二甲基-3-[3-甲基-N-(三氟乙酰基)-L-缬氨酰基]-3-氮杂双环[3.1.0]己烷-2-甲酰胺或其溶剂合物或水合物(PF-07321332)。
32.根据权利要求27所述的方法,其中,发起所述治疗方案的给药包括生成被提供用于在用户设备上显示的图形用户界面元素,所述图形用户界面元素指示至少基于所述第一音素特征集与所述第二音素特征集的所述比较的对所述治疗方案的推荐。
33.根据权利要求32所述的方法,其中,所述用户设备与所述声学传感器设备分离。
34.根据权利要求32所述的方法,还包括基于所述推荐将所述治疗方案应用于所述人类主体。
35.根据权利要求27所述的方法,其中,所述呼吸道状况包括冠状病毒疾病2019(COVID-19)。
36.一种跟踪用于治疗人类主体中的呼吸道状况的治疗剂的疗效的计算机化方法,所述计算机化方法包括:接收第一音素特征集和第二音素特征集,所述第一音素特征集和所述第二音素特征集中的每一个音素特征集表示所述人类主体的话音信息,所述第二音素特征集与第二日期时间值相关联,所述第二日期时间值在与所述第一音素特征集相关联的第一日期时间值之后发生,其中,向所述人类主体给予所述治疗剂的时间段至少包括所述第二日期时间值;执行对所述第一音素特征集和所述第二音素特征集的第一比较以确定第一特征集距离;以及基于所述第一特征集距离来确定所述人类主体的呼吸道状况是否改变。
37.根据权利要求36所述的计算机化方法,其中,所述呼吸道状况是呼吸道感染,并且其中,所述治疗剂是抗微生物药物。
38.根据权利要求37所述的计算机化方法,其中,所述治疗剂是抗生素药物。
39.根据权利要求37所述的计算机化方法,还包括:至少基于确定所述人类主体的呼吸道状况是否改变来确定所述抗生素药物的疗效的改变。
40.根据权利要求36所述的计算机化方法,其中,确定所述人类主体的呼吸道状况是否改变包括确定所述呼吸道状况是否已经改善、恶化或未改变。
41.根据权利要求36所述的计算机化方法,还包括:基于确定所述人类主体的呼吸道状况是否改变来发起用于治疗所述人类主体的动作。
42.根据权利要求41所述的计算机化方法,其中,在确定所述呼吸道状况已经恶化时发起用于治疗所述人类主体的所述动作。
43.根据权利要求41所述的计算机化方法,其中,在确定所述呼吸道状况已经恶化或未改变时发起用于治疗所述人类主体的所述动作。
44.根据权利要求41所述的计算机化方法,其中,用于治疗所述人类主体的动作包括改变所述人类主体的治疗方案。
45.根据权利要求44所述的计算机化方法,其中,改变所述人类主体的治疗方案包括发起对调整所述治疗剂中的一个或多个或者所述治疗剂的剂量的推荐。
46.根据权利要求44所述的计算机化方法,其中,改变所述人类主体的治疗方案包括向所述人类主体的护理提供者发送消息,所述消息请求修改所述人类主体的治疗方案。
47.根据权利要求41所述的计算机化方法,其中,用于治疗所述人类主体的所述动作包括通过根据所述人类主体的电子健康记录(EHR)确定的药房以电子方式发起针对所述治疗剂的重新补充请求。
CN202180074228.3A 2020-08-28 2021-08-30 用于呼吸道状况监视和护理的计算机化决策支持工具和医疗设备 Pending CN116600698A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/071,718 2020-08-28
US202163238103P 2021-08-27 2021-08-27
US63/238,103 2021-08-27
PCT/US2021/048242 WO2022047311A1 (en) 2020-08-28 2021-08-30 Computerized decision support tool and medical device for respiratory condition monitoring and care

Publications (1)

Publication Number Publication Date
CN116600698A true CN116600698A (zh) 2023-08-15

Family

ID=87594226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180074228.3A Pending CN116600698A (zh) 2020-08-28 2021-08-30 用于呼吸道状况监视和护理的计算机化决策支持工具和医疗设备

Country Status (1)

Country Link
CN (1) CN116600698A (zh)

Similar Documents

Publication Publication Date Title
US20200388287A1 (en) Intelligent health monitoring
US20230329630A1 (en) Computerized decision support tool and medical device for respiratory condition monitoring and care
US10010288B2 (en) Screening for neurological disease using speech articulation characteristics
US11881221B2 (en) Health monitoring system and appliance
US8784311B2 (en) Systems and methods of screening for medical states using speech and other vocal behaviors
US10004451B1 (en) User monitoring system
US20230352013A1 (en) Impaired operator detection and interlock apparatus
US9070357B1 (en) Using speech analysis to assess a speaker&#39;s physiological health
JP2021529382A (ja) 精神的健康評価のためのシステム及び方法
Stasak et al. Automatic detection of COVID-19 based on short-duration acoustic smartphone speech analysis
CN114206361A (zh) 一种用于语音属性的机器学习的系统和方法
US11800996B2 (en) System and method of detecting falls of a subject using a wearable sensor
Deshpande et al. Audio, speech, language, & signal processing for covid-19: A comprehensive overview
Sharma et al. Prediction of specific language impairment in children using speech linear predictive coding coefficients
CN116600698A (zh) 用于呼吸道状况监视和护理的计算机化决策支持工具和医疗设备
EP4312768A2 (en) Systems and methods for digital speech-based evaluation of cognitive function
TW202343476A (zh) 用於呼吸病況監測及照護之電腦化決策支援工具及醫療裝置
US20200168317A1 (en) Tool for assisting individuals experiencing auditory hallucinations to differentiate between hallucinations and ambient sounds
KR20230029850A (ko) 긁음 검출 및 발적 예측을 위한 컴퓨터화된 의사결정 지원 툴 및 의료 디바이스
RU2818831C1 (ru) Компьютеризированное инструментальное средство поддержки принятия решений и медицинское устройство для обнаружения расчесов и прогнозирования покраснений
US20230210372A1 (en) Passive assistive alerts using artificial intelligence assistants
WO2018187664A1 (en) Improved diagnostic instrument and methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination