CN114830257A - 咳嗽检测系统和方法 - Google Patents
咳嗽检测系统和方法 Download PDFInfo
- Publication number
- CN114830257A CN114830257A CN202080088541.8A CN202080088541A CN114830257A CN 114830257 A CN114830257 A CN 114830257A CN 202080088541 A CN202080088541 A CN 202080088541A CN 114830257 A CN114830257 A CN 114830257A
- Authority
- CN
- China
- Prior art keywords
- cough
- data
- user
- detection algorithms
- sounds
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/08—Detecting, measuring or recording devices for evaluating the respiratory organs
- A61B5/0823—Detecting or evaluating cough events
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
- A61B5/7275—Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Pulmonology (AREA)
- Signal Processing (AREA)
- Heart & Thoracic Surgery (AREA)
- Veterinary Medicine (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
一种咳嗽检测系统和方法使用与要对其实现咳嗽检测的用户相关并且与可能在用户附近的其他人相关的生理信息的第一数据库。第二数据库(实时使用或作为系统校准的一部分)具有与生理信息相关联的咳嗽数据。存在一组咳嗽检测算法,每个咳嗽检测算法针对特定的一组生理特性被定制。选择或构造适合于标识用户的咳嗽同时忽略其他人的咳嗽的咳嗽检测算法。所选择的算法被应用于所收集的声音以标识用户的咳嗽。
Description
技术领域
本发明涉及用于检测咳嗽、并且特别是用于在可能存在其他咳嗽的人时检测一个目标人的咳嗽的系统和方法。
背景技术
咳嗽是很多呼吸道疾病的症状。
监测咳嗽已经被证明对特定目标群体(例如,COPD患者和哮喘患者)具有临床相关性,并且因此,随着时间的推移,跟踪这样的患者的健康状况是一个关键和重要的组成部分。
优选地,可以在自然环境中利用不引人注目的方式监测患者。一种方便的不引人注目的监测方法是使用音频感测来确定咳嗽话语。这些话语可以根据数量(咳嗽次数)或质量(例如,特征:干咳、湿咳)来分析。然后,监测可以例如用于帮助了解健康问题的触发因素或者提醒用户或护理人员,从而实现早期预警和早期干预。
例如使用远程(非身体)感测的不引人注目的监测表示也会观察到其他人的咳嗽。诸如在高级远程监测解决方案的上下文中的大规模应用需要即插即用系统或易于定制的系统。
当前的不引人注目的咳嗽监测器的部署受到各种问题的阻碍。一旦非目标人产生的咳嗽次数变得不可忽略(相对于目标人的咳嗽次数),一般的即插即用咳嗽分类器可能会造成准确性问题。然而,制作完整的个性化系统既麻烦又耗时;必须观察、注释目标人的咳嗽,并且必须训练系统。
存在用于个性化的自适应系统和方法,但适应或机器学习需要在学习阶段没有太多混杂因素的环境;不容易保证的情况。
US 2018/0011975公开了一种系统,该系统将用户咳嗽或打喷嚏的次数作为所收集的人体特性信息的一部分进行计数。对于咳嗽检测,用户语音被收集,并且在用户声音的收集期间,其他人的声音被过滤。
因此需要改进的咳嗽检测系统和方法。
发明内容
本发明由权利要求限定。
根据本发明的一方面的示例,提供了一种咳嗽检测系统,该咳嗽检测系统包括:
第一数据集,包括和要对其实现咳嗽检测的用户相关的第一生理信息;
第二数据集,包括和可能在用户附近的其他人相关的第二生理信息;
麦克风,用于从用户附近收集声音;以及
处理器,其中处理器适于:
获取咳嗽检测算法,咳嗽检测算法适合于基于与第一生理信息相关联的第一咳嗽数据标识咳嗽,同时基于与第二生理信息相关联的第二咳嗽数据忽略咳嗽;以及
将咳嗽检测算法应用于所收集的声音,从而标识用户的咳嗽。
该系统使得能够获取(选择或构造)咳嗽检测算法,该咳嗽检测算法在标识用户的咳嗽同时忽略可能在场的已知人的咳嗽方面表现最佳(其中在本文档中假定系统的“用户”是需要对其进行咳嗽检测的目标个体)。咳嗽数据用于表示用户的咳嗽和已知其他人的咳嗽,使得可以(提前或实时)测试或构造咳嗽检测算法。然而,这利用了针对特定生理特性定制而不是针对实际个体定制的咳嗽检测算法,并且从而减少了训练负担。
在第一组示例中,处理器适于通过以第一咳嗽数据作为正类,并且以第二咳嗽数据和非咳嗽数据作为负类构造咳嗽分类器来获取咳嗽检测算法。
因此,构建分类器,该分类器检测与第一咳嗽数据相对应的咳嗽并且打折(discount)与第二咳嗽数据相对应的咳嗽。
在第二组示例中,该系统还包括一组咳嗽检测算法,每个咳嗽检测算法针对特定的一组生理特性被定制,并且处理器适于通过选择该组咳嗽检测算法中的一个咳嗽检测算法来获取咳嗽检测算法。
在这种情况下,一种咳嗽检测算法将最佳地匹配用例,即,用户的生理类型和干扰者的生理类型。人的所有可能组合(在不同组的生理特性内)可能已经被预先测试,并且获取最佳咳嗽检测算法涉及简单地基于用户和干扰者的已知特性选择最佳咳嗽检测算法。
在第三组示例中,该系统还包括:
第三数据集,包括第一咳嗽数据;以及
第四数据集,包括第二咳嗽数据,
并且其中处理器适于:
测试该组咳嗽检测算法中的多个咳嗽检测算法对第一咳嗽数据和第二咳嗽数据的响应;
基于对第一咳嗽数据和第二咳嗽数据的响应来选择该组咳嗽检测算法中的一个或多个咳嗽检测算法。
所有这三组示例的共同点是,最终获取的咳嗽检测算法是从表示特定的一组生理特性的咳嗽数据中得出的,而不是为特定个人而被定制的。在所有情况下,一组生理特性限定用户,而另一组或多组生理特性限定其他干扰者。
被测试的该组咳嗽检测算法中的多个咳嗽检测算法是适合用户的生理信息的咳嗽检测算法。可能存在很多这样的候选咳嗽检测算法,每个咳嗽检测算法对于其他人具有不同选择性。
每个咳嗽检测算法(或单个算法,如果被构造)可以包括经训练机器学习咳嗽分类器,或者可以利用咳嗽模型。
因此,不同检测算法可能基于使用真实咳嗽声音的训练,或者基于使用所建模的咳嗽声音的训练,或者这两者的组合。咳嗽声音是与特定的该组生理参数相关联的声音。
第一咳嗽数据可以包括用户的自愿咳嗽声音的至少一个记录。这使得能够使用用户的真实咳嗽声音来测试咳嗽检测算法。然而,该系统甚至可以在没有任何用户特定训练的情况下操作,只需将用户生理参数映射到标准化咳嗽检测算法即可。
第二咳嗽数据还可以包括一个或多个其他(干扰)人的自愿咳嗽声音的至少一个记录。这使得能够使用可能在场的其他人的真实咳嗽声音来测试咳嗽检测算法。
第一咳嗽数据还可以包括用户的语音声音的至少一个记录。语音声音也可以用作分类的一部分。类似地,第二咳嗽数据可以包括上述其他人中的一个或多个其他人的语音声音的至少一个记录。
第一咳嗽数据和第二咳嗽数据可以包括咳嗽模型,该咳嗽模型基于对应的生理信息对咳嗽声音进行建模。在这种情况下,检测算法的测试基于人工生成咳嗽声音的使用,该人工生成咳嗽声音基于生理参数而被选择(或实时生成)。
第一生理信息和第二生理信息每个可以包括以下中的一项或多项:
年龄;
性别;
医疗状况;
身高;
体重;
肺容积;以及
体重指数。
这些是影响咳嗽声音的参数。例如,医疗状况与呼吸状况相关。
第二数据集可以包括和可能在用户附近的多个其他人相关的第二生理信息,并且其中处理器适于针对多个其他人中的每个其他人,测试该组咳嗽检测算法中的多个咳嗽检测算法对第二咳嗽数据的响应。
因此,测试可以涉及依次考虑多个其他人中的每个其他人。该选择可以涉及寻找从其他人到用户的最小组合干扰。
第二数据集可以再次包括和可能在用户附近的多个其他人相关的第二生理信息,但是处理器可以替代地适于针对多个其他人中的每个其他人生成结合咳嗽数据的混合第二咳嗽数据。这通过创建表示所有其他人的虚拟组合人来简化测试。
处理器可以适用于解释与语音或脚步相关的音频以向咳嗽检测算法提供附加输入。该附加信息可以帮助将用户与其他人区分开。
处理器可以适于基于由其他人携带的便携式电子设备来检测其他人中的一个或多个其他人的存在。这种方法可以例如使用WiFi信号强度或简档,以再次帮助将用户与其他人区分开。
处理器优选地适于为用户提供总咳嗽计数。
本发明还提供了一种咳嗽检测方法,该咳嗽检测方法包括:
从要对其实现咳嗽检测的用户附近收集声音;
获取咳嗽检测算法,咳嗽检测算法适合于基于第一咳嗽数据来标识咳嗽,同时基于第二咳嗽数据来忽略咳嗽,第一咳嗽数据与和用户相关的第一生理信息相关联,第二咳嗽数据与和可能在用户附近的其他人相关的第二生理信息相关联;以及
将咳嗽检测算法应用于所收集的声音,从而标识用户的咳嗽。
在第一示例中,获取咳嗽检测算法包括:
以第一咳嗽数据作为正类并且以第二咳嗽数据和非咳嗽声音数据作为负类构造咳嗽分类器。
在第二示例中,获取咳嗽检测算法包括:
从一组咳嗽检测算法中选择一个或多个咳嗽检测算法,每个咳嗽检测算法针对特定的一组生理特性被定制。
在第三示例中(作为对第二示例的改进),选择咳嗽检测算法包括:
测试一组咳嗽检测算法中的多个咳嗽检测算法对第一咳嗽数据和第二咳嗽数据的响应;以及
基于对第一咳嗽数据和第二咳嗽数据的响应来选择该组咳嗽检测算法中的一个或多个咳嗽检测算法。
该方法使得能够通过测试对已知用户特性和可能干扰人的特性的响应来使用最佳咳嗽检测算法。
每个咳嗽检测算法可以包括经训练机器学习咳嗽分类器,或者可以利用咳嗽模型。
第一咳嗽数据可以包括用户的自愿咳嗽声音的至少一个记录,和/或第二咳嗽数据包括上述其他人中的一个或多个其他人的自愿咳嗽声音的至少一个记录。
该方法可以在软件中实现。
本发明的这些和其他方面将从下文描述的实施例中变得明显并且参考下文中描述的实施例来阐明。
附图说明
为了更好地理解本发明,并且为了更清楚地示出它如何实现,现在将仅通过示例的方式参考附图,在附图中:
图1示出了咳嗽检测系统;以及
图2示出了咳嗽检测方法。
具体实施方式
将参考附图描述本发明。
应当理解,详细描述和具体示例虽然指示装置、系统和方法的示例性实施例,但仅旨在用于说明的目的,而不旨在限制本发明的范围。本发明的装置、系统和方法的这些和其他特征、方面和优点将从以下描述、所附权利要求和附图中得到更好的理解。应当理解,这些图仅仅是示意性的并且没有按比例绘制。还应当理解,在所有附图中使用相同的附图标记来表示相同或相似的部分。
本发明提供了一种咳嗽检测系统和方法,其中生理信息的第一数据库与要对其实现咳嗽检测的用户相关,并且还与可能在用户附近的其他人相关。第二数据库(实时使用或作为系统校准的一部分)具有与生理信息相关联的咳嗽数据。存在一组咳嗽检测算法,每个咳嗽检测算法针对特定的一组生理特性被定制。选择或构造适合于标识用户的咳嗽同时忽略其他人的咳嗽的咳嗽检测算法。该算法应用于所收集的声音以标识用户的咳嗽。
存在三种不同的方式来获取合适的咳嗽检测算法。
第一种方式涉及通过以第一咳嗽数据(与要对其检测咳嗽的系统的用户相对应)作为正类并且以第二咳嗽数据(与其他干扰人相对应)和其他非咳嗽声音为负类来构造咳嗽分类器来获取咳嗽检测算法。
第二种方式涉及通过从一组咳嗽检测算法中选择一个或多个咳嗽检测算法来获取咳嗽检测算法,每个咳嗽检测算法针对特定的一组生理特性被定制。基于用户和干扰人的知识、特别是他们的生理特性,先前构造的咳嗽检测算法中的一个(或少数)咳嗽检测算法将最适合使用。基于测试不同咳嗽检测算法对用户和干扰者的不同组合的响应,关于哪些咳嗽检测算法适用于用户和干扰人的不同组合的确定可能已经被确定为全局系统校准。
第三种方式涉及通过以下选择咳嗽检测算法:测试一组咳嗽检测算法中的多个咳嗽检测算法对第一咳嗽数据和第二咳嗽数据的响应,并且基于对第一咳嗽数据和第二咳嗽数据的响应选择该组咳嗽检测算法中的一个或多个咳嗽检测算法。
第三种方法利用系统中的最大数据处理量,并且因此,将针对第三种方法讨论一个详细的示例。
图1示出了咳嗽检测系统10。
第一数据库12存储与期望对其进行咳嗽检测的用户以及可能在用户附近的其他用户两者相关的生理信息。
因此,第一数据库具有第一数据集DS1和第二数据集DS2,第一数据集DS1包括与要对其实现咳嗽检测的用户相关的第一生理信息PI1,第二数据集DS2包括与可能在用户附近的其他人相关的第二生理信息PI2。
例如,生理信息包括诸如年龄、性别、医疗状况、身高、体重、肺容积和体重指数(bmi)等参数。这些参数在很大程度上取决于:肺容量主要取决于年龄和性别。这表示在很多情况下,即使只有部分信息,也有足够的数据可供操作系统使用。输入数据还可以包括(自愿)咳嗽和语音话语(或其特征),因为这些提供关于声道的相关信息。
第二数据库14根据生理信息特性存储与不同的实际人或不同类别的人相关的咳嗽数据。
第二数据库因此具有第三数据集D3,第三数据集D3包括与第一生理信息相关联(即,与和用户相同的生理人类型相关联)的第一咳嗽数据CF1。第二数据库具有第四数据集DS4,第四数据集DS4包括与第二生理信息相关联(即,与和可能在附近的其他人相同的生理人类型相关联)的第二咳嗽数据CD2。
取决于这些参数,该咳嗽数据可以是具有已知生理参数的人的记录的咳嗽的数据库,或基于咳嗽模型而人工生成的咳嗽的数据库。此外,可能涉及更复杂的数据,诸如语音话语的特性(例如,元音或其特性)或自愿咳嗽话语(或其特征)。
该系统具有一组咳嗽检测算法CDA1至CDAn。每个咳嗽检测算法针对特定的一组生理特性被定制。因此,特定咳嗽检测算法被设计为针对特定生理特性检测咳嗽。通常有多种咳嗽检测算法可能适合于特定用户(即,特定的一组生理参数),并且会有一些咳嗽检测算法比其他咳嗽检测算法更擅长区分干扰人。
该系统具有用于从用户附近收集声音的麦克风16。声音信号由声音处理单元18处理以提取使得能够进行咳嗽标识的声音特征。声音处理单元使得能够提取音频特征,诸如梅尔频率倒谱系数(MFCC)以及时域包络和能量。
为了选择最适当的咳嗽检测算法,可以在每次使用系统并且标识用户和干扰者时作为初始校准来执行测试,或者替代地作为全局初始校准来执行测试。
例如,可以在使用系统之前测试用户和干扰者类别的所有组合。一旦标识出用户以及可能的干扰者,该信息就可以使得能够使用最适当的咳嗽检测算法。
备选地,测试可以基于已知用户和已知干扰者,一旦它们已经被系统标识。
在这两种情况下,都利用与特定生理特性相关的咳嗽数据。因此,基于与第一生理信息相关联的第一咳嗽数据来选择该组咳嗽检测算法中的一个或多个咳嗽检测算法,同时基于与第二生理信息相关联的第二咳嗽数据来忽略咳嗽。所选择的咳嗽检测算法也将忽略非咳嗽声音。
在这种情况下,主处理器20测试咳嗽检测算法CD1至CDn中的多个咳嗽检测算法中的一些或全部咳嗽检测算法对第一咳嗽数据和第二咳嗽数据CD1、CD2的响应。以这种方式,可以测试每个咳嗽检测算法,以确定它对由咳嗽数据编码的特定咳嗽类型的识别程度。通常只测试子集,该子集至少使得能够针对与用户相对应的生理信息来标识咳嗽。
然后基于对第一咳嗽数据和第二咳嗽数据的响应来选择该组咳嗽检测算法中的一个(或一个以上的)咳嗽检测算法。所选择的咳嗽检测算法示出为CDi。这是基于第一咳嗽数据(即,与用户相同类型的咳嗽数据)来标识咳嗽同时基于第二咳嗽数据(即,与其他人相同类型的咳嗽数据)来忽略咳嗽的最佳咳嗽检测算法。当然,所有咳嗽检测算法都经过训练或以其他方式被设计以忽略非咳嗽声音,诸如语音、脚步声、开门/关门声等。
然后将所选择的咳嗽检测算法应用于所收集的声音,从而标识用户的咳嗽。然后该系统可以维持和输出对这种咳嗽的计数“Count”。
除了对咳嗽的计数(每单位时间),还可以提供分层,例如与咳嗽的性质(诸如干咳或湿咳)相关的分层。例如,计数可以是每小时或每天的咳嗽次数。该输出可以以数字输出、图表或消息的形式提供给用户和/或护理人员。
该系统因此使得咳嗽检测算法能够被选择,该咳嗽检测算法在标识用户的咳嗽方面表现最佳同时忽略可能在场的已知人的咳嗽。咳嗽检测算法针对特定生理特性被定制,而不是针对实际个体被定制。这样可以减轻训练负担。
为了配置系统,首先创建咳嗽检测算法,例如作为基于用户(咳嗽检测的目标患者)和(多个)主要干扰源的特性的初始咳嗽分类器。例如,每个咳嗽检测算法包括数据库、一组经训练咳嗽分类器或一个或多个咳嗽模型。最适当的咳嗽检测器可以被选择或计算,使得它可以充当用户的初始分类器,但对主要干扰源具有低灵敏度。
由于咳嗽是由呼吸系统产生的,其特性很大程度上取决于呼吸系统的生理机能。决定因素是系统的大小和状态,而这些又受年龄、性别和可能的疾病的影响。
为了创建咳嗽检测算法,可以收集多人的咳嗽的数据库以及相关的生理参数,诸如年龄、身高、体重指数、性别和病史(特别是呼吸系统疾病)。这可以基于机器学习。咳嗽检测算法的创建还利用非咳嗽声音。示例是语音声音、关门声、狗吠等。
咳嗽检测算法还可以利用语音话语或自愿咳嗽话语(或其(平均)特征表示))。作为数据库的备选,咳嗽模型可以用于各种患者子集。因此,可以通过多种方式为特定目标群体开发咳嗽检测算法。
可以基于数据库中存在的咳嗽或使用相关的咳嗽模型来测试咳嗽检测算法以验证它们对主要干扰源的咳嗽的敏感度低。
所确定的咳嗽检测器可以是自学习系统中的初始设置,使得该系统在操作中被进一步优化。
在很多情况下,很容易标识出主要干扰源(即,另一人)。对于卧室里不引人注目的咳嗽监测器,主要干扰源显然是床上伴侣。对于独自睡觉并且在卧室里有咳嗽监测器的哮喘儿童,主要干扰源是父母。因此,目标人的护理人员可以轻松获取所需要的生理参数以输入到系统,从而可以为这些个人定制测试。
所示的各种单元可以是一个系统的一部分,或者可以通过有线或无线方式连接。常规的设置将在患者家中具有音频传感器16和声音处理单元18(音频特征提取单元),并且用于执行计数的咳嗽检测算法和输出单元与护理人员一起。随着随时间收集更多数据,这种设置将允许进一步细化,并且可以基于所接收的数据来细化初始咳嗽检测器算法。只要认为有必要,就可以更新输入参数。此外,可以将新收集的咳嗽数据添加到数据库14中以针对其他患者改进该系统。
现在将概述该系统的基本实现。
可能只有三种咳嗽检测算法CDA1至CDA3。这些是针对高个子成人、针对较小成人和针对儿童的咳嗽检测算法。了解家中情况并且了解家庭的护理人员可能认为家庭成员的语音和咳嗽有很大不同,并且遵循系统中的预定义类别。
然后护理人员将输入反映期望监测情况的生理信息。例如,如果卧室里有一对带监测器的成年夫妇,必须监测最大的人,则护理人员将输入生理信息,该生理信息将个子高的成年人标识为目标群体(用户)并且将身材矮小的成年人标识为干扰组(单独的其他人)。然后系统将选择与个子高的成年人相关联的咳嗽检测算法。
以小儿哮喘为例,护理人员将输入儿童的生理信息作为目标人(用户)并且输入成人的生理信息作为干扰源。然后系统将选择针对儿童而优化的咳嗽检测器。因此,这个最小系统已经适合于服务于大量案例。护理人员任务的一部分是确保仅将监测系统提供给可用咳嗽类别适合被监测的实际情况的情况。
上面的简单示例仅假定一个干扰源。可能有一个以上的干扰源,并且没有一个干扰源是主要的,即,它们应当被认为是同样可能的。在这种情况下,一个以上的干扰人的生理信息被输入到系统中。
在一种方法中,多于一个干扰人的生理数据被组合成单个虚拟人,并且针对该虚拟人生成对应咳嗽数据。以这种方式,处理器可以被认为生成混合第二咳嗽数据,该混合第二咳嗽数据结合上述干扰人中的每个的咳嗽数据。因此,干扰源由为多个干扰源提供单个模型的虚拟人表示。
然后遵循相同的测试过程,即,基于目标人的特性选择一个或多个候选咳嗽检测算法。测试这些一个或多个咳嗽检测算法对干扰源(在这种情况下是虚拟/混合人)的咳嗽的敏感性。基于目标人和干扰源(虚拟/混合人员)两者的操作特性,选择最佳咳嗽检测算法。
备选地,代替将多个干扰人合并为虚拟/混合人,进而可以评估针对目标人(用户)的每个候选咳嗽检测算法由于每个干扰人的存在而导致的性能损失。然后可以在所有干扰人之间平均地添加性能损失,因为各个人没有真正的支配地位。选择总体性能损失最小的咳嗽检测器。
在这种情况下,第二数据集DS2包括与可能在用户附近的多个其他人相关的第二生理信息。处理器测试该组咳嗽检测算法中的多个咳嗽检测算法对上述多个其他人中的每个其他人的第二咳嗽数据的响应。
存在各种附加选项,其中一些将在下面讨论。
第一改进是使得系统能够在咳嗽检测器的视线中排除个体的咳嗽,并且具有与目标人相似的特性。
具体地,这种细化解决了两个个人具有多个相似或几乎相同的生理特性(诸如年龄、性别、bmi、肺容量、肺功能数据、(呼吸)疾病信息)的极端情况。这导致咳嗽特性的非常细微的差异,使得系统难以区分非目标人的咳嗽与目标人的咳嗽。
在检测到咳嗽之前和/或之后由系统立即记录的附加上下文音频信息可以用于提高分类性能。例如,记录的语音(例如,音调)和脚步声(例如,步行节奏)可以用作咳嗽检测算法的附加输入。
由于语音和步行信息并不总是可用,因此可能会使用从用户和/或其他人的便携式设备(诸如他们的智能手机、智能眼镜或智能手表)发出的唯一Wi-Fi签名。这些设备通常始终由目标人佩戴或携带。
更具体地,Wi-Fi签名的存在和Wi-Fi信号强度可以用于确认目标人存在于检测器的视线内。例如,如果系统及其麦克风在起居室中,而目标人在花园中(在系统范围之外,由弱Wi-Fi信号强度确定),并且系统检测到咳嗽,则咳嗽就会打折。以这种方式,分类器的特异性将通过减少的假阳性的数目来提高。
在进一步的改进中,可以使用单个咳嗽检测器来监测具有相似特性的两个目标人的咳嗽。这是通过利用每个目标人的便携式设备的相应独特Wi-Fi签名帮助对由咳嗽检测器记录的咳嗽进行分类来实现的。
这涵盖以下情况:
a)仅目标人1在检测器的视线范围内
b)仅目标人2在检测器的视线范围内
c)两个目标人都在检测器的视线范围内
在前两种情况下,两个人的咳嗽的分类是根据他们在咳嗽检测器的视线中的非重叠存在来进行的。
如果检测到咳嗽并且目标人都不在场,则检测到的咳嗽将被打折。
在第三种情况下,两个目标人都在咳嗽检测器的视线范围内,由于两个目标人具有相似特性,因此难以区分两个目标人的咳嗽。因此,代替跟踪个体咳嗽计数,系统可以将两人的总咳嗽计数汇总为组合咳嗽计数。此外,如果在给定监测时段(例如,1周)内有咳嗽显著增加的趋势,则这将触发临床干预或进一步调查。例如,护士可能会上门拜访以确定哪个目标人咳嗽更多,然后提供适当的治疗调节。
图2示出了一种咳嗽检测方法。
在步骤30中,从要对其实现咳嗽检测的用户附近收集声音。
在步骤34中,测试多个咳嗽检测算法(在更大的一组咳嗽检测算法中,或者多个咳嗽检测算法可以是整个集合)对第一咳嗽数据和第二咳嗽数据的响应。
在步骤36中,基于对第一咳嗽数据和第二咳嗽数据的响应来选择该组咳嗽检测算法中的一个或多个咳嗽检测算法,该一个或多个算法被选择为适合于基于第一咳嗽数据标识咳嗽同时基于第二咳嗽数据忽略咳嗽。如果一个以上的算法被选择,则可能有两个计数,并且护理人员可以解释这两者以判断真实咳嗽情况。
在步骤38中,将一个或多个咳嗽检测算法应用于所收集的声音,从而标识用户的咳嗽。
在步骤40中,响应于每次检测到的咳嗽而更新计数,并且将其输出给用户(或他们的护理人员)。
上面的详细示例基于通过测试多个咳嗽检测算法对第一咳嗽数据和第二咳嗽数据的响应来选择咳嗽检测算法。如上所述,其他方法也是可能的。
以第一咳嗽数据作为正类并且以第二咳嗽数据(和与非咳嗽声音相关的数据)作为负类来构造咳嗽分类器的备选方法避免了测试步骤并且避免了存储一组咳嗽检测算法。它仍然利用咳嗽数据的数据库和相关生理信息,但需要分类器构造单元。
从一组先前测试的咳嗽检测算法中选择一个或多个咳嗽检测算法的备选方法再次避免了在系统中进行实时测试的需要。系统不再需要咳嗽数据数据库,因为它用于系统的一般校准。它仍然利用数据库生理信息,使得能够标识用户类型和干扰者类型。
本发明对于是使用家庭监测的远程医疗系统、尤其是慢性呼吸系统疾病(诸如慢性阻塞性肺病和哮喘)特别感兴趣的。
咳嗽检测算法可以基于机器学习算法。
机器学习算法是处理输入数据以产生或预测输出数据的任何自训练算法。在此,输入数据(针对咳嗽检测算法的每个版本,即,针对不同组生理参数)包括咳嗽声音和其他声音(诸如具有其他生理参数的人的咳嗽),并且输出数据包括咳嗽指示(以及可选地也包括咳嗽类型)。
用于本发明的合适的机器学习算法对于技术人员来说将是很清楚的。合适的机器学习算法的示例包括决策树算法和人工神经网络。诸如逻辑回归、支持向量机或朴素贝叶斯模型等其他机器学习算法是合适的替代方案。
人工神经网络(或简称为神经网络)的结构受到人脑的启发。神经网络由层组成,每层包括多个神经元。每个神经元包括数学运算。特别地,每个神经元可以包括单一类型变换的不同加权组合(例如,相同类型的变换、sigmoid等,但具有不同权重)。在处理输入数据的过程中,每个神经元对输入数据进行数学运算以产生数值输出,并且神经网络中的每一层的输出依次被馈送到下一层。最后一层提供输出。
训练机器学习算法的方法是众所周知的。通常,这样的方法包括获取训练数据集,该训练数据集包括训练输入数据条目和对应的训练输出数据条目。将初始化的机器学习算法应用于每个输入数据条目以生成预测的输出数据条目。预测的输出数据条目与对应的训练输出数据条目之间的误差用于修改机器学习算法。可以重复该过程,直到误差收敛,并且预测的输出数据条目与训练输出数据条目足够相似(例如,±1%)。这通常被称为有监督学习技术。
例如,在机器学习算法由神经网络形成的情况下,可以修改每个神经元的数学运算(的权重),直到误差收敛。修改神经网络的已知方法包括梯度下降、反向传播算法等。
训练输入数据条目对应于示例各种声音。训练输出数据条目对应于关于对于特定生理用户类型哪些声音是咳嗽的指示。
如上所述,系统利用处理器来执行数据处理。本领域技术人员将能够容易地开发用于执行本文中描述的任何方法的处理器。因此,流程图的每个步骤可以表示由处理器执行的不同动作,并且可以由处理处理器的相应模块执行。
处理器可以用软件和/或硬件以多种方式实现,以执行所需要的各种功能。处理器通常采用一个或多个微处理器,该微处理器可以使用软件(例如,微码)进行编程以执行所需要的功能。处理器可以实现为执行某些功能的专用硬件和执行其他功能的一个或多个编程的微处理器和相关联的电路系统的组合。
可以在本公开的各种实施例中采用的电路系统的示例包括但不限于常规微处理器、专用集成电路(ASIC)和现场可编程门阵列(FPGA)。
在各种实现中,处理器可以与一种或多种存储介质相关联,诸如易失性和非易失性计算机存储器,诸如RAM、PROM、EPROM和EEPROM。存储介质可以用一个或多个程序编码,该程序当在一个或多个处理器和/或控制器上执行时执行所需要的功能。各种存储介质可以固定在处理器或控制器内,或者可以是可运输的,使得存储在其上的一个或多个程序可以被加载到处理器中。
通过研究附图、公开内容和所附权利要求,本领域技术人员在实践要求保护的发明时可以理解和实现对所公开的实施例的变型。在权利要求中,“包括”一词不排除其他元件或步骤,不定冠词“一个(a)”或“一个(an)”不排除复数。
在相互不同的从属权利要求中列举了某些措施这一事实并不表明这些措施的组合不能有利地使用。
计算机程序可以存储/分发在合适的介质上,诸如与其他硬件一起提供或作为其一部分提供的光存储介质或固态介质,但也可以以其他形式分发,诸如经由互联网或其他有线或无线电信系统。
如果在权利要求或说明书中使用术语“适于”,注意,术语“适于”旨在等同于术语“被配置为”。
权利要求中的任何附图标记不应当被解释为限制范围。
Claims (15)
1.一种咳嗽检测系统(10),包括:
第一数据集(DS1),包括和要对其实现咳嗽检测的用户相关的第一生理信息(PI1);
第二数据集(DS2),包括和可能在所述用户附近的其他人相关的第二生理信息(PI2);
麦克风(16),用于从所述用户附近收集声音;以及
处理器(20),其中所述处理器适于:
获取咳嗽检测算法(CDA1-CDAn),所述咳嗽检测算法适合于基于与所述第一生理信息相关联的第一咳嗽数据标识咳嗽,同时基于与所述第二生理信息相关联的第二咳嗽数据忽略咳嗽;以及
将所述咳嗽检测算法应用于所收集的所述声音,从而标识所述用户的咳嗽。
2.根据权利要求1所述的系统,其中:
所述处理器适于通过以所述第一咳嗽数据作为正类并且以所述第二咳嗽数据和非咳嗽声音数据作为负类构造咳嗽分类器,来获取咳嗽检测算法。
3.根据权利要求1所述的系统,还包括一组咳嗽检测算法(CDA1-CDAn),每个咳嗽检测算法针对特定的一组生理特性被定制,其中所述处理器适于通过选择所述一组咳嗽检测算法中的一个咳嗽检测算法来获取咳嗽检测算法。
4.根据权利要求3所述的系统,还包括:
第三数据集(DS3),包括所述第一咳嗽数据(CD1);以及
第四数据集(DS4),包括所述第二咳嗽数据(CD2),
并且其中所述处理器适于:
测试所述一组咳嗽检测算法中的多个咳嗽检测算法对所述第一咳嗽数据和所述第二咳嗽数据的响应;
基于对所述第一咳嗽数据和所述第二咳嗽数据的所述响应来选择所述一组咳嗽检测算法(CDA1-CDAn)中的一个或多个所述咳嗽检测算法,
并且其中每个咳嗽检测算法(CDA1-CDAn)包括经训练机器学习咳嗽分类器,或利用咳嗽模型。
5.根据权利要求1至4中任一项所述的系统,其中:
所述第一咳嗽数据(CD1)包括所述用户的自愿咳嗽声音的至少一个记录和/或所述用户的语音声音的至少一个记录;和/或
所述第二咳嗽数据(CD2)包括所述其他人中的一个或多个其他人的自愿咳嗽声音的至少一个记录和/或所述其他人中的一个或多个其他人的语音声音的至少一个记录。
6.根据权利要求1至5中任一项所述的系统,其中所述第一咳嗽数据(CD1)和第二咳嗽数据(CD2)包括咳嗽模型,所述咳嗽模型基于对应的生理信息对咳嗽声音进行建模。
7.根据权利要求1至6中任一项所述的系统,其中所述第一生理信息(PI1)和所述第二生理信息(PI2)各自包括以下中的一项或多项:
年龄;
性别;
医疗状况;
身高;
体重;
肺容积;以及
体重指数。
8.根据权利要求1至7中任一项所述的系统,其中所述第二数据集(DS2)包括与可能在所述用户附近的多个其他人相关的第二生理信息,并且其中所述处理器适于:
针对所述多个其他人中的每个其他人,测试所述一组咳嗽检测算法中的多个咳嗽检测算法对所述第二咳嗽数据的响应;或者
针对所述多个其他人中的每个其他人,生成结合咳嗽数据的混合第二咳嗽数据。
9.根据权利要求1至8中任一项所述的系统,其中所述处理器(20)适于解释与语音或脚步相关的音频以向所述咳嗽检测算法提供附加输入。
10.根据权利要求1至9中任一项所述的系统,其中所述处理器(20)适于基于由所述其他人携带的便携式电子设备来检测所述其他人中的一个或多个其他人的存在。
11.一种计算机实现的咳嗽检测方法,包括:
(30)从要对其实现咳嗽检测的用户附近收集声音;
(36)获取咳嗽检测算法(CDA1-CDAn),所述咳嗽检测算法适合于基于第一咳嗽数据来标识咳嗽,同时基于第二咳嗽数据来忽略咳嗽,所述第一咳嗽数据与和所述用户相关的第一生理信息相关联,所述第二咳嗽数据与和可能在所述用户附近的其他人相关的第二生理信息相关联;以及
(38)将所述咳嗽检测算法应用于所收集的所述声音,从而标识所述用户的咳嗽。
12.根据权利要求11所述的方法,其中获取咳嗽检测算法包括:
以所述第一咳嗽数据作为正类并且以所述第二咳嗽数据和非咳嗽声音数据作为负类构造咳嗽分类器;或者
从一组咳嗽检测算法(CDA1-CDAn)中选择一个或多个咳嗽检测算法,每个咳嗽检测算法针对特定的一组生理特性被定制。
13.根据权利要求12所述的方法,其中选择咳嗽检测算法包括:
(34)测试一组咳嗽检测算法中的多个咳嗽检测算法对所述第一咳嗽数据和所述第二咳嗽数据的响应;以及
(36)基于对所述第一咳嗽数据和所述第二咳嗽数据的所述响应来选择所述一组咳嗽检测算法中的一个或多个咳嗽检测算法,
并且其中每个咳嗽检测算法包括经训练机器学习咳嗽分类器,或利用咳嗽模型。
14.根据权利要求11至13中任一项所述的方法,其中:
所述第一咳嗽数据(CD1)包括所述用户的自愿咳嗽声音的至少一个记录和/或所述用户的语音声音的至少一个记录;和/或
所述第二咳嗽数据(CD2)包括所述其他人中的一个或多个其他人的自愿咳嗽声音的至少一个记录和/或所述其他人中的一个或多个其他人的语音声音的至少一个记录。
15.一种计算机程序,包括计算机程序代码装置,当所述程序在计算机上运行时,所述计算机程序代码装置适于实现根据权利要求11至14中任一项所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19218068.5A EP3839971A1 (en) | 2019-12-19 | 2019-12-19 | A cough detection system and method |
EP19218068.5 | 2019-12-19 | ||
PCT/EP2020/086322 WO2021122672A1 (en) | 2019-12-19 | 2020-12-16 | A cough detection system and method |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114830257A true CN114830257A (zh) | 2022-07-29 |
Family
ID=69410909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080088541.8A Pending CN114830257A (zh) | 2019-12-19 | 2020-12-16 | 咳嗽检测系统和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220409089A1 (zh) |
EP (2) | EP3839971A1 (zh) |
CN (1) | CN114830257A (zh) |
WO (1) | WO2021122672A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11862188B2 (en) * | 2020-10-22 | 2024-01-02 | Google Llc | Method for detecting and classifying coughs or other non-semantic sounds using audio feature set learned from speech |
US20220338756A1 (en) * | 2020-11-02 | 2022-10-27 | Insubiq Inc. | System and method for automatic detection of disease-associated respiratory sounds |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012014691A1 (ja) * | 2010-07-26 | 2012-02-02 | シャープ株式会社 | 生体測定装置、生体測定方法、生体測定装置の制御プログラム、および、該制御プログラムを記録した記録媒体 |
US20150245788A1 (en) * | 2013-07-22 | 2015-09-03 | Quvium Uk Ltd | Cough detection, analysis, and communication platform |
CN105868519A (zh) * | 2015-01-20 | 2016-08-17 | 中兴通讯股份有限公司 | 人体特征数据的处理方法及装置 |
WO2019023879A1 (zh) * | 2017-07-31 | 2019-02-07 | 深圳和而泰智能家居科技有限公司 | 咳嗽声音识别方法、设备和存储介质 |
-
2019
- 2019-12-19 EP EP19218068.5A patent/EP3839971A1/en not_active Withdrawn
-
2020
- 2020-12-16 CN CN202080088541.8A patent/CN114830257A/zh active Pending
- 2020-12-16 EP EP20824556.3A patent/EP4078616A1/en active Pending
- 2020-12-16 WO PCT/EP2020/086322 patent/WO2021122672A1/en unknown
- 2020-12-16 US US17/778,931 patent/US20220409089A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4078616A1 (en) | 2022-10-26 |
US20220409089A1 (en) | 2022-12-29 |
EP3839971A1 (en) | 2021-06-23 |
WO2021122672A1 (en) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200388287A1 (en) | Intelligent health monitoring | |
US11810670B2 (en) | Intelligent health monitoring | |
KR102630580B1 (ko) | 호흡기 질병 진단을 위한 질병 시그니처를 이용한 기침 소리 분석 방법 | |
US10726846B2 (en) | Virtual health assistant for promotion of well-being and independent living | |
JP6435257B2 (ja) | 患者音を処理するための方法および装置 | |
US20240127078A1 (en) | Transferring learning in classifier-based sensing systems | |
Barata et al. | Automatic recognition, segmentation, and sex assignment of nocturnal asthmatic coughs and cough epochs in smartphone audio recordings: observational field study | |
WO2019242155A1 (zh) | 基于声音识别的健康管理方法、装置和计算机设备 | |
US20210267488A1 (en) | Sensing system and method for monitoring time-dependent processes | |
US20220409089A1 (en) | A cough detection system and method | |
JP2023538287A (ja) | 呼吸器症候群を検出するためのアンサンブル機械学習モデル | |
JP2022544757A (ja) | ウェアラブルセンサを用いて被験者の転倒を検出するシステム及び方法 | |
CN112135568A (zh) | 信息处理装置、信息处理方法和程序 | |
WO2021150989A1 (en) | Systems and methods for audio processing and analysis of multi-dimensional statistical signature using machine learning algorithms | |
Zhao et al. | Dysphagia diagnosis system with integrated speech analysis from throat vibration | |
Lo Giudice et al. | Explainable Deep Learning Classification of Respiratory Sound for Telemedicine Applications | |
Ghaffarzadegan et al. | Active Learning for Abnormal Lung Sound Data Curation and Detection in Asthma | |
Kafentzis et al. | Predicting Tuberculosis from Real-World Cough Audio Recordings and Metadata | |
Worasawate et al. | Classification of Parkinson’s disease from smartphone recording data using time-frequency analysis and convolutional neural network | |
Ramasubramanian | Diagnosing the Stage of COVID-19 using Machine Learning on Breath Sounds | |
Avila et al. | Development of Android-Based Pulmonary Monitoring System for Automated Lung Auscultation Using Long Short-Term Memory (LSTM) Network with Post-Processing from Edge Impulse | |
Koravanavar et al. | Lung Sound Based Pulmonary Disease Classification Using Deep Learning | |
Han et al. | Cough classification of MEMS microphone signal using time-series and tabular machine learning algorithms | |
Juhari et al. | E-Stethoscope: Preliminary Classification of Chest Sound for Proper Intubation in Paediatrics | |
ZANINI | Automatic identification of cough events in audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |