CN116324983A - 一种无线可穿戴语音检测系统 - Google Patents
一种无线可穿戴语音检测系统 Download PDFInfo
- Publication number
- CN116324983A CN116324983A CN202180068061.XA CN202180068061A CN116324983A CN 116324983 A CN116324983 A CN 116324983A CN 202180068061 A CN202180068061 A CN 202180068061A CN 116324983 A CN116324983 A CN 116324983A
- Authority
- CN
- China
- Prior art keywords
- signal
- detection system
- wearable
- acc
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 51
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 24
- 230000001133 acceleration Effects 0.000 claims abstract description 12
- 230000005540 biological transmission Effects 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims abstract description 12
- 238000004891 communication Methods 0.000 claims abstract description 8
- 230000005236 sound signal Effects 0.000 claims abstract description 6
- 238000004458 analytical method Methods 0.000 claims description 22
- 230000036541 health Effects 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 10
- 238000004146 energy storage Methods 0.000 claims description 6
- 239000000853 adhesive Substances 0.000 claims description 5
- 230000001070 adhesive effect Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 230000006399 behavior Effects 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 claims description 4
- 230000007170 pathology Effects 0.000 claims description 4
- 238000012800 visualization Methods 0.000 claims description 4
- 238000013500 data storage Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 claims description 3
- 238000012805 post-processing Methods 0.000 claims description 3
- 210000003437 trachea Anatomy 0.000 claims description 3
- 210000001260 vocal cord Anatomy 0.000 claims description 3
- 101100023120 Arabidopsis thaliana MFDR gene Proteins 0.000 claims description 2
- 208000018737 Parkinson disease Diseases 0.000 claims description 2
- 206010039740 Screaming Diseases 0.000 claims description 2
- 230000006872 improvement Effects 0.000 claims description 2
- 238000012417 linear regression Methods 0.000 claims description 2
- 230000000737 periodic effect Effects 0.000 claims description 2
- 229920001296 polysiloxane Polymers 0.000 claims description 2
- 230000000391 smoking effect Effects 0.000 claims description 2
- 238000001228 spectrum Methods 0.000 claims description 2
- 210000001685 thyroid gland Anatomy 0.000 claims description 2
- 230000003442 weekly effect Effects 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 7
- 230000003203 everyday effect Effects 0.000 abstract description 3
- 230000001755 vocal effect Effects 0.000 description 8
- 230000002354 daily effect Effects 0.000 description 7
- 230000033001 locomotion Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 208000013403 hyperactivity Diseases 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035485 pulse pressure Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 206010013952 Dysphonia Diseases 0.000 description 1
- 241000027036 Hippa Species 0.000 description 1
- 206010067672 Spasmodic dysphonia Diseases 0.000 description 1
- 208000005248 Vocal Cord Paralysis Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 230000030808 detection of mechanical stimulus involved in sensory perception of sound Effects 0.000 description 1
- 230000035487 diastolic blood pressure Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 230000000004 hemodynamic effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 201000002849 spasmodic dystonia Diseases 0.000 description 1
- 230000009747 swallowing Effects 0.000 description 1
- 230000035488 systolic blood pressure Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 208000011293 voice disease Diseases 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/48—Other medical applications
- A61B5/4803—Speech analysis specially adapted for diagnostic purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/0002—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/68—Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient
- A61B5/6801—Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient specially adapted to be attached to or worn on the body surface
- A61B5/6813—Specially adapted to be attached to a specific body part
- A61B5/6822—Neck
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/46—Special adaptations for use as contact microphones, e.g. on musical instrument, on stethoscope
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B2562/00—Details of sensors; Constructional details of sensor housings or probes; Accessories for sensors
- A61B2562/02—Details of sensors specially adapted for in-vivo measurements
- A61B2562/0219—Inertial sensors, e.g. accelerometers, gyroscopes, tilt switches
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/74—Details of notification to user or communication with user or patient ; user input means
- A61B5/742—Details of notification to user or communication with user or patient ; user input means using visual displays
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/74—Details of notification to user or communication with user or patient ; user input means
- A61B5/7475—User input or interface means, e.g. keyboard, pointing device, joystick
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- Veterinary Medicine (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Multimedia (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Epidemiology (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Burglar Alarm Systems (AREA)
- Emergency Alarm Devices (AREA)
- Alarm Systems (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
Abstract
公开了一种项链形式的可穿戴语音检测系统,该可穿戴语音检测系统允许通过自主操作来对日常使用条件下的语音使用进行监测并且同时维持所获得信号的准确性和完整性。该系统包括:传感器装置,该传感器装置包括声音检测设备和加速计,该加速计记录用户的皮肤中的声音信号和加速度变化;与传感器装置进行电通信的控制装置,该控制装置包括处理设备和数据传输设备;其中控制装置被配置成接收和处理由传感器装置获得的信号,并且将经处理的数据传输到外部位置。
Description
相关申请的交叉参考
本申请主张申请人于2020年8月5日提出申请的编号为US 63/061,348的先前临时申请的权益。
背景技术
声音是人们生活中的基本工具,人的交流主要受声音的制约。因此,影响或消除说话能力的病症或声音障碍的出现会导致生活质量的显著下降和严重的职业健康问题。全世界每年有数百万人受声带小结、肌肉发音困难、紧张、痉挛性发音困难、声带麻痹或暂时性失声等影响。
目前,对声音病理或障碍的治疗仅通过在有限的时间内进行医疗咨询来进行,这不允许获得持续且足够的信息来充分描述其日常使用。在这个意义上,临床监测对于这些病理的诊断和治疗的有效性是必不可少的,但是其实施方案局限于医疗咨询,这排除了获得充分描述声音的实际使用的信息的可能性。在不具有这些信息的情况下,专家只能设计广谱疗法,这往往是低效的且导致大量复发症。
最近,为了对患有语音病症的患者提供适当的监测,已开发了通常具有项链形式的可穿戴装置,其允许使用电极、麦克风及其他设备来对语音的使用进行监测。
在文献US 2014/235977 A1中描述了现有技术的示例性技术,其公开了一种颈部穿戴式传感器,该传感器是对来自走动的患者的若干参数进行测量的单个身体穿戴式系统。根据每搏输出量,采用线性模型的第一种算法可对患者的脉压进行估测。并且根据脉压和脉搏传导时间,同样采用线性算法的第二种算法可对收缩压和舒张压进行估测。因此,项链可对所有五个生命体征以及血液动力学参数进行测量。该项链还包括运动检测加速计,该项链可通过运动检测加速计来确定运动相关的参数,例如姿势、运动程度、活动水平、呼吸引起的胸部起伏以及跌倒。
上述现有技术的装置会解决与设备的便携性相关的问题,从而允许通过可穿戴装置对用户进行半连续的监测。然而,此装置的配置旨在用于一般的数据记录,但无需特别注意信号完整性。考虑到所使用的传感器(加速计)的目的,这是显而易见的,其目的是记录用户的移动,但不具有进一步的处理来彻底分析语音信号的特性。
记录和分析语音信号的另一种方法是基于使用颈部表面加速计,其允许非侵入性和非阻碍性的语音测量和吞咽测量。代表现有技术的这种技术的一个文献是文献US 2014/0066724 A1,其描述了对受试者的发声功能进行评估的系统和方法。此系统包括加速计和计算机系统,加速计被配置成获取与受试者的发声功能相关联的表面加速度数据,计算机系统被配置成对表面加速度数据进行分析并基于表面加速度数据对受试者产生的声门气流波形进行估测。计算机系统通过基于经校准的传输线模型对表面加速度数据应用逆滤波器来执行分析和估测,并基于所估测的声门气流波形生成对受试者的发声功能的指示。
然而,上述系统需要将传感器连接到计算机系统,以对由传感器获得的数据进行分析。因此,所描述的系统不会解决便携性问题并且不符合自主操作的要求。另外,计算机系统需要使用音频编解码器来对数据进行预处理并以数字方式存储所述数据。此种预处理可根据计算机系统而变化并且可包括增益、带通滤波和降噪,此将导致信号失真,从而影响信号的完整性和后续的数据分析。另外,作为有线装置,上述系统容易出现意想不到的连接问题。
因此,需要提供一种自主装置来记录在日常条件下一天中对声音的完整使用,并且能够同时保持信号的准确性和完整性,因此该数据可用于获得对发声功能的评估有用的某些参数和指标并且对所述参数和指标进行估测。
实用新型内容
本发明涉及一种项链形式的可穿戴语音检测系统,其允许对用户语音的使用进行监测,所述系统包括:
传感器装置,所述传感器装置包括声音检测设备和加速计,所述加速计记录用户的皮肤中的声音信号和加速度变化;以及
与所述传感器装置进行电通信的控制装置,所述控制装置包括处理设备和数据传输设备;
其中所述控制装置被配置成接收和处理由所述传感器装置获得的信号,并且将经处理的数据传输到外部位置。
所描述的系统包括紧凑、小尺寸的元件,其允许作为可穿戴物体而实现便携性和可用性,从而允许在日常使用条件下连续监控语音。通过声音检测设备与加速计的组合使用,所述系统能够准确地记录和分析声带的使用,以便对一系列生理参数进行估测,这些生理参数不仅对研究人员和声音专业人员具有临床意义,而且对任何将他们的声音用作工作工具并需要精确监测他们声音健康的专业人员也距有临床意义,例如播音员、歌手、教师、记者等。因此,上述系统的特定配置能够显著改善每年影响世界上数百万人的声带病变的评估、诊断和监测能力,在最严重的情况下,这些声带病变甚至导致永久性失声。
因此,本发明的装置的操作是基于同时使用加速计与麦克风,从而允许对信号进行实时处理,以基于用户的发声使用向用户传递即时反馈,这构成了发声治疗的破坏性方法。
所描述的系统的关键特征之一是处理设备与传感装置分离,从而通过提供项链形式的微创性可穿戴装置来提供分离的、小的且紧凑的元件,这有利于用户的可穿戴性和舒适性。
优选地,从所捕获的信号获得的经处理数据可存储在控制装置中的数据存储设备中并且可周期性地或实时地传输到外部位置(例如外部计算机或云)中,在所述外部位置可稍后由专家在后处理或医学分析中对所述经处理数据进行分析。可选地,控制装置可被配置成通过蓝牙将信息实时传输到用户界面,例如智能手机中的应用程序。
本发明所解决的关键方面之一是信号的完整性。这一方面是通过选择正确的传感器、具有针对声音应用程序的特定带宽的加速度计与麦克风的组合实现的,且另一方面是通过优化的数据采集过程实现的,包括通过硬件进行滤波以对信号进行预调节且然后使用音频编解码器来进一步处理所述信号。本发明的这种特性的组合提供了对输入信号行为的完全控制,从而使相位和谐波失真最小化并最终对数据进行编码以便传输和存储。
更具体来说,使用策略性地放置在气管上的加速计允许对声门流量、声门下压力和用于识别发声机能亢进的其他确定变量进行估测。另外,由加速计获得的数据由声音检测设备对声音的环境捕捉来补充,可选择性地控制打开和关闭声音检测设备,从而允许患者决定何时他不希望记录某些信息。这两种机制的组合允许即时检测发声滥用。
声音与加速度这两种信号的组合和同时使用允许传递用于对发声功能进行评估的临床相关信息,并且已经显示出能够更好地识别发声滥用的模式,从而产生更有用的装置,并且因此受到健康专家和患者的更大青睐。其功能允许使用高级参数和指示器进行反馈(这是一种革命性的治疗方法),从而对信号进行预处理,并传输数据以向用户提供反馈。另外,其无线、符合人体工程学和谨慎的设计隐藏了其医疗性质,使其易于使用,提供了一个看起来不像医疗装置的物体,允许用户将所述装置作为可穿戴物品使用,而不影响所捕获信号的质量。
附图说明
图1A和图1B示出本发明的可穿戴语音检测系统的优选实施例。
图2示出本发明优选实施例中的传感器装置的分解图。
图3示出本发明优选实施例中的控制装置的分解图。
具体实施方式
以下内容是对示例性实施例的详细描述,以例示出本发明的原理。提供实施例来示出本发明的方面,但是本发明不限于任何实施例。本发明的范围包括许多替换、修改和等效能容,仅由权利要求的实施例界定。
根据图1A、图1B和图2,在本发明的第一方面中公开了一种项链形式的可穿戴语音检测系统(100),所述系统包括:
传感器装置(110),所述传感器装置包括声音检测设备(112)和加速计(114),所述加速计记录用户的皮肤中的声音信号和加速度变化;
与所述传感器装置(110)进行电通信的控制装置(120),所述控制装置包括处理设备和数据传输设备;
其中所述控制装置被配置成接收和处理由所述传感器装置获得的信号,并且将经处理的数据传输到外部位置。
如图1A和图1B中所公开,优选地,控制装置与传感器装置通过电连接(130)连接,这允许所述两个元件之间进行通信,以允许将由传感器装置(110)捕获的信号传输到控制装置(120)进行处理。分离的元件的这种配置允许实现小而紧凑的传感器和控制装置,从而为用户提供舒适的非侵入式系统。更优选地,系统(100)被配置成将控制装置(120)定位在颈部后面并且将传感器装置(110)定位在靠近气管的前部区域。更优选地,传感器装置(110)位于胸骨切迹与甲状腺突出部之间的颈部皮肤上,以允许更准确地接收信号。
参照图2,公开了传感器装置(110)的优选实施例的分解图。在此实施例中,传感器装置(110)包括前壳体(111)、声音检测设备(112)、加速计外壳(113)、加速计(114)、后盖(115)、粘合剂设备(117)和橡胶或硅橡胶垫(116)。前壳体(111)和后盖(115)被配置成对声音检测设备(112)与加速计(114)进行耦合并为其提供外壳。后盖(115)可包括孔(118),以允许加速计(114)与用户皮肤之间的通信。粘合剂设备(117)被配置成允许将传感器装置(110)以可移除方式固定在用户的皮肤中,优选地借助于双面接触带。另外,传感器装置的元件优选地被设计和选择成使得它们不影响对信号的捕获,特别是后盖(115)、橡胶垫(116)和粘合剂设备(117),其中粘合剂设备(117)必须允许能够允许振动传输的固定,以便加速计的正确操作。
参照图3,公开了控制装置(120)的优选实施例的分解图。在此实施例中,控制装置(120)包括控制设备(121)、前壳体(122)、处理设备(123)、能量存储设备(124)和后盖(125)。控制设备(121)被配置成包括一个或多个按钮,以允许对系统的一些操作特征进行控制。优选地,能量存储设备(124)被配置成提供超过12小时连续记录的寿命,从而允许全天不间断的监测,从而获得几天的测量值。
能量存储设备(124)允许系统的自主操作。为了完成此种操作,能量存储设备(124)优选地由电池组成,该电池允许系统在没有与外部源的物理连接的情况下进行操作。在此实施例中,充电端口可包括在控制装置中,以允许使用外部电源对电池进行充电。
处理设备(123)被配置成实施语音处理算法并命令系统(100)的所有元件。优选地,处理设备(123)由印刷电路板组成,配置有最先进的电子技术并且能够处理信号以基于用户的发声使用向用户传递即时反馈(生物反馈),这是发声治疗的新方法。所获得的数据可在云中(符合HIPPA)或外部位置安全地存储和处理,这要归功于专为解释这些数据而设计的独特算法,该算法允许为卫生专业人员生成新的有用信息(例如流量声门气道、声门下压力和发声效率)。
在本发明的优选实施例中,处理设备(123)包括数据存储设备,所述数据存储设备被配置成存储系统正在处理的所有数据,从而允许在使用所述装置时对数据进行处理。
控制装置优选地包括数据传输设备,所述数据传输设备被配置成允许将经处理数据传输到外部位置。优选地,传输设备被配置成周期性地或实时地将经处理数据传输到外部位置,例如外部计算机或云中,在所述外部位置中稍后可由专家在后处理或医学分析中对所述数据进行分析。可选地,控制装置可配置成通过蓝牙将信息实时传输到用户界面,例如计算机或智能手机中的应用程序。
在优选实施例中,将经处理数据优选地传输到用户界面,所述用户界面被配置成在针对研究人员和语音专业人员的对应软件中对数据进行可视化和分析。经处理数据可在各种移动平台和计算机中可视化,无论是对卫生专业人员还是对患者,以对周期性或实时处理的信息进行可视化和分析并对前所未有的发声功能进行追踪。
控制设备(121)可为包括一个或多个按钮的键盘,或者可被配置为触摸板,并且被配置成提供用于系统操作的基本命令,例如打开和关闭系统或者其他替代功能。另外,控制装置可包括显示装置(例如屏幕或灯)以提供关于操作状态的基本信息,例如电池电量或其他操作特征。
在优选实施例中,处理设备被配置成对输入信号实施几种处理或算法,包括通过硬件进行滤波以对信号进行预调节且然后使用音频编解码器来进一步处理所述信号。此种程序结合使用正确的传感器、具有针对声音应用程序的特定带宽的加速度计与麦克风的组合,允许保持信号的完整性,从而提供对输入信号行为的完全控制,最以大限度地减少相位和谐波失真并最终对数据进行编码以便传输和存储。
处理设备被配置成实施声音分析引擎,所述声音分析引擎是使用系统(100)获得的核心分析。声音分析引擎包括为评估声音功能而设计的几种算法,具有两个分析模块,其利用颈部表面加速度信号(neck surface acceleration signal,ACC)和由声音检测装置(优选为麦克风(microphone,MIC))获得的声音信号进行操作。
第一个分析模块是“标准声音健康分析”,它考虑了语音信号处理方法,这些方法在任何先前的移动语音监视器中都不可用。此种模块包括以下功能:
-MIC信号去可懂度(de-intelligibility),其中通过MIC均方根(RMS)将高带宽信号转换成所选择特征,例如声压级(Sound Pressure Level,SPL)、快速傅立叶变换(FastFourier Transform,FFT)的幅度。
-每日ACC位置校准检查,在语音活动检测(vocal activity detection,VAD)之后通过MIC RMS和ACC数据二者进行所述每日ACC位置校准检查。
-使用ACC和MIC相关性对ACC信号和相关的VAD特征进行的稳健语音活动检测(VAD)。
-在VAD之后通过MIC RMS和ACC数据二者产生的发声强度。
-使用自相关从所述ACC信号提取的基频(f0)。
-发声剂量(来自所述ACC信号的SPL和f0),所述发声剂量包括周期剂量和距离剂量。
-声学剂量计,所述声学剂量计包括通过VAD和MIC信号处理进行的背景噪声水平检测。
-发声效率(SPL相对ACC)。
-一次谐波与二次谐波之间的比率H1-H2,所述比率是基于所述ACC信号的FFT。
-频谱倾斜,对所述ACC信号的FFT进行高分辨率滤波。
-所述ACC讯号和MIC信号上的倒谱峰突起(Cepstral peak prominence,CPP)。
另外,可通过处理设备获得以下高级特征,这些特征已被证明能够更好地识别发声机能亢进行为并且是在走动情况下更全面地评估发声机能的关键:
-空气动力学特征,如通过基于阻抗的逆滤波(Impedance-Based InverseFiltering,IBIF)算法从所述ACC信号、口腔气流体积速度(oral airflow volumevelocity,OVV)、声门下压力获得的AC流(不稳定空气流)、最大流量下降率(maximum flowdeclination rate,MFDR)、开放商(OQ,开放期与整个声门周期持续时间的比率)、速度商(SQ,声带的打开阶段与关闭阶段之间的比率)。这还包括使用MIC逆滤波而不是原始IBIF算法中的口腔气流体积速度(OVV)信号(通过使用专用设备并在受控环境中获得)来获得稳健的受试者特定IBIF参数的校准方案。使用加权方法获得IBIF模型参数,该加权方法对来自不同元音的估计的信息进行组合。这种新的校准方案以前在科学/技术文献中未报道过。
-通过使用来自所述MIC信号的SPL的多元线性回归(使用先前的所述空气动力学特征、ACC特征和IBIF特征)获得的声门下压力。
-使用所述ACC信号和所述MIC信号二者的歌唱检测。
因此,借助于上述特征,本发明允许获得和估测对评估发声功能有用的参数和指标,例如SPL、VAD、f0、H1-H2、CPP,这些参数和指标目前只能在临床设施中获得,并且它们中的一些(例如空气动力学特征)需要高度侵入性的过程来获得。这里描述的语音检测系统允许通过可携带装置在连续操作中获得这些参数和指示符。
另外,处理装置被配置成提供每日报告。一旦计算出声音健康指标,声音分析引擎就生成结果的摘要。这些结果被保存并发送给用户(例如通过移动应用程序或网络浏览器)和健康专家。具体内容包括原始特征、每日/每周统计和每日生物反馈总结。作为每日报告的补充,语音分析引擎还能够基于每日报告和用户请求的分析生成图形信息。此种模块中的功能可根据需要选择,包括:
-具有用户定义的窗口时间的跨时间的波形和频谱可视化。
-具有平滑窗口时间和用户定义的窗口时间的跨时间的多种发声健康测量。
-标准发声测量或高级发声测量中的任一者的一维直方图和二维直方图。
-利用UMAP降维技术进行的可视化。
-同一时间窗口中的参数在不同的分析日期之间的比较。
-将获得的参数变化与所述用户的习惯(吸烟、饮食、尖叫等)与环境变量相关联。
-获得与描述“语音质量”的指示符相对应的发声效率水平指示符,这些指标允许患者注意到他们的改善。
-对参数进行估测以识别和支持不同病理和/或健康状况的诊断,甚至超出语音范围,例如帕金森氏症。
尽管已经以概括和详细的形式根据特定实施例和应用描述了本发明,但是这些描述并不旨在以任何方式将其范围限制于任何此种实施例和应用,并且将理解,在不背离本发明的精神的情况下,本领域中的技术人员可对在此示出的方法和系统的所描述的实施例、应用和细节进行许多替换、改变和变化。
Claims (22)
1.一种项链形式的可穿戴语音检测系统(100),包括:
传感器装置(110),所述传感器装置包括声音检测设备(112)和加速计(114),所述加速计记录用户的皮肤中的声音信号和加速度变化;
与所述传感器装置(110)进行电通信的控制装置(120),所述控制装置包括处理设备和数据传输设备;
其中所述控制装置被配置成接收和处理由所述传感器装置获得的信号,并且将经处理的数据传输到外部位置。
2.根据权利要求1所述的可穿戴语音检测系统,其中所述控制装置和所述传感器装置通过电连接(130)而连接,所述电连接允许将由所述传感器装置(110)捕获的所述信号传送到所述控制装置(120)以进行处理。
3.根据权利要求1所述的可穿戴语音检测系统,其中所述控制装置(120)位于颈部后面,并且所述传感器装置(110)位于前部区域,靠近气管,以更准确地接收所述信号。
4.根据权利要求3所述的可穿戴语音检测系统,其中所述传感器装置(110)位于胸骨切迹与甲状腺突出部之间的颈部皮肤上。
5.根据权利要求1所述的可穿戴语音检测系统,其中所述传感器装置(110)包括所述声音检测设备(112)、加速计外壳(113)、所述加速计(114)、被配置成耦合并为所述传感器装置提供外壳的前壳体(111)和后盖(115)。
6.根据权利要求5所述的可穿戴语音检测系统,其中所述传感器装置(110)还包括粘合剂设备(117)和橡胶或硅橡胶垫(116),所述粘合剂设备被配置成允许将所述传感器装置(110)以可移除方式固定在所述用户的皮肤中,所述橡胶或硅橡胶垫被选择成不影响对所述信号的捕获。
7.根据权利要求5所述的可穿戴语音检测系统,其中所述后盖(115)包括孔(118),以允许所述加速计(114)与所述用户的皮肤之间的通信。
8.根据权利要求1所述的可穿戴语音检测系统,其中所述控制装置(120)包括控制设备(121)、前壳体(122)、处理设备(123)、能量存储设备(124)和后盖(125)。
9.根据权利要求8所述的可穿戴语音检测系统,其中所述控制设备(121)包括一个或多个按钮,以允许对所述系统的一些操作特征进行控制。
10.根据权利要求8所述的可穿戴语音检测系统,其中所述控制设备(121)包括具有一个或多个按钮或触摸板的键盘,并且被配置成提供用于所述系统的操作的基本命令,例如打开所述系统和关闭所述系统等。
11.根据权利要求8所述的可穿戴语音检测系统,其中所述控制设备包括例如屏幕或灯等显示设备,以提供关于操作状态的基本信息,如电池电量或其他操作特征。
12.根据权利要求8所述的可穿戴语音检测系统,其中所述能量存储设备(124)被配置成提供超过12小时连续记录的自主操作。
13.根据权利要求1所述的可穿戴语音检测系统,其中所述处理设备(123)被配置成处理所述信号并将所述信号传递到外部位置。
14.根据权利要求1所述的可穿戴语音检测系统,其中所述处理设备(123)包括数据存储设备,所述数据存储设备被配置成存储所述系统正在处理的所有数据。
15.根据权利要求1所述的可穿戴语音检测系统,其中所述传输设备被配置成将所述经处理的数据传输到所述外部位置,在所述外部位置处,稍后能够由技术人员在后处理或医学分析中对所述数据进行分析。
16.根据权利要求15所述的可穿戴语音检测系统,其中所述经处理的数据优选地被传输到用户接口,所述用户接口被配置成在使所述数据在对应的软件中可视化并对所述数据进行分析。
17.根据权利要求1所述的可穿戴语音检测系统,其中所述处理设备被配置成对输入信号实施处理或算法,包括通过硬件进行滤波以对所述信号进行预调节且然后使用音频编解码器来进一步处理所述信号。
18.根据权利要求1所述的可穿戴语音检测系统,其中所述处理设备被配置成实施语音分析引擎,包括为评估语音功能而设计的算法,具有分析模块,所述分析模块利用颈部表面加速度信号(ACC)和由优选为麦克风(MIC)的所述声音检测设备获得的声音信号进行操作。
19.根据权利要求18所述的可穿戴语音检测系统,其中所述分析模块包括:
-MIC信号去可懂度(de-intelligibility),其中通过MIC均方根(RMS)将高带宽信号转换成所选择特征,例如声压级(SPL)、快速傅立叶变换(FFT)的幅度;
-每日ACC位置校准检查,在语音活动检测(VAD)之后通过MIC RMS和ACC数据二者进行所述每日ACC位置校准检查;
-使用ACC和MIC相关性对ACC信号和相关的VAD特征进行的稳健语音活动检测(VAD);
-在VAD之后通过MIC RMS和ACC数据二者产生的发声强度;
-使用自相关从所述ACC信号提取的基频(f0);
-发声剂量(来自所述ACC信号的SPL和f0),所述发声剂量包括周期剂量和距离剂量;
-声学剂量计,所述声学剂量计包括通过VAD和MIC信号处理进行的背景噪声水平检测;
-发声效率(SPL相对ACC);
-一次谐波与二次谐波之间的比率H1-H2,所述比率是基于所述ACC信号的FFT;
-频谱倾斜,对所述ACC信号的FFT进行高分辨率滤波;以及
-所述ACC讯号和MIC信号上的倒谱峰突起(CPP)。
20.根据权利要求18所述的可穿戴语音检测系统,其中所述语音分析引擎还包括用于更好地识别语音超功能行为的高级特征,包括:
-空气动力学特征,如通过基于阻抗的逆滤波(IBIF)算法从所述ACC信号获得的AC流(不稳定空气流)、最大流量下降率(MFDR)、开放商(OQ,开放期与整个声门周期持续时间的比率)、速度商(SQ,声带的打开阶段与关闭阶段之间的比率),包括使用MIC逆滤波来获得稳健的受试者特定IBIF参数的校准方案;
-通过使用来自所述MIC信号的SPL的多元线性回归(使用先前的所述空气动力学特征、ACC特征和IBIF特征)获得的声门下压力;以及
-使用所述ACC信号和所述MIC信号二者的歌唱检测。
21.根据权利要求18所述的可穿戴语音检测系统,其中所述处理装置被配置成提供包括由所述语音分析引擎生成的数据的每日报告,例如原始特征、每日/每周统计数据和每日生物反馈摘要。
22.根据权利要求21所述的可穿戴语音检测系统,其中所述语音分析引擎还能够基于所述每日报告和用户请求的分析来生成图形信息,并且提供所获得的参数与用户的习惯和环境特性之间的相关性,所述相关性包括:
-具有用户定义的窗口时间的跨时间的波形和频谱可视化;
-具有平滑窗口时间和用户定义的窗口时间的跨时间的多种发声健康测量;
-标准发声测量或高级发声测量中的任一者的一维直方图和二维直方图;以及
-利用UMAP降维技术进行的可视化;
-同一时间窗口中的参数在不同的分析日期之间的比较;
-将获得的参数变化与所述用户的习惯(吸烟、饮食、尖叫等)与环境变量相关联;
-获得与描述“语音质量”的指示符相对应的发声效率水平指示符,这些指标允许患者注意到他们的改善;
-对参数进行估测以识别和支持不同病理和/或健康状况的诊断,甚至超出语音范围,例如帕金森氏症。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063061348P | 2020-08-05 | 2020-08-05 | |
US63/061,348 | 2020-08-05 | ||
PCT/IB2021/057224 WO2022029694A1 (en) | 2020-08-05 | 2021-08-05 | A wireless wearable voice detection system |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116324983A true CN116324983A (zh) | 2023-06-23 |
Family
ID=80117785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180068061.XA Pending CN116324983A (zh) | 2020-08-05 | 2021-08-05 | 一种无线可穿戴语音检测系统 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230293095A1 (zh) |
EP (1) | EP4192345A4 (zh) |
CN (1) | CN116324983A (zh) |
BR (1) | BR112023002086A2 (zh) |
CL (1) | CL2023000337A1 (zh) |
MX (1) | MX2023001553A (zh) |
WO (1) | WO2022029694A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3119373B1 (en) * | 2014-03-19 | 2019-01-30 | Copa Animal Health LLC | Sensory stimulation or monitoring apparatus for the back of neck |
US20190159953A1 (en) * | 2017-11-28 | 2019-05-30 | Regents Of The University Of Minnesota | Wearable devices and methods for treatment of focal dystonia of the neck, head and voice |
JP2021513895A (ja) * | 2018-02-16 | 2021-06-03 | ノースウェスタン ユニヴァーシティNorthwestern University | ワイヤレス医療センサおよび方法 |
US10856070B2 (en) * | 2018-10-19 | 2020-12-01 | VocoLabs, Inc. | Throat microphone system and method |
-
2021
- 2021-08-05 BR BR112023002086A patent/BR112023002086A2/pt unknown
- 2021-08-05 US US18/019,784 patent/US20230293095A1/en active Pending
- 2021-08-05 CN CN202180068061.XA patent/CN116324983A/zh active Pending
- 2021-08-05 MX MX2023001553A patent/MX2023001553A/es unknown
- 2021-08-05 WO PCT/IB2021/057224 patent/WO2022029694A1/en unknown
- 2021-08-05 EP EP21852151.6A patent/EP4192345A4/en active Pending
-
2023
- 2023-02-02 CL CL2023000337A patent/CL2023000337A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
US20230293095A1 (en) | 2023-09-21 |
MX2023001553A (es) | 2023-05-03 |
BR112023002086A2 (pt) | 2023-04-11 |
WO2022029694A9 (en) | 2022-03-31 |
EP4192345A4 (en) | 2024-04-24 |
CL2023000337A1 (es) | 2023-07-28 |
WO2022029694A1 (en) | 2022-02-10 |
EP4192345A1 (en) | 2023-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Leng et al. | The electronic stethoscope | |
JP2021513895A (ja) | ワイヤレス医療センサおよび方法 | |
US20070282174A1 (en) | System and method for acquisition and analysis of physiological auditory signals | |
US20220007964A1 (en) | Apparatus and method for detection of breathing abnormalities | |
GB2454960A (en) | Data recording for patient status analysis | |
EP2471461A1 (en) | An integrated monitoring device arranged for recording and processing body sounds from multiple sensors | |
CN110115596A (zh) | 肺音监测装置及其肺音监测方法 | |
Qu et al. | Monitoring of physiological sounds with wearable device based on piezoelectric MEMS acoustic sensor | |
Siddiqui et al. | Hand gesture recognition using multiple acoustic measurements at wrist | |
Shi et al. | Neural network based real-time heart sound monitor using a wireless wearable wrist sensor | |
Goverdovsky et al. | Co-located multimodal sensing: A next generation solution for wearable health | |
KR20150001009A (ko) | 휴대용 무선 디지털 전자 청진기를 이용한 휴대 단말 진단 시스템 | |
US20200138320A1 (en) | Handheld or Wearable Device for Recording or Sonifying Brain Signals | |
Tanaka et al. | Gestural musical performance with physiological sensors, focusing on the electromyogram | |
TW200927065A (en) | Monitoring and control system for cardiopulmonary function and device thereof | |
Rigas et al. | Real-time quantification of resting tremor in the Parkinson's disease | |
CN112489796A (zh) | 一种智能听诊辅助诊断系统及诊断方法 | |
Gilliam III et al. | In-ear infrasonic hemodynography with a digital health device for cardiovascular monitoring using the human audiome | |
CN116324983A (zh) | 一种无线可穿戴语音检测系统 | |
CN207412163U (zh) | 肌肉训练评估装置 | |
JP7320867B2 (ja) | 医療機器及びプログラム | |
Monika et al. | Embedded Stethoscope for Real Time Diagnosis of Cardiovascular Diseases | |
Anand | PC based monitoring of human heart sounds | |
Mayat et al. | Towards a low-cost point-of-care screening platform for electronic auscultation of vital body sounds | |
US20230058011A1 (en) | Method apparatus and system of wearable synchronized multiple vital health sensors and data processing and applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |