KR20230023624A - 디지털 청진기에 의해 생성된 오디오 데이터의 분석을 통한 건강에 대한 통찰의 도출 - Google Patents

디지털 청진기에 의해 생성된 오디오 데이터의 분석을 통한 건강에 대한 통찰의 도출 Download PDF

Info

Publication number
KR20230023624A
KR20230023624A KR1020227041116A KR20227041116A KR20230023624A KR 20230023624 A KR20230023624 A KR 20230023624A KR 1020227041116 A KR1020227041116 A KR 1020227041116A KR 20227041116 A KR20227041116 A KR 20227041116A KR 20230023624 A KR20230023624 A KR 20230023624A
Authority
KR
South Korea
Prior art keywords
respiratory
audio data
event
diagnostic platform
entries
Prior art date
Application number
KR1020227041116A
Other languages
English (en)
Inventor
위안 런 청
푸순 수
지-더 황
상-란 황
Original Assignee
히로익 페이스 메디컬 사이언스 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 히로익 페이스 메디컬 사이언스 컴퍼니 리미티드 filed Critical 히로익 페이스 메디컬 사이언스 컴퍼니 리미티드
Publication of KR20230023624A publication Critical patent/KR20230023624A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7203Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0002Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
    • A61B5/0015Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network characterised by features of the telemetry system
    • A61B5/0022Monitoring a patient using a global network, e.g. telephone networks, internet
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • A61B5/0816Measuring devices for examining respiratory frequency
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7225Details of analog processing, e.g. isolation amplifier, gain or sensitivity adjustment, filtering, baseline or drift compensation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7246Details of waveform analysis using correlation, e.g. template matching or determination of similarity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7253Details of waveform analysis characterised by using transforms
    • A61B5/7257Details of waveform analysis characterised by using transforms using Fourier transforms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7282Event detection, e.g. detecting unique waveforms indicative of a medical condition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/74Details of notification to user or communication with user or patient ; user input means
    • A61B5/746Alarms related to a physiological condition, e.g. details of setting alarm thresholds or avoiding false alarms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/003Detecting lung or respiration noise
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/02Stethoscopes
    • A61B7/04Electric stethoscopes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2562/00Details of sensors; Constructional details of sensor housings or probes; Accessories for sensors
    • A61B2562/02Details of sensors specially adapted for in-vivo measurements
    • A61B2562/0204Acoustic sensors

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Veterinary Medicine (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Physiology (AREA)
  • Signal Processing (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pulmonology (AREA)
  • Mathematical Physics (AREA)
  • Acoustics & Sound (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Power Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

여기에는, 전자 청진기 시스템들에 의해 생성된 오디오 데이터의 분석을 통한 환자들의 건강에 대한 통찰을 도출하기 위한 컴퓨터 프로그램들 및 연관된 컴퓨터 구현 기법들이 소개된다. 진단 플랫폼은 환자의 건강에 대한 통찰을 얻기 위해 전자 청진기 시스템에 의해 생성된 오디오 데이터를 검사하는 것을 담당할 수도 있다. 진단 플랫폼은 의료 전문가에 의한 시각적 분석에 의존하는 전통적인 접근법들을 상당히 능가하는 방식으로 청진을 수행하기 위해 머신 학습 또는 인공 지능에 의존하는 휴리스틱스, 알고리즘들, 또는 모델들을 채용할 수도 있다.

Description

디지털 청진기에 의해 생성된 오디오 데이터의 분석을 통한 건강에 대한 통찰의 도출
다양한 실시형태들은 전자 청진기 시스템들에 의해 생성된 오디오 데이터의 분석을 통해 환자들의 건강에 대한 통찰을 도출하기 위한 컴퓨터 프로그램들 및 연관된 컴퓨터 구현 기법들에 관한 것이다.
역사적으로, 음향 청진기는 생체 내로부터 발생하는 내부 사운드들을 청취하는데 사용되었다. 이 프로세스 - "청진 (auscultation)" 으로서 지칭됨 - 는 보통 이들 내부 사운드들로부터 성능을 추론할 수 있는 생물학적 시스템들을 검사할 목적으로 수행된다. 보통, 음향 청진기는 신체에 대해 배치되도록 설계된 공진기를 갖는 단일의 체스트피스 및 이어피스들에 연결되는 중공 튜브들의 쌍을 포함한다. 음파들이 공진기에 의해 캡처될 때, 이들은 중공 튜브들의 쌍을 통해 이어피스들로 지향된다.
그러나, 음향 청진기는 여러 결점들을 겪는다. 예를 들어, 음향 청진기는 소스의 주파수에 비례하여 사운드를 감쇠시킬 것이다. 따라서, 이어피스들로 전달되는 사운드는 매우 희미한 경향이 있어, 상태들을 정확하게 진단하기 어렵게 할 수 있다. 실제로, 귀의 민감도의 변화로 인해, 일부 사운드들 (예를 들어, 50 헤르츠 미만의 사운드들) 은 전혀 들리지 않을 수도 있다.
일부 기업들은 음향 청진기의 결점들을 해결하기 위해 전자 청진기 ("청진기" 로서 또한 지칭됨) 를 개발하기 시작했다. 전자 청진기는 사운드들을 전자적으로 증폭시킴으로써 음향 청진기를 개선한다. 예를 들어, 전자 청진기는 이들 사운드들을 증폭시킴으로써 생체 내부에서 발생하는 희미한 사운드들을 처리할 수도 있다. 이를 위해, 전자 청진기는 체스트피스에 위치한 마이크로폰에 의해 검출된 음파들을 전기 신호로 변환하고, 그 다음 최적의 청취를 위해 전기 신호를 증폭시킨다.
도 1a 는 전자 청진기 시스템용 입력 유닛의 상부 사시도를 포함한다.
도 1b-도 1c 는 도 1a 에 도시된 입력 유닛의 하부 사시도들을 포함한다.
도 2 는 전자 청진기 시스템용 입력 유닛의 측단면도를 포함한다.
도 3 은 전자 청진기 시스템을 형성하기 위해 하나 이상의 입력 유닛들이 허브 유닛에 연결될 수 있는 방법을 예시한다.
도 4 는 전자 청진기 시스템의 입력 유닛 및 허브 유닛의 예시적인 컴포넌트들을 예시하는 하이-레벨 블록 다이어그램이다.
도 5 는 진단 플랫폼을 포함하는 네트워크 환경을 예시한다.
도 6 은 환자의 건강의 변화들을 검출, 진단, 및 모니터링하는데 도움이 되는 출력들을 생성하도록 설계된 진단 플랫폼을 구현할 수 있는 컴퓨팅 디바이스의 예를 예시한다.
도 7 은 오디오 데이터의 분석들이 검토를 위해 인터페이스 상에 제시되기 전에 진단 플랫폼에 의해 획득된 오디오 데이터가 백그라운드 서비스에 의해 프로세싱될 수 있는 방법을 예시하는 워크플로우 다이어그램의 예를 포함한다.
도 8 은 검출 페이즈 동안 진단 플랫폼에 의해 채용될 수도 있는 계산 파이프라인의 하이-레벨 예시를 포함한다.
도 9 는 진단 플랫폼에 의해 채용될 수 있는 여러 베이스라인 모델들의 아키텍처를 예시한다.
도 10 은 오디오 데이터의 개별 세그먼트들이 진단 플랫폼에 의해 분류될 수 있는 방법을 예시한다.
도 11a 는 호흡률 (respiratory rate) 을 추정하기 위한 알고리즘 접근법의 하이-레벨 예시를 포함한다.
도 11b 는 진단 플랫폼이 미리결정된 빈도로 업데이트되는 미리결정된 길이의 기록에 대해 슬라이딩 윈도우를 사용하여 호흡률을 계산할 수도 있는 방법을 예시한다.
도 12 는 진단 플랫폼이 자기상관을 사용하여 흡기 (inhalations) 및 호기 (exhalations) 를 식별하는 청진에 대한 대안적인 접근법을 예시한다.
도 13a 는 의료 전문가에 의한 진단 결정을 용이하게 하기 위해 진단 플랫폼에 의해 생성된 스펙트로그램이 거의 실시간으로 제시될 수도 있는 방법을 예시한다.
도 13b 는 환자의 건강에 대한 추가적인 통찰을 제공하기 위해 디지털 엘리먼트들 ("그래픽 엘리먼트들" 로서 또한 지칭됨) 이 스펙트로그램을 오버레이할 수도 있는 방법을 예시한다.
도 14 는 오디오 데이터의 분석을 통해 호흡 이벤트들을 검출하고, 그 다음 그 호흡 이벤트들에 기초하여 호흡률을 계산하기 위한 프로세스의 플로우 다이어그램을 도시한다.
도 15 는 환자의 폐에 의해 만들어진 사운드들을 포함하는 오디오 데이터의 분석에 기초하여 호흡률을 계산하기 위한 프로세스의 플로우 다이어그램을 도시한다.
도 16 은 본 명세서에서 설명된 전자 청진기 시스템들 및 진단 플랫폼들이 청진 사운드들을 듣고 거의 실시간으로 호흡 이벤트들을 보기 위해 의료 전문가들에 의해 사용될 수 있는 방법을 예시한다.
도 17 은 본 명세서에서 설명된 적어도 일부 동작들이 구현될 수 있는 프로세싱 시스템의 예를 예시하는 블록 다이어그램이다.
실시형태들은 도면들에서 제한이 아닌 예로서 예시된다. 도면들은 예시의 목적으로 다양한 실시형태들을 도시하지만, 당업자는 대안적인 실시형태들이 본 기술의 원리들로부터 일탈함 없이 채용될 수도 있음을 인식할 것이다. 따라서, 도면들에는 특정 실시형태들이 도시되지만, 본 기술은 다양한 수정들이 가능하다.
전자 청진기 시스템들은 하기에 추가로 논의되는 바와 같이 검사 중인 생체 내부 및 외부로부터 발생하는 사운드들을 동시에 모니터링하도록 설계될 수 있다. 하기에 추가로 논의되는 바와 같이, 전자 청진기 시스템은 허브 유닛에 연결되는 하나 이상의 입력 유닛들을 포함할 수도 있다. 각각의 입력 유닛은 생체 내부에서 발생하는 내부 사운드들을 나타내는 오디오 데이터를 생성하도록 구성되는 적어도 하나의 마이크로폰을 향해 음파들을 지향시키도록 설계되는 원추형 공진기를 가질 수도 있다. 이들 마이크로폰들은 "청진 마이크로폰들" 로서 지칭될 수도 있다. 더욱이, 각각의 입력 유닛은 생체 외부에서 발생하는 외부 사운드들을 나타내는 오디오 데이터를 생성하도록 구성되는 적어도 하나의 마이크로폰을 포함할 수도 있다. 이들 마이크로폰들은 "주변 마이크로폰들" 또는 "환경 마이크로폰들" 로서 지칭될 수도 있다.
예시의 목적을 위해, "주변 마이크로폰" 은 "주변 사운드들" 을 나타내는 오디오 데이터를 생성할 수 있는 것으로 설명될 수도 있다. 그러나, 이들 "주변 사운드들" 은 일반적으로 3 개의 상이한 소스들에 의해 생성된 외부 사운드들의 조합을 포함한다: (1) 주변 환경으로부터 발생하는 사운드들; (2) 입력 유닛을 통해 새어나오는 사운드들; 및 (3) 검사 중인 생체를 관통하는 사운드들. 외부 사운드의 예들은 입력 유닛으로부터 직접 발생하는 사운드들 (예를 들어, 손가락 또는 가슴에 의한 스크래칭) 및 입력 유닛을 관통하는 저주파수 환경 노이즈들을 포함한다.
내부 및 외부 사운드들을 별도로 기록하는 데는 여러 이점들이 있다. 특히, 내부 사운드들은 전자적으로 증폭될 수 있는 한편, 외부 사운드들은 전자적으로 약화, 감쇠, 또는 필터링될 수 있다. 따라서, 전자 청진기 시스템은 내부 및 외부 사운드들을 나타내는 오디오 데이터를 조작함으로써 검사 중인 생체 내로부터 발생하는 희미한 사운드들을 처리할 수도 있다. 그러나, 조작은 내부 사운드들을 해석하기 더 어렵게 하는 바람직하지 않은 디지털 아티팩트들을 초래할 수도 있다. 예를 들어, 이들 디지털 아티팩트들은 흡기 또는 호기를 나타내는 청진 마이크로폰들에 의해 생성된 오디오 데이터의 값들의 패턴들을 식별하는 것을 더 어렵게 할 수도 있다.
여기에는, 전자 청진기 시스템들에 의해 생성된 오디오 데이터의 분석을 통해 환자들의 건강에 대한 통찰을 도출하기 위한 컴퓨터 프로그램들 및 연관된 컴퓨터 구현 기법들이 소개된다. 진단 플랫폼 ("진단 프로그램" 또는 "진단 애플리케이션" 으로서 또한 지칭됨) 은 환자의 건강에 대한 통찰을 얻기 위해 전자 청진기 시스템에 의해 생성된 오디오 데이터를 검사하는 것을 담당할 수도 있다. 하기에 추가로 논의되는 바와 같이, 진단 플랫폼은 의료 전문가에 의한 시각적 분석에 의존하는 전통적인 접근법들을 상당히 능가하는 방식으로 청진을 수행하기 위해 머신 학습 (ML) 또는 인공 지능 (AI) 에 의존하는 휴리스틱스, 알고리즘들, 또는 모델들을 채용할 수도 있다.
예를 들어, 진단 플랫폼이 환자에 연결되는 전자 청진기 시스템에 의해 생성된 오디오 데이터에 기초하여 환자의 호흡률을 추론하는 임무를 맡고 있다고 가정한다. 용어 "호흡률" 은 분당 호흡들의 수 (number of breaths) 를 지칭한다. 휴식 중인 성인의 경우, 분당 호흡들이 12 내지 25 회의 호흡률이 정상으로 간주된다. 휴식 중 분당 호흡들이 12 회 미만이거나 또는 분당 호흡들이 25 회 초과인 호흡률은 비정상으로 간주된다. 호흡률은 건강의 주요 지표이기 때문에, 때때로 "바이탈 사인" 으로서 지칭된다. 따라서, 호흡률에 대한 지식은 환자에게 적절한 치료를 제공하는데 중요할 수도 있다.
위에서 언급된 바와 같이, 전자 청진기 시스템은 내부 사운드들을 나타내는 오디오 데이터 및 외부 사운드들을 나타내는 오디오 데이터를 생성할 수도 있다. 전자는 "제 1 오디오 데이터" 또는 "내부 오디오 데이터" 로서 지칭될 수도 있고, 후자는 "제 2 오디오 데이터" 또는 "외부 오디오 데이터" 로서 지칭될 수도 있다. 일부 실시형태들에서, 진단 플랫폼은 제 1 오디오 데이터를 개선하기 위해 제 2 오디오 데이터를 활용한다. 따라서, 진단 플랫폼은, 한다 하더라도, 제 1 오디오 데이터가 외부 사운드들의 영향을 줄이기 위해 조작되어야 하는 방법을 결정하기 위해 제 2 오디오 데이터를 검사할 수도 있다. 예를 들어, 진단 플랫폼이 제 2 오디오 데이터의 분석을 통해 외부 사운드를 발견하면, 진단 플랫폼은 관심 있는 내부 사운드들 (예를 들어, 흡기, 호기 등에 대응하는 사운드들) 을 왜곡시키지 않고 외부 사운드를 제거하기 위한 노력으로 제 1 오디오 데이터를 획득하고, 그 다음 그 제 1 오디오 데이터에 필터를 적용할 수도 있다. 필터는 제 2 오디오 데이터의 분석에 기초하여 진단 플랫폼에 의해 생성될 수도 있거나, 또는 필터는 제 2 오디오 데이터의 분석에 기초하여 진단 플랫폼에 의해 (예를 들어, 다중의 필터들 중에서) 식별될 수도 있다.
그 다음, 진단 플랫폼은 제 1 오디오 데이터에 컴퓨터 구현 모델 (또는 간단히 "모델") 을 적용할 수 있다. 모델은 호흡, 즉, 흡기 및 호기의 별개의 페이즈들을 식별하도록 설계 및 훈련될 수도 있다. 모델은 하나 이상의 인공 뉴럴 네트워크들 (또는 간단히 "뉴럴 네트워크들") 에 기초하는 딥 러닝 모델일 수도 있다. 뉴럴 네트워크는 복잡한 입력들을 프로세싱하기 위해 함께 작동하는 ML 알고리즘들의 프레임워크이다. 인간 및 동물의 뇌들을 구성하는 생물학적 뉴럴 네트워크들에 의해 영감을 받아, 뉴럴 네트워크들은 태스크-특정 규칙들로 프로그래밍되지 않고 예들을 고려하여 태스크들을 수행하는 법을 "학습" 할 수 있다. 예를 들어, 뉴럴 네트워크는 "흡기", "호기", 또는 "흡기 또는 호기 없음" 으로 라벨링된 일련의 오디오 데이터를 검사함으로써 흡기 및 호기를 식별하는 법을 학습할 수도 있다. 이들 일련의 오디오 데이터는 "훈련 데이터" 로서 지칭될 수도 있다. 훈련에 대한 이러한 접근법은 뉴럴 네트워크가 그 존재가 일련의 오디오 데이터로부터 흡기 및 호기를 나타내는 특징들을 자동으로 학습할 수 있게 한다. 예를 들어, 뉴럴 네트워크는 흡기를 나타내는 오디오 데이터의 값들의 패턴들 뿐만 아니라 호기를 나타내는 오디오 데이터의 값들의 패턴들을 이해하게 될 수도 있다.
모델에 의해 생성된 출력들이 도움이 될 수도 있지만, 그 출력들은 해석하기 어려울 수 있다. 예를 들어, 진단 플랫폼은 환자를 모니터링, 검사, 또는 진단하는 것을 담당하는 의료 전문가에 의한 검토를 위해 제 1 오디오 데이터의 시각적 표현 ("시각화" 로서 또한 지칭됨) 을 생성할 수도 있다. 진단 플랫폼은 시각화의 이해도 (comprehensibility) 를 개선하기 위한 노력으로 흡기 또는 호기를 시각적으로 강조할 수도 있다. 예를 들어, 진단 플랫폼은 환자가 숨을 쉬었음을 표시하기 위해 시각화 상에 디지털 엘리먼트 ("그래픽 엘리먼트" 로서 또한 지칭됨) 를 오버레이할 수도 있다. 하기에 추가로 논의되는 바와 같이, 디지털 엘리먼트는 모델에 의해 결정된 바와 같은 흡기의 시작으로부터 모델에 의해 결정된 바와 같은 호기의 종료까지 연장될 수도 있다. 모델에 의해 생성된 출력들을 보다 이해하기 쉬운 방식으로 설명함으로써, 진단 플랫폼은 그 출력들에 의존하는 의료 전문가들과 신뢰를 쌓을 수 있다.
더욱이, 진단 플랫폼은 모델에 의해 생성된 출력들을 활용하여 환자의 건강에 대한 통찰을 얻을 수도 있다. 예를 들어, 모델이 위에서 논의된 바와 같이 흡기 및 호기를 식별하기 위해 환자와 연관된 오디오 데이터에 적용된다고 가정한다. 그러한 시나리오에서, 진단 플랫폼은 그 출력들을 활용하여 메트릭들을 생성할 수도 있다. 그러한 메트릭의 일 예는 호흡률이다. 위에서 언급된 바와 같이, 용어 "호흡률" 은 분당 호흡들의 수를 지칭한다. 그러나, 마지막 순간 동안 실제 호흡들의 수를 세는 것은 단순히 실용적이지 않다. 환자가 제한된 양의 시간 동안이라도 산소결핍을 겪으면 상당한 회복 불가능한 손상이 발생할 수도 있다. 따라서, 의료 전문가들은 거의 실시간으로 업데이트되는 호흡률에 대한 일관된 통찰을 갖는 것이 중요하다. 이를 위해, 진단 플랫폼은 슬라이딩 윈도우 알고리즘을 사용하여 지속적으로 호흡률을 계산할 수도 있다. 하이 레벨에서, 알고리즘은 오디오 데이터의 일 부분을 포함하는 윈도우를 정의하고, 그 다음 오디오 데이터의 상이한 부분들을 커버하기 위해 윈도우를 계속해서 슬라이딩한다. 하기에 추가로 논의되는 바와 같이, 알고리즘은 미리결정된 수의 흡기 또는 호기가 항상 그 경계 (bounds) 내에 포함되도록 윈도우를 조정할 수도 있다. 예를 들어, 알고리즘은 3 회의 흡기가 윈도우의 경계 내에 포함되어야 하도록 프로그래밍될 수도 있으며, 여기서 제 1 흡기는 윈도우의 "시작" 을 나타내고, 제 3 흡기는 윈도우의 "종료" 를 나타낸다. 그 다음, 진단 플랫폼은 윈도우에 포함된 흡기 사이의 간격에 기초하여 호흡률을 계산할 수 있다.
예시의 목적을 위해, 실시형태들은 컴퓨팅 디바이스에 의해 실행가능한 명령들의 맥락에서 설명될 수도 있다. 그러나, 본 기술의 양태들은 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 임의의 조합을 통해 구현될 수 있다. 일 예로서, 환자의 흡기 및 호기를 나타내는 출력들을 식별하기 위해 전자 청진기 시스템에 의해 생성된 오디오 데이터에 모델이 적용될 수도 있다. 그 다음, 환자의 호흡률을 표시하는 메트릭을 생성하기 위해 모델에 의해 생성된 출력들에 알고리즘이 적용될 수도 있다.
실시형태들은 특정 컴퓨팅 디바이스들, 네트워크들, 및 의료 전문가들 및 시설들을 참조하여 설명될 수도 있다. 그러나, 당업자는 그 실시형태들의 특징들이 다른 컴퓨팅 디바이스들, 네트워크들, 및 의료 전문가들 및 시설들에 유사하게 적용가능함을 인식할 것이다. 예를 들어, 실시형태들은 딥 뉴럴 네트워크의 맥락에서 설명될 수도 있지만, 진단 플랫폼에 의해 채용된 모델은 딥 빌리프 네트워크들, 순환 뉴럴 네트워크들, 및 컨볼루션 뉴럴 네트워크들과 같은, 다른 딥 러닝 아키텍처에 기초할 수도 있다.
용어
본 출원 전반에 걸쳐 사용된 용어들, 약어들, 및 어구들의 간략한 정의들이 하기에 주어진다.
용어들 "연결된", "결합된", 및 이들의 임의의 변형들은 직접적 또는 간접적인, 2 개 이상의 엘리먼트들 사이의 임의의 연결 또는 결합을 포함하도록 의도된다. 연결 또는 결합은 물리적, 논리적, 또는 이들의 조합일 수 있다. 예를 들어, 오브젝트들은 물리적 연결을 공유하지 않음에도 불구하고 서로 전기적으로 또는 통신가능하게 연결될 수도 있다.
용어 "모듈" 은 소프트웨어, 펌웨어, 하드웨어, 또는 이들의 임의의 조합을 통해 구현된 컴포넌트들을 광범위하게 지칭하기 위해 사용될 수도 있다. 일반적으로, 모듈들은 하나 이상의 입력들에 기초하여 하나 이상의 출력들을 생성하는 기능적 컴포넌트들이다. 컴퓨터 프로그램은 하나 이상의 모듈들을 포함할 수도 있다. 따라서, 컴퓨터 프로그램은 상이한 태스크들을 완료하는 것을 담당하는 다중의 모듈들 또는 모든 태스크들을 완료하는 것을 담당하는 단일의 모듈을 포함할 수도 있다.
전자 청진기 시스템의 개요
도 1a 는 전자 청진기 시스템용 입력 유닛 (100) 의 상부 사시도를 포함한다. 편의상, 입력 유닛 (100) 은, 입력 유닛이 청진에 필요한 컴포넌트들의 서브세트만을 포함할 수도 있지만, "청진기 패치" 로서 지칭될 수도 있다. 입력 유닛 (100) 은 신체의 가슴에 부착되는 경우가 많기 때문에 "체스트피스 (chestpiece)" 로서 또한 지칭될 수도 있다. 그러나, 당업자는 입력 유닛 (100) 이 신체의 다른 부분들 (예를 들어, 목, 복부, 또는 등) 에도 부착될 수도 있음을 인식할 것이다.
하기에 추가로 설명되는 바와 같이, 입력 유닛 (100) 은 검사 중인 신체 내의 생물학적 활동들을 나타내는 음파들을 수집하고, 음파들을 전기 신호로 변환하고, 그 다음 전기 신호를 (예를 들어, 더 용이한 송신을 위해, 더 높은 충실도를 보장하기 위해 등등) 디지털화할 수 있다. 입력 유닛 (100) 은 강성 재료로 구성된 구조체 (structural body) (102) 를 포함할 수 있다. 보통, 구조체 (102) 는 스테인레스 스틸, 알루미늄, 티타늄, 또는 적합한 금속 합금과 같은 금속으로 구성된다. 구조체 (102) 를 제조하기 위해, 용융 금속은 통상적으로 다이-캐스트되고, 그 다음 적절한 형태로 머시닝 또는 압출될 것이다.
일부 실시형태들에서, 입력 유닛 (100) 은 주변 환경에 대한 구조체 (102) 의 노출을 억제하는 케이싱 (casing) 을 포함한다. 예를 들어, 케이싱은 오염을 방지하고, 청결도 (cleanability) 를 개선하는 등을 행할 수도 있다. 일반적으로, 케이싱은 그 하부 측면을 따라 배치된 원추형 공진기를 제외하고 실질적으로 모든 구조체 (102) 를 캡슐화한다. 원추형 공진기는 도 1b-도 1c 와 관련하여 하기에 더 깊이 있게 설명된다. 케이싱은 실리콘 고무, 폴리프로필렌, 폴리에틸렌, 또는 임의의 다른 적합한 재료로 구성될 수도 있다. 더욱이, 일부 실시형태들에서, 케이싱은 첨가제를 포함하고, 그 첨가제의 존재는 미생물 성장, 자외선 (UV) 분해 등을 제한한다.
도 1b-도 1c 는 원위 부분 (104) 및 근위 부분 (106) 을 갖는 구조체 (102) 를 포함하는 입력 유닛 (100) 의 하부 사시도들을 포함한다. 청진 절차를 개시하기 위해, 개인 (예를 들어, 의사 또는 간호사와 같은 의료 전문가) 은 검사 중인 신체의 표면에 대해 입력 유닛 (100) 의 근위 부분 (106) 을 고정할 수 있다. 입력 유닛 (100) 의 근위 부분 (106) 은 원추형 공진기 (110) 의 더 넓은 개구 (108) 를 포함할 수 있다. 원추형 공진기 (110) 는 더 넓은 개구 (108) 를 통해 수집된 음파들을 더 좁은 개구 (112) 를 향해 지향시키도록 설계될 수도 있으며, 이는 청진 마이크로폰으로 이어질 수도 있다. 종래에, 더 넓은 개구 (108) 는 대략 30-50 밀리미터 (mm), 35-45 mm, 또는 38-40 mm 이다. 그러나, 여기에 설명된 입력 유닛 (100) 은 자동 이득 제어 기능을 가질 수도 있기 때문에, 더 작은 원추형 공진기들이 사용될 수도 있다. 예를 들어, 일부 실시형태들에서, 더 넓은 개구 (108) 는 30 mm, 20 mm, 또는 10 mm 미만이다. 따라서, 본 명세서에서 설명된 입력 유닛들은 상이한 사이즈들을 갖고, 상이한 애플리케이션들을 위해 설계되는 등등의 매우 다양한 원추형 공진기들을 지원 가능할 수도 있다.
용어들 "원위" 및 "근위" 와 관련하여, 달리 명시되지 않는 한, 용어들은 신체에 대한 입력 유닛 (100) 의 상대적 위치들을 지칭한다. 예를 들어, 신체에 고정하기에 적합한 입력 유닛 (100) 을 언급할 때, "원위" 는 디지털 신호들을 전달하기에 적합한 케이블이 입력 유닛 (100) 에 연결될 수도 있는 곳에 가까운 제 1 위치를 지칭할 수 있고, "근위" 는 입력 유닛 (100) 이 신체에 접촉하는 곳에 가까운 제 2 위치를 지칭할 수 있다.
도 2 는 전자 청진기 시스템용 입력 유닛 (200) 의 측단면도를 포함한다. 종종, 입력 유닛 (200) 은 내부 공동이 안에 정의되어 있는 구조체 (202) 를 포함한다. 입력 유닛 (200) 의 구조체 (202) 는 내부 공동 내에 상주하는 마이크로폰을 향해 음파들을 지향시키도록 설계된 원추형 공진기 (204) 를 가질 수도 있다. 일부 실시형태들에서, 다이어프램 (diaphragm) (212) ("진동막" 으로서 또한 지칭됨) 은 원추형 공진기 (204) 의 더 넓은 개구 ("외부 개구" 로서 또한 지칭됨) 를 가로질러 연장된다. 다이어프램 (212) 은 폐에 의해 종종 생성되는 것들과 같은 고음의 (high-pitched) 사운드들을 청취하는데 사용될 수 있다. 다이어프램 (212) 은 에폭시-섬유유리 화합물 또는 유리 섬유들로 구성된 얇은 플라스틱 디스크로 형성될 수 있다.
원추형 공진기 (204) 에 의해 수집된 음파들의 선명도를 개선하기 위해, 입력 유닛 (200) 은 상이한 위치들로부터 발생하는 사운드들을 동시에 모니터링하도록 설계될 수도 있다. 예를 들어, 입력 유닛 (200) 은 검사 중인 신체 내로부터 발생하는 사운드들 및 주변 환경으로부터 발생하는 사운드들을 동시에 모니터링하도록 설계될 수도 있다. 따라서, 입력 유닛 (200) 은 내부 사운드들을 나타내는 오디오 데이터를 생성하도록 구성된 적어도 하나의 마이크로폰 (206) ("청진 마이크로폰" 으로서 또한 지칭됨) 및 주변 사운드들을 나타내는 오디오 데이터를 생성하도록 구성된 적어도 하나의 마이크로폰 (208) ("주변 마이크로폰" 으로서 지칭됨) 을 포함할 수도 있다. 각각의 청진 및 주변 마이크로폰은 음파들을 전기 신호로 변환할 수 있는 변환기 (transducer) 를 포함할 수도 있다. 그 후, 청진 및 주변 마이크로폰들 (206, 208) 에 의해 생성된 전기 신호들은 허브 유닛으로의 송신 전에 디지털화될 수도 있다. 디지털화는 허브 유닛이 다중의 입력 유닛들로부터 수신된 신호들을 용이하게 클록킹 또는 동기화할 수 있게 한다. 디지털화는 또한, 입력 유닛으로부터 허브 유닛에 의해 수신된 신호들이 달리 가능할 것보다 더 높은 충실도를 갖는 것을 보장할 수도 있다.
이들 마이크로폰들은 모든 방향들로부터 사운드를 픽업하도록 설계된 무지향성 (omnidirectional) 마이크로폰들 또는 특정 방향으로부터 오는 사운드들을 픽업하도록 설계된 지향성 (directional) 마이크로폰들일 수도 있다. 예를 들어, 입력 유닛 (200) 은 원추형 공진기 (204) 의 외부 개구에 인접한 공간으로부터 발생하는 사운드들을 픽업하도록 배향된 청진 마이크로폰(들) (206) 을 포함할 수도 있다. 그러한 실시형태들에서, 주변 마이크로폰(들) (208) 은 무지향성 또는 지향성 마이크로폰들일 수도 있다. 다른 예로서, 주변 마이크로폰들 (208) 의 세트는 입력 유닛 (200) 의 구조체 (202) 내에 동일하게 이격되어, 노이즈 및 간섭을 감소시키기 위해 고지향성 주변 사운드들을 캡처할 수 있는 페이즈드 어레이 (phased array) 를 형성할 수 있다. 따라서, 청진 마이크로폰(들) (206) 은 인입 내부 사운드들의 경로 ("청진 경로" 로서 또한 지칭됨) 에 초점을 맞추도록 배열될 수도 있는 한편, 주변 마이크로폰(들) (208) 은 인입 주변 사운드들의 경로들 ("주변 경로들" 로서 또한 지칭됨) 에 초점을 맞추도록 배열될 수도 있다.
종래에, 전자 청진기는 바람직하지 않은 아티팩트들을 필터링하는 것을 담당했던 디지털 신호 프로세싱 (DSP) 알고리즘들에 음파들을 나타내는 전기 신호들을 적용하였다. 그러나, 그러한 액션은 소정의 주파수 범위들 (예를 들어, 100-800 Hz) 내의 거의 모든 사운드를 억제하여, 관심 있는 내부 사운드들 (예를 들어, 흡기, 호기, 또는 심장박동에 대응하는 사운드들) 을 크게 왜곡시킬 수 있다. 그러나, 여기서, 프로세서는 청진 마이크로폰(들) (206) 에 의해 생성된 오디오 데이터 및 주변 마이크로폰(들) (208) 에 의해 생성된 오디오 데이터를 개별적으로 검사하는 능동 노이즈 소거 알고리즘을 채용할 수 있다. 보다 구체적으로, 프로세서는, 한다 하더라도, 청진 마이크로폰(들) (206) 에 의해 생성된 오디오 데이터가 수정되어야 하는 방법을 결정하기 위해 주변 마이크로폰(들) (208) 에 의해 생성된 오디오 데이터를 파싱할 수도 있다. 예를 들어, 프로세서는 소정의 디지털 특징들이 증폭 (예를 들어, 이들은 내부 사운드들에 대응하기 때문), 감소 (예를 들어, 이들은 주변 사운드들에 대응하기 때문), 또는 완전히 제거 (예를 들어, 이들은 노이즈를 나타내기 때문) 되어야 한다는 것을 발견할 수도 있다. 그러한 기법은 입력 유닛 (200) 에 의해 기록된 사운드의 선명도, 디테일, 및 품질을 개선하는데 사용될 수 있다. 예를 들어, 노이즈 소거 알고리즘의 적용은 적어도 하나의 입력 유닛 (200) 을 포함하는 전자 청진기 시스템에 의해 채용된 노이즈제거 프로세스 (denoising process) 의 필수적인 부분일 수도 있다.
프라이버시 목적을 위해, 청진 마이크로폰(들) (206) 이나 주변 마이크로폰(들) (208) 중 어느 것도 원추형 공진기 (204) 가 신체로부터 멀리 지향되는 동안 기록하도록 허용되지 않을 수도 있다. 따라서, 일부 실시형태들에서, 청진 마이크로폰(들) (206) 및/또는 주변 마이크로폰(들) (208) 은 입력 유닛 (200) 이 신체에 부착될 때까지 기록을 시작하지 않는다. 그러한 실시형태들에서, 입력 유닛 (200) 은 구조체 (202) 가 신체의 표면에 적절하게 고정되었는지 여부를 결정하는 것을 담당하는 하나 이상의 부착 센서들 (210a-c) 을 포함할 수도 있다.
입력 유닛 (200) 은 여기에 도시된 부착 센서들의 임의의 서브세트를 포함할 수 있다. 예를 들어, 일부 실시형태들에서, 입력 유닛 (200) 은 원추형 공진기 (204) 의 더 넓은 개구 근처에 위치되는 부착 센서들 (210a-b) 만을 포함한다. 다른 예로서, 일부 실시형태들에서, 입력 유닛 (200) 은 원추형 공진기 (204) 의 더 좁은 개구 ("내부 개구" 로서 또한 지칭됨) 근처에 위치되는 부착 센서 (210c) 만을 포함한다. 더욱이, 입력 유닛 (200) 은 상이한 타입들의 부착 센서들을 포함할 수도 있다. 예를 들어, 부착 센서 (210c) 는, 원추형 공진기 (204) 를 통해 광 (예를 들어, 적외선) 을 방출하고, 그 다음 원추형 공진기 (204) 로 다시 반사된 광에 기초하여, 입력 유닛 (200) 과 신체의 표면 사이의 거리를 결정하도록 설계된 광학 근접 센서일 수도 있다. 다른 예로서, 부착 센서들 (210a-c) 은, 고주파수 신호의 드롭-오프 (drop-off) 를 결정하도록 프로그래밍된 알고리즘의 도움으로, 구조체 (202) 가 주변 노이즈 ("환경 노이즈" 로서 또한 지칭됨) 의 존재에 기초하여 신체의 표면에 대해 견고하게 밀봉되는지 여부를 결정하도록 설계된 오디오 센서들일 수도 있다. 다른 예로서, 부착 센서들 (210a-b) 은 인가된 압력의 양에 기초하여 구조체 (202) 가 신체의 표면에 대해 견고하게 밀봉되는지 여부를 결정하도록 설계된 압력 센서들일 수도 있다. 입력 유닛 (200) 의 일부 실시형태들은 이들 상이한 타입들의 부착 센서들의 각각을 포함한다. 전술한 능동 노이즈 소거 알고리즘과 조합하여 이들 부착 센서(들) (210a-c) 의 출력을 고려함으로써, 프로세서는 접착 상태 (adhesion state) 를 동적으로 결정 가능할 수도 있다. 즉, 프로세서는 이들 부착 센서들 (210a-c) 의 출력에 기초하여 입력 유닛 (200) 이 신체에 대해 밀봉을 형성했는지 여부를 결정 가능할 수도 있다.
도 3 은 전자 청진기 시스템 (300) 을 형성하기 위해 하나 이상의 입력 유닛들 (302a-n) 이 허브 유닛 (304) 에 연결될 수 있는 방법을 예시한다. 일부 실시형태들에서, 다중의 입력 유닛들이 허브 유닛 (304) 에 연결된다. 예를 들어, 전자 청진기 시스템 (300) 은 4 개의 입력 유닛들, 6 개의 입력 유닛들, 또는 8 개의 입력 유닛들을 포함할 수도 있다. 일반적으로, 전자 청진기 시스템 (300) 은 적어도 6 개의 입력 유닛들을 포함할 것이다. 다중의 입력 유닛들을 갖는 전자 청진기 시스템들은 "멀티-채널 청진기" 로서 지칭될 수도 있다. 다른 실시형태들에서, 하나의 입력 유닛만이 허브 유닛 (304) 에 연결된다. 예를 들어, 단일의 입력 유닛은 다중의 입력 유닛들의 어레이를 시뮬레이션하는 방식으로 신체를 가로질러 이동될 수도 있다. 하나의 입력 유닛을 갖는 전자 청진기 시스템들은 "단일-채널 청진기" 로서 지칭될 수도 있다.
도 3 에 도시된 바와 같이, 각각의 입력 유닛 (302a-n) 은 대응하는 케이블 (306a-n) 을 통해 허브 유닛 (304) 에 연결될 수 있다. 일반적으로, 대응하는 케이블 (306a-n) 을 통해 각각의 입력 유닛 (302a-n) 과 허브 유닛 (304) 사이에 형성된 송신 경로는 실질적으로 간섭이 없도록 설계된다. 예를 들어, 전자 신호들은 허브 유닛 (304) 으로의 송신 전에 입력 유닛들 (302a-n) 에 의해 디지털화될 수도 있고, 전자기 노이즈의 생성/오염을 금지함으로써 신호 충실도가 보장될 수도 있다. 케이블들의 예들은 리본 케이블들, 동축 케이블들, USB (Universal Serial Bus) 케이블들, HDMI (High-Definition Multimedia Interface) 케이블들, RJ45 이더넷 케이블들, 및 디지털 신호를 전달하기에 적합한 임의의 다른 케이블을 포함한다. 각각의 케이블은 (예를 들어, 물리적 포트를 통해) 허브 유닛 (304) 에 연결된 제 1 단부 및 (예를 들어, 물리적 포트를 통해) 대응하는 입력 유닛에 연결된 제 2 단부를 포함한다. 따라서, 각각의 입력 유닛 (302a-n) 은 단일의 물리적 포트를 포함할 수도 있고, 허브 유닛 (304) 은 다중의 물리적 포트들을 포함할 수도 있다. 대안적으로, 모든 입력 유닛들 (302a-n) 을 허브 유닛 (304) 에 연결하기 위해 단일의 케이블이 사용될 수도 있다. 그러한 실시형태들에서, 케이블은 허브 유닛 (304) 과 인터페이스할 수 있는 제 1 단부 및 단일의 입력 유닛과 각각 인터페이스할 수 있는 일련의 제 2 단부들을 포함할 수도 있다. 그러한 케이블은 예를 들어, 제 2 단부들의 수에 기초하여 "1-대-2 케이블", "1-대-4 케이블", 또는 "1-대-6 케이블" 로서 지칭될 수도 있다.
허브 유닛들 (304) 에 연결된 모든 입력 유닛들 (302a-n) 이 청진 모드에 있을 때, 전자 청진기 시스템 (300) 은 내부 사운드들을 주변 사운드들과 비교하도록 프로그래밍된 적응 이득 제어 알고리즘을 채용할 수 있다. 적응 이득 제어 알고리즘은 적절한 사운드 레벨이 달성되었는지 여부를 판단하기 위해 타겟 청진 사운드 (예를 들어, 정상 호흡, 천명 (wheezing), 수포음 (crackling) 등) 를 분석할 수도 있다. 예를 들어, 적응 이득 제어 알고리즘은 사운드 레벨이 미리결정된 임계치를 초과하는지 여부를 결정할 수도 있다. 적응 이득 제어 알고리즘은 (예를 들어, 2 개의 상이한 스테이지들에서) 최대 100 배의 이득 제어를 달성하도록 설계될 수도 있다. 이득 레벨은 입력 유닛 어레이 (308) 의 입력 유닛들의 수 뿐만 아니라 각각의 입력 유닛 내의 청진 마이크로폰(들) 에 의해 기록된 사운드의 레벨에 기초하여 적응적으로 조정될 수도 있다. 일부 실시형태들에서, 적응 이득 제어 알고리즘은 피드백 루프의 일부로서 전개되도록 프로그래밍된다. 따라서, 적응 이득 제어 알고리즘은 입력 유닛에 의해 기록된 오디오에 이득을 적용하고, 오디오가 미리프로그래밍된 강도 임계치를 초과하는지 여부를 결정하고, 결정에 기초하여 추가 이득이 필요한지 여부를 동적으로 결정할 수도 있다.
전자 청진기 시스템 (300) 이 포스트프로세싱 절차 동안 적응 이득 제어 알고리즘을 전개할 수 있기 때문에, 입력 유닛 어레이 (308) 는 심장, 폐 등에 의해 야기된 넓은 범위의 사운드들에 관한 정보를 수집하도록 허용될 수도 있다. 입력 유닛 어레이 (308) 의 입력 유닛들 (302a-n) 은 신체의 표면을 따라 (또는 완전히 상이한 신체 상에) 상이한 해부학적 위치들에 배치될 수 있기 때문에, 상이한 생체 특성들 (예를 들어, 호흡률, 심박수, 또는 천명, 수포음의 정도 등) 이 전자 청진기 시스템 (300) 에 의해 동시에 모니터링될 수 있다.
도 4 는 전자 청진기 시스템의 입력 유닛 (400) 및 허브 유닛 (450) 의 예시적인 컴포넌트들을 예시하는 하이-레벨 블록 다이어그램이다. 입력 유닛 (400) 및 허브 유닛 (450) 의 실시형태들은 도 4 에 도시된 컴포넌트들의 임의의 서브세트, 뿐만 아니라 여기에 예시되지 않은 추가적인 컴포넌트들을 포함할 수 있다. 예를 들어, 입력 유닛 (400) 은 땀 (예를 들어, 피부 습도에 기초함), 온도 등과 같은 신체의 생체 특성을 모니터링할 수 있는 생체 센서를 포함할 수도 있다. 추가적으로 또는 대안적으로, 생체 센서는 호흡 패턴 (breathing pattern) ("호흡 패턴 (respiratory pattern)" 으로서 또한 지칭됨) 을 모니터링하고, 심장의 전기적 활동을 기록하는 등을 행하도록 설계될 수도 있다. 다른 예로서, 입력 유닛 (400) 은 제스처, 배향, 또는 위치가 도출될 수 있는 데이터를 생성할 수 있는 관성 측정 유닛 (IMU) 을 포함할 수도 있다. IMU 는 오브젝트의 힘, 각속도, 기울기, 및/또는 자기장을 측정하도록 설계된 전자 컴포넌트이다. 일반적으로, IMU들은 가속도계(들), 자이로스코프(들), 자력계(들), 또는 이들의 임의의 조합을 포함한다.
입력 유닛 (400) 은 하나 이상의 프로세서들 (404), 무선 트랜시버 (406), 하나 이상의 마이크로폰들 (408), 하나 이상의 부착 센서들 (410), 메모리 (412), 및/또는 전력 인터페이스 (416) 에 전기적으로 결합되는 전력 컴포넌트 (414) 를 포함할 수 있다. 이들 컴포넌트들은 하우징 (402) ("구조체" 로서 또한 지칭됨) 내에 상주할 수도 있다.
위에서 언급된 바와 같이, 마이크로폰(들) (408) 은 음향 음파들을 전기 신호로 변환할 수 있다. 마이크로폰(들) (408) 은 내부 사운드들을 나타내는 오디오 데이터를 생성하도록 구성된 청진 마이크로폰(들), 주변 사운드들을 나타내는 오디오 데이터를 생성하도록 구성된 주변 마이크로폰(들), 또는 이들의 임의의 조합을 포함할 수도 있다. 전기 신호의 값들을 나타내는 오디오 데이터는 메모리 (412) 에 적어도 일시적으로 저장될 수 있다. 일부 실시형태들에서, 프로세서(들) (404) 는 허브 유닛 (450) 으로의 다운스트림 송신 전에 오디오 데이터를 프로세싱한다. 예를 들어, 프로세서(들) (404) 는 디지털 신호 프로세싱, 노이즈제거, 이득 제어, 노이즈 소거, 아티팩트 제거, 특징 식별 등을 위해 설계된 알고리즘들을 적용할 수도 있다. 다른 실시형태들에서, 허브 유닛 (450) 으로의 다운스트림 송신 전에 프로세서(들) (404) 에 의해 최소 프로세싱이 수행된다. 예를 들어, 프로세서(들) (404) 는 단순히 입력 유닛 (400) 의 아이덴티티를 특정하는 오디오 데이터에 메타데이터를 첨부하거나 또는 마이크로폰(들) (408) 에 의해 오디오 데이터에 이미 추가된 메타데이터를 검사할 수도 있다.
일부 실시형태들에서, 입력 유닛 (400) 및 허브 유닛 (450) 은 대응하는 데이터 인터페이스들 (418, 470) 사이에 연결된 케이블을 통해 서로 간에 데이터를 송신한다. 예를 들어, 마이크로폰(들) (408) 에 의해 생성된 오디오 데이터는 허브 유닛 (450) 의 데이터 인터페이스 (470) 로의 송신을 위해 입력 유닛 (400) 의 데이터 인터페이스 (418) 로 포워딩될 수도 있다. 대안적으로, 데이터 인터페이스 (470) 는 무선 트랜시버 (456) 의 일부일 수도 있다. 무선 트랜시버 (406) 는 허브 유닛 (450) 의 무선 트랜시버 (456) 와 무선 연결을 자동으로 확립하도록 구성될 수 있다. 무선 트랜시버들 (406, 456) 은 NFC (Near Field Communication), 무선 USB, Bluetooth®, Wi-Fi®, 셀룰러 데이터 프로토콜 (예를 들어, LTE, 3G, 4G, 또는 5G), 또는 독점적 포인트-투-포인트 프로토콜과 같은 양방향 통신 프로토콜을 통해 서로 통신할 수도 있다.
입력 유닛 (400) 은 필요에 따라 하우징 (402) 내에 상주하는 다른 컴포넌트들에 전력을 제공할 수 있는 전력 컴포넌트 (414) 를 포함할 수도 있다. 유사하게, 허브 유닛 (450) 은 하우징 (452) 내에 상주하는 다른 컴포넌트들에 전력을 제공할 수 있는 전력 컴포넌트 (466) 를 포함할 수 있다. 전력 컴포넌트들의 예들은 충전식 리튬-이온 (Li-이온) 배터리들, 충전식 니켈-금속 하이브리드 (NiMH) 배터리들, 충전식 니켈-카드뮴 (NiCad) 배터리들 등을 포함한다. 일부 실시형태들에서, 입력 유닛 (400) 은 전용 전력 컴포넌트를 포함하지 않으므로, 허브 유닛 (450) 으로부터 전력을 수신해야 한다. (예를 들어, 전기 콘택들의 물리적 연결을 통해) 전력의 송신을 용이하게 하도록 설계된 케이블은 입력 유닛 (400) 의 전력 인터페이스 (416) 와 허브 유닛 (450) 의 전력 인터페이스 (468) 사이에 연결될 수도 있다.
전력 채널 (즉, 전력 인터페이스 (416) 와 전력 인터페이스 (468) 사이의 채널) 및 데이터 채널 (즉, 데이터 인터페이스 (418) 와 데이터 인터페이스 (470) 사이의 채널) 은 단지 예시의 목적으로 별도의 채널들로 도시되었다. 당업자는 이들 채널들이 동일한 케이블에 포함될 수 있음을 인식할 것이다. 따라서, 입력 유닛 (400) 과 허브 유닛 (450) 사이에 데이터 및 전력을 반송할 수 있는 단일의 케이블이 결합될 수도 있다.
허브 유닛 (450) 은 하나 이상의 프로세서들 (454), 무선 트랜시버 (456), 디스플레이 (458), 코덱 (460), 하나 이상의 발광 다이오드 (LED) 표시기들 (462), 메모리 (464), 및 전력 컴포넌트 (466) 를 포함할 수 있다. 이들 컴포넌트들은 하우징 (452) ("구조체" 로서 또한 지칭됨) 내에 상주할 수도 있다. 위에서 언급된 바와 같이, 허브 유닛 (450) 의 실시형태들은 이들 컴포넌트들의 임의의 서브세트, 뿐만 아니라 여기에 도시되지 않은 추가적인 컴포넌트들을 포함할 수도 있다.
도 4 에 도시된 바와 같이, 허브 유닛 (450) 의 실시형태들은 검사 중인 개인의 호흡 상태 또는 심박수, 네트워크 연결 상태, 전력 연결 상태, 입력 유닛 (400) 에 대한 연결 상태 등과 같은 정보를 제시하기 위한 디스플레이 (458) 를 포함할 수도 있다. 디스플레이 (458) 는 촉각 입력 메커니즘들 (예를 들어, 하우징 (452) 의 표면을 따라 액세스가능한 버튼들), 오디오 입력 메커니즘들 (예를 들어, 마이크로폰들) 등을 통해 제어될 수도 있다. 다른 예로서, 허브 유닛 (450) 의 일부 실시형태들은 디스플레이 (458) 보다는 동작 안내를 위한 LED 표시기(들) (462) 를 포함한다. 그러한 실시형태들에서, LED 표시기(들) (462) 는 디스플레이 (458) 에 의해 제시된 것과 유사한 정보를 전달할 수도 있다. 다른 예로서, 허브 유닛 (450) 의 일부 실시형태들은 디스플레이 (458) 및 LED 표시기(들) (462) 를 포함한다.
입력 유닛 (400) 의 마이크로폰(들) (408) 에 의해 생성된 전기 신호를 나타내는 오디오 데이터를 수신 시, 허브 유닛 (450) 은 인입 데이터를 디코딩하는 것을 담당하는 코덱 (460) 에 오디오 데이터를 제공할 수도 있다. 코덱 (460) 은 예를 들어, 편집, 프로세싱 등의 준비로 오디오 데이터를 (예를 들어, 입력 유닛 (400) 에 의해 적용된 인코딩을 역전시킴으로써) 디코딩할 수도 있다. 코덱 (460) 은 입력 유닛 (400) 내의 청진 마이크로폰(들)에 의해 생성된 오디오 데이터 및 입력 유닛 (400) 내의 주변 마이크로폰(들)에 의해 생성된 오디오 데이터를 순차적으로 또는 동시에 프로세싱하도록 설계될 수도 있다.
그 후, 프로세서(들) (454) 는 오디오 데이터를 프로세싱할 수 있다. 입력 유닛 (400) 의 프로세서(들) (404) 와 매우 유사하게, 허브 유닛 (450) 의 프로세서(들) (454) 는 디지털 신호 프로세싱, 노이즈제거, 이득 제어, 노이즈 소거, 아티팩트 제거, 특징 식별 등을 위해 설계된 알고리즘들을 적용할 수도 있다. 이들 알고리즘들 중 일부는 입력 유닛 (400) 의 프로세서(들) (404) 에 의해 이미 적용된 경우 필요하지 않을 수도 있다. 예를 들어, 일부 실시형태들에서, 허브 유닛 (450) 의 프로세서(들) (454) 는 오디오 데이터에서 진단적으로 관련된 특징들을 발견하기 위해 알고리즘(들)을 적용하는 한편, 다른 실시형태들에서, 그러한 액션은 입력 유닛 (400) 의 프로세서(들) (404) 가 진단적으로 관련된 특징들을 이미 발견한 경우 필요하지 않을 수도 있다. 대안적으로, 허브 유닛 (450) 은 하기에 추가로 논의되는 바와 같이, 분석을 위해 오디오 데이터를 목적지 (예를 들어, 컴퓨팅 디바이스 또는 분산 시스템 상에서 실행되는 진단 플랫폼) 로 포워딩할 수도 있다. 일반적으로, 진단적으로 관련된 특징은 미리결정된 패턴-정의 파라미터와 매칭되는 오디오 데이터의 값들의 패턴에 대응할 것이다. 다른 예로서, 일부 실시형태들에서, 허브 유닛 (450) 의 프로세서(들) (454) 는 신호-대-노이즈 (SNR) 비를 개선하기 위해 오디오 데이터의 노이즈를 감소시키기 위해 알고리즘들을 적용하는 한편, 다른 실시형태들에서, 이들 알고리즘들은 입력 유닛 (400) 의 프로세서(들) (404) 에 의해 적용된다.
전력 인터페이스 (468) 에 더하여, 허브 유닛 (450) 은 전력 포트를 포함할 수도 있다. 전력 포트 ("전력 잭" 으로서 또한 지칭됨) 는 허브 유닛 (450) 이 전력 소스 (예를 들어, 전기 콘센트) 에 물리적으로 연결될 수 있게 한다. 전력 포트는 상이한 커넥터 타입들 (예를 들어, C13, C15, C19) 과 인터페이스 가능할 수도 있다. 추가적으로 또는 대안적으로, 허브 유닛 (450) 은 외부 소스로부터 전력을 무선으로 수신할 수 있는 집적 회로 ("칩" 으로서 또한 지칭됨) 를 갖는 전력 수신기를 포함할 수도 있다. 유사하게, 입력 유닛 (400) 은 예를 들어, 입력 유닛 (400) 및 허브 유닛 (450) 이 케이블을 통해 서로 물리적으로 연결되지 않는 경우 외부 소스로부터 전력을 무선으로 수신할 수 있는 칩을 갖는 전력 수신기를 포함할 수도 있다. 전력 수신기는 무선 전력 위원회 (Wireless Power Consortium) 에 의해 개발된 Qi 표준 또는 일부 다른 무선 전력 표준에 따라 송신된 전력을 수신하도록 구성될 수도 있다.
일부 실시형태들에서, 허브 유닛 (450) 의 하우징 (452) 은 오디오 포트를 포함한다. 오디오 포트 ("오디오 잭" 으로서 또한 지칭됨) 는 오디오와 같은 신호들을 헤드폰과 같은 부착물의 적절한 플러그에 송신하는데 사용될 수 있는 리셉터클 (receptacle) 이다. 오디오 포트는 통상적으로 적절한 플러그가 오디오 포트에 삽입될 때 오디오 신호들이 쉽게 송신될 수 있게 하는 1 개, 2 개, 3 개, 또는 4 개의 콘택들을 포함한다. 예를 들어, 대부분의 헤드폰은 3.5 밀리미터 (mm) 오디오 포트용으로 설계된 플러그를 포함한다. 추가적으로 또는 대안적으로, 허브 유닛 (450) 의 무선 트랜시버 (456) 는 (예를 들어, NFC, 무선 USB, 블루투스 등을 통해) 오디오 신호들을 직접 무선 헤드폰에 송신 가능할 수도 있다.
위에서 언급된 바와 같이, 입력 유닛 (400) 의 프로세서(들) (404) 및/또는 허브 유닛 (450) 의 프로세서(들) (454) 는 상이한 기능들을 지원하기 위해 다양한 알고리즘들을 적용할 수 있다. 그러한 기능들의 예들은 오디오 데이터에서의 손실된 데이터 패킷의 감쇠, 노이즈-의존 볼륨 제어, 동적 범위 압축, 자동 이득 제어, 등화, 노이즈 억제, 및 음향 에코 소거를 포함한다. 각각의 기능은 메모리 (예를 들어, 입력 유닛 (400) 의 메모리 (412) 또는 허브 유닛 (450) 의 메모리 (464)) 에 상주하는 별도의 모듈에 대응할 수도 있다. 따라서, 입력 유닛 (400) 및/또는 허브 유닛 (450) 은 감쇠 모듈, 볼륨 제어 모듈, 압축 모듈, 이득 제어 모듈, 등화 모듈, 노이즈 억제 모듈, 에코 소거 모듈, 또는 이들의 임의의 조합을 포함할 수도 있다.
일부 실시형태들에서, 입력 유닛 (400) 은 마이크로폰(들) (408) 에 의해 생성된 오디오 데이터를 허브 유닛 (450) 이외의 목적지로 직접 송신하도록 구성된다는 것에 유의한다. 예를 들어, 입력 유닛 (400) 은 오디오 데이터를 분석하는 것을 담당하는 진단 플랫폼으로의 송신을 위해 오디오 데이터를 무선 트랜시버 (406) 로 포워딩할 수도 있다. 오디오 데이터는 허브 유닛 (450) 대신 또는 그에 더하여 진단 플랫폼에 송신될 수도 있다. 오디오 데이터가 허브 유닛 (450) 에 더하여 진단 플랫폼으로 포워딩되면, 입력 유닛 (400) 은 오디오 데이터의 복제 사본 (duplicate copy) 을 생성하고, 그 다음 그 별도의 사본들을 앞으로 (예를 들어, 진단 플랫폼으로의 송신을 위해 무선 트랜시버 (406) 로, 허브 유닛 (450) 으로의 송신을 위해 데이터 인터페이스 (418) 로) 포워딩할 수도 있다. 하기에 추가로 논의되는 바와 같이, 진단 플랫폼은 보통 입력 유닛 (400) 에 통신가능하게 연결되는 컴퓨팅 디바이스 상에 상주하지만, 진단 플랫폼의 양태들은 입력 유닛 (400) 또는 허브 유닛 (450) 상에 상주할 수 있다.
전자 청진기 시스템들에 대한 추가 정보는 본 명세서에 전부 참조로 통합되는 미국 특허 제10,555,717호에서 찾아볼 수 있다.
진단 플랫폼의 개요
도 5 는 진단 플랫폼 (502) 을 포함하는 네트워크 환경 (500) 을 예시한다. 개인은 인터페이스들 (504) 을 통해 진단 플랫폼 (502) 과 상호작용할 수 있다. 예를 들어, 환자들은 오디오 데이터, 질병, 치료, 및 피드백에 관한 정보가 제공될 수 있는 인터페이스들에 액세스 가능할 수도 있다. 다른 예로서, 의료 전문가들은 오디오 데이터 및 오디오 데이터의 분석들이 적절한 진단을 결정하고, 건강을 모니터링하는 등의 목적을 위해 검토될 수 있는 인터페이스들에 액세스 가능할 수도 있다. 하이 레벨에서, 인터페이스들 (504) 은 환자들 또는 의료 전문가들을 위한 정보 대시보드들의 역할을 하도록 의도될 수도 있다.
도 5 에 도시된 바와 같이, 진단 플랫폼 (502) 은 네트워크 환경 (500) 에 상주할 수도 있다. 따라서, 진단 플랫폼 (502) 은 하나 이상의 네트워크들 (506a-b) 에 연결될 수도 있다. 네트워크(들) (506a-b) 는 개인 영역 네트워크들 (personal area networks; PAN들), 로컬 영역 네트워크들 (LAN들), 광역 네트워크들 (WAN들), MAN들 (metropolitan area networks), 셀룰러 네트워크들, 인터넷 등을 포함할 수 있다. 추가적으로 또는 대안적으로, 진단 플랫폼 (502) 은 블루투스, NFC, Wi-Fi Direct ("Wi-Fi P2P" 로서 또한 지칭됨) 등과 같은 단거리 무선 연결 기술을 통해 하나 이상의 컴퓨팅 디바이스들에 통신가능하게 결합될 수 있다.
인터페이스들 (504) 은 웹 브라우저, 데스크탑 애플리케이션, 모바일 애플리케이션, 또는 OTT (over-the-top) 애플리케이션을 통해 액세스가능할 수도 있다. 예를 들어, 의료 전문가는 환자에 관한 정보가 입력될 수 있는 인터페이스에 액세스 가능할 수도 있다. 그러한 정보는 이름, 생년월일, 진단, 증상, 또는 약물을 포함할 수 있다. 대안적으로, 정보는 (예를 들어, 네트워크 액세스가능 서버 시스템 (508) 에 저장된 데이터에 기초하여) 진단 플랫폼 (502) 에 의해 인터페이스에 자동으로 채워질 수도 있지만, 의료 전문가는 필요에 따라 정보를 조정하도록 허용될 수도 있다. 하기에 추가로 논의되는 바와 같이, 의료 전문가는 또한, 오디오 데이터 및 오디오 데이터의 분석들이 검토를 위해 제시될 수 있는 인터페이스에 액세스 가능할 수도 있다. 이 정보로, 의료 전문가는 쉽게 환자의 상태 (예를 들어, 호흡 여부) 를 확립하고, 진단을 (예를 들어, 천명, 수포음 등의 존재에 기초하여) 렌더링하는 등을 하는 것이 가능할 수도 있다. 따라서, 인터페이스들 (504) 은 모바일 워크스테이션들 ("의료 카트들" 로서 또한 지칭됨), 개인용 컴퓨터들, 태블릿 컴퓨터들, 모바일 폰들, 웨어러블 전자 디바이스들, 및 가상 또는 증강 현실 시스템들과 같은 컴퓨팅 디바이스들 상에서 보여질 수도 있다.
일부 실시형태들에서, 진단 플랫폼 (502) 의 적어도 일부 컴포넌트들은 로컬로 호스팅된다. 즉, 진단 플랫폼 (502) 의 일부는 인터페이스들 (504) 중 하나에 액세스하는데 사용되는 컴퓨팅 디바이스 상에 상주할 수도 있다. 예를 들어, 진단 플랫폼 (502) 은 의료 전문가와 연관된 모바일 폰 상에서 실행되는 모바일 애플리케이션으로서 구현될 수도 있다. 그러나, 모바일 애플리케이션은 진단 플랫폼 (502) 의 다른 컴포넌트들이 호스팅되는 네트워크 액세스가능 서버 시스템 (508) 에 통신가능하게 연결될 수도 있다는 것에 유의한다.
다른 실시형태들에서, 진단 플랫폼 (502) 은 예를 들어, Amazon Web Services®, Google Cloud PlatformTM, 또는 Microsoft Azure® 에 의해 운영되는 클라우드 컴퓨팅 서비스에 의해 전적으로 실행된다. 그러한 실시형태들에서, 진단 플랫폼 (502) 은 하나 이상의 컴퓨터 서버들을 포함하는 네트워크 액세스가능 서버 시스템 (508) 상에 상주할 수도 있다. 이들 컴퓨터 서버들은 모델들, 알고리즘들 (예를 들어, 오디오 데이터를 프로세싱하고, 호흡률을 계산하는 등을 위함), 환자 정보 (예를 들어, 프로파일들, 크리덴셜들, 및 건강-관련 정보, 이를 테면 나이, 생년월일, 지리적 위치, 질병 분류, 질병 상태, 의료 제공자 등), 및 다른 자산들을 포함할 수 있다. 당업자는 이 정보가 또한 네트워크 액세스가능 서버 시스템 (508) 및 하나 이상의 컴퓨팅 디바이스들 간에 분산되거나 또는 블록체인과 같은 분산 네트워크 인프라스트럭처에 걸쳐 분산될 수 있음을 인식할 것이다.
도 6 은 환자의 건강의 변화들을 검출, 진단, 및 모니터링하는데 도움이 되는 출력들을 생성하도록 설계된 진단 플랫폼 (610) 을 구현할 수 있는 컴퓨팅 디바이스 (600) 의 예를 예시한다. 하기에 추가로 논의되는 바와 같이, 진단 플랫폼 (610) 은 호흡 이벤트들 (respiratory events) ("호흡 이벤트들 (breathing events)" 또는 "호흡들 (breaths)" 로서 또한 지칭됨) 의 발생들을 식별하기 위해 환자와 연관된 오디오 데이터에 모델을 적용하고, 그 다음 환자의 건강에 대한 통찰을 얻기 위해 그 호흡 이벤트들에 알고리즘을 적용할 수 있다. 용어들 "호흡 이벤트 (respiratory event)" 및 "호흡 이벤트 (breathing event)" 는 흡기 또는 호기를 지칭하는데 사용될 수도 있다. 예를 들어, 알고리즘은 하기에 추가로 논의되는 바와 같이 호흡률을 나타내는 메트릭을 출력할 수도 있다. 따라서, 진단 플랫폼 (610) 은 진단적으로 관련된 오디오 데이터의 값들의 패턴들을 발견할 수도 있을 뿐만 아니라, 환자의 현재 건강을 이해하는데 도움이 되는 방식으로 그 패턴들의 시각화들을 생성할 수도 있다. 예시의 목적을 위해, 실시형태들은 전자 청진기 시스템에 의해 생성되는 오디오 데이터의 맥락에서 설명될 수도 있다. 그러나, 당업자는 오디오 데이터가 다른 소스로부터 획득될 수 있음을 인식할 것이다.
보통, 컴퓨팅 디바이스 (600) 는 의료 전문가 또는 의료 시설과 연관된다. 예를 들어, 컴퓨팅 디바이스 (600) 는 병원의 수술실에 위치한 모바일 워크스테이션일 수도 있거나, 또는 컴퓨팅 디바이스 (600) 는 환자에게 서비스들을 제공하는 동안 의료 전문가에 액세스가능한 모바일 폰 또는 태블릿 컴퓨터일 수도 있다. 대안적으로, 컴퓨팅 디바이스 (600) 는 전자 청진기 시스템의 허브 유닛일 수도 있다.
컴퓨팅 디바이스 (600) 는 프로세서 (602), 메모리 (604), 디스플레이 메커니즘 (606), 및 통신 모듈 (608) 을 포함할 수 있다. 이들 컴포넌트들의 각각은 하기에 더 상세히 논의된다. 당업자는 컴퓨팅 디바이스 (600) 의 특성에 의존하여 이들 컴포넌트들의 상이한 조합들이 존재할 수도 있음을 인식할 것이다.
프로세서 (602) 는 범용 프로세서들과 유사한 일반적인 특성들을 가질 수 있거나, 또는 프로세서 (602) 는 컴퓨팅 디바이스 (600) 에 제어 기능들을 제공하는 주문형 집적 회로 (application-specific integrated circuit; ASIC) 일 수도 있다. 도 6 에 도시된 바와 같이, 프로세서 (602) 는 통신 목적들을 위해, 직접 또는 간접적으로, 컴퓨팅 디바이스 (600) 의 모든 컴포넌트들에 연결될 수 있다.
메모리 (604) 는 정적 랜덤 액세스 메모리 (SRAM), 동적 랜덤 액세스 메모리 (DRAM), 전기적으로 소거가능한 프로그래밍가능 판독 전용 메모리 (EEPROM), 플래시 메모리, 또는 레지스터들과 같은 임의의 적합한 타입의 저장 매체로 구성될 수도 있다. 프로세서 (602) 에 의해 실행될 수 있는 명령들을 저장하는 것에 더하여, 메모리 (604) 는 또한 (예를 들어, 진단 플랫폼 (610) 의 모듈들을 실행할 때) 프로세서 (602) 에 의해 생성된 데이터를 저장할 수 있다. 메모리 (604) 는 단지 저장 환경의 추상적 표현이라는 것에 유의한다. 메모리 (604) 는 실제 메모리 칩들 또는 모듈들로 구성될 수 있다.
디스플레이 메커니즘 (606) 은 정보를 시각적으로 전달하도록 동작가능한 임의의 컴포넌트일 수 있다. 예를 들어, 디스플레이 메커니즘 (606) 은 LED들, 유기 LED들, 액정 엘리먼트들, 또는 전기영동 엘리먼트들을 포함하는 패널일 수도 있다. 컴퓨팅 디바이스 (600) 가 전자 청진기 시스템의 허브 유닛을 나타내는 실시형태들에서, 디스플레이 메커니즘 (606) 은 디스플레이 패널 (예를 들어, 도 4 의 디스플레이 (458)) 또는 LED 표시기들 (예를 들어, 도 4 의 LED 표시기들 (462)) 일 수도 있다. 일부 실시형태들에서, 디스플레이 메커니즘 (606) 은 터치 감응형이다. 따라서, 개인은 디스플레이 메커니즘 (606) 과 상호작용함으로써 진단 플랫폼 (610) 에 입력을 제공 가능할 수도 있다. 디스플레이 메커니즘 (606) 이 터치 감응형이 아닌 실시형태들에서, 개인은 제어 디바이스 (도시되지 않음), 이를 테면 키보드, 물리적 엘리먼트 (예를 들어, 기계적 버튼 또는 노브 (knob)), 또는 포인팅 디바이스 (예를 들어, 컴퓨터 마우스) 를 사용하여 진단 플랫폼 (610) 과 상호작용 가능할 수도 있다.
통신 모듈 (608) 은 컴퓨팅 디바이스 (600) 의 컴포넌트들 사이의 통신들을 관리하는 것을 담당할 수도 있거나, 또는 통신 모듈 (608) 은 다른 컴퓨팅 디바이스들 (예를 들어, 도 5 의 네트워크 액세스가능 서버 시스템 (508)) 과의 통신들을 관리하는 것을 담당할 수도 있다. 통신 모듈 (608) 은 다른 컴퓨팅 디바이스들과의 통신 채널들을 확립하도록 설계되는 무선 통신 회로부일 수도 있다. 무선 통신 회로부의 예들은 셀룰러 네트워크들 ("모바일 네트워크들" 로서 또한 지칭됨) 을 위해 구성된 안테나 모듈들 및 NFC, 무선 USB, 블루투스 등을 위해 구성된 칩들을 포함한다.
편의상, 진단 플랫폼 (610) 은 메모리 (604) 에 상주하고 프로세서 (602) 에 의해 실행되는 컴퓨터 프로그램으로 지칭될 수도 있다. 그러나, 진단 플랫폼 (610) 은 컴퓨팅 디바이스 (600) 에서 구현되거나 또는 컴퓨팅 디바이스 (600) 에 액세스가능한 소프트웨어, 펌웨어, 또는 하드웨어로 구성될 수 있다. 본 명세서에서 설명된 실시형태들에 따르면, 진단 플랫폼 (610) 은 훈련 모듈 (612), 프로세싱 모듈 (614), 진단 모듈 (616), 분석 모듈 (618), 및 그래픽 사용자 인터페이스 (GUI) 모듈 (620) 을 포함할 수도 있다.
훈련 모듈 (612) 은 진단 플랫폼 (610) 에 의해 사용될 모델들을 훈련하는 것을 담당할 수도 있다. 훈련은 감독, 반-감독, 또는 비감독 방식으로 행해질 수도 있다. 예를 들어, 훈련 모듈 (612) 이 오디오 데이터에서 호흡 이벤트들을 식별하기 위해 모델을 훈련하라는 요청을 나타내는 입력을 수신한다고 가정한다. 그러한 시나리오에서, 훈련 모듈 (612) 은 훈련되지 않은 모델을 획득하고, 그 다음, 예를 들어 "호흡 이벤트" 또는 "호흡 이벤트 없음" 으로 라벨링된 오디오 데이터를 사용하여 모델을 훈련할 수도 있다. 따라서, 라벨링된 오디오 데이터는 모델이 호흡 이벤트들을 식별하는 방법을 학습하도록 훈련 데이터로서 모델에 제공될 수도 있다. 보통, 모델은 호흡 이벤트들을 나타내는 오디오 데이터의 값들의 패턴들을 식별하는 법을 학습할 것이다.
프로세싱 모듈 (614) 은 진단 플랫폼 (610) 에 의해 획득된 오디오 데이터를 다른 모듈들에 적합한 포맷으로 프로세싱할 수 있다. 예를 들어, 프로세싱 모듈 (614) 은 진단 모듈 (616) 에 의한 분석의 준비로 오디오 데이터에 규칙들, 휴리스틱스, 또는 알고리즘들을 적용할 수도 있다. 다른 예로서, 프로세싱 모듈 (614) 은 분석 모듈 (618) 에 의한 분석의 준비로 진단 모듈 (616) 에 의해 생성된 출력들에 규칙들, 휴리스틱스, 또는 알고리즘들을 적용할 수도 있다. 따라서, 프로세싱 모듈 (614) 은 적절한 데이터가 진단 플랫폼 (610) 의 다른 모듈들에 액세스가능하도록 보장하는 것을 담당할 수도 있다. 더욱이, 프로세싱 모듈 (614) 은 진단 플랫폼 (610) 의 다른 모듈들에 의해 생성된 출력들이 (예를 들어, 메모리 (604) 에의) 저장 또는 (예를 들어, 통신 모듈 (608) 을 통한) 송신에 적합하다는 것을 보장하는 것을 담당할 수도 있다.
진단 모듈 (616) 은 진단 플랫폼 (610) 에 의해 획득된 오디오 데이터에 적용할 적절한 모델을 식별하는 것을 담당할 수도 있다. 예를 들어, 진단 모듈 (616) 은 오디오 데이터, 환자, 또는 전자 청진기 시스템의 속성에 기초하여 적절한 모델을 식별할 수도 있다. 이들 속성들은 오디오 데이터를 수반하는 메타데이터에 특정될 수도 있다. 예로서, 내부 사운드들이 기록된 해부학적 영역에 기초하여 적절한 모델이 식별될 수도 있다. 대안적으로, 진단 모듈 (616) 은 분석 모듈 (618) 에 의해 생성될 메트릭들에 기초하여 적절한 모델을 식별할 수도 있다. 예로서, 분석 모듈 (618) 이 호흡률을 계산하는 임무를 맡은 경우, 진단 모듈 (616) 은 호흡 이벤트들을 발견할 수 있는 모듈을 식별할 수도 있다. 원하는 메트릭(들)은 의료 전문가에 의해 특정될 수도 있거나, 또는 원하는 메트릭(들)은 진단 플랫폼 (610) 에 의해 결정될 수도 있다.
일반적으로, 진단 모듈 (616) 에 의해 오디오 데이터에 적용되는 모델은 메모리 (604) 에 유지되는 다중의 모델들 중 하나이다. 이들 모델들은 상이한 호흡 이벤트들, 병들 등과 연관될 수도 있다. 예를 들어, 제 1 모델은 흡기 및 호기를 식별하도록 설계되고, 그 다음 훈련될 수도 있고, 제 2 모델은 천명 또는 수포음의 인스턴스들을 식별하도록 설계되고, 그 다음 훈련될 수도 있다.
하이 레벨에서, 각각의 모델은, 오디오 데이터에 적용될 경우, 환자의 건강에 대한 통찰을 제공할 수도 있는 정보를 전달하는 출력을 생성하는 알고리즘들의 집합을 나타낼 수도 있다. 예를 들어, 진단 모듈 (616) 에 의해 적용된 모델이 흡기 및 호기를 식별하는 경우, 출력들은 환자가 정상적으로 호흡하는지 또는 비정상적으로 호흡하는지를 확립하는데 유용할 수도 있다. 다른 예로서, 진단 모듈 (616) 에 의해 적용된 모델이 천명 또는 수포음의 인스턴스들을 식별하는 경우, 출력들은 환자가 주어진 질병을 앓고 있는지 여부를 확립하는데 유용할 수도 있다.
일부 시나리오들에서, 진단 모듈 (616) 에 의해 적용된 모델들에 의해 생성된 출력들은 그 자체로는 특별히 유용하지 않다. 분석 모듈 (618) 은 보다 전체론적인 의미에서 이들 출력들의 맥락을 고려하는 것을 담당할 수도 있다. 예를 들어, 분석 모듈 (618) 은 진단 모듈 (616) 에 의해 적용된 모델들에 의해 생성된 출력들에 기초하여 환자의 건강을 나타내는 하나 이상의 메트릭들을 생성할 수도 있다. 이들 메트릭들은 모델들에 의해 생성된 출력들의 완전한 분석 또는 인식을 요구하지 않고 환자의 건강에 대한 통찰을 제공할 수도 있다. 예를 들어, 진단 모듈 (616) 에 의해 적용된 모델이 오디오 데이터의 분석에 기초하여 호흡 이벤트들을 식별한다고 가정한다. 호흡 이벤트들에 대한 지식이 유용할 수도 있지만, 의료 전문가는 호흡률과 같은 메트릭에 더 관심이 있을 수도 있다. 분석 모듈 (618) 은 진단 모듈 (616) 에 의해 식별된 호흡 이벤트들에 기초하여 호흡률을 계산할 수도 있다.
GUI 모듈 (620) 은 디스플레이 메커니즘 (606) 상에 검토를 위한 정보를 제시하는 방법을 확립하는 것을 담당할 수도 있다. 디스플레이 메커니즘 (606) 의 특성에 의존하여 다양한 타입들의 정보가 제시될 수 있다. 예를 들어, 진단 모듈 (616) 및 분석 모듈 (618) 에 의해 도출, 추론, 또는 그렇지 않으면 획득되는 정보는 의료 전문가에게 디스플레이하기 위해 인터페이스 상에 제시될 수도 있다. 다른 예로서, 시각적 피드백은 환자가 건강의 변화를 경험한 때를 표시하기 위해 인터페이스 상에 제시될 수도 있다.
도 7 은 오디오 데이터의 분석들이 검토를 위해 인터페이스 상에 제시되기 전에 진단 플랫폼에 의해 획득된 오디오 데이터가 백그라운드 서비스에 의해 프로세싱될 수 있는 방법을 예시하는 워크플로우 다이어그램의 예를 포함한다. 도 7 에 도시된 바와 같이, 데이터는 진단 플랫폼의 "백 엔드" 에 의해 획득 및 프로세싱될 수도 있는 한편, 그 데이터의 분석들은 진단 플랫폼의 "프론트 엔드" 에 의해 제시될 수도 있다. 개인, 이를 테면 의료 전문가들 및 환자들은 또한, 그 프론트 엔드를 통해 진단 플랫폼과 상호작용 가능할 수도 있다. 예를 들어, 디스플레이 상에 도시된 인터페이스들을 통해 커맨드들이 이슈될 수도 있다. 더욱이, 진단 플랫폼은 하기에 추가로 논의되는 바와 같이, 통지들을 생성 가능할 수도 있다. 예를 들어, 진단 플랫폼이 환자의 호흡률이 결정된 임계치 아래로 떨어진다고 결정하면, 진단 플랫폼은 경보 (alarm) 의 역할을 하는 통지를 생성할 수도 있다. 통지는 디스플레이를 통해 시각적으로 제시되고 및/또는 스피커를 통해 청각적으로 제시될 수도 있다.
호흡률을 확립하기 위한 접근법들
호흡률을 계산하기 위한 종래의 접근법들은 여러 결점들을 겪는다.
일부 접근법들은 상대적으로 긴 시간 간격에 걸쳐 흡기 및 호기를 관찰하는 것에 의존한다. 이 "관찰 간격" 이 60 초 이상 지속되는 것은 드문 일이 아니다. 관찰 간격이 너무 길기 때문에, 이들 접근법들은 무호흡과 같은 단명 이벤트들을 설명할 수 없다. 그 결과, 전체 관찰 간격에 걸쳐 호흡률에 거의 영향을 주지 않을 것이기 때문에, 의료 전문가들은 호흡의 일시 중단을 전부는 아니더라도 거의 알지 못할 수도 있다. 호흡률을 잘못 이해하면, 호흡의 중단이 즉시 해결되어야 할 수도 있기 때문에 심각한 피해를 초래할 수 있다.
다른 접근법들은 내쉬는 공기 중의 호기말 (end-tidal) 이산화탄소 (CO2) 또는 흉부의 움직임을 모니터링하는 것에 의존한다. 그러나, 이들 접근법들은 많은 상황들에서 실용적이지 않거나 또는 적합하지 않다. 예를 들어, 흉부 움직임은 호흡 이벤트들의 정확한 지표가 아닐 수도 있으며 - 특히 환자가 전신 마취 하에 있거나 또는 의료 이벤트 (예를 들어, 발작) 를 경험하고 있는 경우, 내쉬는 공기의 조성은 환자가 마스크를 착용하고 있지 않은 경우 알 수 없을 수도 있다.
여기에는, 오디오 데이터의 분석을 통해 호흡률을 계산함으로써 이들 결점들을 해결하는 접근법이 소개된다. 위에서 논의된 바와 같이, 이 접근법은 일관되고 정확한 방식으로 검출되는 흡기 및 호기에 의존한다. 청진에서, 이들 호흡 이벤트들은 의료 전문가들에 의한 진단 결정에 중요하다.
하이 레벨에서, 접근법은 2 개의 페이즈들, 흡기 및 호기가 검출되는 제 1 페이즈 및 그 다음, 이들 흡기 및 호기가 호흡률을 계산하는데 사용되는 제 2 페이즈를 수반한다. 제 1 페이즈는 "검출 페이즈" 로서 지칭될 수도 있고, 제 2 페이즈는 "계산 페이즈" 로서 지칭될 수도 있다.
A. 호흡 이벤트 검출
도 8 은 검출 페이즈 동안 진단 플랫폼에 의해 채용될 수도 있는 계산 파이프라인의 하이-레벨 예시를 포함한다. 이 계산 파이프라인 ("계산 프레임워크" 로서 또한 지칭됨) 의 하나의 이점은 그의 모듈러 설계이다. 각각의 "유닛" 은 최상의 전체 성능을 달성하기 위해 개별적으로 테스팅되고, 그 다음 조정될 수 있다. 더욱이, 일부 유닛들의 출력들은 다중의 목적들을 위해 사용될 수도 있다. 예를 들어, 프리프로세싱 동안 생성된 스펙트로그램은 입력으로서 모델에 제공되고 및/또는 실시간 검토를 위해 인터페이스에 포스팅될 수 있다.
단순화를 위해, 이 프레임워크는 3 개의 부분들, 즉 프리프로세싱, 분석, 및 포스트프로세싱으로 분할된다. 프리프로세싱은 오디오 데이터를 프로세싱하는 것 뿐만 아니라 특징 엔지니어링 기법들을 채용하는 것을 포함할 수도 있다. 분석은 호흡 이벤트들을 식별하도록 훈련되는 모델을 채용하는 것을 포함할 수도 있다. 위에서 언급된 바와 같이, 모델은 단일의 검출 (예를 들어, 분류 또는 진단) 보다는 검출들의 (예를 들어, 호흡 이벤트들의) 시퀀스를 출력으로서 생성하도록 설계되는 뉴럴 네트워크를 포함할 수도 있다. 각각의 검출은 모델에 의해 독립적으로 이루어지는 별도의 예측을 나타낼 수도 있다 마지막으로, 포스트프로세싱은 모델에 의해 생성된 검출들을 검사 및/또는 분할하는 것을 포함할 수도 있다. 보통, 프리프로세싱은 프로세싱 모듈 (예를 들어, 도 6 의 프로세싱 모듈 (614)) 에 의해 수행되고, 분석은 진단 모듈 (예를 들어, 도 6 의 진단 모듈 (616)) 에 의해 수행되고, 포스트프로세싱은 분석 모듈 (예를 들어, 도 6 의 분석 모듈 (618)) 에 의해 수행된다.
각각의 부분에 관한 추가 상세들은 예의 맥락에서 하기에 제공된다. 당업자는 하기에 제공된 숫자들이 단지 예시적인 것으로 의도됨을 인식할 것이다. 프레임워크의 하나의 중요한 양태는 그의 유연성이며, 따라서 다른 숫자들이 다른 시나리오들에서 적용가능하거나 또는 적절할 수도 있다.
I. 프리프로세싱
이 예에서, 폐에 의해 만들어진 내부 사운드들의 기록을 나타내는 오디오 데이터는 4 킬로헤르츠 (kHz) 와 같은 샘플링 주파수로 프로세싱되었다. 그 다음, 오디오 데이터에 고역통과 필터를 10 의 차수 및 80 Hz 의 컷-오프 주파수로 적용하여, 심장 (~1-2 Hz) 또는 다른 내부 기관에 의해 만들어진 내부 사운드들 및 전기 간섭 (~60 Hz) 을 제거하였다. 따라서, 진단 플랫폼은 관심이 없는 다른 내부 기관에 의해 만들어진 사운드들을 필터링하기에 충분한 컷-오프 주파수를 갖는 고역통과 필터를 적용할 수도 있다. 그 다음, 필터링된 오디오 데이터는 STFT (Short-Time Fourier Transform) 를 사용하여 프로세싱되었다. 이 예에서, SFTF 는 256 의 윈도우 사이즈 및 0.25 의 오버랩 비율을 갖는 해밍 윈도우를 가졌다. 따라서, 대략 15 초의 신호는 938 x 129 의 사이즈를 갖는 대응하는 스펙트로그램으로 변환될 수 있다. 관심 있는 내부 사운드들의 스펙트럼 정보를 활용하기 위해, 진단 플랫폼은 (i) 스펙트로그램, (ii) MFCC들 (Mel frequency cepstral coefficients), 및 (iii) 에너지 합산들을 추출하였다. 이 예에서, 스펙트로그램은 129-빈 로그 크기 스펙트로그램이었다. MFCC들의 경우, 진단 플랫폼은 20 개의 정적 계수들, 20 개의 델타 계수들, 및 20 개의 가속 계수들을 추출하였다. 이를 위해, 진단 플랫폼은 0-4,000 Hz 의 주파수 범위 내의 40 개의 멜 (Mel) 대역들을 사용하였다. 델타 및 가속 계수들을 계산하는데 사용된 폭은 9 프레임들이었다. 이는 프레임 당 60-빈 벡터를 초래한다. 한편, 진단 플랫폼은 3 개의 상이한 주파수 대역들, 0-250 Hz, 251-500 Hz, 및 501-1,000 Hz 의 에너지 합산을 계산하였으며, 이는 각각의 프레임에 대해 3 개의 값들을 초래한다.
이들 특징들을 추출한 후, 진단 플랫폼은 938 x 193 특징 행렬을 형성하기 위해 이들 특징들을 함께 연접시켰다. 그 다음, 진단 플랫폼은 각각의 특징에 최소-최대 정규화 (min-max normalization) 를 적용하여 정규화된 특징들이 0 내지 1 의 값의 범위가 되도록 하였다.
II. 분석
위에서 언급된 바와 같이, 프리프로세싱 동안 추출된 특징들은 입력으로서, 호흡 이벤트들을 식별하도록 훈련된 여러 모델들에 제공되었다. 최적의 모델을 확립하기 위해, 6 개의 모델들이 동일한 추출된 특징들을 사용하여 테스팅되었다. 이들 모델들은 단방향 순환 뉴럴 네트워크 (Uni-RNN), 단방향 장단기 메모리 뉴럴 네트워크 (uni-LSTM), 단방향 게이티드 순환 유닛 뉴럴 네트워크 (Uni-GRU), 양방향 순환 뉴럴 네트워크 (Bi-RNN), 양방향 장단기 메모리 뉴럴 네트워크 (Bi-LSTM), 및 양방향 게이티드 순환 유닛 뉴럴 네트워크 (Bi-GRU) 를 포함하였다. 집합적으로, 이들 모델들은 "베이스라인 모델들" 로서 지칭된다.
이들 베이스라인 모델들의 아키텍처는 도 9 에 도시된다. 베이스라인 모델들은 오디오 데이터의 분석에 기초하여 호흡 이벤트들을 검출할 수 있도록 설계되었다. 제 1 및 제 2 레이어들은 RNN, LSTM, 또는 GRU 일 수 있는 순환 레이어들이다. 이들 순환 레이어들은 특징들의 시간 정보를 처리한다. 호흡은 보통 주기적이기 때문에, 이들 순환 레이어들은 라벨링된 예들 ("훈련 데이터" 로서 또한 지칭됨) 로부터 호흡 사이클들의 특성을 학습할 수 있다. 오디오 데이터에서 호흡 이벤트들의 시작 및 종료 시간들을 검출하기 위해, 진단 플랫폼은 출력 레이어로서 시간-분포 완전 연결 레이어 (time-distributed fully connected layer) 를 사용하였다. 이 접근법은 단일의 검출보다는 검출들의 시퀀스 (예를 들어, 흡기 (inhale) 또는 액션 없음) 를 출력할 수 있는 모델들을 초래하였다. 시그모이드 함수는 시간-분포 완전 연결 레이어에서 활성화 함수로서 사용되었다.
각각의 베이스라인 모델에 의해 생성된 각각의 출력은 938 x 1 의 사이즈를 갖는 검출 벡터였다. 이 벡터의 각각의 엘리먼트는 값이 임계치를 초과하면 흡기 또는 호기가 대응하는 시간 세그먼트에 존재한다는 것을 표시하기 위해 1 로 설정되었고; 그렇지 않으면, 그 값은 0 으로 설정되었다. 이 예에서, 단일-태스크 학습 접근법이 베이스라인 모델들에 대해 사용되었지만, 멀티-태스크 학습 접근법들이 또한 사용될 수 있다.
벤치마크 모델의 경우, ADAM (Adaptive Moment Estimation) 이 옵티마이저 (optimizer) 로서 사용되었다. ADAM 은 딥 러닝 및 머신 러닝에서 중요한 프로세스인 확률적 최적화를 사용하여 파라미터들에 대한 적응 학습률들을 계산하는 방법이다. 시작 학습률은 검증 손실이 10 개의 에포크들 동안 감소하지 않았을 때 단계 감쇠 (0.2x) 로 0.0001 로 설정되었다. 이 학습 프로세스는 50 개의 연속 에포크들 동안 개선이 없을 때 중단되었다.
III. 포스트프로세싱
그 다음, 베이스라인 모델들에 의해 생성된 검출 벡터들은 상이한 목적을 위해 추가로 프로세싱될 수 있다. 예를 들어, 진단 플랫폼은 의료 전문가에 의한 실시간 모니터링에 사용하기 위해 각각의 예측 벡터를 프레임들로부터 시간으로 변환할 수도 있다. 더욱이, 도메인 지식은 도 9 에 도시된 바와 같이 적용될 수도 있다. 호흡은 생체에 의해 수행되는 것으로 알려져 있기 때문에, 호흡 이벤트의 지속기간은 보통 소정의 범위 내에 있다. 검출 벡터가 사이에 작은 간격을 갖는 연속 호흡 이벤트들 (예를 들어, 흡기) 이 있음을 표시할 때, 진단 플랫폼은 이들 호흡 이벤트들의 연속성을 검사하고, 그 다음 그 호흡 이벤트들을 병합할지 여부를 결정할 수 있다. 보다 구체적으로, 진단 플랫폼은 호흡 이벤트들 사이의 간격이 T 초보다 작은 경우 j 번째 및 i 번째 호흡 이벤트들 사이의 에너지 피크의 주파수 차이
Figure pct00001
를 계산할 수 있다. 차이가 주어진 임계치 P 보다 작으면, 이들 호흡 이벤트들은 단일의 호흡 이벤트로 병합된다. 이 예에서, T 는 0.5 초로 설정되었고, P 는 25 Hz 로 설정되었다. 호흡 이벤트가 0.05 초보다 짧으면, 진단 플랫폼은 단순히 호흡 이벤트를 완전히 삭제할 수 있다. 예를 들어, 진단 플랫폼은 호흡 이벤트가 발생하지 않았음을 표시하기 위해 대응하는 세그먼트(들)에 적용된 라벨(들)을 조정할 수도 있다.
IV. 태스크 정의 및 평가
이 예에서, 진단 플랫폼에 의해 2 개의 별개의 태스크들이 수행되었다.
제 1 태스크는 오디오 데이터의 세그먼트들의 분류였다. 이를 위해, 각각의 호흡 이벤트의 기록은 초기에 스펙트로그램으로 변환되었다. 스펙트로그램의 시간 분해능은 위에서 논의된 바와 같이 STFT 의 오버랩 비율 및 윈도우 사이즈에 의존하였다. 편의상, 이들 파라미터들은 각각의 스펙트로그램이 938 x 128 의 사이즈를 갖는 행렬이 되도록 고정되었다. 따라서, 각각의 기록은 938 개의 세그먼트들로 분할되었고, 각각의 세그먼트는 도 10 에 도시된 바와 같이 실측 자료 라벨들 (ground truth labels) 에 기초하여 자동으로 라벨링되었다.
기록이 프리프로세싱 및 분석을 거친 후, 진단 플랫폼은 938 x 1 의 사이즈를 갖는 순차적 검출들로 대응하는 출력에 액세스할 것이다. 이 출력은 "추론 결과들" 로서 지칭될 수도 있다. 순차적 검출들을 실측 자료 세그먼트들과 비교함으로써, 진단 플랫폼은 참 양성 (TP), 참 음성 (TN), 거짓 양성 (FP), 및 거짓 음성 (FN) 을 정의할 수 있다. 그 다음, 세그먼트들을 분류하는데 사용되는 모델의 민감도 및 특이도가 계산될 수 있다.
제 2 태스크는 오디오 데이터에서 호흡 이벤트들의 검출이었다. 모델에 의해 이루어진 순차적 검출들을 획득한 후, 진단 플랫폼은 동일한 라벨을 갖는 연결된 세그먼트들을 대응하는 호흡 이벤트로 어셈블링할 수 있다. 예를 들어, 진단 플랫폼은 연결된 세그먼트들이 흡기, 호기, 또는 액션 없음에 대응하는 것을 특정할 수도 있다. 더욱이, 진단 플랫폼은 각각의 어셈블링된 호흡 이벤트의 시작 및 종료 시간들을 도출할 수 있다. 이 예에서, JI (Jaccard Index) 는 모델에 의해 예측된 하나의 호흡 이벤트가 실측 자료 이벤트와 정확하게 매칭되었는지 여부를 결정하는데 사용되었다. JI 의 값이 0.5 를 초과하면, 진단 플랫폼은 어셈블링된 호흡 이벤트를 TP 이벤트로 지정하였다. JI 의 값이 0 을 초과하지만 0.5 아래로 떨어지면, 진단 플랫폼은 어셈블링된 호흡 이벤트를 FN 이벤트로 지정하였다. JI 의 값이 0 이면, 진단 플랫폼은 어셈블링된 호흡 이벤트를 FP 이벤트로 지정하였다.
성능을 평가하기 위해, 진단 플랫폼은 각각의 베이스라인 모델의 정확도, 민감도, 양성 예측값, 및 F1-스코어를 검사하였다. 모든 양방향 모델들은 단방향 모델들보다 우수하였다. 이 결과는 주로 양방향 모델들의 복잡성 (및 훈련가능한 파라미터들의 수) 의 증가에 기인한다. 전반적으로, Bi-GRU 는 베이스라인 모델들 중 가장 유망한 것으로 보였지만, 다른 베이스라인 모델들이 Bi-GRU 보다 더 적합한 상황들이 있을 수도 있다.
B. 호흡률 계산
호흡률의 신뢰가능한 추정은 다양한 질환의 조기 검출에 중요한 역할을 한다. 비정상적인 호흡률은 상이한 질병 뿐만 아니라 다른 병리학적 또는 정신병적 원인들을 암시할 수 있다. 호흡률을 계속해서 확립하기 위한 임상적으로 허용가능하고 정확한 기법에 대한 탐색은 쉽지 않은 것으로 입증되었다. 위에서 논의된 바와 같이 이 임상적 갭을 채우기 위한 시도로 여러 접근법들이 개발되었지만, 어느 것도 의료 전문가들로부터 의료 표준이 되기에 충분한 신뢰를 얻지 못했다.
도 11a 는 호흡률을 추정하기 위한 알고리즘 접근법의 하이-레벨 예시를 포함한다. 도 11a 에 도시된 바와 같이, 이 알고리즘 접근법은 진단 플랫폼에 의해 채용된 모델에 의해 예측되는 호흡 이벤트들에 의존한다. 호흡 이벤트들을 적절히 식별하는 것은 호흡률을 추정하는데 중요하므로, 검출 및 계산 페이즈들은 일관되게 높은 정확도로 완료되어야 한다. 더욱이, 검출 및 계산 페이즈들은 호흡률이 거의 실시간으로 (예를 들어, 매 30-60 초보다는 매 수초마다) 추정되도록 계속해서 수행될 수도 있다.
하이 레벨에서, 이 알고리즘 접근법은 호흡 이벤트들의 발생들을 추적하고 그 다음 슬라이싱 윈도우를 사용하여 지속적으로 호흡률을 계산하는 것에 의존한다. 초기에, 진단 플랫폼에 의해 실행되는 알고리즘은 분석을 위해 획득된 오디오 데이터의 일 부분을 포함하는 윈도우에 대한 시작 포인트를 정의한다. 그 다음, 진단 플랫폼은 윈도우에 대한 종료 포인트를 정의하기 위해 위에서 논의된 바와 같이 모델에 의해 추론된 호흡 이벤트들을 모니터링할 수 있다. 윈도우에 대한 시작 및 종료 포인트들은 미리결정된 수의 호흡 이벤트들이 그의 경계 내에 포함되도록 정의될 수도 있다. 여기서, 예를 들어, 윈도우는 3 회의 호흡 이벤트들을 포함하지만, 다른 실시형태들에서 3 회보다 더 많거나 또는 더 적은 호흡 이벤트들이 윈도우에 포함될 수 있다. 윈도우가 3 회의 호흡 이벤트들을 포함하도록 프로그래밍되는 실시형태들에서, 윈도우에 대한 시작 포인트는 윈도우에 포함된 제 1 호흡 이벤트 (1102) 의 시작에 대응하고, 윈도우에 대한 종료 포인트는 제 4 호흡 이벤트 (1108) 의 시작에 대응한다. 제 4 호흡 이벤트 (1108) 가 윈도우에 대한 종료 포인트를 정의하지만, 제 4 호흡 이벤트 (1108) 는 초기에 윈도우에 포함되지 않는다.
도 11a 에 도시된 바와 같이, 진단 플랫폼은 윈도우에 포함된 흡기 사이의 간격에 기초하여 호흡률을 계산할 수 있다. 여기서, 윈도우는 제 1 호흡 이벤트 (1102), 제 2 호흡 이벤트 (1104), 및 제 3 호흡 이벤트 (1106) 를 포함한다. 위에서 언급된 바와 같이, 제 4 호흡 이벤트 (1108) 는 윈도우에 대한 종료 포인트를 정의하는데 사용될 수도 있다. "I" 로 표현된 제 1 주기는 제 1 호흡 이벤트 (1102) 의 시작과 제 2 호흡 이벤트 (1104) 의 시작 사이의 시간 간격에 의해 정의된다. "II" 로 표현된 제 2 주기는 제 2 호흡 이벤트 (1104) 의 시작과 제 3 호흡 이벤트 (1106) 의 시작 사이의 시간 간격에 의해 정의된다. "III" 으로 표현된 제 3 주기는 제 3 호흡 이벤트 (1106) 의 시작과 제 4 호흡 이벤트 (1108) 의 시작 사이의 시간 간격에 의해 정의된다.
각각의 주기는 프레임들의 수 (및 따라서 시간 간격) 에 대응한다. 예를 들어, 진단 플랫폼에 의해 획득된 오디오 데이터가 총 15 초의 지속기간을 갖는 기록이고, 프로세싱 동안, 기록이 대략 0.016 초의 지속기간을 각각 갖는 938 개의 세그먼트들로 분할된다고 가정한다. 용어 "세그먼트" 는 용어 "프레임" 과 상호교환가능하게 사용될 수도 있다. 여기서, 제 1, 제 2, 및 제 3 주기들은 길이가 대략 5 초이지만, 제 1, 제 2, 및 제 3 호흡 이벤트들 (1102, 1104, 1106) 은 세그먼트 및 초의 관점에서 상이한 길이들이다. 그러나, 당업자는 호흡 이벤트들 사이의 주기들이 서로 동일할 필요가 없다는 것을 인식할 것이다.
도 11a 에 도시된 바와 같이, 호흡률은 이들 주기들에 기초하여 프레임당 기준으로 계산될 수 있다. 예로서, "A" 에 의해 표현되는 15 초를 고려한다. 이 시점에서, 제 3 주기는 제 3 호흡 이벤트 (1106) 가 아직 시작되지 않았기 때문에 아직 정의되지 않았다. 호흡률은 120 을 초 단위의 제 1 및 제 2 주기들의 합으로 나누어 계산될 수 있다. "B" 로 표현되는 16 초에서 시작하여, 진단 플랫폼은 제 3 호흡 이벤트 (1106) 를 인식한다. 따라서, 16 초에서 시작하여, 호흡률은 120 을 초 단위의 제 2 및 제 3 주기들의 합으로 나누어 계산될 수 있다.
보통, 진단 플랫폼은 추가 호흡 이벤트들이 식별됨에 따라 지속적인 방식으로 호흡률을 계산한다. 달리 말하면, 호흡률은 새로운 주기들이 식별됨에 따라 "롤링" 방식으로 계산될 수 있다. 호흡 이벤트가 식별될 때마다 (및 따라서 새로운 주기가 정의됨), 진단 플랫폼은 가장 최근의 주기들을 사용하여 호흡률을 계산할 수도 있다. 예로서, 제 1 및 제 2 주기들이 각각 5 초 및 7 초에 대응한다고 가정한다. 이 시나리오에서, 호흡률은 분당 10 회 호흡들 (즉,
Figure pct00002
) 일 것이다. 다른 예로서, 제 1 및 제 2 주기들이 각각 4 초 및 4 초에 대응한다고 가정한다. 이 시나리오에서, 호흡률은 분당 15 회 호흡들 (즉,
Figure pct00003
) 일 것이다. 다른 주기 (즉, 제 3 주기) 가 식별된 후, 호흡률은 제 1 및 제 2 주기들보다는 제 2 및 제 3 주기들을 사용하여 계산될 수 있다.
위에서 언급된 바와 같이, 호흡은 생체에 의해 수행되는 것으로 알려져 있기 때문에, 호흡 이벤트의 지속기간은 보통 소정의 범위 내에 있다. 따라서, 호흡률을 계산하기 위해 진단 플랫폼에 의해 채용된 알고리즘은 새로운 호흡 이벤트가 소정 수의 프레임 또는 초 내에 추론되지 않으면 분모를 증분시키도록 프로그래밍될 수도 있다. 도 11a 에서, 알고리즘은 새로운 호흡 이벤트가 6 초 내에 발견되지 않았다는 결정에 응답하여 분모를 증분시키도록 프로그래밍된다. 따라서, "C" 로 표현되는 22 초에서, 진단 플랫폼은 120 을 제 2 주기 더하기 6 의 합으로 나누어 호흡률을 계산할 수도 있다. 한편, "D" 로 표현되는 23 초에서, 진단 플랫폼은 120 을 제 2 주기 더하기 7 의 합으로 나누어 호흡률을 계산할 수도 있다. 도 11a 에 도시된 바와 같이, 진단 플랫폼은 새로운 호흡 이벤트가 발견될 때까지 경과하는 매 초마다 분모를 계속 증분시킬 수 있다.
그러한 접근법은 환자의 건강의 변화들을 반영하기 위해 호흡률이 거의 실시간으로 업데이트되는 것을 보장한다. 환자가 완전히 호흡을 멈추면, 진단 플랫폼에 의해 계산된 호흡률은 즉시 0 의 값을 갖지 않을 수도 있지만, 호흡률은 거의 순간적으로 하향 추세를 보일 것이며, 이는 의료 전문가들에게 경보의 역할을 할 수 있다.
진단 플랫폼에 의해 계산된 호흡률이 비정상적으로 낮거나 또는 높은 시나리오들을 해결하기 위해, 알고리즘은 제 1 임계치 ("하한 임계치" 로서 또한 지칭됨) 및 제 2 임계치 ("상한 임계치" 로서 또한 지칭됨) 로 프로그래밍될 수도 있다. 호흡률이 하한 임계치 아래로 떨어지면, 알고리즘은 진단 플랫폼에 의해 경고가 제시되어야 함을 표시할 수도 있다. 더욱이, 진단 플랫폼이 호흡률이 하한 임계치 아래로 떨어진다고 결정하면, 진단 플랫폼은 호흡률이 실제로 0 인 것처럼 작용할 수도 있다. 그러한 접근법은 호흡률이 실제로 0 에 도달할 것을 요구하지 않고 진단 플랫폼이 연장된 시간 간격 동안 호흡 이벤트들이 발견되지 않은 시나리오들에 쉽게 반응할 수 있음을 보장한다. 유사하게, 호흡률이 상한 임계치를 초과하면, 알고리즘은 진단 플랫폼에 의해 경고가 제시되어야 함을 표시할 수도 있다. 하한 및 상한 임계치들은 환자, 환자에게 제공되는 서비스들 등에 기초하여 - 수동으로 또는 자동으로 - 조정될 수도 있다. 예를 들어, 하한 및 상한 임계치들은 소아 환자들의 경우 각각 4 및 60 일 수도 있고, 하한 및 상한 임계치들은 성인 환자들의 경우 각각 4 및 35 일 수도 있다.
단순화를 위해, (예를 들어, 도 13a-도 13b 에 도시된 인터페이스들에) 검토를 위해 포스팅된 호흡률은 정수 값일 수도 있지만, 호흡률은 소수점 첫째 또는 둘째 자리까지 (즉, 10 분의 1 또는 100 분의 1 자리까지) 계산될 수도 있다. 이는 특히 긴급한 상황들에서, 의료 전문가들 및 환자들에 의한 혼란을 회피하는데 도움이 될 수도 있다. 위에서 언급된 바와 같이, 검토를 위해 포스팅된 호흡률은 하한 임계치 아래로 떨어지거나 또는 상한 임계치를 초과하는 이벤트에서 시각적으로 변경될 수도 있다. 예를 들어, 호흡률이 하한 임계치 아래로 떨어지면, 진단 플랫폼은 호흡률이 검출불가능임을 표시하도록 의도되는 플레이스홀더 엘리먼트 (예를 들어, "-" 또는 "--") 를 포스팅할 수도 있다. 호흡률이 상한 임계치를 초과하면, 진단 플랫폼은 호흡률이 비정상적으로 높음을 표시하도록 의도되는 다른 플레이스홀더 엘리먼트 (예를 들어, "35+" 또는 "45+") 를 포스팅할 수도 있다. 많은 상황들에서, 의료 전문가들은 정확한 호흡률이 정확히 무엇인지보다 호흡률이 비정상적으로 높을 때를 아는 것에 더 관심이 있다.
일반적으로, 진단 플랫폼은 기록이 발생할 때 거의 실시간으로 획득되는 오디오 데이터의 스트림을 프로세싱한다. 달리 말하면, 진단 플랫폼은 위에서 논의된 바와 같이 새로운 호흡 이벤트들이 발견됨에 따라 호흡률을 계속해서 계산할 수도 있다. 그러나, 일부 실시형태들에서, 진단 플랫폼은 프로세싱 리소스들을 보존하기 위한 노력으로 모든 단일의 프레임에 대한 호흡률을 계산하지 않는다. 대신에, 진단 플랫폼은 주기적으로 호흡률을 계산할 수도 있지만, 호흡률은 보통, 의료 전문가들이 환자의 건강의 임의의 변화들을 인식하는 것을 보장하기 위해 여전히 자주 (예를 들어, 매 수 초마다) 계산될 것이다.
도 11b 는 진단 플랫폼이 미리결정된 빈도 (예를 들어, 매 2, 3, 또는 5 초마다) 업데이트되는 미리결정된 길이 (예를 들어, 12, 15, 또는 20 초) 의 기록에 대해 슬라이딩 윈도우를 사용하여 호흡률을 계산할 수도 있는 방법을 예시한다. 도 11b 에서, 경계 박스는 오디오 데이터가 프로세싱되는 슬라이딩 윈도우의 경계를 나타낸다. 미리결정된 양의 시간이 경과한 후, 슬라이딩 윈도우의 경계는 시프트된다. 여기서, 예를 들어, 슬라이딩 윈도우는 15 초를 커버하고 3 초만큼 시프트되어, 이전에 슬라이딩 윈도우에 포함된 오디오 데이터의 12 초를 유지한다. 그러한 접근법은 이용가능한 프로세싱 리소스들을 과도하게 소비하지 않고 호흡률이 자주 (예를 들어, 슬라이딩 윈도우의 경계가 시프트될 때마다) 계산될 수 있게 한다.
호흡률을 계산하기 위한 다른 접근법은 청진을 수행하기 위해 ML 또는 AI 보다는 자기상관에 의존한다. 하이 레벨에서, 용어 "자기상관" 은 신호가 지연의 함수로서 신호의 지연된 사본과 상관되는 프로세스를 지칭한다. 자기상관의 분석은 반복 패턴들을 식별하기 위한 일반적인 수학 툴이며, 따라서 반복 이벤트들에 관한 정보를 도출 또는 추론하기 위해 디지털 신호 프로세싱에 종종 사용된다.
진단 플랫폼이 검출을 위해 자기상관을 사용하는 실시형태들에서, 진단 플랫폼은 위에서 논의된 바와 같이 오디오 데이터의 기록을 스펙트로그램으로 변환하기 위해 STFT 를 사용한다. 그 다음, 도 12 에 도시된 바와 같이 흡기와 호기 사이의 간격을 결정하기 위해 기록에 대해 자기상관 계수들이 계산 및 플롯팅된다. 먼저, 진단 플랫폼은 노이즈를 감소시키기 위해 자기상관 계수들을 정규화할 수도 있다. 그 다음, 고역통과 필터가 임계치 (예를 들어, 15 Hz) 아래로 떨어지는 것들을 제거하기 위해 자기상관 계수들에 적용될 수도 있다. 더욱이, 진단 플랫폼은 자기상관 계수들을 더 정제하기 위해 추세제거 수정 (detrend modification) 을 수행할 수도 있다.
자기상관 계수들을 프로세싱한 후, 진단 플랫폼은 60 을 1 차 피크와 2 차 피크 사이의 호흡 간격 (RI) 으로 나누어 호흡률을 계산할 수 있다. 호흡률 인덱스는 어느 피크들이 선택되는지를 결정할 수도 있으며, 예를 들어, 높은 호흡률 인덱스가 선호된다. 일반적으로, 대략 0.6 미만의 호흡률 인덱스들은 불안정한 호흡률들을 나타내며, 따라서 진단 플랫폼에 의해 폐기될 수도 있다.
도 13a-도 13b 는 진단 플랫폼에 의해 생성될 수도 있는 인터페이스들의 예들을 포함한다. 도 13a 는 의료 전문가에 의한 진단 결정을 용이하게 하기 위해 진단 플랫폼에 의해 생성된 스펙트로그램이 거의 실시간으로 제시될 수도 있는 방법을 예시한다. 한편, 도 13b 는 환자의 건강에 대한 추가적인 통찰을 제공하기 위해 디지털 엘리먼트들 ("그래픽 엘리먼트들" 로서 또한 지칭됨) 이 스펙트로그램을 오버레이할 수도 있는 방법을 예시한다. 여기서, 예를 들어, 수직 대역들은 진단 플랫폼이 호흡 이벤트들에 대응한다고 결정한 스펙트로그램의 부분들을 오버레이한다. 일부 실시형태들에서, 이들 수직 대역들은 전체 호흡 사이클 (즉, 흡기 및 호기) 을 커버하는 한편, 다른 실시형태들에서 이들 수직 대역들은 호흡 사이클의 일 부분만 (예를 들어, 흡기만) 을 커버함에 유의한다.
호흡률은 의료 전문가에 의한 검토를 위해 (예를 들어, 우측 상단 코너에) 포스팅될 수도 있다. 진단 플랫폼이 호흡률이 비정상이라고 결정하는 경우, 포스팅된 값은 일부 방식으로 시각적으로 변경될 수도 있다. 예를 들어, 포스팅된 값은 상이한 컬러로 렌더링되거나, 상이한 (예를 들어, 더 큰) 사이즈로 렌더링되거나, 또는 주기적으로 제거된 다음 의료 전문가의 주의를 끌기 위해 "번쩍이 (flash)" 도록 다시 포스팅된다. 진단 플랫폼은 값이 하한 임계치 (예를 들어, 4, 5, 또는 8) 아래로 떨어지거나 또는 상한 임계치 (예를 들어, 35, 45, 또는 60) 를 초과하면 호흡률이 비정상이라고 결정할 수도 있거나, 또는 진단 플랫폼은 미리결정된 양의 시간 (예를 들어, 10, 15, 또는 20 초) 내에 호흡 이벤트들이 발견되지 않으면 호흡률이 비정상이라고 결정할 수도 있다.
도 13b 에 도시된 바와 같이, 인터페이스는 진단 플랫폼에 의해 지원되는 상이한 기능들과 연관된 다양한 아이콘들을 포함할 수도 있다. 선택될 때, 기록 아이콘 (1302) 은 인터페이스 상에 도시된 콘텐츠의 기록을 개시할 수도 있다. 예를 들어, 기록은 임의의 디지털 엘리먼트들과 함께 스펙트로그램, 뿐만 아니라 대응하는 오디오 데이터를 포함할 수도 있다. 선택될 때, 동결 아이콘 (1304) 은 현재 도시된 바와 같이 인터페이스를 동결시킬 수도 있다. 따라서, 추가적인 콘텐츠는 동결 아이콘 (1304) 이 선택될 때 인터페이스에 포스팅되지 않을 수도 있다. 콘텐츠는 동결 아이콘 (1304) 이 이 다음에 선택된 후에 다시 한번 인터페이스 상에 제시될 수도 있다. 선택될 때, 제어 아이콘들 (1306) 은 인터페이스의 다양한 양태들을 제어할 수도 있다. 예를 들어, 제어 아이콘들 (1306) 은 의료 전문가가 인터페이스를 잠그고 (예를 들어, 추가 변경들을 반영구적으로 또는 일시적으로 방지하기 위해), 인터페이스의 레이아웃을 변경하고, 인터페이스의 컬러 방식을 변경하고, 인터페이스에 대한 입력 메커니즘 (예를 들어, 터치 대 음성) 을 변경하는 등을 하는 것을 허용할 수도 있다. 보충 정보가 또한 인터페이스 상에 제시될 수도 있다. 예를 들어, 도 13b 에서, 인터페이스는 능동 노이즈 소거 (ANC), 재생, 및 연결된 전자 청진기 시스템의 상태에 관한 정보를 포함한다. 따라서, 의료 전문가는 진단 플랫폼이 상주하는 (그리고 인터페이스가 도시되는) 컴퓨팅 디바이스가 오디오 데이터를 생성하는 것을 담당하는 전자 청진기 시스템에 통신가능하게 연결되는지 여부를 쉽게 관찰 가능할 수도 있다.
호흡률을 계산하기 위한 방법론들
도 14 는 오디오 데이터의 분석을 통해 호흡 이벤트들을 검출하고 그 다음 그 호흡 이벤트들에 기초하여 호흡률을 계산하기 위한 프로세스 (1400) 의 플로우 다이어그램을 도시한다. 초기에, 진단 플랫폼은 환자의 폐에 의해 생성된 사운드들의 기록을 나타내는 오디오 데이터를 획득할 수 있다 (단계 1401). 일부 실시형태들에서, 진단 플랫폼은 전자 청진기 시스템으로부터 직접 오디오 데이터를 수신한다. 다른 실시형태들에서, 진단 플랫폼은 저장 매체로부터 오디오 데이터를 취득한다. 예를 들어, 환자는 자신이 기록한 오디오 데이터를 저장 매체에 업로드하도록 허용될 수도 있다. 다른 예로서, 의료 전문가는 자신이 기록한 오디오 데이터를 저장 매체에 업로드하도록 허용될 수도 있다.
그 다음, 진단 플랫폼은 훈련된 모델에 의한 분석의 준비로 오디오 데이터를 프로세싱할 수 있다 (단계 1402). 예를 들어, 진단 플랫폼은 오디오 데이터에 고역통과 필터를 적용하고, 그 다음 필터링된 오디오 데이터에 기초하여, (i) 스펙트로그램, (ii) 일련의 MFCC들, 및 (iii) 스펙트로그램의 상이한 주파수 대역들에 걸쳐 합산된 에너지를 나타내는 일련의 값들을 생성할 수도 있다. 진단 플랫폼은 이들 특징들을 특징 행렬로 연접시킬 수도 있다. 보다 구체적으로, 진단 플랫폼은 스펙트로그램, 일련의 MFCC들, 일련의 값들을 입력으로서 훈련된 모델에 제공될 수 있는 특징 행렬로 연접시킬 수도 있다. 일부 실시형태들에서, 진단 플랫폼은 각각의 엔트리가 0 과 1 사이의 값을 갖도록 특징 행렬에 대해 최소-최대 정규화를 수행한다.
그 다음, 진단 플랫폼은 오디오 데이터 (또는 오디오 데이터의 분석들) 에 훈련된 모델을 적용하여 시간 순서로 배열된 엔트리들을 포함하는 벡터를 생성할 수 있다 (단계 1403). 보다 구체적으로, 진단 플랫폼은 위에서 언급된 바와 같이 특징 행렬에 훈련된 모델을 적용할 수도 있다. 벡터 내의 각각의 엔트리는 오디오 데이터의 대응하는 세그먼트가 호흡 이벤트를 나타내는지 여부를 표시하는, 훈련된 모델에 의해 생성된, 검출을 나타낼 수도 있다. 벡터 내의 각각의 엔트리는 오디오 데이터의 상이한 세그먼트에 대응할 수도 있지만, 벡터 내의 모든 엔트리들은 동일한 지속기간의 오디오 데이터의 세그먼트들에 대응할 수도 있다. 예를 들어, 진단 플랫폼에 의해 획득된 오디오 데이터가 총 15 초의 지속기간을 갖는 기록을 나타낸다고 가정한다. 프리프로세싱의 일부로서, 기록은 동일한 지속기간의 938 개의 세그먼트들로 분할될 수도 있다. 이들 세그먼트들의 각각에 대해, 훈련된 모델은 오디오 데이터의 대응하는 부분이 호흡 이벤트를 나타내는지 여부에 관한 검출을 나타내는 출력을 생성할 수도 있다.
그 후, 진단 플랫폼은 위에서 언급된 바와 같이 벡터 내의 엔트리들의 포스트프로세싱을 수행할 수도 있다 (단계 1404). 예를 들어, 진단 플랫폼은 벡터를 검사하여 미리결정된 수 미만의 엔트리들에 의해 분리되는 동일한 타입의 호흡 이벤트에 대응하는 엔트리들의 쌍을 식별하고 그 다음 엔트리들의 쌍이 단일의 호흡 이벤트를 나타낸다는 것을 표시하기 위해 엔트리들의 쌍을 병합할 수도 있다. 이는 모델이 호흡 이벤트 없음을 표시한 세그먼트의 존재로 인해 호흡 이벤트가 누락되지 않는 것을 보장하기 위해 행해질 수도 있다. 추가적으로 또는 대안적으로, 진단 플랫폼은 벡터를 검사하여 미리결정된 길이 미만인 동일한 타입의 호흡 이벤트에 대응하는 일련의 연속 엔트리들을 식별하고, 그 다음 일련의 연속 엔트리들에 의해 표현된 호흡 이벤트를 삭제하기 위해 일련의 연속 엔트리들 내의 각각의 엔트리와 연관된 라벨을 조정할 수도 있다. 이는 미리결정된 길이 (예를 들어, 0.25, 0.50, 또는 1.00 초) 미만의 호흡 이벤트들이 인식되지 않는 것을 보장하기 위해 행해질 수도 있다.
그 다음, 진단 플랫폼은 벡터를 검사함으로써 (i) 제 1 호흡 이벤트, (ii) 제 2 호흡 이벤트, 및 (iii) 제 3 호흡 이벤트를 식별할 수 있다 (단계 1405). 제 2 호흡 이벤트는 제 1 호흡 이벤트를 뒤따를 수도 있고, 제 3 호흡 이벤트는 제 2 호흡 이벤트를 뒤따를 수도 있다. 각각의 호흡 이벤트는 오디오 데이터의 대응하는 세그먼트들이 호흡 이벤트를 나타낸다는 것을 표시하는 벡터 내의 적어도 2 개의 연속 엔트리들에 대응할 수도 있다. 연속 엔트리들의 수는 진단 플랫폼에 의해 시행되는 호흡 이벤트들의 최소 길이에 대응할 수도 있다.
그 다음, 진단 플랫폼은 (a) 제 1 및 제 2 호흡 이벤트들 사이의 제 1 주기 및 (b) 제 2 및 제 3 호흡 이벤트들 사이의 제 2 주기를 결정할 수 있다 (단계 1406). 위에서 논의된 바와 같이, 제 1 주기는 제 1 호흡 이벤트의 시작으로부터 제 2 호흡 이벤트의 시작까지 연장될 수도 있고, 제 2 주기는 제 2 호흡 이벤트의 시작으로부터 제 3 호흡 이벤트의 시작까지 연장될 수도 있다. 그 다음, 진단 플랫폼은 제 1 및 제 2 주기들에 기초하여 호흡률을 계산할 수 있다 (단계 1407). 예를 들어, 진단 플랫폼은 호흡률을 확립하기 위해 120 을 제 1 및 제 2 주기들의 합으로 나눌 수도 있다.
도 15 는 환자의 폐에 의해 만들어진 사운드들을 포함하는 오디오 데이터의 분석에 기초하여 호흡률을 계산하기 위한 프로세스 (1500) 의 플로우 다이어그램을 도시한다. 초기에, 진단 플랫폼은 시간 순서로 배열된 엔트리들을 포함하는 벡터를 획득할 수 있다 (단계 1501). 하이 레벨에서, 벡터 내의 각각의 엔트리는 오디오 데이터의 대응하는 세그먼트가 호흡 이벤트를 나타내는지 여부에 관한 검출을 나타낼 수도 있다. 위에서 논의된 바와 같이, 벡터는 출력으로서, 진단 플랫폼에 의해 오디오 데이터 또는 오디오 데이터의 분석들에 적용되는 모델에 의해 생성될 수도 있다.
그 다음, 진단 플랫폼은 벡터의 엔트리들을 검사함으로써 (i) 제 1 호흡 이벤트, (ii) 제 2 호흡 이벤트, 및 (iii) 제 3 호흡 이벤트를 식별할 수 있다 (단계 1502). 보통, 이는 벡터를 검사하여 동일한 타입의 호흡 이벤트와 연관되는 연속 엔트리들을 식별함으로써 달성된다. 예를 들어, 진단 플랫폼은 벡터를 파싱하여 동일한 검출 (예를 들어, 도 9 에 도시된 바와 같은 "흡기" 또는 "액션 없음") 을 갖는 연속 엔트리들을 식별할 수도 있다. 따라서, 각각의 호흡 이벤트는 (i) 미리결정된 길이를 초과하고 (ii) 오디오 데이터의 대응하는 세그먼트들이 호흡 이벤트를 나타낸다는 것을 표시하는 일련의 연속 엔트리들에 대응할 수도 있다. 위에서 논의된 바와 같이, 진단 플랫폼은 거짓 양성 및 음성이 호흡 이벤트들을 식별하는 그의 능력에 영향을 미치지 않는 것을 보장하기 위해 포스트프로세싱을 수행할 수도 있다.
그 다음, 진단 플랫폼은 (a) 제 1 및 제 2 호흡 이벤트들 사이의 제 1 주기 및 (b) 제 2 및 제 3 호흡 이벤트들 사이의 제 2 주기를 결정할 수 있다 (단계 1503). 도 15 의 단계 1503 은 도 14 의 단계 1406 과 유사할 수도 있다. 그 후, 진단 플랫폼은 제 1 및 제 2 주기들에 기초하여 호흡률을 계산할 수 있다 (단계 1504). 예를 들어, 진단 플랫폼은 호흡률을 확립하기 위해 120 을 제 1 및 제 2 주기들의 합으로 나눌 수도 있다.
일부 실시형태들에서, 진단 플랫폼은 오디오 데이터에 대응하는 스펙트로그램을 포함하는 인터페이스의 디스플레이를 야기하도록 구성된다 (단계 1505). 그러한 인터페이스들의 예들은 도 13a-도 13b 에 도시된다. 그러한 실시형태들에서, 진단 플랫폼은 의료 전문가에 의한 진단 결정을 용이하게 하기 위해 인터페이스에 호흡률을 포스팅할 수도 있다 (단계 1506). 더욱이, 진단 플랫폼은 위에서 논의된 바와 같이 호흡률을 임계치와 비교하고 (단계 1507), 그 다음 비교의 결과에 기초하여 적절한 액션을 취할 수도 있다 (단계 1508). 예를 들어, 진단 플랫폼이 호흡률이 하한 임계치 아래로 떨어진다고 결정하면, 진단 플랫폼은 그만큼을 표시하는 통지를 생성할 수도 있다. 유사하게, 진단 플랫폼이 호흡률이 상한 임계치를 초과한다고 결정하면, 진단 플랫폼은 그만큼을 표시하는 통지를 생성할 수도 있다. 보통, 통지는 호흡률이 포스팅되는 인터페이스 상에 제시된다. 예를 들어, 호흡률은 하한 임계치 아래로 떨어지거나 또는 상한 임계치를 초과한다는 결정에 응답하여 시각적으로 변경될 수도 있다.
물리적 가능성에 반하지 않는 한, 위에서 설명된 단계들은 다양한 시퀀스들 및 조합들로 수행될 수도 있을 것으로 예상된다.
예를 들어, 프로세스 (1500) 는 추가적인 호흡 이벤트들이 발견됨에 따라 호흡률이 계속해서 재계산되도록 반복적으로 수행될 수도 있다. 그러나, 위에서 언급된 바와 같이, 진단 플랫폼은 호흡 이벤트들이 발견되지 않으면 분모를 증분 (및 따라서 호흡률을 감소) 시키도록 프로그래밍될 수도 있다.
다른 예로서, 호흡률은 2 개 초과의 주기들을 사용하여 계산될 수도 있다. 일반적으로, 단일의 주기를 사용하여 호흡률을 계산하는 것은 바람직하지 않은데, 그 이유는 의료 전문가들에게 도움이 되기에는 상대적으로 짧은 시간 주기들에 걸쳐 값이 너무 많이 변할 것이기 때문이다. 그러나, 진단 플랫폼은 3 개 이상의 주기들을 사용하여 호흡률을 계산할 수 있다. 예를 들어, 진단 플랫폼이 4 회의 호흡 이벤트들에 의해 정의된 3 개의 주기들을 사용하여 호흡률을 계산하는 임무를 맡는다고 가정한다. 그러한 시나리오에서, 진단 플랫폼은 주로 도 14-도 15 를 참조하여 위에서 설명된 바와 같이 단계들을 수행할 수도 있다. 그러나, 진단 플랫폼은 그 때 180 을 제 1, 제 2, 및 제 3 주기들의 합으로 나눌 것이다. 프로세스는 대체로 동일하게 유지되지만, 호흡률을 계산하기 위해, 진단 플랫폼은 60 곱하기 "N" (여기서 "N" 은 주기들의 수임) 을 그 "N" 개의 주기들의 합으로 나눌 것이다.
다른 단계들이 또한 일부 실시형태들에 포함될 수도 있다. 예를 들어, 호흡 이상의 존재와 같은 진단 관련 통찰은, 인터페이스 (예를 들어, 도 13b 의 인터페이스) 에 포스팅되거나 또는 환자와 연관된 프로파일을 나타내는 데이터 구조에 저장될 수 있다. 따라서, 진단 관련 통찰은 대응하는 환자들과 연관된 오디오 데이터로 인코딩되는 데이터 구조들에 저장될 수도 있다.
전자 청진기 시스템 및 진단 플랫폼의 예시적인 사용 사례
중등도 내지 중증 마취에 대한 요구가 전통적인 삽관 수술보다 점차 커지고 있으며, 마취가 의료 시설에서 주류 치료가 되었다. 그러나, 호흡 정지 또는 기도 폐색의 위험은 여전히 제거될 수 없다. 환자들의 호흡 상태의 직접적이고 계속적인 모니터링이 부족하며, 위에서 논의된 청진-주도 (auscultation-driven) 접근법들이 이 문제에 대한 해결책을 나타낸다.
세계보건기구 (WHO) 에 의해 공개된 수술 안전 가이던스에 따르면, 중등도 비삽관 마취는 담당 의료 전문가에 의한 지속적인 모니터링을 요구한다. 이는 전통적으로 청진에 기초한 환기의 확인, 호기말 CO2 의 모니터링, 또는 환자와의 구두 소통을 포함하여 여러 방식들로 달성되었다. 그러나, 이들 전통적인 접근법들은 많은 상황들에서 불가능하지는 않더라도 비실용적이다.
위에서 논의된 청진-주도 접근법은 이들 전통적인 접근법들에 적합하지 않은 상황들에서 채용될 수 있다. 예를 들어, 청진-주도 접근법은 진정제 투여가 종종 고통을 완화시키는데 사용되는 성형 수술, 위장관 내시경 검사, 및 치과 시술과 같은 상황들에서 사용될 수도 있다. 다른 예로서, 청진-주도 접근법은 질병 전파의 위험이 높은 상황들 (예를 들어, 호흡기 질환이 있는 환자들의 치료) 에서 사용될 수도 있다. 본 명세서에서 설명된 접근법들의 가장 중요한 적용들 중 하나는 청진을 통해 기도가 막혔음을 신속하게 확인하는 능력이다. 전자 청진기 시스템과 진단 플랫폼을 함께 사용하면 의료 전문가들이 환자의 호흡 사운드들을 수동으로 평가할 필요 없이 환자를 계속해서 모니터링할 수 있다.
A. 성형 수술
코 성형과 같은 소정의 시술은, 그 환자들이 필요한 마스크를 착용할 수 없을 것이기 때문에 호기말 CO2 가 호흡 상태를 모니터링하는데 사용되는 것을 방지할 것이다. 주변 산소측정기들은 고유 레이턴시를 가지며 산소가 소정의 레벨 아래로 탈포화되었을 때만 통지들을 생성할 수 있다.
B. 위장관 내시경
전통적으로, 주변 산소측정기들 및 호기말 CO2 모니터들은 위장관 내시경 동안 환자들의 호흡 상태를 모니터링하는데 사용되었다. 이들 2 개의 접근법들은 고유 레이턴시를 가지며 산소 탈포화 또는 호기말 볼륨이 적어도 소정량 변할 때만 통지들을 제공한다.
C. 치과 시술
치과 시술 동안, 의료 전문가들이 바이탈 사인을 계속해서 모니터링하는 것은 어렵다. 고도의 집중력이 요구될 뿐만 아니라, 치과 시술을 수행하는 동안 한 명 또는 두 명의 의료 전문가들만이 참석하는 것은 드문 일이 아니다. 더욱이, 환자들은 자신의 타액으로 인해 쉽게 구역질을 하거나 또는 질식할 수 있으며, 이는 그 환자들이 마취 상태에 있는 경우 특히 위험하다.
D. 전염병 예방
질병의 전파를 방지하기 위해, 환자들은 종종 격리된다. 격리가 필요할 때, 의료 전문가들이 전통적인 청진을 수행하는 것은 위험할 수도 있다. 더욱이, 의료 전문가들은 보호 가운 및 마스크와 같은 개인용 보호구 (PPE) 를 착용하는 동안 청진을 실시하지 못할 수도 있다. 간단히 말해, 격리와 PPE 의 조합은 환자들의 호흡 상태를 적절하게 평가하기 어렵게 할 수 있다.
전자 청진기 시스템 및 진단 플랫폼은 호흡 이벤트들을 시각화하기 위한 수단을 제공할 뿐만 아니라, 청진 사운드들의 재생을 개시하고 순간 통지들을 생성하는데 사용될 수 있다. 의료 전문가들은 청진 사운드들을 듣고 도 16 에 도시된 바와 같은 호흡 이벤트들을 볼 수 있으며, 이는 기도가 부분적으로 막히거나 또는 호흡률이 불안정해질 때를 확립하는데 사용될 수 있다.
프로세싱 시스템
도 17 은 본 명세서에서 설명된 적어도 일부 동작들이 구현될 수 있는 프로세싱 시스템 (1700) 의 예를 예시하는 블록 다이어그램이다. 예를 들어, 프로세싱 시스템 (1700) 의 컴포넌트들은 진단 플랫폼을 실행하는 컴퓨팅 디바이스 상에 호스팅될 수도 있다. 컴퓨팅 디바이스들의 예들은 전자 청진기 시스템들, 모바일 폰들, 태블릿 컴퓨터들, 개인용 컴퓨터들, 및 컴퓨터 서버들을 포함한다.
프로세싱 시스템 (1700) 은 버스 (1716) 에 통신가능하게 연결되는 프로세서 (1702), 메인 메모리 (1706), 비휘발성 메모리 (1710), 네트워크 어댑터 (1712) (예를 들어, 네트워크 인터페이스), 비디오 디스플레이 (1718), 입력/출력 디바이스 (1720), 제어 디바이스 (1722) (예를 들어, 키보드, 포인팅 디바이스, 또는 버튼과 같은 기계적 입력), 저장 매체 (1726) 를 포함하는 드라이브 유닛 (1724), 및 신호 생성 디바이스 (1730) 를 포함할 수도 있다. 버스 (1716) 는, 적절한 브리지들, 어댑터들, 또는 제어기들에 의해 연결되는 하나 이상의 물리적 버스들 및/또는 포인트-투-포인트 연결들을 나타내는 추상화로서 예시된다. 따라서, 버스 (1716) 는 시스템 버스, PCI (Peripheral Component Interconnect) 버스, PCI-Express 버스, HyperTransport 버스, ISA (Industry Standard Architecture) 버스, SCSI (Small Computer System Interface) 버스, USB, I2C (Inter-Integrated Circuit) 버스, 또는 IEEE (Institute of Electrical and Electronics Engineers) 표준 1394 를 준수하는 버스를 포함할 수 있다.
프로세싱 시스템 (1700) 은 컴퓨터 서버, 라우터, 데스크탑 컴퓨터, 태블릿 컴퓨터, 모바일 폰, 비디오 게임 콘솔, 웨어러블 전자 디바이스 (예를 들어, 시계 또는 피트니스 트래커), 네트워크 연결 ("스마트") 디바이스 (예를 들어, 텔레비전 또는 홈 어시스턴트 디바이스), 증강 또는 가상 현실 시스템 (예를 들어, 헤드 장착 디스플레이), 또는 프로세싱 시스템 (1700) 에 의해 취해질 액션(들)을 특정하는 (순차적 또는 다른 방식의) 명령들의 세트를 실행할 수 있는 다른 전자 디바이스의 것과 유사한 컴퓨터 프로세서 아키텍처를 공유할 수도 있다.
메인 메모리 (1706), 비휘발성 메모리 (1710), 및 저장 매체 (1726) 는 단일의 매체인 것으로 도시되지만, 용어들 "저장 매체" 및 "머신 판독가능 매체" 는 명령들 (1728) 의 하나 이상의 세트들을 저장하는 단일의 매체 또는 다중의 매체들을 포함하는 것으로 간주되어야 한다. 용어들 "저장 매체" 및 "머신 판독가능 매체" 는 또한, 프로세싱 시스템 (1700) 에 의한 실행을 위해 명령들의 세트를 저장, 인코딩, 또는 반송할 수 있는 임의의 매체를 포함하는 것으로 간주되어야 한다.
일반적으로, 본 개시의 실시형태들을 구현하도록 실행되는 루틴들은 특정 애플리케이션, 컴포넌트, 프로그램, 오브젝트, 모듈, 또는 명령들의 시퀀스 (집합적으로 "컴퓨터 프로그램들" 로서 지칭됨) 또는 오퍼레이팅 시스템의 일부로서 구현될 수도 있다. 컴퓨터 프로그램들은 통상적으로 컴퓨팅 디바이스 내의 다양한 메모리들 및 저장 디바이스들에서 다양한 시간들에 설정된 하나 이상의 명령들 (예를 들어, 명령들 (1704, 1708, 1728)) 을 포함한다. 프로세서 (1702) 에 의해 판독 및 실행될 경우, 명령들은 프로세싱 시스템 (1700) 으로 하여금 본 개시의 다양한 양태들을 실행하기 위한 동작들을 수행하게 한다.
실시형태들은 완전히 기능하는 컴퓨팅 디바이스들의 맥락에서 설명되었지만, 당업자는 다양한 실시형태들이 다양한 형태들의 프로그램 제품으로서 배포될 수 있음을 인식할 것이다. 본 개시는 실제로 배포를 일으키는데 사용되는 머신- 또는 컴퓨터 판독가능 매체의 특정 타입에 관계없이 적용된다. 머신- 및 컴퓨터 판독가능 매체들의 추가 예들은 휘발성 메모리, 비휘발성 메모리 (1710), 착탈식 디스크들, 하드 디스크 드라이브들 (HDD들), 광학 디스크들 (예를 들어, 컴팩트 디스크 판독 전용 메모리 (CD-ROM들) 및 디지털 다기능 디스크들 (DVD들)), 클라우드-기반 스토리지, 및 송신 타입 매체들, 이를 테면 디지털 및 아날로그 통신 링크들과 같은 기록가능 타입 매체들을 포함한다.
네트워크 어댑터 (1712) 는 프로세싱 시스템 (1700) 이 프로세싱 시스템 (1700) 및 외부 엔티티에 의해 지원되는 임의의 통신 프로토콜을 통해 프로세싱 시스템 (1700) 외부에 있는 엔티티와 네트워크 (1714) 내의 데이터를 중재할 수 있게 한다. 네트워크 어댑터 (1712) 는 (예를 들어, 블루투스 또는 Wi-Fi 를 통한 통신을 가능하게 하는) 집적 회로를 포함하는 트랜시버, 네트워크 어댑터 카드, 무선 네트워크 인터페이스 카드, 스위치, 프로토콜 변환기, 게이트웨이, 브릿지, 허브, 수신기, 또는 리피터를 포함할 수 있다.
비고
본 기술의 다양한 실시형태들의 전술한 설명은 예시 및 설명의 목적으로 제공되었다. 청구된 주제를 개시된 정확한 형태로 제한하거나 철저한 것으로 의도되지 않는다.
많은 수정들 및 변동들은 당업자에게 명백할 것이다. 실시형태들은 본 기술의 원리들 및 그 실제 애플리케이션들을 가장 잘 설명하고, 그에 의해, 당업자로 하여금 고려된 특정 이용에 적합한 청구된 주제, 다양한 실시형태들, 및 다양한 수정들을 이해할 수 있게 하기 위해 선택 및 설명되었다.

Claims (18)

  1. 호흡률 (respiratory rate) 을 계산하기 위한 방법으로서,
    환자의 폐에 의해 생성된 사운드들의 기록을 나타내는 오디오 데이터를 획득하는 단계;
    훈련된 모델에 의한 분석의 준비로 상기 오디오 데이터를 프로세싱하는 단계;
    상기 오디오 데이터에 상기 훈련된 모델을 적용하여 시간 순서로 배열된 엔트리들을 포함하는 벡터를 생성하는 단계로서,
    상기 벡터 내의 각각의 엔트리는 상기 오디오 데이터의 대응하는 세그먼트가 호흡 이벤트를 나타내는지 여부를 표시하는, 상기 벡터를 생성하는 단계;
    상기 벡터를 검사함으로써 (i) 제 1 호흡 이벤트, (ii) 상기 제 1 호흡 이벤트를 뒤따르는 제 2 호흡 이벤트, 및 (iii) 상기 제 2 호흡 이벤트를 뒤따르는 제 3 호흡 이벤트를 식별하는 단계;
    (a) 상기 제 1 및 제 2 호흡 이벤트들 사이의 제 1 주기 및 (b) 상기 제 2 및 제 3 호흡 이벤트들 사이의 제 2 주기를 결정하는 단계; 및
    상기 제 1 및 제 2 주기들에 기초하여 호흡률을 계산하는 단계를 포함하는, 호흡률을 계산하기 위한 방법.
  2. 제 1 항에 있어서,
    상기 벡터 내의 각각의 엔트리는 상기 오디오 데이터의 상이한 세그먼트에 대응하고, 상기 벡터 내의 모든 엔트리들은 동일한 지속기간의 상기 오디오 데이터의 세그먼트들에 대응하는, 호흡률을 계산하기 위한 방법.
  3. 제 1 항에 있어서,
    각각의 호흡 이벤트는 상기 오디오 데이터의 대응하는 세그먼트들이 호흡 이벤트를 나타낸다는 것을 표시하는 상기 벡터 내의 적어도 2 개의 연속 엔트리들에 대응하는, 호흡률을 계산하기 위한 방법.
  4. 제 1 항에 있어서,
    상기 프로세싱하는 단계는,
    상기 오디오 데이터에 고역통과 필터를 적용하는 단계,
    상기 오디오 데이터에 기초하여, (i) 스펙트로그램 (spectrogram), (ii) 일련의 MFCC들 (Mel-frequency cepstral coefficients), 및 (iii) 상기 스펙트로그램의 상이한 주파수 대역들에 걸쳐 합산된 에너지를 나타내는 일련의 값들을 생성하는 단계, 및
    상기 스펙트로그램, 상기 일련의 MFCC들, 및 상기 일련의 값들을 특징 행렬 (feature matrix) 로 연접시키는 단계를 포함하는, 호흡률을 계산하기 위한 방법.
  5. 제 4 항에 있어서,
    상기 프로세싱하는 단계는,
    각각의 엔트리가 0 과 1 사이의 값을 갖도록 상기 특징 행렬에 대해 최소-최대 정규화 (min-max normalization) 를 수행하는 단계를 더 포함하는, 호흡률을 계산하기 위한 방법.
  6. 제 4 항에 있어서,
    상기 고역통과 필터의 컷-오프 주파수는 상기 환자의 다른 내부 기관에 의해 만들어진 사운드들이 상기 오디오 데이터로부터 필터링되게 하는, 호흡률을 계산하기 위한 방법.
  7. 제 1 항에 있어서,
    상기 벡터를 검사하여, 미리결정된 수 미만의 엔트리들에 의해 분리되는 동일한 타입의 호흡 이벤트에 대응하는 엔트리들의 쌍을 식별하는 단계; 및
    상기 엔트리들의 쌍이 단일의 호흡 이벤트를 나타낸다는 것을 표시하기 위해 상기 엔트리들의 쌍을 병합하는 단계를 더 포함하는, 호흡률을 계산하기 위한 방법.
  8. 제 7 항에 있어서,
    상기 엔트리들의 쌍은 상기 오디오 데이터의 대응하는 세그먼트들이 흡기 (inhalation) 를 나타낸다는 것을 표시하는, 호흡률을 계산하기 위한 방법.
  9. 제 7 항에 있어서,
    상기 엔트리들의 쌍은 상기 오디오 데이터의 대응하는 세그먼트들이 호기 (exhalation) 를 나타낸다는 것을 표시하는, 호흡률을 계산하기 위한 방법.
  10. 제 1 항에 있어서,
    상기 벡터를 검사하여, 미리결정된 길이 미만인 동일한 타입의 호흡 이벤트에 대응하는 일련의 연속 엔트리들을 식별하는 단계; 및
    상기 일련의 연속 엔트리들에 의해 표현된 호흡 이벤트를 삭제하기 위해 상기 일련의 연속 엔트리들 내의 각각의 엔트리와 연관된 라벨을 조정하는 단계를 더 포함하는, 호흡률을 계산하기 위한 방법.
  11. 제 1 항에 있어서,
    상기 제 1 주기는 상기 제 1 호흡 이벤트의 시작으로부터 상기 제 2 호흡 이벤트의 시작까지 연장되고, 상기 제 2 주기는 상기 제 2 호흡 이벤트의 시작으로부터 상기 제 3 호흡 이벤트의 시작까지 연장되고, 상기 계산하는 단계는,
    상기 호흡률을 확립하기 위해 120 을 상기 제 1 및 제 2 주기들의 합으로 나누는 단계를 포함하는, 호흡률을 계산하기 위한 방법.
  12. 명령들이 저장된 비일시적 매체로서,
    상기 명령들은, 컴퓨팅 디바이스의 프로세서에 의해 실행될 경우, 상기 컴퓨팅 디바이스로 하여금,
    시간 순서로 배열된 엔트리들을 포함하는 벡터를 획득하는 것으로서,
    상기 벡터 내의 각각의 엔트리는 오디오 데이터의 대응하는 세그먼트가 호흡 이벤트를 나타내는지 여부에 관한 예측을 나타내는, 상기 벡터를 획득하는 것;
    상기 벡터의 상기 엔트리들을 검사함으로써 (i) 제 1 호흡 이벤트, (ii) 제 2 호흡 이벤트, 및 (iii) 제 3 호흡 이벤트를 식별하는 것;
    (a) 상기 제 1 및 제 2 호흡 이벤트들 사이의 제 1 주기 및 (b) 상기 제 2 및 제 3 호흡 이벤트들 사이의 제 2 주기를 결정하는 것; 및
    상기 제 1 및 제 2 주기들에 기초하여 호흡률을 계산하는 것
    을 포함하는 동작들을 수행하게 하는, 명령들이 저장된 비일시적 매체.
  13. 제 12 항에 있어서,
    각각의 호흡 이벤트는 환자에 의한 흡기인, 명령들이 저장된 비일시적 매체.
  14. 제 12 항에 있어서,
    상기 제 1, 제 2, 및 제 3 호흡 이벤트들의 각각은 (i) 미리결정된 길이를 초과하고 (ii) 상기 오디오 데이터의 대응하는 세그먼트들이 호흡 이벤트를 나타낸다는 것을 표시하는 상기 벡터 내의 일련의 연속 엔트리들에 대응하는, 명령들이 저장된 비일시적 매체.
  15. 제 12 항에 있어서,
    상기 계산하는 것은,
    상기 호흡률을 확립하기 위해 120 을 상기 제 1 및 제 2 주기들의 합으로 나누는 것을 포함하는, 명령들이 저장된 비일시적 매체.
  16. 제 12 항에 있어서,
    상기 동작들은,
    상기 오디오 데이터에 대응하는 스펙트로그램을 포함하는 인터페이스의 디스플레이를 야기하는 것; 및
    의료 전문가에 의한 진단 결정을 용이하게 하기 위해 상기 인터페이스에 상기 호흡률을 포스팅하는 것을 더 포함하는, 명령들이 저장된 비일시적 매체.
  17. 제 12 항에 있어서,
    상기 동작들은,
    상기 호흡률을 하한 임계치와 비교하는 것; 및
    상기 호흡률이 상기 하한 임계치 아래로 떨어진다는 결정에 응답하여 통지를 생성하는 것을 더 포함하는, 명령들이 저장된 비일시적 매체.
  18. 제 12 항에 있어서,
    상기 동작들은,
    상기 호흡률을 상한 임계치와 비교하는 것; 및
    상기 호흡률이 상기 상한 임계치를 초과한다는 결정에 응답하여 통지를 생성하는 것을 더 포함하는, 명령들이 저장된 비일시적 매체.
KR1020227041116A 2020-05-15 2021-05-14 디지털 청진기에 의해 생성된 오디오 데이터의 분석을 통한 건강에 대한 통찰의 도출 KR20230023624A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063025395P 2020-05-15 2020-05-15
US63/025,395 2020-05-15
PCT/US2021/032595 WO2021231958A1 (en) 2020-05-15 2021-05-14 Deriving insights into health through analysis of audio data generated by digital stethoscopes

Publications (1)

Publication Number Publication Date
KR20230023624A true KR20230023624A (ko) 2023-02-17

Family

ID=78525093

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227041116A KR20230023624A (ko) 2020-05-15 2021-05-14 디지털 청진기에 의해 생성된 오디오 데이터의 분석을 통한 건강에 대한 통찰의 도출

Country Status (7)

Country Link
US (3) US11813109B2 (ko)
EP (1) EP4149350A4 (ko)
JP (1) JP2023529803A (ko)
KR (1) KR20230023624A (ko)
CN (1) CN115884709A (ko)
CA (1) CA3178999A1 (ko)
WO (1) WO2021231958A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023245228A1 (en) * 2022-06-24 2023-12-28 Ticking Heart Pty Ltd A phonocardiogram sensing device
WO2024015524A1 (en) * 2022-07-13 2024-01-18 Heroic Faith Medical Science Co., Ltd. Tubular member for facilitating the collection of sound waves originating inside a living body

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9031243B2 (en) * 2009-09-28 2015-05-12 iZotope, Inc. Automatic labeling and control of audio algorithms by audio recognition
US20140194793A1 (en) * 2010-05-14 2014-07-10 Kai Medical, Inc. Systems and methods for non-contact multiparameter vital signs monitoring, apnea therapy, apnea diagnosis, and snore therapy
US11315687B2 (en) * 2012-06-18 2022-04-26 AireHealth Inc. Method and apparatus for training and evaluating artificial neural networks used to determine lung pathology
US9750461B1 (en) * 2013-01-02 2017-09-05 Masimo Corporation Acoustic respiratory monitoring sensor with probe-off detection
US20170296094A1 (en) * 2016-04-15 2017-10-19 Msa Technology, Llc Breathing apparatus with system-integrated breathing sensor system
WO2019067880A1 (en) 2017-09-28 2019-04-04 Heroic Faith Medical Science Co., Ltd. ELECTRONIC STETHOSCOPE SYSTEMS CONNECTED TO THE NETWORK
US10636437B2 (en) * 2018-03-02 2020-04-28 Robert Bosche Gmbh System and method for monitoring dietary activity

Also Published As

Publication number Publication date
EP4149350A1 (en) 2023-03-22
WO2021231958A1 (en) 2021-11-18
US20240057965A1 (en) 2024-02-22
CN115884709A (zh) 2023-03-31
US20230076296A1 (en) 2023-03-09
US11813109B2 (en) 2023-11-14
CA3178999A1 (en) 2021-11-18
EP4149350A4 (en) 2024-05-22
JP2023529803A (ja) 2023-07-12
US20240057964A1 (en) 2024-02-22

Similar Documents

Publication Publication Date Title
AU2019357278B2 (en) An intelligent cardio-pulmonary screening device for telemedicine applications
US20210145306A1 (en) Managing respiratory conditions based on sounds of the respiratory system
Kim et al. The coming era of a new auscultation system for analyzing respiratory sounds
US11813109B2 (en) Deriving insights into health through analysis of audio data generated by digital stethoscopes
AU2018266253B2 (en) System and method for determining cardiac rhythm and/or respiratory rate
CN107595259B (zh) 一种报警方法、装置、穿戴设备及存储介质
WO2013089073A1 (ja) 情報解析装置、電子聴診器、情報解析方法、測定システム、制御プログラム、および、記録媒体
JP2013123494A (ja) 情報解析装置、情報解析方法、制御プログラム、および、記録媒体
US11484283B2 (en) Apparatus and method for identification of wheezing in ausculated lung sounds
CN112654286A (zh) 筛选结构性心脏病的设备、方法及系统
JP2023168424A (ja) 診断可能化データを識別するためのシステム、方法、及びコンピュータプログラム製品
Rahman et al. Towards reliable data collection and annotation to extract pulmonary digital biomarkers using mobile sensors
KR20150001009A (ko) 휴대용 무선 디지털 전자 청진기를 이용한 휴대 단말 진단 시스템
Ahmed et al. Remote breathing rate tracking in stationary position using the motion and acoustic sensors of earables
Doheny et al. Estimation of respiratory rate and exhale duration using audio signals recorded by smartphone microphones
US20220151582A1 (en) System and method for assessing pulmonary health
US20220378377A1 (en) Augmented artificial intelligence system and methods for physiological data processing
KR102597981B1 (ko) 사운드 분석 장치
US11083403B1 (en) Pulmonary health assessment system
Uwaoma et al. Using embedded sensors in smartphones to monitor and detect early symptoms of exercise-induced asthma
WO2024065722A1 (en) Multiple sensor acoustic respiratory monitor
Kemper et al. An algorithm for obtaining the frequency and the times of respiratory phases from nasal and oral acoustic signals
WO2024057260A1 (en) Respiratory evaluation and monitoring system and method
CN113951917A (zh) 一种远程听诊检测装置、方法及电子设备
Martins Look4MySounds: Sound Platform for Remote Auscultation

Legal Events

Date Code Title Description
A201 Request for examination