KR102630580B1 - 호흡기 질병 진단을 위한 질병 시그니처를 이용한 기침 소리 분석 방법 - Google Patents

호흡기 질병 진단을 위한 질병 시그니처를 이용한 기침 소리 분석 방법 Download PDF

Info

Publication number
KR102630580B1
KR102630580B1 KR1020207021010A KR20207021010A KR102630580B1 KR 102630580 B1 KR102630580 B1 KR 102630580B1 KR 1020207021010 A KR1020207021010 A KR 1020207021010A KR 20207021010 A KR20207021010 A KR 20207021010A KR 102630580 B1 KR102630580 B1 KR 102630580B1
Authority
KR
South Korea
Prior art keywords
disease
cough
features
model
signatures
Prior art date
Application number
KR1020207021010A
Other languages
English (en)
Other versions
KR20200122301A (ko
Inventor
우단타 아베이라트네
비나야크 스와른카
Original Assignee
더 유니버서티 어브 퀸슬랜드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2017905129A external-priority patent/AU2017905129A0/en
Application filed by 더 유니버서티 어브 퀸슬랜드 filed Critical 더 유니버서티 어브 퀸슬랜드
Publication of KR20200122301A publication Critical patent/KR20200122301A/ko
Application granted granted Critical
Publication of KR102630580B1 publication Critical patent/KR102630580B1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • A61B5/0823Detecting or evaluating cough events
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0002Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • A61B5/0803Recording apparatus specially adapted therefor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/113Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb occurring during breathing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/41Detecting, measuring or recording for evaluating the immune or lymphatic systems
    • A61B5/411Detecting or monitoring allergy or intolerance reactions to an allergenic agent or substance
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/003Detecting lung or respiration noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2560/00Constructional details of operational features of apparatus; Accessories for medical measuring apparatus
    • A61B2560/02Operational features
    • A61B2560/0242Operational features adapted to measure environmental factors, e.g. temperature, pollution
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2562/00Details of sensors; Constructional details of sensor housings or probes; Accessories for sensors
    • A61B2562/02Details of sensors specially adapted for in-vivo measurements
    • A61B2562/0204Acoustic sensors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2562/00Details of sensors; Constructional details of sensor housings or probes; Accessories for sensors
    • A61B2562/02Details of sensors specially adapted for in-vivo measurements
    • A61B2562/0219Inertial sensors, e.g. accelerometers, gyroscopes, tilt switches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/75Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 for modelling vocal tract parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Physiology (AREA)
  • Pulmonology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Signal Processing (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Fuzzy Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Engineering & Computer Science (AREA)
  • Dentistry (AREA)

Abstract

환자 기도의 하나 이상의 질병을 진단하기 위한 방법은: 환자로부터 기침 소리를 취득하는 단계; 기침 세그먼트로부터 하나 이상의 기침 소리 피처를 나타내는 기침 소리 피처 신호를 생성하기 위해 기침 소리를 처리하는 단계; 기침 소리 피처 신호에 기초하여 하나 이상의 질병 시그니처를 획득하는 단계; 및 기침 세그먼트가 상기 질병들 중 하나 이상을 나타내는 것으로 간주하도록 하나 이상의 질병 시그니처를 분류하는 단계를 포함하고, 기침 소리 피처 신호에 기초하여 하나 이상의 질병 시그니처를 획득하는 단계는 기침 소리 피처를 하나 이상의 미리훈련된 질병 시그니처 결정 머신 각각에 적용하는 단계를 포함하고, 각각의 상기 결정 머신은 기침 소리 피처를 특정한 질병 또는 비질병 상태에 대응하는 것으로서 분류하거나 제1 특정한 질병 또는 제1 특정한 질병과는 상이한 제2 특정한 질병에 대응하는 것으로서 분류하도록 미리훈련된다.

Description

호흡기 질병 진단을 위한 질병 시그니처를 이용한 기침 소리 분석 방법
본 발명은 의료진이 호흡기 질병을 앓고 있는 환자를 진단하고 치료하는 것을 보조하기 위한 방법 및 장치에 관한 것이다.
종래 기술의 방법, 장치 또는 문서에 대한 어떠한 언급도, 그것이 일반적인 상식을 형성하거나 상식의 일부를 형성한다는 어떠한 증거 또는 인정을 구성하는 것으로 간주되어서는 안된다.
그 전체내용이 참조에 의해 본 명세서에 포함되는 국제 특허 출원 PCT/AU2013/000323의 주제인 동일한 발명자들 중 한 명 이상에 의한 이전 연구에서, 환자 기도(respiratory tract) 소리가 녹음되고 그로부터 기침 소리가 식별되었다. 환자에서 폐렴 등의 호흡기 기능장애의 존재를 진단하기 위해, 기침 소리로부터 피처가 추출되어 테스트 피처 벡터를 형성한 다음, 미리훈련된 분류기, 바람직하게는 로지스틱 회귀 모델(logistic regression model)에 적용되었다.
PCT/AU2013/000323에 설명된 질병 상태를 진단하는 방법은 잘 작동했고 상업적으로 성공적으로 구현되었지만, 개선의 필요성이 있다. 예를 들어, 보다 정확한 진단을 생성할 수 있는 개선된 방법이 제공된다면 유리할 것이다. 이 방법이 영역 특유의 정보를 진단 프로세스 내에 주입할 수 있다면 역시 바람직할 것이다. 더욱이, 표준 임상 진단의 다소 주관적 성질이 수용될 수 있다면 바람직할 것이다.
본 발명의 목적은 기도의 질병 상태의 진단을 보조하기 위한 방법 및 장치를 제공하는 것이다.
본 발명의 제1 양태에 따르면, 환자의 기도의 하나 이상의 질병을 진단하기 위한 방법이 제공되고 이 방법은 다음과 같은 단계들을 포함한다:
환자로부터 기침 소리를 취득하는 단계;
기침 세그먼트로부터 하나 이상의 기침 소리 피처를 나타내는 기침 소리 피처 신호를 생성하기 위해 기침 소리를 처리하는 단계;
기침 소리 피처 신호에 기초하여 하나 이상의 질병 시그니처를 획득하는 단계; 및
기침 세그먼트가 상기 질병들 중 하나 이상을 나타내는 것으로 간주하도록 하나 이상의 질병 시그니처를 분류하는 단계;
여기서, 기침 소리 피처 신호에 기초하여 하나 이상의 질병 시그니처를 획득하는 단계는, 기침 소리 피처를 하나 이상의 미리훈련된 질병 시그니처 결정 머신 각각에 적용하는 단계를 포함하고, 각각의 상기 결정 머신은, 기침 소리 피처를 특정한 질병 또는 비질병 상태에 대응하는 것으로서 분류하거나 제1 특정한 질병 또는 제1 특정한 질병과는 상이한 제2 특정한 질병에 대응하는 것으로 분류하도록 미리훈련된다.
본 발명의 바람직한 실시예에서, 하나 이상의 질병 시그니처 머신은 각각은, 훈련된 로지스틱 회귀 모델(Logistic Regression Model)(LRM)을 포함한다.
각각의 훈련된 로지스틱 회귀 모델(LRM)은, LRM에 대해 중요하다고 결정된 이용가능한 세트의 훈련 피처들 중의 피처들인 감소된 세트의 훈련 피처들을 이용하여 훈련됨으로써, LRM의 과훈련을 피할 수 있다.
훈련 피처는, 모든 훈련 피처에 대한 평균 p-값을 계산한 다음 임계값 Pmin 미만의 평균 p-값을 갖는 피처를 선택함으로써 LRM에 대한 중요한 것으로 결정될 수 있다. 본 발명의 한 실시예에 따른 이 프로세스의 추가 상세사항은 본 명세서의 부록 F에 개시되어 있다.
이 실시예에서, 각각의 LRM에 대한 독립 변수는 기침 소리 피처의 값이고, LRM으로부터의 출력 값은 제2 특정한 질병을 참조하여 또는 비질병 상태를 참조하여 제1 특정한 질병을 나타내는 기침의 예측 확률을 포함한다.
질병 시그니처는 또한, 호흡기 의학에서 이용되는 특정한 평가 또는 측정 결과와 연관된 스케일을 생성하도록 훈련될 수 있다. 예: 낮은 WSS와 높은 WSS를 분리하도록 시그니처를 훈련함에 의한 천명 심각성 점수(Wheeze Severity Scores)(WSS); 폐활량검사에서 측정된 낮은 FEV1 대 높은 FEV1; 폐활량검사에서 측정된 낮은 FEV1/FVC 대 높은 FEV1/FVC.
본 발명의 또 다른 실시예에서, 하나 이상의 질병 시그니처 머신은 하나 이상의 훈련된 신경망을 포함할 수 있다. 연속 출력을 제공하는 다른 분류기 또는 모델(예를 들어, 일반화된 선형 모델, 은닉된 Markov 모델 등)도 신호 머신으로서 이용할 수 있다.
이 방법은, 기침 피처에 추가하여, 독립 변수로서, 임상 환자 측정치를 질병 시그니처 결정 머신에 적용하는 단계를 더 포함할 수 있다.
본 발명의 한 실시예에서, 기침 세그먼트를 상기 질병들 중 하나 이상을 나타내는 것으로서 간주하도록 하나 이상의 질병 시그니처를 분류하는 단계는, 모든 질병 그룹을 포괄하도록 훈련된 단일 분류기에 하나 이상의 질병 시그니처를 적용하는 단계를 포함한다.
본 발명의 또 다른 실시예에서, 기침 세그먼트를 상기 질병들 중 하나 이상을 나타내는 것으로서 간주하도록 하나 이상의 질병 시그니처를 분류하는 단계는, 관심 질병을 인식하도록 각각이 훈련된 복수의 분류기에 하나 이상의 질병 시그니처를 적용하는 단계를 포함한다.
바람직한 실시예에서, 분류기들 각각은 다음과 같은 질병들 중 하나를 인식하도록 훈련된다: 모세기관지염(SBo); 크루프(SC); 천식/RAD(SA); 폐렴(SP); 하위 기도 질병(SLRTD); 1차 URTI(SU).
바람직하게는, 기침 소리 피처 신호에 기초하여 하나 이상의 질병 시그니처를 획득하는 단계에 의해 d개의 질병 시그니처가 생성되고, 대응적으로 인공 신경망(ANN)은, 하나의 입력 뉴런이 질병 시그니처들 각각에 대응하는 갖는 d-차원 입력 계층을 갖는다.
본 발명의 바람직한 실시예에서, ANN은 k-차원 출력 계층을 가지며, 여기서 출력 계층 내의 각각의 뉴런은 질병에 대응하는 확률을 출력한다.
본 발명의 바람직한 실시예에서, 하나 이상의 질병 시그니처를 분류하는 단계는, 복합 유효 확률 측정치 PQ'를 컴파일하는 복합 유효 확률 측정치 y를 다음과 같이 컴파일하는 단계를 포함한다:
여기서 PQ는 환자가 질병 Q에 속하는 확률의 표시자를 포함하고 PZ는 질병 Z에 대한 것을 포함한다. 따라서, 곱 PQ(1 - PZ)는 환자가 질병 Q에 속하고 질병 Z에 속하지 않는 복합 이벤트의 확률을 나타낸다.
이 방법은 표적 질병들 각각에 대한 기침 지수(cough index)를 계산하는 단계를 포함할 수 있고, 표적 질병에 대한 환자의 기침 지수는, 상기 환자에 대해 분석된 총 기침 횟수에 대한, 표적 질병을 나타내는 것으로서 분류된 환자의 기침의 비율로서 계산된다.
이 방법은, 진단된 특정한 질병에 기초하여, 특정한 요법, 예를 들어 환자에게 효과적인 것으로 알려진 치료를 적용하는 단계를 더 포함할 수 있다.
본 발명의 바람직한 피처, 실시예 및 변형은, 본 기술분야의 통상의 기술자가 본 발명을 수행하기에 충분한 정보를 제공하는 이하의 상세한 설명으로부터 식별될 수 있다. 상세한 설명은 어떠한 방식으로든 선행하는 본 발명의 요약의 범위를 제한하는 것으로 간주되어서는 안된다. 상세한 설명은 다음과 같은 다수의 도면을 참조할 것이다:
도 1은 본 발명의 제1 실시예에 따른 바람직한 진단 방법의 플로차트이다.
도 2는 d-차원 입력 계층(도 B의 시그니처 블록으로부터의 입력)와 k-차원 출력 계층을 갖는 인공 신경망 아키텍처를 도시한다. 출력 계층 내의 각각의 뉴런은 질병 서브그룹에 대응한다.
도 3은 사전 스크리닝 및 사후 스크리닝 처리 블록들을 포함하는 본 발명의 추가 실시예에 따른 진단 방법의 플로차트의 제1 부분이다.
도 4는 도 3의 플로차트의 제2 부분을 포함한다.
도 5는 피처 매핑을 위해 훈련된 자동-인코더 신경망(Auto-Encoder Neural Network)의 블록도이다.
도 6은 질병 특유의 시그니처를 생성하도록 훈련된 시그니처 계층 신경망의 블록도이다.
도 7은 본 발명의 한 실시예에 따른 딥 신경망(Deep Neural Network)의 블록도이다.
도 1은 본 발명의 바람직한 실시예에 따른 방법의 플로차트(100)를 도시한다. 방법(100)은 다음과 같은 4개의 주요 처리 박스 또는 블록을 포함한다: 기침 피처 계산 블록(112), 질병-시그니처 생성(114), 시그니처 선택(116) 및 시그니처 분류기 블록(118). 이들 블록들 각각은, 예를 들어 여기서 설명될 다양한 기능을 구현하도록 구체적으로 프로그래밍된 컴퓨터를 이용함으로써, 장치를 제공하도록 구현될 수 있다. 대안으로서, 다양한 처리 블록은 또한, 맞춤형 전자 집적 회로 칩 및 이산 로직을 이용하여 구현될 수 있다. 더 구체적으로, 분류기 블록(118) 등의 일부 블록은 ANN(Artificial Neural Network)을 구현하고, IBM의 Synapse 칩 또는 Qualcomm의 Zeroth 프로세서 또는 그 균등물 등의, 전용 ANN 집적 회로를 이용하여 구현될 수 있다.
환자(101)로부터 환자 소리(102)가 마이크로폰(104)을 통해 박스(106)에 녹음된다. 오디오 녹음은, 오디오 녹음을 처리하고 이를 자동으로 기침 소리로 세그먼트화하는 기침 식별 및 세그먼트화 블록(108), 예를 들어, CG1(110a) 및 CG2(110b)에 전달된다. 디지털화된 신호, 예를 들어 전자 MP3 파일 세그먼트로 구성된 기침 소리(110a, 110b)는, 기침 피처 계산 블록(114)으로 전송된다. 기침 피처 계산 블록(114)은, 설명되는 바와 같이, 각각의 기침이 다수의 특성규정 피처들 중 각각의 것을 소유하는 정도를 나타내는, 신호 형태의, 예를 들어, 회로 보드 또는 집적 회로 도체 상에서 전송되는 전기 신호 형태의 기침 피처 값을 추출하기 위해 기침 소리 각각을 처리하도록 배열된다. 기침 피처 계산 블록(112)으로부터의 출력 신호는 시그니처 생성 블록(114)에 의해 처리된다. 시그니처 생성 블록(114)은, 각각이 기침 피처 신호를 제1 또는 제2 특정한 질병(또는 질병 그룹)을 나타내는 것으로서 분류하도록 미리훈련된, 복수의 미리훈련된 결정 머신(2a 내지 2n), 바람직하게는 훈련된 로지스틱 회귀 머신을 포함한다. 미리훈련된 결정 머신(2a 내지 2n) 중 하나는 또한, 기침 피처 신호를 특정한 질병을 나타내는 것으로서 또는 정상(즉, 비질병)으로서 분류하도록 훈련되었을 수도 있다.
시그니처 선택 블록(116)은, 질병 시그니처 생성 블록(114)으로부터 출력된 신호를 수신하고, 분류기 블록(118)의 출력에서의 훈련/검증 데이터세트에 관한 최상의 진단 결과를 제공할 시그니처 세트를 출력된 신호로부터 식별하도록 배열된다. 시그니처 선택 블록(116)은 다음과 같이 복수의 요소를 고려하도록 배열된다:
(i) 개개의 시그니처 생성 프로세스에서 양호한 훈련 및 검증 성능을 제공하는 능력,
(ii) 영역-특유의 지식(예를 들어, 최종 분류기의 목표가 천식/RAD를 진단하는 것이라면, 천명은 천식/RAD의 강력한 표시자이므로 WSS 시그니처가 유용할 것으로 예상된다. 분류기가 폐렴을 진단해야 한다면, 임상 실습 등에서 진단 딜레마를 나타내는 것이라고 알려져 있는 이유로 폐렴 대 모세기관지염 시그니처가 표시될 수 있다),
(iii) 시그니처에 관한 검색 프로세스에 기초하여 훈련/검증 세트에 관한 분류기 출력에서의 진단 성능을 최대화.
선택된 시그니처 선택 블록(116)으로부터의 출력 값은, 바람직하게는, 각각이 선택된 시그니처 생성기의 출력을 다수의 미리결정된 질병 중 하나 또는 다른 것으로서 분류하도록 미리훈련된, 복수의 미리훈련된 신경망으로 구성된 분류기 블록(118)에 전달된다.
진단 표시 블록(120)은 분류기 블록(118)에 응답하고, 임상의가 질병 진단을 확인하고 환자에게 적절한 치료를 제공하기 위해 이용될 수 있는 질병 진단에 관한 표시를 제시한다. 출력 박스(120)는, 예를 들어, 시각적 전자 디스플레이 상에서의, 단일 질병 또는 다수의 질병의 진단 표시의 임상의 또는 환자의 다른 보호자에게로의 프리젠테이션을 포함하고, 임상의 또는 환자의 다른 보호자는, 진단된 특정한 질병에 기초하여, 특정한 요법, 예를 들어 환자에게 효과적이라고 알려진 치료를 적용할 수 있다.
이제, 추가의 상세사항이 이하의 논의에서 제공될 것이다.
기침 피처 계산 박스(112)
박스(112)에서, 기침 이벤트를 포함하는 것으로 식별된 환자 기록으로부터의 세그먼트는, PCT/AU2013/000323에 설명된 방식으로 각각의 기침 이벤트로부터 수학적 피처를 추출하도록 배열된 처리 블록에 적용된다.
추가로, 및 본 발명의 바람직한 실시예에 따르면, 기침 피처 계산 블록(112)은 또한, 멜 주파수 셉스트럴 계수들(Mel-Frequency Cepstral Coeffcients)(MFCC) 계수에 의해 야기되는, 고차-스펙트럼-슬라이스에 기초한 셉스트럴 계수를 추출하도록 배열된다. 이 새로운 계수는 본 명세서에서 바이스펙트럼 주파수 셉스트럴 계수들(Bispectral Frequency Cepstral Coefficients)(BFCC)라고 지칭되며, 본 명세서의 부록 B (i)에 추가로 상세히 설명되어 있다.
기침 피처 계산 박스는 이용시 다음과 같은 프로세스를 실행하도록 배열된다:
(i) x는 임의의 기침 이벤트로부터의 이산 시간 소리 신호를 나타낸다고 하자.
(ii) 예를 들어, x를 3개의 동일한 크기의 비중첩 서브세그먼트로 세그먼트화한다. 목표는 단일 기침 내에서 수학적 피처의 변화를 포착하는 것이다. x ix의 i번째 서브세그먼트를 나타낸다고 하고, 여기서 i = 1, 2, 3이다.
각각의 서브세그먼트 x i로부터, 다음과 같은 피처들: 8 바이스펙트럼 계수(Bispectrum coefficients)(BC), 비-가우시안 스코어(Non-Gaussianity score)(NGS), 처음 4개의 포먼트 주파수(formant frequency)(FF), 로그 에너지(LogE), 제로 교차(ZCR), 첨도(Kurt), 31 멜 주파수 셉스트럴 계수들(MFCC), 새논 엔트로피(Shannon Entropy)(ShE)을 계산한다.
(iii) 추가로, 전체 기침 이벤트 데이터를 이용하여 13 웨이블릿 피처를 계산한다 [2]. 각각의 기침 피처의 간단한 설명에 대해, 부록 B를 참조한다.
(iv) 각각의 기침 이벤트로부터 총 Cf = 157개의 피처가 추출된다.
질병 시그니처 생성 박스(114)
PCT/AU2013/000323의 주제인 이전 연구에서, 박스(112)에서 계산된 피처 세트에 관해 로지스틱 회귀 모델을 훈련시킴으로써 환자들이 직접 분류되었다.
PCT/AU2013/000323에서 취해진 접근법과는 대조적으로, 본 발명의 바람직한 실시예는, (a) 진단 프로세스에 영역 특유의 정보를 주입하는 방법으로서, (b) 표준 임상 진단의 주관적 성질을 수용하는 방법으로서, (c) 더 정확한 진단을 생성하는 방식으로서, 몇 가지 목적을 염두에 두고, 여기서는 "시그니처 생성"이라고 지칭되는 생각해 보았던 새로운 절차를 포함한다.
박스(114)에서 실행되는 시그니처 생성은, 기침 피처 계산 블록(112)으로부터의 입력 피처를, 0과 1 사이에서 연속적으로 변하고 분류기가 개개의 질병을 더 잘 진단할 수 있는 공간을 정의하는, 디지털 메모리에서 표현되는, 한 세트의 축에 매핑하는 것을 포함한다. 이들 축 각각을 시그니처라고 한다. 모든 환자는 각각의 축(시그니처)을 따라 반응을 제공하고, 그 다음, 각각의 환자의 각각의 시그니처에 대한 반응 값의 모음은, 분류기 블록(118)에 전송되어 진단 표시 블록(120)에서 프리젠팅되는 진단을 생성한다. 설명될 바와 같이, 축(시그니처)은 영역-특유의 지식을 임베딩한다.
한 실시예에서, 박스(112)로부터 박스(114)로의 입력 피처는 로지스틱 회귀 모델(LRM)을 훈련시킴으로써 시그니처로 변환될 수 있다. 예를 들어, 시그니처 축은, {(모세기관지염 vs 정상), (크루프 vs 정상), (모세기관지염 vs 크루프), (모세기관지염 vs 모든 질병), (크루프 vs A/RAD)… 등} 등의, 모델들의 모음을 훈련시킴으로써 달성될 수 있다. 각각의 모델은 하나의 시그니처를 제공한다. 이용되는 실제 시그니처는 진단을 요구하는 질병 그룹에 의존한다. 시그니처는, (높은 천명 심각성 점수 WSS = 5, 6, 7 대 낮은 천명 심각성 점수 WSS = 0, 1, 2) 등의 모델, 및 맵 임상 징후(예를 들어, 열, 콧물)가 0과 1 사이의 연속 변수에 매핑되는 임상 징후 기반의 모델로 구축될 수 있다. 입력을 연속 결정 변수에 매핑하는 임의의 다른 분류기, 예를 들어, 신경망이, LRM의 대안으로서 시그니처 블록을 생성하는데 이용될 수 있다.
로지스틱 회귀(LR) 모델은 일반화된 선형 모델로서, 수 개의 독립 변수를 이용하여 범주형 이벤트의 확률을 추정한다. 관련 독립 변수는 기침 이벤트로부터 계산된 수학적 피처이고, 범주형 이벤트는 질병 서브그룹이다. 따라서 위의 예에서, 크루프 질병을 참조하여 기침이 모세기관지염 질병에 속할 확률을 예측하도록 LR 모델을 훈련될 수 있다.
회귀 함수를 이용하여 LR 모델이 도출되어 독립 피처가 주어질 때 다음과 같이 확률 Y를 추정한다:
(2)에서, β0은 절편이라고 불리며, β1, β2 등은 피처를 나타내는 독립 변수 q1, q2, … qF의 회귀 계수라고 불린다.
질병 시그니처 생성 블록(114)의 요구되는 LR 모델들(2a, …, 2n)을 생성하기 위해, 취득된 기침 소리를 이용하여 이들을 훈련시키는 것이 필요하다. LRM 모델들(2a, .., 2n)은 관련 환자 서브그룹에 관해 질병 또는 측정 클래스를 올바르게 분류할 수 있는 능력에 따라 훈련된다. 일단 훈련되고 나면, 이들은, 진단을 요구하는 모든 환자에 대해 (0, 1) 사이의 연속 값의 확률 출력 신호를 생성하는데 이용된다.
기침 소리 취득
기침 소리는, Perth, Western Australia에 위치한, 2개의 임상 사이트, JHC(Joondalup Health Campus)와 PMH(Princess Margaret Hospital)에서 녹음되었다. 환자 집단은, 폐렴, 천식/RAD(반응성 기도 질병), 모세기관지염, 크루프 및 상위 기도 감염(URTI) 등의 호흡기 질환으로 의심되는 0-12세 아동을 포함했다. The University of Queensland, Joondalup Health Campus and Princess Margaret Hospital의 인간 윤리 위원회는, 연구 프로토콜과 환자 모집 절차를 승인했다.
(기침, 천명, 숨가쁨, 천음, URTI를 나타내는) 포함 기준을 충족하고 (호흡기 지원을 요구하는, 동의가 없는) 제외 기준을 충족하지 않는 환자가 연구에 모집되었고, 측정 당시 어떠한 호흡기 질병의 증상도 갖지 않은 아동으로서 정의된 건강한 대상자도 역시 모집되었다.
기침 소리는 Apple iPhone 6s를 이용하여 녹음되었다(도 1의 박스(106) 참조). 소리 데이터는 샘플 당 16 비트의 비트 깊이에서 fs = 44.1k 샘플/s의 샘플링 레이트로 녹음되었다. 스마트폰 녹음기는 입으로부터 약 50cm 떨어져 있었고 약 45°의 각도로 배치되었다.
데이터베이스 & 실험 설계
도 1의 장치를 구현하는데 요구되는 다양한 모델을 훈련시키는 이용된 데이터베이스는, 기침 녹음, 및 최종 진단, 임상 검사 결과 및 실험실뿐만 아니라 영상 결과를 포함한 각각의 환자에 관한 상세한 임상 진단 정보로 구성된다. 인구통계 정보는 또한, 환자의 비식별 포맷으로도 이용가능했다.
진단 그룹들(질병 진단에 이용되는 사례 정의는 부록 A에 나와 있다).
정상 그룹(Nr): 측정시 식별할 수 있는 호흡기 질환이 없는 건강한 지원자.
1차 URTI 그룹(U): 측정시 의학적으로 식별할 수 있는 하위 기도 침범 또는 다른 호흡기 질병이 없는, 상위 기도 감염(URTI) 단독만을 갖는 환자.
크루프 그룹(C): 크루프 단독의 또는 URTI의 동반질병을 갖는 진단 분류의 환자.
천식/반응성 기도 질병 그룹(A): 동반질병으로서 URTI가 있거나 없는, 천식 또는 반응성 기도 질병의 진단 분류를 갖는 환자.
임상 폐렴 그룹(P): 동반질병으로서 URTI가 있거나 없는, 임상 폐렴의 진단 분류를 갖는 환자.
모세기관지염 그룹(Bo): 동반질병으로서 URTI가 있거나 없는, 모세기관지염의 진단 분류를 갖는 환자.
기관지염 그룹(Bc): 동반질병으로서 URTI가 있거나 없는, 기관지염의 진단 분류를 갖는 환자.
분류기 모델을 훈련, 검증 및 테스트하기 위해 전체 대상자가 2개의 상호배타적인 세트로 분할되었다. 2개의 상호배타적인 세트는 다음과 같았다: (1) 훈련-검증 세트(TrV), 및 (2) 예비 테스팅 세트(PT). 각각의 대상자는 단 하나의 세트에만 속했다. (임상 팀에 의해 표시된) 진단 불확실성 및 URTI를 제외한 동반질병을 갖는 대상자는 TrV에서 제외되었다.
훈련-검증 세트 TrV는, LOOV(Leave-One-Out-Validation) 또는 K-폴드 교차 검증 기술에 따라 모델을 훈련시키고 검증하는데 이용된다. LOOV 방법은, 한 명을 제외한 모든 환자로부터의 데이터를 이용하여 모델을 훈련시키고 나머지 환자의 기침 이벤트를 이용하여 모델을 검증한다. 이 프로세스는, TrV 내의 각각의 환자가 모델을 정확히 한 번만 검증하는데 이용되도록 체계적으로 반복되었다. K-폴드 교차 검증에서, 원본 샘플은 K개의 동일한 크기의 서브샘플로 무작위로 분할된다. 단일의 서브샘플은, 모델 테스팅을 위한 검증 데이터로서 유지된다. 나머지 (K-1)개의 샘플은 모델을 훈련시키는데 이용될 것이다. 이 프로세스는, TrV 내의 모든 데이터가 모델 테스팅에 한 번씩 이용될 때까지 K회 반복될 것이다. LOOV는 K가 세트 TrV 내의 데이터의 총 수(N)로 설정된 K-폴드 교차 검증 방법의 특별한 경우라는 점에 유의한다.
표 1(오버페이지)은, 도 1의 질병 시그니처 생성 블록(114)에서 훈련된 상이한 LR 모델들 2a, …, 2n을 열거하고 있다.
표 1: LOOV 실시예에서 도 2의 시그니처 블록에서 훈련된 시그니처 생성 모델들의 목록
Figure 112020075101572-pct00003
TrV 데이터세트 내의 데이터는, 표 1에 열거된 모든 LR 모델을 훈련시키고 검증하는데 이용되었다.
가장 간단한 형태에서, 기침-기반의 피처만이 LR 모델을 훈련시키는데 이용된다. 그러나, 발명자들은, 추가 비용없이 최소한의 복잡성으로 LR 모델의 성능을 향상시키는데 이용할 수 있는 몇 가지 단순 임상 측정의 존재를 인식했다. 이를 통해, 발명자들은 단순 임상 피처를 갖춘 기침 기반의 피처를 추가하고 표 1의 제2 세트의 LR 모델 목록을 훈련시켰다. 표 2는 기침 기반의 피처가 추가된 단순 임상 피처를 보여준다.
표 2: 는 모델 설계에서 해당 피처의 포함을 나타낸다. 임상 징후는 임상 검사 동안에 부모에 의해 보고되는 환자 이력으로부터 취해졌다.
Figure 112020075101572-pct00005
피처 선택
피처 선택은 최적의 시그니처 모델을 설계하기 위해 관련 피처를 선택하는 기술이다. 예를 들어, TrV 세트를 이용하여 시그니처로서 LR 모델을 구축하는데 있어서, 각각의 입력 피처에 대해 p-값이 계산되어 특정한 피처가 모델에 대해 얼마나 중요한지를 포착한다. 중요한 피처는 낮은 p-값을 갖는다. LR 모델의 이 속성은 합리적인 피처 조합을 선택하기 위해 전체 TrV 세트에 걸쳐 이용되었다. 일단 중요한 피처의 서브세트가 알려지고 나면, TrV 데이터세트에 관한 LOOV(K-폴드) 훈련/검증에 기초하여 LR 모델을 재훈련하는데 이용되었다. 피처 선택 프로세스의 더욱 상세한 사항은, 앞서 참조된 이전 PCT 출원 및 Abeyratne, U.R., et al., Cough sound analysis can rapidly diagnose childhood pneumonia. Annals of biomedical engineering, 2013. 41(11): p. 2448-2462에서 찾아 볼 수 있다.
양호한 LR 모델 선택
LOOV 훈련/검증 프로세스는 Nk개의 LR 모델을 생성하며, 여기서 Nk는 TrV 세트 내의 환자 수이다. Nk의 값은, TrV 세트 내의 상이한 질병 그룹들 내의 상이한 환자 수로 인해 표 1에 열거된 상이한 LR 모델에 따라 달라질 것이다. Nk개의 LR 모델로부터, k-평균 클러스터링 알고리즘에 기초하여 최상의 모델들 중 하나가 선택되었다. 모델 선택에 대한 k-평균 클러스터링 알고리즘 이용에 관한 더 상세한 사항은 [1]에서 찾아 볼 수 있다.
는 기침 단독 피처를 이용하여 훈련된 LR 모델 j에 기초하여 선택된 시그니처를 나타내고, 는 기침 + 단순 임상 피처를 이용하여 훈련된 선택된 LR 모델을 나타낸다고 하자. 일단 LR 모델이 선택되고 나면, TrV 데이터세트의 모든 환자를 통해 실행되어 질병 시그니처를 생성한다.
이들 시그니처는, 상이한 시그니처 값들을 통해 테스트된 모든 가설과 대조하여 주어진 환자 i의 '반응' 를 제공한다. 벡터 x i는, 모델 에 의해 요구되는, i번째 환자의 기침 소리 및 임상 징후 등의 정보의 모음을 나타낸다.
한 예로서, 테스트중인 환자가 모세기관지염을 앓고 있다면, {모세기관지염 대 다른 모든 질병} 등의 모델에 대조한 환자의 반응은 1('완전한 반응')에 더 가까운 강한 값을 제공해야 하는 반면, {A/RAD 대 다른 모든 질병}은 더 낮은 반응('부분 반응')을 제공해야 한다. 그러나, 환자는 각각의 시그니처 축(LRM 모델)에 대조한 특정한 반응을 제공할 것이고, 각각의 환자 'i'에 대한 이러한 반응의 모음을 나타내는 벡터 는, 환자가 앓고 있는 질병을 특성규정할 것이다.
j = 모든 선택된 시그니처들(LRM 모델들) (3)
j = 모든 선택된 시그니처들(LRM 모델들) (4)
신호 생성기 블록(114)에서 이용가능한 모든 모델 2a, …, 2n이 반드시 최종 시그니처 분류기 블록(118)에서 이용되는 것은 아니라는 점에 유의한다. 시그니처의 선택은 시그니처 선택 블록(116)에서 이루어지며, 시그니처 선택 블록(116)은, 특정한 시그니처가 어떻게 최종 질병 진단 성능뿐만 아니라 시그니처들 사이의 정보 중복성에 기여하는지에 관한 영역-특유의 지식 및 관찰을 고려하도록 배열된다. 표 1 엔트리는 더 큰 모음집으로부터 선택된 이러한 시그니처들의 바람직한 목록을 제공한다.
분류기 블록 118
분류기 블록(118)의 기능은, 신호 생성기 블록(114)에 의해 제공된 시그니처 를 이용하고 특정한 질병 그룹에 속하는 각각의 환자로부터 녹음된 각각의 기침의 가능성을 라벨링하는 것이다. 그 다음, 수 개의 상이한 방법을 이용하여 환자별로 전반적인 진단 결정이 내려진다. 관심 질병 그룹을 포괄하도록 복수의 분류기 블록이 구축되거나 모든 질병 그룹을 포괄하도록 단일 분류기가 구축될 수 있다. 임의의 분류기가 시그니처 분류기 블록(118)에서 이용될 수 있지만, 바람직한 실시예에서, Softmax 인공 신경망 계층(Softmax ANN)이 분류기로서 이용되었다.
도 2는 도 1의 블록(118)에 이용된 soft-max ANN의 전형적인 구조(200)를 도시한다. TrV 데이터세트로부터 ANN 데이터의 훈련 및 검증을 위해 LOOV(또는 K-Fold) 교차 검증 프로세스가 후속하여 이용되었다. soft-max 기능을 이용하는 이점은, 각각의 뉴런의 값이 0과 1 사이이고 출력 계층 내의 모든 뉴런의 합이 1이라는 것이다. 이것은 질병 서브그룹의 확률을 모델링하고 예측하는데 유용한 기능이다. 예를 들어, 질병 Q를 진단하는 모델을 구축하기를 원하고 질병 Z가 혼동되는 (예를 들어, 증상이 일부 중복되는) 질병으로서 나타나는 것이라고 알려진 경우, 다음과 같이 복합 유효 확률 측정치 를 컴파일함으로써 진단 성능이 향상될 수 있다:
여기서 PQ는 환자가 질병 Q에 속하는 확률의 표시자로서 취급될 수 있고 PZ는 질병 Z에 대한 것으로서 취급될 수 있다. 따라서, 곱 PQ(1 - PZ)는 환자가 {질병 Q에 속하고 질병 Z에 속하지 않는} 복합 이벤트의 확률을 나타낸다.
도 2에 도시된 ANN은, 뉴런(203)(입력이 도 1의 시그니처 블록(114)으로부터 수신됨) 및 k-차원 출력 계층(205)으로 구성된 d-차원 입력 계층(201)을 갖는 인공 신경망 아키텍처를 도시한다. 출력 계층(203)의 각각의 뉴런(207)은 질병 서브그룹에 대응한다.
본 발명의 바람직한 실시예에서, 5개의 상이한 soft-max ANN 모델이 질병 서브그룹: 모세기관지염, 크루프, 천식/RAD, 폐렴 및 하위 기도 질병(LRTD)을 식별하도록 훈련되었다. 이들 질병 특유의 soft-max ANN의 상세사항이 이하에서 제공된다.
1. 모세기관지염(S Bo )에 대한 Soft-max ANN : 이 soft-max ANN 모델에서는 모세기관지염 중심의 시그니처가 이용되었다. ANN을 훈련시키는데 이용된 시그너토리(signatory) LR 모델은 이었다. 출력 계층에서 k의 차원은, 각각의 뉴런이 하나의 질병 서브그룹, 모세기관지염, 천식/RAD, 폐렴, 기관지염, pURTI, 크루프에 대응하도록 하여 6개의 뉴런으로 설정되었다. 수학식 (5)에서, PQ는 모세기관지염 뉴런의 출력이고 PZ는 RAD 뉴런의 출력이다.
2. 크루프(S C )에 대한 Soft-max ANN : 이 ANN 모델에서는 크루프 중심의 시그니처가 이용되었다. 이용된 시그너토리 LR 모델은 이었다. 출력 계층에서 k의 차원은, 각각의 뉴런이 하나의 질병 서브그룹, 모세기관지염, 천식/RAD, 폐렴, 기관지염, pURTI, 크루프에 대응하도록 하여 6개의 뉴런으로 설정되었다. 수학식 (5)에서, PQ는 크루프 뉴런의 출력이고 PZ는 pURTI 뉴런의 출력이다.
3. 천식/RAD(S A )의 soft-max ANN: 이 ANN 모델에서는 천식/RAD 중심의 시그니처가 이용되었다. 이용된 시그너토리 LR 모델은 이었다. 출력 계층에서 k의 차원은, 각각의 뉴런이 하나의 질병 서브그룹, 모세기관지염, 천식/RAD, 폐렴, 기관지염, pURTI, 크루프에 대응하도록 하여 6개의 뉴런으로 설정되었다. 수학식 (5)에서, PQ는 천식/RAD 뉴런의 출력이고 PZ는 pURTI 뉴런의 출력이다.
4. 폐렴(S P )에 대한 soft-max ANN: 폐렴, soft-max ANN 모델에서, 이용된 시그너토리 LR 모델은 이었다. 출력 계층에서 k의 차원은, 모세기관지염, 폐렴 & 크루프에 대해 각각 하나의 뉴런이 대응하고, 질병 천식/RAD, 기관지염, pURTI에 대해 하나의 뉴런이 대응하도록 하여 4개의 뉴런으로 설정되었다. 수학식 (5)에서, PQ는 폐렴 뉴런의 출력이고, PZ는 천식/RAD, 기관지염, pURTI 질병에 대한 뉴런의 출력이다.
5. 하위 기도 질병(S LRTD )에 대한 soft-max ANN: 하위 기도 질병(LRTD)은 하위 기도 침범을 갖는 질병을 나타내는데 이용되는 포괄적인 용어이다. LRTD 서브그룹은, 폐렴, 천식/RAD, 모세기관지염 및 기관지염 질병으로부터의 환자들을 조합하였다. LRTD soft-ANN 모델은, 크루프 및 pURTI로부터 LRTD 질병을 식별하도록 훈련되었다. 이 ANN에서 LRTD 중심의 시그니처가 이용되었다. 이용된 시그너토리 LR 모델은 이었다. 출력 계층에서 k의 차원은, URTI & 크루프에 대해 각각 하나의 뉴런이 대응하고, LRTD 질병 그룹에 대해 하나의 뉴런이 대응하도록 하여 3개의 뉴런으로 설정되었다. 수학식 (5)에서, PQ는 LRTD 뉴런의 출력이고 PZ는 pURTI에 대한 뉴런의 출력이다.
6. 1차 URTI(S U )에 대한 soft-max ANN: 이 ANN 모델에서는 pURTI 중심의 시그니처가 이용되었다. 이용된 시그너토리 LR 모델은 이었다. 출력 계층에서 k의 차원은, 각각의 뉴런이 하나의 질병 서브그룹, 모세기관지염, 천식/RAD, 폐렴, 기관지염, pURTI, 크루프에 대응하도록 하여 6개의 뉴런으로 설정되었다. 수학식 (5)에서, PQ는 pURTI 뉴런의 출력이고 PZ는 폐렴 뉴런의 출력이다.
기침 훈련을 위해 기침 피처만 이용하여 개발된 soft-max ANN LR 시그니처 모델만 이용되었다. 기침 + 단순 임상 피처 훈련을 위해, 기침 피처 단독 및/또는 기침 + 단순 임상 피처를 이용하여 개발된 soft-max ANN LR 시그니처 모델이 이용되었다.
선호하는 Soft-Max ANN 모델 선택
LOOV 교차-검증 프로세스는 N개의 soft-max 모델을 생성할 것이다. 여기서 N은 TrV 데이터세트 내의 환자 수이다. N개의 모델로부터, 발명자들은 k-평균 클러스터링 알고리즘에 따라 다시 한번 최상의 모델들 중 하나를 선택했다. 모델 선택에 대한 k-평균 클러스터링 알고리즘 이용에 관한 더 상세한 사항은 [1]에서 찾아 볼 수 있다. Ss는 선택된 soft-max ANN을 나타내고 λs는 특정한 질병 서브그룹에 대한 대응하는 확률 결정 임계값이라고 하자. 일단 Ss가 선택되고 나면, 모델의 모든 파라미터를 고정하고 훈련 프로세스를 완전히 종료한다. 그 다음, 모델 Ss는 추가 테스팅을 위한 최상의 모델로서 이용된다. K-폴드 교차 검증 접근법에도 유사한 접근법이 이용되었다.
softmax ANN을 훈련시키는데 있어서 발명자들이 조사한 다른 요소는, 망 크기, 훈련 시기, 훈련 속도, 중단 기준 및 훈련 오류와 검증 오류 사이의 차이이다. 이들 요소들은, 우리가 접근한 데이터세트에 대한 과도학습을 최소화하고 통계적으로 유사한 이전에는 볼 수 없었던 집단에 대한 일반화를 최대화하기 위한 관점에서 조사되었다.
이하에서는, 각각의 환자에 관한 진단 결정에 도달하기 위해 이용된 방법론의 몇 가지 바람직한 실시예를 설명한다.
i) 기침 지수 및 환자 기반의 분류
이 접근법에서는 분류기(예를 들어, softmax ANN)의 출력(예를 들어, PQ, PZ 등)이 직접적으로 또는 등의 확률 복합형 측정치가 처리되었다. 제1 목표는, 표적 질병 클래스(예를 들어, 모세기관지염)와 대조하여 환자가 제공한 각각의 기침을 테스트하고 각각의 기침을 '성공 = 1' 또는 '실패 = 0'으로 라벨링하는 것이다. 예를 들어, 최종 목표가 모세기관지염에 대해 테스트하는 것이라면, 각각의 기침은, 모세기관지염(성공, 라벨 1로 표시) 또는 비-모세기관지염(실패, 라벨 0으로 표시)으로 라벨링되었다. 최적의 결정 임계값 λ(즉, 테스트 통계가 ≥ λ이면 테스트중인 기침이 표적 질병(성공, 1)에 속함)을 선택하기 위해 TrV 세트에 관해 ROC(Receiver-Operating Curve) 분석이 이용되었다.
각각의 표적 질병에 대해 다음과 같이 기침 지수가 계산되었다.
CT를 환자 i로부터 분석된 총 기침 수라 하고, CS를 soft-max ANN 모델에 의해 '성공'으로서 라벨링된 기침 수라고 하자. 그러면, 표적 질병 서브그룹 j에 대한 환자 i의 기침 지수 는 다음과 같이 계산된다: .
ii). 딥 러닝 전략에 기초한 분류
(0과 1 사이에서 연속적으로 변하는 실수인) softmax 계층의 원시 출력은 딥 러닝 접근법의 정신에서 추가로 처리될 수 있다. 일부 바람직한 실시예가 아래에 제공된다:
a) 블록(1183)의 Softmax ANN의 원시 출력은, 상이한 이론으로 훈련된 다른 유사한 망으로부터 입력을 동시에 수신할 신경망 등의 또 다른 분류기에 공급될 수 있다. 예를 들어, 다른 망은, 전적으로, 부모가 용이하게 관찰하고 임상의에게 보고할 수 있는 임상 징후에 기초할 수 있다. 임상-징후 망은, 도 1의 질병 시그니처 생성 블록(114)과 병렬의 아키텍처, 또는 임상 징후를 원하는 질병 그룹에 매핑하는 한 세트의 선택된 LRM 분류기(또는 ANN 분류기 등)의 세트 등의 더 간단한 버전을 가질 수 있다.
b) 도 1의 블록(114)의 LRM 기반의 시그니처 생성기 모델(2a, …, 2n)은, 전체 망을 ANN 기반화하거나, 딥 러닝 망의 이론을 따르게 하는 ANN 계층 등의 다른 분류기로 대체될 수 있다. 발명자들은 이러한 모델을 구축하고 테스트했다. 임상-징후 모델은 상기와 같이 통합될 수 있다.
한 바람직한 실시예에서, 발명자들은 인코더 접근법을 이용하여 딥 신경망(deep neural network)을 훈련시켰다. 최종 분류기 자체는, 하나의 뉴런이 관심 질병 클래스들 각각을 나타내는 신경망이었다.
D. 프로세스 테스트
이 섹션에서는 예비 데이터세트에 관한 최종 진단 모델의 성능을 조사한다. 예비 데이터세트를 이용하기 전에 우리는 진단 모델을 완전히 정지시키고 더 이상의 훈련이나 파라미터 조정 또는 프로토콜 변경은 허용되지 않았다.
결과
A. 데이터세트
표 3은 이 연구에 이용된 대상자 집단의 상세사항을 개시한다. 이 작업을 위해, 우리는 모델을 개발, 검증 및 테스트하기 위해 총 N = 1151 명의 대상자(982명의 환자와 169명의 정상인)의 기침 소리 데이터를 이용했다. 이들 환자들은, 2개의 비중첩 데이터세트, (1) 훈련-검증 세트(TrV), 및 (2) 예비 테스팅 세트(PT)로 분리되었다. 병원에 제출하는 순서에 기초하여 환자들은 각각의 세트에 배정되었다.
표 3: 연구에 이용된 총 대상자 집단의 상세사항
Figure 112020075101572-pct00029
훈련-검증 데이터세트: 모델 훈련 및 검증을 위해, 우리는 2개의 사이트로부터 총 1011명의 대상자(852명의 환자 및 159명의 정상인)을 모집한 후 데이터세트를 동결했다; 환자 600명 및 정상인 134명
예비 테스팅 데이터세트: 기록 사이트 JHC로부터의 총 130명의 환자와 10명의 정상 대상자 기록(JHC로부터 9 명, PMH로부터 1명)이 있었다.
임상 판정에 따라 및 임상 팀과의 협의에 따라, 데이터세트 내의 대상자들은 다양한 진단 서브그룹으로 분류되었다: 정상 그룹(Nr), 1차 URTI 그룹(U), 크루프 그룹(C), 천식/반응성 기도 질병 그룹(A), 임상 폐렴 그룹(P), 모세기관지염 그룹(BO), 기관지염 그룹(BC).
B. 훈련-검증 데이터세트에 관한 시그니처 모델의 성능.
1011명의 대상자 중 725명의 대상자(602명의 환자, 123 명의 정상 대상자)가 최종적으로 모델 훈련 및 검증에 이용되었다.
표 4: 진단 질병 서브그룹들
Figure 112020075101572-pct00030
표 4는 훈련-검증 모델에 이용된 각각의 질병 서브그룹 내의 환자 수를 보여준다.
정상 대 질병에 대한 LR 모델: 처음에 우리는 정상 대상자와 임의의 질병 서브그룹 대상자의 기침을 분류하는데 있어서 LR 시그너토리 모델의 성능을 조사했다. 표 5는 이 조사의 leave-one-out 검증 결과를 보여준다.
표 5: 시그너토리 LR 모델을 이용하여 질병 기침으로부터 정상 기침을 분류하는데 있어서 leave-one-out 검증 결과.
Figure 112020075101572-pct00031
표 5로부터, 피처 선택 후 모든 LR 모델은 정상 기침을 질병 기침과 매우 높은 정확도로 분리할 수 있었다는 것을 알 수 있다.
질병 서브그룹들 사이의 LR 모델: 우리의 다음 목표는 2개의 상이한 질병 그룹으로부터 기침을 분류하는데 있어서 LR 시그너토리 모델의 성능을 조사하는 것이다. 이 조사는 LR 모델이 질병의 시그니처를 얼마나 잘 포착했는지를 결정하는 것을 보조할 것이다. 표 6(A)는 모든 피처가 모델 훈련에 이용될 때 이 조사에 대한 leave-one-out 검증 결과를 나타낸다.
표 6(A): 모든 피처가 모델 훈련에 이용될 때 시그너토리 LR 모델의 leave-one-out 검증 성능.
Figure 112020075101572-pct00032
그리고, 표 6(B) - 오버페이지 - 피처 선택 이후의 결과를 나타낸다.
표 6(B): 선택된 피처가 모델 훈련에 이용될 때 시그너토리 LR 모델의 leave-one-out 검증 성능.
Figure 112020075101572-pct00033
표 6(B)에 따르면, 피처 선택 후, 대부분의 LR 시그너토리 모델은 2개의 클래스로부터의 기침들을 분리할 때 중간 정도 내지 높은 정확도(70-90%)를 달성했다. 임의의 다른 질병이나 질병 그룹으로부터 크루프 또는 모세기관지염 기침을 식별하는데 있어서 가장 높은 정확도가 달성된다. 가장 덜 정확한 LR 시그너토리 모델은, 폐렴 대 기관지염, 및 기관지염 대 pURTI(정확도 ~ 65%)였다.
C. 훈련-검증 데이터세트에 관한 soft-max 모델들의 성능
표 7(A): 모든 피처가 모델 훈련에 이용될 때 시그너토리 LR 모델의 leave-one-out 검증 성능.
Figure 112020075101572-pct00034
섹션 3(B)로부터의 결과는, LR-시그너토리 모델이 질병 특유의 시그니처를 포착하는데 상당히 성공적임을 나타냈다. 섹션 2(C) 단계 3에서 이들 시그니처를 이용하여 표적 질병 기침을 다른 질병으로부터 분리하도록 soft-max 신경망 모델을 훈련시켰다. 그 다음, 기침 지수를 이용하고 최적의 임계값을 적용하여 환자 레벨에서 우리의 궁극적 목표인 질병 분류를 달성했다.
표 7(B)는 Soft-max ANN 모델을 이용하여 하나의 질병을 나머지로부터 분리하는 leave-one-out 검증 결과를 보여준다. 이들 결과에 따르면, 폐렴을 제외한 모든 모델은 매우 높은 민감도(sensitivity)와 특이도(specificity)로 표적 질병을 예측할 수 있다. (기침 + 단순 임상 징후 모델 이용하여) 100% 민감도 및 96% 특이도로 및 (기침 단독 모델의 경우) 95% 민감도 및 92% 특이도로 크루프 모델에 대해 최상의 검증 결과가 획득된다. 두 번째로 최상의 결과는, 모세기관지염 모델과 이에 후속되는 1차 URTI, 천식 및 LRTD 모델들에 대한 것이다. 기침 + 단순 임상 피처로 훈련된 모든 모델의 경우, 기침 단독 피처를 이용하여 훈련된 모델보다 분명히 성능이 뛰어났다.
표 7(B): soft-max ANN 모델들을 이용하여 환자를 분류하기 위한 leave-one-out 검증 결과들
Figure 112020075101572-pct00035
leave-one-out 교차-검증 프로세스는 N개의 soft-max 모델을 생성할 것이다. 여기서 N은 TrV 데이터세트 내의 환자 수이다. N개의 모델로부터, 우리는, k-평균 클러스터링 알고리즘에 따라 다시 한번 최상의 모델들 중 하나를 선택했다. 표 8은 선택된 ANN 모델의 성능을 보여준다.
표 8: 훈련-검증 데이터세트에 관한 선택된 soft-max ANN 모델들의 성능
Figure 112020075101572-pct00036
표 7(B) 및 표 8로부터, 크루프, 모세기관지염, URTI 및 천식 모델은 모두 매우 민감하고 동시에 특이적임을 관찰할 수 있었다. 반면, 폐렴 모델은 높은 민감도와 중간 정도의 특이도를 가지고 있다. 따라서, 폐렴 모델 내의 다른 질병 모델을 사후 스크리너로 이용하여 거짓 양성 사례를 걸러내고 특이도를 향상시킬 수 있다고 가정한다. 이 가설을 테스트하기 위해, 폐렴 모델에서 사후 스크리너로서 천식, 1차 URTI, 크루프 및 모세기관지염 모델을 순차적으로 적용했다. 진정한 양성의 폐렴 사례가 다른 질병으로서 걸러내어지는 것을 피하기 위해, 스크리닝 모델의 기침 지수에 적용되는 임계값을 이용했다. 이 임계값은, 대상자가 폐렴이 아님을 스크리닝 모델이 얼마나 확실하게 나타내고 있는지를 표시한다. 스크리닝 임계값이 훈련-검증 데이터세트를 이용하여 최적화되었다.
표 9: 사후 스크리너를 적용한 후의 soft-max 폐렴 모델의 결과들.
Figure 112020075101572-pct00037
표 9(위)는, 상이한 질병 사후 스크리너들을 폐렴 모델에 순차적으로 적용한 결과를 보여준다. 민감도에서의 작은 손실과 함께, ANN 폐렴 모델의 특이도에서의 큰 이득이 달성된다는 것을 알 수 있다. 민감도 손실은 기침 단독 모델의 경우 -9%, 기침 + 단순 임상 피처 모델의 경우 -4%였다. 특이도 증가는 기침 단독 모델의 경우 18%, 기침 + 단순 임상 피처 모델의 경우 16%였다. 본질적이진 아닐지라도, 사후 스크리너 및 사전 스크리너는 본 발명의 실시예에서 사용될 수 있다.
폐렴 모델에 관한 사후 스크리너의 긍정적인 효과에 힘입어, 우리는 다른 질병 모델에 대한 그들의 적용을 조사했다. 우리의 분석은, 크루프 스크리너를 이용함으로써 모세기관지염과 LRTD 모델 특이도 성능이 1 내지 3% 향상될 수 있다는 것을 나타냈다. 천식 및 1차 URTI 모델에서는 성능 향상이 보이지 않는다. 크루프 모델 성능은 이미 매우 높기 때문에, 어떠한 스크리너도 시도되지 않는다. 표 10은 이 조사의 결과를 보여준다.
표 10: 사후 스크리너들을 다른 질병 모델들에 적용한 결과들.
Figure 112020075101572-pct00038
D. 예비 테스팅 데이터세트에서 soft-max 모델의 성능
도 3은, 모든 훈련이 종료되고 모든 파라미터가 고정되고 선택된 모델이 예비 테스팅을 위해 준비가 된 이후의 진단 알고리즘의 플로차트(300)를 도시한다. 이들 모델은 훈련-검증 데이터세트와는 완전히 독립적인 예상 데이터세트에 관해 테스트되었다. 폐렴을 제외한 모든 모델은 표적 질병을 예측하는데 있어서 높은 정확도를 달성했다. 모든 모델 중에서 크루프와 모세기관지염은, 모든 예비 연구 목록들에 걸쳐, 및 기침 단독과 기침 + 단순 임상 피처 모델 양쪽 모두에 대해 86% - 100% 범위에서 최상의 민감도와 특이도를 달성하는 것으로 드러났다. 천식/RAD 모델의 성능은 기침 단독 피처에서 보통이었지만, 기침 피처에 단순 임상 피처를 추가하면 상당히 향상되었다(민감도 ~93% 및 특이도 ~90 %). 사전 스크리너 및 사후 스크리너 블록에 관한 상세사항은 부록 E를 참조한다.
1. 부록 A
1. 임상 폐렴
미국 임상 폐렴 사례 정의 - JHC & PMH로부터의 데이터세트를 라벨링하는데 이용
2. WHO 방사선 1차 말단 지점 폐렴(PEP)
US WHO 방사선 폐렴 사례 정의 - JHC & PMH로부터의 X-선 데이터세트를 라벨링하는데 이용
3. 크루프
미국 임상 크루프 사례 정의 - JHC & PMH로부터의 데이터세트를 라벨링하는데 이용
4. 모세기관지염
미국 모세기관지염 사례 정의 - JHC & PMH로부터의 데이터세트를 라벨링하는데 이용
5. 천식(A)/반응성 기도 질병(RAD) ―A/RAD
미국 A/RAD 사례 정의 - JHC & PMH로부터의 데이터세트를 라벨링하는데 이용
6. 기관지염
미국 기관지염 사례 정의 - JHC & PMH로부터의 데이터세트를 라벨링하는데 이용
7. 상위 기도 감염
미국 URTI 사례 정의 - JHC & PMH로부터의 데이터세트를 라벨링하는데 이용
8. 하위 기도 질병(LRTD)
미국 LRTD 사례 정의 - JHC & PMH로부터의 데이터세트를 라벨링하는데 이용
2. 부록 B
기침으로부터의 피처 계산
기침 피처
우리의 방법은 기침 소리로부터 다수의 수학적 피처의 계산을 요구한다. 이 섹션에서는, 녹음된 기침 소리 x의 각각의 서브세그먼트 xi, i = 1, 2, 3으로부터 계산한 피처를 설명한다.
i) 바이스펙트럼 주파수 셉스트럴 계수들(BFCC, 총 24개의 피처; 기침 세그먼트의 각각의 부분으로부터의 8개) - 신호의 3차 스펙트럼은 바이스펙트럼이라고 알려져 있다[3]. 전력 스펙트럼(자기상관에 기초한 2차 스펙트럼)과는 달리, 바이스펙트럼은 푸리에(Fourier) 위상 정보를 보존한다. xi 세그먼트의 바이스펙트럼 은 (6)으로부터 다음과 같이 추정될 수 있다,
여기서, 는, 본 문서에서 이용된 최소 바이스펙트럼-편향 상한 윈도우 등의 바이스펙트럼 윈도우 함수이고, 는 (2)로 추정된 xi의 3차 누적량이며, ω1, ω2는 디지털 주파수를 나타낸다.
(7)에서, Q는 고려된 3차 상관 래그의 길이이고, xi는 제로-평균 신호이다.
바이스펙트럼은 2D 신호이다. 그러나, 선형 신호의 경우, 축에 평행한 슬라이스 이외의 바이스펙트럼의 임의의 1D 비스듬한 슬라이스: ω1 = 0, ω2 = 0 및 ω1 + ω2 = 0은, 위상 계수(phase factor) 내에서 전체 2D 바이스펙트럼을 특성규정하기에 충분한 정보를 운반한다는 것이 증명될 수 있다. 이 작업에서, 우리는, ω1 = ω2 = ω, 즉, 에 의해 정의된 대각선 슬라이스 P(ω)를 통해 바이스펙트럼에서 이용가능한 정보를 포착한다.
그 다음, 대각선 슬라이스 P(ω)에 필터 연산자를 적용하여, 우리는 (8)을 이용해 바이스펙트럼 주파수 셉스트럴 계수를 계산했다.
(8)에서, 는 그 하위 및 상위 컷오프 주파수로서 를 갖는 필터 연산자를 나타내고, 는 필터의 이득 상수이다. (8)에서 는, 삼각형 필터, 직사각형 필터, 사다리꼴 필터 또는 더 복잡한 형상의 필터일 수 있다. 이 문서의 작업을 위해, 우리는 인 직사각형 필터를 이용했고 표 11에 도시된 바와 같은 다음과 같은 값을 이용하여 8개의 BFCC 계수를 계산했다.
표 11: BFCC를 계산하기 위해 수학식 (8)에서 이용된 필터 하위 및 상위 컷오프 값들
Figure 112020075101572-pct00054
ii) 비-가우시안 점수(NGS, 기침 세그먼트의 각각의 부분으로부터의 1개씩 총 3개의 피처) - NGS 점수는 데이터 xi의 주어진 데이터 세그먼트의 비-가우시안 모형의 수치 측정값이다. 한 세트의 데이터의 가우시안 모형의 시각적 측정값을 획득하기 위해 정규 확률 플롯이 이용될 수 있고, NGS 점수는 회귀 분석에 기초하여 비-가우시안 모형을 정량화하는 방법이다. 우리는 NGS 점수를 추정하기 위해 (9)를 이용했고, 여기서 p와 q는 기준 정규 데이터 및 분석된 데이터(xi)의 정규 확률 플롯을 나타낸다. 심볼 N은 확률 플롯에서 이용되는 데이터 포인트의 수이다.
iii) 포먼트 주파수(기침 세그먼트의 각각의 부분으로부터 4개씩 총 12개의 피처) - 음성 분석에서, 포먼트 주파수(FF)는 성대의 공명이라고 지칭된다. 기침 분석에서, 기침 소리의 생성에 기여하는 전체 기도의 공명이 포먼트 구조로 표현될 것이라고 예상하는 것은 합리적이다. 이에 대한 한 가지 고전적인 예는 천명이다. 점액의 존재는 또한, 기도의 음향 속성을 변화시킬 수 있다. 우리는, 처음 4개의 포먼트(F1, F2, F3, F4)를 우리의 후보 피처 세트에 포함시켰다. 우리는, 기침 세그먼트 xi의 LPC(Linear Predictive Coding) 스펙트럼을 피크 선택함으로써 F1-F4를 계산했다. 이 작업을 위해, 우리는 Levinson-Durbin 재귀 절차를 통해 결정된 파라미터들을 갖는 14차 LPC 모델을 이용했다.
iv) 로그 에너지(LogE, 기침 세그먼트의 각각의 부분으로부터 1개씩 총 3개의 피처) - 모든 서브세그먼트 xi에 대한 로그 에너지가 (10)을 이용하여 계산되었다.
(4)에서, ε는 0의 로그의 우연한 계산을 방지하기 위해 추가된 임의의 작은 양의 상수이다.
v) 제로 교차(Zcr, 기침 세그먼트의 각각의 부분으로부터 1개씩 총 3개의 피처) - 제로 교차의 횟수가 각각의 서브세그먼트 xi에 대해 카운트되었다.
vi) 첨도(Kurt, 기침 세그먼트의 각각의 부분으로부터 1개씩 총 3개의 피처) - 첨도는 xi의 확률 밀도 분포가 얼마나 뾰족한지(peaky)의 측정값이다. 이것은 xi의 4번째 중심 모멘트이고, (11)을 이용하여 계산할 수 있다, 여기서 μ와 σ는 각각 xi의 평균 및 표준 편차를 나타낸다.
vii) 멜 주파수 셉스트럴 계수들(MFCC, 기침 세그먼트의 각각의 부분으로부터 31개씩 총 93개의 피처) - MFCC는 음성 인식 시스템에서 널리 이용되어 왔다. MFCC는 음성 신호에서 비언어적 분산(variance) 소스에 소정의 복원력을 제공한다. 이들은 또한 분류기의 훈련을 용이화하는 직교 피처도 제공한다. MFCC의 계산에는, 단기 전력 스펙트럼의 추정, Mel 주파수 스케일로의 매핑 및 그 다음의 셉스트럴 계수 계산이 포함된다. 우리의 작업에서, 우리는 31개의 MFCC 계수를 우리의 피처 세트에 포함시켰다.
viii) 새논 엔트로피(ShE, 기침 세그먼트의 각각의 부분으로부터 1개씩 총 3개의 피처): 기침 소리는 기도의 다양한 하위 구조로부터의 기여분을 나타내는 복합 신호이다. 이들 성분들 중 일부는 의사-주기적 구조를 나타내는 반면, 다른 것들은 무작위 스토케스틱 특성을 갖는다. 이 작업에서, 우리는 이들 피처를 포착하기 위해 새논 엔트로피를 계산했다. 모든 서브세그먼트 xi의 새논 엔트로피(ShE)는 (12)를 이용하여 계산되었다.
ix) 웨이블릿 피처(WvL, 각각의 기침으로부터의 총 13개의 피처): 우리의 이전 연구는, 폐렴 진단에서 기침 소리로부터의 웨이블릿 피처의 유용성을 보여주었다 [ieee trans paper 참조]. 이 작업을 위해, 우리는 각각의 기침 세그먼트로부터 13개의 웨이블릿 피처를 계산했다. 상세사항은 [2]를 참조한다.
3. 부록 C
1. 천명 시그니처 생성기
아동의 천명은 많은 호흡기 질병의 일반적인 증상이다. 천명은 호흡 동안에 생성된 하이-피치의(high-pitched) 휘파람 소리로서 정의된다. 천명은 천식과 가장 흔하게 연관되지만, 모세기관지염, 기관지염, 폐렴, 낭포성 섬유증 및 이물질 흡인 등의 다른 호흡기 질병에도 존재한다. 이것은 종종 감별 진단(differential diagnosis) 및 상위 기도 감염으로부터 하위 기도 질병을 분리하는데 이용된다. 상세사항은 부록 A: 사례 정의에서 이용가능하다.
천명의 존재 여부는 임상 커뮤니티가 실시하는 임상 의사 결정 트리에서의 핵심 결정 노드이다. 그러나, 임상적으로 이를 검출하는 것이 항상 간단한 작업은 아니다. 천명은 기질 현상(temperamental phenomenon)이며, 생리/병리에서의 근본적인 변화에 따른 2차 효과이다. 의사가 특정한 검사 시간에 천명을 검출하는 능력은, 그 시점에서의 천명의 존재, 및 임상의가 폐 위의 올바른 지점에 청진기를 두는 것, 천명음이 폐로부터 몸통 표면으로 전파되는 동안의 에너지 손실을 견뎌내기에 충분히 강한 강도로 발생하는 것, 임상의가 그 소리를 인지하고 이를 검출하는 기술을 보유하는 것을 포함한, 많은 요인에 의존한다. 관심대상이 되는 기저 생리학적 이유는, 다양한 이유로 인해 기도가 좁아지고 천명음이 이러한 현상의 대리 척도가 된다는 것이다. 어떤 상황에서는, 심각한 질병이더라도 질병의 심각성으로 인한 기류 제한 때문에 천명이 발생하지 않을 수 있다(예를 들어, 중증 천식/RAD에서의 "조용한 흉부(silent chest)").
천명의 심각도를 포착하기 위해, 임상의는 많은 상이한 버전의 천명 심각도 점수(Wheeze Severity Scores)(WSS)를 정의했다. 우리의 임상 협력자들의 버전은 WSS를 계산하기 위해 3개의 상이한 하위점수(subscore)를 이용한다. 이들은: 천명의 존재와 천명이 발생하는 호흡의 국면, 호흡 속도, 보조 근육 이용이다. 우리는, 기침만을 이용하여 또는 부모가 관찰할 수 있는 간단한 징후로 증강하여 WSS를 포착할 수 있는 하나의 시그니처를 개발했다. 우리의 WSS 모델은, 0과 1 사이에서 변하는 연속 시그니처 스케일(LRM 출력)을 이용하여 낮은 WSS 점수(0, 1)로부터 높은 WSS(5-9)를 분리하는 목표에 관해 훈련되었다.
2. 폐 기능 시그니처 생성기
폐 기능 실험실 기술, 특히 폐활량검사는, 이용가능한 경우 천식 및 만성 폐쇄성 폐 질병(COPD) 등의 일부 호흡기 질병의 결정적인 진단에 이용된다. 폐활량검사는 FEV1 및 FVC 등의 수치 측정을 제공한다. 폐활량검사시 수집된 기침을 이용하여, 우리는, 높은 FEV1 대 낮은 FEV1, 높은 FEV1/FVC 대 낮은 FEV1/FVC 등의, 기침-기반의 시그니처 모델을 구축했다. 일단 훈련되고 나면, 모든 환자에 관해 (0, 1) 사이의 출력을 제공하는 시그니처 생성기로서 이용된다.
4. 부록 D
임상 징후-기반의 시그니처 및 진단 모델
임상의는, 일부 호흡기 질병을 진단할 때 (관찰했거나 부모가 보고한) 임상 징후에 크게 의존한다. 이전에는 우리는 임상 징후에만 기초하여 폐렴(인도네시안 연구)을 진단하기 위해 최상의 임상 피처를 식별하도록 모델을 조사하고 구축했다. 우리는 또한, 적은 수의 기침을 임상 징후 모델에 추가할 때 어떤 일이 발생하는지를 조사했다.
우리는 도 B에 표시된 아키텍처에 따라 호흡기 질병을 진단하기 위해 (부모가 보고할 수 있는 징후를 이용한) 임상 징후-단독 모델을 구축했다. 특정한 실시예에서, 열, 천명, 콧물 및 연령, 성별 등의 징후가, LRM 모델링에 기초하여 시그니처를 구축하는데 이용된다. LRM 모델은 범주형 징후를 시그니처 생성기 레벨에서의 연속 출력으로 변환하고, 이것은, 그 다음, 분류기 블록 레벨에서 분류된다. 다른 실시예에서, ANN 등의 다른 분류기 방식이 동일한 목적에 이용될 수 있다. 우리는 또한, 인도네시안 연구에 관해 출원된 임상 징후 특허에서 우리가 했던 바와 같이, 임상 징후 모델에 기침을 추가하여 성능을 향상시킬 수 있다. 또한, 우리는, 딥 러닝 접근법을 이용해 분류를 향상시키기 위해 임상-징후 시그니처를 이용할 수 있다.
신경 딥 러닝 아키텍처(Neural Deep Learning Architecture)를 설계하는 프로세스는 지금 논의되는 2개의 스테이지로 분할된다:
스테이지 1 - 계층별 훈련 - 제1 스테이지에서, 우리는 특정한 작업을 하기 위해 3가지 유형의 신경망을 개별적으로 훈련시켰다.
스테이지 1 - 신경망 유형 1. 피처 인코딩 신경망(FeNN): 여기서 우리는 자동-인코더의 개념을 구현한다. 자동-인코더는 출력에서 그 입력을 재생하도록 훈련된 피드포워드 신경망이다 [1]. 자동-인코더 내의 은닉된 계층은 입력 데이터를 나타내는데 이용될 수 있는 코드를 기호화한다. 훈련 후, 인코더 스테이지 출력이 다음 단계에서 이용된다. 도 5는 피처 매핑을 위해 훈련된 자동-인코더의 예를 도시한다. 이것은 입력 피처 벡터의 크기를 나타내는 입력 크기 144를 가지며, 은닉된 계층(인코더) 크기는 10이고 출력 계층(디코더) 크기는 144로서, 입력 계층과 동일한 크기이다.
스테이지 1 - 신경망 유형 2. 시그니처 신경망(SgNN): 인코더로부터의 출력은, 섹션 "시그니처 생성기 블록"에서 설명된 바와 같이 시그니처를 생성하도록 피드포워드 신경망을 훈련시키는데 이용된다. 이 시그너토리 ANN은 출력 계층에서 어떠한 은닉된 계층 및 soft-max 뉴런도 갖지 않았다. soft-max 뉴런을 이용하는 이점은, 출력이 LR 모델과 유사하게 0과 1 사이에서 변하는 확률 함수가 될 것이지만, 이제는 입력 대 출력 매핑이 비선형이라는 것이다. 도 6은 시그니처 신경망의 한 예를 도시한다. 이 망에 대한 입력은 인코더로부터 나온다. 이 신경망은 질병 특유의 시그니처를 생성하도록 훈련된다. 26개의 시그니처 신경망 모두가 표 1에 열거된 모든 시그니처 모델에 대해 훈련되었다. 표 14는 시그너토리 신경망 모델을 이용하여 질병 기침으로부터 정상 기침을 분류하는데 있어서 Leave-one-out 검증 결과를 보여준다. 표 15는 시그너토리 신경망 모델의 leave-one-out 검증 성능을 나타낸다.
스테이지 1 - 신경망 유형 3. 분류 신경망(CaNN): 그 다음, 시그니처 신경망의 출력이 최종 분류 Softmax Neural Net을 훈련시키는데 이용되었다. 이 신경망은 분류기 블록(118)을 참조하여 설명된 것들과 유사하다.
본 발명의 바람직한 실시예에서, 발명자들은, 모든 표적 질병 서브그룹: 모세기관지염, 크루프, 천식/RAD, 폐렴 및 하위 기도 질병을 식별하도록 단일의 soft-max ANN 모델을 훈련시켰다. CaNN을 훈련시키는데 이용된 시그너토리 신경망은 이었다. 출력 계층에서 k의 차원은, 각각의 뉴런이 하나의 질병 서브그룹, 모세기관지염, 천식/RAD, 폐렴, 기관지염, pURTI, 크루프 및 정상에 대응하도록 하여 7개의 뉴런으로 설정되었다.
스테이지 2 - 이 스테이지에서의 미세 튜닝 스테이지를 위해 스테이지 1로부터의 개별적으로 훈련된 신경망들이 서로 접속되어 도 7에 나타낸 스택형 딥 신경망(DNN)을 생성했다. 도 7은, 1번째 계층이 피처 인코딩 신경망을 나타내고, 2번째 계층이 시그니처 신경망을 나타내고, 3번째 출력 계층이 분류 신경망을 나타내는 DNN을 도시한다.
그 다음, DNN은, 제한된 수의 훈련 시기로 재훈련되고 훈련-검증 데이터세트를 이용하여 DNN 망 파라미터를 미세-튜닝한다. DNN의 미세-튜닝은 leave-one-out 검증 기술에 따라 이루어졌다.
표 16은 DNN 모델을 이용하여 환자를 분류하기 위한 leave-one-out 검증 결과를 나타낸다.
5. 부록 E
사전 스크리너 및 사후 스크리너
본 발명의 추가 실시예가, 이제, 도 4 및 도 5에서 2개의 페이지에 걸쳐 제시된 진단 모델(300)의 블록도를 참조하여 설명될 것이다. 진단 모델(300)은, 1차 모델이라고 지칭될 수 있는, 도 1의 제1 실시예(100)(도 1 참조)의 질병 시그니처 생성 블록(114) 및 분류기 블록(118)을 포함한다. 그러나, 진단 모델(300)의 제2 실시예는 또한, 전체 진단 방법의 진단 성능을 향상시키기 위해 사전 스크리너 블록(111) 및 사후 스크리너 블록(121)을 포함한다.
i) 사전 스크리너 블록(111)
사전 스크리너 블록(111)의 기능은 1차 모델에 의한 분석을 위해 의도한 것이 아닌 대상자를 걸러내는 것이다.
한 예로서, 1차 모델의 작업이, 의료 시설에 참석한 대상자 집단의 다른 주어진 질병들의 혼합으로부터 특정한 질병, 예를 들어 모세기관지염을 진단하는 것으로서 정의되는 상황을 고려하자. 전체 진단 알고리즘의 결과는 다음과 같다: "모세기관지염 예/아니요? = 아니오" 또는 "모세기관지염 예/아니요? = 예". 이 상황에서 사전 스크리너(111)는, 정상 대상자를 모세기관지염 사례로부터 분리하고 그 사례를 추가 분석을 위해 1차 모델에 전송해야 할 필요없이 그 결과를 "모세기관지염 예/아니오? = 아니오"로서 보고하도록 설계될 수 있다.
스크리너 블록(111)의 스크리너 모델들(4a, …, 4n) 각각은, 1차 모델에서 표적으로 삼고 있는 실제 질병을 가진 사람이 질병-없음 라벨을 얻음으로써 추가 분석으로부터 잘못 걸러지지 않도록 결정 임계값을 높게 설정한다.
ii) 사후 스크리너 블록(121)
사후 스크리너 블록(121)의 기능은 1차 모델의 우세한 거짓 양성의 검출을 목표로하고 보정함으로써 1차 모델의 진단 성능을 향상시키는 것이다.
한 예로서, 1차 모델의 작업이, 의료 시설에 참석한 대상자 집단의 다른 주어진 질병들의 혼합으로부터 특정한 질병, 예를 들어 모세기관지염을 진단하는 것으로서 정의되는 상황을 고려하자. 전체 진단 알고리즘의 결과는 다음과 같다: "모세기관지염 예/아니요? = 아니오" 또는 "모세기관지염 예/아니요? = 예". 크루프 환자가 1차 모델에서 우세한 거짓 양성 그룹으로 존재한다는 것을 우리가 알고 있다고 가정한다. 즉, 그룹: "모세기관지염 예/아니요? = 예"에서, 우리는 크루프라는 임상 진단을 갖는 상당수의 대상자를 발견한다. 이 시나리오에서, 우리의 접근법은, 크루프와 모세기관지염 대상자들의 혼합으로부터 크루프 환자를 골라내도록 훈련된, 사후 스크리너 모델: {크루프 대 모세기관지염}을 구축하는 것이다. 그 다음, 우리는, 우리의 {크루프 대 모세기관지염} 모델을 이용하여 "모세기관지염 예/아니오? = 예" 그룹을 처리하고, 검출된 크루프 환자를 1차 모델 출력의 "모세기관지염 예/아니오? = 아니오" 측으로 이동시킬 것이다.
필요성과 효과에 따라, 주어진 1차 모델에 복수의 사후 스크리너 모델 6a, …, 6m을 적용하는 것이 가능하다. 또한, 주어진 1차 모델에서 어떠한 사후 스크리너도 유용하거나 필요하지 않을 수도 있다. 필요할 때, 스크리너 모델은 드물게 이용되며, 1차 모델에서 표적으로 삼는 실제 질병을 가진 사람이 진단 결정의 다른 측으로 잘못 이동하지 않도록 결정 임계값을 높게 설정한다.
6. 부록 F
모델 개발에서 피처 감축
본 명세서에서 논의되는 진단 모델은, 이용가능한 임상 데이터세트에 관한 교차 검증(CV) 방법을 이용하여 개발되었다. 이용가능한 데이터에 관해 K-폴드 교차 검증(K = 10) 및 LOOV(Leave-One-Out Validation) 방법이 이용되었다. 이들 방법들 양쪽 모두는 그들의 장단점을 갖고 있다. 10-폴드 CV는 새로운 데이터세트(이전에 못 본 데이터세트에 관한 일반화 성능)에 관한 추정의 낮은 분산과 높은 편향을 갖는 모델로 이어지는 경향이 있다; LOOV는 새로운 데이터세트에 관한 더 높은 분산과 더 낮은 편향을 갖는 모델로 이어지는 경향이 있다.
이용가능한 데이터세트의 더 작은 크기로 인해, 진단 모델을 개발할 때 10-폴드에 비해 LOOV 방법을 더 선호했다. 모델에서 더 높은 일반화 분산을 보상하기 위해, 모델의 구축을 가능한 한 작게 하여 모델 오버핏팅의 위험을 낮추는 것을 목표로 하는, 피처 감축 프로세스가 개발되었다. 절차는 다음과 같이 설명된다.
피처 최적화/감축은, 강력한 분류기를 구축하기 위해 관련 피처들의 서브세트를 선택하는 기술이다. 최적 피처 선택은, 피처들의 가능한 모든 서브세트를 철저한 검색을 요구한다. 그러나, 우리가 후보 피처로서 이용하는 많은 피처에 대해 그렇게 하는 것은 비실용적이다. 따라서, p 값에 기초한 대안적 접근법이 이용되어 로지스틱 회귀 모델(LRM)을 이용해 시그니처 모델 설계 스테이지에서 중요한 피처를 결정했다. LRM 설계에서, 각각의 피처에 대해 p-값이 계산되고 그 피처가 모델에 대해 얼마나 중요한지를 나타낸다. 중요한 피처는 낮은 p-값을 가지며 LRM의 그 속성은, 훈련 국면 동안 모델에서, 분류를 용이화하는 피처들의 최적 조합을 결정하는데 이용되었다.
취해진 접근법은, 전체 데이터세트에 걸쳐 모든 피처에 대한 평균 p-값을 계산한 다음 임계값 Pmin보다 작은 평균 p-값을 가진 피처를 선택하는 것으로 구성되었다. 상세한 방법은 다음과 같은 단계들로 설명된다.
1. 을 초기 세트의 전체 N개 피처를 나타낸다고 하자.
2. Leave one out 검증(또는 K-폴드) 프로세스에 따라 을 이용하여 로지스틱 회귀 모델(LRM)을 훈련시킨다. 모든 피처에 대한 평균 p 값을 계산한다.
(1)에서, PN은 초기 세트의 전체 N개 피처와 연관된 한 세트의 평균값을 나타낸다.
3. 평균 p 값이 Pths = PO보다 작은 피처를 선택함으로써 으로부터 피처의 새로운 서브세트 를 생성한다.
4. Leave one out 검증(또는 K-폴드) 프로세스에 따라 피처 세트 를 이용하여 LRM을 훈련시킨다. 피처 세트 에 대한 평균 p 값을 계산한다.
5. 평균 p 값이 Pths보다 작은 피처를 선택함으로써 으로부터 피처의 새로운 서브세트 을 생성한다.
6. 의 크기가 과 같다면, 즉, 내의 모든 피처가 Pths보다 작은 평균 p 값을 갖는다면, 수학식 (2)를 이용하여 Pths를 변경한다
여기서, c << Pths
7. 세트의 크기가 세트보다 작을 때까지 단계 6을 반복한다.
8. 피처 세트의 크기가 Fmin보다 작을 때까지, Pths 값을 원래의 값으로 리셋하고 단계 4 - 7을 반복한다.
9. 선택된 피처 모델의 모든 서브세트에 대해 성능(민감도, 특이도 및 Kappa 값)이 계산된다. 최적의 피처 서브세트를 고르기 위해, 우리는 아래의 방식을 따랐다.
a. 모델 성능에서 최대 카파 값을 갖는 피처의 서브세트를 선택한다. 이 서브세트를 Fa로 둔다.
b. 이제, (민감도/특이도 측면에서의) 성능이 Fa 피처 서브세트를 갖는 모델 성능의 q% 내에 있는 모든 피처 서브세트를 식별한다.
c. 이 식별된 피처 서브세트 푸울로부터, 크기가 최소이지만 Z보다 크고 Fa의 크기보다 작은 하나의 서브세트를 선택한다. 이것이 충족되지 않는다면, Fa를 최적 피처 세트로서 선택한다.
하나의 특정한 실시예에서, 다음의 파라미터 값이 상기 주어진 알고리즘에서 이용되었다. 기침 단독 모델에 대한 FN의 크기는 = 157이다(즉, LRM에 대한 157개의 입력 피처로 시작됨). 기침 + 임상 징후 모델에 대한 FN의 크기는 157+이고, 이용된 임상 피처의 수에 의존한다.
Pths (단계 3에서) = PO = 0.20
c (단계 6에서) = 0.001
Fmin (단계 8에서) = 10
Z (단계 9에서) = 10
7. 하나의 특정한 실시예에서, 상기에서 주어진 알고리즘에서 다음과 같은 파라미터 값이 이용되었다. 이 방법으로 획득된 결과는 아래의 표 12 및 13에서 제공된다.
표 12: 피처 최적화 후의 시그너토리 LR 모델들의 leave-one-out 검증 성능. 기침 피처들 단독.
Figure 112020075101572-pct00076
표 13: 피처 최적화 후의 시그너토리 LR 모델들의 leave-one-out 검증 성능. 기침 + 단순 임상 피처들
Figure 112020075101572-pct00077
표 14: 시그너토리 신경망 모델들을 이용하여 질병 기침으로부터 정상 기침을 분류하는데 있어서 leave-one-out 검증 결과들.
Figure 112020075101572-pct00078
표 15: 시그너토리 신경망 모델들의 leave-one-out 검증 성능.
Figure 112020075101572-pct00079
표 16: DNN 모델들을 이용한 환자 분류에 대한 leave-one-out 검증 결과들.
Figure 112020075101572-pct00080
참고문헌
다음의 문서들은 그 전체 내용이 참조에 의해 본 명세서에 포함된다.
법령에 따라, 본 발명은, 다소 구조적 또는 방법론적 피처 특유의 용어로 설명되었다. 용어 "포함하다"와, "포함하는" 및 "~로 구성된" 등의 그 변형은, 전체에 걸쳐 포함적 의미로 사용되며 임의의 추가적인 피처를 배제하는 것이 아니다. 본 명세서에서 설명된 수단이 본 발명이 효과를 나타내게 하는 바람직한 형태를 포함하기 때문에 본 발명은 도시되거나 설명된 특정한 피처로 제한되지 않는 것으로 이해되어야 한다. 따라서, 본 발명은, 본 기술분야의 통상의 기술자에 의해 적절하게 해석되는 첨부된 청구항들의 적절한 범위 내에서 임의의 형태 또는 변형으로 청구된다.
본 명세서 및 청구항들(존재하는 경우) 전체에 걸쳐, 문맥상 달리 요구하지 않는 한, 용어 "실질적으로" 또는 "약"은, 그 용어에 의해 부여되는 범위에 대한 값으로 제한되지 않는 것으로 이해되어야 한다.
본 발명의 특정 양태, 실시예 또는 예와 관련하여 기술된 피처, 정수, 특징, 화합물, 화학적 부분 또는 그룹은 이들 사이에서 호환되지 않는 한 본원에 기술된 임의의 다른 양태, 실시예 또는 예에 적용가능한 것으로 이해되어야 한다.
본 발명의 임의의 실시예는 단지 예시적인 것이며 본 발명을 제한하려는 것은 아니다. 따라서, 본 발명의 사상 및 범위를 벗어나지 않고 설명된 임의의 실시예에 대한 다양한 다른 변경 및 수정이 이루어질 수 있다는 것을 이해해야 한다.

Claims (17)

  1. 프로세서에 의해 수행되는, 환자 기도의 하나 이상의 질병에 대한 예측 정보를 제공하기 위한 방법으로서,
    기침 세그먼트들로부터 하나 이상의 기침 소리 피처를 나타내는 기침 소리 피처 신호들을 생성하기 위해 환자로부터 취득되는 기침 소리를 처리하는 단계;
    상기 기침 소리 피처 신호들에 기초하여 하나 이상의 질병 시그니처를 획득하는 단계; 및
    상기 기침 세그먼트들이 상기 질병들 중 하나 이상을 나타내는 것으로 간주하도록 상기 하나 이상의 질병 시그니처를 분류하는 단계
    를 포함하고,
    상기 기침 소리 피처 신호들에 기초하여 상기 하나 이상의 질병 시그니처를 획득하는 단계는, 상기 기침 소리 피처들을 복수의 미리훈련된 질병 시그니처 결정 머신 각각에 적용하는 단계를 포함하고, 상기 미리훈련된 질병 시그니처 결정 머신들 중 적어도 하나는 상기 기침 소리 피처들을 특정한 질병 또는 비질병 상태에 대응하는 것으로서 분류하고, 상기 미리훈련된 질병 시그니처 결정 머신들 중 적어도 다른 하나는 상기 기침 소리 피처들을 제1 특정한 질병 또는 상기 제1 특정한 질병과는 상이한 제2 특정한 질병에 대응하는 것으로서 분류하도록 미리훈련되는, 방법.
  2. 제1항에 있어서, 상기 복수의 질병 시그니처 결정 머신 각각은 훈련된 로지스틱 회귀 모델(Logistic Regression Model)(LRM)을 포함하는, 방법.
  3. 제2항에 있어서, 각각의 훈련된 로지스틱 회귀 모델(LRM)은 상기 LRM에 대해 중요하다고 결정된 피처들인 감소된 세트의 훈련 피처들을 이용하여 훈련되어 상기 LRM의 과훈련을 피하는, 방법.
  4. 제3항에 있어서, 상기 훈련 피처들은 모든 훈련 피처들에 대한 평균 p-값들을 계산한 다음, 임계값 Pmin 미만의 평균 p-값들을 갖는 피처들을 선택함으로써 상기 LRM에 대해 중요하다고 결정되는, 방법.
  5. 제2항 내지 제4항 중 어느 한 항에 있어서, 각각의 LRM에 대한 독립 변수들은 기침 소리 피처들의 값들이고, 상기 LRM으로부터의 출력 값은 상기 기침이 상기 제2 특정한 질병을 참조하거나 상기 비질병 상태를 참조하여 상기 제1 특정한 질병을 나타내는 예측 확률을 포함하는, 방법.
  6. 제1항에 있어서, 상기 복수의 질병 시그니처 결정 머신은 하나 이상의 훈련된 신경망을 포함하는, 방법.
  7. 제1항 내지 제4항 및 제6항 중 어느 한 항에 있어서, 상기 기침 소리 피처들에 추가하여, 임상 환자 측정값들을 독립 변수들로서 상기 질병 시그니처 결정 머신들에 적용하는 단계를 포함하는, 방법.
  8. 제1항 내지 제4항 및 제6항 중 어느 한 항에 있어서, 상기 기침 세그먼트들을 상기 질병들 중 하나 이상을 나타내는 것으로서 간주하도록 상기 하나 이상의 질병 시그니처를 분류하는 단계는 상기 하나 이상의 질병 시그니처를 모든 질병 그룹들을 포괄하도록 훈련된 단일 분류기에 적용하는 단계를 포함하는, 방법.
  9. 제1항 내지 제4항 및 제6항 중 어느 한 항에 있어서, 상기 기침 세그먼트들을 상기 질병들 중 하나 이상을 나타내는 것으로서 간주하도록 상기 하나 이상의 질병 시그니처를 분류하는 단계는 상기 하나 이상의 질병 시그니처를 관심 질병을 인식하도록 각각이 훈련된 복수의 분류기에 적용하는 단계를 포함하는, 방법.
  10. 제6항에 있어서, 상기 하나 이상의 질병 시그니처를 분류하는 단계는 상기 하나 이상의 질병 시그니처를 다음의 질병들: 모세기관지염(SBo); 크루프(SC); 천식/RAD(SA); 폐렴(SP); 하위 기도 질병(SLRTD); 1차 URTI(SU) 중 하나로서 분류하는 단계를 포함하는, 방법.
  11. 제9항에 있어서, 상기 기침 소리 피처 신호들에 기초하여 하나 이상의 질병 시그니처를 획득하는 단계에 의해 d개의 질병 시그니처가 생성되고, 대응적으로 인공 신경망(Artificial Neural Network)(ANN)은 하나의 입력 뉴런이 질병 시그니처들 각각에 대응하는 d-차원 입력 계층을 갖는, 방법.
  12. 제11항에 있어서, 상기 ANN은 k-차원 출력 계층을 가지며, 상기 출력 계층 내의 각각의 뉴런은 질병에 대응하는 확률을 출력하는, 방법.
  13. 제1항 내지 제4항, 제6항, 및 제10항 중 어느 한 항에 있어서, 상기 하나 이상의 질병 시그니처를 분류하는 단계는 복합 유효 확률 측정치 로서 컴파일하는 단계를 포함하고,
    PQ는 환자가 질병 Q에 속하는 확률의 표시자를 포함하고 PZ는 질병 Z에 대한 것을 포함하며, 곱 PQ(1 - PZ)는 상기 환자가 질병 Q에 속하고 질병 Z에 속하지 않는 복합 이벤트의 확률을 나타내는, 방법.
  14. 제10항에 있어서, 표적 질병들 각각에 대한 기침 지수(cough index)를 계산하는 단계를 포함하고, 표적 질병에 대한 환자의 상기 기침 지수는 상기 환자에 대해 분석된 총 기침 횟수에 대한, 상기 표적 질병을 나타내는 것으로서 분류된 상기 환자의 기침의 비율로서 계산되는, 방법.
  15. 제1항 내지 제4항, 제6항, 제10항, 및 제14항 중 어느 한 항에 있어서, 우세한 거짓 양성(dominant false positive)들을 검출하기 위해 상기 하나 이상의 질병 시그니처를 분류하는 단계로부터의 분류들에 대해, 하나 이상의 사후 스크리닝 테스트(post screening test)를 적용하는 단계를 포함하는, 방법.
  16. 제15항에 있어서, 상기 검출된 거짓 양성들에 기초하여 상기 하나 이상의 질병 시그니처를 분류하는 단계를 조정하는 단계를 더 포함하는, 방법.
  17. 제1항 내지 제4항, 제6항, 제10항, 및 제14항 중 어느 한 항에 있어서, 질병에 대해 제공된 상기 예측 정보에 기초하여 상기 환자에게 특정한 요법을 적용하는 단계를 더 포함하는 방법.
KR1020207021010A 2017-12-21 2018-12-20 호흡기 질병 진단을 위한 질병 시그니처를 이용한 기침 소리 분석 방법 KR102630580B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2017905129A AU2017905129A0 (en) 2017-12-21 A method for analysis of cough sounds to diagnose respiratory diseases
AU2017905129 2017-12-21
PCT/AU2018/051372 WO2019119050A1 (en) 2017-12-21 2018-12-20 A method for analysis of cough sounds using disease signatures to diagnose respiratory diseases

Publications (2)

Publication Number Publication Date
KR20200122301A KR20200122301A (ko) 2020-10-27
KR102630580B1 true KR102630580B1 (ko) 2024-01-30

Family

ID=66992417

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207021010A KR102630580B1 (ko) 2017-12-21 2018-12-20 호흡기 질병 진단을 위한 질병 시그니처를 이용한 기침 소리 분석 방법

Country Status (7)

Country Link
US (1) US11864880B2 (ko)
EP (1) EP3727148A4 (ko)
JP (2) JP2021506486A (ko)
KR (1) KR102630580B1 (ko)
CN (1) CN111629663A (ko)
AU (1) AU2018386721A1 (ko)
WO (1) WO2019119050A1 (ko)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9113591B2 (en) 2012-06-18 2015-08-25 Raven Industries, Inc. Implement for adjustably metering an agricultural field input according to different frame sections
BR112016008517B1 (pt) 2013-10-17 2021-06-22 Raven Industries, Inc Método e sistema para controlar taxa de fluxo de bocal de um produto agrícola em um aspersor agrícola, sistema de controle de aspersor e método para controlar características de aspersão de bocais de aspersão em um sistema aspersor
EP3565399A4 (en) 2017-01-05 2020-10-14 Raven Industries, INC. LOCALIZED PRODUCT INJECTION SYSTEM AND PROCEDURE FOR IT
EP3700411A4 (en) * 2017-10-27 2021-07-28 Ecole de Technologie Supérieure SYSTEM AND METHOD FOR CLASSIFYING NON-VERBAL AUDIO EVENTS IN THE EAR
WO2019194843A1 (en) * 2018-04-05 2019-10-10 Google Llc System and method for generating diagnostic health information using deep learning and sound understanding
EP3781036A1 (en) * 2018-04-20 2021-02-24 Radhakrishna, Suresh, Jamadagni Electronic stethoscope
WO2020183365A1 (en) * 2019-03-12 2020-09-17 Novartis Ag Digital solutions for differentiating asthma from copd
US11468994B2 (en) * 2019-06-28 2022-10-11 Cerner Innovation, Inc. Pneumonia readmission prevention
US11948690B2 (en) 2019-07-23 2024-04-02 Samsung Electronics Co., Ltd. Pulmonary function estimation
US20220280065A1 (en) * 2019-08-19 2022-09-08 The University Of Queensland A method and apparatus for processing asthma patient cough sound for application of appropriate therapy
EP4041461A4 (en) 2019-10-04 2023-11-01 Raven Industries, Inc. VALVE CONTROL SYSTEM AND METHOD
CN111248913B (zh) * 2020-01-21 2023-04-07 山东师范大学 基于迁移学习的慢性阻塞性肺疾病预测系统、设备及介质
US11468908B2 (en) 2020-04-15 2022-10-11 Optum, Inc. Hybrid input machine learning frameworks
KR102555235B1 (ko) * 2020-04-24 2023-07-13 다인기술 주식회사 배뇨에 관한 소리를 분석하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
US20220104725A9 (en) * 2020-05-13 2022-04-07 Ali IMRAN Screening of individuals for a respiratory disease using artificial intelligence
CN111938652A (zh) * 2020-08-24 2020-11-17 上海市第一人民医院 人工智能诊断模式在支气管哮喘早期诊断中的应用
CN112233700A (zh) * 2020-10-09 2021-01-15 平安科技(深圳)有限公司 基于音频的用户状态识别方法、装置及存储介质
CN112687290B (zh) * 2020-12-30 2022-09-20 同济大学 一种经过压缩的咳嗽自动检测方法及嵌入式设备
CN112494032A (zh) * 2021-02-03 2021-03-16 中南大学湘雅二医院 一种基于声学特征的呼吸道疾病监测预警系统
CN112992337B (zh) * 2021-02-07 2022-05-24 华南理工大学 一种颈脊髓损伤患者肺功能评估算法、装置、介质和设备
CN113223498A (zh) * 2021-05-20 2021-08-06 四川大学华西医院 基于喉部语音信息的吞咽障碍识别方法、设备及装置
US20220384040A1 (en) * 2021-05-27 2022-12-01 Disney Enterprises Inc. Machine Learning Model Based Condition and Property Detection
CN115414025A (zh) * 2021-05-31 2022-12-02 华为技术有限公司 筛查方法、设备、存储介质及程序产品
WO2023014063A1 (ko) * 2021-08-03 2023-02-09 다인기술 주식회사 음향 신호를 분석하여 연하장애 가능성을 평가하는 방법, 이를 수행하는 서버 및 비일시성의 컴퓨터 판독 가능 기록 매체
CN113413163B (zh) * 2021-08-24 2021-11-19 山东大学 一种混合深度学习和低差异度森林的心音诊断系统
KR102624637B1 (ko) 2021-10-06 2024-01-15 주식회사 웨이센 시계열 기침음, 호흡음, 낭독음, 발성음 측정을 통한 호흡기 질환 예후 예측시스템 및 방법
CN114041779A (zh) * 2021-11-26 2022-02-15 河南牧原智能科技有限公司 用于对牲畜呼吸道疾病进行识别的识别系统和计算机设备
KR102624676B1 (ko) 2021-12-14 2024-01-15 주식회사 웨이센 스마트폰으로 수집한 기침음, 호흡음, 성음 측정 데이터를 이용한 호흡기 질환 예측 방법
KR102376188B1 (ko) * 2021-12-15 2022-03-17 가천대학교 산학협력단 딥러닝 기반의 호흡음 분류를 위한 피쳐정보 선택방법 및 시스템
CN114403878B (zh) * 2022-01-20 2023-05-02 南通理工学院 一种基于深度学习的语音检测疲劳度方法
US20230368026A1 (en) * 2022-05-11 2023-11-16 Covid Cough, Inc. Systems and methods for chained machine learning models for signal data signature labelling
WO2024058585A1 (ko) * 2022-09-16 2024-03-21 사회복지법인 삼성생명공익재단 음성 데이터 및 임상 정보를 이용하여 대상자의 폐질환의 중증도를 분류하는 방법 및 분석장치
CN117035073B (zh) * 2023-08-16 2024-03-29 南京信息工程大学 一种基于分层事件发展模式归纳的未来气象事件预测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120071777A1 (en) * 2009-09-18 2012-03-22 Macauslan Joel Cough Analysis

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5598508A (en) * 1991-10-18 1997-01-28 Goldman; Julian M. Real-time waveform analysis using artificial neural networks
EP1898786B1 (en) * 2005-06-03 2011-03-30 South Manchester University Hospitals NHS Trust A method for generating output data
GB0711524D0 (en) 2007-06-15 2007-07-25 Univ Leuven Kath Online recognition and localisation of sick pig cough sounds
US20090312660A1 (en) * 2008-06-17 2009-12-17 Biorics Nv Recognition and localisation of pathologic animal and human sounds
ES2947765T3 (es) 2012-03-29 2023-08-18 Univ Queensland Procedimiento y aparato para procesar grabaciones de sonido de un paciente
US10426426B2 (en) * 2012-06-18 2019-10-01 Breathresearch, Inc. Methods and apparatus for performing dynamic respiratory classification and tracking
US11304624B2 (en) * 2012-06-18 2022-04-19 AireHealth Inc. Method and apparatus for performing dynamic respiratory classification and analysis for detecting wheeze particles and sources
EP3359023A4 (en) * 2015-10-08 2019-05-22 Cordio Medical Ltd. ASSESSMENT OF A PULMONARY SUFFERING BY LANGUAGE ANALYSIS
PL3231368T3 (pl) * 2016-04-15 2020-01-31 Clebre Sp. Z O.O. Sposób, system do identyfikacji zdarzeń oddechowych

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120071777A1 (en) * 2009-09-18 2012-03-22 Macauslan Joel Cough Analysis

Also Published As

Publication number Publication date
EP3727148A4 (en) 2021-03-03
EP3727148A1 (en) 2020-10-28
CN111629663A (zh) 2020-09-04
KR20200122301A (ko) 2020-10-27
WO2019119050A1 (en) 2019-06-27
JP2021506486A (ja) 2021-02-22
AU2018386721A1 (en) 2020-07-16
US11864880B2 (en) 2024-01-09
US20210076977A1 (en) 2021-03-18
JP2023164839A (ja) 2023-11-14

Similar Documents

Publication Publication Date Title
KR102630580B1 (ko) 호흡기 질병 진단을 위한 질병 시그니처를 이용한 기침 소리 분석 방법
CN110353685B (zh) 用于处理患者声音的方法与装置
CN103730130B (zh) 一种病理嗓音的检测系统
Jayachitra et al. A cognitive IoT-based framework for effective diagnosis of COVID-19 using multimodal data
Anupam et al. Preliminary diagnosis of COVID-19 based on cough sounds using machine learning algorithms
Swarnkar et al. Neural network based algorithm for automatic identification of cough sounds
Aly et al. A novel deep learning model to detect COVID-19 based on wavelet features extracted from Mel-scale spectrogram of patients’ cough and breathing sounds
Patel et al. Lung Respiratory Audio Prediction using Transfer Learning Models
Vatanparvar et al. CoughMatch–subject verification using cough for personal passive health monitoring
Hafke-Dys et al. Artificial intelligence approach to the monitoring of respiratory sounds in asthmatic patients
Aytekin et al. Covid-19 detection from respiratory sounds with hierarchical spectrogram transformers
Celik et al. Proposing a new approach based on convolutional neural networks and random forest for the diagnosis of Parkinson's disease from speech signals
Shabber et al. A review and classification of amyotrophic lateral sclerosis with speech as a biomarker
Bhosale et al. Contrastive Learning of Cough Descriptors for Automatic COVID-19 Preliminary Diagnosis.
Grant et al. Considerations and Challenges for Real-World Deployment of an Acoustic-Based COVID-19 Screening System
Huang et al. Classification of cough sounds using spectrogram methods and a parallel-stream one-dimensional deep convolutional neural network
KR102624637B1 (ko) 시계열 기침음, 호흡음, 낭독음, 발성음 측정을 통한 호흡기 질환 예후 예측시스템 및 방법
Benmalek et al. A cough-based covid-19 detection with Gammatone and Mel-frequency cepstral coefficients
Ayappan et al. Mayfly Optimization with Deep Belief Network-Based Automated COVID-19 Cough Classification Using Biological Audio Signals
Zhao et al. A CNN-Based Method for Depression Detecting Form Audio
Sharan Automated discrimination of cough in audio recordings: A scoping review
Zhang et al. Towards Open Respiratory Acoustic Foundation Models: Pretraining and Benchmarking
Topuz et al. SUPER-COUGH: A Super Learner-based ensemble machine learning method for detecting disease on cough acoustic signals
Matias et al. Clinically relevant sound-based features in COVID-19 identification: robustness assessment with a data-centric machine learning pipeline
Saeed et al. An AI-enabled Bias-Free Respiratory Disease Diagnosis Model using Cough Audio: A Case Study for COVID-19

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant