KR102659616B1 - 음성 특성 기반 알츠하이머병 예측 방법 및 장치 - Google Patents

음성 특성 기반 알츠하이머병 예측 방법 및 장치 Download PDF

Info

Publication number
KR102659616B1
KR102659616B1 KR1020210089014A KR20210089014A KR102659616B1 KR 102659616 B1 KR102659616 B1 KR 102659616B1 KR 1020210089014 A KR1020210089014 A KR 1020210089014A KR 20210089014 A KR20210089014 A KR 20210089014A KR 102659616 B1 KR102659616 B1 KR 102659616B1
Authority
KR
South Korea
Prior art keywords
voice
alzheimer
disease
subject
model
Prior art date
Application number
KR1020210089014A
Other languages
English (en)
Other versions
KR20220007537A (ko
Inventor
이준영
고현웅
Original Assignee
주식회사 이모코그
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 이모코그 filed Critical 주식회사 이모코그
Priority to EP21837800.8A priority Critical patent/EP4179961A4/en
Priority to US18/004,934 priority patent/US20230233136A1/en
Priority to PCT/KR2021/008710 priority patent/WO2022010282A1/ko
Priority to CN202180048396.5A priority patent/CN115955932A/zh
Priority to JP2023501323A priority patent/JP2023533331A/ja
Publication of KR20220007537A publication Critical patent/KR20220007537A/ko
Application granted granted Critical
Publication of KR102659616B1 publication Critical patent/KR102659616B1/ko

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4088Diagnosing of monitoring cognitive diseases, e.g. Alzheimer, prion diseases or dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4803Speech analysis specially adapted for diagnostic purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Neurology (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Hospice & Palliative Care (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Primary Health Care (AREA)
  • Child & Adolescent Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Psychiatry (AREA)
  • Psychology (AREA)
  • Neurosurgery (AREA)
  • Physiology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

음성 특성 기반 알츠하이머병 예측 방법 및 장치가 제공된다. 실시예에 따른 알츠하이머병 예측 장치는 대상자의 음성을 녹음하여 음성 샘플을 생성하도록 구성된 음성 입력부; 상기 대상자의 인구통계학적 정보를 수신하도록 구성된 데이터 입력부; 상기 생성된 음성 샘플에서 음성 특성을 추출하는 음성 특성 추출부; 및 상기 음성 특성과 상기 인구통계학적 정보를 기초로 상기 대상자의 알츠하이머병 여부를 예측하도록 미리 학습된 예측 모델을 포함한다.

Description

음성 특성 기반 알츠하이머병 예측 방법 및 장치{Method and device for predicting Alzheimer's disease based on phonetic features}
본 발명은 치매의 원인 질병 중 가장 높은 비율을 차지하는 알츠하이머병(Alzheimer's disease, AD)을 진단하기 위한 방법으로 환자의 음성을 이용한 비침습적인 방법을 통하여 의료인의 알츠하이머병 유무를 판단하는데 도움을 제공하는 방법에 관한 것으로, 치매 고위험군인 사람들을 대상으로 비침습적 방법을 통하여 알츠하이머병으로 인한 치매 상태를 예측할 수 있는 방법 및 장치를 제공할 수 있다.
4차 산업과 함께 AI 스피커를 사용하는 비율이 점차 늘어나고 있으나, 아직까지 대중적으로 보급화되지는 못한 상태이다. AI 스피커의 대중화가 늦어지는 것과 관련하여, 다양한 이유들이 존재하나, 소비자들은 AI 스피커를 활용할 컨텐츠가 부족하다는 의견이 대다수를 차지하고 있다. 즉, AI 스피커를 이용한 다양한 컨텐츠의 개발이 요구되고 있는 상황이다.
여기서, AI 스피커와 헬스케어 산업은 수익성과 공익성을 함께 잡는 '두 마리 토끼'로 인식되고 있으며, 국내외 많은 연구진들이 AI 스피커를 이용하여 헬스케어와 관련된 다양한 컨텐츠를 개발하고 있는 상황이다.
우리나라의 65세 이상 노인 인구는 2000년을 기점으로 전체인구의 7.1%를 차지하게 되었고, 2026년에는 20%를 넘어설 것으로 예상된다. 대표적 노인성 질환인 치매의 경우 2000년에 65세 이상 노인의 8.3%인 28만 명으로 집계되었으며, 2010년에는 전체 노인의 8.6%인 43만 명에 이를 것으로 추정되어 증가추세에 있다. 노인 인구의 증가에 따라 평균수명의 증가로 인하여 치매의 유병률은 꾸준하게 증가하는 추세를 나타낸다.
알츠하이머병(Alzheimer's disease, AD)은 전체 치매의 약 70%를 설명하는 가장 흔한 원인 질병으로, 2020년에는 약 60만 명의 알츠하이머병 환자가 발생할 것으로 추정된다. 알츠하이머병은 대표적인 퇴행성 치매질환으로 대뇌 신경세포의 퇴화를 통한 인지기능 및 일상생활 저하를 야기하며 사망에 이르는 파괴적인 질병으로 환자뿐만 아니라 환자를 돌보는 가족들에게도 고통을 초래한다. 알츠하이머병은 비가역적인 질병인데다가 완치 가능한 치료법이 개발되지 않았기 때문에 알츠하이머병을 조기 진단하여 빠르게 개입하는 것이 현재 최선의 방안이다. 알츠하이머병 유병률 증가에 따라 국민 보건 및 의료 비용 지출 또한 막대한 영향을 받고 있다.
음성 및 언어장애는 인지기능 및 신경 퇴화에 따른 치매에 동반되는 증상 중 하나로 정상 노화 및 치매 원인 질병 감별에 자주 사용되는 기준이며 종종 조기 증상의 마커로 나타난다. 때문에 자동음성인식 연구에서는 치매 진단을 위한 음성 및 언어 마커를 발굴하는 다양한 연구들이 수행되고 있다. 대표적으로 DementiaBank의 Pitt corpus의 데이터(e.g., Cookie Theft 그림 설명)를 이용하여 치매를 예측하는 연구들이 주를 이루고 있다.
대표적인 치매 원인질병인 알츠하이머병을 정확하게 진단하는데 사용되는 뇌척수액 검수나 양전자 방출 단층 촬영술(positron emission tomograph, PET)이 전문가에 의해 특정한 공간 및 시간에 제약됨을 고려할 때, AI 스피커 및 스마트 기기를 이용하여 대화 대상자의 알츠하이머병 여부를 예측할 수 있는 방법 및 장치가 요구되고 있는 실정이다.
한국 공개특허 제10-2014-0119486호
본 발명은 음성의 음향학적 특성을 이용하여 알츠하이머병을 진단하기 위한 방법에 대한 것으로, 음성인식 마이크를 통해 AI 스피커 혹은 스마트 기기를 이용하여 대화 상대자의 응답을 수집하여 대화 상대자의 알츠하이머병 유무 및 가능성을 예측할 수 있는 방법 및 장치에 관한 것이다.
본 발명의 실시예에 따른 음성 특성 기반 알츠하이머병 예측 장치는 대상자의 음성을 녹음하여 음성 샘플을 생성하도록 구성된 음성 입력부; 상기 대상자의 인구통계학적 정보를 수신하도록 구성된 데이터 입력부; 상기 생성된 음성 샘플에서 음성 특성을 추출하는 음성 특성 추출부; 및 상기 음성 특성과 상기 인구통계학적 정보를 기초로 상기 대상자의 알츠하이머병 여부를 예측하도록 미리 학습된 예측 모델을 포함한다.
본 발명의 실시예에 따른 음성 특성 기반 알츠하이머병 예측 방법은 대상자의 음성을 녹음하여 음성 샘플을 생성하는 단계; 상기 대상자의 인구통계학적 정보를 수신하는 단계; 상기 생성된 음성 샘플에서 음성 특성을 추출하는 단계; 및 미리 학습된 예측 모델에 상기 음성 특성과 상기 인구통계학적 정보를 입력하여 상기 대상자의 알츠하이머병 여부를 예측하는 단계를 포함한다.
본 발명의 실시예에 따른 기록매체는 컴퓨터 판독 가능 명령을 저장하는 컴퓨터 판독 가능 기록매체로서, 상기 명령은 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서가 단계들을 수행하도록 하며, 상기 단계들은, 대상자의 음성을 녹음하여 음성 샘플을 생성하는 단계; 상기 대상자의 인구통계학적 정보를 수신하는 단계; 상기 생성된 음성 샘플에서 음성 특성을 추출하는 단계; 및 미리 학습된 예측 모델에 상기 음성 특성과 상기 인구통계학적 정보를 입력하여 상기 대상자의 알츠하이머병 여부를 예측하는 단계를 포함한다.
본 발명의 실시예에 따른 음성 특성 기반 알츠하이머병 예측 방법 및 장치는 AI 스피커 및 스마트 기기를 이용한 대화 대상자의 알츠하이머병 여부에 대한 예측 방법 및 장치는 기존 검사에 수반되는 시간적, 공간적, 자원적 한계를 극복하는데 도움을 줄 것으로 예상되며, 의료인의 알츠하이머병 진단을 지원할 수 있다.
본 발명에서 제공하는 음성의 음향학적 특성을 활용한 알츠하이머병 위험도 예측을 통해 지속적으로 늘어나는 치매 인구에 대한 적절한 개입 방안을 마련이 지원될 수 있다.
도 1은 본 발명의 실시예에 따른 음성 특성 기반 알츠하이머병 예측 장치의 구성을 도시한 블록도이다.
도 2는 본 발명의 실시예에 따른 음성 특성 기반 알츠하이머병 예측 장치의 동작 과정에 예시적으로 도시한다.
도 3은 본 발명의 실시예에 따른 음성 특성 기반 알츠하이머병 예측 방법의 순서를 도시한 블록도이다.
도 4는 인구 통계학 및 음성 특성을 고려한 알츠하이머병 예측 결과를 도시한 그래프이다.
이하, 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명한다. 본 발명은 도면에 도시된 실시 예를 참고로 설명되었으나 이는 하나의 실시예로서 설명되는 것이며, 이것에 의해 본 발명의 기술적 사상과 그 핵심 구성 및 작용은 제한되지 않는다.
도 1은 본 발명의 실시예에 알츠하이머병 예측 장치의 구성을 도시한 블록도이다. 도 2는 본 발명의 실시예에 따른 알츠하이머병 예측 장치의 동작 과정에 예시적으로 도시한다.
도 1 및 도 2를 참조하면, 본 발명의 실시예에 따른 알츠하이머병 예측 장치(10)은 음성 입력부(100), 데이터 입력부(110), 음성 특성 추출부(120), 예측 모델(130) 및 데이터 저장부(140)를 포함한다.
알츠하이머병 예측 장치(10)는, 전적으로 하드웨어이거나, 또는 부분적으로 하드웨어이고 부분적으로 소프트웨어인 측면을 가질 수 있다. 예컨대, 본 명세서의 알츠하이머병 예측 장치(10) 및 이에 포함된 각 부는, 특정 형식 및 내용의 데이터를 전자통신 방식으로 주고받기 위한 장치 및 이에 관련된 소프트웨어를 통칭할 수 있다. 본 명세서에서 "부", "모듈(module)", "서버(server)", "장치", "장치" 또는 "단말" 등의 용어는 하드웨어 및 해당 하드웨어에 의해 구동되는 소프트웨어의 조합을 지칭하는 것으로 의도된다. 예를 들어, 여기서 하드웨어는 CPU 또는 다른 프로세서(processor)를 포함하는 데이터 처리 기기일 수 있다. 또한, 하드웨어에 의해 구동되는 소프트웨어는 실행중인 프로세스, 객체(object), 실행파일(executable), 실행 스레드(thread of execution), 프로그램(program) 등을 지칭할 수 있다.
또한, 알츠하이머병 예측 장치(10)를 구성하는 각각의 모듈은 반드시 물리적으로 구분되는 별개의 구성요소를 지칭하는 것으로 의도되지 않는다. 도 1에서 음성 입력부(100), 데이터 입력부(110), 음성 특성 추출부(120), 예측 모델(130) 및 데이터 저장부(140)는 서로 구분되는 별개의 블록으로 도시되나, 이는 알츠하이머병 예측 장치(10)을 구성하는 장치를 해당 장치에 의해 실행되는 동작에 의해 단지 기능적으로 구분한 것이다. 따라서, 실시예에 따라서는 음성 입력부(100), 데이터 입력부(110), 음성 특성 추출부(120), 예측 모델(130) 및 데이터 저장부(140)는 일부 또는 전부가 동일한 하나의 장치 내에 집적화될 수 있다. 예를 들어, 알츠하이머병 예측 장치(10)는 AI 스피커와 같은 음성 인식과 데이터 처리 능력을 가진 장치를 통해 구현될 수 있다. 다만 이에 한정되는 것은 아니며, 상기 구성들은 하나 이상이 다른 부와 물리적으로 구분되는 별개의 장치로 구현될 수도 있으며, 분산 컴퓨팅 환경 하에서 서로 통신 가능하게 연결된 컴포넌트들일 수도 있다.
음성 입력부(100)는 대상자의 음성 샘플을 생성한다. 음성 입력부(100)는 대상자의 음성을 일정 주파수로 녹음하여 음성 샘플을 생성하도록 구성될 수 있다. 음성 입력부(100)는 콘덴서 마이크 및 이를 제어하기 위한 장치를 포함할 수 있으며, 16Hz 이상의 주파수로 대상자의 음성을 녹음하여 음성 샘플을 생성할 수 있다. 대상자는 녹음이 가능한 조용한 방에서 그림 묘사, 표준 문단 발화 및 이야기 회상하기 과제 중 적어도 하나를 실시하여 자연 발화 또는 낭독 발화를 하게 되며, 음성 입력부(100)는 이러한 대상자의 발화를 녹음하여 음성 샘플을 생성하게 된다.
데이터 입력부(110)는 대상자의 인구통계학적 정보를 수신한다. 인구통계학적 정보는 적어도 대상자의 연령, 성별, 교육연수(교육을 받은 학력 정도)를 포함한다. 데이터 입력부(110)를 통해 입력되는 자료는 대상자의 연령, 성별, 교육연수를 확인할 수 있거나, 이러한 정보들을 추출할 수 있는 데이터를 의미한다. 예시적으로, 인구통계학적 정보는 대상자의 문진 자료를 통해 습득될 수 있다. 문진 자료는 환자의 연령, 성별, 교육연수와 관련된 정보를 포함할 수 있으며, 훈련된 전문의의 의학적 판단을 이용하여 생성되는 자료에 해당하며, 기타 의료진 및 환자의 보호자 관리하에 수집된 자료일 수 있다. 데이터 입력부(110)는 상술한 문진 자료를 통해 인구통계학적 정보를 수신할 수 있으나, 이에 한정되는 것은 아니다. 몇몇 실시예에서, 대상자의 인구통계학적 정보는 대상자가 직접 입력한 정보일 수 있다.
음성 입력부(100), 데이터 입력부(110)를 통해 입력된 데이터들은 데이터 저장부(140)에 저장될 수 있다. 데이터 저장부(140)는 입력된 데이터들이 저장되거나, 후술하는 예측 모델의 데이터 처리에 필요한 임시 또는 일시적 저장 공간을 제공하도록 구성될 수 있다.
음성 특성 추출부(120)는 입력된 대상자의 음성 샘플에서 환자의 음성 특성을 추출할 수 있다. 음성 특성 추출부(120)는 음성 샘플의 음운 특성, 근원 특성, 스펙트럼 특성과 관련된 음성 특성을 추출할 수 있다. 구체적으로, 음성 특성 추출부(120)는 대상자 음성의 기본 주파수(fundamental frequency), 발화와 관련된 정보(발화 속도, 발화 시간, 발화 길이) 휴기와 관련된 정보(휴기 정도, 휴기 횟수, 휴기 구간 길이), 쉼머(Shimmer), 지터(Jitter), 포만트(formant), 비음 대 소음 비율(harmonic-to-noise ratio), 라우드니스(loudness), 스펙트럼 수치(spectral centroid) 멜 주파수 켑스트럼 계수(MFCC ,Mel Frequency Cepstral Coefficients), 아이덴티티 벡터(i-vector), 조음 속도, 영교차율(zcr, zero-crossing rate), 음성 확률(vp, voicing probability), 선 스펙트럼 순서쌍(LSP, line spectral paris), 주기 변동(Period perturbation), 진폭 변동 지수(APQ, amplitude perturbation quotient), 강성(Stiffness), 에너지(Energy), 강도(목소리의 크기, Intensity), 엔트로피(Entropy) 중 적어도 하나를 음성 특성으로 추출할 수 있다.
여기서, 음성 특성 추출부(120)은 음성 샘플을 정량화하기 위한 전처리 과정을 먼저 수행할 수 있다. 전처리 과정을 통해 음성 샘플의 시간, 주파수 등이 일정하도록 조정될 수 있다. 또한, 전처리 과정을 통해 사람의 음성과 사람의 음성이 아닌 음성을 구분할 수 있다. 음성 특성 추출부(120)은 입력된 음성 샘플에서 사람의 음성만을 선별하도록 학습된 인공 신경망 모형(예를 들어, 합성곱 신경망)을 포함할 수 있으며, 학습된 인공 신경망 모형을 통해 상술한 사람의 음성만을 선별하는 전처리를 수행할 수 있다. 음성 특성 추출부(120)는 전처리된 음성 샘플에서 음성의 기본 주파수(fundamental frequency), 발화 속도, 발화 시간, 발화 길이, 휴기 정도, 휴기 횟수, 휴기 구간 길이, 쉼머(Shimmer), 지터(Jitter), 포만트(formant), 비음 대 소음 비율(harmonic-to-noise ratio), 라우드니스(loudness), 스펙트럼 수치(spectral centroid) 멜 주파수 켑스트럼 계수(MFCC ,Mel Frequency Cepstral Coefficients), 아이덴티티 벡터(i-vector), 조음 속도, 영교차율(zcr, zero-crossing rate), 음성 확률(vp, voicing probability), 선 스펙트럼 순서쌍(LSP, line spectral paris), 주기 변동(Period perturbation), 진폭 변동 지수(APQ, amplitude perturbation quotient), 강성(Stiffness), 에너지(Energy), 강도(목소리의 크기, Intensity), 엔트로피(Entropy) 중 적어도 하나를 포함하는 음성 특성을 추출할 수 있다. 음성 특성 추출부(120)는 공개된 음성 특성 추출 프로그램(예를 들어, Praat)를 이용하여 음운, 근원, 스펙트럼 영역에 해당하는 음성 특성을 추출할 수도 있다.
예측 모델(130)는 음성 특성 추출부(120)에서 추출된 음성 특성과 데이터 입력부(110)를 통해 제공된 인구통계학적 정보를 통해 대상자의 알츠하이머병 여부를 예측하도록 미리 학습된 상태일 수 있다. 예측 모델(130)은 선형회귀 모형, 로지스틱 회귀 모형, 기계학습 모형 및 신경망 모형 중 적어도 하나의 분석 모형을 포함할 수 있다.
예측 모델(130)은 다변량 로지스틱 회귀 모형을 포함하며, 다변량 로지스틱 회귀 모형은 하기 수학식 1과 같이 구성될 수 있다.
[수학식 1]
(여기서, X1 내지 Xp는 독립 변수로서 예측 모델에 입력되는 입력 값으로 p개의 음성 특성 및 인구통계학적 정보에 각각 대응되고, 내지 는 독립 변수의 회귀 계수인 상수 값에 해당하며, 는 초기 상수 값에 해당하고, 는 치매 위험 확률 값에 해당한다)
상술한 수학식 1에 기초하여 구성된 예측 모델(130)은 치매 위험 확률 값을 출력하고, 상기 치매 위험 확률 값에 기초하여 환자의 상태를 평가한 상태 정보를 출력할 수 있다. 치매 위험 확률 값은 치매로 진단 받을 확률을 의미하며, 상태 정보는 환자를 전문의 진단 기준에 따라 진단한 것으로 환자의 상태는 알츠하이머병 또는 정상인지기능으로 결정될 수 있다. 예를 들어, 예측 모델(130)은 계산된 치매 위험 확률 값()이 0.5 이상인 경우 알츠하이머병으로 환자의 상태를 결정하며, 계산된 치매 위험 확률 값이 0.5 미만인 경우 정상인지기능으로 환자의 상태를 결정할 수 있다.
다만 본 발명의 예측 모델(130)이 이에 한정되는 것은 아니다. 예측 모델(130)은 다항 다변량 로지스틱 회귀모형으로 구성될 수 있으며, 예측 모델(130)은 계산된 치매 위험 확률 값들에 기초하여 환자의 상태를 알츠하이머병, 경도인지장애 및 정상인지기능 중 하나로 결정할 수도 있다.
이하, 본 발명의 다른 실시예에 따른 음성 특성 기반 알츠하이머병 예측 방법을 설명하도록 한다.
도 3은 실시예에 따른 음성 특성 기반 알츠하이머병 예측 방법의 순서도이다. 본 방법은 도 1 및 도 2에 따른 예측 장치에서 수행될 수 있으며, 본 실시예의 설명을 위해 도 1, 도 2 및 관련 설명이 참조될 수 있다.
도 3을 참조하면, 실시예에 따른 음성 특성 기반 알츠하이머병 예측 방법은 대상자의 음성을 녹음하여 음성 샘플을 생성하는 단계(S100); 상기 대상자의 인구통계학적 정보를 수신하는 단계(S110); 상기 생성된 음성 샘플에서 음성 특성을 추출하는 단계(S120); 및 미리 학습된 예측 모델에 상기 음성 특성과 상기 인구통계학적 정보를 입력하여 상기 대상자의 알츠하이머병 여부를 예측하는 단계(S130)를 포함한다.
실시예에 따른 음성 특성 기반 알츠하이머병 예측 방법의 각 단계에서 단계(S100)와 단계(S110)는 설명의 편의를 위해 순차적으로 기재하고 설명하는 것으로, 기재 순서에 국한되어 순차적으로 수행되는 것은 아니다. 몇몇 실시예에서, 단계(S110)가 단계(S100)보다 먼저 수행될 수도 있다. 또한, 상기 예측 방법이 수행되기 이전 예측 모델을 학습하는 단계가 먼저 수행될 수 있다.
대상자의 음성을 녹음하여 음성 샘플을 생성한다(S100).
대상자는 녹음이 가능한 조용한 방에서 그림 묘사, 표준 문단 발화 및 이야기 회상하기 과제 중 적어도 하나를 실시하여 자연 발화 또는 낭독 발화를 하게 되며, 이러한 대상자의 발화를 녹음하여 음성 샘플을 생성하게 된다. 음성 입력부(100)는 콘덴서 마이크 및 이를 제어하기 위한 장치를 포함할 수 있으며, 16Hz 이상의 주파수로 대상자의 음성을 녹음하여 음성 샘플을 생성할 수 있다.
상기 대상자의 인구통계학적 정보를 수신한다(S110).
상기 인구통계학적 정보는 상기 대상자의 연령, 성별 및 교육연수를 포함한다. 예시적으로, 인구통계학적 정보는 대상자의 문진 자료를 통해 습득될 수 있다. 문진 자료는 환자의 연령, 성별, 교육연수와 관련된 정보를 포함할 수 있으며, 훈련된 전문의의 의학적 판단을 이용하여 생성되는 자료에 해당하며, 기타 의료진 및 환자의 보호자 관리하에 수집된 자료일 수 있다. 데이터 입력부(110)는 상술한 문진 자료를 통해 인구통계학적 정보를 수신할 수 있으나, 이에 한정되는 것은 아니다. 몇몇 실시예에서, 대상자의 인구통계학적 정보는 대상자가 직접 입력한 정보일 수 있다.
다음으로, 생성된 음성 샘플에서 음성 특성을 추출한다(S120).
입력된 대상자의 음성 샘플에서 환자의 음성 특성이 추출될 수 있다. 환자의 음성 샘플을 정량화하기 위한 전처리 과정에 인공 신경망 모형이 활용될 수 있다. 전처리 과정을 통해 음성 샘플의 시간, 주파수 등이 일정하도록 조정될 수 있다. 또한, 입력된 음성 샘플이 다수인 경우 음성 샘플을 선별하기 위한 전처리 과정이 수행될 수 있다. 음성 특성 추출부(120)는 전처리된 음성 샘플에서 음성의 기본 주파수(fundamental frequency), 발화 속도, 발화 시간, 발화 길이, 휴기 정도, 휴기 횟수, 휴기 구간 길이, 쉼머(Shimmer), 지터(Jitter), 포만트(formant), 비음 대 소음 비율(harmonic-to-noise ratio), 라우드니스(loudness), 스펙트럼 수치(spectral centroid) 멜 주파수 켑스트럼 계수(MFCC ,Mel Frequency Cepstral Coefficients), 아이덴티티 벡터(i-vector), 조음 속도, 영교차율(zcr, zero-crossing rate), 음성 확률(vp, voicing probability), 선 스펙트럼 순서쌍(LSP, line spectral paris), 주기 변동(Period perturbation), 진폭 변동 지수(APQ, amplitude perturbation quotient), 강성(Stiffness), 에너지(Energy), 강도(목소리의 크기, Intensity), 엔트로피(Entropy) 중 적어도 하나를 포함하는 음성 특성을 추출할 수 있다.
다음으로, 미리 학습된 예측 모델에 상기 음성 특성과 상기 인구통계학적 정보를 입력하여 상기 대상자의 알츠하이머병 여부를 예측한다(S130).
예측 모델(130)는 음성 특성 추출부(120)에서 추출된 음성 특성과 데이터 입력부(110)를 통해 제공된 인구통계학적 정보를 통해 대상자의 알츠하이머병 여부를 예측하도록 미리 학습된 상태일 수 있다. 예측 모델(130)은 선형회귀 모형, 로지스틱 회귀 모형, 기계학습 모형 및 신경망 모형 중 적어도 하나의 분석 모형을 포함할 수 있다.
예측 모델(130)은 다변량 로지스틱 회귀 모델을 포함하며, 상기 다변량 로지스틱 회귀 모형은 하기 수학식 1과 같이 구성될 수 있다.
[수학식 1]
(여기서, X1 내지 Xp는 독립 변수로서 예측 모델에 입력되는 입력 값으로 p개의 음성 특성 및 인구통계학적 정보에 각각 대응되고, 내지 는 독립 변수의 회귀 계수인 상수 값에 해당하며, 는 초기 상수 값에 해당하고, 는 치매 위험 확률 값에 해당한다)
상술한 수학식 1에 기초하여 구성된 예측 모델(130)은 치매 위험 확률 값을 출력하고, 상기 치매 위험 확률 값에 기초하여 환자의 상태를 평가한 상태 정보를 출력할 수 있다. 치매 위험 확률 값은 치매로 진단 받을 확률을 의미하며, 상태 정보는 환자를 전문의 진단 기준에 따라 진단한 것으로 환자의 상태는 알츠하이머병 또는 정상인지기능으로 결정될 수 있다. 예를 들어, 예측 모델(130)은 계산된 치매 위험 확률 값이 0.5 이상인 경우 알츠하이머병으로 환자의 상태를 결정하며, 계산된 치매 위험 확률 값이 0.5 미만인 경우 정상인지기능으로 환자의 상태를 결정할 수 있다.
이러한 실시예들에 따른 음성 특성 기반 알츠하이머병 예측 방법은, 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.
컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.
프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
실험예
상술한 실시예에 따른 음성 특성 기반 알츠하이머병 예측 방법 및 장치의 예측 모델의 구축하고, 구축된 예측 모델을 검증하는 실험을 수행하였다.
예측 모델의 구축을 위한 대상자 데이터는 총 210명을 대상으로, 보라매병원에 내원하는 환자 및 동작구 치매안심센터에 등록된 사람들을 대상으로 음성 및 진단 정보를 획득하였다. 전체 대상자 중, 알츠하이머성 치매군에 해당하는 사람이 106명, 정상군은 104명이었다. 대상자의 음성 수집을 위하여 검사자와 대상자와 상호작용하는 동안 음성을 수집하였다.
대상자의 음성을 정량화 하기 위하여, 먼저 인공신경망 모형(합성곱 신경망)을 활용하여 음성 샘플에 대한 전처리를 수행하였다. 즉, 입력된 음성 샘플이 다수인 경우 사람의 음성 샘플을 선별하기 위한 전처리 과정이 먼저 수행되어 학습에 노이즈 데이터가 입력되는 것을 방지하였다. 전처리된 음성에 대하여 자동화된 음성 특성 추출 방법을 활용하여 음성의 음성 특성을 추출하였다. 음성의 기본 주파수(fundamental frequency(f0) mean, f0 std), 발화와 관련된 정보(발화 속도, 발화 시간, 발화 길이), 휴기(pause)와 관련된 정보(pause rate, pause count, pause duration mean, pause duration standard deviation(std)), 쉼머(Shimmer), 지터(Jitter), 포만트(formant), 비음 대 소음 비율(harmonic-to-noise ratio), 라우드니스(loudness), 스펙트럼 수치(spectral centroid mean, spectral centroid std)와 같은 음성 특성이 각각 추출되었다.
인구 통계학적 정보(연령, 성별, 교육연수)와 추출된 각각의 음성 특성을 입력 값으로 하고, 알츠하이머성 치매 예측 모델을 대상자의 치매 위험 확률 값을 출력하고, 상기 치매 위험 확률 값에 기초하여 환자의 상태를 평가한 상태 정보를 출력하는 예측 모델을 구축하였다. 예측 모델은 다변량 로지스틱 회귀 모델로 구현되었으며, 치매 위험 확률 값을 출력하도록 구축되었다. 예측 모델은 계산된 치매 위험 확률 값이 0.5 이상인 경우 알츠하이머병으로 환자의 상태를 결정하며, 계산된 치매 위험 확률 값이 0.5 미만인 경우 정상인지기능으로 환자의 상태를 결정할 수 있다.
구축된 예측 모델을 통해 예측 성능을 테스트하였다. 구체적으로, 예측 모델에 대하여, 예측 성능의 인덱스로더 ROC(receiver operating characteristic) 커브(curve)의 AUC(area under the curve)를 산출하였다. AUC는 ROC 커브의 밑면적을 구한 값으로 예측 모형의 전반적인 성능을 나타내는 대표적인 인덱스로 1에 가까울수록 좋은 성능을 의미한다. 도 4는 구축된 예측 모델을 결과를 도시하는 그래프이며, Youden Index에 따른 optimal cutoff score에 따르면, 아래 표 1과 같은 성능을 나타낸다.
Cutoff AUC AUC.se Sensitivity Specificity PPV NPV
0.437 0.816 0.029 0.802 0.699 0.733 0.774
예측력은 AUC = 0.816, 민감도(Sensitivity)는 0.802, 그리고 특이도(Specificity)는 0.802의 성능을 나타났다. PPV(positive predictive value)는 0.733, NPV(negative predictive value)는 0.774로 나타났다.
종래 알츠하이머병 진단을 위해 시행되는 검사는 대뇌 침착 아밀로이드 PET 및 뇌척수액 검사를 이용하는 방법이 사용되었다. 아밀로이드 PET을 사용하는 것은 비용이 비싸고, 3차 병원과 같이 전문 의학센터를 운영하는 병원이 아니고서는 쉽게 이용하기 어려울 뿐만 아니라 방사선에 대한 노출과 같은 위험요인이 있다. 뇌척수액 분석에 대해서는, 침습적인 요추 천자요법을 사용하고, 작업 및 분석에 들어가는 노동이 필요하고, 기관에 따른 신뢰도의 차이가 있다는 제한점이 있다.
이와 달리, 본원 발명의 음성 특성 기반 알츠하이머병 예측 방법 및 장치는 비침습적인 방법을 사용한 검사를 통해서 알츠하이머병을 진단하는 것으로, AI스피커/스마트폰/태블릿/PC 등을 통해 진행할 수 있는 시간, 공간, 전문가를 초월한 정신과선별검사로 집에서나 병원 아닌 곳에서 편하게 검사를 진행할 수 있다. 또한, 1,2차 클리닉에서 알츠하이머병 위험도 판단을 할 수 있으며, False-positive를 최소한으로 할 수 있어 비용을 절약할 수 있는 효과도 있으며, 향후 치료 프로그램까지 확장될 수 있다.
즉, 대표적인 치매 원인질병인 알츠하이머병을 정확하게 진단하는데 사용되는 뇌척수액 검수나 양전자 방출 단층 촬영술(positron emission tomograph, PET)이 전문가에 의해 특정한 공간 및 시간에 제약됨을 고려할 때, 본 발명과 같은 AI 스피커 및 스마트 기기를 이용한 대화 대상자의 알츠하이머병 유무에 대한 검사 방법은 기존 검사에 수반되는 시간적, 공간적, 자원적 한계를 극복하는데 도움을 줄 것으로 예상된다.
결과적으로 음성의 음향학적 특성을 활용한 알츠하이머병 위험도 진단은 지속적으로 늘어나는 치매 인구에 대한 적절한 개입방안을 마련할 수 있을 것으로 기대된다.
10: 알츠하이머병 예측 장치
100: 음성 입력부
110: 데이터 입력부
120: 음성 특성 추출부
130: 예측 모델
140: 데이터 저장부

Claims (9)

  1. 대상자의 음성을 녹음하여 음성 샘플을 생성하도록 구성된 음성 입력부;
    상기 대상자의 인구통계학적 정보를 수신하도록 구성된 데이터 입력부;
    상기 생성된 음성 샘플에서 음성 특성을 추출하는 음성 특성 추출부; 및
    상기 음성 특성과 상기 인구통계학적 정보를 기초로 상기 대상자의 알츠하이머병 여부를 예측하도록 미리 학습된 예측 모델을 포함하고,
    상기 음성 특성 및 상기 인구통계학적 정보는,
    독립 변수로서 상기 예측 모델에 입력 값으로 입력되고,
    상기 예측 모델은,
    상기 음성 특성을 나타내는 복수의 제1 독립 변수들, 상기 인구통계학적 정보를 나타내는 복수의 제2 독립 변수들 및 복수의 회귀 계수들의 조합으로 결정된 적어도 하나의 항으로 구성되는 다변량 로지스틱 회귀 모형을 포함하고,
    상기 복수의 회귀 계수들은,
    상기 다변량 로지스틱 회귀 모형의 분류 경계(decision boundary)를 결정하도록 학습된 것이고,
    상기 다변량 로지스틱 회귀 모형은,
    상기 결정된 분류 경계를 이용하여, 상기 제1 독립 변수들 및 상기 제2 독립 변수들에 따른 치매 위험 확률 값을 출력하고,
    상기 치매 위험 확률 값에 기초하여, 환자의 상태를 알츠하이머병 또는 정상인지기능으로 결정하는 상태 정보를 출력하는 것인, 알츠하이머병 예측 장치.
  2. 제1 항에 있어서,
    상기 인구통계학적 정보는 상기 대상자의 연령, 성별 및 교육연수를 포함하는 것을 특징으로 하는, 알츠하이머병 예측 장치.
  3. 제1 항에 있어서,
    상기 음성 특성 추출부는 음성의 기본 주파수(fundamental frequency), 발화 속도, 발화 시간, 발화 길이, 휴기 정도, 휴기 횟수, 휴기 구간 길이, 쉼머(Shimmer), 지터(Jitter), 포만트(formant), 비음 대 소음 비율(harmonic-to-noise ratio), 라우드니스(loudness), 스펙트럼 수치(spectral centroid) 멜 주파수 켑스트럼 계수(MFCC ,Mel Frequency Cepstral Coefficients), 아이덴티티 벡터(i-vector), 조음 속도, 영교차율(zcr, zero-crossing rate), 음성 확률(vp, voicing probability), 선 스펙트럼 순서쌍(LSP, line spectral paris), 주기 변동(Period perturbation), 진폭 변동 지수(APQ, amplitude perturbation quotient), 강성(Stiffness), 에너지(Energy), 강도(목소리의 크기, Intensity), 엔트로피(Entropy) 중 적어도 하나를 상기 음성 특성으로 추출하는 것을 특징으로 하는, 알츠하이머병 예측 장치.
  4. 제3 항에 있어서,
    상기 음성 특성 추출부는 상기 음성 샘플에서 인간의 음성을 선별하는 전처리를 수행하는 인공 신경망 모형을 포함하며,
    상기 음성 특성 추출부는 전처리된 음성 샘플에서 상기 음성 특성을 추출하는 것을 특징으로 하는, 알츠하이머병 예측 장치.
  5. 제1 항에 있어서,
    상기 예측 모델은 선형회귀 모형, 로지스틱 회귀 모형, 기계학습 모형 및 신경망 모형 중 적어도 하나의 분석 모형을 포함하는 특징으로 하는, 알츠하이머병 예측 장치.
  6. 제5 항에 있어서,
    상기 로지스틱 회귀 모형은 다변량 로지스틱 회귀 모형이며, 상기 다변량 로지스틱 회귀 모형은 하기 수학식 1과 같이 구성되는 것을 특징으로 하는, 알츠하이머병 예측 장치.

    [수학식 1]

    (여기서, X1 내지 Xp는 독립 변수로서 예측 모델에 입력되는 입력 값으로 p개의 음성 특성 및 인구통계학적 정보에 각각 대응되고, 내지 는 독립 변수의 회귀 계수인 상수 값에 해당하며, 는 초기 상수 값에 해당하고, 는 치매 위험 확률 값에 해당한다)
  7. 삭제
  8. 알츠하이머병 예측 장치가 대상자의 음성을 녹음하여 음성 샘플을 생성하는 단계;
    상기 대상자의 인구통계학적 정보를 수신하는 단계;
    상기 생성된 음성 샘플에서 음성 특성을 추출하는 단계; 및
    미리 학습된 예측 모델에 상기 음성 특성과 상기 인구통계학적 정보를 입력하여 상기 대상자의 알츠하이머병 여부를 예측하는 단계를 포함하고,
    상기 음성 특성 및 상기 인구통계학적 정보는,
    독립 변수로서 상기 예측 모델에 입력 값으로 입력되고,
    상기 예측 모델은,
    상기 음성 특성을 나타내는 복수의 제1 독립 변수들, 상기 인구통계학적 정보를 나타내는 복수의 제2 독립 변수들 및 복수의 회귀 계수들의 조합으로 결정된 적어도 하나의 항으로 구성되는 다변량 로지스틱 회귀 모형을 포함하고,
    상기 복수의 회귀 계수들은,
    상기 다변량 로지스틱 회귀 모형의 분류 경계(decision boundary)를 결정하도록 학습된 것이고,
    상기 다변량 로지스틱 회귀 모형은,
    상기 결정된 분류 경계를 이용하여, 상기 제1 독립 변수들 및 상기 제2 독립 변수들에 따른 치매 위험 확률 값을 출력하고,
    상기 치매 위험 확률 값에 기초하여, 환자의 상태를 알츠하이머병 또는 정상인지기능으로 결정하는 상태 정보를 출력하는 것인, 음성 특성 기반 알츠하이머병 예측 방법.
  9. 컴퓨터 판독 가능 명령을 저장하는 컴퓨터 판독 가능 기록매체로서, 상기 명령은 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서가 단계들을 수행하도록 하며, 상기 단계들은,
    대상자의 음성을 녹음하여 음성 샘플을 생성하는 단계;
    상기 대상자의 인구통계학적 정보를 수신하는 단계;
    상기 생성된 음성 샘플에서 음성 특성을 추출하는 단계; 및
    미리 학습된 예측 모델에 상기 음성 특성과 상기 인구통계학적 정보를 입력하여 상기 대상자의 알츠하이머병 여부를 예측하는 단계를 포함하고,
    상기 음성 특성 및 상기 인구통계학적 정보는,
    독립 변수로서 상기 예측 모델에 입력 값으로 입력되고,
    상기 예측 모델은,
    상기 음성 특성을 나타내는 복수의 제1 독립 변수들, 상기 인구통계학적 정보를 나타내는 복수의 제2 독립 변수들 및 복수의 회귀 계수들의 조합으로 결정된 적어도 하나의 항으로 구성되는 다변량 로지스틱 회귀 모형을 포함하고,
    상기 복수의 회귀 계수들은,
    상기 다변량 로지스틱 회귀 모형의 분류 경계(decision boundary)를 결정하도록 학습된 것이고,
    상기 다변량 로지스틱 회귀 모형은,
    상기 결정된 분류 경계를 이용하여, 상기 제1 독립 변수들 및 상기 제2 독립 변수들에 따른 치매 위험 확률 값을 출력하고,
    상기 치매 위험 확률 값에 기초하여, 환자의 상태를 알츠하이머병 또는 정상인지기능으로 결정하는 상태 정보를 출력하는 것인, 기록매체.
KR1020210089014A 2020-07-10 2021-07-07 음성 특성 기반 알츠하이머병 예측 방법 및 장치 KR102659616B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
EP21837800.8A EP4179961A4 (en) 2020-07-10 2021-07-08 METHOD AND DEVICE BASED ON A VOICE CHARACTERISTIC FOR PREDICTING ALZHEIMER'S DISEASE
US18/004,934 US20230233136A1 (en) 2020-07-10 2021-07-08 Voice characteristic-based method and device for predicting alzheimer's disease
PCT/KR2021/008710 WO2022010282A1 (ko) 2020-07-10 2021-07-08 음성 특성 기반 알츠하이머병 예측 방법 및 장치
CN202180048396.5A CN115955932A (zh) 2020-07-10 2021-07-08 基于语音特征的阿尔茨海默病预测方法和装置
JP2023501323A JP2023533331A (ja) 2020-07-10 2021-07-08 音声特性に基づくアルツハイマー病予測方法及び装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200085449 2020-07-10
KR20200085449 2020-07-10

Publications (2)

Publication Number Publication Date
KR20220007537A KR20220007537A (ko) 2022-01-18
KR102659616B1 true KR102659616B1 (ko) 2024-04-23

Family

ID=80052550

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210089014A KR102659616B1 (ko) 2020-07-10 2021-07-07 음성 특성 기반 알츠하이머병 예측 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102659616B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116530944B (zh) * 2023-07-06 2023-10-20 荣耀终端有限公司 声音处理方法及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013255786A (ja) * 2012-05-18 2013-12-26 Kao Corp 老年障害リスクの評価方法
KR101881731B1 (ko) * 2018-02-27 2018-07-25 한국과학기술정보연구원 기계 학습을 통한 치매 예측용 데이터 처리 장치 및 그 방법, 이를 수록한 기록 매체
WO2018204934A1 (en) * 2017-05-05 2018-11-08 Canary Speech, LLC Selecting speech features for building models for detecting medical conditions

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120070668A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 음성 통화 정보를 이용한 알츠하이머병 진단 장치 및 방법
KR20140119486A (ko) 2013-04-01 2014-10-10 한국전자통신연구원 알츠하이머병 발병률 예측 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013255786A (ja) * 2012-05-18 2013-12-26 Kao Corp 老年障害リスクの評価方法
WO2018204934A1 (en) * 2017-05-05 2018-11-08 Canary Speech, LLC Selecting speech features for building models for detecting medical conditions
KR101881731B1 (ko) * 2018-02-27 2018-07-25 한국과학기술정보연구원 기계 학습을 통한 치매 예측용 데이터 처리 장치 및 그 방법, 이를 수록한 기록 매체

Also Published As

Publication number Publication date
KR20220007537A (ko) 2022-01-18

Similar Documents

Publication Publication Date Title
Haider et al. An assessment of paralinguistic acoustic features for detection of Alzheimer's dementia in spontaneous speech
De la Fuente Garcia et al. Artificial intelligence, speech, and language processing approaches to monitoring Alzheimer’s disease: a systematic review
US10010288B2 (en) Screening for neurological disease using speech articulation characteristics
Luz et al. A method for analysis of patient speech in dialogue for dementia detection
Saenz-Lechon et al. Methodological issues in the development of automatic systems for voice pathology detection
WO2020013302A1 (ja) 精神・神経系疾患の推定システム、推定プログラムおよび推定方法
Yu et al. Cognitive impairment prediction in the elderly based on vocal biomarkers
EP4179961A1 (en) Voice characteristic-based method and device for predicting alzheimer's disease
Kashyap et al. Automated topographic prominence based quantitative assessment of speech timing in cerebellar ataxia
KR102659616B1 (ko) 음성 특성 기반 알츠하이머병 예측 방법 및 장치
Benba et al. Voice signal processing for detecting possible early signs of Parkinson’s disease in patients with rapid eye movement sleep behavior disorder
Fu et al. Predicting mini-mental status examination scores through paralinguistic acoustic features of spontaneous speech
WO2019188405A1 (ja) 認知機能評価装置、認知機能評価システム、認知機能評価方法及びプログラム
WO2021132289A1 (ja) 病態解析システム、病態解析装置、病態解析方法、及び病態解析プログラム
US11730408B2 (en) Systems and methods for human-machine partnered PTSD prediction
Alghifari et al. Development of sorrow analysis dataset for speech depression prediction
Kim et al. Non-invasive way to diagnose dysphagia by training deep learning model with voice spectrograms
Marks et al. Spectral aggregate of the high-passed fundamental frequency and its relationship to the primary acoustic features of adductor laryngeal dystonia
KR20220069854A (ko) 음향 특성 기반 불안 및 스트레스 예측 방법 및 장치
Dutta et al. A Fine-Tuned CatBoost-Based Speech Disorder Detection Model
JP7265293B2 (ja) 音声を用いて、精神・神経系疾患を推定する装置
US20220415308A1 (en) Tracking articulatory and prosodic development in children
Bou Zeidan Automatic Speech Recognition to Maintain the Elderly’s Autonomy in Signal Processing and Al Approaches
Walker et al. Speech patterns in responses to questions asked by an intelligent virtual agent can help to distinguish between people with early stage neurodegenerative disorders and healthy controls
Teferra Correlates and Prediction of Generalized Anxiety Disorder from Acoustic and Linguistic Features of Impromptu Speech

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant