KR102093370B1 - 압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램 - Google Patents

압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램 Download PDF

Info

Publication number
KR102093370B1
KR102093370B1 KR1020200005755A KR20200005755A KR102093370B1 KR 102093370 B1 KR102093370 B1 KR 102093370B1 KR 1020200005755 A KR1020200005755 A KR 1020200005755A KR 20200005755 A KR20200005755 A KR 20200005755A KR 102093370 B1 KR102093370 B1 KR 102093370B1
Authority
KR
South Korea
Prior art keywords
hearing aid
hearing
data
frequency
frequency band
Prior art date
Application number
KR1020200005755A
Other languages
English (en)
Inventor
이정학
이경원
김진숙
김동욱
진인기
Original Assignee
한림국제대학원대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한림국제대학원대학교 산학협력단 filed Critical 한림국제대학원대학교 산학협력단
Priority to KR1020200005755A priority Critical patent/KR102093370B1/ko
Application granted granted Critical
Publication of KR102093370B1 publication Critical patent/KR102093370B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/70Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/41Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램이 제공된다. 상기 보청기 시스템의 제어 방법은 서버 및 보청기에 의해 수행되는 보청기 시스템의 제어 방법에 있어서, 상기 서버가, 한국어 음성 데이터를 바탕으로 복수개의 주파수 대역을 획득하는 단계; 상기 서버가, 상기 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 획득하는 단계; 상기 보청기가, 상기 획득된 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 바탕으로 상기 보청기를 1차 보정하는 단계; 상기 서버가, 보청기 사용자의 청각 상태에 대한 데이터 및 상기 보청기 사용자의 음성 데이터를 획득하는 단계; 및 상기 보청기가, 상기 보청기 사용자의 청각 상태에 대한 데이터 및 상기 보청기 사용자의 음성 데이터를 바탕으로 상기 1차 보정된 보청기를 2차 보정하는 단계; 를 포함한다.

Description

압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램{Control method, device and program of hearing aid system for optimal amplification for compression threshold level}
본 발명은 압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램에 관한 것이다.
보청기는 청각 저하 또는 상실 상태인 난청인이 소리를 들을 수 있도록 하기 위해 개발되었다. 이러한 보청기는 마이크로폰으로 들어온 음성 데이터를 증폭하여 리시버로 출력하여 난청인이 들을 수 없는 소리를 들을 수 있게 해주는 장치이다.
마이크로폰으로 들어온 음성 데이터는 주파수 대역에 따라 구분된 각각의 채널에서 청력과 입력 음압에 따른 최적 이득(optimal gain)을 구하고, 최적 이득에 따라 음성 데이터를 증폭 시켜 어음인지능력을 향상시키는 것을 목적으로 한다. 이때, 각각의 주파수 대역 및 최대 이득을 구하기 위한 적합 공식을 구하는 것이 보청기의 성능 향상을 위해 중요하다.
그러나 현재의 보청기에서 사용되고 있는 적합 공식은 대부분 영어음의 특성과 인지 능력에 근거하여 개발되어 있는 것이 현실이다. 따라서, 한국어음과 한국인의 청각 해부학적인 특성 및 한국어음의 인지능력에 근거한 보청기 적합공식의 필요성이 증대되고 있으며, 나아가 보청기 사용자 각각에 최적화된 보청기의 보정 방법이 중요해지고 있다.
등록특허공보 제10-0956167호, 2010.04.27
본 발명이 해결하고자 하는 과제는 압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램을 제공하는 것이다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 보청기 시스템의 제어 방법은 서버 및 보청기에 의해 수행되는 보청기 시스템의 제어 방법에 있어서, 상기 서버가, 한국어 음성 데이터를 바탕으로 복수개의 주파수 대역을 획득하는 단계; 상기 서버가, 상기 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 획득하는 단계; 상기 보청기가, 상기 획득된 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 바탕으로 상기 보청기를 1차 보정하는 단계; 상기 서버가, 보청기 사용자의 청각 상태에 대한 데이터 및 상기 보청기 사용자의 음성 데이터를 획득하는 단계; 및 상기 보청기가, 상기 보청기 사용자의 청각 상태에 대한 데이터 및 상기 보청기 사용자의 음성 데이터를 바탕으로 상기 1차 보정된 보청기를 2차 보정하는 단계; 를 포함한다.
이때, 상기 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 획득하는 단계는, 상기 한국어 음성 데이터를 8개의 주파수 대역으로 분류하는 단계; 상기 분류된 8개의 주파수 대역 각각에 대한 정반응률을 획득하는 단계; 상기 획득된 정반응률에 기초하여 각각의 주파수 대역에 대한 각각의 가중치를 획득하는 단계 및 상기 가중치를 바탕으로 상기 제1 주파수 이득값 및 상기 제1 최대 출력값을 결정하는 단계; 를 포함할 수 있다.
이때, 상기 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 획득하는 단계는, 상기 한국어 음성 데이터의 대화음 크기를 판단하는 단계; 상기 대화음 크기가 기 설정된 범위 이내인 경우, 압축역치(Compression Threshold), 압축비율(Compression Ratio), 확장역치(Extension Threshold), 확장비율(Extension Ratio) 및 상기 가중치를 바탕으로 제1 파라미터를 결정하고, 상기 결정된 제1 파라미터를 바탕으로 상기 제1 주파수 이득값 및 상기 제1 최대 출력값을 결정하는 단계;를 더 포함할 수 있다.
이때, 상기 한국어 음성 데이터를 바탕으로 복수개의 주파수 대역을 획득하는 단계는, 성인용 한국 표준 문장 목록 (KS-SL-A)에 포함된 텍스트를 방음부스 내부에서 생성하되, 한국어 음성 데이터의 발화자는 방음부스 중앙에 위치하고 상기 발화자의 정면 1M에 마이크가 위치하여, 상기 마이크를 통해 제1 음성 데이터를 획득하는 단계; 상기 제1 음성 데이터를 학습 데이터로 하여 인공지능 모델에 입력하여 한국어 음성 데이터에 대한 특징값을 추출하도록 상기 인공지능 모델을 학습시키는 단계; 노이즈가 포함된 제2 음성 데이터를 상기 학습된 인공지능 모델에 입력하여 상기 제2 음성 데이터에 대한 특징값을 추출하고, 추출된 특징값을 바탕으로 상기 제2 음성 데이터를 보정하는 단계; 및 상기 제1 음성 데이터 및 상기 보정된 제2 음성 데이터를 포함하는 상기 한국어 음성 데이터를 바탕으로 복수개의 주파수 대역을 획득하는 단계;를 포함할 수 있다.
이때, 상기 보청기 사용자의 청각 상태에 대한 데이터 및 상기 보청기 사용자의 음성 데이터를 획득하는 단계는, 상기 보청기 사용자의 청각 상태에 대한 데이터를 바탕으로, 복수개의 주파수 대역 각각에 대한 상기 주파수 이득값 및 상기 최대 출력값을 보정하여 제2 주파수 이득값 및 제2 최대 출력값을 획득하는 단계; 상기 보청기 사용자의 음성 데이터를 바탕으로 상기 보청기가 감지하는 음원의 파형을 보정하기 위한 특징값을 추출하는 단계;를 포함하고, 상기 2차 보정하는 단계는, 상기 제2 주파수 이득값, 상기 제2 최대 출력값 및 음원의 파형을 보정하기 위한 특징값을 바탕으로 상기 1차 보정된 보청기를 2차 보정하는 단계;를 포함할 수 있다.
이때, 상기 제어 방법은, 상기 보청기가, 상기 보청기로부터 입력되는 음성 데이터를 전자 장치로 전송하는 단계; 상기 전자 장치가, 상기 수신한 음성 데이터를 상기 서버로 전송하는 단계; 상기 서버가, 기 설정된 조건을 만족하면, 상기 수신한 음성 데이터를 바탕으로 상기 보청기를 3차 보정하기 위한 제3 주파수 이득값 및 제3 최대 출력값을 획득하는 단계; 및 상기 보청기가, 상기 제3 주파수 이득값 및 제3 최대 출력값을 바탕으로 상기 2차 보정된 보청기를 3차 보정하는 단계; 를 포함할 수 있다.
이때, 상기 제어 방법은, 상기 보청기 사용자의 생활 공간에서의 배경 소음에 대한 정보, 상기 보청기 사용자의 발화 속도에 대한 정보 및 일반인의 평균 발화 속도에 대한 정보를 포함하는 배경정보를 수집하는 단계; 상기 수집된 배경정보를 바탕으로 청능훈련프로그램에 포함될 배경 소음 및 발화 속도를 결정하는 단계; 상기 결정된 배경 소음, 어음인지 정도 및 발화 속도를 바탕으로 청능훈련프로그램을 생성하는 단계; 상기 보청기 사용자로부터 상기 청능훈련프로그램 및 보청기 착용에 대한 결과 데이터를 수신하는 단계; 및 상기 결과 데이터를 바탕으로 상기 보청기를 4차 보정하는 단계; 를 포함하고, 상기 4차 보정하는 단계는, 상기 결과 데이터 중 기 설정된 비율 이상의 오답률을 가지는 주파수 구간을 획득하는 단계; 상기 획득된 주파수 구간의 주파수 이득값을 상기 제3 주파수 이득값 이상으로 보정하는 단계;를 포함하고, 상기 생성된 청능훈련프로그램은 상기 보청기 사용자의 배경정보에 따라 시각단서, 음소, 단어 및 문장의 난이도, 문장 길이, 환경음 및 음악의 포함 여부가 결정될 수 있다.
이때, 상기 청능훈련프로그램을 생성하는 단계는, 복수의 보청기 사용자의 배경정보, 설문문항에 대한 답변정보 및 상기 답변정보로부터 획득된 상세정보를 포함하는 복수의 제1 데이터를 상기 복수의 사용자 별로 저장하는 단계; 상기 복수의 보청기 사용자의 청능훈련프로그램 및 보청기 착용에 대한 결과 데이터를 포함하는 복수의 제2 데이터를 상기 복수의 보청기 사용자 별로 저장하는 단계; 상기 복수의 제1 데이터를 클러스터링하여 복수의 제1 클러스터를 획득하는 단계; 상기 복수의 제2 데이터를 클러스터링하여 복수의 제2 클러스터를 획득하는 단계; 새로운 제1 보청기 사용자에 대한 배경정보 및 답변정보를 획득하는 단계; 상기 복수의 제1 클러스터 중 상기 획득한 제1 보청기 사용자에 대한 배경정보 및 답변정보와 관련된 제1-1 클러스터를 판단하는 단계; 상기 복수의 제2 클러스터 중 상기 제1-1 클러스터와 기 설정된 거리내에 존재하는 제2-1 클러스터를 판단하는 단계; 및 상기 제2-1 클러스터에 포함된 데이터를 바탕으로 상기 제1 보청기 사용자에 대한 청능훈련프로그램을 생성하는 단계; 를 포함할 수 있다.
본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
상술한 본 발명의 다양한 실시예에 따라, 한국인에게 최적화된 보청기의 적합공식에 따라 보청기를 보정할 수 있는 효과가 있다.
나아가, 보청기 사용자 개개인에게 적합한 보청기의 보정 방법이 제공될 수 있다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 시스템을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 보청기 보정 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 한국어 음성 데이터를 복수개의 주파수 대역으로 분류하는 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 대화음의 크기에 따른 파라미터 획득 방법을 설명하기 위한 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 인공지능모델을 이용한 주파수 대역 획득 방법을 설명하기 위한 흐름도이다.
도 6은 본 발명의 일 실시예에 따른 보청기를 2차 보정하는 방법을 설명하기 위한 흐름도이다.
도 7은 본 발명의 일 실시예에 따른 보청기를 3차 보정하는 방법을 설명하기 위한 흐름도이다.
도 8은 본 발명의 일 실시예에 따른 보청기를 4차 보정하는 방법을 설명하기 위한 흐름도이다.
도 9는 본 발명의 일 실시예에 따른 보청기에 대한 사용 데이터를 획득하는 방법을 설명하기 위한 흐름도이다.
도 10 내지 도 14는 본 발명의 다양한 실시예에 따른 실험 데이터를 설명하기 위한 그래프이다.
도 15는 본 발명의 일 실시예에 따른 장치의 구성도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
명세서에서 사용되는 "부" 또는 “모듈”이라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부" 또는 “모듈”은 어떤 역할들을 수행한다. 그렇지만 "부" 또는 “모듈”은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부" 또는 “모듈”은 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부" 또는 “모듈”은 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부" 또는 “모듈”들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부" 또는 “모듈”들로 결합되거나 추가적인 구성요소들과 "부" 또는 “모듈”들로 더 분리될 수 있다.
공간적으로 상대적인 용어인 "아래(below)", "아래(beneath)", "하부(lower)", "위(above)", "상부(upper)" 등은 도면에 도시되어 있는 바와 같이 하나의 구성요소와 다른 구성요소들과의 상관관계를 용이하게 기술하기 위해 사용될 수 있다. 공간적으로 상대적인 용어는 도면에 도시되어 있는 방향에 더하여 사용시 또는 동작시 구성요소들의 서로 다른 방향을 포함하는 용어로 이해되어야 한다. 예를 들어, 도면에 도시되어 있는 구성요소를 뒤집을 경우, 다른 구성요소의 "아래(below)"또는 "아래(beneath)"로 기술된 구성요소는 다른 구성요소의 "위(above)"에 놓여질 수 있다. 따라서, 예시적인 용어인 "아래"는 아래와 위의 방향을 모두 포함할 수 있다. 구성요소는 다른 방향으로도 배향될 수 있으며, 이에 따라 공간적으로 상대적인 용어들은 배향에 따라 해석될 수 있다.
본 명세서에서, 컴퓨터는 적어도 하나의 프로세서를 포함하는 모든 종류의 하드웨어 장치를 의미하는 것이고, 실시 예에 따라 해당 하드웨어 장치에서 동작하는 소프트웨어적 구성도 포괄하는 의미로서 이해될 수 있다. 예를 들어, 컴퓨터는 스마트폰, 태블릿 PC, 데스크톱, 노트북 및 각 장치에서 구동되는 사용자 클라이언트 및 애플리케이션을 모두 포함하는 의미로서 이해될 수 있으며, 또한 이에 제한되는 것은 아니다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.
본 명세서에서 설명되는 각 단계들은 컴퓨터에 의하여 수행되는 것으로 설명되나, 각 단계의 주체는 이에 제한되는 것은 아니며, 실시 예에 따라 각 단계들의 적어도 일부가 서로 다른 장치에서 수행될 수도 있다.
한편, 본 명세서에서 청각(hearing)이란 소리를 탐지, 변별, 확인 및 인지하는 과정을 의미한다. 난청인(hearing impaired)이란 한쪽 또는 양쪽 귀의 청력이 손상된 사람을 의미한다. 보청기(hearing aid)란 난청 보상을 목적으로 소리 신호의 처리를 위해 고안된 전기 음향적 착용 장치를 의미한다. 보청기 시스템(hearing aid system)이란 한쪽 또는 양쪽 보청기, 귀꽂이, 원격조종장치, 접속기 등 관련 구성요소로 구성된 개별 맞춤형 시스템을 의미한다. 보청기 전문가(hearing aid professional)란 난청인을 대상으로 전문적인 청각평가, 보청기의 선택, 조절, 검증, 청능훈련 등을 포함하는 보청기 적합관리 서비스를 제공할 수 있는 청각학적 역량을 갖춘 사람을 의미한다. 고객(client) 또는 보청기 사용자란 보청기 전문가 또는 보청기 적합관리 시스템이 제공하는 보청기 적합관리 서비스를 받는 사람을 의미한다. 보청기 적합관리(hearing aid fitting management)란 평가모듈, 적합모듈 및 후속조치모듈을 포함하는 종합적인 관리체계로 상담, 청각검사, 보청기 시험착용, 보청기 선택, 귀 인상채취, 보청기 조절, 검증, 고객교육, 청능훈련, 결과측정 및 종합보고서 작성의 11개 구성요소를 시행하여 보청기를 착용한 난청인의 가청력 개선, 어음지각 향상 및 보청기의 지속적 사용과 관리를 돕는 체계적인 과정을 의미한다. 청능재활(auditory rehabilitation)이란 보청기 조절, 상담, 교육 및 다양한 훈련을 통해 청각능력과 의사소통 기술을 향상시키는 체계적이고 포괄적인 과정을 의미한다. 평가모듈(assessment module)이란 보청기 적합 전 단계의 5개 구성요소인 상담, 청각검사, 보청기 시험착용, 보청기 선택 및 귀 인상채취와 구성요소 간의 절차를 포함하는 보청기 적합관리의 과정을 의미한다. 적합모듈(fitting module)이란 보청기 적합 단계의 3개 구성요소인 보청기 조절, 검증 및 고객교육과 구성요소 간의 절차를 포함하는 보청기 적합관리의 과정을 수행하기 위한 모듈을 의미한다. 후속조치모듈(follow-up module)이란 보청기 적합 후 단계의 3개 구성요소인 청능훈련, 결과측정 및 종합보고서 작성과 구성요소 간의 절차를 포함하는 보청기 적합관리의 과정을 수행하기 위한 모듈을 의미한다. 상담(counseling)이란 고객 또는 그 가족에게 고객의 난청상태, 난청으로 인한 어려움, 보청기 적합, 청능훈련 등에 대한 포괄적인 정보를 제공하고 지원하는 과정을 의미한다. 청각평가(hearing evaluation)란 보청기 선택 전에 청력역치 및 어음인지 능력을 측정하여 고객의 청력손실 형태와 정도 및 의사소통 정도를 파악하는 과정을 의미한다. 보청기 시험착용(hearing aid trial)이란 고객의 난청 상태에 적합한 보청기를 선택하기 위하여 보청기 선택 전 단계에서 고객의 청력 상태에 맞추어 조절한 보청기를 실제 경험하는 과정을 의미한다. 보청기 선택(hearing aid selection)이란 보청기 시험착용 결과, 청각 배경정보 등을 근거로 고객에게 적합한 보청기 종류를 결정하는 과정을 의미한다. 귀 인상 채취(ear impression)란 귀꽂이 또는 보청기 외형을 제작하기 위하여 외이도와 갑개 부분의 모양을 본 뜨는 과정을 의미한다. 보청기 조절(hearing aid adjustment)이란 보청기 착용시 물리적 편안함을 위하여 보청기의 외형적 특성 및 착용상태를 점검하여 필요시 변경하고, 또한 어음인지능력 향상과 음향적 편안함을 고려하여 청각평가 결과와 처방법을 근거로 보청기의 전기음향적 특징을 최적화하는 과정을 의미한다. 보청기 조절 검증(verification for hearing aid adjustment)이란 커플러 측정, 실이측정 또는 음장측정과 전기음향 및 심리음향적 측면의 설문지 응답을 통하여 보청기 조절 결과를 평가하는 과정을 의미한다. 고객교육(client education)이란 보청기 작동방법, 보청기 점검방법 및 보청기 사용시 발생가능한 문제 해결방법 등 보청기 사용과 관련된 정보와 보청기에 대한 고객의 현실적 기대치 확립에 필요한 정보를 제공하는 과정을 의미한다. 청능훈련(auditory training)이란 난청인의 의사소통능력 향상을 위한 일정 기간에 걸친 집중적이고 반복적인 듣기연습과 의사소통전략을 포함한 학습 과정을 의미한다. 착용 결과측정(outcome measurements)이란 음향 및 심리사회적 측면에서 보청기 사용자의 착용 결과를 다차원적으로 평가하는 과정으로 일반적으로 보청기 사용자의 어음지각 정도, 객관적 혜택, 소리의 질적 향상, 듣기 위한 노력 정도의 변화, 보청기 사용빈도, 만족도 등 객관적 평가와 주관적 평가를 모두 포함한다. 종합보고서(comprehensive report) 또는 결과 보고서란 보청기 적합관리의 전반적인 과정에서 발생하는 주요 정보를 반영하는 보고서를 의미한다. 귀꽂이(ear mold)란 개별적으로 제작하거나 선택한 보청기와 외이도 간의 기계음향적 연결장치를 의미한다. 고객 배경정보(client profile)란 고객의 청각적 배경정보뿐 아니라 청각기능, 사회적 상황, 활동 기회, 보청기의 필요성, 기대치 등을 포함하는 청각 관련 포괄적 정보를 의미한다. 적합 시스템(fitting system)이란 보청기 조절을 위해 사용하는 컴퓨터 및 적합 소프트웨어 등의 장비 세트를 의미한다. 보청기 초기설정(pre-setting of hearing aids)이란 적합공식 및 관련 청각 정보를 근거로 한 보청기 조절을 의미한다. 미세조율(fine-tuning)이란 개별 난청인의 필요 및 선호에 가장 잘 부합하도록 하는 보청기 시스템의 조율을 의미한다.
도 1은 본 발명의 일 실시예에 따른 시스템을 설명하기 위한 도면이다.
본 발명에 따른 시스템은 서버(10), 보청기(20) 및 전자 장치(30)로 구성될 수 있다.
서버(10)는 전자 장치(30)로부터 다양한 데이터를 수신하여 분석하기 위한 구성이다. 서버(10)는 보청기를 보정하기 위한 다양한 데이터를 수집하고, 수집된 데이터를 바탕으로 보청기를 보청하기 위한 파라미터를 획득할 수 있다.
전자 장치(30)는 보청기 사용자의 보청기 사용과 관련된 다양한 데이터를 서버(10)로 전송하기 위한 구성이다. 전자 장치(30)는 스마트 폰으로 구현되어 보청기 사용자에 대한 다양한 데이터를 서버(10)로 전송할 수 있으나, 이에 한정되는 것은 아니다. 예를 들어, 전자 장치(30)는 보청기로 구현되며, 사용자 인터랙션에 따라 보청기 사용자의 데이터를 서버(10)로 전송할 수 있음은 물론이다.
나아가, 본 발명의 다양한 실시예에 따라 전자 장치(30)는 태블릿 PC(tablet personal computer), 이동 전화기(mobile phone), 영상 전화기, 전자책 리더기(e-book reader), 데스크탑 PC (desktop PC), 랩탑 PC(laptop PC), 넷북 컴퓨터(netbook computer), 워크스테이션(workstation), 서버, PDA(personal digital assistant), PMP(portable multimedia player), MP3 플레이어, 모바일 의료기기, 카메라, 또는 웨어러블 장치(wearable device) 중 적어도 하나를 포함할 수 있다. 다양한 실시 예에 따르면 웨어러블 장치는 엑세서리 형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘텍트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체 형(예: 전자 의복), 신체 부착 형(예: 스킨 패드(skin pad) 또는 문신), 또는 생체 이식 형(예: implantable circuit) 중 적어도 하나를 포함할 수 있다.
또 다른 실시 예로, 전자 장치(30)는 가전 제품(home appliance)일 수 있다. 가전 제품은, 예를 들면, 텔레비전, DVD 플레이어(Digital Video Disk player), 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스(set-top box), 홈 오토매이션 컨트롤 패널(home automation control panel), 보안 컨트롤 패널(security control panel), TV 박스(예: 삼성 HomeSync™, 애플TV™, 또는 구글 TV™), 게임 콘솔(예: Xbox™, PlayStation™), 전자 사전, 전자 키, 캠코더, 또는 전자 액자 중 적어도 하나를 포함할 수 있다.
또 다른 실시 예로, 전자 장치(30)는, 각종 의료기기(예: 각종 휴대용 의료측정기기(혈당 측정기, 심박 측정기, 혈압 측정기, 또는 체온 측정기 등), MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 또는 초음파기 등), 사물 인터넷 장치(internet of things)(예: 전구, 각종 센서, 전기 또는 가스 미터기, 스프링클러 장치, 화재경보기, 온도조절기(thermostat), 가로등, 토스터(toaster), 운동기구, 온수탱크, 히터, 보일러 등) 중 적어도 하나를 포함할 수 있다.
도 2는 본 발명의 일 실시예에 따른 보청기 보정 방법을 설명하기 위한 흐름도이다.
단계 S100에서, 서버(10)는 한국어 음성 데이터를 바탕으로 복수개의 주파수 대역을 획득할 수 있다.
단계 S200에서, 서버(10)는 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 획득할 수 있다.
단계 S300에서, 보청기(20)는 획득된 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 바탕으로 보청기(20)를 1차 보정할 수 있다.
일 실시예로, 제1 최대 출력값 및 후술하는 다양한 최대 출력값은, 최대 출력값을 바탕으로 증폭된 소리가 불쾌수준보다 크지 않으며, 보통 크기의 대화음 소리는 쾌적수준 범위에 있도록 설정될 수 있다. 따라서, 주파수 이득값에 의해 증폭된 소리가 최대 출력값 이상인 경우, 서버(10)는 주파수 이득값을 변경할 수 있다.
단계 S400에서, 서버(10)는 보청기 사용자의 청각 상태에 대한 데이터 및 보청기 사용자의 음성 데이터를 획득할 수 있다.
단계 S500에서, 보청기(20)는, 획득된 보청기 사용자의 청각 상태에 대한 데이터 및 보청기 사용자의 음성 데이터를 바탕으로 1차 보정된 보청기(20)를 2차 보정할 수 있다.
즉, 서버(10)는 한국어 음성 데이터를 바탕으로 보청기(20)를 1차 보정하여 한국인에게 적합하도록 보청기(20)를 보정하고, 보청기 사용자에 대한 다양한 데이터를 바탕으로 보청기 사용자에게 적합하도록 보청기(20)를 2차 보정할 수 있다.
도 3은 본 발명의 일 실시예에 따른 한국어 음성 데이터를 복수개의 주파수 대역으로 분류하는 방법을 설명하기 위한 흐름도이다.
단계 S210에서, 서버(10)는 한국어 음성 데이터를 8개의 주파수 대역으로 분류할 수 있다.
이때, 주파수 대역은 실험적으로 결정될 수 있다. 예를 들어, 주파수 단위는 만 19세~26세의 정상 청력인이 방음부스에서 녹음한 한국어 음성 데이터를 바탕으로 분류될 수 있다. 일 실시예로, 주파수 대역은, 224Hz 이하, 224Hz~447Hz, 447Hz~891Hz, 891Hz~1413Hz, 1413Hz~2239Hz, 2239Hz~3548Hz, 3548Hz~5623Hz, 5623Hz~11000Hz, 11000Hz 이상의 9개의 주파수 구간을 바탕으로 8개의 중심 주파수를 획득하고, 획득된 8개의 중심 주파수 각각에 대한 주파수 대역일 수 있다. 본 명세서에서, 8개의 중심 주파수는 250Hz, 500Hz, 800Hz, 1000Hz, 1600Hz, 2500Hz, 4000Hz, 6000Hz일 수 있으며, 8개의 주파수 대역은 중심 주파수로부터 기 설정된 범위 내의 주파수 대역일 수 있다.
일 실시예로, 8개의 주파수 대역은 0Hz~400Hz, 350Hz~750Hz, 700Hz~950HZ, 900HZ~1500Hz, 1400HZ~2300Hz, 2200Hz~3600Hz, 3500Hz~5500HZ, 5000HZ~11000Hz일 수 있다.
단계 S220에서, 서버(10)는 분류된 8개의 주파수 대역 각각에 대한 정반응률을 획득할 수 있다.
일 실시예로, 한국어 음성 데이터 문장은 상술한 8개의 주파수 대역을 바탕으로 high-pass 또는 low-pass cutoff 시켰으며, 이 8개의 주파수 대역은 각각 10개의 문장으로 구성될 수 있다. 또한 한국어 음성 데이터 문장은 10개의 문장 중 핵심단어 40개에 대한 정반응을 확인하여 기록되었으며, 문장은 45 dB의 크기로 제시되며, 문장대비 소음의 크기를 달리하여 주파수 대역에 따른 정반응률을 획득할 수 있다.
구체적으로, 도 10 low-pass 필터에 대한 정반응률을, 도 11은 high-pass 필터에 대한 정반응률을 도시한 그래프이며, 도 10 및 도 11에 도시된 그래프는 하기 표의 내용과 동일하다.
  Low-pass High-pass 평균
SNR
Hz
0 +5 0 +5 0 +5
224이하 0.00 0.00 2.05 0.23 1.02 0.11
224~447 4.00 17.50 3.86 1.14 3.93 9.32
447~891 30.50 54.33 9.77 2.05 20.14 28.19
891~1413 23.83 16.83 13.18 2.95 18.51 9.89
1413~2239 16.50 6.17 21.14 15.45 18.82 10.81
2239~3548 13.00 3.33 37.27 54.09 25.14 28.71
3548~5623 5.50 1.17 11.36 21.82 8.43 11.49
5623~11000 2.00 -0.50 1.36 2.27 1.68 0.89
11000이상 4.67 1.17 0.00 0.00 2.33 0.58
합계 100.00 100.00 100.00 100.00 100.00 100.00
단계 S230에서, 서버(10)는 획득된 정반응률에 기초하여 각각의 주파수 대역에 대한 각각의 가중치를 획득할 수 있다.일 실시예로, 서버(10)는 상기 표 1에 근거하여, 2239Hz~3548Hz 의 주파수 대역, 447Hz~891Hz의 주파수 대역, 3548Hz~5623Hz의 주파수 대역, 1413Hz~2239Hz대의 주파수 대역, 891Hz~1413Hz대의 주파수 대역, 224Hz~447Hz대의 주파수 대역, 5623Hz~11000Hz대의 주파수 대역, 11000Hz 이상의 주파수 대역, 224Hz 이하의 주파수 대역의 순서로 가중치의 크기를 결정할 수 있다. 일 실시예로, 가중치는 BIF (band-importance function)를 바탕으로 결정될 수 있다. BIF (band-importance function)는 음성의 명료성에 대한 서로 다른 주파수의 중요도에 대한 값으로 0에서 1사이의 값으로 결정될 수 있다. 이때 BIF는 SII(Speech Intelligibility Index, 어음 명료도 지수)를 바탕으로 결정될 수 있다. SII란 음성 명료도를 예측하기 위한 인덱스로, 하기 수학식 1에 의해 결정될 수 있다.
Figure 112020004962625-pat00001
이때, S는 percent correct score를 의미하며, 음성 데이터에 대한 정반응률과 관련된 값일 수 있다. P는 화자, 청취자의 숙련도 값을 의미하며, 정상인의 경우 1의 값을 가진다. Q 및 n는 피팅 상수를 의미할 수 있다.
단계 S240에서, 서버(10)는 가중치를 바탕으로 상기 제1 주파수 이득값 및 상기 제1 최대 출력값을 결정할 수 있다.
도 4는 본 발명의 일 실시예에 따른 대화음의 크기에 따른 파라미터 획득 방법을 설명하기 위한 흐름도이다.
단계 S260에서, 서버(10)는 한국어 음성 데이터의 대화음 크기를 판단할 수 있다.
이때, 대화음의 크기는 방음부스 내부에서 측정된 실험데이터를 바탕으로 획득될 수 있다. 이때의 실험 데이터는 후술하는 제1 음성 데이터일 수 있다.
구체적으로, 피검자는 기초청력검사를 거친 후, 피검자를 방음실 내의 중앙에 앉히고 피검자의 얼굴로부터 정면 1m 거리에 Sound Level Meter(SLM)를 설치. 피검자가 일반용 문장검사에 사용되는 문장을 읽는동안 검사자가 SLM을 사용하여 화자의 말소리 크기를 측정하고, 피검자는 3가지 강도(조용히 말할 때, 대화음 크기로 말할 때, 크게 말할 때)로 각각 말하게 하고 1/3옥타브 밴드의 주파수에 해당하는 LZeq값을 측정할 수 있다. 이에 대한 측정값은 하기 표 2와 같으며, 주파수 및 소리 강도에 따른 DB를 나타낸 그래프는 도 12와 같다.
  Vocal Effort frequency LZeq
  125 160 200 250 315 400 500 630 800 1000 1250 1600 2000 2500 3150 4000 5000 6300 8000
평균
 
 
Casual 27.45 29.30 39.05 41.22 30.75 25.00 31.58 26.52 29.03 22.42 21.25 24.70 20.53 18.95 18.62 19.83 19.45 17.02 17.17 52.93
Normal 32.02 34.10 50.80 54.85 46.22 44.12 47.72 44.65 45.67 39.15 33.25 36.23 32.90 29.05 27.62 24.82 25.53 24.17 24.67 59.28
Raised 31.87 36.18 51.92 59.57 54.98 50.32 56.73 53.98 55.40 50.32 45.47 48.67 43.78 40.57 39.22 35.27 32.70 29.32 29.60 65.75
표준
편차
Casual 2.10 5.31 7.35 11.22 8.60 6.16 9.28 6.93 6.58 3.88 8.11 7.56 4.30 4.77 4.85 5.44 4.81 5.68 5.05 2.37
Normal 11.19 5.62 4.30 5.16 5.90 6.94 5.44 3.20 5.87 3.61 7.46 6.80 5.72 4.06 6.11 5.52 4.46 6.01 4.91 4.55
Raised 10.56 12.02 4.02 5.03 8.29 8.66 8.44 5.63 6.70 5.95 10.04 10.02 8.86 6.87 9.48 7.87 4.87 7.61 6.27 6.58
단계 S270에서, 서버(10)는 대화음 크기가 기 설정된 범위 이내인 경우, 압축역치(Compression Threshold), 압축비율(Compression Ratio), 확장역치(Extension Threshold), 확장비율(Extension Ratio) 및 상기 가중치를 바탕으로 제1 파라미터를 결정하고, 상기 결정된 제1 파라미터를 바탕으로 제1 주파수 이득값 및 제1 최대 출력값을 결정할 수 있다.이때, 압축역치, 압축비율, 확장역치 및 확장비율은 비선형 증폭 방식을 이용하는 보청기에서 사용되는 것으로, 높은 강도의 대화음은 적게 변경하고 낮은 강도의 대화음은 높게 변경하기 위해 사용된다. 즉, 모든 강도의 대화음을 동일한 방법을 통해 증폭시키는 경우, 매우 작은 대화음이 충분히 증폭되지 않거나, 매우 큰 대화음은 과다하게 증폭되어 소리의 왜곡이 발생할 수 있으므로, 서버(10)는 대화음의 크기에 따라(압축역치에 따라) 대화음의 중폭 정도를 (압축비율을 이용하여)조절할 수 있다.구체적으로, 서버(10)는 대화음의 크기가 보통(normal) 대화음 크기인 경우에는 보청기 사용자의 개별 청력역치 및 상기에서 결정된 가중치를 바탕으로 제1 주파수 이득값 및 제1 최대 출력값을 결정할 수 있다.
그러나 서버(10)는 대화음의 크기가 보통(normal) 대화음 크기보다 작거나(Casual) 큰(Raised) 경우, 보청기 사용자의 개별 청력 역치 및 상기에서 결정된 가중치뿐만 아니라, 압축역치(Compression Threshold), 압축비율(Compression Ratio)를 더 고려하여 제1 주파수 이득값 및 제1 최대 출력값을 결정할 수 있다. 예를 들어, 2000Hz대에서의 LZeq가 45인 경우, 서버(10)는 대화음이 보통 대화음보다 큰 대화음으로 판단하고, 이에 대한 압축역치(Compression Threshold), 압축비율(Compression Ratio)를 고려하여 제1 주파수 이득값 및 제1 최대 출력값을 결정할 수 있다.
상술한 방법을 통해 서버(10)는 한국인에게 적합한 보청기(20)의 보정 방법을 획득할 수 있다. 일 실시예로, 도 13 및 14는 50 dB flat 난청 성인에 대한 입력음압레벨(input)과 압축역치레벨(CT)에 따른 각 주파수 대역에서의 주파수 이득값의 그래프를 나타낸다. 도 13 및 도 14를 참조하면, CT31에 대한 압축역치에 대한 주파수 이득값은 30db까지 증가하고 30db 이후로는 감소할 수 있다. CT41에 대한 압축역치에 대한 주파수 이득값은 40db까지 증가하고 40db 이후로는 감소할 수 있다. CT51에 대한 압축역치에 대한 주파수 이득값은 50db 근방까지는 일정하게 유지되며 그 이후로는 감소할 수 있다. CT61에 대한 압축역치에 대한 주파수 이득값은 60db 근방까지는 일정하게 유지되며 그 이후로는 감소할 수 있다. CT71에 대한 압축역치에 대한 주파수 이득값은 70db 근방까지는 일정하게 유지되며 그 이후로는 감소할 수 있다. 각각의 압축역치에 대한 주파수 이득값은 상술한 도 3의 실시예에 의해 획득될 수 있다.
한편, 본 발명의 일 실시예에 따라, 제1 파라미터는 각각의 조건에 따라 하기 공식이 적용되어 산출될 수 있다. 설명의 편의를 위해 X1은 HTL(Hearing Threshold Level), X2는 입력음의 크기, Y(XX)는 조건 XX에서의 제1 파라미터로 정의한다. 또한, 산출된 Y(XX)<0인 경우 Y(XX)=0으로 처리하는 것으로 가정한다. 또한, 상술한 8개의 주파수 대역은 중심 주파수 250Hz에 대한 제1 주파수 대역, 중심 주파수 500Hz에 대한 제2 주파수 대역, 중심 주파수 800Hz에 대한 제3 주파수 대역, 중심 주파수 1000Hz에 대한 제4 주파수 대역, 중심 주파수 1600Hz에 대한 제5 주파수 대역, 중심 주파수 2500Hz에 대한 제6 주파수 대역, 중심 주파수 4000Hz에 대한 제7 주파수 대역, 중심 주파수 6000Hz에 대한 제8 주파수 대역이라고 가정한다.
제1 실시예로, 확장역치레벨(ET)이 ET30, X2=<30dB SPL(Sound Pressure Level)에서 각각의 주파수 대역에 대한 제1 파라미터 Y(ET30)은, 제1 주파수 대역에서 Y(ET30)=0.714X1 + 0.041X2 - 37.243, 제2 주파수 대역에서 Y(ET30)=0.630X1 + 0.201X2 - 20.364, 제3 주파수 대역에서 Y(ET30)=0.598X1 + 0.251X2 - 13.206, 제4 주파수 대역에서 Y(ET30)=0.566X1 + 0.288X2 - 3.016, 제5 주파수 대역에서 Y(ET30)=0.548X1 + 0.289X2 - 0.327, 제6 주파수 대역에서 Y(ET30)=0.513X1 + 0.289X2 + 2.934, 제7 주파수 대역에서 Y(ET30)=0.302X1 + 0.167X2 + 4.271, 제8 주파수 대역에서 Y(ET30)=0.240X1 + 0.128X2 + 1.266일 수 있다.
제2 실시예로, 확장역치레벨(ET)이 ET40, X2=<40dB SPL에서 각각의 주파수 대역에 대한 제1 파라미터 Y(ET40)은, 제1 주파수 대역에서 Y(ET40)=0.714X1 + 0.016X2 - 37.243, 제2 주파수 대역에서 Y(ET40)=0.630X1 + 0.075X2 - 20.364, 제3 주파수 대역에서 Y(ET40)=0.598X1 + 0.094X2 - 13.206, 제4 주파수 대역에서 Y(ET40)=0.566X1 + 0.108X2 - 3.016, 제5 주파수 대역에서 Y(ET40)=0.548X1 + 0.108X2 - 0.327, 제6 주파수 대역에서 Y(ET40)=0.513X1 + 0.108X2 + 2.934, 제7 주파수 대역에서 Y(ET40)=0.302X1 + 0.063X2 + 4.271, 제8 주파수 대역에서 Y(ET40)=0.240X1 + 0.048X2 + 1.266일 수 있다.
제3 실시예로, X2=<40dB SPL이고, 선형 증폭 방식을 이용하는 보청기에서 각각의 주파수 대역에 대한 제1 파라미터 Y(Lin1)은,
제1 주파수 대역에서 Y(Lin1)=0.714X1 - 37.243, 제2 주파수 대역에서 Y(Lin1)=0.630X1 - 20.364, 제3 주파수 대역에서 Y(Lin1)=0.598X1 - 13.206, 제4 주파수 대역에서 Y(Lin1)=0.566X1 - 3.016, 제5 주파수 대역에서 Y(Lin1)=0.548X1 - 0.327, 제6 주파수 대역에서 Y(Lin1)=0.513X1 + 2.934, 제7 주파수 대역에서 Y(Lin1)=0.302X1 + 4.271, 제8 주파수 대역에서 Y(Lin1)=0.240X1 + 1.266일 수 있다.
제4 실시예로, X2=<50dB SPL이고, 선형 증폭 방식을 이용하는 보청기에서 각각의 주파수 대역에 대한 제1 파라미터 Y(Lin2)은, 제1 주파수 대역에서 Y(Lin2)=0.714X1 - 37.243, 제2 주파수 대역에서 Y(Lin2)=0.630X1 - 20.364, 제3 주파수 대역에서 Y(Lin2)=0.598X1 - 13.206, 제4 주파수 대역에서 Y(Lin2)=0.566X1 - 3.016, 제5 주파수 대역에서 Y(Lin2)=0.548X1 - 0.327, 제6 주파수 대역에서 Y(Lin2)=0.513X1 + 2.934, 제7 주파수 대역에서 Y(Lin2)=0.302X1 + 4.271, 제8 주파수 대역에서 Y(Lin2)=0.240X1 + 1.266일 수 있다.
제5 실시예로, X2=<60dB SPL이고, 선형 증폭 방식을 이용하는 보청기에서 각각의 주파수 대역에 대한 제1 파라미터 Y(Lin3)은, 제1 주파수 대역에서 Y(Lin3)=0.714X1 - 37.243, 제2 주파수 대역에서 Y(Lin3)=0.630X1 - 20.364, 제3 주파수 대역에서 Y(Lin3)=0.598X1 - 13.206, 제4 주파수 대역에서 Y(Lin3)=0.566X1 - 3.016, 제5 주파수 대역에서 Y(Lin3)=0.548X1 - 0.327, 제6 주파수 대역에서 Y(Lin3)=0.513X1 + 2.934, 제7 주파수 대역에서 Y(Lin3)=0.302X1 + 4.271, 제8 주파수 대역에서 Y(Lin3)=0.240X1 + 1.266일 수 있다.
제6 실시예로, 압축역치레벨(CT)이 CT31, X2>=31dB SPL에서 각각의 주파수 대역에 대한 제1 파라미터 Y(CT31)은, 제1 주파수 대역에서 Y(CT31)=0.714X1 - 0.062X2 - 34.143, 제2 주파수 대역에서 Y(CT31)=0.630X1 - 0.301X2 - 5.314, 제3 주파수 대역에서 Y(CT31)=0.598X1 - 0.377X2 + 5.644, 제4 주파수 대역에서 Y(CT31)=0.566X1 - 0.432X2 + 18.584, 제5 주파수 대역에서 Y(CT31)=0.548X1 - 0.433X2 + 21.323, 제6 주파수 대역에서 Y(CT31)=0.513X1 - 0.433X2 + 24.584, 제7 주파수 대역에서 Y(CT31)=0.302X1 - 0.250X2 + 16.771, 제8 주파수 대역에서 Y(CT31)=0.240X1 - 0.192X2 + 10.866일 수 있다.
제7 실시예로, 압축역치레벨(CT)이 CT41, X2>=41dB SPL에서 각각의 주파수 대역에 대한 제1 파라미터 Y(CT41)은, 제1 주파수 대역에서 Y(CT41)=0.714X1 - 0.062X2 - 34.143, 제2 주파수 대역에서 Y(CT41)=0.630X1 - 0.301X2 - 5.314, 제3 주파수 대역에서 Y(CT41)=0.598X1 - 0.377X2 + 5.644, 제4 주파수 대역에서 Y(CT41)=0.566X1 - 0.432X2 + 18.584, 제5 주파수 대역에서 Y(CT41)=0.548X1 - 0.433X2 + 21.323, 제6 주파수 대역에서 Y(CT41)=0.513X1 - 0.433X2 + 24.584, 제7 주파수 대역에서 Y(CT41)=0.302X1 - 0.250X2 + 16.771, 제8 주파수 대역에서 Y(CT41)=0.240X1 - 0.192X2 + 10.866일 수 있다.
제8 실시예로, 압축역치레벨(CT)이 CT51, X2>=51dB SPL에서 각각의 주파수 대역에 대한 제1 파라미터 Y(CT51)은, 제1 주파수 대역에서 Y(CT51)=0.714X1 - 0.062X2 - 34.143, 제2 주파수 대역에서 Y(CT51)=0.630X1 - 0.301X2 - 5.314, 제3 주파수 대역에서 Y(CT51)=0.598X1 - 0.377X2 + 5.644, 제4 주파수 대역에서 Y(CT51)=0.566X1 - 0.432X2 + 18.584, 제5 주파수 대역에서 Y(CT51)=0.548X1 - 0.433X2 + 21.323, 제6 주파수 대역에서 Y(CT51)=0.513X1 - 0.433X2 + 24.584, 제7 주파수 대역에서 Y(CT51)=0.302X1 - 0.250X2 + 16.771, 제8 주파수 대역에서 Y(CT51)=0.240X1 - 0.192X2 + 10.866일 수 있다.
제9 실시예로, 압축역치레벨(CT)이 CT61, X2>=61dB SPL에서 각각의 주파수 대역에 대한 제1 파라미터 Y(CT61)은, 제1 주파수 대역에서 Y(CT61)=0.714X1 - 0.078X2 - 33.507, 제2 주파수 대역에서 Y(CT61)=0.630X1 - 0.37625X2 +2.211, 제3 주파수 대역에서 Y(CT61)=0.598X1 - 0.47125X2 + 15.069, 제4 주파수 대역에서 Y(CT61)=0.566X1 - 0.540X2 + 29.384, 제5 주파수 대역에서 Y(CT61)=0.548X1 - 0.54125X2 + 32.148, 제6 주파수 대역에서 Y(CT61)=0.513X1 - 0.54125X2 + 35.409, 제7 주파수 대역에서 Y(CT61)=0.302X1 - 0.3125X2 + 23.021, 제8 주파수 대역에서 Y(CT61)=0.240X1 - 0.240X2 + 15.666일 수 있다.
제10 실시예로, 압축역치레벨(CT)이 CT71, X2>=71dB SPL에서 각각의 주파수 대역에 대한 제1 파라미터 Y(CT71)은, 제1 주파수 대역에서 Y(CT71)=0.714X1 - 0.103333X2 - 30.0097, 제2 주파수 대역에서 Y(CT71)=0.630X1 - 0.501667X2 +14.75267, 제3 주파수 대역에서 Y(CT71)=0.598X1 - 0.628333X2 + 30.77733, 제4 주파수 대역에서 Y(CT71)=0.566X1 - 0.720X2 + 47.384, 제5 주파수 대역에서 Y(CT71)=0.548X1 - 0.7217X2 + 50.192, 제6 주파수 대역에서 Y(CT71)=0.513X1 - 0.7217X2 + 53.453, 제7 주파수 대역에서 Y(CT71)=0.302X1 - 0.41667X2 + 33.43767, 제8 주파수 대역에서 Y(CT71)=0.240X1 - 0.320X2 + 23.666일 수 있다.
도 5는 본 발명의 일 실시예에 따른 인공지능모델을 이용한 주파수 대역 획득 방법을 설명하기 위한 흐름도이다.
단계 S211에서, 서버(10)는 제1 음성 데이터를 획득할 수 있다. 구체적으로 서버(10)는 성인용 한국 표준 문장 목록 (KS-SL-A)에 포함된 텍스트를 방음부스 내부에서 생성하되, 한국어 음성 데이터의 발화자는 방음부스 중앙에 위치하고 상기 발화자의 정면 1M에 마이크가 위치하여, 상기 마이크를 통해 제1 음성 데이터를 획득할 수 있다.
단계 S211에서 획득되는 제1 음성 데이터는 상술한 도 3 및 도 4에서의 제1 주파수 이득값 및 제1 최대 출력값을 획득하기 위한 데이터로 사용될 수 있다. 그러나 성인용 한국 표준 문장 목록 (KS-SL-A)에 포함된 텍스트만을 바탕으로 제1 주파수 이득값 및 제1 최대 출력값을 결정하는 것은 다양한 단어 및 문장을 포함하기 못하기 때문에, 서버(10)는 일상 생활에서 수집 가능한 다양한 한국어 음성 데이터를 수집하고 변환하여 제1 주파수 이득값 및 제1 최대 출력값을 결정하기 위한 데이터로 사용할 수 있다.
이를 위해, 단계 S212에서, 서버(10)는 제1 음성 데이터를 학습 데이터로 하여 인공지능 모델에 입력하여 한국어 음성 데이터에 대한 특징값을 추출하도록 인공지능 모델을 학습시킬 수 있다.
*단계 S213에서, 서버(10)는 노이즈가 포함된 제2 음성 데이터를 학습된 인공지능 모델에 입력하여 제2 음성 데이터에 대한 특징값을 추출하고, 추출된 특징값을 바탕으로 제2 음성 데이터를 보정할 수 있다. 제2 음성 데이터는 한국어가 포함된 음성 데이터로, 다양한 환경에서 수집 가능한 음성 데이터일 수 있다. 예를 들어, 영상 컨텐츠에서 출력되는 음성 데이터, 거리에서 수집되는 음성 데이터 등 다양할 수 있다.
즉, 서버(10)는 제1 음성 데이터를 바탕으로 학습된 인공지능모델에 제2 음성 데이터를 입력하여, 제2 음성 데이터를 보청기 보정에 적합한 제1 음성 데이터의 형식으로 보정할 수 있다. 구체적으로, 서버(10)는 제1 음성데이터의 특징값을 추출하고, 제2 음성 데이터의 특징값을 추출하여, 제1 음성데이터의 특징값을 바탕으로 제2 음성 데이터의 특징값을 보정하고, 보정된 제2 음성 데이터의 특징값을 바탕으로 제2 음성 데이터를 보정할 수 있다.
단계 S214에서, 서버(10)는 제1 음성 데이터 및 보정된 제2 음성 데이터를 포함하는 한국어 음성 데이터를 바탕으로 복수개의 주파수 대역을 획득할 수 있다.
상술한 바와 같이 서버(10)는 다양한 한국어 음성 데이터를 획득하여, 한국인에게 더욱 적합한 보청기(20)의 보정 방법을 결정할 수 있으며, 나아가, 새롭게 발생하는 신조어, 은어, 줄임말 등 시대에 따른 다양한 단어 및 문장을 반영할 수 있는 효과가 존재한다.
도 6은 본 발명의 일 실시예에 따른 보청기를 2차 보정하는 방법을 설명하기 위한 흐름도이다.
도 3 내지 도 5에서는 한국인이 사용하는 전반적인 한국어 음성 데이터에 따라 보청기(20)를 1차 보정하였으나, 보청기 사용자 각각에게 적합한 보청기를 2차 보정할 수 있는 방법이 필요할 수 있다.
따라서, 단계 S410에서, 서버(10)는 보청기 사용자의 청각 상태에 대한 데이터를 바탕으로, 복수개의 주파수 대역 각각에 대한 주파수 이득값 및 최대 출력값을 보정하여 제2 주파수 이득값 및 제2 최대 출력값을 획득할 수 있다. 이때, 사용자의
단계 S420에서, 서버(10)는 보청기 사용자의 음성 데이터를 바탕으로 보청기(20)가 감지하는 음원의 파형을 보정하기 위한 특징값을 추출할 수 있다.
구체적으로, 보청기 사용자에 의해 생성되는 음성 데이터가 보청기(20)를 통과하여 보정된 경우, 보청기 사용자의 실제 목소리와 보청기 사용자의 귀에 들리는 목소리가 달라질 수 있다. 따라서, 서버(10)는 음성 데이터의 크기를 증폭시키는 것뿐만 아니라 음성 데이터의 파형을 실제 음성 데이터와 유사하게 보정하기 위하여 음원의 파형에 대한 특징값을 획득하여 음성 데이터를 보정할 수 있다.
단계 S510에서, 보청기(20)는 제2 주파수 이득값, 상기 제2 최대 출력값 및 음원의 파형을 보정하기 위한 특징값을 바탕으로 1차 보정된 보청기(20)를 2차 보정할 수 있다.
도 7은 본 발명의 일 실시예에 따른 보청기를 3차 보정하는 방법을 설명하기 위한 흐름도이다.
단계 S610에서, 보청기(20)는, 보청기(20)로 입력되는 음성 데이터를 전자 장치(30)로 전송할 수 있다.
구체적으로, 보청기(20)는 마이크로폰을 통해 감지되는 음성 데이터 및 리시버를 통해 출력되는 음성 데이터 모두를 전자 장치(30)로 전송할 수 있다. 이를 위해, 보청기(20)는 통신부 및 메모리를 더 포함할 수 있다. 보청기(20)와 전자 장치(30)는 블루투스로 연결될 수 있다. 또한, 보청기(20)의 메모리는 보청기(20)의 소형화를 위해 최소한의 데이터를 저장할 수 있으며, 저장 후 전자 장치(30)로 전송된 음성 데이터는 곧바로 삭제되어 다음 음성 데이터를 저장할 수 있다. 보청기(20)는 메모리의 저장 공간을 바탕으로 음성 데이터 전송 주기를 판단할 수 있다. 즉, 메모리 저장 공간이 기 설정된 비율 이상 차는 경우에 한하여, 보청기(20)는 음성 데이터를 전자 장치(30)로 전송할 수 있다. 상술한 방법을 통해 보청기(20)가 전자 장치(30)로 음성 데이터를 전송하는 횟수를 최소화 하여 보청기(20)의 불필요한 전력 소모를 방지할 수 있다.
또 다른 실시예로, 보청기(20)는 메모리 저장 공간이 기 설정된 비율 이상 차는 경우 전자 장치(30)와의 통신 연결을 수행하고, 음성 데이터 전송 후 통신 연결을 차단하여 보청기(20)의 불필요한 전력 소모를 방지할 수 있다.
또 다른 실시예로, 전자 장치(30)와의 통신 연결이 불가능하다고 판단한 경우, 보청기(20)는 마이크로폰 또는 리시버를 통해 획득된 음성 데이터를 메모리에 저장하지 않을 수 있다.
단계 S620에서, 전자 장치(30)는 수신한 음성 데이터를 서버(10)로 전송할 수 있다.
단계 S630에서, 서버(10)는 기 설정된 조건을 만족하면, 수신한 음성 데이터를 바탕으로 보청기(20)를 3차 보정하기 위한 제3 주파수 이득값 및 제3 최대 출력값을 획득할 수 있다.
이때, 기 설정된 조건이란, 수신한 음성데이터의 양에 기초한 조건일 수 있다. 즉, 서버(10)는 수신한 음성 데이터의 양이 기 설정된 양 이상인 경우, 수신한 음성 데이터를 바탕으로 보청기(20)를 3차 보정하기 위한 제3 주파수 이득값 및 제3 최대 출력값을 획득할 수 있다.
단계 S640에서, 보청기(20)는 제3 주파수 이득값 및 제3 최대 출력값을 바탕으로 2차 보정된 보청기(20)를 3차 보정할 수 있다.
도 8은 본 발명의 일 실시예에 따른 보청기를 4차 보정하는 방법을 설명하기 위한 흐름도이다.
단계 S710에서, 서버(10)는 보청기 사용자의 생활 공간에서의 배경 소음에 대한 정보, 상기 보청기 사용자의 발화 속도에 대한 정보 및 일반인의 평균 발화 속도에 대한 정보를 포함하는 배경정보를 수집할 수 있다.
단계 S720에서, 서버(10)는 수집된 배경정보를 바탕으로 상기 청능훈련프로그램에 포함될 배경 소음 및 발화 속도를 결정할 수 있다.
단계 S730에서, 서버(10)는 상기 결정된 배경 소음 및 발화 속도를 바탕으로 청능훈련프로그램을 생성할 수 있다. 이때, 생성된 청능훈련프로그램은 보청기 사용자의 배경정보에 따라 시각단서, 음소, 단어 및 문장의 난이도, 문장 길이, 환경음 및 음악의 포함 여부가 결정될 수 있다.
일 실시예로, 보청기 사용자의 발화 속도가 일반인의 평균 발화 속도보다 느린 경우, 서버(10)는 보청기 사용자의 발화 속도를 기준으로 청능훈련프로그램의 발화 속도를 결정하고, 점차적으로 청능훈련프로그램의 발화 속도를 일반인의 평균 발화 속도로 증가시킬 수 있다. 또는, 보청기 사용자의 발화 속도가 일반인의 평균 발화 속도보다 빠른 경우, 서버(10)는 일반인의 평균 발화 속도를 기준으로 청능훈련프로그램의 발화 속도를 결정하고, 점차적으로 청능훈련프로그램의 발화 속도를 보청기 사용자의 발화 속도로 증가시킬 수 있다.
또 다른 실시예로, 서버(10)는 보청기 사용자의 주변 환경 정보를 바탕으로 청능훈련프로그램을 생성할 수 있다. 예를 들어, 서버(10)는 보청기 사용자의 댁내에서의 배경 소음 정보, 직장에서의 배경 소음 정보, 이동 경로에서의 배경 소음 정보를 획득하고, 획득된 배경 소음 정보를 바탕으로 청능훈련프로그램을 생성할 수 있다.
단계 S740에서, 서버(10)는 보청기 사용자로부터 상기 청능훈련프로그램 및 보청기 착용에 대한 결과 데이터를 수신할 수 있다.
단계 S750에서, 서버(10)는 결과 데이터를 바탕으로 3차 보정된 보청기(20)를 4차 보정할 수 있다.
구체적으로, 단계 S751에서, 서버(10)는 청능훈련프로그램에 대한 결과 데이터 중 기 설정된 비율 이상의 오답률을 가지는 주파수 구간을 획득할 수 있다.
단계 S752에서, 서버(10)는 획득된 주파수 구간의 주파수 이득값을 상기 제3 주파수 이득값 이상으로 보정할 수 있다.
즉, 서버(10)는 청능훈련프로그램에 대한 결과 데이터 중 오답률이 기 설정된 비율 이상되는 음성 데이터에 대한 주파수 대역을 획득하고, 획득된 주파수 대역의 소리를 증폭시킬 수 있다. 구체적으로, 서버(10)는 앞서 보정된 제3 주파수 이득값 이상으로 제4 주파수 이득값을 결정할 수 있다. 그러나, 제3 주파수 이득값에 의한 음성 데이터의 증폭값은 제3 최대 출력값 이하가 되도록 제4 주파수 이득값이 결정될 수 있음은 물론이다.
도 9는 본 발명의 일 실시예에 따른 보청기에 대한 사용 데이터를 획득하는 방법을 설명하기 위한 흐름도이다.
단계 S731에서, 서버(10)는 복수의 보청기 사용자 각각에 대한 복수의 제1 데이터를 저장할 수 있다. 이때 복수의 제1 데이터는 배경정보, 설문문항에 대한 답변정보 및 상기 답변정보로부터 획득된 상세정보를 포함할 수 있다.
나아가, 서버(10)는 배경정보, 배경정보를 기초로 획득된 기초정보, 기초정보를 바탕으로 생성된 설문문항, 설문문항에 대한 답변정보 및 답변정보로부터 생성된 결과정보 모두를 제1 데이터로 저장할 수 있음은 물론이다. 이때 서버(10)는 획득된 배경정보, 기초정보, 설문문항, 답변정보 및 결과정보를 사용자별로 저장할 수 있다. 즉 저장된 제1 데이터는 제1 사용자에 대한 배경정보, 기초정보, 설문문항, 답변정보 및 결과정보, 제2 사용자에 대한 배경정보, 기초정보, 설문문항, 답변정보 및 결과정보정보 등으로 그룹화 될 수 있다.
단계 S732에서, 서버(10)는 복수의 보청기 사용자에 대한 복수의 제2 데이터를 상기 복수의 사용자 별로 저장할 수 있다. 이때 제2 데이터는 청능훈련프로그램 및 보청기 착용에 대한 결과 데이터를 포함할 수 있다.
단계 S733에서, 서버(10)는 복수의 제1 데이터를 클러스터링하여 복수의 제1 클러스터를 획득할 수 있다.
즉, 서버(10)는 복수의 보청기 사용자에 대한 데이터를 유사한 데이터끼리 그룹화 할 수 있다.
다만, 이에 한정되는 것은 아니며, 일 실시예로, 서버(10)는 배경정보, 기초정보, 설문문항, 답변정보 및 결과정보에 대한 데이터 각각에 대하여 클러스터링을 수행할 수도 있음은 물론이다. 이 경우, 서버(10)는 복수의 배경정보 클러스터, 기초정보 클러스터, 설문문항 클러스터, 답변정보 클러스터 및 결과정보 클러스터를 각각 획득할 수 있다. 서버(10)는 각각의 배경정보 클러스터, 기초정보 클러스터, 설문문항 클러스터, 답변정보 클러스터 및 결과정보 클러스터를 매칭하여 저장할 수 있다. 구체적으로, 서버(10)는 제1 배경정보 클러스터와 연관된 제1 기초정보 클러스터, 제1 기초정보 클러스터와 연관된 제1 설문문항 클러스터, 제1 설문문항 클러스터와 연관된 제1 답변정보 클러스터 및 제1 답변정보 클러스터와 연관된 제1 결과정보 클러스터는 매칭하여 하나의 제1 그룹을 획득할 수 있다. 동일한 방법으로 서버(10)는 각각의 배경정보 클러스터, 기초정보 클러스터, 설문문항 클러스터, 답변정보 클러스터 및 결과정보 클러스터에 대한 모든 클러스터들을 매칭하여 그룹화 할 수 있다. 서버(10)는 그룹화된 복수의 그룹에 대한 데이터를 클러스터링하여 복수의 제1 클러스터를 획득할 수 있다.
즉, 서버(10)는 제1 데이터에 포함된 배경정보, 기초정보, 설문문항, 답변정보 및 결과정보를 각각 분류하고, 분류된 결과를 바탕으로 실제 사용자에 대한 데이터가 아닌 가상의 (이상적인)사용자에 대한 데이터를 획득할 수 있다. 예를 들어, 실제 사용자에 대한 제1 데이터를 바탕으로 클러스터링을 수행하는 경우에는, 실제 사용자가 설문문항에 대한 답변정보를 잘못 입력하여 정확한 상세정보가 획득되지 않는 경우 데이터 분류 및 분석에 오류가 있을 수 있다. 따라서, 각각의 사용자들이 획득한 정보만을 바탕으로 배경정보, 기초정보, 설문문항, 답변정보 및 결과정보에 대한 그룹을 생성하는 경우, 상술한 오류를 줄일 수 있는 효과가 있다.
단계 S734에서, 서버(10)는 복수의 제2 데이터를 클러스터링하여 복수의 제2 클러스터를 획득할 수 있다.
단계 S735에서, 서버(10)는 새로운 제1 보청기 사용자에 대한 배경정보 및 답변정보를 획득할 수 있다.
나아가, 서버(10)는 제1 보청기 사용자로부터 배경정보, 기초정보, 설문문항, 답변정보 및 결과정보 모두를 수신할 수 있음은 물론이다.
단계 S736에서, 서버(10)는 복수의 제1 클러스터 중 제1 보청기 사용자에 대한 배경정보 및 답변정보와 관련된 제1-1 클러스터를 판단할 수 있다.
단계 S737에서, 서버(10)는 복수의 제2 클러스터 중 제1-1 클러스터와 기 설정된 거리내에 존재하는 제2-1 클러스터를 판단할 수 있다.
단계 S738에서, 서버(10)는 제2-1 클러스터에 포함된 데이터를 바탕으로 제1 보청기 사용자에게 적합한 청능훈련프로그램을 생성할 수 있다.
즉, 제1 보청기 사용자는 제1-1 클러스터에 속한 보청기 사용자와 유사한 배경정보를 가질 것이다. 따라서, 서버(10)는 제1-1 클러스터의 사용자와 연관된 제2-1 클러스터를 획득하고, 제2-1클러스터를 획득하고, 획득된 제2-1 클러스터에 포함된 데이터를 바탕으로 제1 보청기 사용자에게 적합한 청능훈련프로그램을 생성할 수 있다.
다만, 본 발명의 다양한 실시예에 따라 서버(10)는 복수의 보청기 사용자의 시험착용데이터를 저장하고, 클러스터링하여 복수의 제3 클러스터를 생성할 수 있다. 이때, 시험착용데이터란, 복수의 보청기 사용자가 1차 보정된 보청기를 사용하여 획득된 데이터로서, 도 6에서 설명한 2차 보정을 위해 사용되는 데이터 또는 도 7에서 설명한 3차 보정을 위해 사용되는 데이터를 의미할 수 있다. 서버(10)는 복수의 제3 클러스터 중 제1-1 클러스터와 기 설정된 거리 내에 존재하는 제3-1 클러스터를 판단하고, 복수의 제2 클러스터 중 제3-1 클러스터와 기 설정된 거리 내에 존재하는 제2-1 클러스터를 판단할 수도 있음은 물론이다. 또는, 서버(10)는 제2-1 클러스터가 제1-1 클러스터 및 제3-1 클러스터 모두와 기 설정된 거리 이내가 되도록 제2-1 클러스터를 결정할 수도 있음은 물론이다.
도 15는 일 실시 예에 따른 장치의 구성도이다.
프로세서(102)는 하나 이상의 코어(core, 미도시) 및 그래픽 처리부(미도시) 및/또는 다른 구성 요소와 신호를 송수신하는 연결 통로(예를 들어, 버스(bus) 등)를 포함할 수 있다.
일 실시예에 따른 프로세서(102)는 메모리(104)에 저장된 하나 이상의 인스트럭션을 실행함으로써, 도 1 내지 도 9와 관련하여 설명된 방법을 수행한다.
예를 들어, 프로세서(102)는 메모리에 저장된 하나 이상의 인스트럭션을 실행함으로써 신규 학습용 데이터를 획득하고, 학습된 모델을 이용하여, 상기 획득된 신규 학습용 데이터에 대한 테스트를 수행하고, 상기 테스트 결과, 라벨링된 정보가 소정의 제1 기준값 이상의 정확도로 획득되는 제1 학습용 데이터를 추출하고, 상기 추출된 제1 학습용 데이터를 상기 신규 학습용 데이터로부터 삭제하고, 상기 추출된 학습용 데이터가 삭제된 상기 신규 학습용 데이터를 이용하여 상기 학습된 모델을 다시 학습시킬 수 있다.
한편, 프로세서(102)는 프로세서(102) 내부에서 처리되는 신호(또는, 데이터)를 일시적 및/또는 영구적으로 저장하는 램(RAM: Random Access Memory, 미도시) 및 롬(ROM: Read-Only Memory, 미도시)을 더 포함할 수 있다. 또한, 프로세서(102)는 그래픽 처리부, 램 및 롬 중 적어도 하나를 포함하는 시스템온칩(SoC: system on chip) 형태로 구현될 수 있다.
메모리(104)에는 프로세서(102)의 처리 및 제어를 위한 프로그램들(하나 이상의 인스트럭션들)을 저장할 수 있다. 메모리(104)에 저장된 프로그램들은 기능에 따라 복수 개의 모듈들로 구분될 수 있다.
본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.
본 발명의 구성 요소들은 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 애플리케이션)으로 구현되어 매체에 저장될 수 있다. 본 발명의 구성 요소들은 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있으며, 이와 유사하게, 실시 예는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다.
이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.
10: 서버
20: 보청기
30: 전자 장치

Claims (1)

  1. 서버 및 보청기에 의해 수행되는 보청기 시스템의 제어 방법에 있어서,
    상기 서버가, 한국어 음성 데이터를 바탕으로 복수개의 주파수 대역을 획득하는 단계;
    상기 서버가, 상기 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 획득하는 단계;
    상기 보청기가, 상기 획득된 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 바탕으로 상기 보청기를 1차 보정하는 단계;
    상기 서버가, 보청기 사용자의 청각 상태에 대한 데이터 및 상기 보청기 사용자의 음성 데이터를 획득하는 단계; 및
    상기 보청기가, 상기 보청기 사용자의 청각 상태에 대한 데이터 및 상기 보청기 사용자의 음성 데이터를 바탕으로 상기 1차 보정된 보청기를 2차 보정하는 단계; 를 포함하고,
    상기 보청기 사용자의 청각 상태에 대한 데이터 및 상기 보청기 사용자의 음성 데이터를 획득하는 단계는,
    상기 보청기 사용자의 청각 상태에 대한 데이터를 바탕으로, 복수개의 주파수 대역 각각에 대한 상기 주파수 이득값 및 상기 최대 출력값을 보정하여 제2 주파수 이득값 및 제2 최대 출력값을 획득하는 단계;
    상기 보청기 사용자의 음성 데이터를 바탕으로 상기 보청기가 감지하는 음원의 파형을 보정하기 위한 특징값을 추출하는 단계;를 포함하고,
    상기 2차 보정하는 단계는,
    상기 제2 주파수 이득값, 상기 제2 최대 출력값 및 음원의 파형을 보정하기 위한 특징값을 바탕으로 상기 1차 보정된 보청기를 2차 보정하는 단계;를 포함하고,
    상기 제어 방법은,
    상기 보청기가, 상기 보청기로부터 입력되는 음성 데이터를 전자 장치로 전송하는 단계;
    상기 전자 장치가, 수신한 상기 음성 데이터를 상기 서버로 전송하는 단계;
    상기 서버가, 기 설정된 조건을 만족하면, 수신한 상기 음성 데이터를 바탕으로 상기 보청기를 3차 보정하기 위한 제3 주파수 이득값 및 제3 최대 출력값을 획득하는 단계; 및
    상기 보청기가, 상기 제3 주파수 이득값 및 제3 최대 출력값을 바탕으로 상기 2차 보정된 보청기를 3차 보정하는 단계; 를 포함하고,
    상기 제어 방법은,
    상기 서버가, 상기 보청기 사용자의 생활 공간에서의 배경 소음에 대한 정보, 상기 보청기 사용자의 발화 속도에 대한 정보 및 일반인의 평균 발화 속도에 대한 정보를 포함하는 배경정보를 수집하는 단계;
    상기 서버가, 상기 수집된 배경정보를 바탕으로 청능훈련프로그램에 포함될 배경 소음 및 발화 속도를 결정하는 단계;
    상기 서버가, 상기 결정된 배경 소음 및 발화 속도를 바탕으로 청능훈련프로그램을 생성하는 단계;
    상기 서버가, 상기 보청기 사용자로부터 상기 청능훈련프로그램 및 보청기 착용에 대한 결과 데이터를 수신하는 단계; 및
    상기 보청기가, 상기 결과 데이터를 바탕으로 상기 보청기를 4차 보정하는 단계; 를 포함하고,
    상기 4차 보정하는 단계는,
    상기 결과 데이터 중 기 설정된 비율 이상의 오답률을 가지는 주파수 구간을 획득하는 단계;
    상기 획득된 주파수 구간의 주파수 이득값을 상기 제3 주파수 이득값 이상으로 보정하는 단계;를 포함하고,
    상기 생성된 청능훈련프로그램은 상기 보청기 사용자의 배경정보에 따라 시각단서, 음소, 단어 및 문장의 난이도, 문장 길이, 환경음 및 음악의 포함 여부가 결정되고,
    상기 청능훈련프로그램을 생성하는 단계는,
    복수의 보청기 사용자의 배경정보, 설문문항에 대한 답변정보 및 상기 답변정보로부터 획득된 상세정보를 포함하는 복수의 제1 데이터를 상기 복수의 사용자 별로 저장하는 단계;
    상기 복수의 보청기 사용자의 청능훈련프로그램 및 보청기 착용에 대한 결과 데이터를 포함하는 복수의 제2 데이터를 상기 복수의 보청기 사용자 별로 저장하는 단계;
    상기 복수의 제1 데이터를 클러스터링하여 복수의 제1 클러스터를 획득하는 단계;
    상기 복수의 제2 데이터를 클러스터링하여 복수의 제2 클러스터를 획득하는 단계;
    새로운 제1 보청기 사용자에 대한 배경정보 및 답변정보를 획득하는 단계;
    상기 복수의 제1 클러스터 중 상기 획득한 제1 보청기 사용자에 대한 배경정보 및 답변정보와 관련된 제1-1 클러스터를 판단하는 단계;
    상기 복수의 제2 클러스터 중 상기 제1-1 클러스터와 기 설정된 거리내에 존재하는 제2-1 클러스터를 판단하는 단계; 및
    상기 제2-1 클러스터에 포함된 데이터를 바탕으로 상기 제1 보청기 사용자에 대한 청능훈련프로그램을 생성하는 단계; 를 포함하고,
    상기 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 획득하는 단계는,
    상기 한국어 음성 데이터를 8개의 주파수 대역으로 분류하는 단계;
    상기 분류된 8개의 주파수 대역 각각에 대한 정반응률을 획득하는 단계;
    상기 획득된 정반응률에 기초하여 각각의 주파수 대역에 대한 각각의 가중치를 획득하는 단계 및
    상기 가중치를 바탕으로 상기 제1 주파수 이득값 및 상기 제1 최대 출력값을 결정하는 단계; 를 포함하고,
    상기 복수개의 주파수 대역 각각에 대한 제1 주파수 이득값 및 제1 최대 출력값을 획득하는 단계는,
    상기 한국어 음성 데이터의 대화음 크기를 판단하는 단계;
    상기 대화음 크기가 기 설정된 범위 이내인 경우, 압축역치(Compression Threshold), 압축비율(Compression Ratio), 확장역치(Extension Threshold), 확장비율(Extension Ratio) 및 상기 가중치를 바탕으로 제1 파라미터를 결정하고, 상기 결정된 제1 파라미터를 바탕으로 상기 제1 주파수 이득값 및 상기 제1 최대 출력값을 결정하는 단계;를 더 포함하고,
    상기 제1 파라미터는,
    압축역치레벨(CT)이 CT31, X2>=31dB SPL에서 각각의 주파수 대역에 대한 제1 파라미터 Y(CT31)이고,
    상기 Y(CT31)은 제1 주파수 대역에서 Y(CT31)=0.714X1 - 0.062X2 - 34.143, 제2 주파수 대역에서 Y(CT31)=0.630X1 - 0.301X2 - 5.314, 제3 주파수 대역에서 Y(CT31)=0.598X1 - 0.377X2 + 5.644, 제4 주파수 대역에서 Y(CT31)=0.566X1 - 0.432X2 + 18.584, 제5 주파수 대역에서 Y(CT31)=0.548X1 - 0.433X2 + 21.323, 제6 주파수 대역에서 Y(CT31)=0.513X1 - 0.433X2 + 24.584, 제7 주파수 대역에서 Y(CT31)=0.302X1 - 0.250X2 + 16.771, 제8 주파수 대역에서 Y(CT31)=0.240X1 - 0.192X2 + 10.866의 공식에 의해 결정되고,
    X1은 HTL, X2는 입력음의 크기인 것을 특징으로 하는 제어 방법.
KR1020200005755A 2020-01-16 2020-01-16 압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램 KR102093370B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200005755A KR102093370B1 (ko) 2020-01-16 2020-01-16 압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200005755A KR102093370B1 (ko) 2020-01-16 2020-01-16 압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020190063256A Division KR102069893B1 (ko) 2019-05-29 2019-05-29 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램

Publications (1)

Publication Number Publication Date
KR102093370B1 true KR102093370B1 (ko) 2020-05-13

Family

ID=70730136

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200005755A KR102093370B1 (ko) 2020-01-16 2020-01-16 압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램

Country Status (1)

Country Link
KR (1) KR102093370B1 (ko)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100956167B1 (ko) 2008-01-28 2010-05-06 주식회사베토벤보청기 한국어 주파수 특성에 맞는 다채널 디지털 보청기의 채널설정방법 및 이를 이용한 다채널 디지털 보청기
EP2426953A1 (en) * 2010-04-19 2012-03-07 Panasonic Corporation Hearing aid fitting device
US20130202123A1 (en) * 2011-03-31 2013-08-08 Makoto Nishizaki Hearing aid adjustment device, hearing aid adjustment method, and program for hearing aid adjustment
US20150146876A1 (en) * 2012-06-19 2015-05-28 Panasonic Intellectual Property Management Co., Ltd. Hearing aid fitting device, hearing aid, and hearing aid fitting method
US20160255447A1 (en) * 2013-04-24 2016-09-01 Biosoundlab Co., Ltd. Method for Fitting Hearing Aid in Individual User Environment-Adapted Scheme, and Recording Medium for Same
US20170180894A1 (en) * 2015-12-22 2017-06-22 Widex A/S Method of fitting a hearing aid system, a hearing aid fitting system and a computerized device
EP3367700A1 (en) * 2017-02-22 2018-08-29 Sonova AG Automatically determined user experience value for hearing aid fitting

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100956167B1 (ko) 2008-01-28 2010-05-06 주식회사베토벤보청기 한국어 주파수 특성에 맞는 다채널 디지털 보청기의 채널설정방법 및 이를 이용한 다채널 디지털 보청기
EP2426953A1 (en) * 2010-04-19 2012-03-07 Panasonic Corporation Hearing aid fitting device
US20130202123A1 (en) * 2011-03-31 2013-08-08 Makoto Nishizaki Hearing aid adjustment device, hearing aid adjustment method, and program for hearing aid adjustment
US20150146876A1 (en) * 2012-06-19 2015-05-28 Panasonic Intellectual Property Management Co., Ltd. Hearing aid fitting device, hearing aid, and hearing aid fitting method
US20160255447A1 (en) * 2013-04-24 2016-09-01 Biosoundlab Co., Ltd. Method for Fitting Hearing Aid in Individual User Environment-Adapted Scheme, and Recording Medium for Same
US20170180894A1 (en) * 2015-12-22 2017-06-22 Widex A/S Method of fitting a hearing aid system, a hearing aid fitting system and a computerized device
EP3367700A1 (en) * 2017-02-22 2018-08-29 Sonova AG Automatically determined user experience value for hearing aid fitting

Similar Documents

Publication Publication Date Title
Anderson et al. Speech perception benefits of FM and infrared devices to children with hearing aids in a typical classroom
Crowley et al. Estimation of client-assessed hearing aid performance based upon unaided variables
Scollie et al. Stimuli and normative data for detection of Ling-6 sounds in hearing level
US11095995B2 (en) Hearing assist device fitting method, system, algorithm, software, performance testing and training
Beechey et al. Hearing impairment increases communication effort during conversations in noise
Andreetta et al. Evaluation of speech amplification devices in Parkinson's disease
CN104918536A (zh) 听力测定自测试
Paglialonga et al. A user-operated test of suprathreshold acuity in noise for adult hearing screening: The SUN (Speech Understanding in Noise) test
Vaisberg et al. Perceived sound quality dimensions influencing frequency-gain shaping preferences for hearing aid-amplified speech and music
KR102069892B1 (ko) 보청기 적합관리 시스템의 제어 방법, 장치 및 프로그램
US20220369053A1 (en) Systems, devices and methods for fitting hearing assistance devices
AU2010347009B2 (en) Method for training speech recognition, and training device
KR102093365B1 (ko) 시험착용데이터 기반 보청기 적합관리 시스템의 제어 방법, 장치 및 프로그램
KR102093370B1 (ko) 압축역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램
KR102093369B1 (ko) 확장역치레벨에 대한 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램
KR102093368B1 (ko) 한국어에 특화된 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램
EP3864862A1 (en) Hearing assist device fitting method, system, algorithm, software, performance testing and training
KR102069893B1 (ko) 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램
Humes et al. A comparison of single-channel linear amplification and two-channel wide-dynamic-range-compression amplification by means of an independent-group design
KR20200137950A (ko) 보청기 적합관리 시스템의 제어 방법, 장치 및 프로그램
KR102093367B1 (ko) 사용자 맞춤형 보청기 적합관리 시스템의 제어 방법, 장치 및 프로그램
KR20200137951A (ko) 최적증폭을 위한 보청기 시스템의 제어 방법, 장치 및 프로그램
KR102093366B1 (ko) 귀 인상 정보를 바탕으로 관리되는 보청기 적합관리 시스템의 제어 방법, 장치 및 프로그램
KR102093364B1 (ko) 사용자 배경 정보를 바탕으로 구현되는 보청기 적합관리 시스템의 제어 방법, 장치 및 프로그램
Jamaluddin Development and evaluation of the digit triplet and auditory-visual matrix sentence tests in Malay

Legal Events

Date Code Title Description
GRNT Written decision to grant