KR101591175B1

KR101591175B1 - 음성 분석을 이용한 건강 상태 진단 장치 및 방법

Info

Publication number: KR101591175B1
Application number: KR1020140054082A
Authority: KR
Inventors: 장준수; 김종열; 도준형; 남지호; 김영수; 김장웅; 장은수
Original assignee: 한국 한의학 연구원
Priority date: 2014-05-07
Filing date: 2014-05-07
Publication date: 2016-02-04
Also published as: KR20150127380A

Abstract

건강 상태 판단 방법은, 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 단계; 상기 추출된 파라미터의 값 및 상기 파라미터에 대응하는 음성 표현형 함수를 이용하여, 음성 표현형을 결정하는 단계; 및 상기 결정된 음성 표현형에 기초하여 상기 음성에 대응하는 건강 상태를 판단하는 단계를 포함할 수 있다.

Description

음성 분석을 이용한 건강 상태 진단 장치 및 방법{APPARATUS AND METHOD FOR DIAGNOSIS OF PHYSICAL CONDITIONS USING PHONETIC ANALYSIS}

건강 상태 진단 장치 및 방법에 연관되며, 구체적으로는 사용자의 음성을 분석하여 사용자의 건강 상태를 진단하는 장치 및 방법에 연관된다.

사람의 음성(또는 목소리)은 단순히 입에서 나오는 것이 아니라 몸의 전체적인 조화에서 만들어져 성태를 통해 입으로 나오는 것이다. 따라서, 사람의 음성은 몸의 상태를 나타내는 척도가 될 수 있다.

동의보감에서는 "목소리가 신장에서 근원하고, 폐는 목소리가 나오는 문이며, 심장이 그것을 관장하는 것으로 본다"고 하여, 목소리의 장애가 단지 목 부위의 손상 때문에 생기는 것이 아니라 몸 안의 어떤 장기에 문제가 생겨서 그렇다고 보았다. 이와 같이 한의학에서는 맥을 짚거나 얼굴색을 살피는 것과 마찬가지로, 목소리로부터 병이 어디에 있는지 알 수 있다고 할 정도로 음색은 병중을 가리는 중요한 척도가 되었다.

음성으로 진단 가능한 질병의 범위는 점차 넓어지고 있으며, 음성을 패턴을 분석함으로써, 중추 신경계 질환인 파킨슨병을 조기 진단할 수 있다는 연구 결과가 발표되고 있으며, 앞으로도 음성을 이용한 건강 상태의 진단 범위가 점차 넓어질 수 있다.

따라서, 음성 분석을 이용한 건강 상태 판단 장치가 필요하다.

일측에 따르면, 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 단계; 상기 추출된 파라미터의 값 및 상기 파라미터에 대응하는 음성 표현형 함수를 이용하여, 음성 표현형을 결정하는 단계; 및 상기 결정된 음성 표현형에 기초하여 상기 음성에 대응하는 건강 상태를 판단하는 단계를 포함하는 건강 상태 판단 방법이 제공된다.

일실시예에 따르면, 상기 추출된 파라미터에 대응하는 음성 표현형 함수를 호출하는 단계를 더 포함할 수 있다.

다른 일실시예에 따르면, 상기 음성 표현형 함수를 생성하는 단계를 더 포함할 수 있다.

여기서, 상기 음성 표현형 함수를 생성하는 단계는, 복수의 사용자에 대한 음성 및 상기 복수의 사용자에 대한 건강 정보 데이터를 수신하는 단계; 상기 복수의 사용자에 대한 음성으로부터 상기 파라미터를 추출하는 단계; 상기 복수의 사용자에 대한 음성을 음성 표현형에 대한 청취 평가를 수행하는 단계; 상기 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 상기 수행한 청취평가를 이용하여 상기 음성 표현형과 상기 건강 정보 데이터의 상관관계를 연산하는 단계; 상기 연산된 상관관계를 이용하여 상기 음성 표현형 함수를 생성하는 단계를 포함할 수 있다.

한편, 상기 음성 표현형은, 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나에 해당할 수 있다.

구체적으로, 상기 음의 맑기는 MFCC2 및 MFCC6의 파라미터에 기초하여 결정되며, 상기 음의 굵기는 MFCC1 및 HNR35의 파라미터에 기초하여 결정되며, 상기 음의 거칠기는 MFCC3 및 MFCC6의 파라미터에 기초하여 결정될 수 있다.

일실시예에 따르면, 상기 음성 표현형에 대한 청취 평가를 수행하는 단계는, 상기 복수의 사용자에 대한 음성을 미리 정해진 음성 표현형 기준에 따라 분류하는 단계일 수 있다.

다른 일실시예에 따르면, 상기 복수의 사용자를 체질 별로 분류하고, 상기 음성 표현형 함수를 상기 체질 별로 생성하는 단계를 더 포함할 수 있다.

또 다른 일실시예에 따르면, 상기 사용자에 대한 음성을 시계열적으로 수신하는 단계; 및 상기 시계열적으로 수신한 사용자에 대한 음성을 기초로 하여, 상기 사용자의 시계열적 건강 상태를 판단하는 단계를 더 포함할 수 있다.

여기서, 상기 시계열적 건강 상태를 판단하는 단계는, 상기 사용자의 건강 여부를 판단하기 위한 상기 음성 표현형의 제1 범위를 설정하는 단계; 및 상기 시계열적으로 수신한 음성에 대한 음성 표현형의 값이 상기 제1 범위에 포함되는지 여부에 따라서 상기 사용자의 건강 상태를 판단하는 단계를 포함할 수 있다.

또한, 상기 시계열적 건강 상태를 판단하는 단계는, 상기 시계열적으로 수신한 음성에 대한 음성 표현형의 값의 변동 방향에 기초하여 상기 사용자의 건강 상태를 판단하는 것일 수 있다.

한편, 상기 사용자의 건강 상태에 기초하여, 상기 사용자에게 음식 정보 또는 운동 정보를 제공하는 단계를 더 포함할 수 있다.

다른 일측에 따르면, 사용자의 건강 상태를 판단하기 위한 음성 표현형 함수를 생성하는 음성 표현형 함수 생성 방법에 있어서, 복수의 사용자에 대한 음성 및 상기 복수의 사용자에 대한 건강 정보 데이터를 수신하는 단계; 상기 복수의 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 단계; 상기 복수의 사용자에 대한 음성을 음성 표현형에 대한 청취 평가를 수행하는 단계; 상기 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 상기 수행한 청취평가를 이용하여 상기 음성 표현형과 상기 건강 정보 데이터의 상관관계를 연산하는 단계; 상기 연산된 상관관계를 이용하여 상기 음성 표현형 함수를 생성하는 단계를 포함할 수 있다.

여기서, 상기 음성 표현형은, 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나에 해당할 수 있다.

또 다른 일측에 따르면, 음성 표현형 함수 생성 방법을 실행하는 프로그램을 수록한 컴퓨터 판독 가능 기록 매체에 있어서, 상기 음성 표현형 함수 생성 방법은, 복수의 사용자에 대한 음성 및 상기 복수의 사용자에 대한 건강 정보 데이터를 수신하는 단계; 상기 복수의 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 단계; 상기 복수의 사용자에 대한 음성을 음성 표현형에 대한 청취 평가를 수행하는 단계; 상기 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 상기 수행한 청취평가를 이용하여 상기 음성 표현형과 상기 건강 정보 데이터의 상관관계를 연산하는 단계; 상기 연산된 상관관계를 이용하여 상기 음성 표현형 함수를 생성하는 단계를 포함하는 컴퓨터 판독 가능 기록 매체가 제공된다.

또 다른 일측에 따르면, 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 추출부; 상기 추출된 파라미터의 값 및 상기 파라미터에 대응하는 음성 표현형 함수를 이용하여, 음성 표현형을 결정하는 음성 표현형 결정부; 및 상기 결정된 음성 표현형에 기초하여 상기 음성에 대응하는 건강 상태를 판단하는 건강 상태 판단부를 포함하는 건강 상태 판단 장치가 제공된다.

일실시예에 따르면, 상기 사용자에 대한 음성을 시계열적으로 수신하는 수신부를 더 포함하고, 상기 건강 상태 판단부는, 상기 시계열적으로 수신한 사용자에 대한 음성을 기초로 하여, 상기 사용자의 시계열적 건강 상태를 판단할 수 있다.

일측에 따르면, 사용자의 건강 상태를 판단하기 위한 음성 표현형 함수를 생성하는 음성 표현형 함수 생성 장치에 있어서, 복수의 사용자에 대한 음성 및 상기 복수의 사용자에 대한 건강 정보 데이터를 수신하는 수신부; 상기 복수의 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 추출부; 상기 복수의 사용자에 대한 음성을 음성 표현형에 대한 청취 평가를 수행하는 청취 평가부; 상기 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 상기 수행한 청취평가를 이용하여 상기 음성 표현형과 상기 건강 정보 데이터의 상관관계를 연산하는 연산부; 상기 연산된 상관관계를 이용하여 상기 음성 표현형 함수를 생성하는 함수 생성부를 포함하는 음성 표현형 함수 생성 장치가 제공된다.

일실시예에 따르면, 상기 음성 표현형은, 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나에 해당하고, 상기 음의 맑기는 MFCC2 및 MFCC6의 파라미터에 기초하여 결정되며, 상기 음의 굵기는 MFCC1 및 HNR35의 파라미터에 기초하여 결정되며, 상기 음의 거칠기는 MFCC3 및 MFCC6의 파라미터에 기초하여 결정될 수 있다.

도 1은 일실시예에 따른 건강 상태 판단 장치의 개념도이다.
도 2는 일실시예에 따른 건강 상태 판단 장치의 구성을 나타낸 블록도이다.
도 3은 일실시예에 따른 건강 상태 판단 방법의 흐름을 나타낸 순서도이다.
도 4는 일실시예에 따라, 도 3의 건강 상태 판단단계를 상세하게 나타낸 순서도이다.
도 5는 일실시예에 따라, 음성으로부터 음성 특징을 추출하는 것을 나타낸 예시 도면이다.
도 6은 일실시예에 따라, 시간의 변화에 따른 파라미터를 나타낸 그래프이다.
도 7은 일실시예에 따른 음성 표현형 함수 생성 장치의 구성을 나타낸 블록도이다.
도 8은 일실시예에 따른 음성 표현형 함수 생성 방법의 흐름을 나타낸 순서도이다.
도 9는 일실시예에 따라, 파라미터에 대한 청취 평가를 수행한 데이터를 그래프로 나타낸 예시 도면이다.

이하에서, 일부 실시예들을, 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.

아래 설명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 관례, 새로운 기술의 출현 등에 따라 달라질 수 있다.

또한 특정한 경우는 이해를 돕거나 및/또는 설명의 편의를 위해 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 설명 부분에서 상세한 그 의미를 기재할 것이다. 따라서 아래 설명에서 사용되는 용어는 단순한 용어의 명칭이 아닌 그 용어가 가지는 의미와 명세서 전반에 걸친 내용을 토대로 이해되어야 한다.

도 1은 일실시예에 따른 건강 상태 판단 장치의 개념도(100)이다.

일실시예에 따르면, 건강 상태 판단 장치(120)는 사용자의 음성(110)을 입력받아, 사용자의 건강 상태를 판단할 수 있다. 음성(110)으로부터 음성 특징을 나타내는 파라미터를 추출하고, 추출된 파라미터의 값을 이용하여 음성 표현형을 결정할 수 있다. 음성 표현형에 기초하여 음성에 대응하는 건강 상태를 판단할 수 있다.

여기서, 음성 표현형은, 음의 맑기, 음의 굵기, 음의 거칠기 중 적어도 하나에 해당할 수 있다.

일실시예에 따르면, 건강 상태 판단 장치(120)는 음성 표현형 함수를 이용하여 음성 표현형을 결정할 수 있다.

또한, 건강 상태 판단 장치(120)는 사용자로부터 시계열적으로 음성을 입력 받아, 실시간으로 건강 상태를 분석할 수 있다. 건강 상태를 분석하는 과정에서, 미리 정해진 기준 범위 이외에 있게 되면, 사용자의 건강에 이상이 있다고 판단할 수 있다.

건강 상태 판단 장치(120)는 복수의 사용자로부터 음성을 입력 받아, 복수의 사용자의 건강 상태를 판단할 수 있다. 건강 상태를 판단한 결과, 복수의 사용자 중, 질환이 있는 사용자에게는 해당되는 질환 정보(130, 140, 150)를 제공할 수 있다.

이하, 도 2 내지 도 6에서는 건강 상태 판단 장치 및 방법을 설명한다.

도 2는 일실시예에 따른 건강 상태 판단 장치의 구성을 나타낸 블록도(120)이다.

일실시예에 따르면, 건강 상태 판단 장치(120)는 추출부(210), 음성 표현형 결정부(220) 및 건강 상태 판단부(230)를 포함할 수 있다. 건강 상태 판단 장치(120)는 사용자의 음성으로부터 음성 특징을 나타내는 파라미터를 추출하고, 음성 표현형 함수를 이용하여 사용자의 건강 상태를 판단할 수 있다.

추출부(210)는 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출할 수 있다. 사용자는 미리 지정된 모음, 단어 또는 문장들을 발성하면, 발성된 모음, 단어 또는 문장들은 마이크를 통하여 녹음되고, 디지털 신호로 변환될 수 있다. 추출부(210)는 디지털 신호에서 유효한 음성 신호 구간을 검출할 수 있다. 유효한 음성 신호 구간을 검출하고, 유효한 음성 신호 구간으로부터 음성 특징을 나타내는 파라미터를 추출할 수 있다.

음성 표현형 결정부(220)는 추출된 파라미터의 값 및 파라미터에 대응하는 음성 표현형 함수를 이용하여 음성 표현형을 결정할 수 있다. 여기서, 음성 표현형은 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나에 해당할 수 있다. 음성 표현형 함수는 사용자의 건강 상태를 판단하기 위한 함수이다.

건강 상태 판단 장치(120)는 음성 표현형 함수를 생성할 수 있다. 건강 상태 판단 장치(120)는, 복수의 사용자에 대한 음성 및 복수의 사용자에 대한 건강 정보 데이터를 수신할 수 있다. 복수의 사용자에 대한 음성으로부터 파라미터를 추출하고, 음성에 대해 음성 표현형에 대한 청취 평가를 수행할 수 있다. 예를 들면, 청취 평가는 음성에 대하여 "맑음", "조금 맑음", "보통", "조금 탁함" 및 "탁함" 중 어디에 해당되는지로 분류함으로서 수행될 수 있다. 추출된 파라미터의 값 및 수행한 청취평가를 이용하여 음성형과 건강 정보 데이터의 상관관계를 연산할 수 있다. 연산된 상관관계를 이용하여 음성 표현형 함수를 생성할 수 있다. 또한, 건강 상태 판단 장치(120)는 복수의 사용자를 체질 별로 분류하고, 음성 표현형 함수를 체질 별로 생성할 수 있다. 음성 표현형 함수에 대한 구체적인 설명은 도 7 내지 도 9에서 설명한다.

여기서, 음성 표현형 함수 생성은 건강 상태 판단 장치(120)와는 별도로 외부 장치에서 구현될 수 있으며, 건강 상태 판단 장치(120)에 내장되어 구현될 수도 있다. 따라서, 음성 표현형 함수의 생성은 건강 상태 판단 장치(120)에서 구현되는 경우 뿐만 아니라, 물리적으로 건강 상태 판단 장치(120)의 외부에서 구현되는 경우 또한 본 발명의 사상 범위에서 제외되지 않는다.

일실시예에 따르면, 음의 맑기는, MFCC2 및 MFCC6의 파라미터에 기초하여 결정되며, 음의 굵기는 MFCC1 및 HNR35의 파라미터에 기초하여 결정되며, 음의 거칠기는 MFCC3 및 MFCC6의 파라미터에 기초하여 결정될 수 있다.

건강 상태 판단부(230)는 결정된 음성 표현형에 기초하여 음성에 대응하는 건강 상태를 판단할 수 있다.

일실시예에 따르면, 건강 상태 판단부(230)는 수신부(240)를 더 포함할 수 있다. 수신부(240)는 사용자에 대한 음성을 시계열적으로 수신할 수 있다. 시계열적으로 수신한다는 의미는, 시간에 따라 사용자의 음성을 수신하는 것을 의미할 수 있고, 주기적으로 사용자의 음성을 수신하는 것을 의미할 수도 있다.

건강 상태 판단부(230)는 사용자에 대한 음성을 기초로 하여 사용자의 건강 상태를 판단할 수 있다. 건강 상태 판단부(230)는 시계열적으로 사용자의 건강 상태를 판단할 수 있다. 이 경우, 사용자의 건강 여부를 판단하기 위한 음성 표현형의 제1 범위를 설정하고, 음성 표현형의 값이 제1 범위에 포함되는지 여부에 따라서 사용자의 건강 상태를 판단할 수 있다.

또한, 건강 상태 판단부(230)는 음성 표현형의 값의 변동 방향에 기초하여 사용자의 건강 상태를 판단할 수 있다. 사용자의 시계열적 건강 상태를 판단하는 내용은 도 4 및 도 6에서 설명한다.

이하에서는, 건강 상태 판단 장치가 수행하는 다양한 동작이나 응용들이 설명되는데, 상기 추출부, 음성 표현형 결정부, 건강 상태 판단부 및 수신부 중 어느 구성을 특정하지 않더라도 본 발명의 기술분야에 대한 통상의 기술자가 명확하게 이해하고 예상할 수 있는 정도의 내용은 통상의 구현으로 이해될 수 있으며, 본 발명의 권리범위가 특정한 구성의 명칭이나 물리적/논리적 구조에 의해 제한되는 것은 아니다.

도 3은 일실시예에 따른 건강 상태 판단 방법의 흐름을 나타낸 순서도(300)이다.

건강 상태 판단 장치의 추출부는, 음성 특징을 나타내는 파라미터를 추출할 수 있다. (단계 310)

건강 상태 판단 장치의 음성 표현형 결정부는, 추출된 파라미터의 값 및 파라미터에 대응하는 음성 표현형 함수를 이용하여 음성 표현형을 결정할 수 있다. (단계 320) 여기서, 음성 표현형은, 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나를 포함할 수 있다.

여기서, 음의 맑기는 MFCC2 및 MFCC6의 파라미터에 기초하여 결정되며, 음의 굵기는 MFCC1 및 HNR35의 파라미터에 기초하여 결정되며, 음의 거칠기는 MFCC3 및 MFCC6의 파라미터에 기초하여 결정될 수 있다.

일실시예에 따르면, 음성 표현형 함수는 사용자의 음성을 음의 맑기로 분류할 수 있다. 예를 들면, 사용장의 음성은 "맑음", "조금 맑음", "보통". "조금 탁함" 및 "탁함"으로 분류될 수 있다. 음성 표현형 함수는 사용자의 음성을 분석하여, "조금 탁함"으로 결정할 수 있다.

건강 상태 판단 장치의 건강 상태 판단부는, 결정된 음성 표현형에 기초하여 음성에 대응하는 건강 상태를 판단할 수 있다. (단계 330)

일실시예에 따르면, 건강 상태 판단 장치는 음성 표현형 함수를 생성할 수 있다. 음성 표현형 함수는 복수의 사용자로부터 음성 및 건강 정보 데이터를 수신하여 사용자의 건강 상태를 판단할 수 있는 함수이다. 건강 상태 판단 장치는 복수의 사용자의 음성을 분석하여 음성 표현형으로 분류할 수 있다. 복수의 사용자의 건강 정보 데이터 및 의학 정보를 바탕으로 음성 표현형에 대한 건강 상태를 데이터베이스화 할 수 있다. 건강 상태 판단부는 결정된 음성 표현형에 기초하여 해당되는 질병이나 질환, 건강 상태를 판단할 수 있다.

다른 일실시예에 따르면, 건강 상태 판단 장치는 추출된 파라미터에 대응하는 음성 표현형 함수를 호출할 수 있다.

도 4는 일실시예에 따라, 도 3의 건강 상태 판단단계를 상세하게 나타낸 순서도(400)이다.

일실시예에 따르면, 건강 상태 판단 장치는 사용자에 대한 음성을 시계열적으로 수신할 수 있다. 건강 상태 판단 장치는 수신한 사용자에 대한 음성을 기초로 사용자의 시계열적 건강 상태를 판단할 수 있다.

구체적으로, 건강 상태 판단 장치는 사용자의 건강 여부를 판단하기 위한 음성 표현형의 제1 범위를 설정할 수 있다. (단계 410) 예를 들면, 음성 표현형을 "굵기"로 설정하고, 굵기의 정도를 나타내는 값 중 제1 범위를 "A질환"에 대해 이상이 없는 구간으로 설정할 수 있다.

건강 상태 판단 장치는 음성에 대한 음성 표현형의 값이 제1 범위에 포함되는지 여부에 따라서 사용자의 건강 상태를 판단할 수 있다. (단계 420) 예를 들면, 전술한 바와 같이, 사용자의 굵기의 정도를 나타내는 값이 제1 범위 이내에 있으면, "A질환"에 대해 이상이 없는 것으로 진단할 수 있고, 제1 범위 이외에 있으면, "A질환"에 대해 이상이 있는 것으로 진단할 수 있다.

이에 대한 설명은 도 6에서 설명한다.

도 5는 일실시예에 따라, 음성으로부터 음성 특징을 추출하는 것을 나타낸 예시 도면이다.

사용자는 미리 지정한 모음, 단어 및 문장을 발성할 수 있다. 녹음기를 통해 녹음되고, 녹음된 음성은 디지털 신호로 변환될 수 있다. 디지털 신호에서 유효한 음성 신호 구간을 검출할 수 있다. 이 경우, 최소 신호 크기 이상이 있는 구간은 유효 구간으로 하여 검출할 수 있다. (도 510)

건강 상태 판단 장치는 검출된 유효 구간을 이용하여 음성 특징을 나타내는 파라미터를 추출할 수 있다. 건강 상태 판단 장치는 검출된 유효 구간을 프레임 별로 나누고 프레임에서 윈도우를 이동해 가면서 파라미터를 추출할 수 있다. (도 520) 예를 들면, 프레임의 구간은 음성 신호처리의 최소 단위로 40ms로 설정될 수 있다. 또한, 프레임 별 파라미터에 대한 값들을 평균값을 구하고, 평균값은 음성을 대표하는 특징값으로 결정될 수 있다.

일실시예에 따르면, 음성 특징을 나타내는 모음 파라미터(또는 모음 변수)는 표 1과 같다.

표 1에 제시된 모음 변수는 음성 특징을 나타내는 파라미터의 일예시이며, 표 1에 제시되지 않은 모음 변수를 이용하여 음성 특징을 추출하는 것도 본 발명의 사상에서 제외하지 않는다.

다른 일실시예에 따르면, 음성 특징을 나타내는 문장 파라미터(또는 문장 변수)는 표 2와 같다.

표 2에 제시된 문장 변수는 음성 특징을 나타내는 파라미터의 일예시이며, 표 2에 제시되지 않은 문장 변수를 이용하여 음성 특징을 추출하는 것도 본 발명의 사상에서 제외하지 않는다.

도 6은 일실시예에 따라, 시간의 변화에 따른 파라미터를 나타낸 그래프이다.

건강 상태 판단 장치는 사용자에 대한 음성을 시계열적으로 수신하고, 수신된 음성을 기초로 하여 사용자의 시계열적 건강 상태를 판단할 수 있다.

일실시예에 따르면, 건강 상태 판단 장치는 사용자를 매일 정해진 시간에 음성을 수신하여 그래프로 도시할 수 있다. (도 600) 건강 상태 판단 장치는 음성을 수신하여 음성 특징을 나타내는 파라미터를 추출하고, 음성을 음성 파라미터에 기초한 음성 표현형으로 나타낼 수 있다. 표현형에 대한 값은 시간의 추이에 따라 그래프로 도시될 수 있다. 도 600은 시간의 변화에 따른 음의 굵기의 정도를 나타낸 예시 도면이다.

건강 상태 판단 장치는 사용자의 건강 여부를 판단하기 위한 음성 표현형의 제1 범위를 설정할 수 있다. 여기서, 제1 범위는 제1 값 이상 제2 값 이하로 설정할 수 있다. 제1 범위 이내에 음성 표현형의 값이 존재하면, 건강 상태 판단 장치는 "A질환"에 대해 이상이 없는 것으로 판단할 수 있다. 또한, 제1 범위 이외에 음성 표현형의 값이 존재(610, 620, 630)하면, 건강 상태 판단 장치는 "A질환"에 대해 이상이 있는 것으로 판단할 수 있다.

일실시예에 따르면, 건강 상태 판단 장치는 시계열적으로 수신한 음성에 대한 음성 표현형의 값의 변동 방향에 기초하여 사용자의 건강 상태를 판단할 수 있다. 예를 들면, 도 600의 경우, 제1 범위를 벗어난 구간이 3구간이 있다. 3구간의 시간과 빈도를 고려하였을 때, 빈도는 시간이 갈수록 줄어드는 방향으로 되고 있어, "A질환"에 대한 사용자의 건강 상태가 호전되어 가고 있다고 판단할 수 있다. 건강 상태 판단 장치는 제1 범위 이외의 값(또는 미리 정해진 이탈된 범위의 값)에 나오는 구간의 빈도 및 이동 평균선을 이용하여 사용자의 건강 상태 추이를 파악할 수 있다.

다른 일실시예에 따르면, 건강 상태 판단 장치는 사용자의 건강 상태에 기초하여 사용자에게 음식 정보 또는 운동 정보를 제공할 수 있다. 건강 상태 판단 장치는 사용자의 건강 상태 추이를 파악하고, 사용자의 건강 상태에 따른 음식 정보 및 운동 정보를 제공할 수 있다. 예를 들면, 목소리의 굵기가 폐기능 저하로 인해 변화하는 것으로 보아서, 음의 굵기가 지속적으로 얇아지는 사용자에게 견과류, 율무차 등을 섭취하는 정보를 제공할 수 있다.

도 7은 일실시예에 따른 음성 표현형 함수 생성 장치의 구성을 나타낸 블록도(700)이다.

일실시예에 따르면, 음성 표현형 함수 생성 장치(700)는 수신부(710), 추출부(720), 청취 평가부(730), 연산부(940) 및 함수 생성부(750)를 포함할 수 있다. 음성 표현형 함수 생성 장치(700)는 사용자의 건강 상태를 판단하기 위한 음성 표현형 함수를 생성할 수 있다.

수신부(710)는 복수의 사용자에 대한 음성 및 복수의 사용자에 대한 건강 정보 데이터를 수신할 수 있다. 여기서, 건강 정보는 사용자에게 있는 질환, 질병, 특이 사항에 대한 정보를 포함할 수 있다.

추출부(720)는 복수의 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출할 수 있다. 파라미터는 모음 파라미터(또는 모음 변수) 또는 문장 파라미터(또는 문장 변수)에 대한 것일 수 있다.

청취 평가부(730)는 복수의 사용자에 대한 음성을 음성 표현형에 대한 청취 평가를 수행할 수 있다. 음성 표현형은 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나를 포함할 수 있다. 음의 맑기는 MFCC2 및 MFCC6의 파라미터에 기초하여 결정되며, 음의 굵기는 MFCC1 및 HNR35의 파라미터에 기초하여 결정되며, 음의 거칠기는 MFCC3 및 MFCC6의 파라미터에 기초하여 결정될 수 있다.

음성 표현형에 대한 청취 평가의 수행은 복수의 사용자에 대한 음성을 미리 정해진 음성 표현형 기준에 따라 분류하여 수행될 수 있다. 예를 들면, 음의 맑기, 음의 굵기 및 음의 거칠기의 정도를 나타내는 수치를 미리 정해진 범주에 따라 분류할 수 있다. 음의 맑기는 "맑음", "조금 맑음", "보통", "조금 탁함" 및 "탁함"으로 분류될 수 있다.

연산부(940)는 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 수행한 청취평가를 이용하여 음성 표현형과 건강 정보 데이터의 상관관계를 연산할 수 있다. 연산부(940)는 음성 특징을 나타내는 파라미터의 값에 따라, 청취 평가를 수행할 수 있다. 즉, 연산부(940)는 파라미터의 값이 변화함에 따라서 음의 맑기, 음의 굵기, 음의 거칠기의 정도 변화를 분석할 수 있다.

연산부(940)는 음성 표현형과 복수의 사용자에 대한 건강 정보 데이터의 상관관계를 연산할 수 있다. 예를 들면, 복수의 사용자의 음성을 음의 맑기의 정도에 따라 분석한 결과, 음성이 "탁함"으로 분류되면, "A질병"에 해당될 가능성이 높다고 판단할 수 있다.

함수 생성부(750)는 음성 표현형과 건강 정보 데이터의 상관관계를 이용하여 음성 표현형 함수를 생성할 수 있다. 여기서, 음성 표현형은 전술한 음의 맑기, 음의 굵기 및 음의 거칠기 이외에 한정하지 않고, 음성을 통하여 사용자의 건강 상태를 판단할 수 있는 표현형을 포함할 수 있다. 함수 생성부(750)는 각 음성 표현형에 대하여 음성 표현형 함수를 생성할 수 있다.

또한, 함수 생성부(750)는 복수의 사용자를 체질 별로 분류하고, 음성 표현형 함수를 체질 별로 생성할 수 있다.

이하에서는, 음성 표현형 함수 생성 장치가 수행하는 다양한 동작이나 응용들이 설명되는데, 상기 수신부, 추출부, 청취 평가부, 연산부 및 함수 생성부 중 어느 구성을 특정하지 않더라도 본 발명의 기술분야에 대한 통상의 기술자가 명확하게 이해하고 예상할 수 있는 정도의 내용은 통상의 구현으로 이해될 수 있으며, 본 발명의 권리범위가 특정한 구성의 명칭이나 물리적/논리적 구조에 의해 제한되는 것은 아니다.

도 8은 일실시예에 따른 음성 표현형 함수 생성 방법의 흐름을 나타낸 순서도(800)이다.

음성 표현형 함수 생성 장치는 복수의 사용자에 대한 음성 및 복수의 사용자에 대한 건강 정보 데이터를 수신할 수 있다. (단계 810) 복수의 사용자에 대한 음성은 미리 정해진 모음, 단어 및 문장들에 대한 발성일 수 있다. 복수의 사용자에 대한 건강 정보 데이터는 사용자 각각에 대한 건강 정보를 포함하는 데이터로서, 해당되는 질환이나 질병을 포함할 수 있다.

음성 표현형 함수 생성 장치는 복수의 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출할 수 있다. (단계 820) 파라미터는 음성 특징을 나타내는 모음 파라미터 또는 문장 파라미터를 포함할 수 있다. 파라미터는 유효한 음성 신호 구간에서 추출될 수 있다. 음성 표현형 함수 생성 장치는 음성 신호 구간을 프레임 별로 나누고 프레임 윈도우를 이동해 나가면서 파라미터를 추출할 수 있다.

음성 표현형 함수 생성 장치는 복수의 사용자에 대한 음성을 음성 표현형에 대한 청취 평가를 수행할 수 있다. (단계 830) 음성 표현형은 음의 굵기, 음의 맑기, 음의 거칠기 중 적어도 하나에 해당할 수 있다. 청취 평가는 음성을 미리 정해진 음성 표현형 기준에 따라 분류함으로써 수행될 수 있다. 예를 들면, 음성을 음의 맑기로 분류하면, "맑음", "조금 맑음", "보통", "조금 탁함" 및 "탁함"으로 분류될 수 있다.

음성 표현형 함수 생성 장치는 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 수행한 청취평가를 이용하여 음성 표현형과 건강 정보 데이터의 상관관계를 연산할 수 있다. (단계 840) 연산부는 파라미터의 값과 음성 표현형 상관관계를 연산할 수 있다. 예를 들면, 연산부는 MFCC가 클수록 탁한 음성인 관계를 도출할 수 있다. 또한, 연산부는 건강 정보 데이터를 이용하여, 탁한 음성을 가질수록 "A질병"의 확률이 높다는 상관관계를 연산할 수 있다.

음성 표현형 함수 생성 장치는 음성 표현형과 건강 정보 데이터의 상관관계를 이용하여 음성 표현형 함수를 생성할 수 있다. (단계 850) 상관관계를 이용하여 사용자의 음성에 대한 음성 표현형 함수를 생성할 수 있다. 음성 표현형 함수를 이용하면, 사용자의 음성을 음성 표현형 및 그에 대응하는 건강 상태를 알 수 있다.

또한, 음성 표현형 함수 생성 장치는 복수의 사용자를 체질 별로 분류하고, 음성 표현형 함수를 체질 별로 생성할 수 있다. 일실시예에 따라, 태음인 및 음의 굵기에 대한 음성 표현형 함수를 이용하여, 체질이 태음인이고, 음의 굵기가 굵은 사람을 건강하다고 판단할 수 있다.

도 9는 일실시예에 따라, 파라미터에 대한 청취 평가를 수행한 데이터를 그래프로 나타낸 예시 도면(900)이다.

일실시예에 따르면, 도 9는 MFCC2 및 MFCC6에 대한 청취 평가를 수행한 데이터를 그래프로 나타낸 예시 도면이다. 음의 맑기는, "맑음", "조금 맑음", "보통", "조금 탁함" 및 "탁함"으로 분류될 수 있다. 사용자의 음성에 대한 MFCC2 및 MFCC6의 값을 계산하고, 도시할 수 있다. 청취 평가를 수행하는 과정에서 로지스틱 리그레션(logistic regression)을 활용하여 음성 그룹을 "맑은 그룹", "조금 맑은 그룹", "보통 그룹", "조금 탁한 그룹" 및 "탁한 그룹"으로 분류할 수 있다. 도시된 데이터를 기준으로 분포도를 직선으로 나타낼 수 있다. 또한, 직선을 이용하여 음의 맑음 정도를 점수로 수치화하여 나타낼 수 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다.

처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.

이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.

소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.

컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.

프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

Claims

시계열적으로 수신한 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 단계;
상기 추출된 파라미터의 값 및 상기 파라미터에 대응하는 음성 표현형 함수를 이용하여, 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나의 음성 표현형을 결정하는 단계;
상기 사용자의 건강 상태를 판단하기 위한 상기 음성 표현형의 제1 범위를 설정하는 단계; 및
상기 시계열적으로 수신한 음성에 대한 음성 표현형의 값이 상기 제1 범위에 포함되는지의 여부에 따라 상기 사용자의 시계열적 건강 상태를 판단하는 단계를 포함하고,
상기 사용자의 시계열적 건강 상태를 판단하는 단계는,
상기 시계열적으로 수신한 음성에 대한 음성 표현형의 값의 변동 방향에 기초하여 상기 사용자의 건강 상태를 결정하며, 상기 제1 범위 이외의 값이 발생하는 구간의 빈도 및 이동 평균선에 기초하여 상기 사용자의 건강 상태 추이를 판단하는 건강 상태 판단 방법.
제1항에 있어서,
상기 추출된 파라미터에 대응하는 음성 표현형 함수를 호출하는 단계를 더 포함하는 건강 상태 판단 방법.
제1항에 있어서,
상기 음성 표현형 함수를 생성하는 단계를 더 포함하는 건강 상태 판단 방법.
제3항에 있어서,
상기 음성 표현형 함수를 생성하는 단계는,
복수의 사용자에 대한 음성 및 상기 복수의 사용자에 대한 건강 정보 데이터를 수신하는 단계;
상기 복수의 사용자에 대한 음성으로부터 상기 파라미터를 추출하는 단계;
상기 복수의 사용자에 대한 음성을 음성 표현형에 대한 청취 평가를 수행하는 단계;
상기 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 상기 수행한 청취평가를 이용하여 상기 음성 표현형과 상기 건강 정보 데이터의 상관관계를 연산하는 단계;
상기 연산된 상관관계를 이용하여 상기 음성 표현형 함수를 생성하는 단계
를 포함하는 건강 상태 판단 방법.
삭제
제4항에 있어서,
상기 음의 맑기는 MFCC2 및 MFCC6의 파라미터에 기초하여 결정되며, 상기 음의 굵기는 MFCC1 및 HNR35의 파라미터에 기초하여 결정되며, 상기 음의 거칠기는 MFCC3 및 MFCC6의 파라미터에 기초하여 결정되는 건강 상태 판단 방법.
제4항에 있어서,
상기 음성 표현형에 대한 청취 평가를 수행하는 단계는,
상기 복수의 사용자에 대한 음성을 미리 정해진 음성 표현형 기준에 따라 분류하는 단계인 건강 상태 판단 방법.
제4항에 있어서,
상기 복수의 사용자를 체질 별로 분류하고, 상기 음성 표현형 함수를 상기 체질 별로 생성하는 단계
를 더 포함하는 건강 상태 판단 방법.
삭제
삭제
삭제
제1항에 있어서,
상기 사용자의 건강 상태에 기초하여, 상기 사용자에게 음식 정보 또는 운동 정보를 제공하는 단계를 더 포함하는 건강 상태 판단 방법.
사용자의 건강 상태를 판단하기 위한 음성 표현형 함수를 생성하는 음성 표현형 함수 생성 방법에 있어서,
복수의 사용자에 대한 음성 및 상기 복수의 사용자에 대한 건강 정보 데이터를 수신하는 단계;
상기 복수의 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 단계;
상기 복수의 사용자에 대한 음성을 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나의 음성 표현형에 대한 청취 평가를 수행하는 단계;
상기 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 상기 수행한 청취평가를 이용하여 상기 음성 표현형과 상기 건강 정보 데이터의 상관관계를 연산하는 단계;
상기 연산된 상관관계를 이용하여 상기 음성 표현형 함수를 체질별로 생성하는 단계
를 포함하고,
상기 음의 맑기는 MFCC2 및 MFCC6의 파라미터에 기초하여 결정되며, 상기 음의 굵기는 MFCC1 및 HNR35의 파라미터에 기초하여 결정되며, 상기 음의 거칠기는 MFCC3 및 MFCC6의 파라미터에 기초하여 결정되는 음성 표현형 함수 생성 방법.
삭제
삭제
음성 표현형 함수 생성 방법을 실행하는 프로그램을 수록한 컴퓨터 판독 가능 기록 매체에 있어서, 상기 음성 표현형 함수 생성 방법은,
복수의 사용자에 대한 음성 및 상기 복수의 사용자에 대한 건강 정보 데이터를 수신하는 단계;
상기 복수의 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 단계;
상기 복수의 사용자에 대한 음성을 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나의 음성 표현형에 대한 청취 평가를 수행하는 단계;
상기 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 상기 수행한 청취평가를 이용하여 상기 음성 표현형과 상기 건강 정보 데이터의 상관관계를 연산하는 단계;
상기 연산된 상관관계를 이용하여 상기 음성 표현형 함수를 체질별로 생성하는 단계
를 포함하고,
상기 음의 맑기는 MFCC2 및 MFCC6의 파라미터에 기초하여 결정되며, 상기 음의 굵기는 MFCC1 및 HNR35의 파라미터에 기초하여 결정되며, 상기 음의 거칠기는 MFCC3 및 MFCC6의 파라미터에 기초하여 결정되는 컴퓨터 판독 가능 기록 매체.
시계열적으로 수신한 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 추출부;
상기 추출된 파라미터의 값 및 상기 파라미터에 대응하는 음성 표현형 함수를 이용하여, 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나의 음성 표현형을 결정하는 음성 표현형 결정부; 및
상기 사용자의 건강 상태를 판단하기 위한 상기 결정된 음성 표현형의 제1 범위를 설정하고, 상기 시계열적으로 수신한 음성에 대한 음성 표현형의 값이 상기 제1 범위에 포함되는지의 여부에 따라 상기 사용자의 시계열적 건강 상태를 판단하는 건강 상태 판단부를 포함하고,
상기 건강 상태 판단부는,
상기 시계열적으로 수신한 음성에 대한 음성 표현형의 값의 변동 방향에 기초하여 상기 사용자의 건강 상태를 결정하며, 상기 제1 범위 이외의 값이 발생하는 구간의 빈도 및 이동 평균선에 기초하여 상기 사용자의 건강 상태 추이를 판단하는 건강 상태 판단 장치.
삭제
사용자의 건강 상태를 판단하기 위한 음성 표현형 함수를 생성하는 음성 표현형 함수 생성 장치에 있어서,
복수의 사용자에 대한 음성 및 상기 복수의 사용자에 대한 건강 정보 데이터를 수신하는 수신부;
상기 복수의 사용자에 대한 음성으로부터 음성 특징을 나타내는 파라미터를 추출하는 추출부;
상기 복수의 사용자에 대한 음성을 음의 맑기, 음의 굵기 및 음의 거칠기 중 적어도 하나의 음성 표현형에 대한 청취 평가를 수행하는 청취 평가부;
상기 복수의 사용자에 대한 음성에서 추출된 파라미터의 값 및 상기 수행한 청취평가를 이용하여 상기 음성 표현형과 상기 건강 정보 데이터의 상관관계를 연산하는 연산부;
상기 연산된 상관관계를 이용하여 상기 음성 표현형 함수를 체질별로 생성하는 함수 생성부
를 포함하고,
상기 음의 맑기는 MFCC2 및 MFCC6의 파라미터에 기초하여 결정되며, 상기 음의 굵기는 MFCC1 및 HNR35의 파라미터에 기초하여 결정되며, 상기 음의 거칠기는 MFCC3 및 MFCC6의 파라미터에 기초하여 결정되는 음성 표현형 함수 생성 장치.
삭제