WO2023145994A1

WO2023145994A1 - 음성 분석을 이용하여 우울증을 검사하는 장치

Info

Publication number: WO2023145994A1
Application number: PCT/KR2022/001426
Authority: WO
Inventors: 최정회; 노유헌
Original assignee: 심심이(주)
Priority date: 2022-01-26
Filing date: 2022-01-27
Publication date: 2023-08-03
Also published as: KR20230115068A

Abstract

본 개시는 음성 분석을 이용하여 우울증을 검사하는 장치에 관한 것이다. 본 개시의 일 실시 예에 따른 장치는, 적어도 하나의 프로그램이 저장된 메모리; 및 상기 적어도 하나의 프로그램을 실행함으로써 연산을 수행하는 프로세서를 포함하고, 상기 프로세서는, 제1 특성 지문을 읽는 사용자의 제1 음향 특성을 획득하고, 제2 특성 지문을 읽는 사용자의 제2 음향 특성을 획득하고, 평온 지문을 읽는 사용자의 제3 음향 특성을 획득하고, 상기 제1 음향 특성과 상기 제3 음향 특성 간의 연산, 및 상기 제2 음향 특성과 상기 제3 음향 특성 간의 연산을 통해, 우울증 판단 기준 정보를 생성하며, 상기 우울증 판단 기준 정보를 이용하여 우울증 종류 및 우울증 정도 중 적어도 하나를 분석하는 것인, 장치를 제공할 수 있다.

Description

음성 분석을 이용하여 우울증을 검사하는 장치

본 발명은 음성 분석을 이용하여 우울증을 검사하는 장치에 관한 것이다.

최근 지나친 학업 경쟁, 교우관계, 따돌림, 및 학교폭력 등 다양한 이유로 고통받는 학생, 미래에 대한 막연한 불안감을 겪는 군인, 일자리 감소로 인해 스트레스 받는 취업 준비생, 직무 스트레스 및 고용불만으로 우울증 증세를 겪는 회사원, 전염병으로 인한 사회적 배경으로 발생한 이웃 간의 소통 단절 및 일자리 감소로 고통받는 주부, 및 사별, 은퇴, 경제적 곤란으로 인해 스트레스를 받는 사람들이 늘어나고 있다.

이러한 원인으로 발생하는 스트레스 등으로 우울증 및 불안증 등과 같은 정신 건강 관련질환을 앓는 환자가 증가하고 있는 추세이며, 이는 극단적인 선택으로도 이어질 수 있어 사회적으로 중요한 문제로 대두되고 있다.

특히, 우리나라는 OECD 국가 중 노인 고령화 속도 1위와 노인 자살률 1위를 차지하고 있다. 고령인구가 증가하면서 혼자 사는 독거노인 또는 고령자만 거주하는 가구 수가 많아졌으며, 이들이 사회와 가족들의 외면 속에서 빈곤과 소외감을 이기지 못하고 극단적인 선택을 하는 경우가 많아지고 있다. 따라서, 이를 예방하고 사회적으로 고립되지 않도록 우울증 및 불안증을 조기에 예측하고 예방하는 방법에 대한 연구가 필요한 실정이다.

대부분의 우울증은 불안을 동반하고, 감정적 증상, 신체적 증상, 생각으로 나타나는 증상들로 표현되는 특징을 보이는 것으로 알려져 있으며, 이러한 특징을 활용하여 우울증을 판별하려는 연구가 지속되어 왔다. 그러나, 이 경우에도 우울증 판단을 위해서는 측정 및 분석에 대한 전문적인 지식을 필요로 하여 시스템이 복잡해지는 단점이 있다.

본 발명은 음성 분석을 이용하여 우울증을 검사하는 장치를 제공하는데 있다. 본 발명이 해결하고자 하는 과제는 이상에서 언급한 과제에 한정되지 않으며, 언급되지 않은 본 발명의 다른 과제 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시 예에 의해보다 분명하게 이해될 것이다. 또한, 본 발명이 해결하고자 하는 과제 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 알 수 있을 것이다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 개시의 제1 측면은, 음성 분석을 이용하여 우울증을 검사하는 방법에 있어서, 제1 특성 지문을 읽는 사용자의 제1 음향 특성을 획득하는 단계; 제2 특성 지문을 읽는 사용자의 제2 음향 특성을 획득하는 단계; 평온 지문을 읽는 사용자의 제3 음향 특성을 획득하는 단계; 제1 음향 특성과 제3 음향 특성 간의 연산, 및 제2 음향 특성과 제3 음향 특성 간의 연산을 통해, 우울증 판단 기준 정보를 생성하는 단계; 및 우울증 판단 기준 정보를 이용하여 우울증 종류 및 우울증 정도 중 적어도 하나를 분석하는 단계;를 포함하는, 방법을 제공할 수 있다.

전술한 본 개시의 과제 해결 수단에 의하면, 노인, 언어, 문화, 사투리와 상관없이 음성의 특성만을 이용해 우울증을 조기 선별, 검사할 수 있다.

도 1은 일 실시예에 따른 음성 분석을 이용하여 우울증을 검사하는 장치의 블록도이다.

본 방법은 노인, 언어, 문화, 사투리와 상관없이 보정하고 분석할 수 있도록 데이터를 자체 표준화하는 기술이 중요함(예컨데 3번 평온 지문으로 음성 특성들을 개인 보정함). 이를 통해서 음성의 특성만을 이용해 우울증을 조기 선별, 검사할 수 있음.

심리적 상태를 파악할 수 있는 지문을 3종 읽게 하여 각 지문을 읽는 동안 발생하는 화자의 감정 변화와 음성과의 관계를 분석함.

1. 분노 지문 예시 - 소리지르다, 힘들어, 죽겠어, 등 분노 단어 포함

“제발 좀 그러지 마세요. 소리 좀 그만 지르시라고요!”

연수는 들고 있던 물 컵을 소리 나게 식탁에 내려놓으며 소리쳤다.

“저도 힘들어 죽겠다고요!”

2. 감동 지문 예시 - 웃음, 고맙다, 다행 등의 감동 단어가 포함

“고맙다 윤아!” 아버지는 일자리가 생긴 게 얼마나 다행인가 싶었다.

모처럼 활짝 웃는 얼굴로 다짐을 받으려는 듯 윤박사에게 재차 물었다.

“그 자리 틀림없는 거지? 고맙다. 윤아. 내가 나중에 한턱내마.”

3. 평온 지문 예시 - 지켜보다, 바라보다, 낮잠, 평온, 편안 등의 평온 단어 포함

한낮이면 할머니가 으레 소파에서 고양이처럼 웅크려 낮잠을 자고, 엄마는 그 옆에 오도카니 앉아 연수가 집안일 거드는 것 대견한 듯 바라보았다. 그럴 때 정수는 주방 식탁이나 거실 창가쯤에서 엄마를 지켜보았다.

4. 기쁨 지문 예시 - 설레다, 미래 설계, 새로운, 행복, 꿈꾸다 등의 기쁨 단어 포함.

“새 집 지으면 안방 창 쪽으로 커다란 베란다를 만들 거예요. 그 곳에 꽃도 심고 작은 테이블도 하나 놓을 거야. 당신이랑 가끔 차도 마시고 꽃도 볼 겸. 아침저녁으로 해도 보고 달도 보고…….” 창가에 서서 아내는 몹시 설레는 마음으로 미래를 설계했고 새로운 날, 새로운 시간들을 꿈꾸며 행복해했다.

5. 슬픔 지문 예시 - 오열, 슬품, 눈물, 죽음 등의 슬픔 단어 포함

아버지는 차마 엄마를 보지 못하고 다시 한 번 조용히 불러본다. “여보….” 엄마는 아무런 대답이 없다. 아버지는 몸을 일으켜 마치 잠이 든 듯 깨어나지 않는 엄마를 가만히 내려다본다. “인희야!” 이젠 영원히 그 대답을 듣지 못한 엄마의 이름을 부르며 아버지는 오열한다. 주체할 수 없는 눈물이 계속 아버지의 볼을 타고 흘러내렸다. 아버지는 몸이 굽혀 식어버린 아내의 몸을 부서져라 껴안았다.

다음의 지문 3번 평온지문과 1, 5 번 (분노, 슬픔) 지문 중 하나, 2, 4번 (감동, 기쁨) 지문 중 하나를 선택하여 노인에게 지문을 읽게함.

각 지문을 읽을때 환자의 지문을 읽는 음성 샘플에서 음향 특성을 추출하여 데이터화 함. 각 음성별 특징은 기본 주파수, 발화속도, 발화 멈춤 시간, 쉼머, 지터, 모먼트, 음성 스펙트럼, 총 발화 시간, 톤 변화를 포함함.

각 데이터는 3번의 평온지문을 읽을 때 음향 특성을 기준으로 1,5번의 지문을 읽을 때 음향 특성을 빼고 2,4번 지문을 읽을 때 음향 특성은 더한다.

예컨데, 1번 지문, 2번 지문, 3번 지문을 읽을 경우, 3번 지문 읽을 때 음향특성에서 1번 지문 읽을 때의 특성을 뺀 각각의 음성별 특징 데이터들 (예컨데 3번 지문 발화 속도 12초, 1번 지문 10초의 경우 발화속도 데이터는 2초가됨.)과 3번 지문을 읽을 때 음향 특성에서 2번 지문을 읽을 때 특성을 더한 각각의 음성별 특징 데이터들 (예컨데 3번 지문 발화 속도 12초, 2번 지문을 읽을 때 18초의 경우 30초가 됨) 을 수집함.

이렇게 수집된 음향 특성들을 셋트로 만들어서 우울증을 분석하기 위한 데이터로 사용함.

도 1을 참조하면, 우울증을 검사하는 장치(100)는 통신부(110), 프로세서(120) 및 DB(130)를 포함할 수 있다. 도 1의 트래픽 흐름 결정 장치(100)에는 실시예와 관련된 구성요소들만이 도시되어 있다. 따라서, 도 12에 도시된 구성요소들 외에 다른 범용적인 구성요소들이 더 포함될 수 있음을 당해 기술분야의 통상의 기술자라면 이해할 수 있다.

통신부(110)는 외부 서버 또는 외부 장치와 유선/무선 통신을 하게 하는 하나 이상의 구성 요소를 포함할 수 있다. 예를 들어, 통신부(110)는, 근거리 통신부(미도시), 이동 통신부(미도시) 및 방송 수신부(미도시) 중 적어도 하나를 포함할 수 있다.

DB(130)는 장치(100) 내에서 처리되는 각종 데이터들을 저장하는 하드웨어로서, 프로세서(120)의 처리 및 제어를 위한 프로그램을 저장할 수 있다.

DB(130)는 DRAM(dynamic random access memory), SRAM(static random access memory) 등과 같은 RAM(random access memory), ROM(read-only memory), EEPROM(electrically erasable programmable read-only memory), CD-ROM, 블루레이 또는 다른 광학 디스크 스토리지, HDD(hard disk drive), SSD(solid state drive), 또는 플래시 메모리를 포함할 수 있다.

프로세서(120)는 장치(100)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(120)는 DB(130)에 저장된 프로그램들을 실행함으로써, 입력부(미도시), 디스플레이(미도시), 통신부(110), DB(130) 등을 전반적으로 제어할 수 있다. 프로세서(120)는, DB(130)에 저장된 프로그램들을 실행함으로써, 트래픽 흐름 결정 장치(100)의 동작을 제어할 수 있다.

프로세서(120)는 장치(100)의 동작 중 적어도 일부를 제어할 수 있다.

프로세서(120)는 ASICs (application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적 유닛 중 적어도 하나를 이용하여 구현될 수 있다.

본 발명에 따른 실시 예는 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형태로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이때, 매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다.

한편, 상기 컴퓨터 프로그램은 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 프로그램의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함될 수 있다.

일 실시예에 따르면, 본 개시의 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

본 발명에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 본 발명이 한정되는 것은 아니다. 본 발명에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 본 발명을 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 본 발명의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.

따라서, 본 발명의 사상은 상기 설명된 실시 예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims

음성 분석을 이용하여 우울증을 검사하는 장치에 있어서,

적어도 하나의 프로그램이 저장된 메모리; 및

상기 적어도 하나의 프로그램을 실행함으로써 연산을 수행하는 프로세서를 포함하고,

상기 프로세서는,

제1 특성 지문을 읽는 사용자의 제1 음향 특성을 획득하고,

제2 특성 지문을 읽는 사용자의 제2 음향 특성을 획득하고,

평온 지문을 읽는 사용자의 제3 음향 특성을 획득하고,

상기 제1 음향 특성과 상기 제3 음향 특성 간의 연산, 및 상기 제2 음향 특성과 상기 제3 음향 특성 간의 연산을 통해, 우울증 판단 기준 정보를 생성하며,

상기 우울증 판단 기준 정보를 이용하여 우울증 종류 및 우울증 정도 중 적어도 하나를 분석하는 것인, 장치.
제 1 항에 있어서,

상기 프로세서는,

상기 제1 특성 지문은 분노 지문 및 슬픔 지문 중 적어도 하나의 지문을 포함하는 것인, 장치.
제 1 항에 있어서,

상기 프로세서는,

상기 제2 특성 지문은 감동 지문 및 기쁨 지문 중 적어도 하나의 지문을 포함하는 것인, 장치.