WO2023145994A1 - 음성 분석을 이용하여 우울증을 검사하는 장치 - Google Patents

음성 분석을 이용하여 우울증을 검사하는 장치 Download PDF

Info

Publication number
WO2023145994A1
WO2023145994A1 PCT/KR2022/001426 KR2022001426W WO2023145994A1 WO 2023145994 A1 WO2023145994 A1 WO 2023145994A1 KR 2022001426 W KR2022001426 W KR 2022001426W WO 2023145994 A1 WO2023145994 A1 WO 2023145994A1
Authority
WO
WIPO (PCT)
Prior art keywords
depression
fingerprint
characteristic
acoustic characteristic
processor
Prior art date
Application number
PCT/KR2022/001426
Other languages
English (en)
French (fr)
Inventor
최정회
노유헌
Original Assignee
심심이(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 심심이(주) filed Critical 심심이(주)
Publication of WO2023145994A1 publication Critical patent/WO2023145994A1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4803Speech analysis specially adapted for diagnostic purposes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4884Other medical applications inducing physiological or psychological stress, e.g. applications for stress testing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2503/00Evaluating a particular growth phase or type of persons or animals
    • A61B2503/08Elderly

Definitions

  • the present invention relates to an apparatus for screening for depression using voice analysis.
  • Korea ranks first in the rate of aging of the elderly and in the suicide rate among the elderly among OECD countries.
  • the number of elderly people living alone or households where only the elderly live has increased, and there are many cases in which they make extreme choices without overcoming poverty and alienation in society and their families. Therefore, there is a need for research on methods for predicting and preventing depression and anxiety in an early stage to prevent them and prevent social isolation.
  • the present invention is to provide an apparatus for examining depression using voice analysis.
  • the problem to be solved by the present invention is not limited to the above-mentioned problems, and other problems and advantages of the present invention that are not mentioned can be understood by the following description and more clearly understood by the embodiments of the present invention. It will be. In addition, it will be appreciated that the problems and advantages to be solved by the present invention can be realized by the means and combinations indicated in the claims.
  • a first aspect of the present disclosure provides a method for examining depression using voice analysis, comprising: obtaining a first acoustic characteristic of a user reading a first characteristic fingerprint; obtaining a second acoustic characteristic of a user reading a second characteristic fingerprint; obtaining a third acoustic characteristic of a user reading a calmness fingerprint; generating depression determination criterion information through a calculation between the first acoustic characteristic and the third acoustic characteristic, and a calculation between the second acoustic characteristic and the third acoustic characteristic; And analyzing at least one of the type of depression and the degree of depression using the depression criterion information; including, it is possible to provide a method.
  • depression can be screened and tested at an early stage using only voice characteristics regardless of the elderly, language, culture, or dialect.
  • FIG. 1 is a block diagram of an apparatus for examining depression using voice analysis according to an embodiment.
  • An apparatus includes a memory in which at least one program is stored; and a processor that performs an operation by executing the at least one program, wherein the processor acquires first acoustic characteristics of a user reading a first characteristic fingerprint and second acoustic characteristics of a user reading a second characteristic fingerprint.
  • inspirational fingerprints including inspirational words such as laughter, thank you, and gladness
  • serenity passages including serenity words such as watch, watch, nap, serenity, comfort, etc.
  • sadness fingerprints - include sadness words such as sobbing, grief, tears, and death
  • the acoustic characteristics are extracted from the voice sample reading the patient's fingerprint and turned into data. Characteristics of each voice include fundamental frequency, speech rate, speech pause time, pause, jitter, moment, voice spectrum, total speech time, and tone change.
  • the acoustic characteristics are subtracted from the acoustic characteristics when the fingerprints 1 and 5 are read, and the acoustic characteristics are added when the fingerprints 2 and 4 are read.
  • the characteristic data for each voice obtained by subtracting the characteristic when reading fingerprint 1 from the acoustic characteristics when reading fingerprint 3 (e.g., the speech speed of fingerprint 3 is 12 seconds)
  • the speech speed data is 2 seconds.
  • characteristic data for each voice that adds the characteristics when reading No. 2 from the acoustic characteristics when reading No. 3 e.g., the speech speed of No. 3 is 12 seconds.
  • FIG. 1 is a block diagram of an apparatus for examining depression using voice analysis according to an embodiment.
  • an apparatus 100 for checking depression may include a communication unit 110 , a processor 120 and a DB 130 .
  • a communication unit 110 may include a communication unit 110 , a processor 120 and a DB 130 .
  • a processor 120 may include a processor 120 and a DB 130 .
  • DB 130 may be a DB 130 .
  • components related to the embodiment are shown. Accordingly, those skilled in the art can understand that other general-purpose components may be further included in addition to the components shown in FIG. 12 .
  • the communication unit 110 may include one or more components that enable wired/wireless communication with an external server or external device.
  • the communication unit 110 may include at least one of a short-range communication unit (not shown), a mobile communication unit (not shown), and a broadcast reception unit (not shown).
  • the DB 130 is hardware for storing various data processed in the device 100, and may store programs for processing and controlling the processor 120.
  • the DB 130 includes random access memory (RAM) such as dynamic random access memory (DRAM) and static random access memory (SRAM), read-only memory (ROM), electrically erasable programmable read-only memory (EEPROM), and CD-ROM.
  • RAM random access memory
  • DRAM dynamic random access memory
  • SRAM static random access memory
  • ROM read-only memory
  • EEPROM electrically erasable programmable read-only memory
  • CD-ROM compact discs, compact discs, digital versatile discs, and Blu-ray or other optical disk storage, hard disk drive (HDD), solid state drive (SSD), or flash memory.
  • the processor 120 controls the overall operation of the device 100.
  • the processor 120 may generally control an input unit (not shown), a display (not shown), the communication unit 110, and the DB 130 by executing programs stored in the DB 130.
  • the processor 120 may control the operation of the traffic flow determining device 100 by executing programs stored in the DB 130 .
  • the processor 120 may control at least some of the operations of the device 100 .
  • the processor 120 may include application specific integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), field programmable gate arrays (FPGAs), controllers, and microcontrollers. It may be implemented using at least one of micro-controllers, microprocessors, and electrical units for performing other functions.
  • ASICs application specific integrated circuits
  • DSPs digital signal processors
  • DSPDs digital signal processing devices
  • PLDs programmable logic devices
  • FPGAs field programmable gate arrays
  • controllers and microcontrollers. It may be implemented using at least one of micro-controllers, microprocessors, and electrical units for performing other functions.
  • Embodiments according to the present invention may be implemented in the form of a computer program that can be executed on a computer through various components, and such a computer program may be recorded on a computer-readable medium.
  • the medium is a magnetic medium such as a hard disk, a floppy disk and a magnetic tape, an optical recording medium such as a CD-ROM and a DVD, a magneto-optical medium such as a floptical disk, and a ROM hardware devices specially configured to store and execute program instructions, such as RAM, flash memory, and the like.
  • the computer program may be specially designed and configured for the present invention, or may be known and usable to those skilled in the art of computer software.
  • An example of a computer program may include not only machine language code generated by a compiler but also high-level language code that can be executed by a computer using an interpreter or the like.
  • the method according to various embodiments of the present disclosure may be included and provided in a computer program product.
  • Computer program products may be traded between sellers and buyers as commodities.
  • a computer program product is distributed in the form of a device-readable storage medium (eg compact disc read only memory (CD-ROM)), or through an application store (eg Play StoreTM) or between two user devices. It can be distributed (e.g., downloaded or uploaded) directly or online. In the case of online distribution, at least part of the computer program product may be temporarily stored or temporarily created in a device-readable storage medium such as a manufacturer's server, an application store server, or a relay server's memory.
  • a device-readable storage medium such as a manufacturer's server, an application store server, or a relay server's memory.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Veterinary Medicine (AREA)
  • Surgery (AREA)
  • Child & Adolescent Psychology (AREA)
  • Hospice & Palliative Care (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Social Psychology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Educational Technology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Physiology (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

본 개시는 음성 분석을 이용하여 우울증을 검사하는 장치에 관한 것이다. 본 개시의 일 실시 예에 따른 장치는, 적어도 하나의 프로그램이 저장된 메모리; 및 상기 적어도 하나의 프로그램을 실행함으로써 연산을 수행하는 프로세서를 포함하고, 상기 프로세서는, 제1 특성 지문을 읽는 사용자의 제1 음향 특성을 획득하고, 제2 특성 지문을 읽는 사용자의 제2 음향 특성을 획득하고, 평온 지문을 읽는 사용자의 제3 음향 특성을 획득하고, 상기 제1 음향 특성과 상기 제3 음향 특성 간의 연산, 및 상기 제2 음향 특성과 상기 제3 음향 특성 간의 연산을 통해, 우울증 판단 기준 정보를 생성하며, 상기 우울증 판단 기준 정보를 이용하여 우울증 종류 및 우울증 정도 중 적어도 하나를 분석하는 것인, 장치를 제공할 수 있다.

Description

음성 분석을 이용하여 우울증을 검사하는 장치
본 발명은 음성 분석을 이용하여 우울증을 검사하는 장치에 관한 것이다.
최근 지나친 학업 경쟁, 교우관계, 따돌림, 및 학교폭력 등 다양한 이유로 고통받는 학생, 미래에 대한 막연한 불안감을 겪는 군인, 일자리 감소로 인해 스트레스 받는 취업 준비생, 직무 스트레스 및 고용불만으로 우울증 증세를 겪는 회사원, 전염병으로 인한 사회적 배경으로 발생한 이웃 간의 소통 단절 및 일자리 감소로 고통받는 주부, 및 사별, 은퇴, 경제적 곤란으로 인해 스트레스를 받는 사람들이 늘어나고 있다.
이러한 원인으로 발생하는 스트레스 등으로 우울증 및 불안증 등과 같은 정신 건강 관련질환을 앓는 환자가 증가하고 있는 추세이며, 이는 극단적인 선택으로도 이어질 수 있어 사회적으로 중요한 문제로 대두되고 있다.
특히, 우리나라는 OECD 국가 중 노인 고령화 속도 1위와 노인 자살률 1위를 차지하고 있다. 고령인구가 증가하면서 혼자 사는 독거노인 또는 고령자만 거주하는 가구 수가 많아졌으며, 이들이 사회와 가족들의 외면 속에서 빈곤과 소외감을 이기지 못하고 극단적인 선택을 하는 경우가 많아지고 있다. 따라서, 이를 예방하고 사회적으로 고립되지 않도록 우울증 및 불안증을 조기에 예측하고 예방하는 방법에 대한 연구가 필요한 실정이다.
대부분의 우울증은 불안을 동반하고, 감정적 증상, 신체적 증상, 생각으로 나타나는 증상들로 표현되는 특징을 보이는 것으로 알려져 있으며, 이러한 특징을 활용하여 우울증을 판별하려는 연구가 지속되어 왔다. 그러나, 이 경우에도 우울증 판단을 위해서는 측정 및 분석에 대한 전문적인 지식을 필요로 하여 시스템이 복잡해지는 단점이 있다.
본 발명은 음성 분석을 이용하여 우울증을 검사하는 장치를 제공하는데 있다. 본 발명이 해결하고자 하는 과제는 이상에서 언급한 과제에 한정되지 않으며, 언급되지 않은 본 발명의 다른 과제 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시 예에 의해보다 분명하게 이해될 것이다. 또한, 본 발명이 해결하고자 하는 과제 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 알 수 있을 것이다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 개시의 제1 측면은, 음성 분석을 이용하여 우울증을 검사하는 방법에 있어서, 제1 특성 지문을 읽는 사용자의 제1 음향 특성을 획득하는 단계; 제2 특성 지문을 읽는 사용자의 제2 음향 특성을 획득하는 단계; 평온 지문을 읽는 사용자의 제3 음향 특성을 획득하는 단계; 제1 음향 특성과 제3 음향 특성 간의 연산, 및 제2 음향 특성과 제3 음향 특성 간의 연산을 통해, 우울증 판단 기준 정보를 생성하는 단계; 및 우울증 판단 기준 정보를 이용하여 우울증 종류 및 우울증 정도 중 적어도 하나를 분석하는 단계;를 포함하는, 방법을 제공할 수 있다.
전술한 본 개시의 과제 해결 수단에 의하면, 노인, 언어, 문화, 사투리와 상관없이 음성의 특성만을 이용해 우울증을 조기 선별, 검사할 수 있다.
도 1은 일 실시예에 따른 음성 분석을 이용하여 우울증을 검사하는 장치의 블록도이다.
본 개시는 음성 분석을 이용하여 우울증을 검사하는 장치에 관한 것이다. 본 개시의 일 실시 예에 따른 장치는, 적어도 하나의 프로그램이 저장된 메모리; 및 상기 적어도 하나의 프로그램을 실행함으로써 연산을 수행하는 프로세서를 포함하고, 상기 프로세서는, 제1 특성 지문을 읽는 사용자의 제1 음향 특성을 획득하고, 제2 특성 지문을 읽는 사용자의 제2 음향 특성을 획득하고, 평온 지문을 읽는 사용자의 제3 음향 특성을 획득하고, 상기 제1 음향 특성과 상기 제3 음향 특성 간의 연산, 및 상기 제2 음향 특성과 상기 제3 음향 특성 간의 연산을 통해, 우울증 판단 기준 정보를 생성하며, 상기 우울증 판단 기준 정보를 이용하여 우울증 종류 및 우울증 정도 중 적어도 하나를 분석하는 것인, 장치를 제공할 수 있다.
본 방법은 노인, 언어, 문화, 사투리와 상관없이 보정하고 분석할 수 있도록 데이터를 자체 표준화하는 기술이 중요함(예컨데 3번 평온 지문으로 음성 특성들을 개인 보정함). 이를 통해서 음성의 특성만을 이용해 우울증을 조기 선별, 검사할 수 있음.
심리적 상태를 파악할 수 있는 지문을 3종 읽게 하여 각 지문을 읽는 동안 발생하는 화자의 감정 변화와 음성과의 관계를 분석함.
1. 분노 지문 예시 - 소리지르다, 힘들어, 죽겠어, 등 분노 단어 포함
“제발 좀 그러지 마세요. 소리 좀 그만 지르시라고요!”
연수는 들고 있던 물 컵을 소리 나게 식탁에 내려놓으며 소리쳤다.
“저도 힘들어 죽겠다고요!”
2. 감동 지문 예시 - 웃음, 고맙다, 다행 등의 감동 단어가 포함
“고맙다 윤아!” 아버지는 일자리가 생긴 게 얼마나 다행인가 싶었다.
모처럼 활짝 웃는 얼굴로 다짐을 받으려는 듯 윤박사에게 재차 물었다.
“그 자리 틀림없는 거지? 고맙다. 윤아. 내가 나중에 한턱내마.”
3. 평온 지문 예시 - 지켜보다, 바라보다, 낮잠, 평온, 편안 등의 평온 단어 포함
한낮이면 할머니가 으레 소파에서 고양이처럼 웅크려 낮잠을 자고, 엄마는 그 옆에 오도카니 앉아 연수가 집안일 거드는 것 대견한 듯 바라보았다. 그럴 때 정수는 주방 식탁이나 거실 창가쯤에서 엄마를 지켜보았다.
4. 기쁨 지문 예시 - 설레다, 미래 설계, 새로운, 행복, 꿈꾸다 등의 기쁨 단어 포함.
“새 집 지으면 안방 창 쪽으로 커다란 베란다를 만들 거예요. 그 곳에 꽃도 심고 작은 테이블도 하나 놓을 거야. 당신이랑 가끔 차도 마시고 꽃도 볼 겸. 아침저녁으로 해도 보고 달도 보고…….” 창가에 서서 아내는 몹시 설레는 마음으로 미래를 설계했고 새로운 날, 새로운 시간들을 꿈꾸며 행복해했다.
5. 슬픔 지문 예시 - 오열, 슬품, 눈물, 죽음 등의 슬픔 단어 포함
아버지는 차마 엄마를 보지 못하고 다시 한 번 조용히 불러본다. “여보….” 엄마는 아무런 대답이 없다. 아버지는 몸을 일으켜 마치 잠이 든 듯 깨어나지 않는 엄마를 가만히 내려다본다. “인희야!” 이젠 영원히 그 대답을 듣지 못한 엄마의 이름을 부르며 아버지는 오열한다. 주체할 수 없는 눈물이 계속 아버지의 볼을 타고 흘러내렸다. 아버지는 몸이 굽혀 식어버린 아내의 몸을 부서져라 껴안았다.
다음의 지문 3번 평온지문과 1, 5 번 (분노, 슬픔) 지문 중 하나, 2, 4번 (감동, 기쁨) 지문 중 하나를 선택하여 노인에게 지문을 읽게함.
각 지문을 읽을때 환자의 지문을 읽는 음성 샘플에서 음향 특성을 추출하여 데이터화 함. 각 음성별 특징은 기본 주파수, 발화속도, 발화 멈춤 시간, 쉼머, 지터, 모먼트, 음성 스펙트럼, 총 발화 시간, 톤 변화를 포함함.
각 데이터는 3번의 평온지문을 읽을 때 음향 특성을 기준으로 1,5번의 지문을 읽을 때 음향 특성을 빼고 2,4번 지문을 읽을 때 음향 특성은 더한다.
예컨데, 1번 지문, 2번 지문, 3번 지문을 읽을 경우, 3번 지문 읽을 때 음향특성에서 1번 지문 읽을 때의 특성을 뺀 각각의 음성별 특징 데이터들 (예컨데 3번 지문 발화 속도 12초, 1번 지문 10초의 경우 발화속도 데이터는 2초가됨.)과 3번 지문을 읽을 때 음향 특성에서 2번 지문을 읽을 때 특성을 더한 각각의 음성별 특징 데이터들 (예컨데 3번 지문 발화 속도 12초, 2번 지문을 읽을 때 18초의 경우 30초가 됨) 을 수집함.
이렇게 수집된 음향 특성들을 셋트로 만들어서 우울증을 분석하기 위한 데이터로 사용함.
도 1은 일 실시예에 따른 음성 분석을 이용하여 우울증을 검사하는 장치의 블록도이다.
도 1을 참조하면, 우울증을 검사하는 장치(100)는 통신부(110), 프로세서(120) 및 DB(130)를 포함할 수 있다. 도 1의 트래픽 흐름 결정 장치(100)에는 실시예와 관련된 구성요소들만이 도시되어 있다. 따라서, 도 12에 도시된 구성요소들 외에 다른 범용적인 구성요소들이 더 포함될 수 있음을 당해 기술분야의 통상의 기술자라면 이해할 수 있다.
통신부(110)는 외부 서버 또는 외부 장치와 유선/무선 통신을 하게 하는 하나 이상의 구성 요소를 포함할 수 있다. 예를 들어, 통신부(110)는, 근거리 통신부(미도시), 이동 통신부(미도시) 및 방송 수신부(미도시) 중 적어도 하나를 포함할 수 있다.
DB(130)는 장치(100) 내에서 처리되는 각종 데이터들을 저장하는 하드웨어로서, 프로세서(120)의 처리 및 제어를 위한 프로그램을 저장할 수 있다.
DB(130)는 DRAM(dynamic random access memory), SRAM(static random access memory) 등과 같은 RAM(random access memory), ROM(read-only memory), EEPROM(electrically erasable programmable read-only memory), CD-ROM, 블루레이 또는 다른 광학 디스크 스토리지, HDD(hard disk drive), SSD(solid state drive), 또는 플래시 메모리를 포함할 수 있다.
프로세서(120)는 장치(100)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(120)는 DB(130)에 저장된 프로그램들을 실행함으로써, 입력부(미도시), 디스플레이(미도시), 통신부(110), DB(130) 등을 전반적으로 제어할 수 있다. 프로세서(120)는, DB(130)에 저장된 프로그램들을 실행함으로써, 트래픽 흐름 결정 장치(100)의 동작을 제어할 수 있다.
프로세서(120)는 장치(100)의 동작 중 적어도 일부를 제어할 수 있다.
프로세서(120)는 ASICs (application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적 유닛 중 적어도 하나를 이용하여 구현될 수 있다.
본 발명에 따른 실시 예는 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형태로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이때, 매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치를 포함할 수 있다.
한편, 상기 컴퓨터 프로그램은 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 프로그램의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함될 수 있다.
일 실시예에 따르면, 본 개시의 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
본 발명에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 본 발명이 한정되는 것은 아니다. 본 발명에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 본 발명을 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 본 발명의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시 예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims (3)

  1. 음성 분석을 이용하여 우울증을 검사하는 장치에 있어서,
    적어도 하나의 프로그램이 저장된 메모리; 및
    상기 적어도 하나의 프로그램을 실행함으로써 연산을 수행하는 프로세서를 포함하고,
    상기 프로세서는,
    제1 특성 지문을 읽는 사용자의 제1 음향 특성을 획득하고,
    제2 특성 지문을 읽는 사용자의 제2 음향 특성을 획득하고,
    평온 지문을 읽는 사용자의 제3 음향 특성을 획득하고,
    상기 제1 음향 특성과 상기 제3 음향 특성 간의 연산, 및 상기 제2 음향 특성과 상기 제3 음향 특성 간의 연산을 통해, 우울증 판단 기준 정보를 생성하며,
    상기 우울증 판단 기준 정보를 이용하여 우울증 종류 및 우울증 정도 중 적어도 하나를 분석하는 것인, 장치.
  2. 제 1 항에 있어서,
    상기 프로세서는,
    상기 제1 특성 지문은 분노 지문 및 슬픔 지문 중 적어도 하나의 지문을 포함하는 것인, 장치.
  3. 제 1 항에 있어서,
    상기 프로세서는,
    상기 제2 특성 지문은 감동 지문 및 기쁨 지문 중 적어도 하나의 지문을 포함하는 것인, 장치.
PCT/KR2022/001426 2022-01-26 2022-01-27 음성 분석을 이용하여 우울증을 검사하는 장치 WO2023145994A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020220011586A KR20230115068A (ko) 2022-01-26 2022-01-26 음성 분석을 이용하여 우울증을 검사하는 장치
KR10-2022-0011586 2022-01-26

Publications (1)

Publication Number Publication Date
WO2023145994A1 true WO2023145994A1 (ko) 2023-08-03

Family

ID=87472176

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/001426 WO2023145994A1 (ko) 2022-01-26 2022-01-27 음성 분석을 이용하여 우울증을 검사하는 장치

Country Status (2)

Country Link
KR (1) KR20230115068A (ko)
WO (1) WO2023145994A1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106725532A (zh) * 2016-12-13 2017-05-31 兰州大学 基于语音特征与机器学习的抑郁症自动评估系统和方法
CN112435689A (zh) * 2020-11-10 2021-03-02 罗科仕管理顾问有限公司 语音聊天机器人职位面试系统中的情感识别
KR102321520B1 (ko) * 2021-04-09 2021-11-05 주식회사 리얼바이오케어 음성 분석을 통한 우울증 판별 및 케어 시스템
KR20220007275A (ko) * 2020-07-10 2022-01-18 한양대학교 산학협력단 음성활동 평가를 이용한 기분삽화(우울삽화, 조증삽화) 조기 진단을 위한 정보 제공 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106725532A (zh) * 2016-12-13 2017-05-31 兰州大学 基于语音特征与机器学习的抑郁症自动评估系统和方法
KR20220007275A (ko) * 2020-07-10 2022-01-18 한양대학교 산학협력단 음성활동 평가를 이용한 기분삽화(우울삽화, 조증삽화) 조기 진단을 위한 정보 제공 방법
CN112435689A (zh) * 2020-11-10 2021-03-02 罗科仕管理顾问有限公司 语音聊天机器人职位面试系统中的情感识别
KR102321520B1 (ko) * 2021-04-09 2021-11-05 주식회사 리얼바이오케어 음성 분석을 통한 우울증 판별 및 케어 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BAEK YEONSOOK, KIM SEJOO, KIM EUNYEON, CHOI, YAELIN: "Vocal acoustic characteristics of speakers with depression", PHONETICS AND SPEECH SCIENCES, vol. 4, no. 1, 1 March 2012 (2012-03-01), pages 91 - 98, XP093082221, DOI: 10.13064/KSSS.2012.4.1.091 *

Also Published As

Publication number Publication date
KR20230115068A (ko) 2023-08-02

Similar Documents

Publication Publication Date Title
Nabi et al. Can emotions capture the elusive gain-loss framing effect? A meta-analysis
Von Hippel How many imputations do you need? A two-stage calculation using a quadratic rule
Jones et al. Integrating cues of social interest and voice pitch in men's preferences for women's voices
MacMullin et al. Plugged in: Electronics use in youth and young adults with autism spectrum disorder
d'Apice et al. A naturalistic home observational approach to children’s language, cognition, and behavior.
Valentine et al. Judging a man by the width of his face: The role of facial ratios and dominance in mate choice at speed-dating events
Dening et al. Preferences for end-of-life care: a nominal group study of people with dementia and their family carers
van Roekel et al. Loneliness in the daily lives of adolescents: An experience sampling study examining the effects of social contexts
Van der Horst et al. How friendship network characteristics influence subjective well-being
Goodkind “You can be anything you want, but you have to believe it”: Commercialized feminism in gender-specific programs for girls
Hwang et al. Information insufficiency and information seeking: An experiment
Hale et al. The virtual maze: A behavioural tool for measuring trust
Clark et al. The mediating and moderating effects of parent and peer influences upon drug use among African American adolescents
Meyer et al. Social working memory training improves perspective-taking accuracy
Kroll Towards a sociology of happiness: the case of an age perspective on the social context of well-being
Simpson et al. Theorizing compassionate leadership from the case of Jacinda Ardern: Legitimacy, paradox and resource conservation
Katz et al. Repeated interviews with children who are the alleged victims of sexual abuse
Emmenegger How good are your counterfactuals? Assessing quantitative macro-comparative welfare state research with qualitative criteria
Wiskerke et al. New relationships and intimacy in long-term care: the views of relatives of residents with dementia and care home staff
Kogan et al. Childhood adversity, socioeconomic instability, oxytocin-receptor-gene methylation, and romantic-relationship support among young African American men
Entilli et al. Social support and help-seeking among suicide bereaved: a study with Italian survivors
Bleidorn et al. Health adversity and value change
Bozicevic et al. Sculpting culture: early maternal responsiveness and child emotion regulation–a UK-Italy comparison
Andersen Phronetically guided use of knowledge: Interstitial work at Barnahus and how it can inform the knowledge debate in social work
Wyszynski et al. Gamble for the needy! Does identifiability enhances donation?

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22924252

Country of ref document: EP

Kind code of ref document: A1