KR102517717B1 - Apparatus and method for recommending art therapy program through reinforcement learning - Google Patents

Apparatus and method for recommending art therapy program through reinforcement learning Download PDF

Info

Publication number
KR102517717B1
KR102517717B1 KR1020220148394A KR20220148394A KR102517717B1 KR 102517717 B1 KR102517717 B1 KR 102517717B1 KR 1020220148394 A KR1020220148394 A KR 1020220148394A KR 20220148394 A KR20220148394 A KR 20220148394A KR 102517717 B1 KR102517717 B1 KR 102517717B1
Authority
KR
South Korea
Prior art keywords
data
mental health
neural network
module
therapy program
Prior art date
Application number
KR1020220148394A
Other languages
Korean (ko)
Inventor
강희재
이성희
장윤형
김희정
조영신
Original Assignee
(주)비알프레임
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)비알프레임 filed Critical (주)비알프레임
Priority to KR1020220148394A priority Critical patent/KR102517717B1/en
Application granted granted Critical
Publication of KR102517717B1 publication Critical patent/KR102517717B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/70ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Molecular Biology (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Psychiatry (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Surgery (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Psychology (AREA)
  • Social Psychology (AREA)
  • Child & Adolescent Psychology (AREA)
  • Hospice & Palliative Care (AREA)
  • Developmental Disabilities (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Fuzzy Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Signal Processing (AREA)
  • Educational Technology (AREA)

Abstract

The present invention relates to a mental health status classification device and method using a multimodal artificial neural network. The present invention relates to a method for recommending an art therapy program through reinforcement learning. The method is performed by an art therapy program recommendation module included in a device. The method comprises the steps of: receiving mental health status classification data of a test subject; inputting the mental health status classification data into an artificial neural network module included in the art therapy program recommendation module; outputting recommended art therapy program data by the artificial neural network module based on the mental health status classification data; and transmitting the output recommended art therapy program data to the test subject client.

Description

강화학습을 통해 미술치료 프로그램을 추천하기 위한 방법 및 장치{Apparatus and method for recommending art therapy program through reinforcement learning}Apparatus and method for recommending art therapy program through reinforcement learning}

본 발명은 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for classifying mental health conditions using a multimodal artificial neural network.

우울증은 인구의 17%가 경험할 정도로 정신의학에서 가장 중요한 주제 중 하나인데, 현재 정신과에서 주로 쓰이는 우울증 진단 방법은 자가진단 설문지를 이용하는 방법이다. 그러나 이 경우 환자가 느끼는 주관적인 반응에 의존할 수밖에 없어 객관성이 떨어지는 문제점이 있다. 우울감 징후를 객관화하는 것이 극히 어렵다. 환자 스스로 외부 시선을 의식하는 '바람직한 사회성' 추구에 따라 객관성이 더욱 떨어지기도 한다.Depression is one of the most important topics in psychiatry, with 17% of the population experiencing it. Currently, the main method for diagnosing depression in psychiatry is to use a self-diagnosis questionnaire. However, in this case, there is a problem in that objectivity is low because the patient has no choice but to depend on the subjective response felt by the patient. It is extremely difficult to objectify the symptoms of depression. Patients' objectivity is further reduced as they pursue 'desirable sociality' that is conscious of the external gaze.

우울증 외의 정신질환의 경우에도 현재의 방법론에는 한계가 있었다. 예를 들어, 자연재해나 교통사고와 같은 재난을 경험한 사람들은 재난 이후 수년동안 다양한 신체적, 정신적 어려움을 겪는다. 이 중 일부는 사고 이후 비교적 이른 시기에 기능을 회복하고 일상생활에 복귀하는 반면, 다른 사람은 지속적인 정신적 스트레스와 일상생활의 어려움을 호소한다. 이처럼 재난과 트라우마 이후 외상후스트레스장애(PTSD: Post-Traumatic Stress Disorder)로 진행하는 사람들을 초기에 감별하기 위해서, 다양한 측정도구 (예: 뇌파검사 등)를 이용하여 PTSD의 고 위험군을 선별하기 위한 방법들이 제안되어 왔다 (US9792823B2). 하지만 이러한 방식은 물리적인 측정도구를 이용해야하기 때문에, 대형 재난 상황을 경험한 사람들 모두에게 적용하는 데에 한계가 있으며, 정신질환 검사에 대한 피검사자들 중 고위험군을 선별하는 데에 제약이 있었다.Even in the case of mental disorders other than depression, the current methodology had limitations. For example, people who have experienced a disaster, such as a natural disaster or a traffic accident, experience various physical and mental difficulties for many years after the disaster. Some of them recover function and return to daily life relatively early after the accident, while others complain of constant mental stress and difficulties in daily life. In order to discriminate people who progress to PTSD (Post-Traumatic Stress Disorder) at an early stage after disasters and traumas, various measurement tools (e.g., EEG, etc.) are used to select high-risk groups for PTSD. Methods have been proposed (US9792823B2). However, since this method requires the use of physical measurement tools, there are limitations in applying it to all people who have experienced large-scale disaster situations, and there are limitations in selecting high-risk groups among test subjects for mental disorder tests.

미국 공개특허 US 2014-0046696 A1, Systems and Methods for Pharmacogenomic Decision Support in Psychiatry, AssureRx Health, Inc.US Patent Publication US 2014-0046696 A1, Systems and Methods for Pharmacogenomic Decision Support in Psychiatry, AssureRx Health, Inc. 미국 등록특허 US 6317731 B1, Method for predicting the therapeutic outcome of a treatment, ADVANCED BIOLOGICAL LABORATORIES S.A.US registered patent US 6317731 B1, Method for predicting the therapeutic outcome of a treatment, ADVANCED BIOLOGICAL LABORATORIES S.A. 미국 등록특허 US 9792823 B2, Multi-view learning in detection of psychological states, Raytheon BBN Technologies Corp.US registered patent US 9792823 B2, Multi-view learning in detection of psychological states, Raytheon BBN Technologies Corp.

Oh, J., Yun, K., Hwang, J. H., & Chae, J. H. (2017). classification of suicide attempts through a Machine learning algorithm Based on Multiple systemic Psychiatric scales., Frontiers in psychiatry,8, 192. Oh, J., Yun, K., Hwang, J. H., & Chae, J. H. (2017). classification of suicide attempts through a Machine learning algorithm Based on Multiple systemic Psychiatric scales., Frontiers in psychiatry,8, 192. Nuriel S. Mor, Kathryn L. Dardeck, (2018). Quantitative Forecasting of Risk for PTSD Using Ecological Factors: A Deep Learning Application, Journal of Social, Behavioral, and Health Sciences 2018, Volume 12, Issue 1, Pages 61-73. Nuriel S. Mor, Kathryn L. Dardeck, (2018). Quantitative Forecasting of Risk for PTSD Using Ecological Factors: A Deep Learning Application, Journal of Social, Behavioral, and Health Sciences 2018, Volume 12, Issue 1, Pages 61-73. IR Galatzer-Levy, S Ma, A Statnikov, R Yehuda and AY Shalev, (2017). Utilization of machine learning for prediction of post-traumatic stress: a re-examination of cortisol in the prediction and pathways to non-remitting PTSD, Transl Psychiatry (2017) 7, e1070. IR Galatzer-Levy, S Ma, A Statnikov, R Yehuda and A Y Shalev, (2017). Utilization of machine learning for prediction of post-traumatic stress: a re-examination of cortisol in the prediction and pathways to non-remitting PTSD, Transl Psychiatry (2017) 7, e1070. Barak-Corren Y, Castro VM, Javitt S, Hoffnagle AG, Dai Y, Perlis RH, et al. Predicting suicidal behavior from longitudinal electronic health records. Am JPsychiatry (2017) 174:154-62. Barak-Corren Y, Castro VM, Javitt S, Hoffnagle AG, Dai Y, Perlis RH, et al. Predicting suicidal behavior from longitudinal electronic health records. Am J Psychiatry (2017) 174:154-62. Kessler RC, Warner CH, Ivany C, Petukhova MV, Rose S, Bromet EJ, et al. Predicting suicides after psychiatric hospitalization in US Army soldiers: the army study to assess risk and resilience in servicemembers (Army STARRS). JAMA Psychiatry (2015) 72:49-57. Kessler RC, Warner CH, Ivany C, Petukhova MV, Rose S, Bromet EJ, et al. Predicting suicides after psychiatric hospitalization in US Army soldiers: the army study to assess risk and resilience in servicemembers (Army STARRS). JAMA Psychiatry (2015) 72:49-57.

따라서, 본 발명의 목적은 정신과에서 흔히 사용되는 다양한 척도들과 환자의 영상/음성/텍스트로 구성된 상담 데이터 및 웨어러블 디바이스에서 출력되는 환자의 액티비티 데이터를 입력 데이터로 이용하여 환자의 정신질환를 분류하는 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치 및 방법를 제공하는데에 있다. Accordingly, an object of the present invention is to classify a patient's mental illness by using various scales commonly used in psychiatry, counseling data consisting of a patient's video/voice/text, and patient's activity data output from a wearable device as input data. An object of the present invention is to provide an apparatus and method for classifying mental health conditions using a modal artificial neural network.

이하 본 발명의 목적을 달성하기 위한 구체적 수단에 대하여 설명한다.Hereinafter, specific means for achieving the object of the present invention will be described.

본 발명의 목적은, 정신건강 상태에 대해 진단된 피검사자인 기존의 피검사자의 상담 데이터 및 액티비티 데이터를 통해 상기 정신건강 상태에 대해 진단되지 않은 상기 피검사자인 피검사자의 상기 정신건강 상태의 분류을 수행하도록 학습된 인공신경망인 정신건강 상태 분류 인공신경망 모듈의 프로그램 코드를 저장하는 메모리 모듈; 및 상기 정신건강 상태 분류 인공신경망 모듈의 상기 프로그램 코드를 처리하는 처리 모듈;을 포함하고, 상기 정신건강 상태 분류 인공신경망 모듈의 상기 프로그램 코드는, 상기 피검사자의 상기 상담 데이터 및 상기 액티비티 데이터가 입력되는 입력 단계; 및 상기 피검사자의 상기 정신건강 상태의 분류에 대한 데이터인 정신건강 상태 분류 데이터를 추론하고 출력하는 추론 단계;를 포함하여 컴퓨터 상에서 수행되도록 구성되고, 상기 정신건강 상태는 상기 피검사자의 우울증을 포함하는 것을 특징으로 하는, 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치를 제공하여 달성될 수 있다.An object of the present invention is to learn to classify the mental health condition of the test subject, who is not diagnosed for the mental health condition, through counseling data and activity data of the existing test subject, the test subject diagnosed for the mental health condition. A memory module for storing program codes of a mental health condition classification artificial neural network module, which is an artificial neural network; and a processing module for processing the program code of the mental health state classification artificial neural network module, wherein the program code of the mental health state classification artificial neural network module is used to input the counseling data and activity data of the test subject. input step; and an inference step of inferring and outputting mental health state classification data, which is data for the classification of the mental health state of the test subject, wherein the mental health state includes depression of the test subject. Characterized in, it can be achieved by providing a mental health condition classification device using a multimodal artificial neural network.

또한, 상기 정신건강 상태에는 상기 피검사자의 우울증 및 상기 피검사자의 PTSD 예후를 포함한 복수개의 정신질환이 포함되고, 상기 정신건강 상태 분류 인공신경망 모듈은, 상기 복수개의 정신질환 각각에 대해 학습된 복수개의 인공신경망이 포함되며, 상기 추론 단계에서는, 상기 피검사자의 상기 복수개의 정신질환 각각에 대한 상기 정신건강 상태 분류 데이터를 추론하고 출력하는 것을 특징으로 할 수 있다.In addition, the mental health condition includes a plurality of mental diseases including depression of the test subject and a PTSD prognosis of the test subject, and the mental health condition classification artificial neural network module has a plurality of artificial intelligence learned for each of the plurality of mental diseases. A neural network may be included, and in the inference step, the mental health state classification data for each of the plurality of mental disorders of the test subject may be inferred and output.

본 발명의 다른 목적은, 정신건강 상태에 대해 진단된 피검사자인 기존의 피검사자의 상담 데이터 및 액티비티 데이터를 통해 상기 정신건강 상태에 대해 진단되지 않은 상기 피검사자인 피검사자의 상기 정신건강 상태의 분류을 수행하도록 학습된 인공신경망인 정신건강 상태 분류 인공신경망 모듈;을 포함하고, 상기 정신건강 상태 분류 인공신경망 모듈은, 상기 피검사자의 상기 상담 데이터 및 상기 액티비티 데이터가 입력되고, 상기 피검사자의 상기 정신건강 상태의 분류에 대한 데이터인 정신건강 상태 분류 데이터를 추론하고 출력하며, 상기 정신건강 상태는 상기 피검사자의 우울증을 포함하는 것을 특징으로 하는, 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치를 제공하여 달성될 수 있다.Another object of the present invention is to learn to classify the mental health condition of the test subject who has not been diagnosed for the mental health condition through counseling data and activity data of an existing test subject who is a test subject diagnosed for the mental health condition. and a mental health state classification artificial neural network module, which is an artificial neural network, wherein the mental health state classification artificial neural network module inputs the counseling data and the activity data of the test subject, and is used to classify the mental health state of the test subject. It can be achieved by providing a mental health state classification device using a multimodal artificial neural network, characterized in that inferring and outputting mental health state classification data, which is data for the test, and that the mental health state includes depression of the test subject. .

본 발명의 다른 목적은, 정신건강 상태에 대해 진단된 피검사자인 기존의 피검사자의 상담 데이터 및 액티비티 데이터를 통해 상기 정신건강 상태에 대해 진단되지 않은 상기 피검사자인 피검사자의 상기 정신건강 상태의 분류을 수행하도록 학습된 인공신경망인 정신건강 상태 분류 인공신경망 모듈에 상기 피검사자의 상기 상담 데이터 및 상기 액티비티 데이터가 입력되는 입력 단계; 및 상기 정신건강 상태 분류 인공신경망 모듈이 상기 피검사자의 상기 정신건강 상태의 분류에 대한 데이터인 정신건강 상태 분류 데이터를 추론하고 출력하는 추론 단계;를 포함하고, 상기 정신건강 상태는 상기 피검사자의 우울증을 포함하는 것을 특징으로 하는, 멀티모달 인공신경망을 활용한 정신건강 상태 분류 방법을 제공하여 달성될 수 있다.Another object of the present invention is to learn to classify the mental health condition of the test subject who has not been diagnosed for the mental health condition through counseling data and activity data of an existing test subject who is a test subject diagnosed for the mental health condition. an input step of inputting the counseling data and the activity data of the subject to a mental health condition classification artificial neural network module, which is an artificial neural network; and an inference step in which the mental health state classification artificial neural network module infers and outputs mental health state classification data, which is data for classification of the mental health state of the test subject, and wherein the mental health state is the depression of the test subject. It can be achieved by providing a mental health state classification method using a multimodal artificial neural network, characterized in that it comprises.

본 발명의 다른 목적은, 영상 형태 또는 음성 형태로 구성된 피검사자의 상담 데이터 및 시그널 형태로 구성된 상기 피검사자의 액티비티 데이터를 입력 데이터로 하고 상기 피검사자의 정신건강 상태 분류 데이터를 출력 데이터로 하도록 학습된 인공신경망을 포함하는 정신건강 상태 분류 모듈의 프로그램 코드를 저장하는 메모리 모듈; 및 상기 정신건강 상태 분류 모듈의 프로그램 코드를 처리하는 처리 모듈; 을 포함하고, 상기 정신건강 상태 분류 모듈의 프로그램 코드는, 상기 피검사자의 상기 상담 데이터 및 상기 액티비티 데이터가 입력되는 입력 단계; 및 상기 피검사자의 상기 정신건강 상태의 분류에 대한 데이터인 정신건강 상태 분류 데이터를 추론하고 출력하는 추론 단계;를 포함하여 컴퓨터 상에서 수행되도록 구성되고, 상기 정신건강 상태는 상기 피검사자의 우울증 여부를 포함하는 것을 특징으로 하는, 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치를 제공하여 달성될 수 있다. Another object of the present invention is an artificial neural network trained to use counseling data of a test subject in the form of a video or audio and activity data of the test subject in the form of a signal as input data and output data of the test subject's mental health state classification data. A memory module for storing the program code of the mental health condition classification module including; and a processing module processing the program code of the mental health condition classification module. Including, the program code of the mental health state classification module, the input step of inputting the counseling data and the activity data of the test subject; and an inference step of inferring and outputting mental health state classification data, which is data for classification of the mental health state of the test subject, wherein the mental health state includes whether or not the test subject is depressed. Characterized in that, it can be achieved by providing a mental health state classification device using a multimodal artificial neural network.

또한, 상기 메모리 모듈은, 멀티모달 인코더 모듈의 추론 프로그램 코드 및 학습 프로그램 코드를 더 저장하고, 상기 처리 모듈은 상기 멀티모달 인코더 모듈의 추론 프로그램 코드 및 학습 프로그램 코드를 더 처리하며, 상기 멀티모달 인코더 모듈의 추론 프로그램 코드는, 상기 피검사자의 상기 상담 데이터 및 상기 액티비티 데이터가 입력되는 입력 단계; 및 멀티모달 인코딩 벡터가 출력되는 추론 단계;를 포함하여 컴퓨터 상에서 수행되도록 구성되고, 상기 멀티모달 인코더 모듈의 학습 프로그램 코드는, 상기 멀티모달 인코더 모듈이 동일한 구조를 갖는 학습 타겟 모델과 정답 모델을 포함하도록 구성하는 모델 구성 단계; 상기 상담 데이터 및 상기 액티비티 데이터의 각각의 특정 시간 구간(time section step)에 대해 무작위 조합(random concatenate)로 구성된 조합 데이터를 입력 데이터로 구성하고, 상기 상담 데이터 및 상기 액티비티 데이터 중 하나를 무작위로 샘플링하여 마스킹(masking)하여 마스킹 된 조합 데이터를 생성하는 마스킹 단계; 상기 마스킹 된 조합 데이터를 상기 학습 타겟 모델의 입력 데이터로 입력하고, 마스킹 되지 않은 원본인 상기 조합 데이터를 상기 정답 모델의 입력 데이터로 입력하는 입력 데이터 입력 단계; 상기 학습 타겟 모델의 출력 데이터인 학습 타겟 멀티모달 인코딩 벡터 및 상기 정답 모델의 출력 데이터인 정답 멀티모달 인코딩 벡터를 획득하는 출력 데이터 출력 단계; 및 상기 학습 타겟 멀티모달 인코딩 벡터와 상기 정답 멀티모달 인코딩 벡터와의 차이를 기초로 하는 손실함수의 손실값을 최소화하는 방향으로 상기 학습 타겟 모델의 파라미터를 업데이트하고, 상기 학습 타겟 모델의 파라미터에 EMA(exponetially moving average)를 적용하여 상기 정답 모델의 파라미터를 업데이트하는 파라미터 업데이트 단계; 를 포함하여 컴퓨터 상에서 수행되도록 구성되고, 상기 정신건강 상태 분류 모듈의 프로그램 코드의 상기 입력 단계에서는, 상기 멀티모달 인코딩 벡터가 상기 정신건강 상태 분류 모듈의 입력 데이터로 입력되는, 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치를 제공하여 달성될 수 있다. In addition, the memory module further stores inference program codes and learning program codes of the multimodal encoder module, and the processing module further processes the inference program codes and learning program codes of the multimodal encoder module, and the multimodal encoder The reasoning program code of the module may include an input step of inputting the counseling data and the activity data of the test subject; and an inference step of outputting the multimodal encoding vector, wherein the learning program code of the multimodal encoder module includes a learning target model and an answer model having the same structure as the multimodal encoder module. A model construction step configured to do so; For each specific time section (time section step) of the consultation data and the activity data, combination data composed of a random concatenate is configured as input data, and one of the consultation data and the activity data is randomly sampled. a masking step of generating masked combination data by masking the masked data; an input data input step of inputting the masked combination data as input data of the learning target model and inputting the unmasked original combination data as input data of the correct answer model; an output data output step of obtaining a learning target multimodal encoding vector that is output data of the learning target model and a correct answer multimodal encoding vector that is output data of the correct answer model; and updating parameters of the learning target model in a direction of minimizing a loss value of a loss function based on a difference between the learning target multimodal encoding vector and the correct answer multimodal encoding vector, and adding EMA to the parameters of the learning target model. a parameter update step of updating parameters of the correct answer model by applying an exponentially moving average; Utilizing a multimodal artificial neural network configured to be executed on a computer, including, in the input step of the program code of the mental health condition classification module, the multimodal encoding vector is input as input data of the mental health condition classification module. This can be achieved by providing a mental health condition classification device.

또한, 상기 메모리 모듈은, 신경망 처리 모듈의 프로그램 코드를 더 저장하고, 상기 처리 모듈은 상기 신경망 처리 모듈의 프로그램 코드를 더 처리하며, 상기 신경망 처리 모듈의 프로그램 코드는, 상기 정신건강 상태 분류 모듈에 포함된 상기 인공신경망의 학습 세션을 처리하여 파라미터를 업데이트 하는 파라미터 업데이트 단계; 업데이트 된 상기 파라미터를 메인 신경망 서버의 일구성인 연합 학습 모듈에 업로드 하는 업로드 단계; 및 상기 메인 신경망 서버의 일구성인 메인 신경망 모듈에서 복수의 검사자 클라이언트에 의해 연합 학습된 메인 신경망을 다운로드 받아 상기 정신건강 상태 분류 모듈에 포함된 상기 인공신경망의 적어도 일부를 대체하는 다운로드 단계; 를 포함하여 컴퓨터 상에서 수행되도록 구성되고, 상기 메인 신경망 서버는, 상기 파라미터와 다른 검사자 클라이언트에서 업로드 된 다른 파라미터를 통합하여 상기 정신건강 상태 분류 모듈에 포함된 인공신경망을 업데이트 하도록 구성되는, 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치를 제공하여 달성될 수 있다. In addition, the memory module further stores the program code of the neural network processing module, the processing module further processes the program code of the neural network processing module, and the program code of the neural network processing module is stored in the mental health condition classification module. a parameter updating step of updating parameters by processing the included learning session of the artificial neural network; an uploading step of uploading the updated parameters to a federated learning module that is a component of a main neural network server; and a download step of downloading a main neural network jointly learned by a plurality of examiner clients from a main neural network module, which is a component of the main neural network server, and replacing at least a part of the artificial neural network included in the mental health condition classification module. Is configured to be performed on a computer, wherein the main neural network server is configured to update the artificial neural network included in the mental health condition classification module by integrating the parameters and other parameters uploaded from other examiner clients. This can be achieved by providing a mental health condition classification device using a neural network.

상기한 바와 같이, 본 발명에 의하면 이하와 같은 효과가 있다.As described above, the present invention has the following effects.

첫째, 본 발명의 일실시예에 따르면, 우울증 등의 정신질환을 실시간으로 분류해냄으로써, 정신적 위기 상황에 적절히 대처가능한 효과가 발생된다. First, according to one embodiment of the present invention, by classifying mental disorders such as depression in real time, an effect capable of appropriately coping with a mental crisis situation is generated.

둘째, 본 발명의 일실시예에 따르면, 정신과 외래진료실 등을 방문한 환자를 대상으로, 비교적 적은 리소스로 PTSD나 우울증, 자살 위험도와 같은 정신질환을 판별할 수 있는 효과가 발생된다.Second, according to one embodiment of the present invention, for patients who have visited a psychiatric outpatient clinic, etc., an effect that can discriminate mental disorders such as PTSD, depression, and suicide risk with relatively few resources occurs.

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.
도 1은 본 발명의 일실시예에 따른 환자의 영상/음성/텍스트 데이터 및 웨어러블 디바이스에서 출력되는 환자의 액티비티 데이터를 이용하여 환자의 정신질환를 분류하는 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)를 도시한 모식도,
도 2는 본 발명의 일실시예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)의 구성을 도시한 모식도,
도 3은 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 학습 세션을 도시한 모식도,
도 4는 다층 신경망 모델(딥러닝 또는 심층 신경망 모델)의 구조를 도시한 모식도,
도 5는 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 노드에서의 계산 과정을 도시한 모식도,
도 6은 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 Drop-out 방식을 도시한 모식도,
도 7은 ReLU 활성함수를 도시한 그래프,
도 8는 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 신경망 전이 학습을 도시한 모식도,
도 9는 본 발명의 다른 실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 강화학습을 도시한 모식도,
도 10은 본 발명의 일실시예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 방법을 도시한 흐름도,
도 11은 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치의 작동관계를 도시한 모식도,
도 12는 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치와 메인 신경망 서버의 각 단계에 따른 작동관계를 도시한 모식도,
도 13은 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치의 구성관계를 도시한 모식도,
도 14는 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치의 구체적인 작동관계를 도시한 모식도,
도 15는 본 발명의 변형예에 따른 멀티모달 인코더 모듈을 도시한 모식도,
도 16은 본 발명의 변형예에 따른 멀티모달 인코더 모듈의 학습 세션을 도시한 모식도,
도 17은 본 발명의 변형예에 따른 정신건강 상태 분류 모듈을 도시한 모식도,
도 18은 본 발명의 일실시예에 따른 정신건강 상태 분류 모듈의 학습 세션을 도시한 모식도,
도 19는 본 발명의 변형예에 따른 미술치료 프로그램 추천 모듈을 도시한 모식도,
도 20은 본 발명의 변형예에 따른 미술치료 프로그램 추천 모듈의 강화학습을 도시한 모식도이다.
The following drawings attached to this specification illustrate preferred embodiments of the present invention, and together with the detailed description of the invention serve to further understand the technical idea of the present invention, the present invention is limited only to those described in the drawings. and should not be interpreted.
1 is a mental health state classification device using a multimodal artificial neural network that classifies a patient's mental illness using a patient's video/voice/text data and patient activity data output from a wearable device according to an embodiment of the present invention. A schematic diagram showing (1),
2 is a schematic diagram showing the configuration of an apparatus 1 for classifying mental health conditions using a multimodal artificial neural network according to an embodiment of the present invention;
3 is a schematic diagram showing a learning session of the artificial neural network module 12 for classifying mental health conditions according to an embodiment of the present invention;
4 is a schematic diagram showing the structure of a multilayer neural network model (deep learning or deep neural network model);
5 is a schematic diagram showing a calculation process at a node of the artificial neural network module 12 for classifying mental health conditions according to an embodiment of the present invention;
6 is a schematic diagram showing a drop-out method of the artificial neural network module 12 for classifying mental health conditions according to an embodiment of the present invention;
7 is a graph showing a ReLU activation function;
8 is a schematic diagram showing neural network transfer learning of the artificial neural network module 12 for classifying mental health conditions according to an embodiment of the present invention;
9 is a schematic diagram showing reinforcement learning of the artificial neural network module 12 for classifying mental health conditions according to another embodiment of the present invention;
10 is a flowchart illustrating a mental health state classification method using a multimodal artificial neural network according to an embodiment of the present invention;
11 is a schematic diagram showing the operational relationship of a mental health state classification device using a multimodal artificial neural network according to a modified example of the present invention;
12 is a schematic diagram showing the operational relationship according to each step of a mental health condition classification apparatus using a multimodal artificial neural network according to a modified example of the present invention and a main neural network server;
13 is a schematic diagram showing the configuration of an apparatus for classifying mental health conditions using a multimodal artificial neural network according to a modified example of the present invention;
14 is a schematic diagram showing the specific operating relationship of a mental health state classification device using a multimodal artificial neural network according to a modified example of the present invention;
15 is a schematic diagram showing a multimodal encoder module according to a modified example of the present invention;
16 is a schematic diagram showing a learning session of a multimodal encoder module according to a modified example of the present invention;
17 is a schematic diagram showing a mental health condition classification module according to a modified example of the present invention;
18 is a schematic diagram showing a learning session of a mental health condition classification module according to an embodiment of the present invention;
19 is a schematic diagram showing an art therapy program recommendation module according to a modified example of the present invention;
20 is a schematic diagram illustrating reinforcement learning of an art therapy program recommendation module according to a modified example of the present invention.

이하 첨부된 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명을 쉽게 실시할 수 있는 실시예를 상세히 설명한다. 다만, 본 발명의 바람직한 실시예에 대한 동작원리를 상세하게 설명함에 있어서 관련된 공지기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.Hereinafter, an embodiment in which a person skilled in the art can easily practice the present invention will be described in detail with reference to the accompanying drawings. However, in the detailed description of the operating principle of the preferred embodiment of the present invention, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description will be omitted.

또한, 도면 전체에 걸쳐 유사한 기능 및 작용을 하는 부분에 대해서는 동일한 도면 호를 사용한다. 명세서 전체에서, 특정 부분이 다른 부분과 연결되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐만 아니라, 그 중간에 다른 소자를 사이에 두고, 간접적으로 연결되어 있는 경우도 포함한다. 또한, 특정 구성요소를 포함한다는 것은 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다.In addition, the same reference numerals are used for parts having similar functions and actions throughout the drawings. Throughout the specification, when a specific part is said to be connected to another part, this includes not only the case where it is directly connected but also the case where it is indirectly connected with another element interposed therebetween. In addition, including a specific component does not exclude other components unless otherwise stated, but means that other components may be further included.

멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치Mental health condition classification device using multimodal artificial neural network

도 1은 본 발명의 일실시예에 따른 환자의 영상/음성/텍스트로 구성된 상담 데이터 및 웨어러블 디바이스에서 출력되는 환자의 액티비티 데이터를 이용하여 환자의 정신질환를 분류하는 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)를 도시한 모식도이다. 도 1에 도시된 바와 같이, 학습(Training) 세션의 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)에는 정신건강 상태에 대해 진단된 피검사자인 기존의 피검사자의 상담 데이터(a, 환자의 영상/음성/텍스트로 구성된 정신과 상담 세션 데이터), 액티비티 데이터(b, 환자에게 주어진 웨어러블 디바이스에서 입력되는 활동/수면/스트레스 데이터를 포함하는 센서 데이터), 설문 문항 데이터(c, Ground Truth)가 입력되어 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)가 학습되고, 추론(Inference) 세션의 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)에는 정신건강 상태에 대해 진단되지 않은 환자인 피검사자의 상담 데이터(a), 액티비티 데이터(b)가 입력되어 우울증(Depressive disorder) 분류 데이터(A), PTSD(posttraumatic stress disorder) 예후 분류 데이터(B), 자살시도 가능성 분류 데이터, 불안장애(Anxiety disorder) 분류 데이터 등의 정신건강 상태 분류 데이터가 출력된다. 이하에서는 설명의 편의를 위하여 정신건강 상태 분류 데이터 중 우울증 분류 데이터(A), PTSD 예후 분류 데이터(B)를 기초로 발명의 내용을 설명하고, 본 발명의 범위는 이에 한정되지 않을 수 있다. 1 shows mental health using a multimodal artificial neural network that classifies a patient's mental illness using consultation data composed of a patient's video/voice/text and activity data output from a wearable device according to an embodiment of the present invention. It is a schematic diagram showing the state classification device 1. As shown in FIG. 1, the mental health condition classification apparatus 1 using the multimodal artificial neural network of the training session includes counseling data of an existing test subject who has been diagnosed for a mental health condition (a, patient's Psychiatric counseling session data composed of video/voice/text), activity data (b, sensor data including activity/sleep/stress data input from a wearable device given to the patient), and survey item data (c, Ground Truth) are input The mental health condition classification device (1) using a multimodal artificial neural network is learned, and the mental health condition classification device (1) using a multimodal artificial neural network in an inference session is used for mental health conditions that have not been diagnosed. Depressive disorder classification data (A), PTSD (posttraumatic stress disorder) prognosis classification data (B), suicide attempt possibility classification data, anxiety disorder (Anxiety disorder) classification data such as mental health status classification data is output. Hereinafter, for convenience of description, the content of the present invention will be described based on depression classification data (A) and PTSD prognosis classification data (B) among mental health status classification data, and the scope of the present invention may not be limited thereto.

본 발명의 일실시예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)는 특정 웹서버, 클라우드 서버와 같은 가상 서버, 스마트폰, 태블릿 PC, 데스크탑 PC 등의 컴퓨팅 장치의 처리모듈에 의해 처리되고, 각 장치의 메모리 모듈에 저장되도록 구성될 수 있다. An apparatus for classifying mental health conditions using a multimodal artificial neural network according to an embodiment of the present invention (1) is a processing module of a computing device such as a specific web server, a virtual server such as a cloud server, a smartphone, a tablet PC, and a desktop PC. It may be processed by, and configured to be stored in a memory module of each device.

상담 데이터(a)는 디지털 기기를 통해 영상, 음성, 텍스트 등의 형태로 입력되는 피검사자의 상담 세션에 대한 데이터를 의미한다. 상담 데이터(a)는 피검사자의 스마트폰, 태블릿, PC 등에서 입력되거나 담당 의사의 스마트폰, 태블릿, PC 등에서 입력될 수 있다.Counseling data (a) refers to data about a counseling session of a test subject that is input in the form of video, audio, or text through a digital device. Counseling data (a) may be input from a smartphone, tablet, or PC of the examinee or from a smartphone, tablet, or PC of the doctor in charge.

액티비티 데이터(b)는 피검사자에게 제공되는 웨어러블 디바이스의 센서 데이터에 의해 출력되는 수면, 호흡, 스트레스 등에 대한 액티비티 시그널 데이터를 의미한다. 액티비티 데이터(b)는 피검사자의 웨어러블 디바이스와 연결된 스마트폰, 태블릿, PC 등에서 입력되거나 담당 의사의 스마트폰, 태블릿, PC 등에서 입력될 수 있다.Activity data (b) refers to activity signal data about sleep, respiration, stress, etc. output by sensor data of a wearable device provided to the test subject. The activity data (b) may be input from a smart phone, tablet, PC, etc. connected to the wearable device of the examinee, or may be input from the smart phone, tablet, PC, etc. of the doctor in charge.

설문 문항 데이터(c)는 우울증(Depressive disorder)에 대한 설문인 우울증 설문, 자살시도에 대한 설문인 자살시도 설문, PTSD(posttraumatic stress disorder)에 대한 설문인 PTSD 설문 등의 정신과 진단에 대한 text 데이터를 의미한다. 본 발명의 일실시예에 따른 자살시도 설문은 "① 일생동안 자살을 시도한 적이 있었는가?, ② 최근 1년 이내에 자살을 시도한 적이 있었는가?, ③ 최근 1개월 이내에 자살을 시도한 적이 있었는가?"로 구성될 수 있고, 각각의 설문은 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)의 학습 세션에서 출력값에 대한 ground truth로 사용될 수 있다. 설문 문항 데이터(c)은 피검사자의 스마트폰, 태블릿, PC 등에서 입력되거나 담당 의사의 스마트폰, 태블릿, PC 등에서 입력될 수 있다.Questionnaire data (c) includes text data on psychiatric diagnoses such as the Depression Questionnaire, which is a questionnaire on depression (Depressive Disorder), the Suicide Attempt Questionnaire, which is a questionnaire on suicide attempts, and the PTSD Questionnaire, which is a questionnaire on PTSD (posttraumatic stress disorder). it means. The suicide attempt questionnaire according to an embodiment of the present invention is "Have you ever attempted suicide during your lifetime?, ② Have you ever attempted suicide within the last year?, ③ Have you ever attempted suicide within the last month?" , and each questionnaire can be used as the ground truth for the output value in the learning session of the mental health state classification device 1 using a multimodal artificial neural network. Questionnaire data (c) may be input from a smartphone, tablet, or PC of the examinee or from a smartphone, tablet, or PC of a doctor in charge.

우울증 분류 데이터(A)는 학습 세션에서 우울증 설문에 대한 설문 문항 데이터(c)에 기반한 실제 우울증 여부를 Ground Truth로 하여 기학습된 정신건강 상태 분류 인공신경망 모듈(12)의 추론 세션에서 분류되는 해당 피검사자의 우울증 가능성을 의미한다. Depression classification data (A) is based on the actual depression as Ground Truth based on the questionnaire data (c) of the depression questionnaire in the learning session. It means the possibility of depression of the test subject.

*PTSD 예후 분류 데이터(B)는 학습 세션에서 PTSD 설문에 대한 설문 문항 데이터(c)에 기반한 실제 PSTD 예후를 Ground Truth로 하여 기학습된 정신건강 상태 분류 인공신경망 모듈(12)의 추론 세션에서 분류되는 해당 피검사자의 PTSD 예후 가능성을 의미한다. * PTSD prognosis classification data (B) is based on the actual PSTD prognosis based on the PTSD questionnaire survey item data (c) in the learning session as Ground Truth, and is classified in the inference session of the artificial neural network module (12). It means the possibility of prognosis of PTSD of the test subject to be tested.

본 발명의 일실시예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)는 Supervised Learning의 형태로 구성이 가능하고, 선형/로지스틱 회귀분석(Regression), 서포트 벡터 머신(Support Vector Machine), 다층 퍼셉트론(Multi-layer perceptron), 나이브 베이지안 분류(Naive-Bayesian Classification), 랜덤 포레스트 분류(Random Forest Classification), 인공신경망(Neural Network) 등의 다양한 머신러닝 알고리즘으로 구성이 가능하다. 설명의 편의를 위하여 이하에서는 본 발명의 일실시예에 따라 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)를 인공신경망으로 구성한 예시로 설명한다. The mental health state classification apparatus 1 using a multimodal artificial neural network according to an embodiment of the present invention can be configured in the form of supervised learning, linear / logistic regression analysis (Regression), support vector machine (Support Vector Machine) ), multi-layer perceptron, Naive-Bayesian Classification, Random Forest Classification, and Neural Network. For convenience of description, the mental health state classification apparatus 1 using the multimodal artificial neural network according to an embodiment of the present invention will be described as an example configured with the artificial neural network.

도 2는 본 발명의 일실시예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)의 구성을 도시한 모식도이다. 도 2에 도시된 바와 같이, 본 발명의 일실시예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)는 상담 데이터 인코더(10), 액티비티 데이터 인코더(11), 정신건강 상태 분류 인공신경망 모듈(12)을 포함할 수 있다. 2 is a schematic diagram showing the configuration of an apparatus 1 for classifying mental health conditions using a multimodal artificial neural network according to an embodiment of the present invention. As shown in FIG. 2, the mental health state classification apparatus 1 using the multimodal artificial neural network according to an embodiment of the present invention includes a consultation data encoder 10, an activity data encoder 11, and mental health state classification. An artificial neural network module 12 may be included.

상담 데이터 인코더(10)는 기존의 피검사자의 상담 데이터(a), 액티비티 데이터(b)를 입력 데이터로 하여 학습되고, 피검사자의 상담 데이터(a)를 기초로 상담 인코딩 벡터를 추론하는 인공신경망 모듈을 의미한다.The counseling data encoder 10 is learned using existing counseling data (a) and activity data (b) of the test subject as input data, and an artificial neural network module that infers a counseling encoding vector based on the counseling data (a) of the test subject. it means.

액티비티 데이터 인코더(11)는 기존의 피검사자의 상담 데이터(a), 액티비티 데이터(b)를 입력 데이터로 하여 학습되고, 피검사자의 액티비티 데이터(b)을 기초로 액티비티 인코딩 벡터를 추론하는 인공신경망 모듈을 의미한다.The activity data encoder 11 is trained using existing counseling data (a) and activity data (b) of the test subject as input data, and an artificial neural network module that infers an activity encoding vector based on the activity data (b) of the test subject. it means.

정신건강 상태 분류 인공신경망 모듈(12)은, 상담 인코딩 벡터 및 액티비티 인코딩 벡터를 조합한 조합 벡터를 입력 데이터로 하고, 우울증 분류 데이터(A), PTSD 예후 분류 데이터(B)와 같은 정신건강 상태 분류 데이터를 출력 데이터로 하는 인공신경망 모듈을 의미한다. 상기 정신건강 상태 분류 인공신경망 모듈(12)은, 설문 문항 데이터(c)를 ground truth로 하여 학습될 수 있다. The mental health condition classification artificial neural network module 12 takes a combination vector obtained by combining a counseling encoding vector and an activity encoding vector as input data, and classifies mental health conditions such as depression classification data (A) and PTSD prognosis classification data (B). It refers to an artificial neural network module that uses data as output data. The mental health state classification artificial neural network module 12 may be trained using the questionnaire item data (c) as the ground truth.

상담 데이터 인코더(10), 액티비티 데이터 인코더(11), 정신건강 상태 분류 인공신경망 모듈(12)의 신경망 모델(Neural Network model)은 생물학에서의 뉴런 구조로부터 착안된 지도 학습(supervised learning) 알고리즘이다. 신경망 모델의 기본적인 작동 원리는 여러 개의 뉴런들을 상호 연결하여 입력값에 대한 최적의 출력값을 분류하는 것이다. 통계적인 관점에서 보면 신경망 모델은 입력 변수의 선형 결합에 비선형 함수를 취하는 사영추적회귀로 볼 수 있다. 이하에서는 설명의 편의를 위해 정신건강 상태 분류 인공신경망 모듈(12)을 위주로 설명한다.The neural network model of the counseling data encoder 10, activity data encoder 11, and mental health condition classification artificial neural network module 12 is a supervised learning algorithm derived from the structure of neurons in biology. The basic operating principle of a neural network model is to classify an optimal output value for an input value by interconnecting several neurons. From a statistical point of view, a neural network model can be viewed as a projective tracking regression that takes a non-linear function over a linear combination of input variables. Hereinafter, for convenience of description, the mental health condition classification artificial neural network module 12 will be mainly described.

도 3은 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 학습 세션을 도시한 모식도이다. 도 3에 도시된 바와 같이, 기존의 피검사자의 상담 인코딩 벡터, 액티비티 인코딩 벡터 및 히스토리 벡터(현재 time step 이전의 상담에 대한 상담 인코딩 벡터의 조합인 상담 히스토리 벡터와 현재 time step 이전의 액티비티에 대한 액티비티 인코딩 벡터의 조합인 액티비티 히스토리 벡터가 concatenate 된 벡터를 의미)가 입력 데이터로서 x1, x2, x3와 같은 입력층(input layer)의 각 노드에 입력되고, w1과 같은 weight을 기반으로 h1, h2, h3와 같은 은닉층(hidden layer)의 컴퓨팅 이후에 softmax나 ReLU와 같은 activation function을 기반으로 분류되는 우울증 분류 데이터(A)가 y1인 출력층(output layer)에서 출력되게 된다. 출력된 우울증 분류 데이터(A)와 실제 우울증에 대한 설문 문항 데이터(c)에 의해 판정된 실제 우울증 여부(Ground Truth)와의 에러(error, -Sigma(yi log pi))를 줄이는 방향으로 은닉층의 weight를 업데이트 시키도록 Back propagation 될 수 있다. 3 is a schematic diagram showing a learning session of the artificial neural network module 12 for classifying mental health conditions according to an embodiment of the present invention. As shown in FIG. 3, the counseling encoding vector of the existing test subject, the activity encoding vector, and the history vector (a counseling history vector that is a combination of counseling encoding vectors for counseling before the current time step and activities for activities before the current time step) The activity history vector, which is a combination of encoding vectors, is a concatenated vector) is input to each node of the input layer such as x1, x2, and x3 as input data, and based on weights such as w1, h1, h2, Depression classification data (A) classified based on an activation function such as softmax or ReLU after computing a hidden layer such as h3 is output from the output layer of y1. Hidden layer in the direction of reducing the error (error, -Sigma(y i log pi )) between the actual depression (Ground Truth) determined by the output depression classification data (A) and the actual depression questionnaire data (c) Back propagation can be performed to update the weight of

본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 구체적인 구조와 관련하여, 도 4는 다층 신경망 모델(딥러닝 또는 심층 신경망 모델)의 구조를 도시한 모식도이다. 도 4에 도시된 바와 같이 본 발명의 일실시예에 따른 상담 데이터 인코더(10), 액티비티 데이터 인코더(11), 정신건강 상태 분류 인공신경망 모듈(12)의 다층 신경망 모델은 입력층(input layer), 은닉층(hidden layer), 출력층(output layer)으로 구성된다. 입력층은 각 입력변수에 대응되는 노드로 구성되며, 노드의 수는 입력변수의 개수와 같다. 은닉층은 입력층으로부터 전달되는 변수값들의 선형 결합을 시그모이드 함수와 같은 비선형 함수로 처리하여 출력층 또는 다른 은닉층에 전달하는 역할을 한다(최근에는 Back propagation에서 chain rule을 적용하면서 error가 앞단의 layer에서 희석되는 vanishing gradient 문제가 발생되어 시그모이드 함수 대신, ReLU 등을 일반적으로 이용한다). 출력층은 출력 변수에 대응되는 노드로서 분류 모형에서는 클래스의 수만큼 출력 노드가 생성된다. Regarding the specific structure of the mental health condition classification artificial neural network module 12 according to an embodiment of the present invention, FIG. 4 is a schematic diagram showing the structure of a multi-layer neural network model (deep learning or deep neural network model). As shown in FIG. 4, the multilayer neural network model of the counseling data encoder 10, activity data encoder 11, and mental health condition classification artificial neural network module 12 according to an embodiment of the present invention is an input layer , a hidden layer, and an output layer. The input layer is composed of nodes corresponding to each input variable, and the number of nodes is equal to the number of input variables. The hidden layer serves to process the linear combination of variable values transmitted from the input layer with a non-linear function such as the sigmoid function and pass it to the output layer or other hidden layer (recently, by applying the chain rule in Back propagation, the error is Since the problem of vanishing gradient is generated in , ReLU is generally used instead of the sigmoid function). The output layer is a node corresponding to an output variable, and output nodes are generated as many as the number of classes in the classification model.

도 5는 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 노드에서의 계산 과정을 도시한 모식도이다. 도 5에 도시된 바와 같이, 각각의 노드에서는 실제로 연산이 일어나는데, 이 연산 과정은 인간의 신경망을 구성하는 뉴런에서 일어나는 과정을 모사하도록 수학적으로 설계되어있다. 노드는 일정 크기 이상의 자극을 받으면 반응을 하는데, 그 반응의 크기는 바이어스(bias) 값을 제외하고 입력 값과 노드의 계수(또는 가중치, weights)를 곱한 값과 대략 비례한다. 일반적으로 노드는 여러 개의 입력을 받으며 입력의 개수만큼 계수를 가지고 있다. 따라서 이 계수를 조절함으로써 여러 입력에 다른 가중치를 부여할 수 있다. 최종적으로 곱한 값들은 전부 더해지고 그 합은 활성 함수(activation function)의 입력으로 들어가게 된다. 활성 함수의 결과가 노드의 출력에 해당하며 이 출력값이 궁극적으로 분류나 회귀 분석에 쓰이게 된다. 신경망 모델의 각 층은 적어도 하나의 노드로 이루어져 있으며 입력값에 따라 각 노드의 활성화/비활성화 여부가 결정된다. 입력 데이터는 첫 번째 층(입력층, input layer)의 입력이 되며 그 이후엔 각 층의 출력이 다시 다음 층의 입력이 된다. 모든 계수는 학습 과정에서 계속 조금씩 변하는데, 결과적으로 각 노드가 어떤 입력을 중요하게 여기는지를 반영한다. 그리고 신경망 모델의 '학습(training)'은 이 계수를 업데이트하는 과정이다.5 is a schematic diagram showing a calculation process in a node of the artificial neural network module 12 for classifying mental health conditions according to an embodiment of the present invention. As shown in FIG. 5 , calculation actually occurs at each node, and this calculation process is mathematically designed to simulate a process occurring in neurons constituting a human neural network. A node responds when it receives a stimulus of a certain size or more, and the size of the response is approximately proportional to the value obtained by multiplying the input value and the node's coefficient (or weights), excluding the bias value. In general, a node receives multiple inputs and has as many coefficients as the number of inputs. Therefore, by adjusting this coefficient, different weights can be given to different inputs. Finally, the multiplied values are all added up, and the sum goes into the input of the activation function. The result of the activation function corresponds to the output of the node, and this output value is ultimately used for classification or regression analysis. Each layer of the neural network model is composed of at least one node, and activation/deactivation of each node is determined according to an input value. The input data becomes the input of the first layer (input layer), and then the output of each layer becomes the input of the next layer. All the coefficients keep changing slightly during the learning process, which in turn reflects which inputs each node considers important. And 'training' of the neural network model is the process of updating these coefficients.

다층 신경망 모델, 즉 딥러닝에서 가장 문제되는 것은 과적합(overfitting) 문제이다. 과적합(Overfitting)은 주어진 데이터의 양에 비해 모델의 복잡도(complexity)가 높으면 발생하게 된다. 안타깝게도 신경망(neural network)이 깊어질수록 모델의 복잡도는 exponential하게 증가하게 된다. 그렇기 때문에 거의 무한한 표현형을 학습할 수 있는 deep network가 좋다는 것을 다들 알고 있음에도 불구하고, 너무나 과적합(overfitting)이 심하게 발생하기 때문에 Marvin Minsky 교수의 1969년 Perceptrons 이론에 의해 neural network 연구가 멈추게 된 것이다. 하지만, 2007~2008년 즈음하여 과적합을 막기 위한 새로운 initialization 방법인 RBM(Restricted Boltzmann Machine)과 CNN(Convolutional Neural Network)이 제안되면서, 다시 딥러닝 연구가 활발하게 진행되었다. The most problematic problem in multilayer neural network models, that is, deep learning, is overfitting. Overfitting occurs when the complexity of the model is high compared to the amount of data given. Unfortunately, the complexity of the model increases exponentially as the neural network gets deeper. Therefore, although everyone knows that a deep network that can learn almost infinite phenotypes is good, overfitting occurs so severely that neural network research was stopped by Professor Marvin Minsky's 1969 Perceptrons theory. However, around 2007~2008, new initialization methods to prevent overfitting, such as RBM (Restricted Boltzmann Machine) and CNN (Convolutional Neural Network), were proposed, and deep learning research was actively conducted again.

특히, RBM은 DBN(Deep Belief Network)을 구성하는 요소로 이용되고, unsupervised RBM(restricted Boltzmann machine)을 통해 학습시킬 feedforward neural network의 각 층을 효과적으로 사전훈련(pre-training)하여 과적합(overfitting)을 방지할 수 있는 수준의 initialize point를 잡았고, 이를 다시 supervised back propagation를 사용하는 형태로 학습을 진행한다.In particular, RBM is used as a component of DBN (Deep Belief Network), and overfitting by effectively pre-training each layer of the feedforward neural network to be trained through an unsupervised RBM (restricted Boltzmann machine) We set an initialize point at a level that can prevent this, and proceed with learning in the form of using supervised back propagation again.

하지만, NIPS 2006에 발표된 Bengio 교수 연구팀의 Greedy layer-wise training of deep networks 연구와 NIPS 2007에 발표된 Hinton 교수 연구팀의 A fast learning algorithm for deep belief nets 두 논문을 통해 제안되었던 RBM과 DBN 같은 unsupervised pretraining method들은 최근 실무에서 사용되지는 않는다. 지금은 데이터가 충분히 많을 경우 이런 방식으로 weight를 initialization하는 것보다 random initialization의 성능이 훨씬 우수하다는 것이 알려져 있기 때문이다. Random initialization의 일환으로 Drop-out이라는 개념이 소개되었고, 최근에는 대부분이 Drop-out 방식을 이용하고 있다. However, unsupervised pretraining such as RBM and DBN, which was proposed in two papers, the Greedy layer-wise training of deep networks by Professor Bengio's research team published in NIPS 2006 and A fast learning algorithm for deep belief nets by Professor Hinton's research team published in NIPS 2007 methods are not used in current practice. This is because it is now known that random initialization performs much better than initializing the weights in this way when there is enough data. As part of random initialization, the concept of drop-out was introduced, and most of them use the drop-out method recently.

도 6은 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 Drop-out 방식을 도시한 모식도이다. 도 6에 도시된 바와 같이, 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 Drop-out 방식은 매 학습시 은닉층에서 모든 neuron을 사용하는 것이 아니라 50% 정도의 neuron을 사용한다. 하나의 딥러닝에서 여러 개의 작은 neural network이 앙상블(ensemble)되어진 효과가 있고, 앙상블은 과적합이 크게 줄어든다고 알려져 있다. 또한, 비슷한 weight를 갖는 뉴런들이 줄어들게 되어서 중복된 판단을 하는 뉴런들이 줄어들게 되어 뉴런을 효율적으로 사용가능한 장점이 있다.6 is a schematic diagram showing a drop-out method of the artificial neural network module 12 for classifying mental health conditions according to an embodiment of the present invention. As shown in FIG. 6, the drop-out method of the mental health condition classification artificial neural network module 12 according to an embodiment of the present invention uses about 50% of neurons in the hidden layer instead of using all neurons in each learning. use. It is known that there is an effect of ensemble of several small neural networks in one deep learning, and the ensemble greatly reduces overfitting. In addition, neurons with similar weights are reduced, so neurons making redundant judgments are reduced, which has the advantage of being able to use neurons efficiently.

또한, 최근에는 ReLU(Rectified Linear Unit) 등의 신규 활성함수(activation function)로 느린 학습시간과 과적합 문제 등을 해결하고 있다. 도 7은 ReLU 활성함수를 도시한 그래프이다. 도 7에 도시된 바와 같이, 기존의 sigmoid 함수는 기울기 하강(Gradient Descent)를 여러 층으로 해나갈 때마다 error가 소멸되는 문제가 발생한다. 여러 층을 지나 극한으로 갈수록 sigmoid 함수는 Gradient(기울기)가 작아져서 weight가 업데이트되지 않는 문제가 발생하는 것이다. 그런데 활성함수로 ReLU 함수를 사용시, 기울기가 0 또는 1로 학습되는 경우에 100%로 error가 전파되어 이러한 문제가 해소되게 된다. ReLU 함수는 sigmoid 처럼 [0,1]로 제한되는 것이 아니고 그 범위가 무제한이기 때문에 좀 더 확실한 표현력을 가진다고 볼 수 있다. 또한, 각 노드의 출력값 중 필요 없는 값들이 많다. 이럴 때, sigmoid 함수 사용시 모든 값에 대한 계산을 해야하는데, ReLU 함수는 상당 부분의 연산량을 줄일 수 있어 컴퓨팅 속도가 개선되는 효과가 발생된다. ReLU 함수에 의해 정규화(Regularization)가 향상될 수 있다.In addition, recently, new activation functions such as Rectified Linear Unit (ReLU) have been used to solve problems such as slow learning time and overfitting. 7 is a graph showing a ReLU activation function. As shown in FIG. 7, the existing sigmoid function has a problem that errors disappear whenever gradient descent is performed in several layers. As you go through several layers and reach the limit, the gradient of the sigmoid function becomes smaller, causing a problem that the weights are not updated. However, when using the ReLU function as an activation function, when the gradient is learned as 0 or 1, the error is propagated to 100%, which solves this problem. Since the ReLU function is not limited to [0,1] like sigmoid and its range is unlimited, it can be seen that it has more reliable expressiveness. In addition, there are many unnecessary values among the output values of each node. In this case, when using the sigmoid function, it is necessary to calculate all values, but the ReLU function can reduce a large part of the amount of calculation, resulting in an effect of improving the computing speed. Regularization can be improved by the ReLU function.

본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 학습 세션에서는 자살시도에 대한 데이터가 우울증(Depressive disorder)이나 불안장애(Anxiety disorder) 등과 같이 일반적인 정신질환에 비해 불균형적(학습 데이터 중 자살시도 경험이 있는 데이터와 자살시도 경험이 없는 데이터의 불균형)이고 양이 적다는 문제가 있다. 이러한 문제를 해결하기 위해, 본 발명의 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)은 우울증(Depressive disorder)과 같이 데이터의 양이 많아 인공신경망의 학습이 용이한 일반적인 정신질환에 대한 인공신경망 모듈의 기학습된 인공신경을 전이(Transfer)하는 방법으로 구성될 수 있다. In the learning session of the mental health condition classification artificial neural network module 12 according to an embodiment of the present invention, the data on suicide attempts are disproportionate compared to general mental disorders such as depression (Depressive disorder) or anxiety disorder ( Among the learning data, there is an imbalance between data with suicide attempts and data without suicide attempts) and a small amount. In order to solve this problem, the mental health condition classification artificial neural network module 12 according to an embodiment of the present invention is a general mental condition that is easy to learn by the artificial neural network due to the large amount of data such as depression (Depressive disorder). It can be configured as a method of transferring the previously learned artificial nerve of the artificial neural network module for the disease.

신경망 전이에 대하여, 도 8는 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 신경망 전이 학습을 도시한 모식도이다. 도 8에 도시된 바와 같이, 우울증에 대한 정신건강 상태 분류 인공신경망 모듈(12_1)의 일부 층(Layer)은 다른 정신질환에 대한 정신건강 상태 분류 인공신경망 모듈(12_2)의 일부 층(Layer)의 신경망 전이에 의해 생성되고, 다른 정신질환에 대한 정신건강 상태 분류 인공신경망 모듈(12_2)의 나머지 층(Layer)은 파라미터인 초기 가중치 w와 초기 편향 b가 무작위로 초기화된 초기화 층으로 생성된다. 이후 다른 정신질환에 대한 피검사자의 상담 인코딩 벡터와 액티비티 인코딩 벡터를 입력 데이터로 하고 설문 문항 데이터(c)를 기초로 판정되는 다른 정신질환 여부를 출력 데이터에 대한 Ground Truth로 하여 다른 정신질환에 대한 정신건강 상태 분류 인공신경망 모듈(12_2)을 재학습하여 다른 정신질환에 대한 정신건강 상태 분류 인공신경망 모듈(12_2)의 파라미터를 세부 교정할 수 있다. 이때, 우울증 분류에 대한 정신건강 상태 분류 인공신경망 모듈(12_1)의 입력 데이터는 우울증에 대한 피검사자의 상담 인코딩 벡터와 액티비티 인코딩 벡터(또는, 히스토리 벡터를 더 포함)이고 출력 데이터는 우울증 분류 데이터이며, 다른 정신질환의 분류을 위한 정신건강 상태 분류 인공신경망 모듈(12_2)의 입력 데이터는 다른 정신질환에 대한 피검사자의 상담 인코딩 벡터와 액티비티 인코딩 벡터(또는, 히스토리 벡터를 더 포함)이고 출력 데이터는 다른 정신질환 분류 데이터(예를 들어, PTSD 예후 분류 데이터, 자살시도 가능성 분류 데이터 등)이다. Regarding neural network transfer, FIG. 8 is a schematic diagram showing neural network transfer learning of the artificial neural network module 12 for classifying mental health conditions according to an embodiment of the present invention. As shown in FIG. 8, some layers of the artificial neural network module 12_1 for classifying mental health conditions for depression are part of layers of the artificial neural network module 12_2 for classifying mental health conditions for other mental disorders. The remaining layers of the artificial neural network module 12_2, which are generated by neural network transition and classify mental health conditions for different mental disorders, are generated as initialization layers in which initial weight w and initial bias b, which are parameters, are randomly initialized. Afterwards, the counseling encoding vector and activity encoding vector of the test subject for other mental disorders are used as input data, and whether or not other mental illnesses determined based on the questionnaire data (c) is used as the ground truth for the output data. Parameters of the mental health condition classification artificial neural network module 12_2 for other mental disorders may be calibrated in detail by retraining the health state classification artificial neural network module 12_2. At this time, the input data of the mental health condition classification artificial neural network module 12_1 for depression classification is the test subject's consultation encoding vector and activity encoding vector (or, further includes a history vector) for depression, and the output data is depression classification data, The input data of the mental health condition classification artificial neural network module 12_2 for classification of other mental disorders is the counseling encoding vector and the activity encoding vector (or further includes a history vector) of the test subject for other mental disorders, and the output data is other mental disorders. Classification data (eg, PTSD prognostic classification data, suicide attempt probability classification data, etc.).

특히, 본 발명의 일실시예에 따른 신경망 전이는, 출력 층(layer) 또는 특정 layer 이후의 후반부 층만을 초기화 층으로 구성하도록 수행될 수 있다. 이에 따르면, 자살시도가능성, PTSD 예후 등 각각의 정신건강 상태에 대해 피검사자의 데이터 양이 인공신경망을 학습시키기에 매우 부족하다고 하더라도 사전에 우울증 등 일반적인 정신질환에 대해 피검사자의 정신질환 패턴을 인공신경망이 고려함으로써 정신건강 상태 분류을 원활히 수행할 수 있게 되는 효과가 발생된다. 또한, 정신건강 상태 분류 인공신경망 모듈(12)에 dummy data를 삽입하거나 data cloning 등의 방법의 data 처리를 수행하지 않아도 자살시도가능성 분류와 같은 데이터의 양이 부족한 정신질환에 대한 분류 작업을 원활히 수행할 수 있게 되는 효과가 발생된다. In particular, neural network transition according to an embodiment of the present invention may be performed to configure only the output layer or the second half layer after a specific layer as an initialization layer. According to this, even if the amount of data of the subject for each mental health condition, such as the possibility of suicide attempt and the prognosis of PTSD, is very insufficient to train the artificial neural network, the artificial neural network can predict the pattern of the subject's mental illness for general mental disorders such as depression in advance. By considering it, the effect of being able to smoothly perform mental health condition classification occurs. In addition, without inserting dummy data into the mental health condition classification artificial neural network module 12 or performing data processing such as data cloning, the classification of mental diseases with insufficient data such as the possibility of suicide attempt is performed smoothly. The effect of being able to do that happens.

또한, 본 발명의 일실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 재학습은, 신경망 전이에 의해 생성된 다른 정신질환에 대한 정신건강 상태 분류 인공신경망 모듈(12_2)의 input layer 및 초기화 층을 제외한 hidden layer에 대해서는 재학습에 의해 파라미터가 변경되지 않도록 고정할 수 있다. 특정 프레임워크에서는 trainableParameter=0 또는 freeze=1를 이용할 수 있다. 이에 따르면, 고정된 Layer의 활성값을 저장하여 출력 층 또는 후반부 층만을 학습하면 되는 효과가 발생된다. In addition, re-learning of the mental health state classification artificial neural network module 12 according to an embodiment of the present invention is an input layer of the mental health state classification artificial neural network module 12_2 for other mental disorders generated by neural network transition For hidden layers other than the initialization layer, parameters can be fixed so that they are not changed by relearning. In certain frameworks you can use trainableParameter=0 or freeze=1. According to this, the effect of learning only the output layer or the latter layer by storing the active value of the fixed layer is generated.

또한, 본 발명의 일실시예에 따른 다른 정신질환에 대한 정신건강 상태 분류 인공신경망 모듈(12_2)의 재학습은, 상위계층 인공신경망에 의해 다른 정신질환에 대한 정신건강 상태 분류 인공신경망 모듈(12_2)의 하이퍼 파라미터가 조정되어 재학습되도록 구성될 수 있다. 본 발명의 일실시예에 따라 상위계층 인공신경망에 의해 조정되는 정신건강 상태 분류 인공신경망 모듈(12)의 하이퍼 파라미터는 Parameter Scale, Gradient, Learning rate(학습률), Learning rate decay(학습률 분해), Regularization strenght(정규화 강도) 등을 의미할 수 있다. In addition, the re-learning of the artificial neural network module 12_2 for classifying mental health conditions for other mental disorders according to an embodiment of the present invention is performed by the upper layer artificial neural network to classify mental health conditions for other mental disorders. The artificial neural network module 12_2 ) may be configured to be relearned by adjusting the hyperparameters. According to an embodiment of the present invention, the hyperparameters of the mental health condition classification artificial neural network module 12 adjusted by the upper layer artificial neural network are Parameter Scale, Gradient, Learning rate (learning rate), Learning rate decay (learning rate decomposition), Regularization strength (normalized strength), and the like.

본 발명의 일실시예에 따른 재학습 시 조정되는 Learning rate는 아래 수학식 1과 같이 재학습 시 파라미터 업데이트에 적용될 수 있다. The learning rate adjusted during re-learning according to an embodiment of the present invention may be applied to parameter update during re-learning as shown in Equation 1 below.

Figure 112022118949819-pat00001
Figure 112022118949819-pat00001

Figure 112022118949819-pat00002
Figure 112022118949819-pat00002

위 수학식 1에서 W는 초기 가중치, b는 초기 편향, η는 학습률(Learning rate), L은 손실을 의미하고, ∂L/∂W와 ∂L/∂b는 각각 가중치와 편향의 Gradient를 의미한다. In Equation 1 above, W is the initial weight, b is the initial bias, η is the learning rate, L is the loss, and ∂L/∂W and ∂L/∂b are the gradients of the weight and bias, respectively. do.

결국, 상위계층 인공신경망은 정신건강 상태 분류 인공신경망 모듈(12)의 재학습 시의 하이퍼 파라미터를 세부적으로 조정하여 출력하는, 각각의 정신질환에 대한 자동 튜닝을 수행하는 상위 계층의 인공신경망을 의미할 수 있고, 상담 데이터 인코더(10), 액티비티 데이터 인코더(11), 정신건강 상태 분류 인공신경망 모듈(12) 등의 파라미터들과 출력된 우울증 분류 데이터(A), PTSD 예후 분류 데이터(B)를 기초로 하이퍼 파라미터를 출력하도록 구성될 수 있다. 출력된 우울증 분류 데이터(A)는 학습된 정신건강 상태 분류 인공신경망 모듈(12)의 Gradient, Weight, 손실(Loss) 등을 계산하는데 이용될 수 있다. 출력된 우울증 분류 데이터(A)를 포함하여, 정신건강 상태 분류 인공신경망 모듈(12)의 Gradient, Weight, 손실(Loss), Learning rate, 데이터의 양 등은 상위계층 인공신경망을 학습시키는데 이용될 수 있다. After all, the upper-layer artificial neural network refers to a higher-layer artificial neural network that performs automatic tuning for each mental disorder by adjusting and outputting hyperparameters during relearning of the mental health condition classification artificial neural network module 12 in detail. parameters such as the counseling data encoder 10, the activity data encoder 11, the mental health status classification artificial neural network module 12, the output depression classification data (A), and the PTSD prognosis classification data (B) It can be configured to output hyperparameters based on The output depression classification data (A) can be used to calculate the gradient, weight, loss, etc. of the learned mental health condition classification artificial neural network module 12 . Including the output depression classification data (A), the gradient, weight, loss, learning rate, and amount of data of the mental health condition classification artificial neural network module 12 can be used to train the upper-layer artificial neural network. there is.

본 발명의 다른 실시예와 관련하여, 정신건강 상태 분류 인공신경망 모듈(12)의 정신건강 상태 분류에 강화학습(Reinforcement Learning)이 이용될 수 있다. 도 9는 본 발명의 다른 실시예에 따른 정신건강 상태 분류 인공신경망 모듈(12)의 강화학습을 도시한 모식도이다. 도 9에 도시된 바와 같이, 정신건강 상태 분류 인공신경망 모듈(12)의 강화학습의 경우, 피검사자의 상담 인코딩 벡터, 액티비티 인코딩 벡터, 히스토리 벡터가 Environment, 정신건강 상태 분류 인공신경망 모듈(12)이 Agent, 정신건강 상태 분류 인공신경망 모듈(12)의 정신건강 상태 분류가 Action, 설문 문항 데이터(c)에 의해 진단되는 정신질환 여부와 정신건강 상태 분류의 유사도가 Reward로 구성되는 강화학습을 구성하여 정신건강 상태 분류 인공신경망 모듈(12)을 업데이트 할 수 있다. 본 발명의 일실시예에 따른 강화학습에 따르면, 피검사자의 상담 데이터(a), 액티비티 데이터(b)와 같이 Environment가 비선형적인 경우에도 정신건강 상태 분류 인공신경망 모듈(12)의 정확도를 향상시킬 수 있는 효과가 발생된다.In relation to another embodiment of the present invention, reinforcement learning may be used for mental health state classification of the mental health state classification artificial neural network module 12 . 9 is a schematic diagram showing reinforcement learning of the artificial neural network module 12 for classifying mental health conditions according to another embodiment of the present invention. As shown in FIG. 9, in the case of reinforcement learning of the mental health state classification artificial neural network module 12, the counseling encoding vector, activity encoding vector, and history vector of the test subject are Environment, and the mental health state classification artificial neural network module 12 is Agent, Mental Health Status Classification The mental health status classification of the artificial neural network module (12) constitutes reinforcement learning, in which the similarity between the mental health status classification diagnosed by Action, the questionnaire data (c) and the mental health status classification consists of Reward. The mental health condition classification artificial neural network module 12 may be updated. According to reinforcement learning according to an embodiment of the present invention, the accuracy of the mental health state classification artificial neural network module 12 can be improved even when the environment is non-linear, such as counseling data (a) and activity data (b) of the test subject. effect occurs.

도 10은 본 발명의 일실시예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 방법을 도시한 흐름도이다. 도 10에 도시된 바와 같이, 본 발명의 일실시예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 방법은 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)를 학습하는 학습 단계(S10), 피검사자의 데이터를 입력하는 신규 데이터 입력 단계(S11), 피검사자의 정신질환을 분류하는 추론 단계(S12)를 포함한다. 10 is a flowchart illustrating a mental health condition classification method using a multimodal artificial neural network according to an embodiment of the present invention. As shown in FIG. 10, the mental health state classification method using a multimodal artificial neural network according to an embodiment of the present invention is a learning step of learning the mental health state classification device 1 using a multimodal artificial neural network ( S10), a new data input step of inputting the test subject's data (S11), and an inference step of classifying the test subject's mental illness (S12).

학습 단계(S10)는, 기존의 피검사자의 상담 데이터, 액티비티 데이터 및 설문 문항 데이터(Ground Truth로의 활용)를 이용하여 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)를 학습하는 단계이다. 이때 기존의 피검사자의 자살시도, PTSD, 우울증, 불안장애 등 정신질환에 대해 각각 별도의 인공신경망 모듈을 구성하고 각각의 인공신경망 모듈을 별도로 학습하게 된다.The learning step (S10) is a step of learning the mental health state classification device 1 using the multimodal artificial neural network using the existing counseling data, activity data, and questionnaire data (used as ground truth) of the test subject. At this time, separate artificial neural network modules are configured for mental disorders such as suicide attempts, PTSD, depression, and anxiety disorders of existing test subjects, and each artificial neural network module is separately learned.

신규 데이터 입력 단계(S11)는, S10에서 학습된 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)에 피검사자의 상담 데이터, 액티비티 데이터를 입력하는 단계이다.The new data input step (S11) is a step of inputting the counseling data and activity data of the test subject into the mental health state classification apparatus 1 using the multimodal artificial neural network learned in S10.

추론 단계(S12)는, S11에서 입력된 피검사자의 상담 데이터, 액티비티 데이터에 기초하여 각각의 정신질환에 대해 구성된 복수의 인공신경망 모듈에서 정신건강 상태 분류 데이터(우울증 분류 데이터, PTSD 예후 분류 데이터 등)를 추론(분류)하고 출력하는 단계이다.In the inference step (S12), mental health state classification data (depression classification data, PTSD prognosis classification data, etc.) This step is to infer (classify) and output.

[변형예][modified example]

본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)는 데이터의 modality에 관계없이 통합적으로 적용될 수 있는 Self-supervised 되는 구조로 구성될 수 있다. 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)의 구체적인 구성 및 작동관계와 관련하여, 도 11은 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치의 작동관계를 도시한 모식도, 도 12는 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치와 메인 신경망 서버의 각 단계에 따른 작동관계를 도시한 모식도, 도 13은 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치의 구성관계를 도시한 모식도, 도 14는 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치의 구체적인 작동관계를 도시한 모식도이다. 도 11에 도시된 바와 같이, 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)는 검사자 클라이언트(100)에 구성될 수 있고, 정신건강 상태에 대한 피검사자가 피검사자 클라이언트(101)를 활용하여 라이브 상담 스트리밍 서버를 통해 연결된 검사자 클라이언트(100)와의 유무선 네트워크 연결을 통해 검사자와의 정신건강 상담을 진행하고, 검사자 클라이언트(100)에 구성된 정신건강 검사 애플리케이션 모듈을 통해 수신되는 상담 데이터, 액티비티 데이터, 설문 문항 데이터(Ground truth로 활용)를 검사자 클라이언트(100)에 포함된 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)에 입력하고, 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)에서 메인 신경망 서버(200)에 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1) 장치에 포함된 인공신경망의 파라미터를 송신하도록 구성된다. The mental health condition classification device 1 using a multimodal artificial neural network according to a modified example of the present invention can be configured with a self-supervised structure that can be applied integrally regardless of the modality of data. Regarding the specific configuration and operational relationship of the mental health condition classification apparatus 1 using a multimodal artificial neural network according to a modified example of the present invention, FIG. 11 is a mental health condition using a multimodal artificial neural network according to a modified example of the present invention 12 is a schematic diagram showing the operation relationship of a mental health status classification device using a multimodal artificial neural network according to a modified example of the present invention and a main neural network server according to each step, 13 is a schematic diagram showing the configuration of a mental health condition classification device using a multimodal artificial neural network according to a modified example of the present invention, and FIG. 14 is a mental health condition using a multimodal artificial neural network according to a modified example of the present invention. It is a schematic diagram showing the specific operating relationship of the classification device. As shown in FIG. 11, the mental health state classification apparatus 1 using a multimodal artificial neural network may be configured in the examiner client 100, and the testee for the mental health state utilizes the testee client 101 Mental health counseling is conducted with the examiner through a wired/wireless network connection with the examiner client 100 connected through the live counseling streaming server, counseling data received through the mental health examination application module configured in the examiner client 100, activity data, Questionnaire data (used as ground truth) is input into the mental health condition classification device 1 using the multimodal artificial neural network according to the modified example of the present invention included in the examiner client 100, and the multimodal artificial neural network is used. A mental health state classification device (1) using a multimodal artificial neural network is configured to transmit parameters of the artificial neural network included in the device to the main neural network server (200) in a mental health state classification device (1).

또한, 도 12에 도시된 바와 같이 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치는 복수개의 검사자 클라이언트(100)에 각각 구성되며, 메인 신경망 서버(200)와 유무선 네트워크로 연결되어 클라이언트 학습 단계, 파라미터 업데이트 단계 및 메인 신경망 다운로드 단계를 수행하도록 구성될 수 있다. 또한, 도 13, 14에 도시된 바와 같이 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)는, 피검사자의 상담 데이터, 액티비티 데이터를 입력 데이터로 하고 상기 피검사자의 상담 데이터, 액티비티 데이터, 설문 문항 데이터에 대응되는 피검사자의 정신건강 상태 분류 데이터를 출력 데이터로 하며, 학습 세션에서는 설문 문항 데이터를 ground truth로 하고, 멀티모달 인코더 모듈, 정신건강 상태 분류 모듈, 클라이언트 학습 모듈, 파라미터 업로드 모듈, 메인 신경망 다운로드 모듈을 포함할 수 있다. 파라미터 업로드 모듈에서는 변경된 파라미터와 수정 변화 정보를 메인 신경망 서버(200)의 연합 학습 모듈(220)에 송신하고, 연합 학습 모듈(220)에서는 복수의 검사자 클라이언트(100)에서 수신된 파라미터와 수정 변화 정보를 기초로 연합 학습을 수행하여 기학습된 메인 신경망을 생성하도록 구성될 수 있다. 기학습된 메인 신경망은 메인 신경망 모듈(210)을 통해 멀티모달 인코더 모듈 및 정신건강 상태 분류 모듈의 인공신경망 모듈을 업데이트하도록 구성될 수 있다. 이에 따르면, 상담 데이터, 액티비티 데이터, 설문 문항 데이터에 포함된 개인정보가 다른 검사자 클라이언트(100) 또는 피검사자 클라이언트(101)에 공유되지 않으면서도 정신건강 상태 분류를 수행하기 위한 멀티모달 인코더 모듈 및 정신건강 상태 분류 모듈의 인공신경망을 학습시킬 수 있게 되는 효과가 발생된다. In addition, as shown in FIG. 12, the apparatus for classifying mental health conditions using a multimodal artificial neural network according to a modified example of the present invention is configured in a plurality of examiner clients 100, respectively, and the main neural network server 200 and the wired/wireless network It can be connected to and configured to perform a client learning step, a parameter update step, and a main neural network download step. In addition, as shown in FIGS. 13 and 14, the mental health state classification apparatus 1 using the multimodal artificial neural network according to the modified example of the present invention uses the counseling data and activity data of the test subject as input data, and the test subject's The test subject's mental health status classification data corresponding to the counseling data, activity data, and questionnaire data is used as output data. module, a parameter upload module, and a main neural network download module. The parameter upload module transmits the changed parameters and corrected change information to the federated learning module 220 of the main neural network server 200, and the federated learning module 220 transmits the parameters and corrected changed information received from the plurality of tester clients 100. It can be configured to generate a pre-learned main neural network by performing federated learning based on. The pre-learned main neural network may be configured to update the artificial neural network module of the multimodal encoder module and the mental health state classification module through the main neural network module 210 . According to this, a multimodal encoder module for performing mental health condition classification without sharing personal information included in counseling data, activity data, and questionnaire data with other examiner clients 100 or testee clients 101 and mental health The effect of being able to learn the artificial neural network of the state classification module is generated.

멀티모달 인코더 모듈과 관련하여, 도 15는 본 발명의 변형예에 따른 멀티모달 인코더 모듈을 도시한 모식도이다. 도 15에 도시된 바와 같이, 멀티모달 인코더 모듈은 상담 데이터, 액티비티 데이터를 입력 데이터로 하고 멀티모달 인코딩 벡터(multi-modal encoding vector)를 출력 데이터로 하는 인공신경망으로 구성될 수 있으며, CNN layer, Transformer layer를 포함하도록 구성될 수 있다. Regarding the multimodal encoder module, FIG. 15 is a schematic diagram showing a multimodal encoder module according to a modified example of the present invention. As shown in FIG. 15, the multimodal encoder module may be composed of an artificial neural network having consultation data and activity data as input data and a multi-modal encoding vector as output data, a CNN layer, It can be configured to include a Transformer layer.

CNN layer는 layer nomalization과 GELU activation function을 포함하고 temporal convolution network(TCN)를 포함하도록 구성될 수 있다. TCN(Temporal convolutional network)은 Temporal 컨볼루션과 Dilation을 사용하여 시퀀셜 데이터(Sequential data)에 맞게 시간성과 큰 수용 필드(receptive field)를 포함하는 프레임워크이다. CNN layer는 상담 데이터(video, audio), 액티비티 데이터의 특정 time step을 입력 데이터로 하고 차원 축소된 latent vector를 출력하도록 구성될 수 있다. 본 발명의 일실시예에 따른 CNN layer는 상담 데이터(video, audio), 액티비티 데이터 각각의 특정 time section step에 대한 random concatenate로 구성된 조합 데이터를 입력 데이터로 할 수 있다. 이에 따르면, random하게 조합된 입력 데이터의 구성에 의해 상담 데이터 및 액티비티 데이터의 시간 관계와의 페어링이 저감된 전반적인 특징 추출이 가능해지는 효과가 발생된다. CNN layers can be configured to include layer normalization and GELU activation functions, and to include temporal convolution networks (TCNs). Temporal convolutional network (TCN) is a framework that includes temporality and a large receptive field according to sequential data using temporal convolution and dilation. The CNN layer may be configured to output a dimensionally reduced latent vector using a specific time step of consultation data (video, audio) and activity data as input data. The CNN layer according to an embodiment of the present invention may take, as input data, combination data configured by random concatenation for a specific time section step of consultation data (video, audio) and activity data. According to this, an effect of enabling overall feature extraction with reduced pairing of counseling data and activity data with a temporal relationship is generated by the configuration of randomly combined input data.

Transformer layer는 Multi-head Self Attention Layer - FFNN - softmax를 포함하도록 구성될 수 있다. 멀티모달 인코더 모듈의 Multi-head Self Attention Layer는 latent vector를 입력 데이터로 입력받고 위치 정보를 조합하는 Positional encoding을 수행하며, Positional encoding된 matrix에 병렬적으로 복수개의 Self Attention 연산(예를 들어, scaled dot product attention)을 수행하여 생성된 attention value matrix를 concatenate 하여 어텐션 정보를 생성하는 layer를 의미한다. 멀티모달 인코더 모듈의 FFNN(Feed Forward Neural Network)은 Position-wise FFNN을 의미할 수 있으며, Fully-connected FFNN을 의미할 수 있다. 멀티모달 인코더 모듈의 FFNN의 입력 데이터는 latent vector와 상기 어텐션 정보가 잔차연결(Residual Connection)된 matrix를 층 정규화(layer normalization) 한 값으로 구성될 수 있다. 멀티모달 인코더 모듈의 softmax(예를 들어, ReLU, GELU 등)는 FFNN의 출력 matrix가 잔차연결(Residual Connection)된 matrix를 층 정규화(layer normalization) 한 값을 입력 데이터로 하고 정신건강 상태 분류 데이터를 출력 데이터로 하는 활성화 layer를 의미할 수 있다. 이에 따르면, positional encoding에 의해 상담 데이터의 시간 순서에 대한 특징도 정신건강 상태 분류에 영향을 주게 되고, Multi-head self attention layer에 의해 병렬로 복수의 어텐션 연산이 수행되게 되므로 다양한 값의 어텐션이 활용되어 보다 정교한 정신건강 상태 분류가 가능해지는 효과가 발생된다. 또한, 이에 따르면, 모달리티에 따라 다른 인공신경망을 별도로 구축할 필요없이 멀티모달에 대해서도 하나의 인공신경망으로 정신건강 상태 분류가 가능해지는 효과가 발생된다. The Transformer layer may be configured to include a Multi-head Self Attention Layer - FFNN - softmax. The Multi-head Self Attention Layer of the multimodal encoder module receives latent vectors as input data and performs Positional encoding that combines location information, and performs multiple Self Attention operations (e.g., scaled It refers to a layer that generates attention information by concatenating the attention value matrix generated by performing dot product attention). A feed forward neural network (FFNN) of the multimodal encoder module may mean a position-wise FFNN or a fully-connected FFNN. The input data of the FFNN of the multimodal encoder module may be composed of a layer normalized value of a latent vector and a matrix obtained by residual connection of the attention information. The softmax (e.g., ReLU, GELU, etc.) of the multimodal encoder module takes the value obtained by layer normalization of the residual connection matrix of the FFNN output matrix as input data and mental health status classification data It may mean an activation layer used as output data. According to this, the characteristics of the temporal order of counseling data also affect mental health state classification by positional encoding, and multiple attention calculations are performed in parallel by the multi-head self attention layer, so attention of various values is utilized. This results in a more sophisticated classification of mental health conditions. In addition, according to this, there is an effect that it is possible to classify mental health conditions with one artificial neural network even for multimodal without the need to separately construct different artificial neural networks according to modalities.

멀티모달 인코더 모듈의 학습 세션과 관련하여, 도 16은 본 발명의 변형예에 따른 멀티모달 인코더 모듈의 학습 세션을 도시한 모식도이다. 도 16에 도시된 바와 같이, 멀티모달 인코더 모듈의 학습 세션에서 멀티모달 인코더 모듈은 동일한 구조를 갖는 학습 타겟 모델과 정답 모델을 포함하도록 구성되며, 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)에서는 아래의 단계로 멀티모달 인코더 모듈의 학습 세션이 수행되도록 구성될 수 있다. 이에 따르면, 멀티모달 인코더 모듈에 대하여 별도의 레이블링 데이터가 획득되지 않아도 self learning이 가능해지는 효과가 발생된다. Regarding the learning session of the multimodal encoder module, FIG. 16 is a schematic diagram showing a learning session of the multimodal encoder module according to a modified example of the present invention. As shown in FIG. 16, in the learning session of the multimodal encoder module, the multimodal encoder module is configured to include a learning target model and a correct answer model having the same structure, and a mental health state classification device using a multimodal artificial neural network ( In 1), the learning session of the multimodal encoder module can be configured to be performed in the following steps. According to this, an effect of enabling self-learning is generated even if separate labeling data is not obtained for the multimodal encoder module.

① 마스킹 단계와 관련하여, 상담 데이터(video, audio), 액티비티 데이터(signal) 각각의 특정 time section step에 대해 random concatenate로 구성된 조합 데이터를 입력 데이터로 구성할 때, video data, audio data, signal data 중 하나를 무작위로 샘플링하여 마스킹(masking) - video data는 인접 블록을 함께 마스킹하는 block-wise masking, audio data와 signal data는 멀티모달 인코딩 벡터의 span을 마스킹함 -① Regarding the masking step, when composing data composed of random concatenation for each specific time section step of consultation data (video, audio) and activity data (signal) as input data, video data, audio data, signal data Masking by randomly sampling one of them - block-wise masking that masks adjacent blocks together for video data, and masking spans of multimodal encoding vectors for audio data and signal data -

② 입력 데이터 입력 단계와 관련하여, 마스킹 된 조합 데이터를 학습 타겟 모델인 멀티모달 인코더 모듈의 입력 데이터로 입력하고, 마스킹 되지 않은 원본 조합 데이터를 정답 모델인 멀티모달 인코더 모듈의 입력 데이터로 입력② Regarding the input data input step, input masked combination data as input data of the multimodal encoder module, which is the learning target model, and input unmasked original combination data as input data of the multimodal encoder module, which is the correct answer model.

③ 출력 데이터 출력 단계와 관련하여, 학습 타겟 모델인 멀티모달 인코더 모듈의 출력 데이터인 학습 타겟 멀티모달 인코딩 벡터 및 정답 모델인 멀티모달 인코더 모듈의 출력 데이터인 정답 멀티모달 인코딩 벡터를 획득 - 이때 정답 모델인 멀티모달 인코더 모듈의 출력 데이터 출력에는 전체 n개의 transformer layer 중 Top K layer를 사용하도록 구성될 수 있음 -③ In relation to the output data output step, the learning target multimodal encoding vector, which is the output data of the multimodal encoder module, which is the learning target model, and the correct answer multimodal encoding vector, which is the output data of the multimodal encoder module, which is the correct answer model, are obtained - at this time, the correct answer model The output data of the multimodal encoder module can be configured to use the Top K layer among all n transformer layers -

④ 파라미터 업데이트 단계와 관련하여, 학습 타겟 멀티모달 인코딩 벡터와 정답 멀티모달 인코딩 벡터와의 차이(손실)를 기초로 하는 손실함수의 손실값을 최소화하는 방향으로 학습 타겟 모델인 멀티모달 인코더 모듈의 파라미터를 업데이트하고, 학습 타겟 모델인 멀티모달 인코더 모듈의 파라미터에 EMA(exponetially moving average)를 적용하여 정답 모델인 멀티모달 인코더 모듈의 파라미터를 업데이트④ Regarding the parameter update step, the parameters of the multimodal encoder module, which is the learning target model, are minimized in the direction of minimizing the loss value of the loss function based on the difference (loss) between the learning target multimodal encoding vector and the correct multimodal encoding vector. and update the parameters of the multimodal encoder module, which is the correct answer model, by applying EMA (exponentially moving average) to the parameters of the multimodal encoder module, which is the learning target model.

파라미터 업데이트 단계에서, 학습 타겟 모델인 멀티모달 인코더 모듈의 손실함수는 아래의 수학식과 같이 구성될 수 있다. In the parameter update step, the loss function of the multimodal encoder module, which is the learning target model, may be configured as in the following equation.

Figure 112022118949819-pat00003
Figure 112022118949819-pat00003

위 수학식에서 L은 손실함수, yt는 정답 멀티모달 인코딩 벡터, ft(x)는 학습 타겟 멀티모달 인코딩 벡터, β는 스무딩 조정 변수이다. 멀티모달 인코더 모듈의 손실함수에 구성된 β에 의해 학습 세션에서의 스무딩 정도를 조정할 수 있다. 이에 따르면, 학습 타겟 모델인 멀티모달 인코더 모듈의 과적합이 방지되고 레이블의 스무딩이 가능해지는 효과가 발생된다. In the above equation, L is the loss function, y t is the correct answer multimodal encoding vector, f t (x) is the learning target multimodal encoding vector, and β is the smoothing adjustment variable. The degree of smoothing in the learning session can be adjusted by β configured in the loss function of the multimodal encoder module. According to this, overfitting of the multimodal encoder module, which is a learning target model, is prevented and labels are smoothed.

또한, 파라미터 업데이트 단계에서, 정답 모델인 멀티모달 인코더 모델의 학습은 아래의 수학식과 같이 수행될 수 있다. In addition, in the parameter update step, learning of the multimodal encoder model, which is the correct answer model, may be performed as in the following equation.

Figure 112022118949819-pat00004
Figure 112022118949819-pat00004

위 수학식에서 Δ는 정답 모델인 멀티모달 인코더 모델의 weight, θ는 학습 타겟 모델인 멀티모달 인코더 모델의 weight, τ는 조정 변수로서 τ가 1인 경우 정답 모델의 weight만 사용하고 τ가 0인 경우 학습 타겟 모델의 weight만 사용하여 정답 모델인 멀티모달 인코더 모델의 학습을 수행하도록 구성될 수 있다. 이에 따르면, 정답 모델의 학습에 대해 노이즈 제거 효과가 발생됨으로써 보다 안정적으로 학습 타겟 모델의 학습이 가능해지는 효과가 발생된다. In the above equation, Δ is the weight of the multimodal encoder model, which is the correct answer model, θ is the weight of the multimodal encoder model, which is the learning target model, and τ is an adjustment variable. When τ is 1, only the weight of the correct answer model is used and τ is 0 It can be configured to perform learning of the multimodal encoder model, which is the correct answer model, using only the weight of the learning target model. According to this, a noise removal effect is generated for the learning of the correct answer model, so that the learning of the learning target model is possible more stably.

정신건강 상태 분류 모듈과 관련하여, 도 17은 본 발명의 변형예에 따른 정신건강 상태 분류 모듈을 도시한 모식도이다. 도 17에 도시된 바와 같이, 본 발명의 변형예에 따른 정신건강 상태 분류 모듈은, time step에 따라 생성된 복수의 멀티모달 인코딩 벡터를 조합(Concatenate)한 조합 벡터를 입력 데이터로 하고 피검사자의 정신건강 상태 분류 class(예를 들어, 우울증 분류 데이터, PTSD 예후 분류 데이터, 자살시도 가능성 분류 데이터 등) 및 confidence를 포함하는 정신건강 상태 분류 데이터를 출력 데이터로 하는 인공신경망 모듈로 구성될 수 있다. Regarding the mental health condition classification module, FIG. 17 is a schematic diagram showing a mental health condition classification module according to a modified example of the present invention. As shown in FIG. 17, the mental health condition classification module according to a modified example of the present invention uses a concatenated vector obtained by concatenating a plurality of multimodal encoding vectors generated according to a time step as input data, and uses the test subject's mental state as input data. It can be composed of an artificial neural network module that outputs mental health condition classification data including health status classification class (eg, depression classification data, PTSD prognosis classification data, suicide attempt possibility classification data, etc.) and confidence.

정신건강 상태 분류 모듈의 구체적인 구성과 관련하여, 본 발명의 일실시예에 따른 정신건강 상태 분류 모듈은 Multi-head Self Attention Layer - FFNN - softmax를 포함하도록 구성될 수 있다. 정신건강 상태 분류 모듈의 Multi-head Self Attention Layer는 time step에 따라 생성된 복수의 멀티모달 인코딩 벡터를 조합(Concatenate)한 조합 벡터를 입력 데이터로 입력받고 위치 정보를 조합하는 Positional encoding을 수행하며, Positional encoding된 matrix에 병렬적으로 복수개의 Self Attention 연산(예를 들어, scaled dot product attention)을 수행하여 생성된 attention value matrix를 concatenate 하여 어텐션 정보를 생성하는 layer를 의미한다. 정신건강 상태 분류 모듈의 FFNN(Feed Forward Neural Network)은 Position-wise FFNN을 의미할 수 있으며, Fully-connected FFNN을 의미할 수 있다. 정신건강 상태 분류 모듈의 FFNN의 입력 데이터는 time step에 따라 생성된 복수의 멀티모달 인코딩 벡터를 조합(Concatenate)한 조합 벡터와 상기 어텐션 정보가 잔차연결(Residual Connection)된 matrix를 층 정규화(layer normalization) 한 값으로 구성될 수 있다. 정신건강 상태 분류 모듈의 softmax는 FFNN의 출력 matrix가 잔차연결(Residual Connection)된 matrix를 층 정규화(layer normalization) 한 값을 입력 데이터로 하고 정신건강 상태 분류 데이터를 출력 데이터로 하는 활성화 layer를 의미할 수 있다. 이에 따르면, positional encoding에 의해 time step에 따라 생성된 복수의 멀티모달 인코딩 벡터를 조합(Concatenate)한 조합 벡터의 각 객체 위치에 대한 특징도 정신건강 상태 분류에 영향을 주게 되고, Multi-head self attention layer에 의해 병렬로 복수의 어텐션 연산이 수행되게 되므로 다양한 값의 어텐션이 활용되어 보다 정교한 정신건강 상태 분류가 가능해지는 효과가 발생된다. Regarding the specific configuration of the mental health state classification module, the mental health state classification module according to an embodiment of the present invention may be configured to include a Multi-head Self Attention Layer - FFNN - softmax. The Multi-head Self Attention Layer of the mental health condition classification module receives a concatenated vector obtained by concatenating a plurality of multimodal encoding vectors generated according to the time step as input data and performs positional encoding to combine location information, It refers to a layer that generates attention information by concatenating an attention value matrix generated by performing a plurality of self-attention operations (eg, scaled dot product attention) in parallel on a positionally encoded matrix. The feed forward neural network (FFNN) of the mental health condition classification module may mean a position-wise FFNN or a fully-connected FFNN. The input data of the FFNN of the mental health condition classification module is layer normalization of a combination vector obtained by concatenating a plurality of multimodal encoding vectors generated according to time step and a matrix in which the attention information is residually connected. ) can be configured with one value. The softmax of the mental health status classification module means an activation layer that has as input data the value obtained by layer normalization of the matrix in which the output matrix of FFNN is residual connection and mental health status classification data as output data. can According to this, the feature of each object location of the concatenated vector of a plurality of multimodal encoding vectors generated according to the time step by positional encoding also affects mental health state classification, and multi-head self attention Since a plurality of attention calculations are performed in parallel by the layer, attention of various values is utilized, resulting in the effect of enabling more sophisticated classification of mental health conditions.

이때, 검사자 클라이언트(100)의 정신건강 상태 분류 모듈에 의해 생성된 피검사자의 정신건강 상태 분류 데이터는 검사자 클라이언트(100)의 디스플레이에 출력될 수 있으며, 검사자는 피검사자의 상담 데이터, 액티비티 데이터 및 설문 문항 데이터를 기초로 피검사자를 진단하여 진단결과를 생성하고, 생성된 진단결과와 정신건강 상태 분류 모듈에서 출력된 피검사자의 정신건강 상태 분류 데이터를 비교하여 수정이 필요한 경우 검사자는 검사자 클라이언트(100)의 클라이언트 학습 모듈에 검사자의 수정이 반영된 수정 정보를 생성할 수 있다.At this time, the mental health status classification data of the examinee client 100 generated by the mental health status classification module of the examinee client 100 may be output on the display of the examinee client 100, and the examinee may determine the examinee's counseling data, activity data, and questionnaire items. Based on the data, a diagnosis result is generated by diagnosing the test subject, and the generated diagnosis result is compared with the test subject's mental health status classification data output from the mental health status classification module. Correction information reflecting the examiner's correction may be generated in the learning module.

클라이언트 학습 모듈은, 검사자 클라이언트(100)에서 피검사자의 정신건강 상태 분류 데이터에 대한 검사자의 수정이 반영된 수정 정보가 생성되는 경우, 수정 정보를 ground truth로 하여 검사자 클라이언트(100)의 멀티모달 정신건강 상태 분류 장치(1)의 일구성인 정신건강 상태 분류 모듈에 포함된 인공신경망의 파라미터를 업데이트 하도록 정신건강 상태 분류 모듈의 학습 세션을 수행할 수 있다. 이때, 멀티모달 인코더 모듈의 파라미터는 별도로 self-supervised learning 진행될 수 있으며, 정신건강 상태 분류 모듈의 학습 세션에서는 freezed 될 수 있다. The client learning module, when the examiner client 100 generates correction information reflecting the examiner's correction to the testee's mental health state classification data, multimodal mental health status of the examinee client 100 by using the corrected information as the ground truth A learning session of the mental health condition classification module may be performed to update parameters of an artificial neural network included in the mental health condition classification module, which is a component of the classification device 1 . At this time, the parameters of the multimodal encoder module can be separately self-supervised learning, and can be frozen in the learning session of the mental health condition classification module.

클라이언트 학습 모듈의 멀티모달 인코더 모듈에 대한 학습 세션과 관련하여, 멀티모달 인코더 모듈의 파라미터는 위에 기재된 바와 같이 별도로 self-supervised learning 진행될 수 있다. Regarding the learning session for the multimodal encoder module of the client learning module, the parameters of the multimodal encoder module may be separately self-supervised learning as described above.

클라이언트 학습 모듈의 정신건강 상태 분류 모듈에 대한 학습 세션과 관련하여, 도 18은 본 발명의 일실시예에 따른 정신건강 상태 분류 모듈의 학습 세션을 도시한 모식도이다. 도 18에 도시된 바와 같이, 클라이언트 학습 모듈의 정신건강 상태 분류 모듈의 학습 세션은 수정 정보가 생성된 경우 수행되도록 구성될 수 있고, 정신건강 상태 분류 모듈에 멀티모달 인코더 모듈의 출력 데이터인 time step에 따라 생성된 복수의 멀티모달 인코딩 벡터를 조합(Concatenate)한 조합 벡터를 입력 데이터로 입력하고 정신건강 상태 분류 데이터를 출력 데이터로 하며, 출력된 정신건강 상태 분류 데이터와 수정 정보의 수정된 정신건강 상태 분류 데이터(ground truth)의 손실(loss)이 작아지는 방향으로(또는, 유사도가 높아지는 방향으로) 정신건강 상태 분류 모듈의 파라미터가 업데이트 되도록 구성될 수 있다. Regarding the learning session for the mental health condition classification module of the client learning module, FIG. 18 is a schematic diagram showing the learning session of the mental health condition classification module according to an embodiment of the present invention. As shown in FIG. 18, the learning session of the mental health condition classification module of the client learning module may be configured to be performed when correction information is generated, and the time step output data of the multimodal encoder module to the mental health condition classification module. A concatenated vector obtained by concatenating a plurality of multimodal encoding vectors generated according to the above is input as input data, mental health status classification data is used as output data, and the mental health status classification data and correction information are modified. Parameters of the mental health condition classification module may be updated in a direction in which the loss of the ground truth is reduced (or in a direction in which the degree of similarity increases).

파라미터 업로드 모듈은, 클라이언트 학습 모듈에 의한 정신건강 상태 분류 모듈의 학습 세션 이후, 멀티모달 인코더 모듈의 변경된 파라미터와 정신건강 상태 분류 모듈의 변경된 파라미터를 메인 신경망 서버(200)의 연합 학습 모듈(220)에 업로드하는 모듈이다. 파라미터는, 정신건강 상태 분류 모듈의 학습 세션 이후 멀티모달 인코더 모듈 및 정신건강 상태 분류 모듈의 그래디언트(g) 또는 인공신경망의 웨이트(w)를 포함할 수 있다. 파라미터 업로드 모듈의 멀티모달 인코더 모듈 및 정신건강 상태 분류 모듈에 대한 파라미터 업로드는 상기 수정 정보가 생성된 경우에 수행되도록 구성된다. After the learning session of the mental health status classification module by the client learning module, the parameter upload module transfers the changed parameters of the multimodal encoder module and the changed parameters of the mental health status classification module to the federated learning module 220 of the main neural network server 200. This module is uploaded to . The parameter may include the gradient (g) of the multimodal encoder module and the mental health state classification module or the weight (w) of the artificial neural network after the learning session of the mental health state classification module. Parameter upload for the multimodal encoder module and the mental health condition classification module of the parameter upload module is configured to be performed when the correction information is generated.

또한, 파라미터 업로드 모듈은, 멀티모달 인코더 모듈 및 정신건강 상태 분류 모듈의 변경된 파라미터에 노이즈(ε)를 적용하여 메인 신경망 서버(200)에 업로드하도록 구성될 수 있다. 예를 들어, 파라미터가 그래디언트(g)인 경우, g+ε로 업로드 되도록 구성될 수 있고, 파라미터가 웨이트(w)인 경우 w+ε로 업로드 되도록 구성될 수 있다. 이때, 노이즈(ε)는 양의 값과 음의 값이 랜덤하게 부여되어 연합 학습 모듈(220)에서의 연합 학습 시 노이즈의 영향이 최소한으로 적용되도록 구성될 수 있다. 이에 따르면, 검사자 클라이언트(100)에서 파라미터에 노이즈가 적용되어 메인 신경망 서버에 업로드 되므로, 제3자가 파라미터를 취득하더라도 피검사자의 상담 데이터, 액티비티 데이터, 설문 문항 데이터의 취득이 불가능한 효과가 발생된다. In addition, the parameter upload module may be configured to apply noise (ε) to the changed parameters of the multimodal encoder module and the mental health condition classification module and upload them to the main neural network server 200. For example, if the parameter is the gradient (g), it can be configured to be uploaded as g+ε, and if the parameter is the weight (w), it can be configured to be uploaded as w+ε. In this case, the noise ε may be configured to have a positive value and a negative value randomly assigned so that the effect of the noise is minimally applied during federated learning in the federated learning module 220 . According to this, since noise is applied to the parameters in the examiner client 100 and uploaded to the main neural network server, even if a third party acquires the parameters, it is impossible to acquire the counseling data, activity data, and questionnaire data of the examinee.

메인 신경망 다운로드 모듈은, 메인 신경망 서버(200)의 연합 학습 모듈(220)에 의해 기학습된 멀티모달 인코더 메인 신경망, 정신건강 상태 분류 메인 신경망을 다운로드하여 멀티모달 인코더 모듈, 정신건강 상태 분류 모듈의 적어도 일부 네트워크를 치환(교체, 전이)하는 모듈이다. The main neural network download module downloads the multimodal encoder main neural network and the mental health state classification main neural network pre-learned by the federated learning module 220 of the main neural network server 200 to generate the multimodal encoder module and the mental health state classification module. It is a module that replaces (replaces, transitions) at least some networks.

멀티모달 인코더 모듈의 네트워크 다운로드는, 메인 신경망 서버(200)의 메인 신경망 모듈(210)에서 기학습된 멀티모달 인코더 메인 신경망을 다운로드 받고, 멀티모달 인코더 모듈의 후방 레이어(최후 n개의 layer)를 제외한 나머지를 다운로드 받은 멀티모달 인코더 메인 신경망으로 치환(교체, 전이)하도록 구성된다. 이에 따르면, 각 검사자 클라이언트(100)의 멀티모달 인코더 모듈의 신경망을 메인 신경망으로 완전히 교체하지 않으므로, 멀티모달 인코더 모듈을 계속적으로 업데이트 하면서도 피검사자의 상담 스타일에 따른 정신건강 상태 분류의 개인화가 가능해지는 효과가 발생된다. The network download of the multimodal encoder module downloads the multimodal encoder main neural network pretrained in the main neural network module 210 of the main neural network server 200, excluding the rear layers (last n layers) of the multimodal encoder module. It is configured to replace (replace, transfer) the rest to the downloaded multimodal encoder main neural network. According to this, since the neural network of the multimodal encoder module of each examiner client 100 is not completely replaced with the main neural network, the multimodal encoder module is continuously updated, while the effect of personalizing mental health status classification according to the counseling style of the testee is possible occurs.

정신건강 상태 분류 메인 신경망의 네트워크 다운로드는, 메인 신경망 서버(200)의 메인 신경망 모듈(210)에서 기학습된 정신건강 상태 분류 메인 신경망을 다운로드 받고, 정신건강 상태 분류 모듈을 다운로드 받은 정신건강 상태 분류 메인 신경망으로 치환(교체, 전이)하도록 구성된다. The network download of the mental health state classification main neural network downloads the mental health state classification main neural network pre-learned in the main neural network module 210 of the main neural network server 200, and classifies the mental health state downloaded from the mental health state classification module. It is configured to substitute (replace, transfer) to the main neural network.

메인 신경망 서버(200)는, 메인 신경망 모듈(210)과 연합 학습 모듈(220)을 포함할 수 있고, 복수의 검사자 클라이언트(100)에서 업로드되는 멀티모달 인코더 모듈, 정신건강 상태 분류 모듈의 파라미터를 취합하여 메인 신경망 모듈(210)을 업데이트한 뒤, 기학습된 메인 신경망을 검사자 클라이언트(100)에 다시 배포하도록 구성되는 서버이다. The main neural network server 200 may include a main neural network module 210 and a federated learning module 220, and parameters of a multimodal encoder module and a mental health condition classification module uploaded from a plurality of examiner clients 100 After collecting and updating the main neural network module 210, the server is configured to redistribute the pre-learned main neural network to the inspector client 100.

메인 신경망 모듈(210)은, 멀티모달 인코더 메인 신경망, 정신건강 상태 분류 메인 신경망을 포함할 수 있으며, 연합 학습 모듈(220)에 의해 특정 그래디언트(g) 또는 특정 웨이트(w)로 파라미터가 업데이트되도록 구성될 수 있다. 멀티모달 인코더 메인 신경망은, 멀티모달 인코더 모듈에 대응되는 메인 신경망을 의미하고, 정신건강 상태 분류 메인 신경망은 정신건강 상태 분류 모듈에 대응되는 메인 신경망을 의미한다. The main neural network module 210 may include a multimodal encoder main neural network and a mental health state classification main neural network, and the associated learning module 220 may update parameters with a specific gradient (g) or a specific weight (w). can be configured. The multimodal encoder main neural network refers to a main neural network corresponding to the multimodal encoder module, and the mental health condition classification main neural network refers to a main neural network corresponding to the mental health condition classification module.

연합 학습 모듈(220)은, 복수의 피검사자 클라이언트(100)에서 업로드되는 멀티모달 인코더 메인 신경망, 정신건강 상태 분류 메인 신경망의 파라미터를 취합한 뒤, 취합 된 파라미터를 이용하여 메인 신경망 모듈(210)을 업데이트 하도록 구성되는 모듈이다. 이때, 취합된 파라미터를 이용하여 메인 신경망 모듈(210)을 업데이트하는 방법은 아래와 같이 생성된 수정 정보와 수정 전 정보(정신건강 상태 분류 데이터)의 차이인 수정 변화 정보가 파라미터의 가중치로 사용되고, 파라미터와 수정 변화 정보의 곱의 합산을 상기 수정 변화 정보의 합으로 나눔으로써 파라미터가 수정 변화 정보를 기준으로 평균되도록 구성될 수 있다. The federated learning module 220 collects the parameters of the multimodal encoder main neural network and the mental health state classification main neural network uploaded from the plurality of testee clients 100, and then uses the collected parameters to perform the main neural network module 210. It is a module configured to update. At this time, in the method of updating the main neural network module 210 using the collected parameters, the correction change information, which is the difference between the correction information generated as follows and the information before correction (mental health status classification data), is used as the weight of the parameter, and the parameter The parameter may be averaged based on the modified change information by dividing the sum of the product of the modified change information and the modified change information by the sum of the modified change information.

파라미터가 그래디언트(g)인 경우, 연합 학습 모듈(220)에서는 아래의 수학식과 같이 메인 신경망 모듈(210)의 파라미터를 업데이트 하도록 구성될 수 있다. When the parameter is the gradient (g), the federated learning module 220 may be configured to update the parameter of the main neural network module 210 as shown in the following equation.

Figure 112022118949819-pat00005
Figure 112022118949819-pat00005

위 수학식에서, wnew는 메인 신경망 모듈(210)의 업데이트 후 웨이트, wold는 메인 신경망 모듈(210)의 업데이트 이전 웨이트, α는 learning rate, sn은 검사자 클라이언트(100) n에서 업로드 된 수정 변화 정보, gn은 검사자 클라이언트(100) n에서 업로드 된 그래디언트를 의미하도록 구성될 수 있다. In the above equation, w new is the weight after updating the main neural network module 210, w old is the weight before updating the main neural network module 210, α is the learning rate, and s n is the correction uploaded from the tester client 100 n Change information g n may be configured to mean a gradient uploaded from the inspector client 100 n.

파라미터가 웨이트(w)인 경우, 연합 학습 모듈(220)에서는 아래의 수학식과 같이 메인 신경망 모듈(210)의 파라미터를 업데이트 하도록 구성될 수 있다. When the parameter is weight (w), the federated learning module 220 may be configured to update the parameter of the main neural network module 210 as shown in the following equation.

Figure 112022118949819-pat00006
Figure 112022118949819-pat00006

위 수학식에서, wnew는 메인 신경망 모듈(210)의 업데이트 후 웨이트, sn은 검사자 클라이언트(100) n에서 업로드 된 수정 변화 정보, wn은 검사자 클라이언트(100) n에서 업로드 된 웨이트를 의미하도록 구성될 수 있다. In the above equation, w new is the post-update weight of the main neural network module 210, s n is the correction change information uploaded from the inspector client 100 n, and w n means the weight uploaded from the inspector client 100 n can be configured.

이에 따르면, 메인 신경망 모듈(210)에서의 연합 학습 시 수정 변화 정보가 파라미터의 가중치로 사용됨으로써 미니 배치(mini batch)의 효과가 발생된다. 또한, 메인 신경망 모듈(210)에서의 연합 학습 시 수정 변화 정보가 파라미터의 가중치로 사용됨으로써 네트워크 토폴로지 및 비동기 통신 문제가 저감되는 효과가 발생된다. 또한, 수정 정보와 수정 전 정보의 차이가 큰 경우가 메인 신경망 모듈의 업데이트에 보다 큰 영향력을 갖게 되는 효과가 발생된다. According to this, during joint learning in the main neural network module 210, correction change information is used as a weight of a parameter, thereby generating a mini-batch effect. In addition, during federated learning in the main neural network module 210, correction change information is used as a weight of a parameter, thereby reducing network topology and asynchronous communication problems. In addition, when the difference between the corrected information and the pre-corrected information is large, an effect of having a greater influence on the update of the main neural network module occurs.

미술치료 프로그램의 추천과 관련하여, 본 발명의 변형예에 따른 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치(1)는 미술치료 프로그램 추천 모듈을 더 포함할 수 있다. 도 19는 본 발명의 변형예에 따른 미술치료 프로그램 추천 모듈을 도시한 모식도이다. 도 19에 도시된 바와 같이, 본 발명의 변형예에 따른 미술치료 프로그램 추천 모듈은 검사자 클라이언트(100)에 구성될 수 있고, 유무선 네트워크로 미술치료 프로그램 서버 및 미술치료 프로그램 DB에 연결될 수 있으며, 피검사자에 대해 정신건강 상태 분류 모듈에서 출력된 정신건강 상태 분류 데이터를 입력 데이터로 하고 추천 미술치료 프로그램 데이터(미술치료 프로그램 카테고리, 난이도, 색감 등)를 출력 데이터로 할 수 있고, 출력된 추천 미술치료 프로그램 데이터를 피검사자 클라이언트(101)의 미술치료 애플리케이션 모듈에 송신하도록 구성될 수 있다.Regarding the recommendation of the art therapy program, the apparatus 1 for classifying mental health conditions using a multimodal artificial neural network according to a modified embodiment of the present invention may further include an art therapy program recommendation module. 19 is a schematic diagram showing an art therapy program recommendation module according to a modified example of the present invention. As shown in FIG. 19, the art therapy program recommendation module according to the modified example of the present invention may be configured in the examiner client 100, and may be connected to the art therapy program server and the art therapy program DB through a wired or wireless network, and the test subject For this, the mental health condition classification data output from the mental health condition classification module can be used as input data, and the recommended art therapy program data (art therapy program category, difficulty, color, etc.) can be used as output data, and the output recommended art therapy program It may be configured to transmit data to the art therapy application module of the test subject client (101).

본 발명의 변형예에 따른 미술치료 프로그램 추천 모듈은 피검사자에 대해 정신건강 상태 분류 모듈에서 출력된 정신건강 상태 분류 데이터를 기반으로 피검사자에 대한 미술치료 프로그램의 추천에 대하여 강화학습(Reinforcement Learning)이 적용될 수 있다. 도 20은 본 발명의 변형예에 따른 미술치료 프로그램 추천 모듈의 강화학습을 도시한 모식도이다. 도 20에 도시된 바와 같이, 미술치료 프로그램 추천 모듈의 강화학습의 경우, 피검사자의 상담 데이터, 액티비티 데이터가 Environment, 미술치료 프로그램 추천 모듈이 Agent, 미술치료 프로그램 추천 모듈의 추천 미술치료 프로그램 선정이 Action, 정신건강 상태 분류 데이터가 State, 미술치료 프로그램 전 후의 정신건강 분류 데이터의 차이(호전도)가 Reward로 구성되는 강화학습을 구성하여 미술치료 프로그램 추천 모듈을 업데이트 할 수 있다. 본 발명의 변형예에 따른 강화학습에 따르면, 피검사자의 정신건강 상태 분류 데이터의 출력에 따라 피검사자의 미술치료 가능성이 가장 높을 것으로 예상되는 미술치료 프로그램을 추천할 수 있는 효과가 발생된다.In the art therapy program recommendation module according to a modified example of the present invention, reinforcement learning is applied to the recommendation of an art therapy program for the test subject based on the mental health state classification data output from the mental health state classification module for the test subject. can 20 is a schematic diagram showing reinforcement learning of an art therapy program recommendation module according to a modified example of the present invention. As shown in FIG. 20, in the case of reinforcement learning of the art therapy program recommendation module, the counseling data and activity data of the test subject are Environment, the art therapy program recommendation module is Agent, and the recommended art therapy program selection of the art therapy program recommendation module is Action. , The art therapy program recommendation module can be updated by configuring reinforcement learning in which the mental health status classification data is composed of State, and the difference (improvement degree) of mental health classification data before and after the art therapy program is composed of Reward. According to the reinforcement learning according to the modified example of the present invention, an effect of recommending an art therapy program that is expected to have the highest possibility of art therapy for the subject is generated according to the output of the subject's mental health status classification data.

이상에서 설명한 바와 같이, 본 발명이 속하는 기술 분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 상술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함하는 것으로 해석되어야 한다.As described above, those skilled in the art to which the present invention pertains will be able to understand that the present invention can be embodied in other specific forms without changing its technical spirit or essential features. Therefore, the above-described embodiments should be understood as illustrative in all respects and not restrictive. The scope of the present invention is indicated by the claims to be described later rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and equivalent concepts should be construed as being included in the scope of the present invention.

본 명세서 내에 기술된 특징들 및 장점들은 모두를 포함하지 않으며, 특히 많은 추가적인 특징들 및 장점들이 도면들, 명세서, 및 청구항들을 고려하여 당업자에게 명백해질 것이다. 더욱이, 본 명세서에 사용된 언어는 주로 읽기 쉽도록 그리고 교시의 목적으로 선택되었고, 본 발명의 주제를 묘사하거나 제한하기 위해 선택되지 않을 수도 있다는 것을 주의해야 한다.The features and advantages described in this specification are not all inclusive, and many additional features and advantages will become apparent to those skilled in the art, particularly from consideration of the drawings, specification, and claims. Moreover, it should be noted that the language used herein has been chosen primarily for readability and instructional purposes, and may not have been chosen to delineate or limit the subject matter of the invention.

본 발명의 실시예들의 상기한 설명은 예시의 목적으로 제시되었다. 이는 개시된 정확한 형태로 본 발명을 제한하거나, 빠뜨리는 것 없이 만들려고 의도한 것이 아니다. 당업자는 상기한 개시에 비추어 많은 수정 및 변형이 가능하다는 것을 이해할 수 있다.The foregoing description of embodiments of the present invention has been presented for purposes of illustration. It is not intended to limit the invention to the precise form disclosed or to make it without omission. Those skilled in the art can appreciate that many modifications and variations are possible in light of the above disclosure.

그러므로 본 발명의 범위는 상세한 설명에 의해 한정되지 않고, 이를 기반으로 하는 출원의 임의의 청구항들에 의해 한정된다. 따라서, 본 발명의 실시예들의 개시는 예시적인 것이며, 이하의 청구항에 기재된 본 발명의 범위를 제한하는 것은 아니다.Therefore, the scope of the present invention is not limited by the detailed description, but by any claims of the application based thereon. Accordingly, the disclosure of embodiments of the invention is illustrative and not limiting of the scope of the invention set forth in the claims below.

1: 멀티모달 인공신경망을 활용한 정신건강 상태 분류 장치
10: 액티비티 데이터 인코더
11: 상담 데이터 인코더
12: 정신건강 상태 분류 인공신경망 모듈
100: 검사자 클라이언트
101: 피검사자 클라이언트
200: 메인 신경망 서버
210: 메인 신경망 모듈
220: 연합 학습 모듈
a: 상담 데이터
b: 액티비티 데이터
c: 설문 문항 데이터
A: 우울증 분류 데이터
B: PTSD 예후 분류 데이터
1: Mental health condition classification device using multimodal artificial neural network
10: Activity Data Encoder
11: consultation data encoder
12: Mental health condition classification artificial neural network module
100: inspector client
101: test subject client
200: main neural network server
210: main neural network module
220: federated learning module
a: consultation data
b: activity data
c: Questionnaire data
A: Depression classification data
B: PTSD prognostic classification data

Claims (5)

미술치료 프로그램을 추천하기 위한 방법으로서, 상기 방법은 장치에 포함된 미술치료 프로그램 추천 모듈에 의해 수행되고, 상기 방법은,
피검사자에 대한 정신건강 상태 분류 데이터를 수신하는 단계와,
상기 정신건강 상태 분류 데이터를 상기 미술치료 프로그램 추천 모듈에 포함된 인공 신경망 모듈에 입력하는 단계와,
상기 정신건강 상태 분류 데이터에 기초하여 상기 인공 신경망 모듈에 의해 추천 미술치료 프로그램 데이터를 출력하는 단계와,
상기 출력된 추천 미술치료 프로그램 데이터를 피검사자 클라이언트로 송신하는 단계
를 포함하고,
상기 추천 미술치료 프로그램 데이터는 추천하는 미술치료 프로그램의 카테고리, 난이도 및 색감 중 적어도 하나를 포함하고,
상기 인공 신경망 모듈은 강화학습을 수행함으로써 업데이트되며,
상기 강화학습은, 상기 피검사자의 상담 데이터 및 시그널 형태로 구성된 상기 피검사자의 액티비티 데이터가 Environment, 상기 미술치료 프로그램 추천 모듈이 Agent, 상기 미술치료 프로그램 추천 모듈에서 출력한 추천 미술치료 프로그램이 Action, 상기 정신건강 상태 분류 데이터가 State, 상기 추천 미술치료 프로그램을 상기 피검사자에게 미술치료로 적용한 전후의 상기 정신건강 분류 데이터의 차이가 Reward로 구성되는 것인
미술치료 프로그램을 추천하기 위한 방법.
A method for recommending an art therapy program, the method being performed by an art therapy program recommendation module included in a device, the method comprising:
Receiving mental health condition classification data for the test subject;
inputting the mental health state classification data into an artificial neural network module included in the art therapy program recommendation module;
outputting recommended art therapy program data by the artificial neural network module based on the mental health state classification data;
Transmitting the outputted recommended art therapy program data to the test subject client
including,
The recommended art therapy program data includes at least one of the category, difficulty, and color of the recommended art therapy program;
The artificial neural network module is updated by performing reinforcement learning,
In the reinforcement learning, the test subject's activity data composed of the test subject's counseling data and signal form is Environment, the art therapy program recommendation module is Agent, and the recommended art therapy program output from the art therapy program recommendation module is Action, and the mind The health status classification data is State, and the difference between the mental health classification data before and after applying the recommended art therapy program as art therapy to the test subject is composed of Reward.
How to recommend an art therapy program.
제 1 항에 있어서,
상기 정신건강 상태 분류 데이터는 정신건강 상태 분류 모듈로부터 수신한 것이며,
상기 정신건강 상태 분류 모듈은, 영상 형태 또는 음성 형태로 구성된 상기 피검사자의 상담 데이터 및 시그널 형태로 구성된 상기 피검사자의 액티비티 데이터를 입력 데이터로 하고 상기 피검사자의 정신건강 상태 분류 데이터를 출력 데이터로 하도록 학습된 인공신경망을 포함하는
미술치료 프로그램을 추천하기 위한 방법.
According to claim 1,
The mental health condition classification data is received from the mental health condition classification module,
The mental health condition classification module is trained to use the counseling data of the test subject in the form of a video or audio and the activity data of the test subject in the form of a signal as input data and output the mental health state classification data of the test subject as output data including artificial neural networks
How to recommend an art therapy program.
삭제delete 삭제delete 미술치료 프로그램 추천 모듈을 포함하는 장치로서,
상기 장치는 상기 미술치료 프로그램 추천 모듈의 프로그램 코드를 저장하는 메모리 모듈; 및
상기 미술치료 프로그램 추천 모듈의 프로그램 코드를 처리하는 처리 모듈
을 포함하고,
상기 미술치료 프로그램 추천 모듈의 프로그램 코드는, 상기 처리 모듈에 의해 실행되어,
피검사자에 대한 정신건강 상태 분류 데이터를 수신하고,
상기 정신건강 상태 분류 데이터를 상기 미술치료 프로그램 추천 모듈에 포함된 인공 신경망 모듈에 입력하고,
상기 정신건강 상태 분류 데이터에 기초하여 상기 인공 신경망 모듈에 의해 추천 미술치료 프로그램 데이터를 출력하고,
상기 출력된 추천 미술치료 프로그램 데이터를 피검사자 클라이언트로 송신하도록 동작하고,
상기 추천 미술치료 프로그램 데이터는 추천하는 미술치료 프로그램의 카테고리, 난이도 및 색감 중 적어도 하나를 포함하고,
상기 인공 신경망 모듈은 강화학습을 수행함으로써 업데이트되며,
상기 강화학습은, 상기 피검사자의 상담 데이터 및 시그널 형태로 구성된 상기 피검사자의 액티비티 데이터가 Environment, 상기 미술치료 프로그램 추천 모듈이 Agent, 상기 미술치료 프로그램 추천 모듈에서 출력한 추천 미술치료 프로그램이 Action, 상기 정신건강 상태 분류 데이터가 State, 상기 추천 미술치료 프로그램을 상기 피검사자에게 미술치료로 적용한 전후의 상기 정신건강 분류 데이터의 차이가 Reward로 구성되는 것인
미술치료 프로그램 추천 모듈을 포함하는 장치.
An apparatus including an art therapy program recommendation module,
The device includes a memory module for storing the program code of the art therapy program recommendation module; and
A processing module for processing the program code of the art therapy program recommendation module
including,
The program code of the art therapy program recommendation module is executed by the processing module,
Receiving mental health condition classification data for the test subject;
Inputting the mental health state classification data to an artificial neural network module included in the art therapy program recommendation module,
Outputting recommended art therapy program data by the artificial neural network module based on the mental health state classification data;
Operating to transmit the outputted recommended art therapy program data to a test subject client;
The recommended art therapy program data includes at least one of the category, difficulty, and color of the recommended art therapy program;
The artificial neural network module is updated by performing reinforcement learning,
In the reinforcement learning, the test subject's activity data composed of the test subject's counseling data and signal form is Environment, the art therapy program recommendation module is Agent, and the recommended art therapy program output from the art therapy program recommendation module is Action, and the mind The health status classification data is State, and the difference between the mental health classification data before and after applying the recommended art therapy program as art therapy to the test subject is composed of Reward.
A device including an art therapy program recommendation module.
KR1020220148394A 2022-04-05 2022-11-09 Apparatus and method for recommending art therapy program through reinforcement learning KR102517717B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220148394A KR102517717B1 (en) 2022-04-05 2022-11-09 Apparatus and method for recommending art therapy program through reinforcement learning

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020220042527A KR102466731B1 (en) 2022-04-05 2022-04-05 Apparatus and method for predicting mental illness using multimodal artificial neural network
KR1020220148394A KR102517717B1 (en) 2022-04-05 2022-11-09 Apparatus and method for recommending art therapy program through reinforcement learning

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020220042527A Division KR102466731B1 (en) 2022-04-05 2022-04-05 Apparatus and method for predicting mental illness using multimodal artificial neural network

Publications (1)

Publication Number Publication Date
KR102517717B1 true KR102517717B1 (en) 2023-04-04

Family

ID=84043171

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020220042527A KR102466731B1 (en) 2022-04-05 2022-04-05 Apparatus and method for predicting mental illness using multimodal artificial neural network
KR1020220148394A KR102517717B1 (en) 2022-04-05 2022-11-09 Apparatus and method for recommending art therapy program through reinforcement learning
KR1020220148395A KR102548241B1 (en) 2022-04-05 2022-11-09 Apparatus and method for predicting mental illness via reinforcement learning using multimodal artificial neural network

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020220042527A KR102466731B1 (en) 2022-04-05 2022-04-05 Apparatus and method for predicting mental illness using multimodal artificial neural network

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020220148395A KR102548241B1 (en) 2022-04-05 2022-11-09 Apparatus and method for predicting mental illness via reinforcement learning using multimodal artificial neural network

Country Status (1)

Country Link
KR (3) KR102466731B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210027769A (en) * 2019-09-03 2021-03-11 한국항공대학교산학협력단 Neural network based sentiment analysis and therapy system
KR20210058449A (en) * 2019-11-14 2021-05-24 주식회사 셀바스에이아이 Apparatus and method for mental healthcare based on artificial intelligence
KR102327669B1 (en) * 2021-04-01 2021-11-23 이병관 Mental care system using artificial intelligence
KR102367024B1 (en) * 2021-08-10 2022-02-24 주식회사 어루만짐 Art play kit matching system and method using psychological analysis

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102243294B1 (en) * 2018-11-30 2021-04-22 인하대학교 산학협력단 Human emotion state recognition method and system using fusion of image and eeg signals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210027769A (en) * 2019-09-03 2021-03-11 한국항공대학교산학협력단 Neural network based sentiment analysis and therapy system
KR20210058449A (en) * 2019-11-14 2021-05-24 주식회사 셀바스에이아이 Apparatus and method for mental healthcare based on artificial intelligence
KR102327669B1 (en) * 2021-04-01 2021-11-23 이병관 Mental care system using artificial intelligence
KR102367024B1 (en) * 2021-08-10 2022-02-24 주식회사 어루만짐 Art play kit matching system and method using psychological analysis

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
Barak-Corren Y, Castro VM, Javitt S, Hoffnagle AG, Dai Y, Perlis RH, et al. Predicting suicidal behavior from longitudinal electronic health records. Am JPsychiatry (2017) 174:154-62.
IR Galatzer-Levy, S Ma, A Statnikov, R Yehuda and AY Shalev, (2017). Utilization of machine learning for prediction of post-traumatic stress: a re-examination of cortisol in the prediction and pathways to non-remitting PTSD, Transl Psychiatry (2017) 7, e1070.
Kessler RC, Warner CH, Ivany C, Petukhova MV, Rose S, Bromet EJ, et al. Predicting suicides after psychiatric hospitalization in US Army soldiers: the army study to assess risk and resilience in servicemembers (Army STARRS). JAMA Psychiatry (2015) 72:49-57.
Nuriel S. Mor, Kathryn L. Dardeck, (2018). Quantitative Forecasting of Risk for PTSD Using Ecological Factors: A Deep Learning Application, Journal of Social, Behavioral, and Health Sciences 2018, Volume 12, Issue 1, Pages 61-73.
Oh, J., Yun, K., Hwang, J. H., & Chae, J. H. (2017). classification of suicide attempts through a Machine learning algorithm Based on Multiple systemic Psychiatric scales., Frontiers in psychiatry,8, 192.
미국 공개특허 US 2014-0046696 A1, Systems and Methods for Pharmacogenomic Decision Support in Psychiatry, AssureRx Health, Inc.
미국 등록특허 US 6317731 B1, Method for predicting the therapeutic outcome of a treatment, ADVANCED BIOLOGICAL LABORATORIES S.A.
미국 등록특허 US 9792823 B2, Multi-view learning in detection of psychological states, Raytheon BBN Technologies Corp.

Also Published As

Publication number Publication date
KR102466731B1 (en) 2022-11-14
KR102548241B1 (en) 2023-06-28

Similar Documents

Publication Publication Date Title
Azeez et al. Comparison of adaptive neuro-fuzzy inference system and artificial neutral networks model to categorize patients in the emergency department
WO2017106770A1 (en) Platform and system for digital personalized medicine
KR102197112B1 (en) Computer program and method for artificial neural network model learning based on time series bio-signals
KR102208759B1 (en) Method for generating deep-learning model for diagnosing health status and pathology symptom based on biosignal
Dargazany et al. WearableDL: Wearable Internet‐of‐Things and Deep Learning for Big Data Analytics—Concept, Literature, and Future
Zhang et al. Multi-modal interactive fusion method for detecting teenagers’ psychological stress
Yu et al. Wearable sensor-based chronic condition severity assessment: An adversarial attention-based deep multisource multitask learning approach
Datta et al. Artificial intelligence in critical care: Its about time!
Khan et al. Incorporating deep learning methodologies into the creation of healthcare systems
Agarwal et al. Edge optimized and personalized lifelogging framework using ensembled metaheuristic algorithms
Liu et al. Hipal: A deep framework for physician burnout prediction using activity logs in electronic health records
Ye et al. Personalized on-device e-health analytics with decentralized block coordinate descent
KR102517717B1 (en) Apparatus and method for recommending art therapy program through reinforcement learning
Yadav et al. Supervised learning technique for prediction of diseases
Leentjens et al. Will the biopsychosocial model of medicine survive in the age of artificial intelligence and machine learning?
US11972336B2 (en) Machine learning platform and system for data analysis
Alshari et al. Machine learning model to diagnose diabetes type 2 based on health behavior
KR102208760B1 (en) Method for generating video data for diagnosing health status and pathology symptom based on biosignal
Chen XAmI applications to telemedicine and telecare
Kulev et al. Recommender system for responsive engagement of senior adults in daily activities
KR20230060393A (en) Apparatus and method for predicting mental illness using reinforcement learning
KR20230060394A (en) Apparatus and method for predicting mental illness using neural network transfer
CN116261733A (en) Auxiliary model for predicting new model parameters
KR20230060392A (en) Apparatus and method for predicting mental illness using multimodal artificial neural network
VeerasekharReddy et al. Diet Recommendation System for Human Health Using Machine Learning

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant