KR20200031265A - Method and apparatus for early diagnosis of depression - Google Patents

Method and apparatus for early diagnosis of depression Download PDF

Info

Publication number
KR20200031265A
KR20200031265A KR1020180110050A KR20180110050A KR20200031265A KR 20200031265 A KR20200031265 A KR 20200031265A KR 1020180110050 A KR1020180110050 A KR 1020180110050A KR 20180110050 A KR20180110050 A KR 20180110050A KR 20200031265 A KR20200031265 A KR 20200031265A
Authority
KR
South Korea
Prior art keywords
model
depression
brain
early diagnosis
indicator
Prior art date
Application number
KR1020180110050A
Other languages
Korean (ko)
Other versions
KR102245353B1 (en
Inventor
이상완
허수연
신재훈
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020180110050A priority Critical patent/KR102245353B1/en
Publication of KR20200031265A publication Critical patent/KR20200031265A/en
Application granted granted Critical
Publication of KR102245353B1 publication Critical patent/KR102245353B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Psychiatry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Surgery (AREA)
  • Artificial Intelligence (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Social Psychology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Hospice & Palliative Care (AREA)
  • Educational Technology (AREA)
  • Developmental Disabilities (AREA)
  • Child & Adolescent Psychology (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Psychology (AREA)
  • Physiology (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Image Analysis (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

Provided are a method for early diagnosing depression and an apparatus thereof. According to the present invention, the method for early diagnosing depression comprises the steps of: generating a behavioral indicator for early diagnosing depression by collecting behavioral data while a user is performing a decision-making task based on reinforcement learning; analyzing a task performance strategy through a calculation model by using the behavioral data of a user that is collected while performing the task and generating a model-based indicator for early diagnosing depression; analyzing a brain image acquired while performing the task by using the model-based indicator and generating a brain area information amount indicator for early diagnosing depression; analyzing brain connectivity by using the brain area information amount indicator and generating a brain connectivity indicator for early diagnosing depression; and learning the indicators based on machine learning to generate a predictive model for early diagnosing depression.

Description

우울증 조기 진단 방법 및 장치{Method and apparatus for early diagnosis of depression}Method and apparatus for early diagnosis of depression

본 발명은 강화학습 기반의 의사결정 과제 수행 동안의 개인의 과제 수행 전략을 계산 모델을 이용하여 파악하고, 이를 기반으로 개인의 내제된 학습 전략, 학습 신호 및 뇌 영상 신호를 분석하여 우울증을 조기에 진단할 수 있는 방법 및 장치에 관한 것이다.The present invention grasps an individual's task execution strategy during execution of reinforcement learning-based decision making tasks using a computational model, and analyzes an individual's internal learning strategy, learning signal, and brain image signal based on the analysis to prematurely depress depression. It relates to a method and apparatus for diagnosis.

도파민은 모델-프리 학습 및 모델-기반 학습 모두에 필수적이다. 이전의 많은 연구들은 RPE 유도에 있어서의 도파민 역할을 보고하며(Schultz W 등, 1997; Hollerman 등, 1998), 최근 연구는 연상 학습에 있어서 도파민의 필수적인 역할을 시사하는데(Sharpe MJ 등, 2017), 이는 SPE 표현에 대한 도파민의 관여를 의미한다. 그러나, 우울증은 감소된 도파민 수치가 특징이므로(Dunlop 및 Nemeroff 2007; Malhi 및 Berk 2007) 모델-프리 시스템(model-free system)과 모델-기반 시스템(model-based system) 모두를 학습하는 데 장애가 될 수 있다. 실제로 많은 연구에서, 다양한 실험 조건 하에서 우울증이 있으면 무딘 RPE가 발견되었다(Pavlovian learning: Kumar 등, 2008, instrumental learning: Gradin 등, 2011; Dombrovski 등, 2013; Bettina 등, 2015; Rothkirch 등, 2017; Kumar 등, 2018). 이전의 RPE 부족과 일관되게, 본 발명에서는 SPE 표현에 대한 우울증 영향을 더 제안한다.Dopamine is essential for both model-free learning and model-based learning. Many previous studies report the role of dopamine in RPE induction (Schultz W et al., 1997; Hollerman et al., 1998), and recent studies suggest an essential role of dopamine in associative learning (Sharpe MJ et al., 2017). This means dopamine's involvement in SPE expression. However, depression is characterized by reduced dopamine levels (Dunlop and Nemeroff 2007; Malhi and Berk 2007), and thus will be a barrier to learning both model-free systems and model-based systems. You can. Indeed, in many studies, dull RPE was found with depression under various experimental conditions (Pavlovian learning: Kumar et al., 2008, instrumental learning: Gradin et al., 2011; Dombrovski et al., 2013; Bettina et al., 2015; Rothkirch et al., 2017; Kumar Et al., 2018). Consistent with previous RPE deficiencies, the present invention further suggests a depressive effect on SPE expression.

중재 과정과 관련된 뇌 영역 중 하나 인 FPC(Lee 등, 2014)는 사람들이 우울해짐에 따라 최대 신뢰성 신호(max reliability signal)에 대한 응답이 점차 감소함을 보여준다. 이는 우울한 사람들이 모델-기반 시스템(model-based system) 및 모델-프리 시스템(model-free system)에서 계산되는 신뢰성들을 비교하는 능력을 상실한다는 것을 나타낸다.One of the brain regions associated with the intervention process, FPC (Lee et al., 2014), shows that the response to the maximum reliability signal gradually decreases as people become depressed. This indicates that depressed people lose the ability to compare the reliability calculated in a model-based system and a model-free system.

또한, 우울증이 있으면 중재 시스템이 모델-프리 시스템에 민감해진다는 것을 확인한다. 모델-프리 신뢰성의 업데이트 속도를 제어하는 모델 파라미터 중 하나는 우울증 수치와 양의 상관 관계가 있는데, 이는 모델-프리 시스템의 신뢰성이 현재 관찰을 기반으로 극적으로 변한다는 것을 의미한다. 이것은 모델-프리 시스템의 학습이 모델-기반 시스템의 학습에 비해 우울증이 있으면 민감해진다는 하나의 지표이다. 또한, MVPA 분석에 따르면 우울 그룹은 양측 ilPFC 및 FPC에서 모델-프리 신뢰성 신호의 변화를 더 잘 예측한다고 한다. 모델 파라미터 연구 결과와 일관되게, 이 결과는 중재 과정과 관련된 뇌 영역이 모델-프리 시스템에 민감하게 반응함을 의미한다. It also confirms that with depression, the intervention system becomes sensitive to the model-free system. One of the model parameters that control the rate of update of model-free reliability is positively correlated with depression levels, which means that the reliability of the model-free system changes dramatically based on current observations. This is one indicator that learning in a model-free system becomes more sensitive to depression when compared to learning in a model-based system. In addition, the MVPA analysis suggests that the depressed group better predicts changes in model-free reliability signals in bilateral ilPFC and FPC. Consistent with the model parameter study results, these results indicate that the brain regions involved in the intervention process are sensitive to the model-free system.

본 발명이 이루고자 하는 기술적 과제는 강화학습 기반의 의사결정 과제 수행 동안의 개인의 과제 수행 전략을 계산 모델을 이용하여 파악하고, 이를 기반으로 개인의 내제된 학습 전략, 학습 신호 및 뇌 영상 신호를 분석하여 우울증을 조기에 진단할 수 있는 시스템을 제안하고자 한다.The technical task to be achieved by the present invention is to identify an individual's task execution strategy during execution of a reinforcement learning-based decision task using a calculation model, and analyze an individual's internal learning strategy, learning signal, and brain image signal based on this. Therefore, I would like to propose a system that can diagnose depression early.

일 측면에 있어서, 본 발명에서 제안하는 우울증 조기 진단 방법은 사용자가 강화학습 기반의 의사결정 과제 수행하는 동안 행동 데이터를 수집하여 우울증 조기 진단을 위한 행동 지표를 생성하는 단계; 상기 과제 수행 동안 수집된 사용자의 행동 데이터를 이용하여 계산 모델을 통해 과제 수행 전략을 분석하고, 우울증 조기 진단을 위한 모델기반 지표를 생성하는 단계; 상기 과제 수행 동안 획득한 뇌 영상을 상기 모델기반 지표를 이용하여 분석하고, 우울증 조기 진단을 위한 뇌영역 정보량 지표를 생성하는 단계; 상기 뇌영역 정보량 지표를 이용하여 뇌 연결성을 분석하고, 우울증 조기 진단을 위한 뇌 연결성 지표를 생성하는 단계; 및 상기 지표들을 기계학습 기반 으로 학습하여, 우울증 조기 진단을 위한 예측 모델을 생성하는 단계를 포함한다. In one aspect, the method for early diagnosis of depression proposed in the present invention comprises: generating behavioral indicators for early diagnosis of depression by collecting behavioral data while a user performs a decision task based on reinforcement learning; Analyzing a task performance strategy through a calculation model using the user's behavior data collected during the task performance, and generating a model-based indicator for early diagnosis of depression; Analyzing brain images obtained during the task using the model-based indicator and generating a brain region information amount indicator for early diagnosis of depression; Analyzing brain connectivity using the brain region information amount indicator and generating a brain connectivity indicator for early diagnosis of depression; And learning the indicators based on machine learning to generate a predictive model for early diagnosis of depression.

상기 과제 수행 동안 수집된 사용자의 행동 데이터를 이용하여 계산 모델을 통해 과제 수행 전략을 분석하고, 우울증 조기 진단을 위한 모델기반 지표를 생성하는 단계는 의사 결정에 대한 모델-기반의 영향 및 모델-프리의 영향을 구분하고, 모델-기반 시스템과 모델-프리 시스템의 통합을 설명하는 모델을 기반으로 하며, 상기 모델은 평가, 중재, 행동 선택을 포함하는 과정으로 구성된다. Analyzing the task performance strategy through a computational model using the user's behavior data collected during the task performance, and generating a model-based indicator for early diagnosis of depression include model-based impact and model-free for decision making It is based on a model that distinguishes the effects of, and describes the integration of a model-based system with a model-free system.

평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-기반 시스템은 전방향(FORWARD) 학습 알고리즘을 사용하여 상태 예측 오차(State Prediction Error; SPE)로 상태 전이 확률을 학습하고, 역방향(BACKWARD) 알고리즘으로 행동 값을 계산한다. In the evaluation phase, the model-based system and the model-free system learn behavioral values in a given state, and the model-based system uses the FORWARD learning algorithm to state the state prediction error (SPE). It learns the probability of transition and calculates the action value using the backward algorithm.

평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-프리 시스템은 SARSA 알고리즘을 사용하여 보상 예측 오차(Reward Prediction Error; RPE)로 상태-행동 값을 학습한다. In the evaluation phase, the model-based system and the model-free system learn the behavior values in a given state, and the model-free system uses the SARSA algorithm to learn the state-behavior values with the Reward Prediction Error (RPE). do.

중재 과정에서, 모델-기반 시스템이 신뢰성을 업데이트하기 위해 SPE의 이력을 사용하여 계층화된 경험적 베이즈 방법을 구현한다. In the mediation process, the model-based system uses the history of the SPE to update the reliability to implement a layered empirical Bayes method.

중재 과정에서, 모델-프리 시스템은 부호 없는 RPE를 기반으로 하는 피어스-홀(Pearce-Hall) 연관성 규칙(associability rule)을 사용하여 신뢰성을 업데이트한다. In the arbitration process, the model-free system updates reliability using a Peer-Hall association rule based on an unsigned RPE.

행동 선택 단계에서, 소프트맥스(softmax) 규칙을 사용하여 확률론적으로 행동을 선택한다. In the action selection step, the action is probabilistically selected using softmax rules.

상기 과제 수행 동안 획득한 뇌 영상을 상기 모델기반 지표를 이용하여 분석하고, 우울증 조기 진단을 위한 뇌영역 정보량 지표를 생성하는 단계는, 뇌 영상을 수집하여 T1 평형 영향(T1 equilibrium effects)을 감소시키기 위해 첫 두 개의 볼륨을 제거하고, EPI 영상은 슬라이스 타이밍(slice timing)과 모션 움직임(motion movement)을 위해 수정하고, SPM 소프트웨어가 제공한 표준 템플릿 영상으로 부분적 정규화한다. Analyzing the brain image obtained during the task using the model-based indicator, and generating a brain region information amount indicator for early diagnosis of depression, collecting brain images to reduce T1 equilibrium effects In order to remove the first two volumes, the EPI image is modified for slice timing and motion movement, and partially normalized to the standard template image provided by the SPM software.

일반 선형 모델 분석(general linear model analysis; GLM)을 이용하여 뇌 영상을 분석하고, 피실험자-특정 값 신호 및 중재 신호는 중재 모델로 계산되며 신호는 epi 영상에서 복셀-관련 신호와 비교되고, 리그레서(Regressor)의 순서는 모델-기반 시스템의 예측 오차 및 모델-프리 시스템의 예측 오차, 신뢰성 비교 신호, 모델-기반 시스템의 선택 값, 모델-프리 시스템의 선택 값, 선택된 통합 값과 선택되지 않은 통합 값 간의 차이 및 선택된 동작을 고를 가능성의 순서를 따르고, 리그레서는 결과 해석 시 리그레서 순서의 영향을 제거하기 위해 GLM 분석에서 순차적으로 비-직교화된다. Brain images are analyzed using general linear model analysis (GLM), subject-specific value signals and mediation signals are calculated as mediation models, and signals are compared to voxel-related signals in epi images, and regressors The order of (Regressor) is the prediction error of the model-based system and the prediction error of the model-free system, the reliability comparison signal, the selected value of the model-based system, the selected value of the model-free system, the selected integrated value and the unselected integration. The difference between the values and the order of likelihood of choosing a selected action is followed, and the ligase is sequentially non-orthogonalized in the GLM analysis to eliminate the effect of the ligencer sequence when interpreting the results.

멀티복셀 패턴 분석(Multivoxel Pattern Analysis; MVPA)을 이용하여 뇌 영상을 분석하고, 특정 관심 영역(Region Of Interest; ROI)에서 다양한 중재 신호 처리를 이해하기 위해 수행되고, 중재 과정에 관여된다고 알려진 3가지의 ROI인 좌/우 하외측 전전두엽피질(inferior lateral prefrontal cortex; ilPFC) 및 전두극 전전두엽 피질(Frontopolar Prefrontal Cortex; FPC)이 선택되며, 각 뇌 영역의 마스크들은 GLM 분석을 통해 기능적으로 정의된다. 중재 신호에 관련된 신뢰성 신호들은 피실험자들이 예측 오차를 경험할 때 업데이트되고, 현재 자극 표현에서 다음 자극 및 보상 표현까지 촬영된 모든 epi 스캔들은 현재 표현으로부터 신뢰성 신호를 인코딩하기 위해 나타난다고 가정하며, 각 신뢰성 신호에서, 각 피실험자의 상위 일정 비율의 최고 활성 신호 및 하위 일정 비율의 최저 신호 값이 분석에 사용되고, 이진 지원 벡터 머신 분류기가 복셀의 특징을 학습하기 위해 적용되어 마스크 내 모든 복셀들이 학습을 위해 사용된다. Analyzing brain images using Multivoxel Pattern Analysis (MVPA), three things known to be involved in the mediation process, performed to understand various mediation signal processing in a region of interest (ROI) Inferior lateral prefrontal cortex (ilPFC) and Frontopolar Prefrontal Cortex (FPC), which are the ROIs of, are selected, and the masks of each brain region are functionally defined through GLM analysis. Reliability signals related to the mediation signal are updated when subjects experience prediction errors, and it is assumed that all epi scans taken from the current stimulus representation to the next stimulus and compensation representation appear to encode the reliability signal from the current representation, and each reliability signal In, the highest active signal of the highest percentage of each subject and the lowest signal value of the lowest percentage of each subject are used for analysis, and a binary-assisted vector machine classifier is applied to learn the characteristics of voxels, so that all voxels in the mask are used for learning. .

상기 뇌영역 정보량 지표를 이용하여 뇌 연결성을 분석하고, 우울증 조기 진단을 위한 뇌 연결성 지표를 생성하는 단계는, 역동적 인과관계 모델링(Dynamic Causal Modeling; DCM) 방법을 활용하여 피험자들의 과제 수행 동안의 뇌 영역간 연결성 변화를 관찰하였다. 분석에 사용된 뇌 영역은 양측 ilPFC, FPC, vmPFC, mPFC, putamen (Lee 등, 2014)이다. Analyzing brain connectivity using the brain region information level indicator and generating brain connectivity indicators for early diagnosis of depression include using a dynamic causal modeling (DCM) method to perform the brains of subjects during task performance Changes in connectivity between regions were observed. The brain regions used for the analysis are bilateral ilPFC, FPC, vmPFC, mPFC, and putamen (Lee et al., 2014).

또 다른 일 측면에 있어서, 본 발명에서 제안하는 우울증 조기 진단 장치는 사용자가 강화학습 기반의 의사결정 과제 수행하는 동안 행동 데이터를 수집하여 우울증 조기 진단을 위한 행동 지표를 생성하는 행동 지표 생성부; 상기 과제 수행 동안 수집된 사용자의 행동 데이터를 이용하여 계산 모델을 통해 과제 수행 전략을 분석하고, 우울증 조기 진단을 위한 모델기반 지표를 생성하는 모델기반 지표 생성부; 상기 과제 수행 동안 획득한 뇌 영상을 상기 모델기반 지표를 이용하여 분석하고, 우울증 조기 진단을 위한 뇌영역 정보량 지표를 생성하는 뇌영역 정보량 지표 생성부; 상기 뇌영역 정보량 지표를 이용하여 뇌 연결성을 분석하고, 우울증 조기 진단을 위한 뇌 연결성 지표를 생성하는 뇌 연결성 지표 생성부; 및 상기 지표들을 기계학습 기반 으로 학습하여, 우울증 조기 진단을 위한 예측 모델을 생성하는 우울증 진단 모델링부를 포함한다. In another aspect, the apparatus for early diagnosis of depression proposed in the present invention includes a behavior indicator generating unit that collects behavior data while a user performs a decision task based on reinforcement learning to generate behavior indicators for early diagnosis of depression; A model-based index generator that analyzes a task performance strategy through a computational model using the user's behavior data collected during the task performance and generates a model-based index for early diagnosis of depression; A brain region information amount indicator generating unit for analyzing brain images obtained during the task using the model-based indicator and generating a brain region information amount indicator for early diagnosis of depression; A brain connectivity index generator for analyzing brain connectivity using the brain region information level indicator and generating a brain connectivity indicator for early diagnosis of depression; And a depression diagnosis modeling unit for learning the indicators based on machine learning to generate a predictive model for early diagnosis of depression.

본 발명의 실시예들에 따르면 과제 수행의 결과로 드러나는 개인의 행동 성향 및 이를 계산 모델로 분석한 개인의 학습 신호를 기반으로 우울증과 관련 있는 변수들을 확인하고, 과제 수행 동안 획득한 뇌 영상을 모델 기반으로 분석하여 우울증 조기 진단을 위한 뇌 영상 지표 및 연결성 지표를 발견하고, 추가적으로 뇌 영상을 머신러닝 기법으로 분석하여 우울증 조기 진단을 위한 뇌 신호 처리 지표를 찾아낼 수 있다. 발견된 지표들을 기계학습 기반으로 학습하여, 우울증 예측 모델을 생성할 수 있다.According to embodiments of the present invention, variables related to depression are identified based on an individual's behavioral tendency revealed as a result of task performance and an individual's learning signal analyzed by a calculation model, and a brain image obtained during task execution is modeled Based on the analysis, it is possible to find brain image indicators and connectivity indicators for early diagnosis of depression, and additionally, brain images can be analyzed by machine learning to find brain signal processing indicators for early diagnosis of depression. The discovered indicators can be learned based on machine learning to generate a depression prediction model.

도 1은 본 발명의 일 실시예에 따른 우울증 조기 진단 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 과제 구조를 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 행동 결과를 나타내는 그래프이다.
도 4는 본 발명의 일 실시예에 따른 모델 선택을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 계산 신호에 대한 신경 상관물을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 뇌 영역간의 정보 전달 연결성을 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따른 우울증 조기 진단 장치의 구조를 나타내는 도면이다.
도 8은 본 발명의 일 실시예에 따른 예측 오차 표현에 대한 우울증의 영향을 나타내는 도면이다.
도 9는 본 발명의 일 실시예에 따른 중재 시스템에 대한 우울증의 영향을 나타내는 도면이다.
1 is a flowchart illustrating a method for early diagnosis of depression according to an embodiment of the present invention.
2 is a view for explaining the subject structure according to an embodiment of the present invention.
3 is a graph showing behavioral results according to an embodiment of the present invention.
4 is a diagram for explaining model selection according to an embodiment of the present invention.
5 is a diagram for explaining a neural correlator for a calculated signal according to an embodiment of the present invention.
6 is a view for explaining information transfer connectivity between brain regions according to an embodiment of the present invention.
7 is a view showing the structure of an apparatus for early diagnosis of depression according to an embodiment of the present invention.
8 is a view showing the effect of depression on the prediction error expression according to an embodiment of the present invention.
9 is a view showing the effect of depression on the intervention system according to an embodiment of the present invention.

예측 오차 표현(Prediction Error Representation)에 대한 우울증의 영향에 있어서, 본 발명의 일 실시예에 따라 구별되는 두 가지 유형의 예측 오차인 SPE와 RPE가 우울증이 있는 뇌에서 비정상적으로 나타남을 발견했다. 신경 분석 결과, 우울증이 있으면 좌측 뇌섬엽(left insula)에서 SPE 신호가 약화되었고 양측 미상(bilateral caudate)에서 RPE가 감소했다. 또한, 무딘 신호(blunted signal) 표현의 정도는 우울 증상과 상당한 상관 관계가 있다.In the effect of depression on the prediction error representation, it was found that two types of prediction errors, SPE and RPE, which are distinguished according to an embodiment of the present invention, appear abnormally in a depressed brain. As a result of the neuroanalysis, the presence of depression weakened the SPE signal in the left insula and decreased RPE in the bilateral caudate. In addition, the degree of blunted signal expression correlates significantly with depressive symptoms.

중재 시스템(Arbitration system)에 대한 우울증의 영향에 있어서, 중재 시스템에 대한 부적응적 통제(maladaptive control)를 암시한다. 중재 과정과 관련된 뇌 영역 중 하나 인 FPC(Lee et al., 2014)는 사람들이 우울해짐에 따라 최대 신뢰성 신호(max reliability signal)에 대한 응답이 점차 감소함을 보여준다. 이는 우울한 사람들이 모델-기반 시스템(model-based system) 및 모델-프리 시스템(model-free system)에서 계산되는 신뢰성들을 비교하는 능력을 상실한다는 것을 나타낸다.In the effect of depression on the arbitration system, it implies maladaptive control of the intervention system. FPC (Lee et al., 2014), one of the brain regions involved in the intervention process, shows that the response to the maximum reliability signal gradually decreases as people become depressed. This indicates that depressed people lose the ability to compare the reliability calculated in a model-based system and a model-free system.

우울증이 판단-행동 변환(Valuation-Action Translation)에 미치는 영향에 있어서, 우울증은 차선의 행동 선택(sub-optimal action selection)을 수반한다. 계산 모델은 MB 계획(MB strategy)에서 활용(exploitation)을 결정하는 모델 파라미터가 우울증 수치와 반비례 관계가 있음을 보여주는데, 이는 우울한 사람들은 특히 모델-프리 시스템에 치우친 경우, 탐색 결정(exploratory decisions)을 내리는 경향이 있음을 나타낸다. 이는 우울증이 있는 경우에 선택의 일관성이 감소한다는 행동 경향을 설명한다.In terms of how depression affects judgment-action translation, depression entails sub-optimal action selection. The computational model shows that model parameters that determine exploitation in MB strategy are inversely related to depression levels, which makes exploratory decisions particularly for depressed people, especially when biased toward model-free systems. Indicates a tendency to fall. This explains the behavioral tendency that the consistency of choice decreases in the presence of depression.

우울증이 있는 경우 두 가지의 반대되는 선택 일관성 행동을 설명할 수 있다(Beever 등, 2013; Blanco 등, 2013). Beever 등 (2013)은 일반 그룹과 우울 그룹 간에 보상 최대화 상황에서 탐색 패턴에 유의미한 차이가 없음을 발견했다. 반면, Blanco 등(2013)은 우울 집단이 더 많이 탐색하려는 경향이 있음을 시사한다. 이러한 충돌이 서로 다른 과제 구조(task structure)에서 비롯된 것이라고 생각한다. Beever의 연구는 사람들이 모델-프리 시스템에 의존하여 과제를 수행할 수 있도록 상대적으로 정적인 최적 정책을 사용했다. 그러나, Blanco가 사용한 보상 구조에서는 최적 정책의 변경이 더 빈번히 발생했기 때문에, 사람들은 적절한 의사 결정을 내리기 위해 모델-기반 시스템 및 모델-프리 시스템을 모두 사용해야 한다. 모델 파라미터의 관점에서, Blanco의 과제는 모델-기반 시스템을 더 필요로 하기 때문에, 행동 선택 과정에서 MB 계획의 활용도의 기여가 더 높아 우울 그룹의 활용 수치가 낮아 지므로, 결국 더 탐색적인 행동 선택을 유발한다In the presence of depression, two opposite choice coherence behaviors can be explained (Beever et al., 2013; Blanco et al., 2013). Beever et al. (2013) found that there was no significant difference in the search pattern in the situation of maximizing compensation between the general and depressed groups. On the other hand, Blanco et al. (2013) suggest that depressed groups tend to explore more. I think these conflicts originated from different task structures. Beever's study used a relatively static optimal policy to enable people to rely on a model-free system to accomplish their tasks. However, in the compensation structure used by Blanco, changes to the optimal policy occur more frequently, so people must use both model-based systems and model-free systems to make appropriate decisions. In terms of model parameters, Blanco's task requires more model-based systems, so the contribution of utilization of the MB plan in the behavior selection process is higher, resulting in lower utilization of the depressed group, resulting in more exploratory behavior choices. cause

우울증이 있으면 STG 반응이 더 높다는 신경계통의 결과 또한 상기 연구 결과를 뒷받침한다. 이전 연구는 사람들이 행동을 유지하고 있기 보다는 그들의 행동을 바꿀 때 STG 반응이 증가하고 제시했다(Paulus 등, 2005). 우울한 사람들은 더 작은 활용 파라미터로 인해 그들의 행동을 바꾸기 때문에, 그들은 불규칙적인 선택을 하는 경향이 더 많고, 이는 더 높은 STG 반응을 야기한다. The findings of the nervous system that the depression has a higher STG response also support the findings. Previous studies have suggested that STG responses increase and increase when people change their behavior rather than maintaining their behavior (Paulus et al., 2005). Depressed people tend to make irregular choices because they change their behavior due to smaller utilization parameters, which leads to a higher STG response.

활용도 감소 또한 우울증이 있을 시의 보상 감도 감소와 일치한다. 보상 감도의 관점에서 활용 파라미터를 고려하면(Huys 등, 2013), 작은 활용 파라미터는 모든 행동에 대해 유사한 확률을 부여하며, 이는 보상에 대한 민감도가 더 낮음을 나타낸다. 이전 연구는 우울증이 있을 때 보상 과정에서의 보상 감도 감소를 보고했으며(Steele 등 2007; Chen 등 2015; Alloy 등 2016), 나아가 특히 모델-기반 시스템이 매우 활성화된 경우에 이 경향이 발생한다는 것을 제안한다.Reduced utilization is also consistent with reduced compensation sensitivity in the event of depression. When considering utilization parameters in terms of compensation sensitivity (Huys et al., 2013), small utilization parameters give similar probabilities for all actions, indicating that the sensitivity to compensation is lower. Previous studies have reported a reduction in compensatory sensitivity in the compensation process in the presence of depression (Steele et al. 2007; Chen et al. 2015; Alloy et al. 2016), and further suggest that this tendency occurs, especially when model-based systems are very active do.

본 발명에서 제안하는 우울증 조기 진단 시스템 및 방법은 인간의 의사 결정에서 동적인 탐색-활용 간 절충 경향을 설명할 수 있는, 확장된 중재 모델을 발견하는 데 기여한다. 제안하는 모델을 기반으로, 강화 학습 과정의 여러 단계에 미치는 우울증의 영향을 특징 짓는다. 수치 계산 과정에서, 모델-기반 시스템 및 모델-프리 시스템은 각각 신경 상관물인 뇌섬엽(insula) 및 미상(caudate) 내 예측 오차 신호 표현이 감소하는 것을 보인다. 중재 과정에서, 모델-기반 시스템 및 모델-프리 시스템의 비교 신호는 FPC 영역에서 비정상적으로 나타났다. 또한, 중재 과정과 관련 있는 영역들인 양측(bilateral) ilPFC 및 FPC는 우울증이 있을 때 모델-프리 시스템에 더 민감해졌다. 이러한 결과는 우울증이 있을 때 두 시스템 간의 적절한 균형이 깨진다는 것을 내포한다. 마지막으로, 행동 선택 단계에서, 특히 모델-기반 시스템이 지배적인 경우 내부 모델은 탐색적 의사 결정을 유발하기 때문에 우울한 사람들은 최적 정책을 선택하는 데 어려움을 겪는다. 이 탐색적 의사 결정은 STG 내 증가된 활성화와 관계가 있다.The system and method for early diagnosis of depression proposed in the present invention contributes to discovering an extended intervention model that can explain the dynamic search-utilization liver tendency in human decision making. Based on the proposed model, the effects of depression on different stages of the reinforcement learning process are characterized. In the numerical calculation process, the model-based system and the model-free system show that the prediction error signal expression in the neurocorrelates, the insula and the caudate, respectively, decreases. During the intervention process, the comparison signals of the model-based system and the model-free system appeared abnormally in the FPC region. In addition, the areas involved in the intervention process, bilateral ilPFC and FPC, became more sensitive to model-free systems in the presence of depression. These results imply that when there is depression, the proper balance between the two systems is broken. Finally, in the behavioral selection phase, depressed people have a hard time choosing the best policy because internal models drive exploratory decision making, especially when model-based systems dominate. This exploratory decision is related to increased activation in the STG.

상기 연구 결과는 우울증이 있을 때 모델-기반 분열(disruption)과 모델-프리 분열을 모두 설명할 수 있다. 이 패러다임은 중독(Lucantonio 등, 2014) 및 충동(Voon 등, 2014)처럼 강화 시스템 간의 부적절한 균형을 보이는 다른 정신 질환에도 적용될 수 있다.The results of this study can explain both model-based disruption and model-free division in the presence of depression. This paradigm can also be applied to other mental disorders that show an improper balance between strengthening systems, such as addiction (Lucantonio et al., 2014) and impulse (Voon et al., 2014).

현재 연구는 다양한 임상적인 적용이 가능하다. 첫 번째, 본 결과는 기존의 뇌심부자극술이나 반복 경두개자기자극술이 우울증 치료에 왜 효과적인지에 대한 근거를 제시한다. 두 번째, MDD의 발병 시기가 대략 25세에서 45세인 것을 감안하면(Kessler 등, 2007), 본 연구의 연구 참여자의 평균 연령이 상대적으로 어리기 때문에(22.8세), 우울증을 조기에 진단할 수 있는 가능성을 보였다. 마지막으로, 본 연구의 결과는 증가된 보상예측신호를 완화시킬 수 있는 치료법으로 우울증의 증상을 완화시킬 수 있음을 시사한다. The current study is applicable to a variety of clinical applications. First, this result provides a basis for why conventional deep brain stimulation or repeated transcranial magnetic stimulation is effective in treating depression. Second, considering that the onset of MDD is approximately 25 to 45 years old (Kessler et al., 2007), because the average age of study participants in this study is relatively young (22.8 years old), it is possible to diagnose depression early. Showed the possibility. Lastly, the results of this study suggest that it can alleviate the symptoms of depression as a treatment that can alleviate increased compensatory predictive signals.

도 1은 본 발명의 일 실시예에 따른 우울증 조기 진단 방법을 설명하기 위한 흐름도이다. 1 is a flowchart illustrating a method for early diagnosis of depression according to an embodiment of the present invention.

제안하는 우울증 조기 진단 방법은 사용자가 강화학습 기반의 의사결정 과제 수행하는 동안 행동 데이터를 수집하여 우울증 조기 진단을 위한 행동 지표를 생성하는 단계(110), 상기 과제 수행 동안 수집된 사용자의 행동 데이터를 이용하여 계산 모델을 통해 과제 수행 전략을 분석하고, 우울증 조기 진단을 위한 모델기반 지표를 생성하는 단계(120), 상기 과제 수행 동안 획득한 뇌 영상을 상기 모델기반 지표를 이용하여 분석하고, 우울증 조기 진단을 위한 뇌영역 정보량 지표를 생성하는 단계(130), 상기 뇌영역 정보량 지표를 이용하여 뇌 연결성을 분석하고, 우울증 조기 진단을 위한 뇌 연결성 지표를 생성하는 단계(140) 및 상기 지표들을 기계학습 기반 으로 학습하여, 우울증 조기 진단을 위한 예측 모델을 생성하는 단계(150)를 포함한다. The proposed method for early diagnosis of depression collects behavior data while the user performs a decision task based on reinforcement learning to generate an action indicator for early diagnosis of depression (110), and collects user behavior data collected during the task execution. Analyzing the task performance strategy through the computational model using, generating a model-based indicator for early diagnosis of depression (120), analyzing the brain image obtained during the task using the model-based index, and early depression Generating a brain area information amount indicator for diagnosis (130), analyzing brain connectivity using the brain area information amount indicator, generating a brain connectivity index for early diagnosis of depression (140), and machine learning the indicators Learning based on, and generating a predictive model for early diagnosis of depression (150).

단계(110)에서, 사용자가 강화학습 기반의 의사결정 과제 수행하는 동안 행동 데이터를 수집하여 우울증 조기 진단을 위한 행동 지표를 생성한다. In step 110, the user collects behavioral data while performing a reinforcement learning-based decision-making task to generate behavioral indicators for early diagnosis of depression.

단계(120)에서, 상기 과제 수행 동안 수집된 사용자의 행동 데이터를 이용하여 계산 모델을 통해 과제 수행 전략을 분석하고, 우울증 조기 진단을 위한 모델기반 지표를 생성한다. In step 120, the task performance strategy is analyzed through a computational model using the user's behavior data collected during the task performance, and a model-based indicator for early diagnosis of depression is generated.

의사 결정에 대한 모델-기반의 영향 및 모델-프리의 영향을 구분하고, 모델-기반 시스템과 모델-프리 시스템의 통합을 설명하는 모델을 기반으로 하며, 상기 모델은 평가, 중재, 행동 선택을 포함하는 과정으로 구성된다. It is based on a model that distinguishes model-based and model-free impacts on decision-making and describes the integration of model-based and model-free systems, which include evaluation, intervention, and behavioral selection. It consists of a process.

평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-기반 시스템은 전방향(FORWARD) 학습 알고리즘을 사용하여 상태 예측 오차(State Prediction Error; SPE)로 상태 전이 확률을 학습하고, 역방향(BACKWARD) 알고리즘으로 행동 값을 계산한다. 또한, 평가 단계에서 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-프리 시스템은 SARSA 알고리즘을 사용하여 보상 예측 오차(Reward Prediction Error; RPE)로 상태-행동 값을 학습한다. In the evaluation phase, the model-based system and the model-free system learn behavioral values in a given state, and the model-based system uses the FORWARD learning algorithm to state the state prediction error (SPE). It learns the probability of transition and calculates the action value using the backward algorithm. In addition, in the evaluation step, the model-based system and the model-free system learn behavioral values in a given state, and the model-free system uses the SARSA algorithm to calculate the state-behavior value as a Reward Prediction Error (RPE). To learn.

중재 과정에서, 모델-기반 시스템이 신뢰성을 업데이트하기 위해 SPE의 이력을 사용하여 계층화된 경험적 베이즈 방법을 구현하고, 모델-프리 시스템은 부호 없는 RPE를 기반으로 하는 피어스-홀(Pearce-Hall) 연관성 규칙(associability rule)을 사용하여 신뢰성을 업데이트한다. In the mediation process, the model-based system implements a layered empirical Bayes method using SPE's history to update reliability, and the model-free system is a Pearce-Hall based on an unsigned RPE. Reliability is updated using an association rule.

행동 선택 단계에서, 소프트맥스(softmax) 규칙을 사용하여 확률론적으로 행동을 선택한다. In the action selection step, the action is probabilistically selected using softmax rules.

단계(130)에서 상기 과제 수행 동안 획득한 뇌 영상을 상기 모델기반 지표를 이용하여 분석하고, 우울증 조기 진단을 위한 뇌영역 정보량 지표를 생성한다. 뇌 영상을 수집하여 T1 평형 영향(T1 equilibrium effects)을 감소시키기 위해 첫 두 개의 볼륨을 제거한다. EPI 영상은 슬라이스 타이밍(slice timing)과 모션 움직임(motion movement)을 위해 수정하고, SPM 소프트웨어가 제공한 표준 템플릿 영상으로 부분적 정규화한다. In step 130, the brain image obtained during the task is analyzed using the model-based indicator, and an amount of brain region information for early diagnosis of depression is generated. Brain images are collected to remove the first two volumes to reduce T1 equilibrium effects. EPI images are modified for slice timing and motion movement, and partially normalized with standard template images provided by SPM software.

이때, 일반 선형 모델 분석(general linear model analysis; GLM)을 이용하여 뇌 영상을 분석한다. 피실험자-특정 값 신호 및 중재 신호는 중재 모델로 계산되며 신호는 epi 영상에서 복셀-관련 신호와 비교되고, 리그레서(Regressor)의 순서는 모델-기반 시스템의 예측 오차 및 모델-프리 시스템의 예측 오차, 신뢰성 비교 신호, 모델-기반 시스템의 선택 값, 모델-프리 시스템의 선택 값, 선택된 통합 값과 선택되지 않은 통합 값 간의 차이 및 선택된 동작을 고를 가능성의 순서를 따른다. 리그레서는 결과 해석 시 리그레서 순서의 영향을 제거하기 위해 GLM 분석에서 순차적으로 비-직교화된다. At this time, brain images are analyzed using general linear model analysis (GLM). The subject-specific value signal and the mediation signal are calculated as an arbitration model, and the signal is compared with the voxel-related signal in the epi image, and the order of the regressor is the prediction error of the model-based system and the prediction error of the model-free system. , The reliability comparison signal, the model-based system's selected value, the model-free system's selected value, the difference between the selected integrated value and the unselected integrated value, and the likelihood of choosing the selected action. The ligercers are sequentially non-orthogonalized in the GLM analysis to eliminate the effect of the ligersor order in interpreting the results.

또한, 멀티복셀 패턴 분석(Multivoxel Pattern Analysis; MVPA)을 이용하여 뇌 영상을 분석할 수 있다. 특정 관심 영역(Region Of Interest; ROI)에서 다양한 중재 신호 처리를 이해하기 위해 수행되고, 중재 과정에 관여된다고 알려진 3가지의 ROI인 좌/우 하외측 전전두엽피질(inferior lateral prefrontal cortex; ilPFC) 및 전두극 전전두엽 피질(Frontopolar Prefrontal Cortex; FPC)이 선택되며, 각 뇌 영역의 마스크들은 GLM 분석을 통해 기능적으로 정의된다. 신뢰성 관련 신호들은 피실험자들이 예측 오차를 경험할 때 업데이트되고, 현재 자극 표현에서 다음 자극 및 보상 표현까지 촬영된 모든 epi 스캔들은 현재 표현으로부터 신뢰성 신호를 인코딩하기 위해 나타난다고 가정한다. 각 신뢰성 신호에서, 각 피실험자의 상위 일정 비율의 최고 활성 신호 및 하위 일정 비율의 최저 신호 값이 분석에 사용되고, 이진 지원 벡터 머신 분류기가 복셀의 특징을 학습하기 위해 적용되어 마스크 내 모든 복셀들이 학습을 위해 사용된다. In addition, brain images may be analyzed using Multivoxel Pattern Analysis (MVPA). It is performed to understand the processing of various mediation signals in a region of interest (ROI), and the three ROIs known to be involved in the mediation process, the inferior lateral prefrontal cortex (ilPFC) and the frontal region The frontal prefrontal cortex (FPC) is selected, and the masks of each brain region are functionally defined through GLM analysis. It is assumed that the reliability-related signals are updated when subjects experience a prediction error, and all epi scans taken from the current stimulus representation to the next stimulus and compensation representation appear to encode the reliability signal from the current representation. In each reliability signal, the highest active signal of the highest percentage of each subject and the lowest signal value of the lowest percentage of each subject are used for analysis, and a binary-assisted vector machine classifier is applied to learn the characteristics of voxels so that all voxels in the mask are trained. Used for

단계(140)에서 상기 뇌영역 정보량 지표를 이용하여 뇌 연결성을 분석하고, 우울증 조기 진단을 위한 뇌 연결성 지표를 생성한다. 우울증 조기 진단을 위한 뇌 연결성 지표를 생성하는 단계는, 역동적 인과관계 모델링(Dynamic Causal Modeling; DCM) 방법을 활용하여 피험자들의 과제 수행 동안의 뇌 영역간 연결성 변화를 관찰하였다. 분석에 사용된 뇌 영역은 양측 ilPFC, FPC, vmPFC, mPFC, putamen (Lee 등, 2014)이다. In step 140, brain connectivity is analyzed using the brain region information amount indicator, and brain connectivity indicators for early diagnosis of depression are generated. In the step of generating a brain connectivity index for early diagnosis of depression, the dynamic causal modeling (DCM) method was used to observe changes in connectivity between brain regions during subjects' task performance. The brain regions used for the analysis are bilateral ilPFC, FPC, vmPFC, mPFC, and putamen (Lee et al., 2014).

단계(150)에서, 상기 지표들을 기계학습 기반 으로 학습하여, 우울증 조기 진단을 위한 예측 모델을 생성한다. In step 150, the indicators are learned based on machine learning to generate a predictive model for early diagnosis of depression.

도 2는 본 발명의 일 실시예에 따른 과제 구조를 설명하기 위한 도면이다. 2 is a view for explaining the subject structure according to an embodiment of the present invention.

본 발명의 실시예에 따르면, 65명의 오른손잡이 한국인들(여성 28명, 평균 나이 22.8±3.8세)이 연구에 참여했다. 참여자들은 온라인 공고를 통해 지역 사회에서 모집되었다. 오직 28명의 피실험자만이 과제를 하는 동안 fMRI(Functional magnetic resonance imaging) 스캔을 받았다. 전체 누적 보상이 추측-단계(chance-level)(10,000개의 랜덤 시뮬레이션을 사용한 보상의 평균 값) 이하인 두 명의 피실험자는 분석에서 제외되었다. 따라서, 총 63개의 행동 데이터 및 28개의 fMRI 데이터가 분석용으로 남았다. 개인의 우울증 수준을 얻기 위하여, 사람들은 실험전에 CES-D(Center for Epidemiologic Studies Depression) 설문지(Radloff, 1977)를 완성하도록 지시 받았다(참여자들의 우울증 심각성 분포를 위한 것). 신경 정신 질환의 병력을 갖고 있는 피실험자는 없었다. 모든 피실험자들은 KAIST(Korea Advanced Institute of Science and Technology)의 IRB(Institutional Review Board)가 승인한 실험 규정에 대한 서면 동의를 제공했다.According to an embodiment of the present invention, 65 right-handed Koreans (28 women, average age 22.8 ± 3.8 years) participated in the study. Participants were recruited from the community through online announcements. Only 28 subjects underwent functional magnetic resonance imaging (fMRI) scans during the assignment. Two subjects whose total cumulative compensation was below the guess-level (average value of compensation using 10,000 random simulations) were excluded from the analysis. Thus, a total of 63 behavioral data and 28 fMRI data remained for analysis. To obtain an individual's level of depression, people were instructed to complete the Center for Epidemiologic Studies Depression (CES-D) questionnaire (Radloff, 1977) prior to the experiment (for the distribution of depression severity among participants). No subject had a history of neuropsychiatric disorders. All subjects provided written consent to the experimental rules approved by the Institutional Review Board (IRB) of the Korea Advanced Institute of Science and Technology (KAIST).

도 2a와 같아, 순차적인 2단계의 Markov 판단 과제(sequential two-stage Markov decision task)(Lee 등 2014)는 모델-기반 계획과 모델-프리 계획을 분리하기 위해 제안되었다. 이 과제에서, 피실험자들은 이원 선택(왼쪽 또는 오른쪽 중 하나)을 하고 나서 특정 확률로 다른 단계로 진행한다. 다음 단계가 스크린에 나타나면, 참여자들은 또 다른 판단을 한다. 두 가지 순차적인 판단을 한 후에, 코인이 전달되는 마지막 단계에 도달한다. 피실험자들은 과제의 구조를 학습하기 위해 학습 전 세션에서 100개의 시험(trials)을 수행한다. 평균적으로 80개의 시험을 갖는 4개의 메인 세션들이 학습-전 세션에 뒤이어 등장한다. 참여자들은 메인 세션에서 최대한 많은 코인을 취하도록 권고 받았다. As shown in FIG. 2A, a sequential two-stage Markov decision task (Lee et al. 2014) was proposed to separate the model-based plan from the model-free plan. In this task, the subjects make a binary selection (either left or right) and then proceed to another step with a certain probability. When the next step appears on the screen, the participants make another judgment. After making two sequential judgments, the final stage of coin delivery is reached. Subjects performed 100 trials in the pre-learning session to learn the structure of the task. On average, four main sessions with 80 exams follow the pre-learning session. Participants were encouraged to take as many coins as possible in the main session.

이 과제는 도 2b에 나타낸 바와 같아, 특정-목표 상태(specific-goal condition) 및 유연-목표 상태(flexible-goal condition)로 구분된다. 특정-목표 상태에서, 특정 색깔(빨간색, 파란색, 노란색)을 갖는 박스가 나타나며 피실험자들은 코인 색깔이 특정 박스의 색깔과 동일하면 금전적 보상을 받는다. 그렇지 않으면, 보상이 주어지지 않는다. 반면, 유연-목표 상태에서는, 흰색 박스가 시험 초반에 나타나고 참여자들은 모든 종류의 코인을 얻을 수 있다. As shown in FIG. 2B, this task is divided into a specific-goal condition and a flexible-goal condition. In a specific-target state, a box with a specific color (red, blue, yellow) appears, and subjects are monetarily compensated if the coin color is the same as that of the specific box. Otherwise, no compensation is given. On the other hand, in the flexible-target state, a white box appears at the beginning of the test and participants can get all kinds of coins.

다른 시스템에 대한 하나의 시스템의 계속적인 의존을 방지하기 위하여 두 가지 유형의 상태-전이 확률(state-transition probability)이 환경의 불확실성을 제어하는 데 사용된다. 상태-전이 확률은 불확실성이 높은 환경에서는 (0.5, 0.5), 불확실성이 낮은 상황에서는 (0.9, 0.1)이다.Two types of state-transition probabilities are used to control the uncertainty of the environment to prevent continued dependence of one system on other systems. The state-transition probability is (0.5, 0.5) in high uncertainty environments and (0.9, 0.1) in low uncertainty situations.

요약하면, (i) 불확실성이 높은 환경의 특정-목표 상태, (ii) 불확실성이 낮은 환경의 특정-목표 상태, (iii) 불확실성이 높은 환경의 유연-목표 상태, (iv) 불확실성이 낮은 환경의 유연-목표 상태라는 네 가지 블록이 나타난다. 네 가지 유형의 블록이 무작위 순서로 나오며 각 블록은 4-6 번의 시험 동안 지속된다. 각 시험의 처음에, 참여자들은 박스의 색으로 특정-목표 상태에 있는지 아니면 유연-목표 상태에 있는지를 알 수 있다. 그러나, 환경의 불확실성에 대한 정보는 제공되지 않는다. In summary, (i) the specific-target state of the environment with high uncertainty, (ii) the specific-target state of the environment with low uncertainty, (iii) the flexible-target state of the environment with high uncertainty, and (iv) the environment with low uncertainty. Four blocks appear: flexible-target state. Four types of blocks appear in random order, with each block lasting for 4-6 trials. At the beginning of each test, participants can tell whether they are in a specific-goal or flexible-going state by the color of the box. However, no information on environmental uncertainty is provided.

본 발명에서 채택된 계산적인 가정은 의사 결정에 대한 모델-기반의 영향 및 모델-프리의 영향을 구분하며, 두 시스템의 통합을 설명하는 이전 모델(Lee 등, 2014)을 기반으로 한다. 모델은 평가(valuation), 중재(arbitration), 행동 선택(action selectino)이라는 세 가지 과정으로 구성된다. The computational assumptions adopted in the present invention distinguish between model-based and model-free influences on decision-making, and are based on previous models (Lee et al., 2014) explaining the integration of the two systems. The model consists of three processes: valuation, arbitration, and action selectino.

평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태(state)에서 행동 값(action value)을 학습한다. 모델-기반 시스템은 FORWARD 학습 알고리즘(Glascher 등, 2010)을 사용하여 상태 예측 오차(State Prediction Error)(= 1- 예상 변화 확률, SPE)로 상태 전이 확률을 학습하고, BACKWARD 알고리즘으로 행동 값을 계산한다. 반면에, 모델-프리 시스템은 SARSA 알고리즘(Sutton 및 Barto, 1998)을 사용하여 보상 예측 오차(Reward Prediction Error)(=실제 값 - 기대 값, RPE)로 상태-행동 값(state-action value)을 학습한다.In the evaluation phase, the model-based system and the model-free system learn action values in a given state. The model-based system uses the FORWARD learning algorithm (Glascher et al., 2010) to learn the state transition probability with the State Prediction Error (= 1- expected change probability, SPE), and calculate the behavior value with the BACKWARD algorithm do. On the other hand, the model-free system uses the SARSA algorithm (Sutton and Barto, 1998) to calculate the state-action value with the Reward Prediction Error (= actual value-expected value, RPE). To learn.

중재 과정에서, 모델-기반 시스템이 신뢰성을 업데이트하기 위해 SPE의 이력을 사용하여 계층화된 경험적 베이즈 방법(hierarchical empirical Bayes method)을 구현하는 반면, 모델-프리 시스템은 부호 없는 RPE(unsigned RPE)를 기반으로 하는 Pearce-Hall 연관성 규칙(associability rule)을 사용해 신뢰성을 업데이트한다. 이러한 신뢰성 신호는 push-pull 메커니즘과 경쟁하여 각 시스템에 가중치(weight)를 할당한다.In the mediation process, the model-based system uses the history of the SPE to update the reliability and implements a hierarchical empirical Bayes method, while the model-free system uses unsigned RPE (unsigned RPE). Reliability is updated using the Pearce-Hall association rule based. This reliability signal competes with the push-pull mechanism to assign a weight to each system.

마지막으로, 행동 선택 단계에서, 모델은 softmax 규칙(Daw 등, 2006, Glascher등, 2010, Wilson 등, 2014)을 사용하여 확률론적으로 행동을 선택한다. Finally, in the behavior selection phase, the model selects behavior stochastically using softmax rules (Daw et al., 2006, Glascher et al., 2010, Wilson et al., 2014).

본 발명에서는 분리 학습 중재 모델(separate learning arbitration model) 및 동적 활용 중재 모델(dynamic exploitation arbitration model)이라는 두 가지 유형의 수정된 모델을 제안했다. 분리 학습 중재 모델은 모델-기반 시스템과 모델-프리 시스템의 서로 다른 학습 속도를 가정한다. 동적 활용 중재 모델은 RL 에이전트 정책 최적화의 지표인 활용도(degree of exploitation)가 양 시스템에 대한 의존도에 의해 변화한다는 추가적인 가정을 사용하여 분리 학습 모델을 진전시킨다. 활용도의 변화를 설명하기 위하여 세 가지 유형의 방정식인 로지스틱스(logistics), 선형(linear), 가중 선형(weighted linear)을 제안했다.In the present invention, two types of modified models have been proposed: a separate learning arbitration model and a dynamic exploitation arbitration model. The separate learning intervention model assumes different learning speeds of the model-based system and the model-free system. The dynamic utilization mediation model advances the segregation learning model using the additional assumption that the degree of exploitation, an indicator of RL agent policy optimization, is dependent on the dependence on both systems. Three types of equations, logistics, linear and weighted linear, have been proposed to explain changes in utilization.

먼저, fMRI 데이터를 습득한다. 뇌기능 영상(functional imaging)은 KAIST 뇌영상센터에 위치한 3T Siemens(Magnetom) Verio scanner로 수행되었다. 전체적인 뇌를 덮는 42개의 축 단면(axial slices)이 3mm x 3mm x 3mm의 해상도를 갖고 interleaved-ascending 순서로 습득된다. 단일-샷 에코-평면 영상의 펄스 연쇄(one-shot echo-planar imaging pulse sequence)가 사용되었다(TR = 2800ms, TE = 30ms, FOV = 192 mm, flip angle = 90°). 높은 해상도의 구조 영상(structural image)도 각 피실험자에 대해 0.7mm x 0.7mm x 0.7mm의 해상도로 습득되었다.First, fMRI data is acquired. Functional imaging was performed with a 3T Siemens (Magnetom) Verio scanner located at the KAIST Brain Imaging Center. 42 axial slices covering the entire brain are acquired in an interleaved-ascending sequence with a resolution of 3 mm x 3 mm x 3 mm. A single-shot echo-planar imaging pulse sequence was used (TR = 2800 ms, TE = 30 ms, FOV = 192 mm, flip angle = 90 °). High-resolution structural images were also acquired at a resolution of 0.7 mm x 0.7 mm x 0.7 mm for each subject.

다음으로, fMRI 데이터를 전처리한다. 이미지는 SPM12 소프트웨어(뇌영상연구소 Wellcome 분과, 런던, 영국)를 사용하여 처리되고 분석되었다. T1 평형 영향(T1 equilibrium effects)을 감소시키기 위해 첫 두 개의 볼륨은 제거되었다. EPI 영상은 슬라이스 타이밍(slice timing)과 모션 움직임(motion movement)을 위해 수정되었으며 SPM 소프트웨어가 제공한 표준 템플릿 영상으로 부분적 정규화되었다.Next, fMRI data is preprocessed. Images were processed and analyzed using SPM12 software (Braincommunication Lab Wellcome Division, London, UK). To reduce T1 equilibrium effects, the first two volumes were removed. EPI images were modified for slice timing and motion movement, and partially normalized to standard template images provided by SPM software.

일반 선형 모델 분석(general linear model analysis, GLM)에서, 정규화된 영상은 6mm FWHM 가우시안 커널을 사용해서 부드럽게 되었으며 하이패스필터(128s cut-off)가 노이즈를 제거하기 위해 적용되었다.In general linear model analysis (GLM), normalized images were smoothed using a 6mm FWHM Gaussian kernel and a high pass filter (128s cut-off) was applied to remove noise.

멀티복셀 패턴 분석(multivoxel pattern analysis, MVPA)에서, 부드럽지 않은(unsmoothed) epi 영상 데이터가 사용되었다. 선형 추세(linear trends)를 제거하고 신호의 범위를 맞추기 위해 디-트렌딩(de-trending)과 z-스코어링(z-scoring)이 진행되었다. In multivoxel pattern analysis (MVPA), unsmoothed epi image data was used. De-trending and z-scoring were performed to remove linear trends and to match the signal range.

일반 선형 모델 분석(General Linear Model Analysis)에서, 피실험자-특정 값 신호 및 중재 신호는 중재 모델로 계산되며 신호는 epi 영상에서 복셀-관련 신호와 비교된다. 리그레서(Regressor)의 순서는 모델-기반 시스템의 예측 오차(SPE) 및 모델-프리 시스템의 예측 오차(RPE), 신뢰성 비교 신호(=max(RelMB, RelMF), 최대 신뢰성), 모델-기반 시스템의 선택 값(Qfwd), 모델-프리 시스템의 선택 값(Qsarsa), 선택된 통합 값과 선택되지 않은 통합 값 간의 차이(Qarb) 및 선택된 동작을 고를 가능성(Pchosen action)이라는 순서를 따른다. Regressor는 결과 해석 시 regressor 순서의 영향을 제거하기 위해 GLM 분석에서 순차적으로 비-직교화되었다. MARSBAR 소프트웨어(http://marsbar.sourceforge.net)는 관심 영역에서 파라미터 추정을 추출하는 데 사용되었다(Brett M 등, 2002).In General Linear Model Analysis, the subject-specific value signal and the intervention signal are calculated as an intervention model and the signal is compared to the voxel-related signal in the epi image. The order of the regressor is the prediction error (SPE) of the model-based system and the prediction error (RPE) of the model-free system, the reliability comparison signal (= max (RelMB, RelMF), maximum reliability), and the model-based system. Follow the order of the selected value (Qfwd) of the model, the selected value of the model-free system (Qsarsa), the difference between the selected integrated value and the unselected integrated value (Qarb), and the probability of choosing the selected action (Pchosen action). The regressors were sequentially non-orthogonalized in the GLM analysis to eliminate the effect of the regressor order in interpreting the results. MARSBAR software (http://marsbar.sourceforge.net) was used to extract parameter estimates from regions of interest (Brett M et al., 2002).

멀티복셀 패턴 분석(Multivoxel Pattern Analysis)에서, MVPA는 특정한 관심 영역(Region Of Interest, ROI)에서 다양한 중재 신호 처리를 이해하기 위해 수행되었다. 중재 과정에 관여된다고 알려진 3가지의 ROI인 좌/우 하외측 전전두엽피질(inferior lateral prefrontal cortex, ilPFC) 및 전두극 전전두엽 피질(Frontopolar Prefrontal Cortex, FPC)이 선택되었다. 각 뇌 영역의 마스크들은 GLM 분석을 통해 기능적으로 정의되었다. 전체-뇌 보정(p<0.001, uncorrelated) 후 남아 있는 최대 신뢰성 신호에 반응하는 클러스터를 각 ROI의 마스크로 사용했다.In Multivoxel Pattern Analysis, MVPA was performed to understand various interventional signal processing in a specific region of interest (ROI). Three ROIs known to be involved in the intervention process were selected: the inferior lateral prefrontal cortex (ilPFC) and the frontopolar prefrontal cortex (FPC). Masks in each brain region were functionally defined through GLM analysis. Clusters that respond to the maximum reliability signal remaining after full-brain correction (p <0.001, uncorrelated) were used as a mask for each ROI.

신뢰성 관련 신호들(MB 신뢰성, MF 신뢰성, Max 신뢰성)은 피실험자들이 예측 오차를 경험할 때(즉, 상태 및 보상이 나타날 때) 업데이트된다. 현재 자극 표현에서 다음 자극/보상 표현까지 촬영된 모든 epi 스캔들은 현재 표현으로부터 신뢰성 신호를 인코딩하기 위해 나타난다고 가정하며, BOLD 반응 시간 4-6초를 감안한다. 각 신뢰성 신호에서, 각 피실험자의 상위 33% 최고 활성 신호 및 하위 33% 최저 신호 값이 분석에 사용되었으며, '높은 값 그룹' 및 '낮은 값 그룹'으로 분류된다.Reliability-related signals (MB reliability, MF reliability, Max reliability) are updated when subjects experience prediction errors (ie, when status and compensation appear). Assume that all epi scans taken from the current stimulus representation to the next stimulus / compensation representation appear to encode the reliability signal from the current representation, taking into account the BOLD response time of 4-6 seconds. For each reliability signal, the upper 33% highest active signal and the lower 33% lowest signal value of each subject were used for the analysis and classified into 'high value group' and 'low value group'.

이진 지원 벡터 머신 분류기가 복셀의 특징을 학습하기 위해 적용되었다. 마스크 내 모든 복셀들은 학습을 위해 사용되었다. 데이터의 단위(dimensions)는 좌 ilPFC, 우 ilPFC 및 FPC 각각에 대해 196, 79, 294이다. 학습은 개별적으로 수행되었으며, 각 피실험자의 평균적인 데이터 수는 MB 신뢰성에서 349.9, MF 신뢰성에서 548.5, MAX 신뢰성에서 542.5이다. 데이터는 무작위로 30개의 블록으로 나눠졌으며, 각 블록은 동일한 수의 두 그룹을 포함했고, 분류기는 29개의 블록을 사용하여 학습되었으며, 나머지 하나의 블록은 테스트 목적으로 사용되었다. 일반화된 예측 성능은 30개의 예측 정확도를 평균 내어서 계산되었다. 모든 과정은 프린스턴 멀티-복셀 패턴 분석 툴바(Princeton Multi-Voxel Pattern Analysis toolbox)(Detre 등, 2006)를 기반으로 구현되었다. 마지막으로, ANOVA 분석이 CES-D의 표준 cutoff 기준인 16점(Comstock 등, 1997, Weissman 등, 1977)을 기반으로 나누어진 일반 그룹과 우울 그룹 간의 신호 예측 정확도를 비교하기 위해 사용되었다.A binary-assisted vector machine classifier was applied to learn the features of voxels. All voxels in the mask were used for learning. The dimensions of the data are 196, 79 and 294 for the left ilPFC, right ilPFC and FPC respectively. Training was conducted individually, and the average number of data for each subject was 349.9 in MB reliability, 548.5 in MF reliability, and 542.5 in MAX reliability. The data were randomly divided into 30 blocks, each block contained two groups of the same number, the classifier was trained using 29 blocks, and the other block was used for testing purposes. The generalized prediction performance was calculated by averaging 30 prediction accuracy. The whole process was implemented based on the Princeton Multi-Voxel Pattern Analysis toolbox (Detre et al., 2006). Finally, ANOVA analysis was used to compare the signal prediction accuracy between the general and depressive groups divided based on CES-D's standard cutoff criteria of 16 points (Comstock et al., 1997, Weissman et al., 1977).

다시 도 2(a)를 참조하면, 본 발명에서는 Lee 등 (2014)이 설계한 순차적인 2단계 Markov 판단 과제(sequential two-stage Markov decisiontask)가 사용되었다. 참여자들이 이원 선택(좌 또는 우)을 할 때 마다, 그들은 특정 상태-전이(state-transition) 확률 p에 따라 다음 상태로 이동한다. 전이 확률은 확실성이 높은 환경에서 (0.5, 0.5)에 대응하며, 확실성이 낮은 환경에서는 (0.9, 0.1)에 대응한다. Referring back to FIG. 2 (a), in the present invention, a sequential two-stage Markov decision task designed by Lee et al. (2014) was used. Each time a participant makes a binary selection (left or right), they move to the next state according to a particular state-transition probability p. The probability of transition corresponds to (0.5, 0.5) in an environment with high certainty, and (0.9, 0.1) in an environment with low certainty.

도 2(b)에 나타낸 바와 같이, 과제는 특정 목표 상태 및 유연 목표 상태라는 두 상태로 나눠진다. 특정 목표 상태(specific goal condition)에서, 피실험자들은 코인 색깔이 토큰 박스의 색깔(빨간색(40), 파란색(20), 노란색(10))과 일치할 때만 코인을 얻도록 허용된다. 반면에, 유연-목표 상태(flexible goal condition)에서는, 모든 유형의 토큰들(빨간색(40), 파란색(20), 노란색(10))이 교환 가능하다(redeemable).2 (b), the task is divided into two states: a specific target state and a flexible target state. Under a specific goal condition, subjects are allowed to earn coins only when the coin color matches the color of the token box (red (40), blue (20), yellow (10)). On the other hand, in a flexible goal condition, all types of tokens (red (40), blue (20), yellow (10)) are redeemable.

도 3은 본 발명의 일 실시예에 따른 행동 결과를 나타내는 그래프이다. 3 is a graph showing behavioral results according to an embodiment of the present invention.

도 3(a)는 우울증 수치(CES-D)와 누적 보상(accumulated reward) 간의 관계(n=63)를 나타낸다. 우울증 수치가 증가하면 과제 능력은 감소한다. 도 3(b)는 우울증 수치와 최적 선택의 비율 간의 관계(n=63)를 나타낸다. 최적 선택의 비율은 우울증 증상과 반비례 관계이다. 도 3(c)는 첫 번째 상태(S1)에서 우울증 수치와 선택 일관성 간의 관계(n=63)를 나타낸다. 선택 일관성의 감소율은 우울증과 역 상관관계이다.3 (a) shows the relationship (n = 63) between the depression level (CES-D) and the accumulated reward. As your depression level increases, your ability to work decreases. Fig. 3 (b) shows the relationship between the depression level and the ratio of optimal selection (n = 63). The ratio of optimal choices is inversely related to the symptoms of depression. Fig. 3 (c) shows the relationship (n = 63) between depression level and selection consistency in the first state (S1). The rate of decrease in selection consistency is inversely correlated with depression.

도 4는 본 발명의 일 실시예에 따른 모델 선택을 설명하기 위한 도면이다. 4 is a diagram for explaining model selection according to an embodiment of the present invention.

도 4(a)는 모델 기반(model-based, MB) 학습 시스템과 모델-프리(model-free, MF) 시스템의 통합을 설명하는 계산적인 가정이다. 두 가지의 분리된 시스템은 행동 값 및 신뢰성을 예측 오차를 사용하여 계산한다(각각 SPE 및 RPE, 점선(valuation)). 그 후, 모델은 두 시스템의 신뢰성을 비교함으로써 두 시스템의 통합을 결정한다(중재, 실선(arbitration)). 중재 과정에서 계산된 추정 가중치를 사용하여 두 시스템을 통합한 후에, 행동은 소프트맥스(softmax) 규칙을 기반으로 선택된다. 모델 구조는(Lee 등, 2014)를 따른다. FIG. 4 (a) is a computational assumption explaining the integration of a model-based (MB) learning system and a model-free (MF) system. The two separate systems calculate behavioral values and reliability using prediction errors (SPE and RPE, respectively, valuation). The model then determines the integrity of the two systems by comparing the reliability of the two systems (arbitration, arbitration). After integrating the two systems using estimated weights calculated during the intervention process, the behavior is selected based on the softmax rule. The model structure follows (Lee et al., 2014).

도 4(b)는 모델 비교 결과이다. 본 발명에서는 인간 행동 데이터를 가장 잘 설명하는 모델을 선택하기 위한 수단으로 베이지안 정보 기준(Bayesian Information Criteria, BIC)을 선택했다. 4 (b) is a model comparison result. In the present invention, Bayesian Information Criteria (BIC) was selected as a means for selecting a model that best describes human behavior data.

도 4(c)를 참조하면, Arb는 (Lee 등, 2014)이 제안한 계산 모델을 언급한다. 중재의 추가적인 버전은 분리 학습(separate learning) 및 동적 활용(dynamic exploitation)을 고려한다. Arbα는 분리 학습 파라미터를 두 가지의 다른 시스템에 할당한다(즉, α 대신 αMB, αMF 사용). 각 시스템이 얼마나 사용되는지에 따라 활용도가 변화한다는 추가적인 가정으로 Arbα,τ는 Arbα가 진전된 것이다. 모델의 최고의 버전은 모델-선택 확률(PMB)을 사용하여 모델-기반 활용(τMB) 및 모델-프리 활용(τMF) 파라미터의 누적된 통합을 활용도(τ)로 사용한다(즉, τ = PMB*τMB + (1-PMB)*τMF). 별표(asterisk, *)는 대응 표본 t 검정 비교(pair t-test comparison)를 통한 0.05 수준에서의 상당한 차이를 나타낸다. 오차 막대(error bar)는 표준 오차 평균(standard error mean)을 나타낸다.Referring to FIG. 4 (c), Arb refers to a calculation model proposed by (Lee et al., 2014). Additional versions of mediation consider separate learning and dynamic exploitation. Arbα assigns separate learning parameters to two different systems (ie, αMB, αMF instead of α). Arbα, τ is the progress of Arbα as an additional assumption that utilization varies depending on how much each system is used. The best version of the model uses the cumulative integration of model-based utilization (τMB) and model-free utilization (τMF) parameters with model-select probability (PMB) as utilization (τ) (i.e., τ = PMB * τMB + (1-PMB) * τMF). The asterisk (*) represents a significant difference at the 0.05 level through pair t-test comparison. The error bar represents the standard error mean.

도 5는 본 발명의 일 실시예에 따른 계산 신호에 대한 신경 상관물을 설명하기 위한 도면이다. 5 is a diagram for explaining a neural correlator for a calculated signal according to an embodiment of the present invention.

제안하는 모델의 값 및 중재 신호는 상기 영역에서 나타난다. 신경 상관물은 (Lee 등, 2014)과 일치한다. SPE 및 RPE는 각각 상태 예측 오차(state prediction error) 및 보상 예상 오차(reward prediction error)를 나타낸다. 최대 신뢰성은 모델-기반 시스템 및 모델-프리 시스템의 최대 신뢰성을 나타낸다(=max(RelMB, RelMF)). QMB 및 QMF는 모델-기반 시스템 및 모델-프리 시스템에서 선택된 값을 나타낸다. Qarb는 선택된 행동 값과 선택되지 않은 행동 값 간의 차이를 나타낸다. Pchosen action는 선택된 행동에 할당된 확률을 나타낸다.The proposed model values and arbitration signals are shown in the above area. Neural correlates are consistent with (Lee et al., 2014). The SPE and RPE represent state prediction error and reward prediction error, respectively. The maximum reliability represents the maximum reliability of the model-based system and the model-free system (= max (RelMB, RelMF)). QMB and QMF represent values selected from model-based systems and model-free systems. Qarb represents the difference between the selected action value and the unselected action value. The Pchosen action represents the probability assigned to the selected action.

도 6은 본 발명의 일 실시예에 따른 뇌 영역간의 정보 전달 연결성을 설명하기 위한 도면이다. 6 is a diagram for explaining information transfer connectivity between brain regions according to an embodiment of the present invention.

도 6(a)는 뇌 영역간의 정보 전달 연결성을 설명하기 위한 도면이다. 우울증 조기 진단을 위한 뇌 연결성 지표를 생성하는 과정은 역동적 인과관계 모델링(Dynamic Causal Modeling; DCM) 방법을 활용하여 피험자들의 과제 수행 동안의 뇌 영역간 연결성 변화를 관찰하였다. 분석에 사용된 뇌 영역은 양측 ilPFC(inferior lateral PFC), FPC, vmPFC(Ventromedial PFC), mPFC(medial PFC), pPut(posterior Putamen), ACC(anterior Cingulate Cortex) (Lee 등, 2014)이다. 화살표는 두 영역간 연결성이 PMF 신호에 의해 조절됨을 의미한다. PMF란, 피험자가 현재 모델-프리 신호를 얼마나 사용하고 있는 지 나타내는 신호이다. FIG. 6 (a) is a diagram for explaining information transfer connectivity between brain regions. In the process of generating brain connectivity indicators for early diagnosis of depression, the dynamic causal modeling (DCM) method was used to observe changes in connectivity between brain regions during subjects' tasks. Brain regions used for the analysis are bilateral ilPFC (inferior lateral PFC), FPC, vmPFC (Ventromedial PFC), mPFC (medial PFC), pPut (posterior Putamen), and ACC (anterior Cingulate Cortex) (Lee et al., 2014). The arrow indicates that the connectivity between the two regions is controlled by the PMF signal. PMF is a signal indicating how much the subject is currently using a model-free signal.

도 6(b)는 ilPFC 으로부터 mPFC의 연결에 PMF가 미치는 영향력을 나타내는 그래프이다. 6 (b) is a graph showing the influence of PMF on the connection of mPFC from ilPFC.

도 7은 본 발명의 일 실시예에 따른 우울증 조기 진단 장치의 구조를 나타내는 도면이다. 7 is a view showing the structure of an apparatus for early diagnosis of depression according to an embodiment of the present invention.

제안하는 우울증 조기 진단 장치(700)는 행동 지표 생성부(710), 모델기반 지표 생성부(720), 뇌영역 정보량 지표 생성부(730), 뇌 연결성 지표 생성부(740), 우울증 진단 모델링부(750)를 포함한다. The proposed early diagnosis device for depression 700 includes a behavioral indicator generator 710, a model-based indicator generator 720, a brain region information amount indicator generator 730, a brain connectivity index generator 740, and a depression diagnosis modeling unit. (750).

행동 지표 생성부(710)는 사용자가 강화학습 기반의 의사결정 과제 수행하는 동안 행동 데이터를 수집하여 우울증 조기 진단을 위한 행동 지표를 생성한다. The behavioral indicator generator 710 collects behavioral data while the user performs a decision-based task based on reinforcement learning to generate behavioral indicators for early diagnosis of depression.

모델기반 지표 생성부(720)는 상기 과제 수행 동안 수집된 사용자의 행동 데이터를 이용하여 계산 모델을 통해 과제 수행 전략을 분석하고, 우울증 조기 진단을 위한 모델기반 지표를 생성한다. The model-based index generation unit 720 analyzes a task performance strategy through a computational model using the user's behavior data collected during the task performance, and generates a model-based index for early diagnosis of depression.

뇌영역 정보량 지표 생성부(730)는 상기 과제 수행 동안 획득한 뇌 영상을 상기 모델기반 지표를 이용하여 분석하고, 우울증 조기 진단을 위한 뇌영역 정보량 지표를 생성한다. The brain region information amount indicator generation unit 730 analyzes the brain image acquired during the task using the model-based indicator and generates a brain region information amount indicator for early diagnosis of depression.

뇌 연결성 지표 생성부(740)는 상기 뇌영역 정보량 지표를 이용하여 뇌 연결성을 분석하고, 우울증 조기 진단을 위한 뇌 연결성 지표를 생성한다. The brain connectivity index generator 740 analyzes brain connectivity using the brain region information amount indicator and generates a brain connectivity indicator for early diagnosis of depression.

우울증 진단 모델링부(750)는 상기 지표들을 기계학습 기반 으로 학습하여, 우울증 조기 진단을 위한 예측 모델을 생성한다. The depression diagnosis modeling unit 750 learns the indicators based on machine learning to generate a predictive model for early diagnosis of depression.

모델기반 지표 생성부(720)는 의사 결정에 대한 모델-기반의 영향 및 모델-프리의 영향을 구분하고, 모델-기반 시스템과 모델-프리 시스템의 통합을 설명하는 모델을 기반으로 하며, 상기 모델은 평가, 중재, 행동 선택을 포함하는 과정으로 구성한다. The model-based index generation unit 720 is based on a model that distinguishes model-based influence and model-free influence on decision-making, and describes the integration of the model-based system and the model-free system, and the model Consists of a process that includes assessment, intervention, and behavioral choice.

모델기반 지표 생성부(720)는 평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-기반 시스템은 전방향(FORWARD) 학습 알고리즘을 사용하여 상태 예측 오차(State Prediction Error; SPE)로 상태 전이 확률을 학습하고, 역방향(BACKWARD) 알고리즘으로 행동 값을 계산한다. 또한, 평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-프리 시스템은 SARSA 알고리즘을 사용하여 보상 예측 오차(Reward Prediction Error; RPE)로 상태-행동 값을 학습한다. In the evaluation step, the model-based index generation unit 720 learns behavior values in a given state in the model-based system and the model-free system, and the model-based system uses a forward learning algorithm to predict the state error. The state transition probability is learned with (State Prediction Error; SPE), and the action value is calculated with a backward algorithm. In addition, in the evaluation step, the model-based system and the model-free system learn behavioral values in a given state, and the model-free system uses the SARSA algorithm to compensate for the state-behavior with a reward prediction error (RPE). To learn.

모델기반 지표 생성부(720)는 중재 과정에서, 모델-기반 시스템이 신뢰성을 업데이트하기 위해 SPE의 이력을 사용하여 계층화된 경험적 베이즈 방법을 구현한다. 또한, 중재 과정에서 모델-프리 시스템은 부호 없는 RPE를 기반으로 하는 피어스-홀(Pearce-Hall) 연관성 규칙(associability rule)을 사용하여 신뢰성을 업데이트한다. The model-based index generation unit 720 implements a hierarchical empirical Bayes method using the history of the SPE in order to update the reliability of the model-based system in the mediation process. In addition, in the arbitration process, the model-free system updates reliability using a Peer-Hall association rule based on an unsigned RPE.

모델기반 지표 생성부(720)는 행동 선택 단계에서, 소프트맥스(softmax) 규칙을 사용하여 확률론적으로 행동을 선택한다. The model-based index generation unit 720 selects behavior stochastically using a softmax rule in the behavior selection step.

뇌영역 정보량 지표 생성부(730)는 뇌 영상을 수집하여 T1 평형 영향(T1 equilibrium effects)을 감소시키기 위해 첫 두 개의 볼륨을 제거한다. EPI 영상은 슬라이스 타이밍(slice timing)과 모션 움직임(motion movement)을 위해 수정하고, SPM 소프트웨어가 제공한 표준 템플릿 영상으로 부분적 정규화한다. The brain region information amount index generation unit 730 collects brain images and removes the first two volumes to reduce T1 equilibrium effects. EPI images are modified for slice timing and motion movement, and partially normalized with standard template images provided by SPM software.

뇌영역 정보량 지표 생성부(730)는 일반 선형 모델 분석(general linear model analysis; GLM)을 이용하여 뇌 영상을 분석하고, 피실험자-특정 값 신호 및 중재 신호는 중재 모델로 계산되며 신호는 epi 영상에서 복셀-관련 신호와 비교된다. 리그레서(Regressor)의 순서는 모델-기반 시스템의 예측 오차 및 모델-프리 시스템의 예측 오차, 신뢰성 비교 신호, 모델-기반 시스템의 선택 값, 모델-프리 시스템의 선택 값, 선택된 통합 값과 선택되지 않은 통합 값 간의 차이 및 선택된 동작을 고를 가능성의 순서를 따르고, 리그레서는 결과 해석 시 리그레서 순서의 영향을 제거하기 위해 GLM 분석에서 순차적으로 비-직교화된다. The brain region information amount index generation unit 730 analyzes the brain image using general linear model analysis (GLM), and the subject-specific value signal and the mediation signal are calculated as the mediation model, and the signal is calculated from the epi image. Compared to voxel-related signals. The order of the regressor is the prediction error of the model-based system and the prediction error of the model-free system, the reliability comparison signal, the selected value of the model-based system, the selected value of the model-free system, and the selected integrated value and not selected. The order between the differences between unintegrated values and the likelihood of choosing a selected action is followed, and the ligase is sequentially non-orthogonalized in the GLM analysis to eliminate the effect of the ligencer order when interpreting the results.

뇌영역 정보량 지표 생성부(730)는 멀티복셀 패턴 분석(Multivoxel Pattern Analysis; MVPA)을 이용하여 뇌 영상을 분석하고, 특정 관심 영역(Region Of Interest; ROI)에서 다양한 중재 신호 처리를 이해하기 위해 수행된다. 중재 과정에 관여된다고 알려진 3가지의 ROI인 좌/우 하외측 전전두엽피질(inferior lateral prefrontal cortex; ilPFC) 및 전두극 전전두엽 피질(Frontopolar Prefrontal Cortex; FPC)이 선택되며, 각 뇌 영역의 마스크들은 GLM 분석을 통해 기능적으로 정의된다. 신뢰성 관련 신호들은 피실험자들이 예측 오차를 경험할 때 업데이트되고, 현재 자극 표현에서 다음 자극 및 보상 표현까지 촬영된 모든 epi 스캔들은 현재 표현으로부터 신뢰성 신호를 인코딩하기 위해 나타난다고 가정한다. 각 신뢰성 신호에서, 각 피실험자의 상위 일정 비율의 최고 활성 신호 및 하위 일정 비율의 최저 신호 값이 분석에 사용되고, 이진 지원 벡터 머신 분류기가 복셀의 특징을 학습하기 위해 적용되어 마스크 내 모든 복셀들이 학습을 위해 사용된다. The brain region information amount index generation unit 730 analyzes the brain image by using Multivoxel Pattern Analysis (MVPA) and performs various intervention signal processing in a region of interest (ROI). do. Three ROIs known to be involved in the intervention process are selected: the left / right inferior lateral prefrontal cortex (ilPFC) and the frontopolar prefrontal cortex (FPC), and the masks in each brain region are analyzed by GLM. Is defined functionally. It is assumed that the reliability-related signals are updated when subjects experience a prediction error, and all epi scans taken from the current stimulus representation to the next stimulus and compensation representation appear to encode the reliability signal from the current representation. In each reliability signal, the highest active signal of the highest percentage of each subject and the lowest signal value of the lowest percentage of each subject are used for analysis, and a binary-assisted vector machine classifier is applied to learn the characteristics of voxels so that all voxels in the mask are trained. Used for

뇌 연결성 지표 생성부(740)는 역동적 인과관계 모델링(Dynamic Causal Modeling; DCM) 방법을 활용하여 피험자들의 과제 수행 동안의 뇌 영역간 연결성 변화를 관찰하였다. 분석에 사용된 뇌 영역은 양측 좌/우 하외측 전전두엽피질 (inferior lateral prefrontal cortex; ilPFC), 전두극 전전두엽 피질 (Frontopolar Prefrontal Cortex; FPC), 복내측 전전두피질 (Ventromedial Prefrontal Cortex; vmPFC), 내측전전두피질 (medial Prefrontal Cortex; mPFC), 피각 (putamen) (Lee 등, 2014)이다. The brain connectivity index generating unit 740 observed a change in connectivity between brain regions during the task of the subjects using the dynamic causal modeling (DCM) method. Brain regions used for the analysis were bilateral left / right inferior lateral prefrontal cortex (ilPFC), frontal prefrontal cortex (FPC), ventraldial prefrontal cortex (vmPFC), medial These are the medial prefrontal cortex (mPFC) and the putamen (Lee et al., 2014).

도 8은 본 발명의 일 실시예에 따른 예측 오차 표현에 대한 우울증의 영향을 나타내는 도면이다. 8 is a view showing the effect of depression on the prediction error expression according to an embodiment of the present invention.

도 8(a)는 SPE 반응에 대한 우울증 영향(n=28)을 나타낸다. 좌측 뇌섬엽(left insula)([-36, 20, -4], z-score=4.49)은 SPE 표현과 관련이 있다. 뇌섬엽 활동과 SPE 간의 추산된 영향 값(estimated effect size)는 우울증 수치와 반비례 관계가 있다. 도 8(b) 및 도 8(c)는 RPE 반응에 대한 우울증 영향(n=28)을 나타낸다. 양측 미상(bilateral caudate) 간의 추산된 영향 값(좌: [-4, 6, -4], z-score=4.50, 우: [4, 8 -4], z-score=5.30)이며, RPE는 우울증 증상과 반비례 관계이다.8 (a) shows the depression effect (n = 28) on the SPE response. The left insula ([-36, 20, -4], z-score = 4.49) is related to SPE expression. The estimated effect size between brain lobe activity and SPE is inversely related to depression levels. 8 (b) and 8 (c) show the depression effect (n = 28) on the RPE response. The estimated influence values between the bilateral caudates (left: [-4, 6, -4], z-score = 4.50, right: [4, 8 -4], z-score = 5.30), and RPE is It is inversely related to the symptoms of depression.

도 9은 본 발명의 일 실시예에 따른 중재 시스템에 대한 우울증의 영향을 나타내는 도면이다.9 is a view showing the effect of depression on the intervention system according to an embodiment of the present invention.

도 9(a)는 모델 파라미터에 대한 우울증의 영향(n=63)을 나타낸다. 도 9(a)의 경계선 좌측은 우울증 수치와 모델-프리 신뢰성 학습 파라미터 간의 관계를 나타낸다. 우울한 사람들은 더 높은 학습 속도를 보여주며, 이는 그들이 모델-프리 신뢰성 학습 과정에서 현재 보상 예측 오차에 더 많이 의존하려는 경향이 있다는 것을 나타낸다. 도 9(a)의 경계선 우측은 신뢰성에 대한 학습 속도 영향의 예시이다. 일반 그룹은 양 시스템 모두에 고정된 신뢰성 신호를 갖는다. 반면, 우울 그룹은 높은 학습 속도로 인해 MF 신뢰성에서 급격한 변화를 보인다. 도 9(b)는 우울증 수치와 중재 과정을 나타내는 뇌 영역 간의 관계(GLM 분석)(n=28)이다. 전두극 전전두엽 피질(Frontopolar prefrontal cortex, FPC, 좌표 [8,44,40], z-score=3.83)의 반응은 우울증 수치가 증가할수록 감소한다. 도 9(c)는 일반 그룹(n=15)과 우울 그룹(n=13)에서 모델-프리 신뢰성 예측 능력에 대한 비교(MVPA 분석)이다. 중재 영역과 관련된 세 가지 뇌 영역인 좌/우 ilPFC 및 FPC의 마스크는 GLM 분석을 통해 얻어진다. 이 영역들을 기반으로 하는 MVPA 분석은 모델-프리 신뢰성 신호의 예측 능력이 우울 그룹에서 모든 영역에서 상당히 높았다는 점을 보인다(p=0.042, p=0.047, p=0.036, 단방향(one-way) ANOVA).9 (a) shows the effect of depression on model parameters (n = 63). The left side of the border line in FIG. 9 (a) shows the relationship between depression values and model-free reliability learning parameters. Depressed people show a higher learning rate, indicating that they tend to rely more on current compensation prediction errors in the model-free reliability learning process. The right side of the border in FIG. 9 (a) is an example of the effect of learning speed on reliability. The general group has a fixed reliability signal for both systems. On the other hand, the depressed group showed a rapid change in MF reliability due to the high learning rate. Fig. 9 (b) shows the relationship between depression levels and brain regions representing the intervention process (GLM analysis) (n = 28). The response of the frontal prefrontal cortex (FPC, coordinates [8,44,40], z-score = 3.83) decreases with increasing depression levels. FIG. 9 (c) is a comparison (MVPA analysis) of model-free reliability prediction ability in the general group (n = 15) and the depressed group (n = 13). Masks of the three brain regions associated with the mediation region, left / right ilPFC and FPC, are obtained through GLM analysis. MVPA analysis based on these regions showed that the predictive ability of the model-free reliability signal was significantly higher in all regions in the depressed group (p = 0.042, p = 0.047, p = 0.036, one-way ANOVA) ).

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다.  또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.  이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.  예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.  또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The device described above may be implemented with hardware components, software components, and / or combinations of hardware components and software components. For example, the devices and components described in the embodiments include, for example, a processor, controller, arithmetic logic unit (ALU), digital signal processor (micro signal processor), microcomputer, field programmable array (FPA), It may be implemented using one or more general purpose computers or special purpose computers, such as a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions. The processing device may run an operating system (OS) and one or more software applications running on the operating system. In addition, the processing device may access, store, manipulate, process, and generate data in response to the execution of the software. For convenience of understanding, a processing device may be described as one being used, but a person having ordinary skill in the art, the processing device may include a plurality of processing elements and / or a plurality of types of processing elements. It can be seen that may include. For example, the processing device may include a plurality of processors or a processor and a controller. In addition, other processing configurations, such as parallel processors, are possible.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.  소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다.  소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instruction, or a combination of one or more of these, and configure the processing device to operate as desired, or process independently or collectively You can command the device. Software and / or data may be interpreted by a processing device, or to provide instructions or data to a processing device, of any type of machine, component, physical device, virtual equipment, computer storage medium or device. Can be embodied in The software may be distributed on networked computer systems, and stored or executed in a distributed manner. Software and data may be stored in one or more computer-readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.  The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer readable medium. The computer-readable medium may include program instructions, data files, data structures, or the like alone or in combination. The program instructions recorded on the medium may be specially designed and constructed for the embodiments or may be known and usable by those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs, DVDs, and magnetic media such as floptical disks. -Hardware devices specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of program instructions include high-level language code that can be executed by a computer using an interpreter, etc., as well as machine language codes produced by a compiler.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described by a limited embodiment and drawings, those skilled in the art can make various modifications and variations from the above description. For example, the described techniques are performed in a different order than the described method, and / or the components of the described system, structure, device, circuit, etc. are combined or combined in a different form from the described method, or other components Alternatively, even if replaced or substituted by equivalents, appropriate results can be achieved.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also within the scope of the following claims.

Claims (24)

사용자가 강화학습 기반의 의사결정 과제 수행하는 동안 행동 데이터를 수집하여 우울증 조기 진단을 위한 행동 지표를 생성하는 단계;
상기 과제 수행 동안 수집된 사용자의 행동 데이터를 이용하여 계산 모델을 통해 과제 수행 전략을 분석하고, 우울증 조기 진단을 위한 모델기반 지표를 생성하는 단계;
상기 과제 수행 동안 획득한 뇌 영상을 상기 모델기반 지표를 이용하여 분석하고, 우울증 조기 진단을 위한 뇌영역 정보량 지표를 생성하는 단계;
상기 뇌영역 정보량 지표를 이용하여 뇌 연결성을 분석하고, 우울증 조기 진단을 위한 뇌 연결성 지표를 생성하는 단계; 및
상기 지표들을 기계학습 기반 으로 학습하여, 우울증 조기 진단을 위한 예측 모델을 생성하는 단계
를 포함하는 우울증 조기 진단 방법.
Generating behavioral indicators for early diagnosis of depression by collecting behavioral data while a user performs a decision-making task based on reinforcement learning;
Analyzing a task performance strategy through a computational model using the user's behavior data collected during the task performance and generating a model-based indicator for early diagnosis of depression;
Analyzing brain images obtained during the task using the model-based indicator and generating a brain region information amount indicator for early diagnosis of depression;
Analyzing brain connectivity using the brain region information amount indicator and generating a brain connectivity indicator for early diagnosis of depression; And
Learning the indicators based on machine learning to generate a predictive model for early diagnosis of depression
Depression early diagnosis method comprising a.
제1항에 있어서,
상기 과제 수행 동안 수집된 사용자의 행동 데이터를 이용하여 계산 모델을 통해 과제 수행 전략을 분석하고, 우울증 조기 진단을 위한 모델기반 지표를 생성하는 단계는,
의사 결정에 대한 모델-기반의 영향 및 모델-프리의 영향을 구분하고, 모델-기반 시스템과 모델-프리 시스템의 통합을 설명하는 모델을 기반으로 하며, 상기 모델은 평가, 중재, 행동 선택을 포함하는 과정으로 구성 되는
우울증 조기 진단 방법.
According to claim 1,
The step of analyzing the task performance strategy through the calculation model using the behavioral data of the user collected during the task execution, and generating a model-based indicator for early diagnosis of depression,
It is based on a model that distinguishes model-based and model-free impacts on decision-making and describes the integration of model-based and model-free systems, which include evaluation, intervention, and behavioral selection. Which consists of
How to diagnose depression early.
제2항에 있어서,
평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-기반 시스템은 전방향(FORWARD) 학습 알고리즘을 사용하여 상태 예측 오차(State Prediction Error; SPE)로 상태 전이 확률을 학습하고, 역방향(BACKWARD) 알고리즘으로 행동 값을 계산하는
우울증 조기 진단 방법.
According to claim 2,
In the evaluation phase, the model-based system and the model-free system learn behavioral values in a given state, and the model-based system uses the FORWARD learning algorithm to state the state prediction error (SPE). Learning the probability of transition, and calculating the behavioral value with the backward algorithm
How to diagnose depression early.
제2항에 있어서,
평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-프리 시스템은 SARSA 알고리즘을 사용하여 보상 예측 오차(Reward Prediction Error; RPE)로 상태-행동 값을 학습하는
우울증 조기 진단 방법.
According to claim 2,
In the evaluation phase, the model-based system and the model-free system learn the behavior values in a given state, and the model-free system uses the SARSA algorithm to learn the state-behavior values with the Reward Prediction Error (RPE). doing
How to diagnose depression early.
제2항에 있어서,
중재 과정에서, 모델-기반 시스템이 신뢰성을 업데이트하기 위해 SPE의 이력을 사용하여 계층화된 경험적 베이즈 방법을 구현하는
우울증 조기 진단 방법.
According to claim 2,
In the mediation process, the model-based system uses the SPE's history to update the reliability to implement a layered empirical Bayes method.
How to diagnose depression early.
제2항에 있어서,
중재 과정에서, 모델-프리 시스템은 부호 없는 RPE를 기반으로 하는 피어스-홀(Pearce-Hall) 연관성 규칙(associability rule)을 사용하여 신뢰성을 업데이트하는
우울증 조기 진단 방법.
According to claim 2,
In the arbitration process, the model-free system uses the Peer-Hall association rule based on unsigned RPE to update reliability.
How to diagnose depression early.
제2항에 있어서,
행동 선택 단계에서, 소프트맥스(softmax) 규칙을 사용하여 확률론적으로 행동을 선택하는
우울증 조기 진단 방법.
According to claim 2,
In the action selection phase, we use the softmax rule to stochastically select actions
How to diagnose depression early.
제1항에 있어서,
상기 과제 수행 동안 획득한 뇌 영상을 상기 모델기반 지표를 이용하여 분석하고, 우울증 조기 진단을 위한 뇌영역 정보량 지표를 생성하는 단계는,
뇌 영상을 수집하여 T1 평형 영향(T1 equilibrium effects)을 감소시키기 위해 첫 두 개의 볼륨을 제거하고, EPI 영상은 슬라이스 타이밍(slice timing)과 모션 움직임(motion movement)을 위해 수정하고, SPM 소프트웨어가 제공한 표준 템플릿 영상으로 부분적 정규화하는
우울증 조기 진단 방법.
According to claim 1,
Analyzing the brain image obtained during the task using the model-based indicator, and generating a brain region information amount indicator for early diagnosis of depression,
Collect brain images to remove the first two volumes to reduce T1 equilibrium effects, EPI images are modified for slice timing and motion movement, and provided by SPM software Partially normalized to one standard template image
How to diagnose depression early.
제8항에 있어서,
일반 선형 모델 분석(general linear model analysis; GLM)을 이용하여 뇌 영상을 분석하고, 피실험자-특정 값 신호 및 중재 신호는 중재 모델로 계산되며 신호는 epi 영상에서 복셀-관련 신호와 비교되고, 리그레서(Regressor)의 순서는 모델-기반 시스템의 예측 오차 및 모델-프리 시스템의 예측 오차, 신뢰성 비교 신호, 모델-기반 시스템의 선택 값, 모델-프리 시스템의 선택 값, 선택된 통합 값과 선택되지 않은 통합 값 간의 차이 및 선택된 동작을 고를 가능성의 순서를 따르고, 리그레서는 결과 해석 시 리그레서 순서의 영향을 제거하기 위해 GLM 분석에서 순차적으로 비-직교화되는
우울증 조기 진단 방법.
The method of claim 8,
Brain images are analyzed using general linear model analysis (GLM), subject-specific value signals and mediation signals are calculated as mediation models, and signals are compared to voxel-related signals in epi images, and regressors The order of (Regressor) is prediction error of model-based system and prediction error of model-free system, reliability comparison signal, selected value of model-based system, selected value of model-free system, selected integrated value and unselected integration The difference between the values and the order of likelihood of choosing the selected action is followed, and the ligase is sequentially non-orthogonalized in the GLM analysis to eliminate the effect of the ligencer order when interpreting the results.
How to diagnose depression early.
제8항에 있어서,
멀티복셀 패턴 분석(Multivoxel Pattern Analysis; MVPA)을 이용하여 뇌 영상을 분석하고, 특정 관심 영역(Region Of Interest; ROI)에서 다양한 중재 신호 처리를 이해하기 위해 수행되고, 중재 과정에 관여된다고 알려진 3가지의 ROI인 좌/우 하외측 전전두엽피질(inferior lateral prefrontal cortex; ilPFC) 및 전두극 전전두엽 피질(Frontopolar Prefrontal Cortex; FPC)이 선택되며, 각 뇌 영역의 마스크들은 GLM 분석을 통해 기능적으로 정의되는
우울증 조기 진단 방법.
The method of claim 8,
Analyzing brain images using Multivoxel Pattern Analysis (MVPA), three things known to be involved in the mediation process, performed to understand various mediation signal processing in a region of interest (ROI) Inferior lateral prefrontal cortex (ilPFC) and Frontopolar Prefrontal Cortex (FPC), which are the ROIs of, are selected, and the masks of each brain region are functionally defined through GLM analysis.
How to diagnose depression early.
제8항에 있어서,
신뢰성 관련 신호들은 피실험자들이 예측 오차를 경험할 때 업데이트되고, 현재 자극 표현에서 다음 자극 및 보상 표현까지 촬영된 모든 epi 스캔들은 현재 표현으로부터 신뢰성 신호를 인코딩하기 위해 나타난다고 가정하며, 각 신뢰성 신호에서, 각 피실험자의 상위 일정 비율의 최고 활성 신호 및 하위 일정 비율의 최저 신호 값이 분석에 사용되고, 이진 지원 벡터 머신 분류기가 복셀의 특징을 학습하기 위해 적용되어 마스크 내 모든 복셀들이 학습을 위해 사용되는
우울증 조기 진단 방법.
The method of claim 8,
Reliability-related signals are updated when subjects experience prediction errors, and it is assumed that all epi scans taken from the current stimulus representation to the next stimulus and compensation representation appear to encode the reliability signal from the current representation. The highest active signal of the highest constant ratio and the lowest signal value of the lower constant ratio are used for analysis, and the binary-assisted vector machine classifier is applied to learn the characteristics of the voxels, so that all voxels in the mask are used for learning.
How to diagnose depression early.
제1항에 있어서,
상기 뇌영역 정보량 지표를 이용하여 뇌 연결성을 분석하고, 우울증 조기 진단을 위한 뇌 연결성 지표를 생성하는 단계는,
역동적 인과관계 모델링(Dynamic Causal Modeling; DCM) 방법을 활용하여 과제 수행 동안의 뇌 영역간 연결성 변화를 관찰하는
우울증 조기 진단 방법.
According to claim 1,
Analyzing brain connectivity using the brain region information level indicator, and generating a brain connectivity indicator for early diagnosis of depression,
Dynamic Causal Modeling (DCM) method is used to observe changes in connectivity between brain regions during task execution.
How to diagnose depression early.
사용자가 강화학습 기반의 의사결정 과제 수행하는 동안 행동 데이터를 수집하여 우울증 조기 진단을 위한 행동 지표를 생성하는 행동 지표 생성부;
상기 과제 수행 동안 수집된 사용자의 행동 데이터를 이용하여 계산 모델을 통해 과제 수행 전략을 분석하고, 우울증 조기 진단을 위한 모델기반 지표를 생성하는 모델기반 지표 생성부;
상기 과제 수행 동안 획득한 뇌 영상을 상기 모델기반 지표를 이용하여 분석하고, 우울증 조기 진단을 위한 뇌영역 정보량 지표를 생성하는 뇌영역 정보량 지표 생성부;
상기 뇌영역 정보량 지표를 이용하여 뇌 연결성을 분석하고, 우울증 조기 진단을 위한 뇌 연결성 지표를 생성하는 뇌 연결성 지표 생성부; 및
상기 지표들을 기계학습 기반 으로 학습하여, 우울증 조기 진단을 위한 예측 모델을 생성하는 우울증 진단 모델링부
를 포함하는 우울증 조기 진단 장치.
A behavioral indicator generator that collects behavioral data while a user performs a decision-making task based on reinforcement learning and generates behavioral indicators for early diagnosis of depression;
A model-based index generator that analyzes a task performance strategy through a computational model using the user's behavior data collected during the task performance and generates a model-based index for early diagnosis of depression;
A brain region information amount indicator generating unit for analyzing brain images obtained during the task using the model-based indicator and generating a brain region information amount indicator for early diagnosis of depression;
A brain connectivity index generator for analyzing brain connectivity using the brain region information level indicator and generating a brain connectivity indicator for early diagnosis of depression; And
Depression diagnosis modeling unit that learns the indicators based on machine learning to generate a predictive model for early diagnosis of depression
Depression early diagnosis device comprising a.
제13항에 있어서,
상기 모델기반 지표 생성부는,
의사 결정에 대한 모델-기반의 영향 및 모델-프리의 영향을 구분하고, 모델-기반 시스템과 모델-프리 시스템의 통합을 설명하는 모델을 기반으로 하며, 상기 모델은 평가, 중재, 행동 선택을 포함하는 과정으로 구성 되는
우울증 조기 진단 장치.
The method of claim 13,
The model-based index generation unit,
It is based on a model that distinguishes model-based and model-free impacts on decision-making and describes the integration of model-based and model-free systems, which include evaluation, intervention, and behavioral selection. Which consists of
Depression early diagnosis device.
제14항에 있어서,
상기 모델기반 지표 생성부는,
평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-기반 시스템은 전방향(FORWARD) 학습 알고리즘을 사용하여 상태 예측 오차(State Prediction Error; SPE)로 상태 전이 확률을 학습하고, 역방향(BACKWARD) 알고리즘으로 행동 값을 계산하는
우울증 조기 진단 장치.
The method of claim 14,
The model-based index generation unit,
In the evaluation phase, the model-based system and the model-free system learn behavioral values in a given state, and the model-based system uses the FORWARD learning algorithm to state the state prediction error (SPE). Learning the probability of transition, and calculating the behavioral value with the backward algorithm
Depression early diagnosis device.
제14항에 있어서,
상기 모델기반 지표 생성부는,
평가 단계에서, 모델-기반 시스템과 모델-프리 시스템은 주어진 상태에서 행동 값을 학습하고, 모델-프리 시스템은 SARSA 알고리즘을 사용하여 보상 예측 오차(Reward Prediction Error; RPE)로 상태-행동 값을 학습하는
우울증 조기 진단 장치.
The method of claim 14,
The model-based index generation unit,
In the evaluation phase, the model-based system and the model-free system learn the behavior values in a given state, and the model-free system uses the SARSA algorithm to learn the state-behavior values with the Reward Prediction Error (RPE). doing
Depression early diagnosis device.
제14항에 있어서,
상기 모델기반 지표 생성부는,
중재 과정에서, 모델-기반 시스템이 신뢰성을 업데이트하기 위해 SPE의 이력을 사용하여 계층화된 경험적 베이즈 방법을 구현하는
우울증 조기 진단 장치.
The method of claim 14,
The model-based index generation unit,
In the mediation process, the model-based system uses the SPE's history to update the reliability to implement a layered empirical Bayes method.
Depression early diagnosis device.
제14항에 있어서,
상기 모델기반 지표 생성부는,
중재 과정에서, 모델-프리 시스템은 부호 없는 RPE를 기반으로 하는 피어스-홀(Pearce-Hall) 연관성 규칙(associability rule)을 사용하여 신뢰성을 업데이트하는
우울증 조기 진단 장치.
The method of claim 14,
The model-based index generation unit,
In the arbitration process, the model-free system uses the Peer-Hall association rule based on unsigned RPE to update reliability.
Depression early diagnosis device.
제14항에 있어서,
상기 모델기반 지표 생성부는,
행동 선택 단계에서, 소프트맥스(softmax) 규칙을 사용하여 확률론적으로 행동을 선택하는
우울증 조기 진단 장치.
The method of claim 14,
The model-based index generation unit,
In the action selection phase, we use the softmax rule to stochastically select actions
Depression early diagnosis device.
제13항에 있어서,
상기 뇌영역 정보량 지표 생성부는,
뇌 영상을 수집하여 T1 평형 영향(T1 equilibrium effects)을 감소시키기 위해 첫 두 개의 볼륨을 제거하고, EPI 영상은 슬라이스 타이밍(slice timing)과 모션 움직임(motion movement)을 위해 수정하고, SPM 소프트웨어가 제공한 표준 템플릿 영상으로 부분적 정규화하는
우울증 조기 진단 장치.
The method of claim 13,
The brain region information amount indicator generation unit,
Collect brain images to remove the first two volumes to reduce T1 equilibrium effects, EPI images are modified for slice timing and motion movement, and provided by SPM software Partially normalized to one standard template image
Depression early diagnosis device.
제20항에 있어서,
상기 뇌영역 정보량 지표 생성부는,
일반 선형 모델 분석(general linear model analysis; GLM)을 이용하여 뇌 영상을 분석하고, 피실험자-특정 값 신호 및 중재 신호는 중재 모델로 계산되며 신호는 epi 영상에서 복셀-관련 신호와 비교되고, 리그레서(Regressor)의 순서는 모델-기반 시스템의 예측 오차 및 모델-프리 시스템의 예측 오차, 신뢰성 비교 신호, 모델-기반 시스템의 선택 값, 모델-프리 시스템의 선택 값, 선택된 통합 값과 선택되지 않은 통합 값 간의 차이 및 선택된 동작을 고를 가능성의 순서를 따르고, 리그레서는 결과 해석 시 리그레서 순서의 영향을 제거하기 위해 GLM 분석에서 순차적으로 비-직교화되는
우울증 조기 진단 장치.
The method of claim 20,
The brain region information amount indicator generation unit,
Brain images are analyzed using general linear model analysis (GLM), subject-specific value signals and mediation signals are calculated as mediation models, and signals are compared to voxel-related signals in epi images, and regressors The order of (Regressor) is the prediction error of the model-based system and the prediction error of the model-free system, the reliability comparison signal, the selected value of the model-based system, the selected value of the model-free system, the selected integrated value and the unselected integration. The difference between the values and the order of likelihood of choosing the selected action is followed, and the ligase is sequentially non-orthogonalized in the GLM analysis to eliminate the effect of the ligencer order when interpreting the results.
Depression early diagnosis device.
제20항에 있어서,
상기 뇌영역 정보량 지표 생성부는,
멀티복셀 패턴 분석(Multivoxel Pattern Analysis; MVPA)을 이용하여 뇌 영상을 분석하고, 특정 관심 영역(Region Of Interest; ROI)에서 다양한 중재 신호 처리를 이해하기 위해 수행되고, 중재 과정에 관여된다고 알려진 3가지의 ROI인 좌/우 하외측 전전두엽피질(inferior lateral prefrontal cortex; ilPFC) 및 전두극 전전두엽 피질(Frontopolar Prefrontal Cortex; FPC)이 선택되며, 각 뇌 영역의 마스크들은 GLM 분석을 통해 기능적으로 정의되는
우울증 조기 진단 장치.
The method of claim 20,
The brain region information amount indicator generation unit,
Analyzing brain images using Multivoxel Pattern Analysis (MVPA), three things known to be involved in the mediation process, performed to understand various mediation signal processing in a region of interest (ROI) Inferior lateral prefrontal cortex (ilPFC) and Frontopolar Prefrontal Cortex (FPC), which are the ROIs of, are selected, and the masks of each brain region are functionally defined through GLM analysis.
Depression early diagnosis device.
제20항에 있어서,
상기 뇌영역 정보량 지표 생성부는,
신뢰성 관련 신호들은 피실험자들이 예측 오차를 경험할 때 업데이트되고, 현재 자극 표현에서 다음 자극 및 보상 표현까지 촬영된 모든 epi 스캔들은 현재 표현으로부터 신뢰성 신호를 인코딩하기 위해 나타난다고 가정하며, 각 신뢰성 신호에서, 각 피실험자의 상위 일정 비율의 최고 활성 신호 및 하위 일정 비율의 최저 신호 값이 분석에 사용되고, 이진 지원 벡터 머신 분류기가 복셀의 특징을 학습하기 위해 적용되어 마스크 내 모든 복셀들이 학습을 위해 사용되는
우울증 조기 진단 장치.
The method of claim 20,
The brain region information amount indicator generation unit,
Reliability-related signals are updated when subjects experience prediction errors, and it is assumed that all epi scans taken from the current stimulus representation to the next stimulus and compensation representation appear to encode the reliability signal from the current representation. The highest active signal of the highest constant ratio and the lowest signal value of the lower constant ratio are used for analysis, and the binary-assisted vector machine classifier is applied to learn the characteristics of the voxels, so that all voxels in the mask are used for learning.
Depression early diagnosis device.
제13항에 있어서,
상기 뇌 연결성 지표 생성부는,
역동적 인과관계 모델링(Dynamic Causal Modeling; DCM) 방법을 활용하여 과제 수행 동안의 뇌 영역간 연결성 변화를 관찰하는
우울증 조기 진단 장치.
The method of claim 13,
The brain connection index generation unit,
Dynamic Causal Modeling (DCM) method is used to observe changes in connectivity between brain regions during task execution.
Depression early diagnosis device.
KR1020180110050A 2018-09-14 2018-09-14 Method and apparatus for early diagnosis of depression KR102245353B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180110050A KR102245353B1 (en) 2018-09-14 2018-09-14 Method and apparatus for early diagnosis of depression

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180110050A KR102245353B1 (en) 2018-09-14 2018-09-14 Method and apparatus for early diagnosis of depression

Publications (2)

Publication Number Publication Date
KR20200031265A true KR20200031265A (en) 2020-03-24
KR102245353B1 KR102245353B1 (en) 2021-04-28

Family

ID=70004281

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180110050A KR102245353B1 (en) 2018-09-14 2018-09-14 Method and apparatus for early diagnosis of depression

Country Status (1)

Country Link
KR (1) KR102245353B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114246588A (en) * 2021-12-22 2022-03-29 成都市第四人民医院 Depression research method
KR20220161879A (en) * 2021-05-31 2022-12-07 성균관대학교산학협력단 Method and apparatus for generation of multi-label classifier algorithm, method for predicting of emotional disorder patient, computer-readable storage medium and computer program
KR20220164368A (en) 2021-06-04 2022-12-13 연세대학교 원주산학협력단 Method for management of personalized anti-depressant behavior based on behavioral activation therapy
KR20220164369A (en) 2021-06-04 2022-12-13 연세대학교 원주산학협력단 Method for function monitoring of behavior based on behavioral activation therapy for depression

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220164150A (en) 2021-06-04 2022-12-13 연세대학교 원주산학협력단 A device for diagnosis of depression through analysis of reactive oxygen species concentration or inflammation levels in nerve cells for diagnosis of depression caused by fine dust
KR20230024667A (en) 2021-08-12 2023-02-21 연세대학교 산학협력단 4d fmri autism prediction and early diagnosis method and apparatus using dynamic brain connectivity extraction of deep learning model

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100026426A (en) * 2008-08-29 2010-03-10 연세대학교 산학협력단 An eeg-based real-time functional cortical connectivity monitoring system
KR20140112264A (en) * 2013-03-13 2014-09-23 가천대학교 산학협력단 An actigraphy based health evaluation method for patients and a device therefor
JP2018015327A (en) * 2016-07-28 2018-02-01 株式会社リコー Diagnostic apparatus, diagnostic method, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100026426A (en) * 2008-08-29 2010-03-10 연세대학교 산학협력단 An eeg-based real-time functional cortical connectivity monitoring system
KR20140112264A (en) * 2013-03-13 2014-09-23 가천대학교 산학협력단 An actigraphy based health evaluation method for patients and a device therefor
JP2018015327A (en) * 2016-07-28 2018-02-01 株式会社リコー Diagnostic apparatus, diagnostic method, and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
R.G.M. Schlosser et al., Neuroimage, 54, p.1662-1668, 2011.* *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220161879A (en) * 2021-05-31 2022-12-07 성균관대학교산학협력단 Method and apparatus for generation of multi-label classifier algorithm, method for predicting of emotional disorder patient, computer-readable storage medium and computer program
KR20220164368A (en) 2021-06-04 2022-12-13 연세대학교 원주산학협력단 Method for management of personalized anti-depressant behavior based on behavioral activation therapy
KR20220164369A (en) 2021-06-04 2022-12-13 연세대학교 원주산학협력단 Method for function monitoring of behavior based on behavioral activation therapy for depression
CN114246588A (en) * 2021-12-22 2022-03-29 成都市第四人民医院 Depression research method

Also Published As

Publication number Publication date
KR102245353B1 (en) 2021-04-28

Similar Documents

Publication Publication Date Title
KR102245353B1 (en) Method and apparatus for early diagnosis of depression
Korn et al. Heuristic and optimal policy computations in the human brain during sequential decision-making
Wilson et al. Inferring relevance in a changing world
Chase et al. Reinforcement learning models and their neural correlates: An activation likelihood estimation meta-analysis
Meder et al. Simultaneous representation of a spectrum of dynamically changing value estimates during decision making
Jocham et al. Reward-guided learning with and without causal attribution
Lee et al. Neural computations underlying arbitration between model-based and model-free learning
Liljeholm et al. Differentiating neural systems mediating the acquisition vs. expression of goal‐directed and habitual behavioral control
Waldschmidt et al. Cortical and striatal contributions to automaticity in information-integration categorization
Morris et al. Action-value comparisons in the dorsolateral prefrontal cortex control choice between goal-directed actions
KR102183847B1 (en) A 2-stage ranking-CNN for diagnosis of glaucoma from fundus images using CAM-extracted ROI as an intermediate input
Schrum et al. Evolving multimodal networks for multitask games
Langlois et al. Passive attention in artificial neural networks predicts human visual selectivity
US20220319003A1 (en) Machine-learning techniques for prediction of future visual acuity
Hummos et al. Thalamic regulation of frontal interactions in human cognitive flexibility
Molinaro et al. Intrinsic rewards explain context-sensitive valuation in reinforcement learning
Ofir‐Geva et al. Use of multi‐perturbation Shapley analysis in lesion studies of functional networks: The case of upper limb paresis
McFadyen et al. Differential replay of reward and punishment paths predicts approach and avoidance
Wang et al. The passive recipient: Neural correlates of negative self‐view in depression
Heo et al. Effects of subclinical depression on prefrontal–striatal model-based and model-free learning
Uesaka et al. Multi-view learning over retinal thickness and visual sensitivity on glaucomatous eyes
Makwana et al. A neural mechanism of strategic social choice under sanction-induced norm compliance
Prokopowicz et al. Fuzzy-based description of computational complexity of central nervous systems
KR20200092457A (en) System and method for predicting human choice behavior and underlying strategy using meta-reinforcement learning
CN115659054A (en) Game level recommendation method and device based on reinforcement learning

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant