KR20190125153A

KR20190125153A - 텍스트 기반 사용자심리상태예측 및 콘텐츠추천 장치 및 그 방법

Info

Publication number: KR20190125153A
Application number: KR1020180140316A
Authority: KR
Inventors: 김규태
Original assignee: 아토머스 주식회사
Priority date: 2018-04-27
Filing date: 2018-11-14
Publication date: 2019-11-06
Also published as: KR102222451B1

Abstract

본 개시는 기계학습모델에 기초하여 사용자가 작성한 텍스트로부터 사용자의 심리를 도출하고, 사용자에게 콘텐츠를 추천하는 방법 및 장치에 관한 것이다. 텍스트에 기반하여 사용자의 심리상태를 예측하는 방법은 복수의 사용자들로부터 글(text), 고민 분류 정보 및 Patient Health Questionnaire(PHQ)와 관련된 정보를 포함하는 데이터 셋들을 수신하는 단계, 상기 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하는 단계, Convolutional Neural Networks(CNN) 및 Long Short-Term Memory models(LSTM)를 포함하는 기계 학습을 이용하여, 형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델을 획득하는 단계, 및 기계 학습을 이용하여, 형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델을 획득하는 단계를 포함한다.

Description

텍스트 기반 사용자심리상태예측 및 콘텐츠추천 장치 및 그 방법 {An apparatus for predicting the status of user's psychology and a method thereof}

본 명세서는 사용자가 작성한 텍스트 및 텍스트와 관련된 사용자의 심리를 기계학습하여 학습모델을 획득하는 방법 및 장치에 관한 것이다. 또한, 학습모델에 기초하여 사용자가 작성한 텍스트로부터 사용자의 심리를 도출하고, 사용자에게 콘텐츠를 추천하는 방법 및 장치에 관한 것이다.

급격히 성장하고 있는 정신건강치료 산업의 전문 상담자는 사용자가 남긴 글(text)로부터 사용자의 심리상태를 진단할 수 있다. 사용자의 사용자가 남긴 글에는 다양한 감정이 표현될 수 있으며, 사용자가 남긴 글이 길어질수록 보다 많은 감정이 표현될 수 있다. 따라서 사용자가 남긴 글에 담긴 여러가지 감정을 종합하여 사용자의 심리 상태를 정확하게 분석하는 방법의 필요성이 증대되고 있다. 또한, 사용자의 심리 상태를 정확하게 분석하는 경우, 사용자에게 보다 정확한 전문가의 상담글을 추천하거나, 영화, 시 또는 음악과 같은 외부 콘텐츠를 제공할 수 있다.

또한, 사용자가 남긴 글에는 많은 단어가 사용되며, 단어가 문장의 맥락에 따라 다른 감정을 나타내는 경우가 있으므로, 단어 간의 상호작용 패턴을 고려하는 필요성 역시 증대되고 있다.

또한, 사용자가 남긴 글은 사용자의 나이, 성별, 출신 지역 등에 따라 다양한 단어를 포함하며, 오타를 포함할 수 있다. 단순히 사용자가 남긴 글에 나타난 단어의 빈도에 기초하여 사용자의 심리 상태를 판단하기 힘든 면이 있으며, 다양한 단어 및 오타가 고려되어야 한다. 또한, 사용자가 남긴 글에 기반하여 콘텐트를 추천하는 경우, 단어의 빈도 분석에 의한 기법(bag-of-words, LSA 등)만이 아닌 글에 담긴 맥락(context)을 고려할 필요성이 있다.

또한, 한글은 교착어이므로 공백문자만으로 토큰화(tokenization)를 하는 경우 존재하지 않는 단어를 생성할 수 있고, 처리할 단어의 양을 늘려서 시스템의 부하를 높일 수 있다. 따라서, 형태소에 기반하여 한글을 분석할 필요성이 있다.

본 개시에서는 인공지는 또는 기계 학습을 이용하여 사용자의 글에 담긴 심리상태를 정확하게 결정할 수 있다. 또한 사용자에게, 사용자의 심리상태의 개선에 도움이 되는 외부콘텐츠(시, 음악, 또는 영화 등)을 제공할 수 있다. 또한, 사용자에게 심리 상태의 개선에 유용한 미리 작성되어 있는 전문 상담자의 상담글 및 유사한 심리상태를 경험하고 있는 사용자의 글을 제공할 수 있다.

인공지능(Artificial Intelligence, AI) 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 Rule 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다. 인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 Rule 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.

인공지능 기술은 기계학습(딥러닝) 및 기계학습을 활용한 요소 기술들로 구성된다. 기계학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소기술은 딥러닝 등의 기계학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 추론/예측, 지식 표현 등의 기술 분야로 구성된다.

인공지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함한다.

본 개시는 사용자가 작성한 텍스트 및 텍스트와 관련된 사용자의 심리를 기계학습하여 학습모델을 획득하는 방법 및 장치에 관한 것이다. 또한, 학습모델에 기초하여 사용자가 작성한 텍스트로부터 사용자의 심리를 정확하게 도출하고, 사용자의 심리상태 개선에 도움이 되는 콘텐츠를 추천하는 방법 및 장치에 관한 것이다.

본 개시의 일 실시예에 따른 심리상태예측장치는 프로세서 및 적어도 하나의 프로그램이 저장되는 메모리를 포함할 수 있다. 메모리는 적어도 하나의 프로그램이 프로세서에서 실행될 때, 프로세서가, 복수의 사용자들로부터 글(text), 고민 분류 정보 및 Patient Health Questionnaire(PHQ)와 관련된 정보를 포함하는 데이터 셋들을 수신하는 단계, 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하는 단계, Convolutional Neural Networks(CNN) 및 Long Short-Term Memory models(LSTM)를 포함하는 기계 학습을 이용하여, 형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델을 획득하는 단계, 및 기계 학습을 이용하여, 형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델을 획득하는 단계를 실행하도록 하는 명령어들을 저장한다.

본 개시의 일 실시예에 따른 심리상태예측장치에 포함된 메모리는 적어도 하나의 프로그램이 프로세서에서 실행될 때, 프로세서가, 글에 포함된 문장의 감정 분류 정보 를 수신하는 단계, 및 문장의 형태소 임베딩과 문장의 감정 분류 정보의 상관 관계에 대한 제 3 학습 모델을 획득하는 단계를 실행하도록 하는 명령어들을 저장한다.

본 개시의 일 실시예에 따른 문장의 감정 분류 정보는 Plutchik wheel의 4개의 쌍을 포함하고, Plutchik wheel의 4개의 쌍은 기쁨(joy) 대 슬픔 (sadness), 분노(anger) 대 공포(fear), 신뢰(trust) 대 혐오(disgust), 및 놀람(surprise) 대 기대(anticipation)이고, 제 3 학습 모델은, 4개의 쌍에 포함된 각각의 쌍에 대하여 바이너리 회귀 학습 모델인 것을 특징으로 한다.

본 개시의 일 실시예에 따른 심리상태예측장치는 프로세서 및 적어도 하나의 프로그램이 저장되는 메모리를 포함하고, 메모리는 적어도 하나의 프로그램이 프로세서에서 실행될 때, 프로세서가, 사용자의 글을 수신하는 단계, 사용자의 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하고, 형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델에 기초하여, 형태소 임베딩에 대응되는, 사용자의 고민 분류 정보를 획득하는 단계, 및 형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델에 기초하여, 형태소 임베딩에 대응되는, 사용자의 PHQ와 관련된 정보를 획득하는 단계를 실행하도록 하는 명령어들을 저장한다.

본 개시의 일 실시예에 따른 심리상태예측장치에 포함된 메모리는 적어도 하나의 프로그램이 프로세서에서 실행될 때, 프로세서가, 형태소 임베딩과 문장의 감정 분류 정보의 상관 관계에 대한 제 3 학습 모델에 기초하여, 사용자의 글에 포함된 문장의 형태소 임베딩에 대응되는 문장의 감정 분류 정보를 획득하는 단계, 문장의 감정 분류 정보에 기초하여 사용자의 감정 라벨(label)을 결정하는 단계를 실행하도록 하는 명령어들을 저장한다.

본 개시의 일 실시예에 따른 심리상태예측장치에 포함된 메모리는 적어도 하나의 프로그램이 프로세서에서 실행될 때, 프로세서가, 제 3 학습 모델에 기초하여, 사용자의 감정 라벨을 결정하기 위한 사용자의 글의 형태소의 기여도를 결정하는 단계, 및 기여도에 따라 사용자의 글의 형태소를 다른 색으로 디스플레이에 표시하는 단계를 실행하도록 하는 명령어들을 저장한다.

본 개시의 일 실시예에 따른 심리상태예측장치에 포함된 메모리는 적어도 하나의 프로그램이 프로세서에서 실행될 때, 프로세서가, 사용자의 고민 분류 정보, PHQ와 관련된 정보, 및 감정 라벨 중 적어도 하나에 기초하여 사용자에게 추천할 외부 콘텐츠 정보를 결정하는 단계를 실행하도록 하는 명령어들을 저장한다.

본 개시의 일 실시예에 따른 심리상태예측장치에 포함된 메모리는 적어도 하나의 프로그램이 프로세서에서 실행될 때, 프로세서가, 사용자의 글에 포함된 형태소들 중 불용어(stopword) 및 저빈도 형태소를 제거하여 중간 데이터를 획득하는 단계, 중간 데이터에 거리 관리 모델(distant supervision model)을 적용하여 Distributed memory(DM)와 관련된 글 임베딩 및 Distributed bag of words(DBOW)와 관련된 글 임베딩을 획득하는 단계, DM와 관련된 글 임베딩 및 DBOW 와 관련된 글 임베딩을 결합(concatenation )하여 결합된 글 임베딩을 획득하는 단계, 메모리에 미리 저장되어 있는 복수의 글들에 대한 글 임베딩들과 결합된 글 임베딩 사이의 코사인 유사도를 계산하여, 복수의 글들 중 사용자의 글과 가장 유사한 글을 선택하는 단계, 선택된 글과 관련되 전문 상담글에 대한 정보를 획득하는 단계를 실행하도록 하는 명령어들을 저장한다.

본 개시의 일 실시예에 따른 심리상태예측장치에 포함된 메모리는 적어도 하나의 프로그램이 프로세서에서 실행될 때, 프로세서가, 사용자의 활동 로그에 기초하여 사용자 임베딩에 대한 정보를 획득하는 단계, 사용자 임베딩에 대한 정보를 협업 필터링(collaborative filtering)하여 메모리에 미리 저장되어 있는 복수의 글들 중에서 사용자의 상태와 관련이 가장 높은 글을 선택하는 단계를 실행하도록 하는 명령어들을 저장하고, 사용자 임베딩에 대한 정보는 복수의 사용자의 활동 로그를 차원 축소(dimensionality reduction)하여 생성된 정보이고, 활동 로그는 사용자가 열람한 게시글에 대한 정보, 댓글, 사용자가 공감을 표시한 글에대한 정보 및 사용자의 북마크 중 적어도 하나를 포함하는 것을 특징으로 한다.

본 개시의 일 실시예에 따른 심리상태예측장치에 포함된 메모리는 적어도 하나의 프로그램이 프로세서에서 실행될 때, 프로세서가, 심리 프로파일에 더 기초하여 사용자 임베딩에 대한 정보를 획득하는 단계를 실행하도록 하는 명령어들을 저장하고, 심리 프로파일은 복수의 사용자의 성별, 나이, 성향 프로파일 및 성격형 테스트 결과 중 적어도 하나를 포함하는 것을 특징으로 한다.

본 개시의 일 실시예에 따른 심리상태예측방법은 복수의 사용자들로부터 글(text), 고민 분류 정보 및 Patient Health Questionnaire(PHQ)와 관련된 정보를 포함하는 데이터 셋들을 수신하는 단계, 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하는 단계, Convolutional Neural Networks(CNN) 및 Long Short-Term Memory models(LSTM)를 포함하는 기계 학습을 이용하여, 형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델을 획득하는 단계, 및 기계 학습을 이용하여, 형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델을 획득하는 단계를 포함한다.

본 개시의 일 실시예에 따른 심리상태예측방법은 글에 포함된 문장의 감정 분류 정보를 수신하는 단계, 및 문장의 형태소 임베딩과 문장의 감정 분류 정보의 상관 관계에 대한 제 3 학습 모델을 획득하는 단계를 포함한다.

본 개시의 일 실시예에 따른 심리상태예측방법은 사용자의 글을 수신하는 단계, 사용자의 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하고, 형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델에 기초하여, 형태소 임베딩에 대응되는, 사용자의 고민 분류 정보를 획득하는 단계, 및 형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델에 기초하여, 형태소 임베딩에 대응되는, 사용자의 PHQ와 관련된 정보를 획득하는 단계를 포함한다.

본 개시의 일 실시예에 따른 심리상태예측방법은 형태소 임베딩과 문장의 감정 분류 정보의 상관 관계에 대한 제 3 학습 모델에 기초하여, 사용자의 글에 포함된 문장의 형태소 임베딩에 대응되는 문장의 감정 분류 정보를 획득하는 단계, 및 문장의 감정 분류 정보에 기초하여 사용자의 감정 라벨(label)을 결정하는 단계를 포함한다.

본 개시의 일 실시예에 따른 심리상태예측방법은 사용자의 고민 분류 정보, PHQ와 관련된 정보, 및 감정 라벨 중 적어도 하나에 기초하여 사용자에게 추천할 외부 콘텐츠 정보를 결정하는 단계를 포함한다.

또한, 상술한 바와 같은 심리상태예측방법을 구현하기 위한 프로그램은 컴퓨터로 판독 가능한 기록 매체에 기록될 수 있다.

도 1은 본 개시의 일 실시예에 따른 프로세서(100)의 블록도이다.
도 2는 본 개시의 일 실시예에 따른 데이터 학습부(110)의 블록도이다.
도 3은 본 개시의 일 실시예에 따른 데이터 인식부(120)의 블록도이다.
도 4는 본 개시의 일 실시예에 따른 디바이스(400) 및 서버(420)가 서로 연동함으로써 데이터를 학습하고 인식하는 예시를 나타내는 도면이다.
도 5는 본 개시의 일 실시예에 따른 학습모델을 획득하는 방법에 관한 흐름도를 도시한다.
도 6은 본 개시의 일 실시예에 따른 고민 분류 정보 및 Patient Health Questionnaire(PHQ)와 관련된 정보를 설명하기 위한 도면이다.
도 7 은 본 개시의 일 실시예에 따라 글을 형태소 분석하는 과정을 간략하게 설명한 도면이다.
도 8은 본 개시의 일 실시예에 따른 심리상태예측장치의 학습부를 설명하기 위한 도면이다.
도 9는 Plutchik wheel의 4개의 쌍으로된 8개의 감정을 나타낸다.
도 10 은 본 개시의 일 실시예에 따라 학습모델을 이용하여 사용자의 심리상태를 예측하는 방법에 관한 흐름도이다.
도 11은 본 개시의 일 실시예에 따른 심리상태예측장치의 인식부를 설명하기 위한 도면이다.
도 12 는 본 개시의 일 실시예에 따라 형태소에 따라 감정 분류 정보를 획득하는 기계학습모델 내부의 가중치를 나타낸 도면이다.
도 13은 본 개시의 일 실시예 따른 사용자의 전자기기 화면 및 분석 데이터베이스 내에 저장된 정보를 나타낸 도면이다.
도 14는 본 개시의 일 실시예에 따른 심리상태예측장치를 설명하기 위한 도면이다.
도 15는 본 개시의 실시예에 따른 텍스트 기반 추천기(1413)의 동작을 나타낸 흐름도 이다.
도 16은 본 개시의 일 실시예에 따른 Distributed memory 및 Distributed bag of words를 설명하기 위한 도면이다.
도 17은 본 개시의 일 실시예에 따른 로그 기반 추천기(1414)의 동작을 나타낸 흐름도 이다.

개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시예에 대해 구체적으로 설명하기로 한다.

본 명세서에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.

본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다. 또한 복수의 표현은 문맥상 명백하게 복수인 것으로 특정하지 않는 한, 단수의 표현을 포함한다.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.

또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어 또는 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.

본 개시의 일 실시예에 따르면 "부"는 프로세서 및 메모리로 구현될 수 있다. 용어 "프로세서" 는 범용 프로세서, 중앙 처리 장치 (CPU), 마이크로프로세서, 디지털 신호 프로세서 (DSP), 제어기, 마이크로제어기, 상태 머신 등을 포함하도록 넓게 해석되어야 한다. 몇몇 환경에서는, "프로세서" 는 주문형 반도체 (ASIC), 프로그램가능 로직 디바이스 (PLD), 필드 프로그램가능 게이트 어레이 (FPGA) 등을 지칭할 수도 있다. 용어 "프로세서" 는, 예를 들어, DSP 와 마이크로프로세서의 조합, 복수의 마이크로프로세서들의 조합, DSP 코어와 결합한 하나 이상의 마이크로프로세서들의 조합, 또는 임의의 다른 그러한 구성들의 조합과 같은 처리 디바이스들의 조합을 지칭할 수도 있다.

용어 "메모리" 는 전자 정보를 저장 가능한 임의의 전자 컴포넌트를 포함하도록 넓게 해석되어야 한다. 용어 메모리는 임의 액세스 메모리 (RAM), 판독-전용 메모리 (ROM), 비-휘발성 임의 액세스 메모리 (NVRAM), 프로그램가능 판독-전용 메모리 (PROM), 소거-프로그램가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능 PROM (EEPROM), 플래쉬 메모리, 자기 또는 광학 데이터 저장장치, 레지스터들 등과 같은 프로세서-판독가능 매체의 다양한 유형들을 지칭할 수도 있다. 프로세서가 메모리로부터 정보를 판독하고/하거나 메모리에 정보를 기록할 수 있다면 메모리는 프로세서와 전자 통신 상태에 있다고 불린다. 프로세서에 집적된 메모리는 프로세서와 전자 통신 상태에 있다.

아래에서는 첨부한 도면을 참고하여 실시예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략한다.

도 1은 본 개시의 일 실시예에 따른 프로세서(100)의 블록도이다.

도 1을 참조하면, 일부 실시예에 따른 프로세서(1300)는 데이터 학습부(110) 및 데이터 인식부(120)를 포함할 수 있다.

데이터 학습부(110)는 사용자의 심리 상태를 판단하기 위한 기준을 학습할 수 있다. 데이터 학습부(110)는 사용자의 심리 상태를 판단하기 위하여 어떤 데이터를 이용할지, 데이터를 이용하여 심리 상태를 어떻게 판단할 지에 관한 기준을 학습할 수 있다. 데이터 학습부(110)는 학습에 이용될 데이터를 획득하고, 획득된 데이터를 후술할 데이터 학습모델에 적용함으로써, 사용자의 심리 상태를 판단하기 위한 기준을 학습할 수 있다.

데이터 인식부(120)는 데이터에 기초하여 사용자의 심리 상태를 판단할 수 있다. 데이터 인식부(120)는 학습된 데이터 학습모델을 이용하여, 소정의 데이터로부터 사용자의 심리 상태를 인식할 수 있다. 데이터 인식부(120)는 학습에 의한 미리 설정된 기준에 따라 소정의 데이터를 획득할 수 있다. 또한, 데이터 인식부(120)는 획득된 데이터를 입력 값으로 하여 데이터 학습모델을 이용함으로써, 소정의 데이터에 기초한 사용자의 심리 상태를 판단할 수 있다. 또한, 획득된 데이터를 입력 값으로 하여 데이터 학습모델에 의해 출력된 결과 값은, 데이터 학습모델을 갱신하는데 이용될 수 있다.

데이터 학습부(110) 및 데이터 인식부(120) 중 적어도 하나는, 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 데이터 학습부(110) 및 데이터 인식부(120) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 전자 장치에 탑재될 수도 있다.

또한 데이터 학습부(110) 및 데이터 인식부(120)는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 데이터 학습부(110) 및 데이터 인식부(120) 중 하나는 전자 장치에 포함되고, 나머지 하나는 서버에 포함될 수 있다. 또한, 데이터 학습부(110) 및 데이터 인식부(120)는 유선 또는 무선으로 통하여, 데이터 학습부(110)가 구축한 모델 정보를 데이터 인식부(120)로 제공할 수도 있고, 데이터 인식부(120)로 입력된 데이터가 추가 학습 데이터로써 데이터 학습부(110)로 제공될 수도 있다.

한편, 데이터 학습부(110) 및 데이터 인식부(120) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 학습부(110) 및 데이터 인식부(120) 중 적어도 하나가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 메모리 또는 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.

도 2는 본 개시의 일 실시예에 따른 데이터 학습부(110)의 블록도이다.

도 2를 참조하면, 일부 실시예에 따른 데이터 학습부(110)는 데이터 획득부(210), 전처리부(220), 학습 데이터 선택부(230), 모델 학습부(240) 및 모델 평가부(250)를 포함할 수 있다.

데이터 획득부(210)는 사용자의 심리 상태 판단에 필요한 데이터를 획득할 수 있다. 데이터 획득부(210)는 사용자의 심리 상태 판단을 위한 학습을 위하여 필요한 데이터를 획득할 수 있다. 데이터 획득부(210)는 사용자로부터 복수의 글을 수신할 수 있다. 사용자의 복수의 글에는 사용자의 심리상태가 담겨있을 수 있다.

사용자는 PC, 스마트폰 등과 같은 전자 단말기를 이용하여 글을 작성할 수 있다. 데이터 획득부(210)를 포함한 학습부(110)가 서버에 포함된 경우, 데이터 획득부(210)는 사용자의 전자 달말기로부터 유무선으로 사용자가 작성한 글을 수신할 수 있다. 또한, 학습부(110)를 구비한 사용자의 전자 단말기는 데이터 사용자가 작성한 글을 키보드, 터치 키패드, 마우스 등과 같은 입력장치로부터 획득할 수 있다.

학습을 위해서는 많은 데이터가 필요하므로, 데이터 획득부(210)는 복수의 사용자들로부터 복수의 글을 수신할 수 있다. 또한 데이터 획득부(210)는 사용자들로부터 복수의 글뿐 아니라, 사용자로부터 입력된 고민 분류 정보, Patient Health Questionnaire - 9 (PHQ-9)설문에 대한 정보, 사용자의 활동 로그, 사용자의 심리 프로파일을 수신할 수 있다. 사용자의 활동 로그는 사용자가 열람한 게시글, 댓글, 사용자가 공감을 표시한 글 및 사용자의 북마크 중 적어도 하나를 포함할 수 있다. 또한 심리 프로파일은 복수의 사용자의 성별, 나이, 성향 프로파일 및 성격형 테스트 결과 중 적어도 하나를 포함할 수 있다.

전처리부(220)는 사용자의 심리 상태 판단을 위하여 획득된 데이터가 기계학습에 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 전처리부(320)는 후술할 모델 학습부(240)가 사용자의 심리 상태 판단을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 미리 설정된 포맷으로 가공할 수 있다. 예를 들어 전처리부(320)는 사용자가 남긴 글을 형태소 분석하여 형태소 임베딩을 획득할 수 있다.

학습 데이터 선택부(230)는 전처리된 데이터 중에서 학습에 필요한 데이터를 선택할 수 있다. 선택된 데이터는 모델 학습부(240)에 제공될 수 있다. 학습 데이터 선택부(230)는 사용자의 심리 상태 판단을 위한 기 설정된 기준에 따라, 전처리된 데이터 중에서 학습에 필요한 데이터를 선택할 수 있다. 또한, 학습 데이터 선택부(230)는 후술할 모델 학습부(240)에 의한 학습에 의해 기 설정된 기준에 따라 데이터를 선택할 수도 있다.

모델 학습부(240)는 학습 데이터에 기초하여 사용자의 심리 상태를 어떻게 판단할 지에 관한 기준을 학습할 수 있다. 또한, 모델 학습부(240)는 사용자의 심리 상태 판단을 위하여 어떤 학습 데이터를 이용해야 하는 지에 대한 기준을 학습할 수도 있다.

또한, 모델 학습부(240)는 사용자의 심리 상태 판단에 이용되는 데이터 학습모델을 학습 데이터로써 이용하여 학습시킬 수 있다. 이 경우, 데이터 학습모델은 미리 구축된 모델일 수 있다. 예를 들어, 데이터 학습모델은 기본 학습 데이터(예를 들어, 샘플 이미지 등)을 입력 받아 미리 구축된 모델일 수 있다.

데이터 학습모델은, 학습모델의 적용 분야, 학습의 목적 또는 장치의 컴퓨터 성능 등을 고려하여 구축될 수 있다. 데이터 학습모델은, 예를 들어, 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예컨대, Deep Neural Network (DNN), Recurrent Neural Network (RNN), Long Short-Term Memory models (LSTM), BRDNN (Bidirectional Recurrent Deep Neural Network), Convolutional Neural Networks (CNN)과 같은 모델이 데이터 학습모델로써 사용될 수 있으나, 이에 한정되지 않는다.

다양한 실시예에 따르면, 모델 학습부(240)는 미리 구축된 데이터 학습모델이 복수 개가 존재하는 경우, 입력된 학습 데이터와 기본 학습 데이터의 관련성이 큰 데이터 학습모델을 학습할 데이터 학습모델로 결정할 수 있다. 이 경우, 기본 학습 데이터는 데이터의 타입 별로 기 분류되어 있을 수 있으며, 데이터 학습모델은 데이터의 타입 별로 미리 구축되어 있을 수 있다. 예를 들어, 기본 학습 데이터는 학습 데이터가 생성된 지역, 학습 데이터가 생성된 시간, 학습 데이터의 크기, 학습 데이터의 장르, 학습 데이터의 생성자, 학습 데이터 내의 오브젝트의 종류 등과 같은 다양한 기준으로 기 분류되어 있을 수 있다.

또한, 모델 학습부(240)는, 예를 들어, 오류 역전파법(error back-propagation) 또는 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 등을 이용하여 데이터 학습모델을 학습시킬 수 있다.

또한, 모델 학습부(240)는, 예를 들어, 학습 데이터를 입력 값으로 하는 지도 학습(supervised learning) 을 통하여, 데이터 학습모델을 학습할 수 있다. 또한, 모델 학습부(240)는, 예를 들어, 별다른 지도없이 상황 판단을 위해 필요한 데이터의 종류를 스스로 학습함으로써, 상황 판단을 위한 기준을 발견하는 비지도 학습(unsupervised learning)을 통하여, 데이터 학습모델을 학습할 수 있다. 또한, 모델 학습부(240)는, 예를 들어, 학습에 따른 상황 판단의 결과가 올바른 지에 대한 피드백을 이용하는 강화 학습(reinforcement learning)을 통하여, 데이터 학습모델을 학습할 수 있다.

또한, 데이터 학습모델이 학습되면, 모델 학습부(240)는 학습된 데이터 학습모델을 저장할 수 있다. 이 경우, 모델 학습부(240)는 학습된 데이터 학습모델을 데이터 인식부(120)를 포함하는 전자 장치의 메모리에 저장할 수 있다. 또는, 모델 학습부(240)는 학습된 데이터 학습모델을 전자 장치와 유선 또는 무선 네트워크로 연결되는 서버의 메모리에 저장할 수도 있다.

이 경우, 학습된 데이터 학습모델이 저장되는 메모리는, 예를 들면, 전자 장치의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 함께 저장할 수도 있다. 또한, 메모리는 소프트웨어 및/또는 프로그램을 저장할 수도 있다. 프로그램은, 예를 들면, 커널, 미들웨어, 어플리케이션 프로그래밍 인터페이스(API) 및/또는 어플리케이션 프로그램(또는 "어플리케이션") 등을 포함할 수 있다.

모델 평가부(250)는 데이터 학습모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 인식 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부(240)로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 데이터 학습모델을 평가하기 위한 기 설정된 데이터일 수 있다.

예를 들어, 모델 평가부(250)는 평가 데이터에 대한 학습된 데이터 학습모델의 인식 결과 중에서, 인식 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우 소정 기준을 만족하지 못한 것으로 평가할 수 있다. 예컨대, 소정 기준이 비율 2%로 정의되는 경우, 학습된 데이터 학습모델이 총 1000개의 평가 데이터 중의 20개를 초과하는 평가 데이터에 대하여 잘못된 인식 결과를 출력하는 경우, 모델 평가부(250)는 학습된 데이터 학습모델이 적합하지 않은 것으로 평가할 수 있다.

한편, 학습된 데이터 학습모델이 복수 개가 존재하는 경우, 모델 평가부(250)는 각각의 학습된 동영상 학습모델에 대하여 소정 기준을 만족하는지를 평가하고, 소정 기준을 만족하는 모델을 최종 데이터 학습모델로써 결정할 수 있다. 이 경우, 소정 기준을 만족하는 모델이 복수 개인 경우, 모델 평가부(250)는 평가 점수가 높은 순으로 미리 설정된 어느 하나 또는 소정 개수의 모델을 최종 데이터 학습모델로써 결정할 수 있다.

한편, 데이터 학습부(110) 내의 데이터 획득부(210), 전처리부(220), 학습 데이터 선택부(230), 모델 학습부(240) 및 모델 평가부(250) 중 적어도 하나는, 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 데이터 획득부(210), 전처리부(220), 학습 데이터 선택부(230), 모델 학습부(240) 및 모델 평가부(250) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 전자 장치에 탑재될 수도 있다.

또한, 데이터 획득부(210), 전처리부(220), 학습 데이터 선택부(230), 모델 학습부(240) 및 모델 평가부(250)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 데이터 획득부(210), 전처리부(220), 학습 데이터 선택부(230), 모델 학습부(240) 및 모델 평가부(250) 중 일부는 전자 장치에 포함되고, 나머지 일부는 서버에 포함될 수 있다.

또한, 데이터 획득부(210), 전처리부(220), 학습 데이터 선택부(230), 모델 학습부(240) 및 모델 평가부(250) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 획득부(210), 전처리부(220), 학습 데이터 선택부(230), 모델 학습부(240) 및 모델 평가부(250) 중 적어도 하나가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.

도 3은 본 개시의 일 실시예에 따른 데이터 인식부(120)의 블록도이다.

도 3을 참조하면, 일부 실시예에 따른 데이터 인식부(120)는 데이터 획득부(310), 전처리부(320), 인식 데이터 선택부(330), 인식 결과 제공부(340) 및 모델 갱신부(350)를 포함할 수 있다.

데이터 획득부(310)는 사용자의 심리 상태 판단을 위해 필요한 데이터를 획득할 수 있으며, 전처리부(320)는 사용자의 심리 상태 판단을 위해 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 전처리부(320)는 후술할 인식 결과 제공부(340)가 사용자의 심리 상태 판단을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기 설정된 포맷으로 가공할 수 있다.

인식 데이터 선택부(330)는 전처리된 데이터 중에서 사용자의 심리 상태 판단에 필요한 데이터를 선택할 수 있다. 선택된 데이터는 인식 결과 제공부(340)에게 제공될 수 있다. 인식 데이터 선택부(330)는 사용자의 심리 상태 판단을 위한 기 설정된 기준에 따라, 전처리된 데이터 중에서 일부 또는 전부를 선택할 수 있다. 또한, 인식 데이터 선택부(330)는 모델 학습부(240)에 의한 학습에 의해 기 설정된 기준에 따라 데이터를 선택할 수도 있다.

인식 결과 제공부(340)는 선택된 데이터를 데이터 학습모델에 적용하여 사용자의 심리 상태를 판단할 수 있다. 인식 결과 제공부(340)는 데이터의 인식 목적에 따른 인식 결과를 제공할 수 있다. 인식 결과 제공부(340)는 인식 데이터 선택부(330)에 의해 선택된 데이터를 입력 값으로 이용함으로써, 선택된 데이터를 데이터 학습모델에 적용할 수 있다. 또한, 인식 결과는 데이터 학습모델에 의해 결정될 수 있다.

모델 갱신부(350)는 인식 결과 제공부(340)에 의해 제공되는 인식 결과에 대한 평가에 기초하여, 데이터 학습모델이 갱신되도록할 수 있다. 예를 들어, 모델 갱신부(350)는 인식 결과 제공부(340)에 의해 제공되는 인식 결과를 모델 학습부(240)에게 제공함으로써, 모델 학습부(240)가 데이터 학습모델을 갱신하도록 할 수 있다.

한편, 데이터 인식부(120) 내의 데이터 획득부(310), 전처리부(320), 인식 데이터 선택부(330), 인식 결과 제공부(340) 및 모델 갱신부(350) 중 적어도 하나는, 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 데이터 획득부(310), 전처리부(320), 인식 데이터 선택부(330), 인식 결과 제공부(340) 및 모델 갱신부(350) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 전자 장치에 탑재될 수도 있다.

또한, 데이터 획득부(310), 전처리부(320), 인식 데이터 선택부(330), 인식 결과 제공부(340) 및 모델 갱신부(350)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 데이터 획득부(310), 전처리부(320), 인식 데이터 선택부(330), 인식 결과 제공부(340) 및 모델 갱신부(350) 중 일부는 전자 장치에 포함되고, 나머지 일부는 서버에 포함될 수 있다.

또한, 데이터 획득부(310), 전처리부(320), 인식 데이터 선택부(330), 인식 결과 제공부(340) 및 모델 갱신부(350) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 획득부(310), 전처리부(320), 인식 데이터 선택부(330), 인식 결과 제공부(340) 및 모델 갱신부(350) 중 적어도 하나가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.

도 4는 본 개시의 일 실시예에 따른 디바이스(400) 및 서버(420)가 서로 연동함으로써 데이터를 학습하고 인식하는 예시를 나타내는 도면이다.

도 4를 참조하면, 서버(420)는 사용자의 심리 상태 판단을 위한 기준을 학습할 수 있으며, 디바이스(400)는 서버(420)에 의한 학습 결과에 기초하여 사용자의 심리 상태를 판단할 수 있다.

이 경우, 서버(420)의 모델 학습부(430)는 도 2에 도시된 데이터 학습부(110)의 기능을 수행할 수 있다. 서버(420)의 모델 학습부(430)는 사용자의 심리 상태를 판단하기 위하여 어떤 데이터를 이용할지, 데이터를 이용하여 사용자의 심리 상태를 어떻게 판단할 지에 관한 기준을 학습할 수 있다. 모델 학습부(430)는 학습에 이용될 데이터를 획득하고, 획득된 데이터를 후술할 데이터 학습모델에 적용함으로써, 사용자의 심리 상태 판단을 위한 기준을 학습할 수 있다.

또한, 디바이스(400)의 인식 결과 제공부(404)는 인식 데이터 선택부(403)에 의해 선택된 데이터를 서버(420)에 의해 생성된 데이터 학습모델에 적용하여 사용자의 심리 상태를 판단할 수 있다. 예를 들어, 인식 결과 제공부(404)는 인식 데이터 선택부(403)에 의해 선택된 데이터를 서버(420)에게 전송하고, 서버(420)가 인식 데이터 선택부(403)에 의해 선택된 데이터를 학습모델에 적용하여 사용자의 심리 상태를 판단할 것을 요청할 수 있다. 또한, 인식 결과 제공부(404)는 서버(420)에 의해 판단된 사용자의 심리 상태에 관한 정보를 서버(420)로부터 수신할 수 있다.

또는, 디바이스(400)의 인식 결과 제공부(404)는 서버(420)에 의해 생성된 학습모델을 서버(420)로부터 수신하고, 수신된 학습모델을 이용하여 사용자의 심리 상태를 판단할 수 있다. 이 경우, 디바이스(400)의 인식 결과 제공부(404)는 인식 데이터 선택부(403)에 의해 선택된 데이터를 서버(420)로부터 수신된 데이터 학습모델에 적용하여 사용자의 심리 상태를 판단할 수 있다.

도 4는 디바이스(400)에 인식부(410)를 포함하고, 서버(420)에 학습부(430)를 포함하는 구성을 기재하였으나 이에 한정되는 것은 아니다. 디바이스(400)는 서버(420)와 다른 서버로 구현될 수 있다. 사용자는 디바이스(400)로부터 인식 결과 정보만 수신할 수 있다.

도 5는 본 개시의 일 실시예에 따른 학습모델을 획득하는 방법에 관한 흐름도를 도시한다.

텍스트에 기초하여 사용자 심리상태를 예측하기 위한 심리상태예측장치는 적어도 하나의 프로세서 및 메모리를 포함할 수 있다. 상기 적어도 하나의 프로세서는 도 1의 프로세서(100)를 포함할 수 있다. 메모리에 저장된 적어도 하나의 프로그램은 상기 프로세서에서 실행될 수 있는 명령어를 포함할 수 있다.

심리상태예측장치는 학습부(110, 430)를 포함할 수 있다. 심리상태예측장치는 데이터 셋들을 학습하여 학습모델을 획득할 수 있다. 이하에서는 심리상태예측장치에 포함된 학습부(110, 430)를 자세히 설명한다.

심리상태예측장치는 복수의 사용자들로부터 글(text), 고민 분류 정보 및 Patient Health Questionnaire(PHQ)와 관련된 정보를 포함하는 데이터 셋들을 수신하는 단계(510)를 수행할 수 있다. 심리상태예측장치는 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하는 단계(520)를 수행할 수 있다. 심리상태예측장치는 Convolutional Neural Networks(CNN) 및 Long Short-Term Memory models(LSTM)를 포함하는 기계 학습을 이용하여, 형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델을 획득하는 단계(530)를 수행할 수 있다. 심리상태예측장치는 기계 학습을 이용하여, 형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델을 획득하는 단계(540)를 수행할 수 있다.

심리상태예측장치는 제 1 학습모델과 제 2 학습모델을 메모리에 저장할 수 있다. 심리상태예측장치는 제 1 학습모델과 제 2 학습모델을 유무선으로 인식부(120)를 구비한 다른 장치에 전송할 수 있다. 인식부(120)를 구비한 장치는 제 1 학습모델과 제 2 학습모델을 이용하여 사용자의 심리상태를 예측할 수 있다.

아래에서는 도 5의 각 단계에 대하여 도 6 내지 8과 함께 자세히 설명한다.

심리상태예측장치에 포함된 데이터 획득부(210)는 복수의 사용자들로부터 글(text), 고민 분류 정보 및 Patient Health Questionnaire(PHQ)와 관련된 정보를 수신하는 단계(510)를 수행할 수 있다. 사용자는 심리상담을 하기 위해 전문 상담사에게 사연글을 남길 수 있다. 심리상태예측장치는 수신된 사연글을 저장할 수 있다.

또한 심리상태예측장치는 사용자로부터 고민의 종류를 글과 함께 입력받을 수 있으며, 사용자는 고민의 종류에 따른 전문 상담사에게 상담을 받을 수 있다. 또한 심리상태예측장치는 사용자에게 소정의 설문을 제공할 수 있다. 심리상태예측장치는 사용자로부터 설문에 대한 응답을 수신할 수 있다. 사용자는 설문 결과에 따라 전문 상담사에게 상담을 받을 수 있다.

도 6은 본 개시의 일 실시예에 따른 고민 분류 정보 및 Patient Health Questionnaire(PHQ)와 관련된 정보를 설명하기 위한 도면이다.

심리상태예측장치는 사용자의 단말의 화면(610)에 사연글을 남길 수 있는 화면을 표시할 수 있다. 사용자는 고민 분류 항목에서 자신의 고민의 종류를 선택할 수 있다. 고민의 종류는 "학교/학업", "취업/진로", "직장", "가족", "결혼/육아", "연예", "성" 및 "외모" 중 적어도 하나를 포함할 수 있다. 심리상태예측장치는 선택된 고민 분류 항목을 고민 분류 정보로서 저장할 수 있다. 심리상태예측장치는 사용자로부터 글의 제목 및 글 내용을 수신할 수 있다. 심리상태예측장치는 고민 분류 정보를 사용자의 글의 제목 및 글 내용과 연관시키고 메모리에 저장할 수 있다. 고민 분류 정보, 사용자의 글의 제목 및 글 내용은 하나의 데이터 셋이 될 수 있다.

심리상태예측장치는 사용자의 단말의 화면(620)에 소정의 설문을 표시할 수 있다. 소정의 설문은 사용자가 글을 남긴 후 2주 내외에 사용자의 단말의 화면(620)에 표시될수 있다. 소정의 설문은 Patient Health Questionnaire(PHQ)일 수 있다. 소정의 설문은 9개의 질문으로 이루어질 수 있다. 또한 심리상태예측장치는 소정의 설문에 대한 사용자의 답변에 기초하여 사용자의 우울증 정도 정보를 0 내지 27 로 나타낼 수 있다. 하지만 이에 한정되는 것은 아니며, 심리상태예측장치는 우울증 정도 점수를 소정의 범위로 변환할 수 있다. 예를 들어 변환된 범위는 0 내지 10일 수 있다. 심리상태예측장치는 우울증 정도 점수를 PHQ와 관련된 정보로서 저장할 수 있다. 심리상태예측장치는 PHQ와 관련된 정보를 사용자가 남긴 글 및 고민 분류 정보와 연관시키고 메모리에 저장할 수 있다. PHQ와 관련된 정보, 고민 분류 정보, 사용자의 글의 제목 및 글 내용은 하나의 데이터 셋이 될 수 있다.

심리상태예측장치가 정확도를 높이기 위해서는 많은 데이터 셋을 학습해야한다. 따라서 심리상태예측장치는 적어도 300,000개의 데이터 셋을 수신할 수 있다.

도 7 은 본 개시의 일 실시예에 따라 글을 형태소 분석하는 과정을 간략하게 설명한 도면이다.

심리상태예측장치에 포함된 전처리부(220)는 사용자로부터 수신한 글을 형태소 분석하여 형태소 임베딩을 획득하는 단계(520)를 수행할 수 있다. 예를들어 심리상태예측장치는 사용자로부터 "철수가 집에 갔다"라는 글을 수신할 수 있다(710). 심리상태예측장치는 사용자의 글을 형태소 단위로 나눌 수 있다. 예를 들어 심리상태예측장치는 사용자의글을 "철수/가/집/에/가/았/다"와 같이 나눌 수 있다(720).

심리상태예측장치는 형태소에 주석문자를 추가할 수 있다(730). 심리상태예측장치는 주석문자를 추가하여, 같은 음을 가지지만 다른 뜻을 가지는 형태소를 구별할 수 있다. 같은 글자라도 다른 뜻을 가질 수 있다. 예를 들어 "가"는 조사일 수도 있고 "가다"의 "가"일 수 있다. 따라서, 조사 "가"에는 "XXX"를 추가하고 동사 "가"에는 XXY를 추가할 수 있다. 하지만 이에 한정되는 것은 아니다. 같은 음을 가지지만 다른 뜻을 가지는 형태소를 구별하기 위한 다양한 방법이 사용될 수 있다.

심리상태예측장치는 기계학습을 수행하기 위하여 각각의 형태소를 형태소 임베딩으로 변환하여 초기화할 수 있다(740). 예를 들어 "철수"라는 형태소는 {A1, A2, A3, A4, ... Ak}와 같은 형태소 임베딩을 포함할 수 있다. A1, A2, A3, A4, ... Ak는 각각 숫자일 수 있다. A1, A2, A3, A4, ... Ak는 각각 실수 값을 가질 수 있다. k는 k차원으로 인코딩된 것을 의미한다. {A1, A2, A3, A4, ... Ak}는 형태소 벡터, 형태소 메트릭스 또는 형태소 임베딩일 수 있다. 심리상태예측장치는 기계학습과정에서 A1, A2, A3, A4, ... Ak의 값을 갱신할 수 있다.

심리상태예측장치에 포함된 학습 데이터 선택부(230)는 글에 포함된 형태소들 중 중요도가 떨어지는 형태소를 제거하여 데이터의 수를 줄일 수 있다. 심리상태예측장치는 문장 기호, 조사, 이모티콘 또는 외국어 중 적어도 하나를 삭제여 모델 학습에 사용하지 않을 수 있다. 심리상태예측장치는 데이터의 수를 줄여서 기계학습을 빠르게 수행할 수 있다.

도 8은 본 개시의 일 실시예에 따른 심리상태예측장치의 학습부를 설명하기 위한 도면이다.

심리상태예측장치는 학습부(800)를 포함할 수 있다. 학습부(800)는 도 1 또는 도 2의 학습부(110)에 동일 대응될 수 있다. 학습부(800)는 제 1 학습부(810), 제 2 학습부(820) 및 제 3 학습부(830) 중 적어도 하나를 포함할 수 있다. 제 1 학습부(810), 제 2 학습부(820) 및 제 3 학습부(830)는 도 2의 모델 학습부(240)에 동일 대응될 수 있다.

심리상태예측장치에 포함된 제 1 학습부(810)는 Convolutional Neural Networks(CNN) 및 Long Short-Term Memory models(LSTM)를 포함하는 기계 학습을 이용하여, 형태소 임베딩(811)과 고민 분류 정보(812)의 상관 관계에 대한 제 1 학습모델(813)을 획득하는 단계(530)를 수행할 수 있다. 제 1 학습부(810)는 다중-클래스 분류기(multi-class classifier)와 관련된 기계학습을 수행할 수 있다.

CNN은 심층 신경망(DNN:Deep Neural Network)의 한 종류로, 하나 또는 여러 개의 콘볼루션 계층(convolutional layer)과 통합 계층(pooling layer), 완전하게 연결된 계층(fully connected layer)들로 구성된 신경망이다. CNN은 2차원 데이터의 학습에 적합한 구조를 가지고 있으며, 역전달(Backpropagation algorithm)을 통해 훈련될 수 있다. 영상 내 객체 분류, 객체 탐지 등 다양한 응용 분야에 폭넓게 활용되는 DNN의 대표적 모델 중 하나이다.

Long Short-Term Memory models(LSTM)는 Recurrent Neural Networks(RNN)의 에 추가되는 모듈로서 RNN의 장기 의존성 문제를 해결하기 위한 알고리즘이다.

심리상태예측장치에 포함된 제 2 학습부(820)는 CNN 및 LSTM을 포함하는 기계 학습을 이용하여, 형태소 임베딩(821)과 PHQ와 관련된 정보(822)의 상관 관계에 대한 제 2 학습모델(823)을 획득하는 단계(540)를 수행할 수 있다. 제 2 학습부(820)는 회귀(regression)와 관련된 기계학습을 수행할 수 있다.

심리상태예측장치는 제 1 학습모델 및 제 2 학습모델을 인식부(120)로 전송할 수 있다. 인식부는 제 1 학습모델 및 제 2 학습모델을 이용하여 사용자의 글로부터 사용자의 우울증 정도 점수, 고민 분류 정보를 예측할 수 있다.

심리상태예측장치에 포함된 제 3 학습부(830)는 사용자의 글에 포함된 문장의 감정 분류 정보를 수신하는 단계를 더 수행할 수 있다. 사용자의 글에 포함된 문장은 Plutchik wheel에 따른 4개의 쌍으로된 8개의 감정으로 분류될수 있다. 전문 심리 상담사는 사용자의글에 포함된문장에 따른 감정 정보를 주석으로 기재할 수 있다. 심리상태예측장치는 사용자의 글에 포함된 문장에 따른 감정 정보를 주석으로 수신할 수 있다. 또한 심리상태예측장치는 문장에 따른 감정 정보를 데이터 셋에 추가할 수 있다.

또한 심리상태예측장치는 사용자의 사연을 음성으로 수신할 수 있다. 심리상태 예측장치는 음성으로 수신된 사용자의 사연을 문자로 변환할 수 있다. 또한 심리상태예측장치는 사용자의 음성의 톤, 성량, 떨림 등을 분석하여 사용자의 음성에 담긴 감정정보를 획득할 수 있다. 또한 심리상태예측장치는 문장에 따른 감정 정보를 데이터 셋에 추가할 수 있다.

또한 심리상태예측장치는 문장의 형태소 임베딩(831)과 문장의 감정 분류 정보(832)의 상관 관계에 대한 제 3 학습 모델(833)을 획득하는 단계를 수행할 수 있다.

도 9는 Plutchik wheel의 4개의 쌍으로된 8개의 감정을 나타낸다.

문장의 감정 분류 정보는 Plutchik wheel의 4개의 쌍을 포함한다. Plutchik wheel의 4개의 쌍은 기쁨(joy) 대 슬픔 (sadness), 분노(anger) 대 공포(fear), 신뢰(trust) 대 혐오(disgust), 및 놀람(surprise) 대 기대(anticipation)이다.

제 3 학습 모델은, 4개의 쌍에 포함된 각각의 쌍에 대하여 바이너리 회귀 학습 모델일 수 있다. 즉, 심리상태예측장치는 기쁨 대 슬픔, 분노 대 공포, 신뢰 대 혐오, 및 놀람 대 기대 각각의 쌍에 대한 바이너리 회귀 학습 모델일 수 있다.

예를 들어 심리상태예측장치는 문장의 형태소 임베딩 및 문장에 대한 감정 분류 정보를 기계학습하여 제 3 학습 모델을 획득할 수 있다. 인식부(120)는 제 3 학습 모델을 임의의 문장에 적용하여, 임의의 문장이 기쁨과 슬픔 중 어떤 감정에 속하는지 판단할 수 있다. 또한 인식부(120)는 제 3 학습 모델을 임의의 문장에 적용하여, 임의의 문장이 분노와 공포 중 어떤 감정에 속하는지 판단할 수 있다. 또한 인식부(120)는 제 3 학습 모델을 임의의 문장에 적용하여, 임의의 문장이 신뢰와 혐오 중 어떤 감정에 속하는지 판단할 수 있다. 또한 인식부(120)는 제 3 학습 모델을 임의의 문장에 적용하여, 임의의 문장이 놀람과 기대 중 어떤 감정에 속하는지 판단할 수 있다.

도 10 은 본 개시의 일 실시예에 따라 학습모델을 이용하여 사용자의 심리상태를 예측하는 방법에 관한 흐름도이다.

심리상태예측장치는 인식부(120, 410)를 포함할 수 있다. 심리상태예측장치는 미리 학습된 학습모델에 기초하여 사용자의 텍스트로부터 사용자의 심리상태를 추정할 수 있다. 이하에서는 심리상태예측장치에 포함된 인식부(120, 410)를 자세히 설명한다.

심리상태예측장치는 사용자의 글을 수신하는 단계(1010)를 수행할 수 있다. 심리상태예측장치는 사용자의 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하는 단계를 수행(1020)할 수 있다. 심리상태예측장치는 형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델에 기초하여, 형태소 임베딩에 대응되는, 사용자의 고민 분류 정보를 획득하는 단계(1030)를 수행할 수 있다. 심리상태예측장치는 형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델에 기초하여, 형태소 임베딩에 대응되는, 사용자의 PHQ와 관련된 정보를 획득하는 단계(1040)를 수행할 수 있다.

심리상태예측장치에 포함된 데이터 획득부(310)는 사용자의 글을 유무선으로 수신할 수 있다. 예를 들어 심리상태예측장치가 서버에 포함되는 경우, 사용자는 전자 단말기를 이용하여 글을 작성하고, 유무선으로 글을 서버에 전송할 수 있다. 또한 심리상태예측장치가 사용자의 단말에 포함된 경우, 심리상태예측장치는 사용자 단말에 포함된 키보드, 터치패드, 마우스 등과 같은 입력 장치로부터 사용자의 글을 입력받을 수 있다.

심리상태예측장치에 포함된 전처리부(320)는 사용자의 글을 형태소 분석할 수 있다. 도 7과 함께 이미 설명한 바와 같이, 심리상태예측장치는 사용자의 글을 형태소 단위로 나눌 수 있다. 또한 심리상태예측장치는 형태소에 주석문자를 추가할 수 있다. 다만 이에 한정되는 것은 아니며 심리상태예측장치는 사용자의 글을 음소, 음절, 단어 단위로 나눌 수 있다. 심리상태예측장치는 해당 단위로 데이터를 처리할 수 있다. 이하에서는 설명의 편의를 위하여 형태소 단위로 설명한다.

또한 심리상태예측장치는 미리 저장되어 있는 데이터베이스에 기초하여 각각의 형태소에 복수의 숫자들을 포함하는 벡터로 나타낼 수 있다. 예를 들어 데이터베이스는 미리 학습된 학습모델일 수 있다. 형태소에 대응하는 벡터는 {A1, A2, A3, A4, ... Ak}와 같은 형식을 가질 수 있다. k는 차원 수를 나타내며 인식부(120)의 차원은 학습부(110)의 차원가 같을 수 있다. 형태소 임베딩은 형태소에 대응하는 벡터를 포함할 수 있다.

또한 심리상태예측장치에 포함된 인식 데이터 선택부(330)는 형태소들 중 중요도가 떨어지는 형태소를 제거하여 데이터의 수를 줄일 수 있다. 심리상태예측장치는 문장 기호, 조사, 이모티콘 또는 외국어 중 적어도 하나를 삭제여 모델 학습에 사용하지 않을 수 있다. 심리상태예측장치는 데이터의 수를 줄여서 기계학습을 빠르게 수행할 수 있다.

심리상태예측장치에 포함된 인식 결과 제공부(340)는 형태소 임베딩과 미리 저장되어 있는 학습모델에 기초하여 고민 분류 정보 및 PHQ와 관련된 정보를 획득할 수 있다. 이에 대해서는 도 13과 함께 자세히 설명한다.

도 11은 본 개시의 일 실시예에 따른 심리상태예측장치의 인식부를 설명하기 위한 도면이다.

심리상태예측장치의 인식부(1110)는 형태소 임베딩(1100)을 수신할 수 있다. 심리상태예측장치의 인식부(1110)는 형태소 임베딩(1100)을 심리상태예측장치의 인식부(1110)의 전처리부(320) 또는 인식 데이터 선택부(330)으로부터 수신할 수 있다.

심리상태예측장치의 인식부(1110)는 우울정도 분석기(1111), 고민 분류기(1112) 및 감정분류기(1113) 중 적어도 하나를 포함할 수 있다. 우울정도 분석기(1111)는 도 8의 학습부(800)에서 미리 학습한 제 2 학습모델(823)을 포함할 수 있다. 고민 분류기(1112)는 도 8의 학습부(800)에서 미리 학습한 제 1 학습모델(813)을 포함할 수 있다. 감정 분류기(1113)는 도 8의 학습부(800)에서 미리 학습한 제 3 학습 모델(833)을 포함할 수 있다.

심리상태예측장치에 포함된 고민 분류기(1112)는 형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델에 기초하여, 형태소 임베딩(1100)에 대응되는, 사용자의 고민 분류 정보(1122)를 획득하는 단계(1030)를 수행할 수 있다. 고민 분류 정보(1122)는 "학교/학업", "취업/진로", "직장", "가족", "결혼/육아", "연예", "성" 및 "외모" 중 적어도 하나를 포함할 수 있다. 심리상태예측장치는 획득된 고민 분류 정보(1122)를 분석 데이터베이스(1120)에 저장할 수 있다.

심리상태예측장치에 포함된 우울 정도 분석기(1111)는 형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델에 기초하여, 형태소 임베딩(1100)에 대응되는, 사용자의 PHQ와 관련된 정보(1121)를 획득하는 단계(1040)를 수행할 수 있다.

심리상태예측장치는 사용자의 PHQ와 관련된 정보(1121)를 획득하여 사용자의 우울정도를 획득할 수 있다. 우울증 정도 정보는 0내지 27의 값을 가질 수 있다. 하지만 이에 한정되는 것은 아니며, 심리상태 예측 장치는 우울증 정도 정보는 0내지 10의 값을 가질 수 있다. 인식부(120)의 우울증 정도 정보의 범위는 학습부(110)의 우울증 정도 정보의 범위와 동일할 수 있다. 심리상태예측장치는 획득된 PHQ 관련 정보(1121) 또는 우울증 정도 정보를 분석 데이터베이스(1120)에 저장할 수 있다.

심리상태예측장치에 포함된 감정분류기(1113)는 형태소 임베딩과 문장의 감정 분류 정보의 상관 관계에 대한 제 3 학습 모델에 기초하여, 사용자의 글에 포함된 문장의 형태소 임베딩에(1100) 대응되는 문장의 감정 분류 정보(1123)를 획득하는 단계를 수행할 수 있다.

감정 분류 정보는 Plutchik wheel의 4개의 쌍으로된 8개의 감정을 나타낼 수 있다. Plutchik wheel의 4개의 쌍은 기쁨(joy) 대 슬픔 (sadness), 분노(anger) 대 공포(fear), 신뢰(trust) 대 혐오(disgust), 및 놀람(surprise) 대 기대(anticipation)이다.

심리상태예측장치는 사용자의 글에 포함된 각각의 문장에 대하여 감정 분류 정보(1123)를 획득할 수 있다. 감정 분류 정보(1123)를 숫자로 나타날 수 있다. 또한 심리상태예측장치는 감정 분류 정보(1123)를 4 개의 쌍 각각에 대하여 획득할 수 있다. 심리상태예측장치는 사용자의 문장에 나타난 기쁨과 슬픔의 정도를 숫자로 나타낼 수 있다. 또한, 심리상태예측장치는 사용자의 문장에 나타난 분노와 공포의 정도를 숫자로 나타낼 수 있다. 또한, 심리상태예측장치는 사용자의 문장에 나타난 신뢰 대 혐오의 정도를 숫자로 나타낼 수 있다. 심리상태예측장치는 사용자의 문장에 나타난 놀람과 기대의 정도를 숫자로 나타낼 수 있다. 숫자는 감정의 정도를 나타낼 수 있다. 또는 숫자는 감정의 확률을 나타낼 수도 있다. 심리상태예측장치는 문장에 나타난 감정 분류 정보에 기초하여 문장에 드러난 사용자의 감정 라벨(label)을 결정할 수 있다.

예를 들어 심리상태예측장치는 문장에 나타난 감정 분류 정보 중 가장 큰 값에 대응되는 감정을 감정 라벨로 결정할 수 있다. 사용자의 글에 포함된 하나의 문장에 대하여 심리상태예측장치는 기쁨과 슬픔에 대한 감정 분류 정보를 0.1 및 0.9로 획득할 수 있다. 또한 심리상태예측장치는 분노와 공포에 대한 감정 분류 정보를 0.5 및 0.5로 획득할 수 있다. 심리상태예측장치는 신뢰와 혐오에 대한 감정 분류 정보를 0.6 대 0.4 로 획득할 수 있다. 또한 심리상태예측장치는 놀람과 기대에 대한 감정 분류 정보를 0.5 대 0.5 로 획득할 수 있다. 이 경우 슬픔에 대한 감정 분류 정보가 가장 높으므로 심리상태예측장치는 사용자의 문장에 슬픔이 드러나 있는 것으로 판단할 수 있다. 즉, 심리상태예측장치는 슬픔을 사용자의 감정 라벨로 결정할 수 있다.

사용자의 글에는 복수의 문장이 포함될 수 있다. 심리상태예측장치는 각각의 문장에 대하여 감정 분류 정보를 획득할 수 있다. 심리상태예측장치는 복수의 문장에 대응되는 감정 분류 정보를 감정 별로 평균하거나 합하여 사용자의 글에 대한 감정 분류 정보를 획득할 수 있다. 심리상태예측장치는 사용자의 글에 대한 감정 분류 정보에 기초하여 사용자의 감정 라벨을 결정할 수 있다.

예를 들어, 심리상태예측장치는 제 1 문장에 대하여 기쁨과 슬픔, 분노와 공포, 신뢰와 혐오 및 놀람과 기대에 대한 감정 분류 정보를 각각, 0.1, 0.9, 0.5, 0.5, 0.6, 0.4, 0.5, 0.5 로 획득할 수 있다. 심리상태예측장치는 제 2 문장에 대하여 기쁨과 슬픔, 분노와 공포, 신뢰와 혐오 및 놀람과 기대에 대한 감정 분류 정보를 각각, 0.2, 0.8, 0.3, 0.7, 0.4, 0.6, 0.5, 0.5 로 획득할 수 있다. 심리상태예측장치는 제 1 문장 및 제 2 문장에 대응되는 감정 분류 정보를 감정 별로 평균하면, 0.15, 0.85, 0.4, 0.6, 0.5, 0.5, 0.5, 0.5 일 수 있다. 슬픔에 대한 감정 분류 정보가 가장 높으므로 심리상태예측장치는 사용자의 글에 대한 지배적인 감정이 슬픔임을 결정할 수 있다. 심리상태예측장치는 슬픔을 사용자의 감정 라벨로 결정할 수 있다.

심리상태예측장치는 문장에 대한 감정 분류 정보, 글에 대한 감정 분류 정보 또는 사용자의 감정 라벨을 분석 데이터베이스(1120)에 저장할 수 있다.

도 12 는 본 개시의 일 실시예에 따라 형태소에 따라 감정 분류 정보를 획득하는 기계학습모델 내부의 가중치를 나타낸 도면이다.

심리상태예측장치는 제 3 학습 모델에 기초하여, 사용자의 감정 라벨을 결정하기 위한 상기 사용자의 글의 형태소의 기여도를 결정할 수 있다. 사용자의 감정 라벨은 문장의 감정 라벨, 글의 감정 라벨을 의미할 수 있다. 제 3 학습 모델은 각각의 형태소 임베딩과 감정 분류 정보에 대한 가중치 값을 포함할 수 있다. 심리상태예측장치는 사용자의 감정 라벨에 관련된 형태소의 가중치를 형태소의 기여도로 결정할 수 있다.

감정1(1221) 및 감정2(1222)는 감정 분류 정보 또는 감정 라벨을 나타낼 수 있다. 제 3 학습 모델은 형태소a(1211)에 대한 감정1(1221)로의 가중치인 Wa1을 포함할 수 있다. 제 3 학습 모델은 형태소a(1211)에 대한 감정2(1222)로의 가중치인 Wa2을 포함할 수 있다. 제 3 학습 모델은 형태소b(1212)에 대한 감정1(1221)로의 가중치인 Wb1을 포함할 수 있다. 제 3 학습 모델은 형태소b(1212)에 대한 감정2(1222)로의 가중치인 Wb2을 포함할 수 있다. 제 3 학습 모델은 형태소c(1213)에 대한 감정1(1221)로의 가중치인 Wc1을 포함할 수 있다. 제 3 학습 모델은 형태소c(1213)에 대한 감정2(1222)로의 가중치인 Wc2을 포함할 수 있다.

심리상태예측장치가 감정1을 문장에 드러난 사용자의 감정 라벨로 결정한 경우 심리상태예측장치는 형태소a, 형태소b, 형태소c의 가중치들(Wa1, Wb1, Wb1)를 비교할 수 있다. 또한 심리상태예측장치는 형태소들 중 학습모델에 포함된 가중치가 높을수록 기여도가 높다고 결정할 수 있다. 또한 심리상태예측장치가 감정2을 문장에 드러난 사용자의 감정 라벨로 결정한 경우 심리상태예측장치는 형태소a, 형태소b, 형태소c의 가중치들(Wa2, Wb2, Wb2)를 비교할 수 있다. 또한 심리상태예측장치는 형태소들 중 학습모델에 포함된 가중치가 높을수록 기여도가 높다고 결정할 수 있다.

심리상태예측장치는 기여도에 따라 사용자의 글의 형태소를 다른 색으로 디스플레이에 표시할 수 있다. 예를 들어 심리상태예측장치는 기여도가 높을수록 형태소를 제 1 색으로 표시하고, 기여도가 낮을수록 제 2 색으로 표시할 수 있다. 심리상태예측장치는 형태소들을 히트맵(heatmap)으로 시각화하여 표시할 수 있다. 심리상태예측장치는 색과 기여도의 관계를 나타내는 그래프를 히트맵과 함께 표시할 수 있고, 사용자는 형태소의 기여도를 쉽게 파할 수 있다.

도 12는 형태소를 기준으로 설명하였으나, 형태소를 포함하는 단어 또는 문장에 대해서도 동일하게 설명될 수 있다. 예를 들어 심리상태예측장치는 단어를 이루는 형태소의 가중치의 합을 이용하여, 단어가 문장의 감정 라벨에 기여한 정도를 획득할 수 있다. 또한 심리상태예측장치는 문장을 이루는 형태소의 가중치의 합을 이용하여 문장이 글의 감정 라벨에 기여한 정도를 획득할 수 있다. 또한 심리상태예측장치는 단어 또는 문장을 기여도에 따라 다른 색으로 표시할 수 있다.

도 13은 본 개시의 일 실시예 따른 사용자의 전자기기 화면 및 분석 데이터베이스 내에 저장된 정보를 나타낸 도면이다.

사용자는 자신의 전자기기를 이용하여 고민 상담글을 작성할 수 있다. 전자기기에 나타난 화면(1310)을 참조하면, 사용자는 자신의 글에 대한 해시태그를 글과 함께 기재할 수 있다. 또한 사용자는 전자기기를 이용하여 자신의 고민 상담글에 달린 타 사용자의 댓글을 확인할 수 있다.

심리상태예측장치는 도 10 내지 도 12에서 설명한 바와 같이 인식부(120)의 학습모델을 이용하여, 사용자의 고민 상담글에 기초하여 사용자의 우울증 정도 정보, 고민 분류 정보 및 사용자의 감정 라벨을 획득할 수 있다.

분석 데이터베이스(1320)는 tag, user, likes, replies, keyword, depression_rate, expected_d_rate 및, text를 포함할 수 있다. 심리상태예측장치는 tag 항목(1321)에 사용자가 작성한 해시태그의 내용을 기재할 수 있다. 심리상태예측장치는 user 항목(1322)에 고민 상담글을 작성한 사용자의 식별정보를 기재할 수 있다. 심리상태예측장치는 likes항목(1323)에 사용자의 고민 상담글에 "좋음"을 표시한 타 사용자의 식별정보를 기재할 수 있다. 심리상태예측장치는 replies항목(1324)에 사용자의 고민 상담글에 댓글을 남긴 타 사용자의 식별정보 및 댓글 내용을 기재할 수 있다.

심리상태예측장치는 keywords 항목(1325)에 사용자의 고민 상담글의 중요 단어를 기재할 수 있다. 심리상태예측장치는 고민 상담글의 단어들 중 사용자의 감정 라벨 결정에 높은 기여를 한 단어를 중요 단어로 선택할 수 있다. 기여도에 대해서는 도 12와 함께 설명하였으므로 자세한 설명은 생략한다.

심리상태예측장치는 depression_rate항목(1326)에 설문 조사에 기초한 사용자의 우울증 정도 정보를 기재할 수 있다. 설문 조사는 PHQ-9일 수 있다. PHQ-9에 대해서는 도 6과 함께 설명한 바 있으므로 자세한 설명은 생략한다.

심리상태예측장치는 expected_d_rate항목(1327)에 기계학습모델를 이용하여 사용자의 고민상담글로부터 획득한 PHQ와 관련된 정보 또는 우울증 정도 정보를 기재할 수 있다. 심리상태예측장치가 사용자의 상담글로부터 PHQ와 관련된 정보 또는 우울증 정도 정보를 획득하는 방법에 대해서는 도 10 내지 도 11과 함께 자세히 설명하였으므로 자세한 설명은 생략한다.

심리상태예측장치는 분석 데이터베이스에 기초하여 사용자에게 외부 콘텐츠를 추천할 수 있다. 이에 대하여 도 14와 함께 자세히 설명한다.

도 14는 본 개시의 일 실시예에 따른 심리상태예측장치를 설명하기 위한 도면이다.

심리상태예측장치(1410)는 외부 콘텐츠 추천기(1411) 및 내부 콘텐츠 추천기(1412)를 포함할 수 있다. 내부 콘텐츠 추천기(1412)는 텍스트 기반 추천기(1413) 및 로그 기반 추천기(1414)를 포함할 수 있다.

외부 콘텐츠 추천기(1411)는 사용자의 고민 분류 정보, PHQ와 관련된 정보, 및 감정 라벨 중 적어도 하나에 기초하여 사용자에게 추천할 외부 콘텐츠 정보를 결정할 수 있다.

외부 콘텐츠 추천기(1411)는 고민 분류 정보, PHQ와 관련된 정보, 우울증 정도 정보 및 감정 라벨 중 적어도 하나를 인덱스로 하여 외부 콘텐츠(영화, 음악, 등)에 대한 정보를 데이터베이스에 저장하고 있을 수 있다. 외부 콘텐츠 추천기(1411)는 사용자의 고민 분류 정보, PHQ와 관련된 정보, 우울증 정도 정보 및 감정 라벨에 따라 데이터베이스에 저장된 외부 콘텐츠 정보를 선택할 수 있다.

심리상태예측장치는 외부 콘텐츠 정보를 사용자에게 제공할 수 있다. 외부 콘텐츠 정보는 사용자의 전자기기의 디스플레이, 스피커 등으로 출력될 수 있다. 사용자는 디스플레이에 표시된 영상을 보거나 스피커로 출력된 소리를 듣고 외부 콘텐츠를 선택할 수 있다. 또한 심리상태예측장치는 선택된 외부 콘텐츠 정보를 수신할 수 있다. 심리상태예측장치는 외부 콘텐츠를 유무선으로 사용자에게 제공할 수 있다.

텍스트 기반 추천기(1413)는 사용자의 사연글(1402)과 가장 유사한 다른 사용자의 사연글을 획득할 수 있다. 또한, 텍스트 기반 추천기(1413)는 획득된 다른 사용자의 사연글을 사용자에 제공할 수 있다. 또한 텍스트 기반 추천기(1413)는 사용자의 사연글(1402)과 가장 유사한 다른 사용자의 사연글에 달린 전문 상담사의 상담글(1422)을 획득할 수 있다. 텍스트 기반 추천기(1413)는 전문 상담사의 상담글(1422)을 사용자에게 제공할 수 있다.

또한 로그 기반 추천기(1414)는 사용자의 사연글 열람 로그(1403)에 기초하여 다른 사용자의 연관 사연(1423)을 획득할 수 있다. 로그 기반 추천기(1414)는 연관 사연(1423)을 사용자에게 제공할 수 있다.

텍스트 기반 추천기(1413) 및 로그기반 추천기(1414)에 대해서는 도 15 내지 도 17과 함께 자세히 설명한다.

도 15는 본 개시의 실시예에 따른 텍스트 기반 추천기(1413)의 동작을 나타낸 흐름도 이다.

텍스트 기반 추천기(1413)는 사용자의 글에 포함된 형태소들 중 불용어(stopword) 및 저빈도 형태소를 제거하여 중간 데이터를 획득하는 단계(1510)를 수행할 수 있다. 텍스트 기반 추천기(1413)는 중간 데이터에 거리 관리 모델(distant supervision model)을 적용하여 Distributed memory(DM)와 관련된 글 임베딩 및 Distributed bag of words(DBOW)와 관련된 글 임베딩을 획득하는 단계(1520)를 수행할 수 있다. 텍스트 기반 추천기(1413)는 DM와 관련된 글 임베딩 및 상기 DBOW 와 관련된 글 임베딩을 결합(concatenation )하여 결합된 글 임베딩을 획득하는 단계(1530)를 수행할 수 있다. 텍스트 기반 추천기(1413)는 메모리에 미리 저장되어 있는 복수의 글들에 대한 글 임베딩들과 결합된 글 임베딩 사이의 코사인 유사도를 계산하여, 복수의 글들 중 사용자의 글과 가장 유사한 글을 선택하는 단계(1540)를 수행할 수 있다. 텍스트 기반 추천기(1413)는 선택된 글과 관련된 전문 상담글에 대한 정보를 획득하는 단계(1550)를 수행할 수 있다.

텍스트 기반 추천기(1413)는 학습부와 인식부를 포함할 수 있다. 텍스트 기반 추천기(1413)의 학습부 및 인식부는 하나의 장치로 구현될 수 있다. 하지만 이에 한정되는 것은 아니며 텍스트 기반 추천기(1413)의 학습부와 인식부는 서로 다른 장치로 구현될 수 있다. 텍스트 기반 추천기(1413)의 학습부가 학습모델을 획득하고 텍스트 기반 추천기(1413)의 인식부로 학습모델을 전송할 수 있다. 텍스트 기반 추천기(1413)의 인식부는 학습모델을 이용하여 사용자의 글과 가장 유사한 글을 선택할 수 있다.

텍스트 기반 추천기(1413)는 적어도 하나의 프로세서 및 메모리로 구성될 수 있다. 텍스트 기반 추천기(1413)의 메모리에 저장된 명령어가 프로세서에 의하여 실행될 수 있다.

텍스트 기반 추천기(1413)의 학습부는 복수의 사용자의 사연글들을 수신할 수 있다. 기반 추천기(1413)의 학습부는 사용자의 글에 포함된 형태소들 중 불용어(stopword) 및 저빈도 형태소를 제거하여 중간 데이터를 획득하는 단계(1510)를 수행할 수 있다. 불용어는 관사, 전치사, 조사, 접속사와 같이 검색 색인 단어로 의미가 없는 단어를 의미한다. 텍스트 기반 추천기(1413)의 학습부는 형태소들 중 등장횟수가 소정의 임계값을 넘지 않는 형태소를 제거할 수 있다.

텍스트 기반 추천기(1413)의 학습부는 중간 데이터에 거리 관리 모델(distant supervision model)을 적용하여 Distributed memory(DM)와 관련된 학습모델 및 Distributed bag of words(DBOW)와 관련된 학습모델을 획득할 수 있다. DM과 DBOW에 대해서는 도 16에서 보다 자세하게 설명한다.

도 16은 본 개시의 일 실시예에 따른 Distributed memory 및 Distributed bag of words를 설명하기 위한 도면이다.

블록(1600)은 DM을 설명하기위한 도면이다. DM에 따르면 문단의 식별정보 및 소정의 위치 근처 있는 단어들에 기초하여 소정의 위치 근처의 다른 단어들을 학습하는 모델이다.

예를 들어, 텍스트 기반 추천기(1413)의 학습부는 사용자의 사연글에 포함된 복수의 형태소 중 임의의 연속된 형태소들(1602, 1603, 1604)을 획득할 수 있다. 또한 텍스트 기반 추천기(1413)의 학습부는 사용자의 사연글에 대한 식별정보(1601)를 획득할 수 있다. 텍스트 기반 추천기(1413)의 학습부는 식별정보(1601) 및 연속된 형태소들(1602, 1603, 1604)에 기초하여 연속된 형태소 바로 다음에 올 형태소(1605)를 학습할 수 있다. 텍스트 기반 추천기(1413)의 학습부는 복수의 사연글을 학습하여 정확도를 높일 수 있다.

식별정보(1601) 및 연속된 형태소들(1602, 1603, 1604)은 벡터 또는 메트릭스로 표현될 수 있다. 형태소에 대응하는 벡터 또는 메트릭스는 {A1, A2, A3, A4, ... Ak}와 같은 형식을 가질 수 있다. k는 차원 수를 나타내며, A1, A2, A3, A4, ... Ak는 실수일 수 있다. 텍스트 기반 추천기(1413)의 학습부는 식별정보(1601)의 벡터 및 연속된 형태소들(1602, 1603, 1604)의 벡터의 합이 형태소(1605)의 벡터가 되도록 학습할 수 있다. 학습과정에서 식별정보(1601)의 벡터 및 연속된 형태소들(1602, 1603, 1604)의 벡터들은 갱신될 수 있다.

블록(1610)은 DBOW를 설명하기위한 도면이다. DBOW에 따르면 문단의 식별정보에 기초하여 문단에 포함된 단어들을 학습하는 모델이다.

예를 들어, 텍스트 기반 추천기(1413)의 학습부는 사용자의 사연글에 대한 식별정보(1611)를 획득할 수 있다. 텍스트 기반 추천기(1613)의 학습부는 식별정보(1611)에 기초하여 형태소들(1612, 1613, 1614, 1615)를 학습할 수 있다. 텍스트 기반 추천기(1413)의 학습부는 복수의 사연글을 학습하여 정확도를 높일 수 있다. 식별정보(1611) 또는 형태소들(1612, 1613, 1614, 1615)은 벡터 또는 메트릭스로 표현될 수 있다.

텍스트 기반 추천기(1413)의 학습부는 DM과 관련된 학습모델 및 DBOW와 관련된 학습모델을 결합(concatenation)할 수 있다. 또한 텍스트 기반 추천기(1413)의 학습부는 DM과 관련된 학습모델 및 DBOW와 관련된 학습모델을 인식부로 전송할 수 있다.

텍스트 기반 추천기(1413)의 인식부는 사용자로부터 사연글을 수신하는 단계를 수행할 수 있다. 텍스트 기반 추천기(1413)의 인식부는 사용자의 글에 포함된 형태소들 중 불용어 및 저빈도 형태소를 제거하여 중간 데이터를 획득하는 단계(1510)를 수행할 수 있다.

텍스트 기반 추천기(1413)의 인식부는 중간 데이터에 거리 관리 모델(distant supervision model)을 적용하여 DM과 관련된 글 임베딩 및 DBOW와 관련된 글 임베딩을 획득하는 단계(1520)를 수행할 수 있다. 텍스트 기반 추천기(1413)의 인식부는 DM과 관련된 학습모델에 기초하여 DM과 관련된 글 임베딩을 획득할 수 있다. 텍스트 기반 추천기(1413)의 인식부는 DBOW와 관련된 학습모델에 기초하여 DBOW와 관련된 글 임베딩을 획득할 수 있다. DM과 관련된 학습모델 및 DBOW와 관련된 학습모델은 텍스트 기반 추천기(1413)의 학습부로부터 수신할 수 있다.

텍스트 기반 추천기(1413)의 인식부는 사용자의 글에 포함된 형태소에 DM과 관련된 학습모델을 적용하여, 사용자의 글의 식별 정보(1501)를 획득할 수 있다. 사용자의 글의 식별 정보(1501)가 DM과 관련된 글 임베딩이될 수 있다. 또한 텍스트 기반 추천기(1413)의 인식부는 사용자의 글에 포함된 형태소에 DBOW와 관련된 학습모델을 적용하여, 사용자의 글의 식별 정보(1511)를 획득할 수 있다. 사용자의 글의 식별 정보(1511)가 DBOW와 관련된 글 임베딩이될 수 있다.

텍스트 기반 추천기(1413)의 인식부는 DM과 관련된 글 임베딩 및 상기 DBOW 와 관련된 글 임베딩을 결합(concatenation)하여 결합된 글 임베딩을 획득하는 단계(1530)를 수행할 수 있다. 텍스트 기반 추천기(1413)의 인식부는 소정의 함수를 이용하여 DM과 관련된 글 임베딩과 DBOW와 관련된 글 임베딩을 결합할 수 있다.

텍스트 기반 추천기(1413)의 인식부는 메모리에 미리 저장되어 있는 복수의 글들에 대한 글 임베딩들과 상기 결합된 글 임베딩 사이의 코사인 유사도를 계산하여, 상기 복수의 글들 중 상기 사용자의 글과 가장 유사한 글을 선택하는 단계(1540)를 수행할 수 있다. 텍스트 기반 추천기(1413)의 인식부는 미리 저장되어 있는 사연글에 대하여 글 임베딩을 저장하고 있을 수 있다. 글 임베딩은 벡터 또는 메트릭스일 수 있으므로, 텍스트 기반 추천기(1413)의 인식부는 글 임베딩들 사이의 코사인 유사도를 계산할 수 있다. 또한 텍스트 기반 추천기(1413)의 인식부는 현재 사용자의 사연글과 가장 유사한 다른 사용자의 글을 선택할 수 있다.

텍스트 기반 추천기(1413)의 인식부는 선택된 글과 관련된 전문 상담글에 대한 정보를 획득하는 단계(1550)를 수행할 수 있다. 텍스트 기반 추천기(1413)의 인식부의 미리 저장되어 있는 복수의 글들에는 전문 상담사의 상담글이 함께 저장되어 있을 수 있다. 텍스트 기반 추천기(1413)의 인식부는 현재 사용자의 사연글과 가장 유사한 다른 사용자의 사연글에 대응되는 전문 상담사의 상담글을 획득할 수 있다. 텍스트 기반 추천기(1413)의 인식부는 전문 상담사의 상담글을 사용자에게 제공할 수 있다.

도 17은 본 개시의 일 실시예에 따른 로그 기반 추천기(1414)의 동작을 나타낸 흐름도 이다.

로그 기반 추천기(1414)는 복수의 사용자의 활동 로그에 기초하여 사용자 임베딩에 대한 정보를 획득하는 단계(1710)를 수행할 수 있다. 로그 기반 추천기(1414)는 사용자 임베딩에 대한 정보를 협업 필터링(collaborative filtering)하여 상기 메모리에 미리 저장되어 있는 복수의 글들 중에서 상기 사용자의 상태와 관련이 가장 높은 글을 선택하는 단계(1720)를 수행할 수 있다. 협업 필터링은 사용자들의 서비스 이용에 관한 정보를 분석하여 사용자가 선호하는 정보를 예측하는 방법이다.

로그 기반 추천기(1414)는 학습부와 인식부를 포함할 수 있다. 로그 기반 추천기(1414)의 학습부 및 인식부는 하나의 장치로 구현될 수 있다. 하지만 이에 한정되는 것은 아니며 로그 기반 추천기(1414)의 학습부와 인식부는 서로 다른 장치로 구현될 수 있다. 로그 기반 추천기(1414)의 학습부가 학습모델을 획득하고 로그 기반 추천기(1414)의 인식부로 학습모델을 전송할 수 있다. 로그 기반 추천기(1414)의 인식부는 사용자 활동 로그에 학습모델을 적용하여 사용자의 심리 상태와 유사한 사연글을 획득할 수 있다.

활동 로그는 사용자가 열람한 게시글에 대한 정보, 댓글, 사용자가 공감을 표시한 글에 대한 정보 및 사용자의 북마크 중 적어도 하나를 포함할 수 있다. 로그 기반 추천기(1414)의 학습부는 활동 로그 중 양의 상관관계가 있는 정보를 병합하여 차원을 줄일 수 있다.

로그 기반 추천기(1414)의 학습부는 복수의 사용자들의 활동 로그를 획득할 수 있다. 로그 기반 추천기(1414)의 학습부는 사용자 식별정보 및 사용자의 활동 로그를 대응시킬 수 있다. 또한 로그 기반 추천기(1414)의 학습부는 사용자들의 활동 로그를 기계학습하여 사용자들의 활동 로그와 사용자와 연관된 사연글의 관계에 대한 학습모델을 획득할 수 있다. 사용자와 연관된 사연글은 사용자가 공감을 표시한 글, 사용자가 많이 열람한 글, 사용자가 검색에 이용한 키워드와 관련된 글 등이 될 수 있다. 로그 기반 추천기(1414)의 학습부는 학습모델을 로그 기반 추천기(1414)의 인식부에 전달할 수 있다.

로그 기반 추천기(1414)의 인식부는 사용자의 활동 로그를 획득할 수 있다. 또한 로그 기반 추천기(1414)의 인식부는 사용자의 활동 로그 중 적어도 하나를 차원 축소(dimensionality reduction)하여 사용자 임베딩에 대한 정보를 생성할 수 있다. 로그 기반 추천기(1414)의 인식부는 사용자 임베딩에 대한 정보를 협업 필터링하는 단계를 수행할 수 있다. 예를 들어, 로그 기반 추천기(1414)의 인식부는 사용자 임베딩에 대한 정보에 학습모델을 적용하여 사용자의 상태와 관련이 가장 높은 글을 선택할 수 있다. 로그 기반 추천기(1414)의 인식부는 사용자에게 선택된 글을 제공할 수 있다.

로그 기반 추천기(1414)의 인식부는 사용자의 활동 로그 중 적어도 하나를 차원 축소(dimensionality reduction)하여 차원 축소된 사용자 활동 로그를 생성할 수 있다. 로그 기반 추천기(1414)의 인식부는 차원 축소된 사용자 활동 로그에 학습모델을 적용하여 사용자 임베딩에 대한 정보를 획득할 수 있다. 또한 로그 기반 추천기(1414)의 인식부는 미리 저장되어 있는 복수의 글들 중 사용자 임베딩과 대응되는 글을 사용자의 상태와 관련이 가장 높은 글로 선택할 수 있다. 로그 기반 추천기(1414)의 인식부는 사용자에게 선택된 글을 제공할 수 있다.

로그 기반 추천기(1414)의 학습부 및 인식부는 심리 프로파일에 더 기초하여 사용자 임베딩에 대한 정보를 획득하는 단계를 수행할 수 있다. 심리 프로파일은 복수의 사용자의 성별, 나이, 성향 프로파일 및 성격형 테스트 결과 중 적어도 하나를 포함할 수 있다.

이제까지 다양한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.

110: 학습부
120: 인식부
210: 데이터 획득부
220: 전처리부
230: 학습 데이터 선택부
240: 모델 학습부
250: 모델 평가부

Claims

텍스트에 기초하여 사용자 심리상태를 예측하기 위한 장치에 있어서,
상기 장치는 프로세서 및 적어도 하나의 프로그램이 저장되는 메모리를 포함하고,
상기 메모리는 상기 적어도 하나의 프로그램이 상기 프로세서에서 실행될 때, 상기 프로세서가,
복수의 사용자들로부터 글(text), 고민 분류 정보 및 Patient Health Questionnaire(PHQ)와 관련된 정보를 포함하는 데이터 셋들을 수신하는 단계;
상기 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하는 단계;
Convolutional Neural Networks(CNN) 및 Long Short-Term Memory models(LSTM)를 포함하는 기계 학습을 이용하여, 상기 형태소 임베딩과 상기 고민 분류 정보의 상관 관계에 대한 제 1 학습모델을 획득하는 단계; 및
상기 기계 학습을 이용하여, 상기 형태소 임베딩과 상기 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델을 획득하는 단계;
를 실행하도록 하는 명령어들을 저장하는 심리상태예측장치.
제 1 항에 있어서,
상기 메모리는 상기 적어도 하나의 프로그램이 상기 프로세서에서 실행될 때, 상기 프로세서가,
상기 글에 포함된 문장의 감정 분류 정보 를 수신하는 단계; 및
상기 문장의 형태소 임베딩과 상기 문장의 감정 분류 정보의 상관 관계에 대한 제 3 학습 모델을 획득하는 단계를 실행하도록 하는 명령어들을 저장하는 심리상태예측장치.
제 2 항에 있어서,
상기 문장의 감정 분류 정보는 Plutchik wheel의 4개의 쌍을 포함하고,
상기 Plutchik wheel의 4개의 쌍은 기쁨(joy) 대 슬픔 (sadness), 분노(anger) 대 공포(fear), 신뢰(trust) 대 혐오(disgust), 및 놀람(surprise) 대 기대(anticipation)이고,
상기 제 3 학습 모델은, 상기 4개의 쌍에 포함된 각각의 쌍에 대하여 바이너리 회귀 학습 모델인 것을 특징으로 하는 심리상태예측장치.
텍스트에 기초하여 사용자 심리상태를 예측하기 위한 장치에 있어서,
상기 장치는 프로세서 및 적어도 하나의 프로그램이 저장되는 메모리를 포함하고,
상기 메모리는 상기 적어도 하나의 프로그램이 상기 프로세서에서 실행될 때, 상기 프로세서가,
사용자의 글을 수신하는 단계;
상기 사용자의 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하고,
형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델에 기초하여, 상기 형태소 임베딩에 대응되는, 상기 사용자의 고민 분류 정보를 획득하는 단계; 및
형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델에 기초하여, 상기 형태소 임베딩에 대응되는, 상기 사용자의 PHQ와 관련된 정보를 획득하는 단계,
를 실행하도록 하는 명령어들을 저장하는 심리상태예측장치.
제 4 항에 있어서,
상기 메모리는 상기 적어도 하나의 프로그램이 상기 프로세서에서 실행될 때, 상기 프로세서가,
형태소 임베딩과 문장의 감정 분류 정보의 상관 관계에 대한 제 3 학습 모델에 기초하여, 상기 사용자의 글에 포함된 문장의 형태소 임베딩에 대응되는 문장의 감정 분류 정보를 획득하는 단계; 및
상기 문장의 감정 분류 정보에 기초하여 사용자의 감정 라벨(label)을 결정하는 단계,
를 실행하도록 하는 명령어들을 저장하는 심리상태예측장치.
제 5 항에 있어서,
상기 메모리는 상기 적어도 하나의 프로그램이 상기 프로세서에서 실행될 때, 상기 프로세서가,
상기 제 3 학습 모델에 기초하여, 상기 사용자의 감정 라벨을 결정하기 위한 상기 사용자의 글의 형태소의 기여도를 결정하는 단계; 및
상기 기여도에 따라 상기 사용자의 글의 형태소를 다른 색으로 디스플레이에 표시하는 단계;
를 실행하도록 하는 명령어들을 저장하는 심리상태예측장치.
제 5 항에 있어서,
상기 메모리는 상기 적어도 하나의 프로그램이 상기 프로세서에서 실행될 때, 상기 프로세서가,
상기 사용자의 고민 분류 정보, 상기 PHQ와 관련된 정보, 및 상기 감정 라벨 중 적어도 하나에 기초하여 사용자에게 추천할 외부 콘텐츠 정보를 결정하는 단계;
를 실행하도록 하는 명령어들을 저장하는 심리상태예측장치.
제 4 항에 있어서,
상기 메모리는 상기 적어도 하나의 프로그램이 상기 프로세서에서 실행될 때, 상기 프로세서가,
상기 사용자의 글에 포함된 형태소들 중 불용어(stopword) 및 저빈도 형태소를 제거하여 중간 데이터를 획득하는 단계;
상기 중간 데이터에 거리 관리 모델(distant supervision model)을 적용하여 Distributed memory(DM)와 관련된 글 임베딩 및 Distributed bag of words(DBOW)와 관련된 글 임베딩을 획득하는 단계;
상기 DM와 관련된 글 임베딩 및 상기 DBOW 와 관련된 글 임베딩을 결합(concatenation)하여 결합된 글 임베딩을 획득하는 단계;
상기 메모리에 미리 저장되어 있는 복수의 글들에 대한 글 임베딩들과 상기 결합된 글 임베딩 사이의 코사인 유사도를 계산하여, 상기 복수의 글들 중 상기 사용자의 글과 가장 유사한 글을 선택하는 단계; 및
상기 선택된 글과 관련되 전문 상담글에 대한 정보를 획득하는 단계,
를 실행하도록 하는 명령어들을 저장하는 심리상태예측장치.
제 4 항에 있어서,
상기 메모리는 상기 적어도 하나의 프로그램이 상기 프로세서에서 실행될 때, 상기 프로세서가,
사용자의 활동 로그에 기초하여 사용자 임베딩에 대한 정보를 획득하는 단계;
상기 사용자 임베딩에 대한 정보를 협업 필터링(collaborative filtering)하여 상기 메모리에 미리 저장되어 있는 복수의 글들 중에서 상기 사용자의 상태와 관련이 가장 높은 글을 선택하는 단계를 실행하도록 하는 명령어들을 저장하고,
상기 사용자 임베딩에 대한 정보는 상기 사용자의 활동 로그를 차원 축소(dimensionality reduction)하여 생성된 정보이고,
상기 활동 로그는 사용자가 열람한 게시글에 대한 정보, 댓글, 사용자가 공감을 표시한 글에대한 정보 및 사용자의 북마크 중 적어도 하나를 포함하는 것을 특징으로 하는 심리상태예측장치.
제 9 항에 있어서,
상기 메모리는 상기 적어도 하나의 프로그램이 상기 프로세서에서 실행될 때, 상기 프로세서가,
심리 프로파일에 더 기초하여 사용자 임베딩에 대한 정보를 획득하는 단계를 실행하도록 하는 명령어들을 저장하고,
상기 심리 프로파일은 복수의 사용자의 성별, 나이, 성향 프로파일 및 성격형 테스트 결과 중 적어도 하나를 포함하는 것을 특징으로 하는 심리상태예측장치.
텍스트에 기초하여 사용자 심리상태를 예측하기 위한 방법에 있어서,
복수의 사용자들로부터 글(text), 고민 분류 정보 및 Patient Health Questionnaire(PHQ)와 관련된 정보를 포함하는 데이터 셋들을 수신하는 단계;
상기 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하는 단계;
Convolutional Neural Networks(CNN) 및 Long Short-Term Memory models(LSTM)를 포함하는 기계 학습을 이용하여, 상기 형태소 임베딩과 상기 고민 분류 정보의 상관 관계에 대한 제 1 학습모델을 획득하는 단계; 및
상기 기계 학습을 이용하여, 상기 형태소 임베딩과 상기 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델을 획득하는 단계를 포함하는 심리상태예측방법.
제 11 항에 있어서,
상기 글에 포함된 문장의 감정 분류 정보를 수신하는 단계; 및
상기 문장의 형태소 임베딩과 상기 문장의 감정 분류 정보의 상관 관계에 대한 제 3 학습 모델을 획득하는 단계를 포함하는 심리상태예측방법.
텍스트에 기초하여 사용자 심리상태를 예측하기 위한 방법에 있어서,
사용자의 글을 수신하는 단계;
상기 사용자의 글을 형태소 분석하여 형태소 임베딩(embedding)을 획득하고,
형태소 임베딩과 고민 분류 정보의 상관 관계에 대한 제 1 학습모델에 기초하여, 상기 형태소 임베딩에 대응되는, 상기 사용자의 고민 분류 정보를 획득하는 단계; 및
형태소 임베딩과 PHQ와 관련된 정보의 상관 관계에 대한 제 2 학습모델에 기초하여, 상기 형태소 임베딩에 대응되는, 상기 사용자의 PHQ와 관련된 정보를 획득하는 단계를 포함하는 심리상태예측방법.
제 13 항에 있어서,
형태소 임베딩과 문장의 감정 분류 정보의 상관 관계에 대한 제 3 학습 모델에 기초하여, 상기 사용자의 글에 포함된 문장의 형태소 임베딩에 대응되는 문장의 감정 분류 정보를 획득하는 단계; 및
상기 문장의 감정 분류 정보에 기초하여 사용자의 감정 라벨(label)을 결정하는 단계를 포함하는 심리상태예측방법.
제 14 항에 있어서,
상기 사용자의 고민 분류 정보, 상기 PHQ와 관련된 정보, 및 상기 감정 라벨 중 적어도 하나에 기초하여 사용자에게 추천할 외부 콘텐츠 정보를 결정하는 단계를 포함하는 심리상태예측방법.
제 11 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 포함하는 컴퓨터 프로그램 제품.