KR20160120981A

KR20160120981A - 사례 베이스와 빅데이터를 이용한 평가 기준 정보의 생성 방법

Info

Publication number: KR20160120981A
Application number: KR1020150050290A
Authority: KR
Inventors: 권오병
Original assignee: 경희대학교 산학협력단
Priority date: 2015-04-09
Filing date: 2015-04-09
Publication date: 2016-10-19
Also published as: KR101687482B1

Abstract

본 발명은 평가 기준 정보의 생성 방법에 관한 것으로, 보다 구체적으로 빅 데이터로부터 평가 대상에 해당하는 평가 테이블을 생성하고, 평가 테이블과 사례베이스에 기초하여 평가 대상에 대해 생성한 케이스 테이블을 혼합 이용하여 평가 기준 정보를 생성함으로써, 정확하지만 적은 사례베이스와 다양하고 방대하지만 정확하지 않은 빅데이터를 이용하여 높은 정확성으로 평가 대상을 평가할 수 있는 평가 기준 정보의 생성 방법 및 평가 기준 정보를 이용하여 사용자의 상태를 평가할 수 있는 방법에 관한 것이다.

Description

사례 베이스와 빅데이터를 이용한 평가 기준 정보의 생성 방법{Method for producing estimate index based on case and big-data}

사례 베이스에 기초한 평가 정보는 평가 대상, 예를 들어 사용자의 심리적 또는 신체적 상태(우울증, 불면증, 스트레스 등의 심리적 상태 또는 고혈압, 비만, 혈압 등)을 평가하기 위하여 평가 대상에 해당하는 사용자의 사례를 조사하고, 조사한 사례에 기초하여 전문가가 해당 평가 대상을 가지는 사용자의 공통된 요인을 추출하여 평가 정보를 생성한다. 생성한 평가 정보에 기초하여 해당 평가 정보에 해당하는 경우 사용자는 평가 대상에 해당하는 것으로 판단하며, 이에 따라 사용자에 컨설팅 정보를 제공할 수 있다.

그러나 사례 베이스는 수집 지식(collective knowledge)으로 평가 대상에 대한 정확한 평가 정보를 생성하는데 도움이 되지만, 평가 대상에 대한 사례가 방대한 경우에만 정확한 평가 정보를 생성할 수 있으며 평가 대상에 해당하는 사례가 적은 경우에는 평가 정보를 생성하기 곤란하다는 문제점을 가진다. 더욱이 평가 대상에 대한 사례를 수집하는데 많은 시간과 비용이 소요된다는 문제점을 가진다.

한편, 빅데이터(big data)의 경우 평가 대상에 직접 일치되는 사례는 아니지만, 평가 대상에 부합하는 정보를 포함하고 있으며 시간이 경과할수록 그 정보의 양이 기하급수적으로 증가하여 용이하고 저렴한 비용으로 평가 대상에 부합하는 정보를 획득할 수 있다는 장점을 가진다.

사례 베이스와 빅데이터를 결합하여 사례가 적은 경우에서도 평가 대상에 대한 정확한 평가 기준 정보를 용이하게 생성할 수 있으며, 시간이 경과할수록 평가 성능과 정확도가 향상될 수 있는 평가 기준 정보의 생성 방법이 요구된다.

더욱이 최근에는 유비쿼터스 환경에서 심리적 또는 신체적 사용자 상태를 평가하여 컨설팅을 제공하는 헬스케어가 널리 보급되어 사용되고 있는데, 반복하여 주기적으로 사용자의 상태를 평가시 대부분이 정상적인 상태로 평가되고 일부 비정상적인 상태로 판단되는 평가 대상의 경우, 전체 평가 횟수에 비해 일부의 경우에만 비정상적인 상태로 판단되기 때문에 이러한 평가 대상에 대한 사례를 수집하기 곤란하다는 문제점을 가진다.

본 발명이 이루고자 하는 목적은 위에서 언급한 종래 평가 기준 정보의 생성 방법이 가지는 문제점을 해결하기 위한 것으로, 본 발명이 이루고자 하는 목적은 사례 베이스와 빅데이터를 혼합 이용하여 평가 대상에 대한 정확한 평가 기준 정보를 생성하는 방법을 제공하는 것이다.

본 발명이 이루고자 하는 다른 목적은 평가 대상에 대한 사례가 부족한 경우에도 빅데이터를 이용하여 해당 평가 대상을 정확하게 판단할 수 있는 평가 기준 정보를 생성하는 방법을 제공하는 것이다.

본 발명이 이루고자 하는 또 다른 목적은 사례 베이스와 빅데이터를 이용하여 생성한 평가 기준 정보를 이용하여 사용자의 상태를 정확하게 판단할 수 있는 방법을 제공하는 것이다.

본 발명의 목적을 달성하기 위하여, 본 발명에 따른 평가 기준 정보의 생성 방법은 빅 데이터로부터 평가 대상과 관련된 관련 단어를 추출하고 추출한 관련 단어로부터 평가 테이블을 생성하며, 다수 사용자를 대상으로 평가 대상에 대한 전문가의 평가 정보를 구비하는 사례 테이블과 평가 테이블을 조합하여 평가 대상에 대한 평가 기준 정보를 생성하는 것을 특징으로 한다.

여기서 관련 단어를 추출하는 생성하는 단계는 빅 데이터에서 평가 대상에 해당하는 단어를 구비하는 컨텐츠를 검색하는 단계와, 검색한 컨텐츠에 존재하는 단어 중 삭제 데이터베이스에 저장되어 있는 삭제 단어를 삭제하여 컨텐츠에 존재하는 단어 중 삭제 단어를 제외한 잔존 단어를 추출하는 단계와, 잔존 단어와 평가 대상에 해당하는 단어 사이의 연관 여부를 판단하여 잔존 단어 중에서 평가 대상에 해당하는 단어에 연관된 단어를 관련 단어로 추출하는 단계를 포함하는 것을 특징으로 한다.

여기서 연관 여부를 판단하는 단계의 일 예는 컨텐츠에서 상기 평가 대상에 해당하는 단어가 포함되어 있는 포함 문장 세트와 컨텐츠에서 평가 대상에 해당하는 단어가 포함되지 않은 비포함 문장 세트를 랜덤하게 추출하는 단계와, 포함 문장 세트에서 잔존 단어의 등장 빈도와 비포함 문장 세트에서 잔존 단어의 등장 빈도를 계산하는 단계와, 포함 문장 세트에서 잔존 단어의 등장 빈도와 비포함 문장 세트에서 잔존 단어의 등장 빈도에 기초하여 잔존 단어와 평가 대상에 해당하는 단어 사이의 연관 여부를 판단하는 단계를 통해 계산되는 것을 특징으로 한다.

바람직하게, 포함 문장 세트에서 잔존 단어의 등장 빈도와 비포함 문장 세트에서 잔존 단어의 등장 빈도의 차이가 빈도 임계값 이상인 경우 잔존 단어와 평가 대상에 해당하는 단어 사이에 서로 연관이 있는 것으로 판단하는 것을 특징으로 한다.

여기서 연관 여부를 판단하는 단계의 다른 예는 빅 데이터에서, 평가 대상에 해당하는 단어와 잔존 단어의 조합으로 이루어진 검색식으로 검색된 조합 컨텐츠의 수와 잔존 단어로 이루어진 검색식으로 검색된 단일 컨텐츠의 수를 비교하는 단계와, 조합 컨텐츠의 수와 단일 컨텐츠의 수의 차이에 기초하여 잔존 단어와 평가 대상에 해당하는 단어 사이의 연관 여부를 판단하는 단계를 포함하는 것을 특징으로 한다.

바람직하게, 조합 컨텐츠의 수와 단일 컨텐츠의 수의 차이가 연관 임계값 이하인 경우 잔존 단어와 평가 대상에 해당하는 단어 사이에 서로 연관이 있는 것으로 판단하는 것을 특징으로 한다.

여기서 관련 단어로부터 평가 테이블을 생성하는 단계는 관련 단어와 경미 형용사의 조합으로 이루어진 검색식으로 검색된 경미 컨텐츠의 수 및 관련 단어와 심각 형용사의 조합으로 이루어진 검색식으로 검색된 심각 컨텐츠의 수를 비교하는 단계와, 심각 컨텐츠의 수가 경미 컨텐츠의 수보다 많으며, 경미 컨텐츠의 수와 심각 컨텐츠의 수의 차이가 정도 임계값 이상인 관련 단어를 최종 관련 단어로 추출하는 단계와, 최종 관련 단어와 최종 관련 단어에 해당하는 레벨값으로부터 이루어진 평가 테이블을 생성하는 단계를 포함하는 것을 특징으로 한다.

한편, 본 발명에 따른 사용자 상태의 평가 방법은 빅 데이터로부터 평가 대상과 관련된 관련 단어를 추출하고 관련 단어로부터 평가 테이블을 생성하는 단계와, 사용자 주변에 배치되어 있는 환경 센서를 통해 사용자 환경 정보를 획득하는 단계와, 사용자 환경 정보 또는 사용자 상태 정보를 평가 테이블 또는 사례 테이블에 적용하여 사용자 환경 정보가 평가 테이블 또는 상기 사례 테이블에 해당하는지 여부로 사용자가 평가 대상에 해당하는지 평가하는 단계를 포함하며, 여기서 사례 테이블은 다수 사용자를 대상으로 평가 대상에 대한 전문가의 평가 정보를 구비하는 것을 특징으로 한다.

여기서 평가 대상은 사용자의 심리적 또는 신체적 진단 항목인 것을 특징으로 한다.

본 발명에 따른 평가 대상의 평가 기준 정보의 생성 방법은 다음과 같은 효과를 가진다.

첫째, 본 발명에 따른 평가 기준 정보의 생성 방법은 사례 베이스와 빅데이터를 혼합 이용하여 평가 대상에 대한 평가 기준 정보를 생성함으로써, 사례 베이스에 기초한 정확한 평가 정보와 방대한 양의 빅데이터에 기초한 보편적 평가 정보를 이용하여 평가 기준 정보를 생성할 수 있다.

둘째, 본 발명에 따른 평가 기준 정보의 생성 방법은 빅데이터로부터 생성한 평가 정보를 사례에 기초한 평가 정보와 혼합하여 평가 기준 정보를 생성함으로써, 사례가 부족한 평가 대상의 경우에도 해당 평가 대상을 정확하게 판단할 수 있다.

셋째, 본 발명에 따른 평가 기준 정보의 생성 방법은 사례 베이스와 빅데이터를 이용하여 생성된 평가 기준 정보를 제공함으로써, 평가 기준 정보에 획득한 사용자 상태 정보를 적용하여 우발적으로 발생되는 평가 대상도 정확하게 판단할 수 있다.

도 1은 본 발명에 따른 사용자 상태의 평가 시스템을 설명하기 위한 기능 블록도이다.
도 2는 본 발명에 따른 상태 평가 장치를 설명하기 위한 기능 블록도이다.
도 3은 사례 테이블과 평가 테이블의 일 예를 도시하고 있다.
도 4는 본 발명에 따른 평가 테이블 생성부를 보다 구체적으로 설명하기 위한 기능 블록도를 도시하고 있다.
도 5는 본 발명에 따른 사용자 상태의 평가 방법을 설명하기 위한 흐름도이다.
도 6은 본 발명에 따른 평가 테이블의 생성 단계를 보다 구체적으로 설명하기 위한 흐름도이다.
도 7은 평가 대상에 대한 사용자의 평가 결과의 일 예를 도시하고 있다.
도 8은 본 발명에 따른 평가 기준 정보의 생성 단계에서 잔존 단어와 평가 대상 사이의 연관 여부를 판단하는 방법의 일 예를 설명하기 위한 도면이다.
도 9는 본 발명에 따른 평가 기준 정보의 생성 단계에서 잔존 단어와 평가 대상 사이의 연관 여부를 판단하는 방법의 다른 예를 설명하기 위한 도면이다.

이하 첨부한 도면을 참고로 본 발명에 따른 평가 기준 정보의 생성 방법 및 이를 이용한 사용자 상태의 평가 방법에 대해 보다 구체적으로 설명한다.

도 1은 본 발명에 따른 사용자 상태의 평가 시스템을 설명하기 위한 기능 블록도이다.

도 1을 참고로 보다 구체적으로 살펴보면, 관리자 단말기(10), 빅데이터 서버(30), 상태 평가 장치(40) 및 사용자 상태 정보 획득부(50)가 네트워크(20)에 접속되어 있다.

여기서 관리자 단말기(20)는 상태 평가 장치(40)를 운영하는 관리자가 사용하는 단말기로 네트워크(20)를 통해 빅데이터 서버(30) 또는 상태 평가 장치(40)와 데이터를 송수신할 수 있는 개인용 단말기, 스마트폰 등이 사용될 수 있다.

여기서 빅데이터 서버(30)는 평가 대상에 대한 방대한 양의 정보를 제공하는 포털사이트 서버 또는 SNS 서버 등을 의미하며, 빅데이터 서버(30)는 관리자 단말기(10)로부터 입력된 사용자 명령에 따라 평가 대상에 해당하는 컨텐츠를 상태 평가 장치(40)로 제공한다.

여기서 상태 평가 장치(40)는 빅데이터 서버(30)로부터 수신한 컨텐츠에 기초하여 평가 대상에 관련한 관련 단어를 추출하고, 추출한 관련 단어로부터 평가 대상을 평가하기 위한 평가 테이블을 생성한다. 또한, 사용자 단말기(미도시) 또는 사용자 상태 감지부(50)로부터 획득한 사용자의 상태 정보를 빅데이터로부터 생성된 평가 테이블 또는 사례베이스로부터 작성된 사례 테이블에 적용하여 평가 대상에 대한 사용자의 상태를 평가한다. 바람직하게, 상태 평가 장치(40)는 평가 대상에 대한 사용자의 상태를 평가한 후, 평가 결과를 사용자 단말기로 송신하여 사용자에 알려주거나 평가 결과에 따른 컨설팅 정보를 평가 결과와 함께 사용자 단말기로 송신하여 사용자에 알려줄 수 있다.

평가 대상이란 사용자의 심리적 또는 신체적 상태이며, 예를 들어 우울증, 불면증, 스트레스 등의 심리적 상태 또는 고혈압, 비만, 혈압 등의 신체적 상태인 것을 특징으로 한다. 본 발명이 적용되는 분야에 따라 다양한 종류의 평가 대상이 사용될 수 있으며, 이는 본 발명의 범위에 속한다.

여기서 사용자 상태 감지부(50)는 사용자의 상태, 예를 들어 사용자의 혈압, 혈당, 몸무게 등의 신체 상태 정보와, 온도, 습도, 소음 등의 환경 상태 정보와, 사용자의 직업, 현재 상황 등의 사용자 상황 정보를 획득하는 센서가 사용될 수 있다. 즉, 사용자 상태 감지부(50)는 사용자 공간에 배치되어 있는 센서를 통해 사용자의 신체 상태 정보 또는 환경 상태 정보를 획득하거나, 사용자 신체에 부착되어 있는 센서를 통해 신체 상태 정보 또는 사용자 상황 정보를 획득한다.

도 2는 본 발명에 따른 상태 평가 장치를 설명하기 위한 기능 블록도이다.

도 2를 참고로 보다 구체적으로 살펴보면, 평가 테이블 생성부(110)는 평가 대상에 대한 컨텐츠를 빅데이터 서버(30)로부터 요청하며, 빅데이터 서버(30)로부터 수신한 컨텐츠에 기초하여 평가 대상과 관련된 관련 단어를 추출하여 평가 대상에 대한 평가 테이블을 생성한다. 생성한 평가 테이블은 평가 기준 정보 데이터베이스(130)에 저장된다.

평가부(170)는 사용자 정보 획득부(130)에서 사용자 상태 감지부(50)로부터 수신한 사용자 상태 정보 또는 사용자 단말기로부터 수신한 사용자 상태 정보를 평가 기준 정보 데이터베이스(150)에 저장되어 있는 평가 테이블 또는 사례 테이블에 적용하여 사용자의 상태를 판단한다.

평가 기준 정보 데이터베이스(150)에는 평가 테이블 생성부(110)에서 생성된 평가 테이블 이외에 사례 테이블이 저장되어 있는데, 도 3(a)는 평가 테이블의 일 예를 도시하고 있으며 도 3(b)는 사례 테이블의 일 예를 도시하고 있다. 여기서 사례 테이블은 평가 대상의 전문가가 평가 대상의 사용자에 대한 평가 대상의 평가 정보를 구비하고 있는 사례로부터 생성되는 것을 특징으로 한다. 도 3(a)에 도시되어 있는 같이 사례 테이블은 평가 대상에 해당하는 사용자에 개인화된 전문가에 대한 평가 정보를 구비하고 있으며, 도 3(b)에 도시되어 있는 바와 같이 평가 테이블은 빅데이터로부터 평가 대상에 해당하는 단어와 관련 단어를 추출하여 평가 대상에 해당하는 보편적인 평가 정보를 구비하고 있다.

여기서 사용자 정보 획득부(130)는 사용자 상태 감지부(50)와 통신을 수행하여 사용자 상태 정보를 수신하거나 사용자 단말기로부터 사용자 상태 정보를 수신하는데, 예를 들어 사용자가 소지하며 업무 또는 통화를 수행하는 사용자 단말기의 일정 애플리케이션을 이용하여 사용자가 현재 수행하는 업무 또는 만나는 사람, 사용자가 현재 위치하는 장소 등에 기초하여 사용자의 상황 정보를 수신할 수 있다.

도 4는 본 발명에 따른 평가 테이블 생성부를 보다 구체적으로 설명하기 위한 기능 블록도를 도시하고 있다.

도 4를 참고로 보다 구체적으로 살펴보면, 컨텐츠 검색부(111)는 평가 대상이 입력되는 경우 빅데이터 서버에 접속하여 평가 대상과 관련한, 즉 평가 대상이 색인어 또는 식별자로 기재되어 있는 컨텐츠를 검색하며, 평가 대상에 해당하는 단어를 구비하는 컨텐츠를 빅데이터 서버로부터 수신한다. 본 발명이 적용되는 분야에 따라 컨텐츠 검색부(111)는 평가 대상에 관련한 컨텐츠만이 저장되어 있는 빅데이터 서버로 한정하여 평가 대상과 관련한 컨텐츠를 검색할 수 있다.

잔존 단어 추출부(113)는 검색한 컨텐츠를 구성하는 단어들 중에서 삭제 단어 데이버베이스(115)에 저장되어 있는 삭제 단어를 삭제하여 검색한 컨텐츠에서 삭제 단어를 제외하고 잔존하는 단어를 잔존 단어로 추출한다. 여기서 삭제 단어 데이터베이스(115)에는 평가 대상과 관련이 떨어지는 단어들로 이루어진 삭제 단어들이 저장되어 있는데, 이러한 삭제 단어는 평가 대상에 따라 전문가에 의해 사전 선택되어 삭제 단어 데이터베이스(115)에 저장될 수 있다.

연관 단어 추출부(117)는 추출한 잔존 단어와 평가 대상 사이의 연관 여부를 판단하여 잔존 단어 중에서 평가 대상에 연관이 있는 잔존 단어를 관련 단어로 추출한다. 테이블 생성부(119)는 추출한 관련 단어를 이용하여 평가 대상을 평가하는데 사용되는 평가 테이블을 생성한다. 바람직하게, 테이블 생성부(119)는 관련 단어와 각 관련 단어에 대한 평가 대상의 평가 점수로부터 평가 테이블을 생성하며, 더욱 바람직하게 평가 대상의 평가 점수는 평가 대상의 전문가에 의해 상/중/하 또는 정상/비정상으로 설정될 수 있다.

도 5는 본 발명에 따른 사용자 상태의 평가 방법을 설명하기 위한 흐름도이다.

도 5를 참고로 보다 구체적으로 살펴보면, 사용자가 평가 대상에 해당하는지 평가하기 위하여 평가 대상과 관련된 관련 단어를 빅데이터로부터 추출하여 평가 테이블을 생성하고(S130), 생성한 평가 테이블과 사례 베이스에 기초하여 생성된 사례 테이블로부터 평가 기준 정보를 생성한다.

사용자 상태 정보 감지부 또는 사용자 단말기로부터 사용자 상태 정보를 수신하여 사용자 상태 정보를 획득하고(S150), 획득한 사용자 상태 정보 또는 사용자 단말기로부터 직접 입력된 사용자 상태 정보를 평가 기준 정보에 기초하여 사용자가 평가 대상에 해당하는지 사용자의 상태를 판단한다(S170).

도 6은 본 발명에 따른 평가 테이블의 생성 단계를 보다 구체적으로 설명하기 위한 흐름도이다.

도 6을 참고로 살펴보면, 빅데이터에서 평가 대상에 해당하는 단어를 색인어 또는 식별자로 구비하고 있는 컨텐츠를 검색하여 추출한다(S131). 빅데이터는 포털사이트 또는 소셜 네트워크 등과 같이 다수인이 자유롭게 컨텐츠를 업로드하거나 다운로드할 수 있어 방대하고 다양한 컨텐츠가 제공되는 것을 특징으로 한다. 바람직하게, 평가 대상의 평가 기준 정보를 정확하고 빠르게 생성하기 위하여 평가 대상과 직접 관련된 사이트나 소셜 네트워크로 한정하여 평가 대상에 해당하는 단어를 색인어 또는 식별자로 구비하는 컨텐츠를 검색할 수 있다.

검색한 컨텐츠에서 삭제 데이터베이스에 저장되어 있는, 평가 대상과 관련이 적은 삭제 단어를 삭제하여 검색한 컨텐츠를 구성하는 단어들 중 삭제 단어를 제외한 잔존 단어를 추출한다(S133). 검색한 컨텐츠에는 평가 대상과 직접 관련이 적은 단어들이 다수 기재되어 있을 수 있는데, 예를 들어 우울증이 평가 대상인 경우 우울증과 관련이 적은 "나, 너, 당신, 연구, 자료" 등을 삭제 단어로 설정할 수 있다. 여기서 삭제 단어는 평가 대상에 대한 전문가에 의해 설정될 수 있다.

추출한 잔존 단어와 평가 대상 사이에 연관 관계가 존재하는지 판단하여 잔존 단어 중 평가 대상과 연관 관계가 존재하는 단어를 관련 단어로 추출한다(S137).

추출한 관련 단어를 이용하여 평가 대상에 대한 평가 테이블을 생성하게 되며, 평가 테이블과 사례 베이스에 기초한 사례 테이블을 함께 이용하여 사용자가 평가 대상에 해당하는지 평가하게 된다. 사례 베이스에 기초한 사례 테이블은 평가 대상에 해당하는 주변 사용자로부터 직접 주변 사용자가 평가 대상인 경우 가지는 관련 단어 또는 특성에 기초하여 생성되는 것이므로, 평가 대상인 사례가 적은 경우에는 사례 테이블만을 이용하여 정확하게 사용자가 평가 대상에 해당하는지 판단하기 곤란하다. 한편, 빅데이터는 주변 사용자가 평가 대상인 경우 가지는 관련 단어 또는 특성을 반영하지 않지만, 평가 대상과 관련을 가질 수 있는 방대하고 다양한 종류의 컨텐츠를 포함하고 있다. 따라서 빅데이터로부터 평가 대상과 연관 관계를 가지는 관련 단어로부터 평가 테이블을 생성하고, 사용자 상태 정보를 평가 테이블과 사례 테이블에 함께 적용함으로써, 평가 대상에 대한 사례 베이스가 적은 경우에도 정확하게 사용자가 평가 대상에 해당하는지 판단할 수 있다.

한편, 사용자가 평가 대상에 해당하는지 주기적으로 판단하여 평가 대상에 해당하는 경우에는 비정상이고 평가 대상에 해당하지 않는 경우 정상으로 판단하는 경우, 대부분의 경우에는 정상으로 판단되는 평가 대상이 존재한다. 예를 들어, 도 7에 도시되어 있는 바와 같이 평가 대상이 우울증이며 1일 단위로 사용자가 우울증 증상이 있는지 판단하는 경우, 정상적인 사용자의 경우 대부분의 경우 우울증 증상이 없다. 따라서 사용자에게 우울증 증상이 있는 일을 정확하게 판단하여 사용자에게 우울증 증상이 존재함과 이에 따른 건강 컨설팅 정보를 제공하여야 하는데, 사례 베이스에 기초한 사례 테이블만을 이용하는 경우 사용자의 상태 정보가 사례와 동일한 경우에만 사용자에 우울증 증상이 존재하는 것으로 판단한다.

사용자가 평가 대상에 해당하는지 초기에 판단하여 사용자에 적절한 컨설팅 정보를 가능한 빨리 제공하는 것이 평가 대상을 극복하는데 효과적인데, 본 발명에서는 평가 대상에 대한 보편적인 정보를 구비하는 빅데이터로부터 평가 대상에 대한 평가 테이블을 생성하고 평가 테이블과 사례 테이블을 함께 이용하여 평가 대상에 해당하는지 사용자의 상태를 평가하기 때문에, 간헐적으로 발생하며 사용자마다 상이한 특성을 가지는 평가 대상에 대해 정확하게 평가할 수 있다.

도 8은 본 발명에 따른 평가 기준 정보의 생성 단계에서 잔존 단어와 평가 대상 사이의 연관 여부를 판단하는 방법의 일 예를 설명하기 위한 도면이다.

도 8을 참고로 살펴보면, 평가 대상에 해당하는 단어를 구비하는 검색한 컨텐츠에서 평가 대상에 해당하는 단어가 포함되어 있는 포함 문장 세트와 평가 대상에 해당하는 단어가 포함되어 있지 않은 비포함 문장 세트를 추출한다(S211).

추출한 포함 문장 세트에서 추출한 잔존 단어가 등장하는 빈도와 추출한 비포함 문장 세트에서 추출한 잔존 단어가 등장하는 빈도를 각각 계산한다(S213). 여기서 포함 문장 세트에서 잔존 단어가 등장하는 빈도는 포함 문장 세트를 구성하는 전체 문장의 수에서 잔존 단어가 등장하는 문장의 수의 비율로 계산할 수 있다. 이와 같이 비포함 문장 세트에서 잔존 단어가 등장하는 빈도는 비포함 문장 세트를 구성하는 전체 문장의 수에서 잔존 단어가 등장하는 문장의 수의 비율로 계산할 수 있다.

포함 문장 세트에서 잔존 단어가 등장하는 빈도와 비포함 문장 세트에서 잔존 단어가 등장하는 빈도를 서로 차감하여 계산되는 빈도 차이값이 임계 빈도값보다 큰지 판단한다(S215).

빈도 차이값이 임계 빈도값보다 큰 경우에는 잔존 단어와 평가 대상이 서로 연관 관계가 존재하는 것으로 판단하고(S217), 빈도 차이값이 임계 빈도값보다 작은 경우에는 잔존 단어와 평가 대상이 서로 연관 관계가 존재하지 않는 것으로 판단한다(S219).

도 9는 본 발명에 따른 평가 기준 정보의 생성 단계에서 잔존 단어와 평가 대상 사이의 연관 여부를 판단하는 방법의 다른 예를 설명하기 위한 도면이다.

도 9를 참고로 살펴보면, 빅데이터에서 평가 대상에 해당하는 단어와 잔존 단어로 이루어진 검색식을 이용하여 검색된 조합 컨텐츠의 수를 판단하고(S221), 빅데이터에서 잔존 단어로 이루어진 검색식을 이용하여 검색된 단일 컨텐츠의 수를 판단한다(S223).

조합 컨텐츠의 수와 단일 컨텐츠의 수를 서로 차감하여 수 차이값을 계산하며, 수 차이값과 연관 임계값을 서로 비교하여 수 차이값이 연관 임계값보다 큰지 판단한다(S225).

수 차이값이 연관 임계값보다 작은 경우에는 잔존 단어와 평가 대상이 서로 연관 관계가 존재하는 것으로 판단하고(S227), 수 차이값이 연관 임계값보다 작은 경우에는 잔존 단어와 평가 대상이 서로 연관 관계가 존재하지 않는 것으로 판단한다(S229).

한편, 상술한 본 발명의 실시 예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록 매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.

상기 컴퓨터로 읽을 수 있는 기록 매체는 전기 또는 자기식 저장 매체(예를 들어, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장 매체를 포함한다.

본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.

10: 관리자 단말기 20: 네트워크
30: 빅데이터 서버 40: 상태 평가 장치
50: 사용자 상태 감지부 110: 평가 테이블 생성부
130: 사용자 정보 획득부 150: 평가 기준 정보 DB
170: 평가부 111: 컨텐츠 검색부
113: 잔존 단어 추출부 115: 삭제 단어 DB
117: 연관 단어 추출부

Claims

빅 데이터로부터 평가 대상과 관련된 관련 단어를 추출하고, 추출한 상기 관련 단어로부터 평가 테이블을 생성하며,
다수 사용자를 대상으로 상기 평가 대상에 대한 전문가의 평가 정보를 구비하는 사례 테이블과 상기 평가 테이블을 조합하여 상기 평가 대상에 대한 평가 기준 정보를 생성하는 것을 특징으로 하는 평가 기준 정보의 생성 방법.
제 1 항에 있어서, 상기 관련 단어를 추출하는 생성하는 단계는
상기 빅 데이터에서 상기 평가 대상에 해당하는 단어를 구비하는 컨텐츠를 검색하는 단계;
검색한 상기 컨텐츠에 존재하는 단어 중 삭제 데이터베이스에 저장되어 있는 삭제 단어를 삭제하여 상기 컨텐츠에 존재하는 단어 중 상기 삭제 단어를 제외한 잔존 단어를 추출하는 단계; 및
상기 잔존 단어와 상기 평가 대상에 해당하는 단어 사이의 연관 여부를 판단하여 상기 잔존 단어 중에서 상기 평가 대상에 해당하는 단어에 연관된 단어를 관련 단어로 추출하는 단계를 포함하는 것을 특징으로 하는 평가 기준 정보의 생성 방법.
제 2 항에 있어서, 상기 연관 여부를 판단하는 단계는
상기 컨텐츠에서 상기 평가 대상에 해당하는 단어가 포함되어 있는 포함 문장 세트와 상기 컨텐츠에서 상기 평가 대상에 해당하는 단어가 포함되지 않은 비포함 문장 세트를 랜덤하게 추출하는 단계;
상기 포함 문장 세트에서 상기 잔존 단어의 등장 빈도와 상기 비포함 문장 세트에서 상기 잔존 단어의 등장 빈도를 계산하는 단계; 및
상기 포함 문장 세트에서 상기 잔존 단어의 등장 빈도와 상기 비포함 문장 세트에서 상기 잔존 단어의 등장 빈도에 기초하여 상기 잔존 단어와 상기 평가 대상에 해당하는 단어 사이의 연관 여부를 판단하는 단계를 통해 계산되는 것을 특징으로 하는 평가 기준 정보의 생성 방법.
제 3 항에 있어서,
상기 포함 문장 세트에서 상기 잔존 단어의 등장 빈도와 상기 비포함 문장 세트에서 상기 잔존 단어의 등장 빈도의 차이가 빈도 임계값 이상인 경우 상기 잔존 단어와 상기 평가 대상에 해당하는 단어 사이에 서로 연관이 있는 것으로 판단하는 것을 특징으로 하는 평가 기준 정보의 생성 방법.
제 2 항에 있어서, 상기 연관 여부를 판단하는 단계는
상기 빅 데이터에서, 상기 평가 대상에 해당하는 단어와 상기 잔존 단어의 조합으로 이루어진 검색식으로 검색된 조합 컨텐츠의 수와 상기 잔존 단어로 이루어진 검색식으로 검색된 단일 컨텐츠의 수를 비교하는 단계; 및
상기 조합 컨텐츠의 수와 상기 단일 컨텐츠의 수의 차이에 기초하여 상기 잔존 단어와 상기 평가 대상에 해당하는 단어 사이의 연관 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 평가 기준 정보의 생성 방법.
제 5 항에 있어서,
상기 조합 컨텐츠의 수와 상기 단일 컨텐츠의 수의 차이가 연관 임계값 이하인 경우 상기 잔존 단어와 상기 평가 대상에 해당하는 단어 사이에 서로 연관이 있는 것으로 판단하는 것을 특징으로 하는 평가 기준 정보의 생성 방법.
제 3 항 또는 제 5 항에 있어서, 상기 관련 단어로부터 평가 테이블을 생성하는 단계는
상기 관련 단어와 경미 형용사의 조합으로 이루어진 검색식으로 검색된 경미 컨텐츠의 수 및 상기 관련 단어와 심각 형용사의 조합으로 이루어진 검색식으로 검색된 심각 컨텐츠의 수를 비교하는 단계;
상기 심각 컨텐츠의 수가 상기 경미 컨텐츠의 수보다 많으며, 상기 경미 컨텐츠의 수와 상기 심각 컨텐츠의 수의 차이가 정도 임계값 이상인 관련 단어를 최종 관련 단어로 추출하는 단계; 및
상기 최종 관련 단어와 최종 관련 단어에 해당하는 레벨값으로부터 이루어진 평가 테이블을 생성하는 단계를 포함하는 것을 특징으로 하는 평가 기준 정보의 생성 방법.
빅 데이터로부터 평가 대상과 관련된 관련 단어를 추출하고, 상기 관련 단어로부터 평가 테이블을 생성하는 단계;
사용자 주변에 배치되어 있는 환경 센서를 통해 사용자 환경 정보를 획득하는 단계; 및
상기 사용자 환경 정보 또는 사용자 상태 정보를 상기 평가 테이블 또는 사례 테이블에 적용하여 상기 사용자 환경 정보가 상기 평가 테이블 또는 상기 사례 테이블에 해당하는지 여부로 사용자가 상기 평가 대상에 해당하는지 평가하는 단계를 포함하며,
여기서 사례 테이블은 다수 사용자를 대상으로 상기 평가 대상에 대한 전문가의 평가 정보를 구비하는 것을 특징으로 하는 사용자 상태 평가 방법.
제 8 항에 있어서, 상기 평가 대상은
상기 사용자의 심리적 진단 항목 또는 신체적 진단 항목인 것을 특징으로 하는 사용자 상태 평가 방법.
제 8 항에 있어서, 상기 관련 단어를 추출하는 생성하는 단계는
상기 빅 데이터에서 상기 평가 대상에 해당하는 단어를 구비하는 컨텐츠를 검색하는 단계;
검색한 상기 컨텐츠에 존재하는 단어 중 삭제 데이터베이스에 저장되어 있는 삭제 단어를 삭제하여 상기 컨텐츠에 존재하는 단어 중 상기 삭제 단어를 제외한 잔존 단어를 추출하는 단계; 및
상기 잔존 단어와 상기 평가 대상에 해당하는 단어 사이의 연관 여부를 판단하여 상기 잔존 단어 중에서 상기 평가 대상에 해당하는 단어에 연관된 단어를 관련 단어로 추출하는 단계를 포함하는 것을 특징으로 하는 사용자 상태 평가 방법.
제 10 항에 있어서, 상기 연관 여부를 판단하는 단계는
상기 컨텐츠에서 상기 평가 대상에 해당하는 단어가 포함되어 있는 포함 문장 세트와 상기 컨텐츠에서 상기 평가 대상에 해당하는 단어가 포함되지 않은 비포함 문장 세트를 랜덤하게 추출하는 단계;
상기 포함 문장 세트에서 상기 잔존 단어의 등장 빈도와 상기 비포함 문장 세트에서 상기 잔존 단어의 등장 빈도를 계산하는 단계; 및
상기 포함 문장 세트에서 상기 잔존 단어의 등장 빈도와 상기 비포함 문장 세트에서 상기 잔존 단어의 등장 빈도에 기초하여 상기 잔존 단어와 상기 평가 대상에 해당하는 단어 사이의 연관 여부를 판단하는 단계를 통해 계산되는 것을 특징으로 하는 사용자 상태 평가 방법.
제 11 항에 있어서,
상기 포함 문장 세트에서 상기 잔존 단어의 등장 빈도와 상기 비포함 문장 세트에서 상기 잔존 단어의 등장 빈도의 차이가 빈도 임계값 이상인 경우 상기 잔존 단어와 상기 평가 대상에 해당하는 단어 사이에 서로 연관이 있는 것으로 판단하는 것을 특징으로 하는 사용자 상태 평가 방법.
제 10 항에 있어서, 상기 연관 여부를 판단하는 단계는
상기 빅 데이터에서, 상기 평가 대상에 해당하는 단어와 상기 잔존 단어의 조합으로 이루어진 검색식을 이용하여 검색된 조합 컨텐츠의 수와 상기 잔존 단어로 이루어진 검색식을 이용하여 검색된 단일 컨텐츠의 수를 비교하는 단계; 및
상기 조합 컨텐츠의 수와 상기 단일 컨텐츠의 수의 차이에 기초하여 상기 잔존 단어와 상기 평가 대상에 해당하는 단어 사이의 연관 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 사용자 상태 평가 방법.
제 13 항에 있어서,
상기 조합 컨텐츠의 수와 상기 단일 컨텐츠의 수의 차이가 연관 임계값 이하인 경우 상기 잔존 단어와 상기 평가 대상평가 대상는 단어 사이에 서로 연관이 있는 것으로 판단하는 것을 특징으로 하는 사용자 상태 평가 방법.
제 11 항 또는 제 13 항에 있어서, 상기 관련 단어로부터 평가 테이블을 생성하는 단계는
상기 관련 단어와 경미 형용사의 조합으로 이루어진 검색식을 이용하여 검색된 경미 컨텐츠의 수 및 상기 관련 단어와 심각 형용사의 조합으로 이루어진 검색식을 이용하여 검색된 심각 컨텐츠의 수를 비교하는 단계;
상기 심각 컨텐츠의 수가 상기 경미 컨텐츠의 수보다 많으며, 상기 경미 컨텐츠의 수와 상기 심각 컨텐츠의 수의 차이가 정도 임계값 이상인 관련 단어를 최종 관련 단어로 추출하는 단계; 및
상기 최종 관련 단어와 최종 관련 단어에 해당하는 레벨값으로부터 이루어진 평가 테이블을 생성하는 단계를 포함하는 것을 특징으로 하는 사용자 상태 평가 방법.