KR101825025B1 - 사회적 약자의 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공 방법 및 그 시스템 - Google Patents
사회적 약자의 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공 방법 및 그 시스템 Download PDFInfo
- Publication number
- KR101825025B1 KR101825025B1 KR1020150181702A KR20150181702A KR101825025B1 KR 101825025 B1 KR101825025 B1 KR 101825025B1 KR 1020150181702 A KR1020150181702 A KR 1020150181702A KR 20150181702 A KR20150181702 A KR 20150181702A KR 101825025 B1 KR101825025 B1 KR 101825025B1
- Authority
- KR
- South Korea
- Prior art keywords
- tree
- words
- similarity
- welfare
- word
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000000605 extraction Methods 0.000 claims description 28
- 239000008280 blood Substances 0.000 claims description 7
- 210000004369 blood Anatomy 0.000 claims description 7
- 238000013480 data collection Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000036541 health Effects 0.000 description 5
- 230000008520 organization Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 239000008186 active pharmaceutical agent Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/22—Social work or social welfare, e.g. community support activities or counselling services
-
- G06F17/30964—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Child & Adolescent Psychology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
사회적 약자의 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공 방법 및 그 시스템이 제공된다. 본 발명의 실시 예에 따른 사회적 약자의 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법은,사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템이 사회적 약자의 라이프 로그와 상기 사회적 약자에 상응하는 사례문서를 수집하는 단계, 상기 라이프 로그와 상기 사례문서로부터 복수의 관심단어들을 추출하는 단계, 및 추출된 상기 복수의 관심단어들 중에 선택된 대표단어들 및 상기 대표단어들의 우선순위를 나타내는 정보인 복지참조정보를 생성하는 단계를 포함한다.
Description
본 발명은 사회적 약자의 라이프 로그 및 다양한 정형 또는 비정형의 사례문서들을 이용하여 사회적 약자인 사회적 약자의 생활 패턴과 기타 다양한 의견을 통해 실질적으로 필요한 또는 우선순위가 높은 복지 서비스를 효과적으로 제공하기 위한 방법 및 그 시스템에 관한 것이다.
최근 사회복지의 확대로 인한 맞춤형 복지서비스의 발굴에 대한 요구가 높아지고 있다. 그러나 현실과 괴리가 있는 복지서비스의 제공으로 그 효과가 반감되고 있고, 이에 따른 각종 여론의 향방이 부정적으로 흐르는 경우가 많아지고 있다.
특히 장애인이나 노인 등의 사회적 약자들에게는 자아의식의 표현이나 전달력이 약해 이들이 스스로 필요한 서비스를 인지하거나 요구하는데 많은 어려움이 있다. 따라서 사회적 약자들은 사회복지 영역의 주된 분석 대상이라 할 수 있다.
이를 위해서는 라이프 로그를 이용하는 것이 효과적일 수 있다.
라이프 로그를 이용해 사회적 약자의 행동 패턴을 분석하는 기술적 사상에 대해서는 종래기술(한국컴퓨터정보학회 학술대회 논문 제18권 제2호, pp.311-314, 2010.7.)에 개시된 바 있다.
그러나 이러한 종래의 기술은 단순히 사회적 약자의 행동 패턴을 나타내는 라이프 로그를 수집하여 분석하고, 위험상황에 대비하는데에 그치고 있다.
따라서 이러한 라이프 로그를 이용해 실제 복지 서비스를 창출하거나 사회적 약자가 우선적으로 필요로 하는 복지 서비스 또는 영역을 파악하는 기술적 사상을 제공하지 못하고 있다.
또한, 사회적 약자의 요구는 생활패턴과 더불어 각종 SNS 및 웹 사이트 등에 표출되고 있을 수 있다.
따라서 사회적 약자의 생활패턴과 사회적 요구자가 기록한 다양한 자료(이하, '사례문서'라 함)를 토대로 현재의 상태를 분석하고, 이 결과를 이용하여 각종 복지서비스 기관 및 기획을 하고 있는 유관 기관의 서비스와 연결하여 직접적인 복지서비스의 제공이나 새로운 복지서비스의 창출 또는 우선순위를 파악할 수 있는 방법 및 시스템이 요구된다.
한국컴퓨터정보학회 학술대회 논문 제18권 제2호, pp.311-314, 2010.7. "모바일 센서 네트워크를 활용한 장애인 라이프 로그의 분석 및 위험감지 시스템에 관한 연구"
따라서 본 발명이 해결하고자 하는 기술적인 과제는, 사회적 약자의 생활패턴과 사회적 약자가 표출한 의견을 모두 반영하여 유의미한 복지참조정보를 도출함으로써, 새로운 복지 서비스를 기획하거나 또는 우선순위를 높게 부여할 복지 서비스를 객관적으로 도출할 수 있는 방법 및 시스템을 제공하는 것이다.
상기 기술적 과제를 해결하기 위한 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법은, 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템이 사회적 약자의 라이프 로그와 상기 사회적 약자에 상응하는 사례문서를 수집하는 단계, 상기 라이프 로그와 상기 사례문서로부터 복수의 관심단어들을 추출하는 단계, 및 추출된 상기 복수의 관심단어들 중에 선택된 대표단어들 및 상기 대표단어들의 우선순위를 나타내는 정보인 복지참조정보를 생성하는 단계를 포함할 수 있다.
또한, 상기 복지참조정보를 생성하는 단계는, 상기 관심단어들을 복수의 클러스터들로 클러스터링(clustering)하는 단계, 클러스터링된 상기 복수의 클러스트들 각각으로부터 적어도 하나의 대표단어를 추출하는 단계, 추출된 대표단어들의 유사도를 분석하는 단계, 및 상기 대표단어들의 유사도 분석결과 및 상기 대표단어들의 출현빈도에 기초하여 적어도 복지의 우선순위에 상응하는 키워드를 포함할 수 있다.
또한,, 상기 라이프 로그와 상기 사례문서로부터 복수의 관심단어들을 추출하는 단계는, 상기 사회적 약자에 상응하는 라이프 로그 디바이스로부터 수신되는 위치정보 또는 시간 정보 중 적어도 하나에 기초하여 상기 사회적 약자가 방문한 공간 또는 상기 공간에 대응되는 서비스에 상응하는 로그 관심단어를 추출하는 단계를 포함할 수 있다.
또한, 상기 사회적 약자에 상응하는 라이프 로그 디바이스로부터 수신되는 위치정보 또는 시간 정보 중 적어도 하나에 기초하여 상기 사회적 약자가 방문한 공간 또는 상기 공간에 대응되는 서비스에 상응하는 로그 관심단어를 추출하는 단계는, 상기 시간정보에 기초하여 상기 사회적 약자가 일정시간 이상 머문 공간에 기초하여 상기 로그 관심단어를 추출하는 단계를 포함할 수 있다..
또한, 상기 클러스터링된 상기 복수의 클러스트들 각각으로부터 적어도 하나의 대표단어를 추출하는 단계는, 복수의 클러스터들에 포함된 관심단어 중 빈도수가 높은 순위로 상기 적어도 하나의 대표단어를 추출하는 단계를 포함할 수 있다.
또한, 상기 추출된 대표단어들의 유사도를 분석하는 단계는, 상기 대표단어들 각각의 빈도수와 단어거리에 기초하여 상기 대표단어들 중 적어도 일부를 포함하는 트리(tree)를 생성하는 단계, 및 상기 트리에 포함된 노드들 간의 유사도를 산출하는 단계를 포함할 수 있다.
또한, 상기 추출된 대표단어들의 유사도를 분석하는 단계는, 복지관련 학습대상 문서를 입력 데이터로 하여 두 단어 간의 단어거리를 출력할 수 있는 학습엔진을 학습시키는 단계, 및 학습된 상기 학습엔진에 기초하여 상기 대표단어들 간의 단어거리를 산출하는 단계를 포함할 수 있다.
또한, 상기 대표단어들 각각의 빈도수와 단어거리에 기초하여 상기 대표단어들 중 적어도 일부를 포함하는 트리(tree)를 생성하는 단계는, 상기 대표단어들 각각의 빈도수가 높을수록 트리의 상위 레벨 노드에 위치하도록 상기 빈도수에 기초하여 트리를 생성하는 단계, 및 생성된 트리에 포함된 노드에 상응하는 단어들의 단어거리가 일정 기준을 만족하도록 생성된 트리를 재구성하는 단계를 포함할 수 있다.
또한, 상기 트리에 포함된 노드들 간의 유사도를 산출하는 단계는, 상기 트리의 부자노드 관계 및 형제노드 관계를 인간의 혈연관계에 상응하는 촌수로 매핑하여 상기 트리에 포함된 노드들 간의 유사도를 상기 노드들 간의 촌수에 상응하며 미리 설정되어 있는 촌수별 유사도 값으로 설정하는 단계를 포함할 수 있다.
또한, 상기 트리에 포함된 노드들 간의 유사도를 산출하는 단계는, 상기 트리에 포함된 노드들 간의 촌수가 미리 정해진 촌수 이상인 경우에는, 상기 노드들 간의 경로에 포함된 에지들의 유사도 값의 평균을 이용하여 상기 노드들 간의 유사도를 산출하는 단계를 더 포함할 수 있다.
또한, 상기 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법은, 산출된 상기 트리에 포함된 노드들 간의 유사도에 기초하여 노드들 간의 유사도가 미리 설정된 일정 기준을 만족하도록 상기 트리를 재구성하여 결과 트리를 생성하는 단계를 더 포함하며, 상기 복지참조정보는, 상기 결과 트리에 기초한 정보인 것을 특징으로 할 수 있다.
상기 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법은 하드웨어와 결합하여 상기 제공방법을 수행하기 위한 매체에 기록된 컴퓨터 프로그램으로 구현될 수 있다.
상기 기술적 과제를 해결하기 위한 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템은, 사회적 약자의 라이프 로그와 상기 사회적 약자에 상응하는 사례문서를 수집하기 위한 데이터 수집모듈, 상기 라이프 로그로부터 관심단어들을 추출하기 위한 로그 단어 추출모듈, 상기 사례문서로부터 관심단어들을 추출하기 위한 사례 단어 추출모듈, 상기 로그 단어 추출모듈 및 상기 사례단어 추출모듈로부터 추출된 관심단어들 중에 선택된 대표단어들 및 상기 대표단어들의 우선순위를 나타내는 정보인 복지참조정보를 생성하기 위한 제어모듈을 포함할 수 있다.
또한, 상기 제어모듈은, 상기 추출된 관심단어들을 복수의 클러스터들로 클러스터링(clustering)하고, 클러스터링된 상기 복수의 클러스트들 각각으로부터 적어도 하나의 대표단어를 추출하기 위한 대표단어 추출모듈, 추출된 대표단어들의 유사도를 분석하기 위한 유사도 분석모듈, 및 상기 대표단어들의 유사도 분석결과 및 상기 대표단어들의 출현빈도에 기초하여 적어도 복지의 우선순위에 상응하는 키워드를 포함하는 복지참조정보를 생성하는 생성모듈을 포함할 수 있다.
또한, 상기 로그 단어 추출모듈은, 상기 사회적 약자에 상응하는 라이프 로그 디바이스로부터 수신되는 위치정보 또는 시간 정보 중 적어도 하나에 기초하여 상기 사회적 약자가 방문한 공간 또는 상기 공간에 대응되는 서비스에 상응하는 로그 관심단어를 추출할 수 있다.
또한, 상기 유사도 분석모듈은, 상기 대표단어들 각각의 빈도수와 단어거리에 기초하여 상기 대표단어들 중 적어도 일부를 포함하는 트리(tree)를 생성하고, 상기 트리에 포함된 노드들 간의 유사도를 산출할 수 있다.
또한, 상기 유사도 분석모듈은, 상기 트리의 부자노드 관계 및 형제노드 관계를 인간의 혈연관계에 상응하는 촌수로 매핑하여 상기 트리에 포함된 노드들 간의 유사도를 상기 노드들 간의 촌수에 상응하며 미리 설정되어 있는 촌수별 유사도 값으로 설정할 수 있다.
또한, 상기 생성모듈은, 산출된 상기 트리에 포함된 노드들 간의 유사도에 기초하여 노드들 간의 유사도가 미리 설정된 일정 기준을 만족하도록 상기 트리를 재구성하여 결과 트리를 생성하고, 상기 결과 트리에 기초하여 상기 복지참조 정보를 생성할 수 있다.
본 발명의 기술적 사상에 따르면, 사회적 약자의 생활패턴과 사회적 약자가 표출한 의견을 모두 반영하여 유의미한 복지참조정보를 도출함으로써, 새로운 복지 서비스를 기획하거나 또는 우선순위를 높게 부여할 복지 서비스를 객관적으로 도출할 수 있는 효과가 있다.
본 발명의 상세한 설명에서 인용되는 도면을 보다 충분히 이해하기 위하여 각 도면의 간단한 설명이 제공된다.
도 1은 본 발명의 실시 예에 따른 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법을 위한 개략적인 시스템 구성을 나타낸다.
도 2는 본 발명의 실시 예에 따른 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템의 개략적인 구성을 나타낸다.
도 3은 본 발명의 실시 예에 따른 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법을 개략적으로 설명하기 위한 데이터 흐름도이다.
도 4는 본 발명의 실시 예에 따라 라이프 로그로부터 관심단어를 추출하는 개념을 설명하기 위한 도면이다.
도 5는 본 발명의 실시 예에 따라 키워드가 클러스터링되는 개념을 설명하기 위한 도면이다.
도 6 내지 도 8은 본 발명의 실시 예에 따라 트리를 이용하여 참조정보를 생성하는 일 예들을 설명하기 위한 도면이다.
도 1은 본 발명의 실시 예에 따른 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법을 위한 개략적인 시스템 구성을 나타낸다.
도 2는 본 발명의 실시 예에 따른 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템의 개략적인 구성을 나타낸다.
도 3은 본 발명의 실시 예에 따른 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법을 개략적으로 설명하기 위한 데이터 흐름도이다.
도 4는 본 발명의 실시 예에 따라 라이프 로그로부터 관심단어를 추출하는 개념을 설명하기 위한 도면이다.
도 5는 본 발명의 실시 예에 따라 키워드가 클러스터링되는 개념을 설명하기 위한 도면이다.
도 6 내지 도 8은 본 발명의 실시 예에 따라 트리를 이용하여 참조정보를 생성하는 일 예들을 설명하기 위한 도면이다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시 예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다.
본 명세서에 있어서는 어느 하나의 구성요소가 다른 구성요소로 데이터를 '전송'하는 경우에는 상기 구성요소는 상기 다른 구성요소로 직접 상기 데이터를 전송할 수도 있고, 적어도 하나의 또 다른 구성요소를 통하여 상기 데이터를 상기 다른 구성요소로 전송할 수도 있는 것을 의미한다. 반대로 어느 하나의 구성요소가 다른 구성요소로 데이터를 '직접 전송'하는 경우에는 상기 구성요소에서 다른 구성요소를 통하지 않고 상기 다른 구성요소로 상기 데이터가 전송되는 것을 의미한다.
또한 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
또한 본 명세서에 있어서, '포함하다' 또는 '가지다' 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 첨부된 도면들을 참조하여 본 발명의 실시예들을 중심으로 본 발명을 상세히 설명한다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 실시 예에 따른 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법을 위한 개략적인 시스템 구성을 나타낸다.
도 1을 참조하면, 본 발명의 실시 예에 따른 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템(이하, '시스템', 100)은 로그 디바이스(200) 및 사례문서들을 수집할 수 있는 다양한 소스(300)로부터 복지 서비스에 대한 사례문서들을 수집할 수 있다.
상기 로그 디바이스(200)는 복지 서비스의 대상이 되는 사회적 약자(예컨대, 장애인 또는 노인 등, 이하 '사용자'라고도 함)의 생활패턴을 파악할 수 있는 디바이스를 의미할 수 있다. 상기 로그 디바이스(200)의 일 예는 상기 사회적 약자가 소지하고 있는 모바일 단말기, 상기 사회적 약자가 착용하고 있는 웨어러블(wearable) 디바이스 등일 수 있다. 상기 로그 디바이스(200)는 적어도 상기 사회적 약자의 위치 및 위치별 시간정보를 판단하고, 판단된 정보들을 상기 시스템(100)으로 전송할 수 있는 데이터 처리장치일 수 있다.
상기 소스(300)는 사례문서를 수집할 수 있는 다양한 정보수집출처를 의미할 수 있다. 상기 사례문서는 사회적 약자가 작성한 문서, 상기 사회적 약자의 의견이나 요구를 기록한 타인의 문서(예컨대, 사회복지사가 작성한 상담문서 등) 등과 같이 사회적 약자의 복지에 대한 의견이나 느낌, 평가, 또는 요구 등을 포함하는 다양한 컨텐츠를 의미할 수 있다. 이러한 사례문서는 특정 사이트에 게시된 게시글, 인터넷 댓글, 정형화된 문서, 또는 다양한 SNS(Social Network Service)에 개재된 데이터 등 다양한 형태 또는 형식을 가질 수 있다.
이러한 사례문서들을 수집할 수 있는 상기 소스(300)는 예컨대, 복지 서비스를 제공하는 제공기관에서 제공되는 특정 사이트 또는 페이지를 통해 수집되어 정형화된 형식을 가지는 정형 데이터일 수도 있고, 다양한 SNS나 인터넷 게시글, 댓글 등을 통해 수집되어 특정 형식을 갖지 않는 비정형 데이터일 수도 있다.
일반적으로 정형 데이터는 특정 기관(사회복지 기관 또는 이들과 연계되어 서비스를 제공하는 기관)에서 운영되는 DB 또는 ERP 등에 의해 정형성을 가질 수 있고, 또는 상기 특정 기관에서 운영되는 레거시(Legacy)시스템으로부터 수집되는 데이터일 수 있다.
상기 시스템(100)은 이러한 소스(300) 예컨대, 특정 기관의 시스템과 연계되어 정형 데이터에 해당하는 다양한 사례문서들을 수집할 수 있다. 이를 위해 상기 특정 기관의 시스템과 API를 공유하거나, 특정 리소스를 공유할 수 있다.
또한, 상기 시스템(100)은 비정형 데이터를 다양한 외부 시스템(예컨대, SNS를 제공하는 시스템, 특정 웹/모바일 사이트/페이지, 블로그, 카페, 뉴스 등을 제공하는 시스템 등)으로부터 수집할 수도 있다. 이를 위해 상기 시스템(100)은 주기적으로 크롤링(crawling) 또는 클리핑(clopping)을 수행하거나, 또는 상기 외부 시스템이 제공하는 API를 이용하여 사례문서들을 수집할 수도 있다.
기타 다양한 방식과 다양한 소스(300)들로부터 상기 시스템(100)은 복수의 사례문서들을 수집할 수 있다. 각각의 사례문서들은 복지와 관련된 사용자의 의견(이하, 평가, 요구 등을 포함하는 의미로 사용됨)을 나타내는 용어들이 포함되어 있을 수 있다.
결국, 상기 시스템(100)은 사용자가 명시적으로 밝히지는 않았지만 사용자의 생활패턴에 기초하여 사용자의 복지와 관련된 의견을 나타내는 관심단어(또는 관심분야)를 추정하고, 사용자가 직접 또는 타인(예컨대, 사회복지사 등)에 의해 사용자의 의견을 나타내는 문서인 사례문서들로부터 복지와 관련된 의견을 나타내는 관심단어를 추정함으로써 객관적이고 효율적으로 사용자 즉, 사회적 약자의 복지에 대한 요구 및/또는 우선순위를 도출할 수 있다.
즉, 본 발명의 기술적 사상에 의하면 사용자의 의견을 사용자 또는 타인에 의해 작성된 문서뿐만 아니라, 사용자가 생활하는 생활패턴으로부터도 복합적으로 추출하여 사용자에게 필요한 요구 및/또는 상기 사용자가 복지와 관련하여 우선적으로 필요하다고 판단되는 요구를 객관적으로 추출할 수 있다.
이러한 요구 및/또는 우선순위는 사용자의 생활패턴 및 사례문서들로부터 추출되는 관심단어들에 기초하여 도출될 수 있다.
이하에서는 상기 관심단어들을 도출하는 기술적 사상 및 도출된 관심단어들에 기초하여 사용자가 실질적으로 원하는 복지와 관련된 요구(또는 분야) 및/또는 우선순위를 도출하는 기술적 사상에 대해 설명하도록 한다.
상술한 바와 같은 기술적 사상을 구현하기 위한 상기 시스템(100)은 도 2에 도시된 바와 같은 구성을 포함할 수 있다.
상기 시스템(100)은 제어모듈(110), 데이터 수집모듈(120), 로그단어 추출모듈(130), 및 사례단어 추출모듈(140)을 포함한다. 또한, 상기 시스템(100)은 라이프 로그 DB(150) 및 사례DB(160)를 더 포함할 수 있다.
상기 제어모듈(110)은 대표단어 추출모듈(111), 유사도 분석모듈(112) 및 생성모듈(114)를 포함할 수 있다. 또한, 상기 유사도 분석모듈(112)는 소정의 학습엔진(113)을 포함할 수 있다.
본 명세서에서 모듈이라 함은, 본 발명의 기술적 사상을 수행하기 위한 하드웨어 및 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. 예컨대, 상기 각각의 구성들은 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스(resource)의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류나 특정 개수의 하드웨어를 의미하는 것은 아님은 본 발명의 기술분야의 평균적 전문가에게는 용이하게 추론될 수 있다. 따라서, 상기 각각의 구성들은 본 명세서에서 정의되는 기능을 수행하는 하드웨어 및 소프트웨어의 결합을 의미하며 특정 물리적 구성을 의미하는 것은 아니다.
또한, 상기 시스템(100)은 도 1 및 도 2에서는 하나의 물리적 장치인 것처럼 도시하였지만, 복수의 물리적 장치가 유/무선 네트워크를 통해 연결되어 유기적으로 결합되어 상기 시스템(100)을 구현할 수 있음은 물론이다.
상기 제어모듈(110)은 본 발명의 기술적 사상에 따라 상기 시스템(100)에 포함된 구성들의 기능 및/또는 리소스를 전반적으로 제어할 수 있다.
상기 데이터 수집모듈(120)은 로그 디바이스(200) 및 복수의 소스(300)들 각각으로부터 라이프 로그 정보 및 사례문서들을 수집할 수 있다.
상기 데이터 수집모듈(120)은 로그 디바이스(200)와 통신을 수행하여 라이프 로그 정보를 수신할 수 있다. 수신된 라이프 로그 정보는 라이프 로그 DB(150)에 저장될 수 있다. 상기 라이프 로그 정보는 전술한 바와 같이 적어도 사용자의 위치 및 위치에 따른 시간정보를 포함할 수 있다. 이외에도 상기 로그 디바이스(200)에 구비된 다양한 센서들의 실시 예에 따라 온도, 고도, 기타 사용자의 생활 패턴과 관련된 다양한 정보들이 더 수집될 수 있음은 물론이다.
또한, 상기 데이터 수집모듈(120)은 상기 복수의 소스들(300)에 따라 정형 데이터 및/또는 비정형 데이터에 해당하는 사례문서들을 수집할 수 있다. 또한, 각각의 소스들(300)의 종류에 따라 서로 공유된 API를 이용하거나, 크롤링, 클리핑 등 다양한 방식으로 사례문서들을 수집할 수 있다.
상기 데이터 수집모듈(120)에 의해 수집된 사례문서들은 상기 사례DB(160)에 저장될 수 있다.
로그단어 추출모듈(130)은 라이프 로그 DB(150)에 저장된 라이프 로그 정보로부터 관심단어들을 추출할 수 있다. 즉, 사용자의 생활패턴으로부터 사용자가 관심있다고 판단되거나 사용자가 필요로한다고 판단되는 관심단어들을 추출할 수 있다.
이를 위해 상기 로그단어 추출모듈(130)은 상기 라이프 로그 정보에 포함된 위치 또는 시간정보 중 적어도 하나를 이용하여 관심단어를 추출할 수 있다. 이러한 위치정보(예컨대, 위도, 경도 등의 좌표정보) 및 해당 위치의 시간정보를 이용하는 경우, 상기 사용자가 방문한 공간 또는 방문한 공간에 대한 서비스에 상응하는 관심단어가 추출될 수 있다. 물론, 이를 위해 상기 로그단어 추출모듈(130)은 소정의 지도정보를 더 이용할 수 있다.
이러한 일 예는 도 4를 참조하여 설명하도록 한다.
도 4는 본 발명의 실시 예에 따라 라이프 로그로부터 관심단어를 추출하는 개념을 설명하기 위한 도면이다.
도 4에 도시된 화살표는 라이프 로그 정보에 포함된 사용자의 위치정보에 기초하여 사용자의 이동을 도식화한 일 예이고, 이러한 사용자의 이동을 소정의 지도정보 상에 매핑한 일 예가 도 4일 수 있다.
예컨대, 사용자는 도 4에 도시된 바와 같은 경로로 이동을 할 수 있다. 그리고 상기 경로에 의하면, 상기 로그단어 추출모듈(130)은 사용자가 A, D, C라는 공간을 방문한 것으로 판단할 수 있다. 이러한 경우, 상기 로그단어 추출모듈(130)은 A, D, C라는 공간에 상응하는 공간의 속성을 바로 상기 사용자의 관심단어로 추출할 수도 있다. 상기 공간의 속성은 예컨대, 상기 공간의 명칭, 상호, 종류, 또는 상기 공간에 상응하는 서비스일 수 있다. 예컨대, A라는 공간이 도서관인 경우, 도서관의 명칭, 도서관이라는 공간의 종류, 또는 도서관이 제공하는 서비스(도서대여, 도서관람 등)를 나타내는 단어 중 적어도 하나가 상기 관심단어로 추출될 수 있다.
실시 예에 따라서 상기 로그단어 추출모듈(130)은 위치별 시간정보를 더 이용하여 관심단어를 추출할 수도 있다. 예컨대, 라이프 로그 정보에 포함된 위치별 시간정보를 이용하면, 사용자가 미리 정해진 일정 시간 이상 머문 공간을 식별할 수 있다. 예컨대, A라는 공간에서는 일정 시간 이상 머물렀고, D라는 공간에서는 일정시간 미만으로 머물렀고, C라는 공간에서는 일정 시간 이상 머물렀다고 판단되는 경우, 상기 로그단어 추출모듈(130)은 상기 A 및 상기 C라는 공간의 공간 속성으로부터만 관심단어를 추출할 수도 있다.
결국, 라이프 로그로부터 추출되는 관심단어는 사용자가 명시적으로 복지에 관한 자신의 의견 또는 요구를 밝히지 않더라도, 사용자의 생활패턴으로부터 상기 사용자에게 유의미한 복지와 관련된 관심단어를 추출할 수 있는 중요한 기준이 될 수 있다.
다시 도 2를 참조하면, 상기 사례단어 추출모듈(140)은 상기 사례DB(160)에 저장된 사례문서들로부터 관심단어를 추출할 수 있다. 상기 사례문서들은 전술한 바와 같이 사용자가 명시적으로 다양한 소스들에 자신의 의견 또는 요구를 기술한 문서이거나 타인에 의해 작성된 사용자의 의견 또는 요구를 나타내는 단어들이 포함될 수 있다.
이러한 사례문서들로부터 상기 사례단어 추출모듈(140)은 관심단어를 추출할 수 있다. 상기 사례단어 추출모듈(140)이 복수의 사례문서들로부터 복지와 관련된 관심단어를 추출하는 방식은 다양한 방식이 존재할 수 있다. 일 예에 의하면 상기 사례단어 추출모듈(140)은 데이터 마이닝의 기법 중 텍스트 마이닝을 통해 상기 사례문서들로부터 관심단어를 추출할 수 있다. 구현 예에 따라서는 다수의 복지와 관련된 키워드 DB들을 구축하고, 상기 사례문서들에 포함된 단어들 중 상기 키워드 DB에 포함된 단어와 동일하거나 일정한 기준에 의해 유사한 단어(예컨대, 어간이 동일하고 어미만 다른 단어)라고 판단된 단어들을 추출할 수도 있다.
물론, 이를 위해서는 상기 사례문서들을 자연어 처리를 통해 특정 품사에 해당하는 단어들을 삭제하거나, 또는 특정 단어에 대해 표준적 표기로 변경하는 등의 프리 프로세스가 필요할 수 있다. 이처럼 복수의 문서들로부터 특정 분야(예컨대, 복지)에 대한 관심단어 또는 키워드를 추출하는 방식에 대해서는, 텍스트 마이닝 분야 등에서는 널리 공지되어 있는 기술적 사상이므로 상세한 설명은 생략하도록 한다.
이처럼 라이프 로그 및 사례문서들로부터 복수의 관심단어들이 추출되면, 상기 제어모듈(110)은 추출된 복수의 관심단어들 중에서 사용자의 요구를 잘 반영할 수 있는 적어도 하나의 단어 및 상기 적어도 하나의 단어의 우선순위에 대한 정보를 포함하는 참조정보를 생성할 수 있다. 즉, 참조정보에 포함된 적어도 하나의 단어는 사용자가 필요로 하는 복지를 나타내는 단어들일 수 있고, 상기 적어도 하나의 단어에 우선순위가 부여된다고 함은 사용자가 우선적으로 필요로 하거나 요구되는 복지를 나타낼 수 있다.
이러한 참조정보는 예컨대, 복지 서비스를 주관하는 서비스 기관 또는 유관 기관의 복지 정책을 개발하거나 또는 존재하는 복지 정책의 실행의 우선순위를 판단하는데 도움이 됨으로써 사회적 약자에게 실질적으로 도움이 될 수 있는 복지 서비스의 제공이 가능하게 되는 효과가 있다.
상술한 바와 같은 본 발명의 기술적 사상을 개략적으로 도시하면 도 3과 같을 수 있다.
도 3은 본 발명의 실시 예에 따른 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법을 개략적으로 설명하기 위한 데이터 흐름도이다.
도 3을 참조하면, 상기 시스템(100)은 전술한 바와 같이 라이프 로그 및 사례문서들을 수집할 수 있다(S100). 그러면 상기 시스템(100)은 상기 라이프 로그 및 사례문서들로부터 관심단어를 추출할 수 있다(S110). 그리고 상기 시스템(100)은 추출된 관심단어들로부터 상술한 바와 같은 참조정보를 생성할 수 있다(S150). 상기 참조정보는 상기 관심단어들 중에서 사용자에게 중요한 의미를 갖는 복지를 나타내는 적어도 하나의 단어를 포함하며, 상기 적어도 하나의 단어들의 우선순위를 포함하는 정보일 수 있음은 전술한 바와 같다.
상기 관심단어들로부터 상기 참조정보를 생성하는 방식은 다양한 실시 예가 가능할 수 있다. 본 발명의 기술적 사상에 따른 일 실시 예에 의하면, 상기 시스템(100)은 추출된 관심단어들을 클러스터링(clustering) 할 수 있다(S120). 이러한 클러스터링은 기계적으로 상기 관심단어들 중에서 연관성이 있거나 연관성이 있는 분야로 구분될 수 있는 단어들을 군집화하는 과정일 수 있다.
그러면 상기 시스템(100)은 클러스터링된 각각의 클러스터들 각각으로부터 적어도 하나의 대표단어를 추출할 수 있다(S130). 즉, 각각의 클러스터들은 복지와 관련된 다양한 분야들을 대변하는 의미일 수 있고, 이러한 다양한 분야들 각각으로부터 사용자의 관심도가 높은 단어들 즉, 대표단어를 적어도 하나 추출할 수 있다.
그러면 상기 시스템(100)은 추출된 대표단어들의 유사도를 분석할 수 있다(S140). 추출된 대표단어들로 구성되는 집합에서 유사도 분석 과정을 수행하면서 일부의 대표단어는 탈락될 수 있다. 즉, 사용자에게 시급한 복지가 아니라고 판단되는 경우가 이러한 경우일 수 있다. 또한, 추출된 대표단어들 중에서 일정한 기준 이상의 유사도가 없는 경우에는, 다른 대표단어들과 상대적으로 동떨어진 분야 또는 관심으로 취급될 수 있어서 추출된 대표단어들 집합에서 제외될 수 있다. 이러한 과정은 후술하는 유사도 분석과정에서 구체적으로 설명하도록 한다. 또한, 유사도를 분석하는 경우, 사용자가 관심있는 복지와 관련된 유의미한 키워드가 실질적으로 어떤 다른 키워드와 연관되는지를 파악할 수 있어서 그 자체만으로도 복지 서비스를 기획하거나 우선순위를 부여할 때 유의미한 정보가 될 수 있다.
이러한 유사도 분석이 완료되면, 최종적으로 상기 추출된 대표단어들의 집합에 남은 대표단어들이 참조정보에 포함되며, 남은 대표단어들 중에서 우선순위가 부여될 수 있다.
이러한 본 발명의 기술적 사상은 도 2 및 도 5 내지 도8을 참조하여 상세히 설명하도록 한다.
상기 제어모듈(110)에 포함된 대표단어 추출모듈(111)은 라이프 로그 및 사례문서들로부터 추출된 관심단어들을 복수의 클러스터들로 클러스터링(clustering)한다. 그리고 상기 대표단어 추출모듈(111)은 클러스터링된 상기 복수의 클러스트들 각각으로부터 적어도 하나의 대표단어를 추출할 수 있다.
예컨대, 도 5에 도시된 바와 같이 라이프 로그 및 사례문서들로부터 추출된 복수의 단어들(예컨대, K1 내지 Kn)은 상기 대표단어 추출모듈(111)에 의해 클러스터링될 수 있다. 일 예에 의하면, 도 5에 도시된 바와 같이 K1, K2, K3, K7, K11은 제1클러스터(10)로, K4, K5, K6, K8은 제2클러스터(20)로, K9, K10, K12 내지 Kn은 제3클러스터(30)로 클러스터링될 수 있다. 상기 대표단어 추출모듈(111)은 K-Means 알고리즘으로 상기의 클러스터링을 수행할 수 있지만, 반드시 이에 국한되지는 않으며 다양한 클러스터링 기법이 적용될 수 있다.
그러면, 상기 대표단어 추출모듈(111)은 각각의 클러스터들(10, 20, 30)로부터 적어도 하나의 대표단어들을 추출할 수 있다. 예컨대, 상기 대표단어 추출모듈(111)은 제1클러스터(10)로부터 적어도 하나의 대표단어(예컨대, K1, K2), 제2클러스터(20)로부터 적어도 하나의 대표단어(예컨대, K4, K5), 및 제3클러스터(30)로부터 적어도 하나의 대표단어(예컨대, K9, K10)을 추출할 수 있다. 도 5에서는 3개의 클러스터들(10, 20, 30)만 클러스터링된 경우를 도시하고 있지만, 이보다 많은 수의 클러스터들이 생성될 수 있음은 물론이고, 추출된 관심단어들의 수에 따라서도 달라질 수 있다.
각각의 클러스터들로부터 대표단어를 추출하는 기준은 상기 관심단어의 빈도수일 수 있다. 즉, 라이프 로그 및 사례문서들 전체로부터 추출된 관심단어들의 빈도수를 기준으로 상기 대표단어가 추출될 수 있다. 물론, 이를 위해 관심단어들 중 적어도 일부는 소정의 자연어 처리를 통해 표준적인 표현으로 변경될 수 있다. 따라서 각각의 클러스터들로부터 사용자가 상대적으로 관심이 많은 것으로 판단된 관심단어가 대표단어로써 추출될 수 있다.
그러면, 상기 유사도 분석모듈(112)은 대표단어 추출모듈(111)에 의해 추출된 대표단어들의 유사도 분석을 수행할 수 있다. 소정의 단어 또는 키워드에 대해 유사도 분석을 하는 방식은 다양할 수 있다. 예컨대, 상기 유사도 분석모듈(112)은 널리 알려진 바와 같이 대표단어들 간의 유클리디언 거리(Eucloidean Distance), 코사인 유사도, 피어슨 유사도(pearson Correlation Coefficient) 등의 다양한 기법을 이용한 유사도 분석을 수행할 수도 있다.
다른 실시 예에 의하면, 본 발명의 기술적 사상에 따라 소정의 트리를 이용해 상기 대표단어들 간의 유사도를 산출할 수도 있다.
이러한 일 예는 도 6 내지 도 8을 참조하여 설명하도록 한다.
우선 도 6에 도시된 바와 같이, 상기 유사도 분석모듈(112)은 대표단어 추출모듈(111)에 의해 추출된 대표단어들이 복지, 수급, 건강, 체육, 주택, 식품, 의료, 임대, 입원 인 경우, 각각을 노드(예컨대, N1 내지 N9)로 포함하는 트리를 생성할 수 있다.
상기 트리는 대표단어들 중 빈도수가 높은 대표단어가 상위 레벨에 위치하도록 구성될 수 있다. 즉, 도 6의 일 예에서는 복지가 가장 높은 빈도수를 가져서 루트 노드(N1)에 위치하도록 설정되고, 상기 루트 노드(N1)의 자식노드들(N2, N3, N4)는 루트 노드(N1)에 비해 빈도수가 작은 노드들일 수 있다.
또한, 상기 트리는 미리 정해진 m개 m-ary 트리로 구현될 수 있다. 즉, 각각의 노드는 m개 이하의 자식노드만을 가질 수 있도록 제한될 수 있다. 일 예에 의하면 상기 m은 4일 수 있다. 이는 문헌통계학적으로 유의미한 용언 간에 존재하는 단어의 개수가 일반적으로 4개 이상이기 때문에 설정되는 개수일 수 있지만, 반드시 이에 국한되는 것은 아니다. 또한, 상기 트리는 빈도수가 높을수록 좌측 자식노드에 설정될 수도 있다. 예컨대, 노드 N2는 노드 N3에 비해 빈도가 높을 수 있다.
이러한 방식으로 빈도수에 기초하여 트리가 생성되면, 상기 유사도 분석모듈(112)은 단어거리에 기초하여 생성된 상기 트리를 재구성할 수 있다. 단어거리라 함은 일반적으로 소정의 문서 내에서 두 단어들 사이에 존재하는 단어의 개수를 나타내는 지표일 수 있다. 이러한 단어거리는 사용자가 얼마나 두 단어들을 동시에 또는 연관지어 생각하는지를 나타내는 지표일 수 있다.
이러한 두 단어들의 단어거리는 소정의 학습엔진(113)에 의해 산출될 수 있다. 예컨대, 상기 학습엔진(113)은 다수의 복지관련 학습대상 문서를 입력 데이터로 학습을 수행할 수 있다. 이러한 학습이 수행된 후에는 두 단어가 입력 데이터로 입력되면, 입력된 두 단어 간의 단어거리를 출력할 수 있게 된다. 상기 복지관련 학습대상 문서는 예컨대, 복지와 관련되어 작성된 다양한 문서들일 수 있다. 일 예에 의하면, 상기 사용자의 사례문서들 역시 학습 대상문서가 될 수 있다. 학습의 대상이 되는 학습대상 문서의 종류에 따라 단어거리가 달리 산출될 수 있으므로, 복지와 관련된 컨텐츠를 포함하는 다양한 학습대상 문서의 선정에 따라 학습의 정확성 또는 신뢰성이 달라질 수 있음은 물론이다.
이러한 학습엔진(113)을 통해 상기 대표단어들간의 단어거리가 결정되면, 상기 단어거리를 이용하여 상기 트리는 재구성될 수 있다. 예컨대, 상기 단어거리가 가까운 자식노드가 보다 좌측 자식 노드로 설정될 수 있다(물론, 이때에는 자식 노드 간의 위치는 빈도수에 의해 결정되는 것이 아닐 수 있다). 또는 일정 단어거리 이상이 되면 대표단어에서 탈락이 될 수도 있다. 즉, 상기 트리를 구성하는 노드에서 탈락이 될 수도 있다. 기타 다양한 방식으로 상기 단어거리를 이용하여 유의미한 트리의 구성이 가능할 수 있다. 일 예에 의하면 노드의 레벨은 빈도수에 의해 결정되고, 특정 노드의 자식 노드들 간의 위치는 단어거리에 의해 결정될 수 있다. 그렇게 구성된 트리의 일 예가 도 6에 도시된 바와 같을 수 있다.
그러면, 상기 유사도 분석모듈(112)은 도 6에 도시된 바와 같이 생성된 상기 트리를 이용해 각각의 노드들 간의 유사도 즉, 대표단어들 간의 유사도를 산출할 수 있다.
유사도는 기 생성된 트리의 구조에 따라 일정한 기준으로 부여될 수 있다. 예컨대, 자식노드들 간에는 특정 유사도가 부여되고, 형제노드들 간에는 특정 유사도가 부여되는 방식 등이 그러한 일 예일 수 있다. 왜냐하면 상기 트리를 생성할 때, 이미 단어거리라는 기준을 고려하여 트리의 구조가 생성되었기 때문이다. 따라서 트리의 구조에 따라 자동적으로 각각의 노드들 간의 유사도가 자동으로 부여될 수 있음은 물론이다.
본 발명의 일 실시 예에 따르면, 단순히 트리 자체의 구조에 의해 유사도가 산출되는 것이 아니라, 인간의 혈연관계에 따른 유사도가 각각의 노드들에 부여될 수도 있다.
이러한 일 예는 도 7에 도시된 바와 같을 수 있다.
예컨대, 부자간은 1, 형제간은 0.9, 손자간은 0.8, 3촌간은 0.7, 4촌은 0.6, 5촌은 0.5, 6촌은 0.4, 등으로 할당될 수 있다. 즉, 각각의 노드들의 트리구조를 인간의 혈연관계로 가정하고, 인간의 혈연관계에 상응하는 촌수별로 미리 정해진 유사도를 부여할 수 있다.
예컨대, 복지 노드와 수급 노드는 부자노드 간이므로 유사도는 1로 설정된다. 수급노드와 건강이라는 노드는 동일한 부모노드를 가지는 형제 노드이므로 형제간의 촌수인 2촌에 상응하는 0.9의 유사도가 설정될 수 있다. 이러한 방식으로 3촌간인 건강과 식품 노드는 0.7이 부여되고, 4촌간인 식품노드와 의료노드는 0.6이 부여될 수 있다. 5촌간이 의료와 임대노드는 유사도가 0.5로 부여되고, 6촌 간이 임대와 입원 간은 유사도가 0.4로 부여될 수 있다.
또한, 미리 정해진 촌수 이상에 대해서는 미리 설정된 유사도를 부여하는 것이 의미가 취약하므로, 상기 트리(예컨대, 도 6)에 포함된 노드들 간의 촌수가 미리 정해진 촌수 이상인 경우에는, 상기 노드들 간의 경로에 포함된 에지들의 유사도 값의 평균을 이용하여 상기 노드들 간의 유사도를 산출할 수 있다.
예컨대, 복지와 임대에 해당하는 노드는 도 6의 트리에 의하면 3개의 에지를 통해 연결되고, 각각의 노드들은 모두 유사도가 1이될 수 있다. 따라서 복지와 임대에 해당하는 노드간을 연결하는 에지들의 유사도 값 평균은 (1+1+1)/3 즉 1일 수 있다. 여기서 유사도 값 평균이 그 자체로 두 노드간의 유사도로 설정될 수도 있지만, 실시 예에 따라서는 소정의 보정 값을 유사도 값 평균에서 뺀 값이 두 노드 간의 유사도일 수 있다. 예컨대, 다양한 실험 및 설문지를 이용한 조사를 통해 상기 보정 값은 약 0.153 정도의 수치를 가질 수 있다. 따라서 복지와 임대에 해당하는 노드는 에지들의 유사도 값 평균인 1에서 0.153을 뺀 0.847이 될 수 있다. 즉, 이러한 보정 값을 빼지 않는 경우에는 복지와 수급의 유사도와 복지와 임대의 유사도가 동일한 수 있어서 실질적으로 바람직하지 않으므로, 미리 설정된 보정 값을 에지들의 유사도 값 평균에서 제한 값을 두 노드 간의 유사도로 산출할 수 있다.
이러한 방식으로 도 7에 도시된 바와 같이 대표단어들 간의 유사도가 모두 산출되면, 생성모듈(114)은 산출된 상기 트리(예컨대, 도 7)에 포함된 노드들 간의 유사도에 기초하여 노드들 간의 유사도가 미리 설정된 일정 기준을 만족하도록 상기 트리를 재구성하여 결과 트리를 생성할 수 있다. 예컨대, 소정의 노드(예컨대, 루트 노드)로부터 유사도가 일정 값 이하인 노드는 상기 트리에서 제외될 수 있다. 또한, 예컨대, 레벨이 일정 레벨 이상인 노드들은 모두 상기 트리에서 제외될 수도 있다. 유사도가 낮은 노드는 상기 트리에 한 번에 표현되기에는 부적절한 노드를 의미할 수 있고, 레벨이 일정 레벨 이상인 노드들은 사용자의 관심이 많거나 또는 시급한 것이 아닌 사용자의 관심단어일 수 있기 때문이다.
이러한 기준들에 기초하여 상기 생성모듈(114)에 의해 생성된 결과 트리의 일 예는 도 8에 도시된 바와 같을 수 있다.
그러면 상기 생성모듈(114)은 상기 결과트리에 기초하여 참조정보를 생성할 수 있다.
일 예에 의하면, 상기 결과 트리 자체가 참조정보일 수 있다. 또한, 상기 결과 트리에 각각의 노드들 간의 유사도 값이 더 포함된 정보가 상기 참조정보일 수 있다. 또는 상기 결과 트리에 기초하여 소정의 노드 즉, 단어들이 추출된 정보가 상기 참조정보일 수도 있다.
상기 결과트리 자체는 전술한 바와 같이 우선순위를 가지는 정보일 수 있다. 즉, 레벨이 가장 낮은 루트 노드가 가장 우선순위가 높은 관심단어이고, 다음 레벨인 수급, 건강, 체육이 차순위 우선순위를 갖는 관심단어일 수 있다. 또한, 형제 노드들 간에는 좌측 노드가 더 우선순위를 갖는 관심단어일 수 있고, 이는 빈도수 및 단어거리를 이용하여 트리를 구성하는 방식에 따라 달라질 수도 있다.
구현 예에 따라서는 상기 결과트리로부터 우선순위가 높은 몇 개의 단어들(예컨대, 복지, 수급, 건강)이 추출되어 참조정보가 될 수 있다. 또는 상기 결과트리에 포함된 모든 단어들 및 단어들의 우선순위가 상기 참조정보가 될 수도 있다.
이러한 참조정보는 전술한 바와 같이 복지 서비스 기관 또는 유관기관에 제공되어 복지정책에 활용됨으로써 사회적 약자가 진정으로 필요로 하는 서비스가 개발되거나 시행에 있어서 우선순위가 부여되어 시행될 수 있는 효과가 있다.
본 발명의 실시 예에 따른 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.
컴퓨터로 읽을 수 있는 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드위어 장치가 포함된다. 또한 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 전자적으로 정보를 처리하는 장치 예컨대, 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로써 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
본 발명은 도면에 도시된 일 실시 예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.
Claims (18)
- 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템이 사회적 약자의 라이프 로그와 상기 사회적 약자에 상응하는 사례문서를 수집하는 단계;
상기 라이프 로그와 상기 사례문서로부터 복수의 관심단어들을 추출하는 단계;
추출된 상기 복수의 관심단어들 중에 선택된 대표단어들 및 상기 대표단어들의 우선순위를 나타내는 정보인 복지참조정보를 생성하는 단계를 포함하며,
상기 복지참조정보를 생성하는 단계는,
상기 관심단어들을 복수의 클러스터들로 클러스터링(clustering)하는 단계;
클러스터링된 상기 복수의 클러스터들 각각으로부터 적어도 하나의 대표단어를 추출하는 단계;
추출된 대표단어들의 유사도를 분석하는 단계; 및
상기 대표단어들의 유사도 분석결과 및 상기 대표단어들의 출현빈도에 기초하여 적어도 복지의 우선순위에 상응하는 키워드를 포함하는 복지참조정보를 생성하는 단계를 포함하고,
상기 추출된 대표단어들의 유사도를 분석하는 단계는,
상기 대표단어들 각각의 빈도수와 단어거리에 기초하여 상기 대표단어들 중 적어도 일부를 포함하는 트리(tree)를 생성하는 단계; 및
상기 트리에 포함된 노드들 간의 유사도를 산출하는 단계를 포함하며,
상기 추출된 대표단어들의 유사도를 분석하는 단계는,
복지관련 학습대상 문서를 입력 데이터로 하여 두 단어 간의 단어거리를 출력할 수 있는 학습엔진을 학습시키는 단계; 및
학습된 상기 학습엔진에 기초하여 상기 대표단어들 간의 단어거리를 산출하는 단계를 포함하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법.
- 삭제
- 제1항에 있어서, 상기 라이프 로그와 상기 사례문서로부터 복수의 관심단어들을 추출하는 단계는,
상기 사회적 약자에 상응하는 라이프 로그 디바이스로부터 수신되는 위치정보 또는 시간 정보 중 적어도 하나에 기초하여 상기 사회적 약자가 방문한 공간 또는 상기 공간에 대응되는 서비스에 상응하는 로그 관심단어를 추출하는 단계를 포함하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법.
- 제3항에 있어서, 상기 사회적 약자에 상응하는 라이프 로그 디바이스로부터 수신되는 위치정보 또는 시간 정보 중 적어도 하나에 기초하여 상기 사회적 약자가 방문한 공간 또는 상기 공간에 대응되는 서비스에 상응하는 로그 관심단어를 추출하는 단계는,
상기 시간정보에 기초하여 상기 사회적 약자가 일정시간 이상 머문 공간에 기초하여 상기 로그 관심단어를 추출하는 단계를 포함하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법.
- 제1항에 있어서, 상기 클러스터링된 상기 복수의 클러스트들 각각으로부터 적어도 하나의 대표단어를 추출하는 단계는,
복수의 클러스터들에 포함된 관심단어 중 빈도수가 높은 순위로 상기 적어도 하나의 대표단어를 추출하는 단계를 포함하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법.
- 삭제
- 삭제
- 제1항에 있어서, 상기 대표단어들 각각의 빈도수와 단어거리에 기초하여 상기 대표단어들 중 적어도 일부를 포함하는 트리(tree)를 생성하는 단계는,
상기 대표단어들 각각의 빈도수가 높을수록 트리의 상위 레벨 노드에 위치하도록 상기 빈도수에 기초하여 트리를 생성하는 단계; 및
생성된 트리에 포함된 노드에 상응하는 단어들의 단어거리가 일정 기준을 만족하도록 생성된 트리를 재구성하는 단계를 포함하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법.
- 제1항에 있어서, 상기 트리에 포함된 노드들 간의 유사도를 산출하는 단계는,
상기 트리의 부자노드 관계 및 형제노드 관계를 인간의 혈연관계에 상응하는 촌수로 매핑하여 상기 트리에 포함된 노드들 간의 유사도를 상기 노드들 간의 촌수에 상응하며 미리 설정되어 있는 촌수별 유사도 값으로 설정하는 단계를 포함하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법.
- 제9항에 있어서, 상기 트리에 포함된 노드들 간의 유사도를 산출하는 단계는,
상기 트리에 포함된 노드들 간의 촌수가 미리 정해진 촌수 이상인 경우에는, 상기 노드들 간의 경로에 포함된 에지들의 유사도 값의 평균을 이용하여 상기 노드들 간의 유사도를 산출하는 단계를 더 포함하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법.
- 제1항에 있어서, 상기 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법은,
산출된 상기 트리에 포함된 노드들 간의 유사도에 기초하여 노드들 간의 유사도가 미리 설정된 일정 기준을 만족하도록 상기 트리를 재구성하여 결과 트리를 생성하는 단계를 더 포함하며,
상기 복지참조정보는,
상기 결과 트리에 기초한 정보인 것을 특징으로 하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공방법.
- 데이터 처리장치에 설치되며 제1항1, 제3항 내지 제5항, 제8항 내지 제11항 중 어느 한 항에 기재된 방법을 수행하기 위한 기록매체에 저장된 컴퓨터 프로그램.
- 사회적 약자의 라이프 로그와 상기 사회적 약자에 상응하는 사례문서를 수집하기 위한 데이터 수집모듈;
상기 라이프 로그로부터 관심단어들을 추출하기 위한 로그 단어 추출모듈;
상기 사례문서로부터 관심단어들을 추출하기 위한 사례 단어 추출모듈;
상기 로그 단어 추출모듈 및 상기 사례단어 추출모듈로부터 추출된 관심단어들 중에 선택된 대표단어들 및 상기 대표단어들의 우선순위를 나타내는 정보인 복지참조정보를 생성하기 위한 제어모듈을 포함하며,
상기 제어모듈은,
상기 추출된 관심단어들을 복수의 클러스터들로 클러스터링(clustering)하고, 클러스터링된 상기 복수의 클러스트들 각각으로부터 적어도 하나의 대표단어를 추출하기 위한 대표단어 추출모듈;
추출된 대표단어들의 유사도를 분석하기 위한 유사도 분석모듈; 및
상기 대표단어들의 유사도 분석결과 및 상기 대표단어들의 출현빈도에 기초하여 적어도 복지의 우선순위에 상응하는 키워드를 포함하는 복지참조정보를 생성하는 생성모듈을 포함하고,
상기 유사도 분석모듈은,
상기 대표단어들 각각의 빈도수와 단어거리에 기초하여 상기 대표단어들 중 적어도 일부를 포함하는 트리(tree)를 생성하고, 상기 트리에 포함된 노드들 간의 유사도를 산출하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템.
- 삭제
- 제13항에 있어서, 상기 로그 단어 추출모듈은,
상기 사회적 약자에 상응하는 라이프 로그 디바이스로부터 수신되는 위치정보 또는 시간 정보 중 적어도 하나에 기초하여 상기 사회적 약자가 방문한 공간 또는 상기 공간에 대응되는 서비스에 상응하는 로그 관심단어를 추출하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템.
- 삭제
- 제13항에 있어서, 상기 유사도 분석모듈은,
상기 트리의 부자노드 관계 및 형제노드 관계를 인간의 혈연관계에 상응하는 촌수로 매핑하여 상기 트리에 포함된 노드들 간의 유사도를 상기 노드들 간의 촌수에 상응하며 미리 설정되어 있는 촌수별 유사도 값으로 설정하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템.
- 제13항에 있어서, 상기 생성모듈은,
산출된 상기 트리에 포함된 노드들 간의 유사도에 기초하여 노드들 간의 유사도가 미리 설정된 일정 기준을 만족하도록 상기 트리를 재구성하여 결과 트리를 생성하고, 상기 결과 트리에 기초하여 상기 복지참조 정보를 생성하는 사회적 약자 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150181702A KR101825025B1 (ko) | 2015-12-18 | 2015-12-18 | 사회적 약자의 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공 방법 및 그 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150181702A KR101825025B1 (ko) | 2015-12-18 | 2015-12-18 | 사회적 약자의 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공 방법 및 그 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170073147A KR20170073147A (ko) | 2017-06-28 |
KR101825025B1 true KR101825025B1 (ko) | 2018-03-22 |
Family
ID=59280716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150181702A KR101825025B1 (ko) | 2015-12-18 | 2015-12-18 | 사회적 약자의 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공 방법 및 그 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101825025B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230082823A (ko) | 2021-12-02 | 2023-06-09 | (주)진앤현웰빙 | 개인 캘린더를 이용한 맞춤형 복지정보 제공 방법 및 장치 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100799665B1 (ko) * | 2007-04-10 | 2008-01-30 | 삼육대학교산학협력단 | 노인 복지 서비스를 위한 욕구 사정 예측 방법 및 상기방법을 수행하기 위한 시스템 |
-
2015
- 2015-12-18 KR KR1020150181702A patent/KR101825025B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100799665B1 (ko) * | 2007-04-10 | 2008-01-30 | 삼육대학교산학협력단 | 노인 복지 서비스를 위한 욕구 사정 예측 방법 및 상기방법을 수행하기 위한 시스템 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230082823A (ko) | 2021-12-02 | 2023-06-09 | (주)진앤현웰빙 | 개인 캘린더를 이용한 맞춤형 복지정보 제공 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR20170073147A (ko) | 2017-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Singh et al. | Event classification and location prediction from tweets during disasters | |
Resch et al. | Combining machine-learning topic models and spatiotemporal analysis of social media data for disaster footprint and damage assessment | |
Hou et al. | Survey on data analysis in social media: A practical application aspect | |
Havas et al. | E2mc: Improving emergency management service practice through social media and crowdsourcing analysis in near real time | |
Yuan et al. | Mining social media data for rapid damage assessment during Hurricane Matthew: Feasibility study | |
US11164105B2 (en) | Intelligent recommendations implemented by modelling user profile through deep learning of multimodal user data | |
Liu et al. | Social roles and consequences in using social media in disasters: A structurational perspective | |
Kacorri et al. | Insights on assistive orientation and mobility of people with visual impairment based on large-scale longitudinal data | |
Hussain et al. | Behavior life style analysis for mobile sensory data in cloud computing through MapReduce | |
Menini et al. | RAMBLE ON: Tracing movements of popular historical figures | |
Bielik et al. | Examining trade-offs between social, psychological, and energy potential of urban form | |
Mirza et al. | Cyber-physical-social awareness platform for comprehensive situation awareness | |
Banati et al. | Longitudinal research for sustainable development | |
KR101825025B1 (ko) | 사회적 약자의 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공 방법 및 그 시스템 | |
Schneider et al. | A framework for evaluating stay detection approaches | |
O'Neill et al. | A web-based portal for assessing citizen well-being | |
Pánek et al. | Crowdsourcing of environmental health quality perceptions: A pilot study of Kroměříž, Czech Republic | |
Kaufhold et al. | Big data and multi-platform social media services in disaster management | |
Suarez et al. | A geographical and content-based approach to prioritize relevant and reliable tweets for emergency management | |
Yan et al. | Emotional responses through COVID-19 in Singapore | |
Singla et al. | DisDSS: a novel Web-based smart disaster management system for determining the nature of a social media message for decision-making using deep learning–case study of COVID-19 | |
Massa et al. | Social Media Geographic Information: Current developments and opportunities in urban and regional planning | |
Lee et al. | Two-Way Contact Network Modeling for Identifying the Route of COVID-19 Community Transmission | |
Xu et al. | Exploring regional variation in spatial language using spatially stratified web-sampled route direction documents | |
Ganapati | Public participation geographic information systems: A literature survey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |