KR101990862B1

KR101990862B1 - 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법

Info

Publication number: KR101990862B1
Application number: KR1020170089753A
Authority: KR
Inventors: 안성민; 김인기; 박동길
Original assignee: 안성민; 박동길
Priority date: 2017-07-14
Filing date: 2017-07-14
Publication date: 2019-06-20
Also published as: KR20190008487A

Abstract

본 발명은 일반적으로 서비스 유저들과 관련하여 수집되는 대량의 선택경향 데이터를 빅데이터 처리하여 유저의 취향 정보를 계량화 추출하는 빅데이터 기반의 유저 취향 정보 처리 기술에 관한 것이다. 더욱 상세하게는, 본 발명은 일상 생활에서 접하게 되는 여러가지 쟁점 이슈에 대한 서비스 유저들의 표면상의 선택항목들을 다수의 속성으로 분해하여 정리함으로써 개별 유저의 취향 정보를 속성기반 취향 프로파일의 형태로 데이터베이스 관리하는 빅데이터 기반의 유저 취향 정보 처리 기술에 관한 것이다. 또한, 본 발명은 속성기반 취향 프로파일의 데이터베이스를 활용하여 특정 재화(상품, 서비스)에 대한 유저별 선호도를 예측 산출할 수 있고 서비스 유저들 간의 카테고리별 취향 유사도를 예측 산출할 수 있다.

Description

기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법 {Big-data based method of processing user's taste information by use of base attribute analysis}

본 발명은 일반적으로 서비스 유저들과 관련하여 수집되는 대량의 선택경향 데이터를 빅데이터 처리하여 유저의 취향 정보를 계량화 추출하는 빅데이터 기반의 유저 취향 정보 처리 기술에 관한 것이다.

더욱 상세하게는, 본 발명은 일상 생활에서 접하게 되는 여러가지 쟁점 이슈에 대한 서비스 유저들의 표면상의 선택항목들을 다수의 속성으로 분해하여 정리함으로써 개별 유저의 취향 정보를 속성기반 취향 프로파일의 형태로 데이터베이스 관리하는 빅데이터 기반의 유저 취향 정보 처리 기술에 관한 것이다.

또한, 본 발명은 속성기반 취향 프로파일의 데이터베이스를 활용하여 특정 재화(상품, 서비스)에 대한 유저별 선호도를 예측 산출할 수 있고 서비스 유저들 간의 카테고리별 취향 유사도를 예측 산출할 수 있다.

일반적으로 SNS(Social Network Service, 사회관계망 서비스)란 온라인 상에서 인맥 구축이나 소통, 정보 공유 등을 목적으로 개설된 커뮤니티형 웹 사이트로서 현재 전세계적으로 카카오톡, 페이스북, 인스타그램, 트위터, 유튜브, 링크드인, 와츠앱, 핀터레스트 등이 유명하다.

특히 최근 들어 스마트폰 사용자의 증가와 무선 인터넷 서비스의 확충으로 인해 SNS 유저가 급증하는 추세이다. 2017년 4월 기준으로 글로벌 SNS 월간이용자수(MAU)를 살펴보면 페이스북 19억명, 유튜브 10억명, 인스타그램 6억명, 트위터 3억명, 핀터레스트 3억명으로 조사되었다.

이러한 SNS 서비스는 인터넷이라는 매체를 통해 사람들 간의 관계를 손쉽게 형성하고 이를 네트워크화함으로써 인맥을 확장시켜준다는 점에서 매우 획기적이며 유용할 뿐만 아니라 문화적 발달도 촉진하였다.

그러나, 현재 SNS를 통해 공유되는 정보의 내용을 살펴보면 간단한 채팅이거나 신변잡기에 불과하여 정보로서의 가치는 적은 편이다. 사람들이 SNS를 통해 자신의 신변에 관련된 사진이나 동영상을 올리면 사회관계망으로 연결된 사람들이 이에 대해 자신의 반응을 피드백하는 것이 전형적인 서비스 형태이다. 이러한 서비스 형태에서는 많은 사람들로부터 주목받는 것이 중요하며, 이를 위해 소위 파워유저들은 점점더 자극적인 콘텐츠를 올리고 있다.

그로 인한 결과의 한가지 유형으로서 일부 부유층이나 유명인사들이 명품이나 고가의 식사, 여행을 즐기는 사진을 올리고 있다. 이처럼 소수의 유저가 자기과시형 내지 행복과시형 콘텐츠를 게시하면 다수의 일반인 유저는 이를 보면서 대리 만족을 하는 문화가 팽배하다. 그러나 이는 그러한 게시물을 올리는 사람이나 그러한 게시물을 구경하는 사람 모두를 불행하게 만들 뿐이다.

그에 따라 카카오톡, 페이스북, 인스타그램의 첫자를 따서 명명한 소위 '카페인 우울증'이라는 말이 생겨났다. 카페인 우울증이란 카카오톡, 페이스북, 인스타그램 등을 통해 접하는 자기과시형 행복과시형 컨텐츠를 보면서 다수의 사람들이 자신이 불행하다고 느끼는 우울증을 의미한다. 이러한 저급한 문화는 SNS 서비스에서 아주 작은 부분이어서 감수해야 할 정도의 것이 아니라 오히려 최근에는 SNS 문화의 중심부로 되어가고 있는 추세이다.

이러한 부작용이 발생한 이유를 살펴보면 인간의 저급한 본성에도 그 원인을 찾을 수 있겠지만 기본적으로는 SNS를 통해 제공할 수 있는 서비스가 매우 단순하다는 점에도 큰 책임이 있다. 다수의 사람들 간에 편리하게 정보를 주고받을 수 있는 인프라를 구축하였지만 정작 그 인프라를 통해 제공되는 서비스가 유치하기 ?문에 사람들이 자극적인 콘텐츠에 몰두하는 것이다.

그에 따라, 종래의 과시형 SNS를 극복하고 다양한 형태로 유저들이 소통할 수 있고 이 과정에서 소통에 참여한 유저들이 행복감을 느낄 수 있는 차별화된 가치의 SNS 서비스가 필요하며, 이를 위해 SNS 유저의 취향 내지 선호도를 컴퓨터에서 활용 가능한 형태로 가공하는 데이터 처리 기술이 요망된다.

본 발명의 목적은 일반적으로 서비스 유저들과 관련하여 수집되는 대량의 선택경향 데이터를 빅데이터 처리하여 유저의 취향 정보를 계량화 추출하는 빅데이터 기반의 유저 취향 정보 처리 기술을 제공하는 것이다.

특히, 본 발명의 목적은 일상 생활에서 접하게 되는 여러가지 쟁점 이슈에 대한 서비스 유저들의 표면상의 선택항목들을 다수의 속성으로 분해하여 정리함으로써 개별 유저의 취향 정보를 속성기반 취향 프로파일의 형태로 데이터베이스 관리하는 빅데이터 기반의 유저 취향 정보 처리 기술을 제공하는 것이다.

또한, 본 발명의 목적은 속성기반 취향 프로파일의 데이터베이스를 활용하여 특정 재화(상품, 서비스)에 대한 유저별 선호도를 예측 산출하고 서비스 유저들 간의 카테고리별 취향 유사도를 예측 산출하는 것이다

본 발명은 상기의 목적을 달성하기 위하여 제안된 것이며, 본 발명은 유저 취향에 관련된 정보를 취향 분석처리 서버가 빅데이터 기반으로 분석 처리하는 방법으로서,

복수의 카테고리별로 다수의 분석대상 항목, 복수의 기저속성 항목, 기저속성 항목별 가중치을 설정하고 분석대상 항목 각각에 대하여 하나이상의 기저속성 항목을 설정함으로써 취향분석 환경을 설정하는 제 1 단계; 다수의 유저와 관련하여 분석대상 항목 간의 다수의 쟁점 이슈에 대한 응답선택 항목을 수집하는 제 2 단계; 그 수집된 다수의 응답선택 항목을 개별 유저별로 분류하고 해당 유저에 대한 응답선택 항목에 설정된 기저속성 항목의 가중치를 카테고리별로 누적함으로써 개별 유저에 대한 카테고리별 속성기반 취향 프로파일을 획득하여 개별 유저의 취향 정보를 계량화 추출하는 제 3 단계;를 포함하여 구성될 수 있다.

본 발명에 따른 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법은, 특정의 카테고리에 대하여 분석대상 항목에 미포함된 특정의 신규 쟁점 이슈에 관련된 기저속성 항목과 개별 유저의 해당 카테고리에 대한 속성기반 취향 프로파일을 대비함으로써 신규 쟁점 이슈에 대한 특정 유저의 선택예측 데이터를 계량화 산출하는 제 4 단계; 개별 유저에 대해 수집된 응답선택 항목 간의 항목별 대비 결과 및 개별 유저에 대해 획득된 카테고리별 속성기반 취향 프로파일의 기저속성별 대비 결과에 기초하여 복수의 유저들 상호간에 카테고리별 선택경향 유사도 데이터를 계량화 산출하는 제 5 단계; 개별 유저에 대해 수집된 응답선택 항목 간의 항목별 대비 결과 및 개별 유저에 대해 획득된 카테고리별 속성기반 취향 프로파일의 기저속성별 대비 결과에 기초하여 다수의 선택후보 항목 중에서 복수의 유저들 상호간의 공통 선택예측 항목을 선별하는 제 6 단계;를 더 포함하여 구성될 수 있다.

본 발명에서 제 1 단계는, 복수의 카테고리별로 다수의 분석대상 항목을 설정하는 단계; 복수의 카테고리별로 복수의 기저속성 항목을 설정하는 단계; 다수의 분석대상 항목과 복수의 기저속성 항목을 상이하게 조합하면서 인터넷 검색을 반복 수행하는 단계; 그 반복 수행된 인터넷 검색의 결과 분량을 기저속성 항목별로 분류하는 단계; 인터넷 검색 결과 분량의 상대적 비교 결과에 대응하여 기저속성 항목 각각에 대해 가중치를 설정하는 단계; 분석대상 항목 각각에 대하여 기저속성 항목을 하나이상 설정하는 단계;를 포함하여 구성될 수 있다.

또한, 제 3 단계는, 그 수집된 다수의 응답선택 항목을 개별 유저별로 분류하는 단계; 개별 유저에 대하여 해당 유저에 관련된 응답선택 항목을 복수의 카테고리별로 분류하는 단계; 개별 카테고리에 대하여 응답선택 항목에 설정된 기저속성 항목의 가중치를 누적하는 단계; 개별 카테고리에 대한 기저속성 항목들의 누적 가중치 분포를 해당 유저에 대한 카테고리별 속성기반 취향 프로파일로 설정하는 단계;를 포함하여 구성될 수 있다.

또한, 제 4 단계는, 특정의 카테고리에 대하여 분석대상 항목에 미포함된 특정의 신규 쟁점 이슈를 설정하는 단계; 신규 쟁점 이슈에 대해 복수의 기저속성 항목을 설정하는 단계; 개별 유저의 해당 카테고리에 대한 속성기반 취향 프로파일에서 신규 쟁점 이슈에 관련된 복수의 기저속성 항목과 매칭되는 가중치를 누적하는 단계; 그 누적된 가중치 값에 대응하여 신규 쟁점 이슈에 대한 특정 유저의 선택예측 데이터를 설정하는 단계;를 포함하여 구성될 수 있다.

또한, 제 5 단계는, 개별 유저에 대해 다수의 쟁점 이슈 중에서 응답선택 항목이 미수집된 쟁점 이슈들(이하, '비응답 쟁점 이슈'라 함)을 식별하는 단계; 유저별로 비응답 쟁점 이슈의 선택후보 항목들의 기저속성 항목과 해당 유저의 해당 카테고리에 대한 속성기반 취향 프로파일을 대비함으로써 비응답 쟁점 이슈에 대한 응답선택 항목을 예측하는 단계; 다수의 유저들 상호간에 카테고리별로 다수의 쟁점 이슈에 대한 위 수집 또는 예측된 응답선택 항목을 대비하고 그 일치 정도에 대응하여 해당 카테고리에 대한 선택경향 유사도 데이터를 산출하는 단계;를 포함하여 구성될 수 있다.

또한, 제 6 단계는, 복수의 유저들 상호간에 위 수집 또는 예측된 응답선택 항목을 대비하여 상호 일치하는 하나이상의 응답선택 항목을 공통 선택예측 항목으로 선별하는 단계;를 포함하여 구성될 수 있다.

한편, 본 발명에 따른 컴퓨터로 판독가능한 비휘발성 기록매체는 컴퓨터에 이상과 같은 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법을 실행시키기 위한 프로그램을 기록한 것이다.

본 발명에 따르면 인터넷 공간에서 다수의 유저들이 생성한 액티비티 정보를 다수의 기저속성 항목으로 분해하여 데이터 처리함으로써 액티비티에 관련된 다수 유저들의 공통점과 개별 유저의 특징을 기저속성 항목을 기준으로 계량화 산출할 수 있는 장점이 있다.

본 발명에 따르면 기저속성 항목의 계량화 산출 결과를 유저별로 구분하여 관리함으로써 개인의 취향 내지 선택 경향에 관련된 인터넷 서비스, 특히 사회관계망 서비스(SNS)의 신뢰도를 높일 수 있는 장점이 있다.

[도 1]은 본 발명에 따른 취향 분석처리 서버의 내부 기능적 구성을 나타낸 블록도.
[도 2]는 본 발명에 따른 빅데이터 기반의 유저 취향 정보 처리 과정의 전체 프로세스를 나타낸 순서도.
[도 3]은 본 발명에서 취향분석 환경을 설정하는 과정의 일 실시예를 나타낸 순서도.
[도 4]는 본 발명에서 개별 유저에 대한 취향 정보를 계량화 추출하는 과정의 일 실시예를 나타낸 순서도.
[도 5]는 본 발명에서 신규 쟁점 이슈에 대한 특정 유저의 선택예측 데이터를 계량화 산출하는 과정의 일 실시예를 나타낸 순서도.
[도 6]은 본 발명에서 복수의 유저들 상호간에 카테고리별 선택경향 유사도 데이터를 계량화 산출하는 과정의 일 실시예를 나타낸 순서도.
[도 7]은 본 발명에서 복수의 유저들 상호간에 공통 선택예측 항목을 선별하는 과정의 일 실시예를 나타낸 순서도.

이하에서는 도면을 참조하여 본 발명을 상세하게 설명한다.

[도 1]은 본 발명에 따른 취향 분석처리 서버(100)의 내부 기능적 구성을 나타낸 블록도이고, [도 2]는 본 발명에 따른 빅데이터 기반의 유저 취향 정보 처리 과정의 전체 프로세스를 나타낸 순서도이다.

[도 1]을 참조하면, 본 발명에 따른 취향 분석처리 서버(100)는 분석환경 설정부(110), 응답선택 수집부(120), 취향정보 계량추출부(130), 선택예측 계량산출부(140), 카테고리 유사도 산출부(150), 항목 유사도 산출부(160), 분석환경 데이터베이스부(170), 수집정보 데이터베이스부(180), 취향 프로파일 데이터베이스부(190)를 포함하여 구성된다.

이하에서는 이들 기능적 구성요소를 구비한 취향 분석처리 서버(100)가 유저 취향 정보를 빅데이터 기반으로 분석 처리하는 동작 프로세스를 [도 2]를 참조하여 전체적으로 살펴본다.

단계 (S110) : 먼저, 분석환경 설정부(110)가 취향 분석처리 서버(100)의 취향분석 환경을 설정하여 분석환경 DB부(170)에 저장한다. 구체적으로, 분석환경 설정부(110)는 복수의 카테고리별로 다수의 분석대상 항목, 복수의 기저속성 항목, 기저속성 항목별 가중치을 설정한다. 또한, 분석환경 설정부(110)는 복수의 분석대상 항목 각각에 대하여 해당 분석대상 항목의 특성을 설명해줄 수 있는 하나이상의 기저속성 항목을 설정한다.

이때, '카테고리'는 제품이나 서비스의 대분류를 의미하는 것으로 예컨대 음식, 여행, 패션, 영화, 음악, 자동차 등을 들 수 있다. 카테고리별로 성향이 상이하다는 점을 감안하여 취향 분석처리 서버(100)는 데이터 분석 결과의 정확도를 높이기 위해 유저 취향을 카테고리별로 구분하여 분석한다. 편이상 본 명세서에서는 '음식' 카테고리를 기준으로 데이터 분석 과정을 기술한다.

'분석대상 항목'은 해당 카테고리와 관련하여 사람들이 일상 생활에서 선택을 고민하는 항목들이다. 예를 들어, 음식 카테고리에서는 짜장면, 짜장밥, 짬뽕, 짬뽕밥, 후라이드 치킨, 양념치킨, 피자, 파스타, 햄버거, 볶음밥, 군만두, 물만두 등이 분석대상 항목에 해당한다. 사람들은 일상 생활속에서 이러한 항목들 중에서 자신의 취향에 따라 한가지를 선택하는데, 본 발명에서는 이러한 선택 결과에 기초하여 유저 취향을 분석한다.

'기저속성 항목'은 해당 카테고리에서 여러 분석대상 항목들의 성질을 설명할 수 있는 항목들이다. 바람직하게는 인간의 오감(시각, 청각, 후각, 촉각, 미각)과 각종 조건에 따라 특성을 분류하여 기저속성 항목을 설정할 수 있다. 예를 들어 음식 카테고리에 대하여 분석환경 설정부(110)는 다음의 [표 1]과 같이 기저속성 항목을 설정할 수 있다.

빨강	밝은	과일향	탄내	미끈미끈	아침	짤짤한	담백한
주황	어두운	감귤향	고소한	부드러운	점심	단	감칠맛
노랑	후루룩	나무향	더운	말랑말랑	저녁	달콤한	떫은
초록	보글보글	매운향	찬	탄탄한	밤	쓴	느끼한
주황	지글지글	허브향	시원한	무더운	매운	씁쓸한	깔끔한
보라	바삭바삭	박하향	미지근한	따뜻한	매콤한	신	된
분홍	슥슥	바닐라향	뜨거운	시린	간간한	시큼한	묽은
갈색	꽃향	그린향	거친	아픈	짠	개운한	쫄깃한

이처럼 분석환경 설정부(110)는 복수의 카테고리별로 복수의 기저속성 항목을 설정한다.

'기저속성 항목별 가중치'는 해당 카테고리에서 개별 기저속성 항목의 상대적인 중요도를 숫자로서 표시한 것이다. 취향 분석처리 서버(100)는 가중치가 높은 기저속성 항목은 해당 카테고리에서 무언가를 선택할 때에 일반적으로 사람들이 중요하게 생각하는 요소라고 다룬다. 본 발명에서 기저속성 항목별로 가중치를 설정하는 바람직한 실시예를 [도 3]을 참조하여 후술한다.

분석환경 설정부(110)는 복수의 분석대상 항목 각각에 대하여 해당 분석대상 항목을 묘사할 수 있는 하나이상의 기저속성 항목을 설정한다. 예를 들어 음식 카테고리에 속하는 다수의 분석대상 항목에 대하여 다음의 [표 2]와 같이 기저속성 항목을 설정할 수 있다.

짜장면	검정	후루룩	탄내	미지근한	간간한	씁쓸한	풍부한
짬뽕	빨강	후루룩	매운	뜨거운	매운	짠	새콤한
후라이드	노랑	바삭바삭	고소한	거친	고소한	짠	느끼한
양념치킨	주황	슥슥	매운	부드러운	매콤한	감칠맛	새콤한
비빔밥	빨강	슥슥	매운	부드러운	매콤한	감칠맛	새콤한
볶음밥	노랑	지글지글	고소한	거친	고소한	짠	느끼한
군만두	노랑	지글지글	고소한	거친	고소한	짠	느끼한
물만두	흰색	보글보글	바닐라	부드러운	담백	개운한	묽은

단계 (S120) : 응답선택 수집부(120)는 다수의 유저와 관련하여 이들 분석대상 항목 간에 다수의 쟁점 이슈를 가정하고 그에 대한 응답선택 항목을 수집하여 수집정보 DB부(180)에 저장한다.

사람들은 일상 생활에서 분석대상 항목 간에 선택을 고민하게 된다. 예를 들어 음식 카테고리의 경우에 짬뽕을 먹을 것인지 아니면 짜장면을 먹을 것인지, 후라이드 치킨을 먹을 것인지 아니면 양념치킨을 먹을 것인지 등과 같이 다양한 조합에서 각자 선택을 하게 된다. 본 명세서에서는 이와 같은 분석대상 항목 간에 설정되는 선택의 문제들을 '쟁점 이슈'라고 부르고, 해당 쟁점 이슈에 대해 각 유저가 실제로 선택한 분석대상 항목을 '응답선택 항목'이라고 부른다.

본 발명에서는 다수의 유저, 복수의 카테고리, 다수의 분석대상 항목, 복수의 기저속성 항목, 다수의 쟁점 이슈를 가정한다. 응답선택 수집부(120)가 수집하는 응답선택 항목은 시간이 경과함에 따라 엄청나게 많이 쌓이게 되고, 후술하는 바와 같이 본 발명에서는 하나의 분석대상 항목을 복수의 기저속성 항목으로 분해하여 데이터 처리한다. 그에 따라, 취향 분석처리 서버(100)는 다수의 응답선택 항목들을 빅데이터 처리해야만 하게 된다.

다수의 유저와 관련하여 다수의 응답선택 항목을 수집하는 방법의 일 실시예로는 SNS 매체나 스마트폰 앱을 통해 유저에게 간단한 질문을 제공하고 그에 대한 답변을 제공받는 것을 생각할 수 있다. 예를 들어, 매일 점심시간마다 그날의 식사음식을 물어보거나 혹은 몇가지 음식을 제시하고 그중에서 맘에 드는 음식이 무엇인지 답변을 제공받는 것이다. 혹은 소위 '음식 월드컵'과 같은 이벤트를 통해 여러 사람들의 음식에 대한 기호를 한꺼번에 제공받을 수 있다. 그 외에도 인터넷 검색 키워드나 신용카드 결제 기록을 분석함으로써 각 유저에 대하여 다수의 쟁점 이슈에 대한 응답선택 항목을 획득할 수 있다.

단계 (S130) : 취향정보 계량추출부(130)는 다수의 응답선택 항목을 개별 유저별로 분류하고, 해당 유저에 대한 다수의 응답선택 항목에 설정된 기저속성 항목의 가중치를 카테고리별로 누적한다. 이를 통해, 취향정보 계량추출부(130)는 개별 유저의 취향 정보를 계량화 추출할 수 있는데, 이러한 과정을 통해 얻어진 누적 가중치 값을 개별 유저에 대한 카테고리별 '속성기반 취향 프로파일'이라고 부른다. 취향정보 계량추출부(130)는 개별 유저에 대한 카테고리별 속성기반 취향 프로파일을 취향 프로파일 DB부(190)에 저장한다.

먼저, 개별 유저의 취향 정보를 계량화 추출하는 것이 목적이므로 다수의 응답선택 항목을 개별 유저별로 분류한다.

그리고 나서, 각 유저에 대하여 해당 유저와 관련된 응답선택 항목들에 설정된 기저속성 항목들을 식별한다. 이들 기저속성 항목들이 해당 카테고리에 대해 해당 유저가 가지고 있는 기호 내지 취향의 기초 특성이라고 본 발명은 평가한다. 특정의 기저속성 항목이 반복해서 발견된다면 해당 유저는 해당 카테고리에 대해 해당 기저속성 항목, 예컨대 '매운"에 대한 선택경향이 큰 것이다. 따라서, 특정 유저와 관련하여 출현 횟수가 많은 기저속성 항목이 출현 횟수가 적은 기저속성 항목에 비해 상대적으로 더 중요하게 다루어진다.

그리고 나서, 취향정보 계량추출부(130)는 해당 유저의 기저속성 항목들의 가중치를 누적한다. 앞의 과정에서 기저속성 항목의 출현 횟수를 파악하였는데, 여기에 기저속성 항목별로 설정된 가중치를 반영하는 것이다. 카테고리별로 기저속성 항목의 중요도는 상대적으로 차이가 있으며 그 차이 정도는 가중치라는 수치로서 도출된 바 있다. 그에 따라, 각 유저에 대해 기저속성 항목들의 출현 횟수에 가중치를 곱셈 연산하는 것이다.

이러한 일련의 과정을 통하여 취향정보 계량추출부(130)는 각 유저에 대해 기저속성 항목별로 누적 가중치 값을 얻게 된다. 누적 가중치 값이 높은 기저속성 항목은 해당 유저가 선택경향이 높은 음식 특성이고, 반대로 누적 가중치 값이 낮은 기저속성 항목은 해당 유저가 선택경향이 낮은 음식 특성이다. 카테고리별로 설정되어 있는 복수의 기저속성 항목을 그룹으로 묶으면 해당 유저의 카테고리별 속성기반 취향 프로파일이 구성된다.

본 발명에서 개별 유저에 대한 카테고리별 속성기반 취향 프로파일을 획득하는 바람직한 실시예를 [도 4]를 참조하여 후술한다.

단계 (S140) : 선택예측 계량산출부(140)는 특정의 카테고리에 대하여 분석대상 항목에 미포함된 특정의 신규 쟁점 이슈에 관련된 기저속성 항목과 개별 유저의 해당 카테고리에 대한 속성기반 취향 프로파일을 대비함으로써 신규 쟁점 이슈에 대한 특정 유저의 선택예측 데이터를 계량화 산출한다.

앞서 분석대상 항목에 포함되어 있지 않았던 신규 쟁점 이슈, 예컨대 '골뱅이 소면'이나 '도토리 무침'이 제시되었을 때, 선택예측 계량산출부(140)는 이러한 신규 쟁점 이슈에 대한 특정 유저의 선호도 내지 선택가능 정도를 수치적으로 도출해낸다. 본 발명은 선호도 내지 선택가능 정보를 막연히 예측하는 것이 아니라 그 레벨을 수치적으로 계산해낸다. 후처리 과정에서 이 계산 값을 특정의 임계치와 비교함으로써 선택할지 안할지를 예측할 수 있을 것이다.

먼저, 선택예측 계량산출부(140)는 해당 카테고리와 관련하여 앞서 설정되어 있는 다수의 기저속성 항목들 중에서 해당 신규 쟁점 이슈의 특성을 설명해줄 수 있는 복수의 기저속성 항목을 설정한다.

그리고 나서, 신규 쟁점 이슈의 기저속성 항목과 해당 유저의 해당 카테고리에 대한 속성기반 취향 프로파일과 대비하며, 이를 통해 해당 신규 쟁점 이슈에 대한 해당 유저의 선택예측 데이터를 계량화 산출할 수 있다. 바람직하게는 해당 유저의 해당 카테고리에 대한 속성기반 취향 프로파일로부터 신규 쟁점 이슈의 기저속성 항목에 해당하는 누적 가중치 값들을 합산하는 방식을 채택할 수 있다. 그 합산된 값이 크다면 신규 쟁점 이슈(예: 골뱅이 소면)는 해당 유저의 선택경향과 잘 맞는 것이므로 해당 유저의 선택예측 데이터로 활용 가능하다.

한편, 여러 개의 신규 쟁점 이슈들에 대해 선택예측 데이터를 산출하여 서로 비교함으로써 특정의 유저에 대하여 어떠한 재화를 추천하는 것이 성공 가능성이 높은지 활용하는 것도 가능하다. 또한, 하나의 신규 쟁점 이슈에 대해 여러 유저에 대한 선택예측 데이터를 산출하여 서로 비교함으로써 해당 재화를 누구에게 추천하는 것이 성공 가능성이 높은지 활용하는 것도 가능하다.

본 발명에서 신규 쟁점 이슈에 대한 특정 유저의 선택예측 데이터를 계량화 산출하는 바람직한 실시예를 [도 5]를 참조하여 후술한다.

단계 (S150) : 카테고리 유사도 산출부(150)는 복수의 유저들 상호간에 카테고리별로 선택경향이 얼마나 유사한지 여부에 관한 선택경향 유사도 데이터를 계량화 산출한다. 예를 들어, 특정의 유저 A와 B가 음식 카테고리에 대해 선택경향 유사도가 예컨대 78 퍼센트라는 결과를 얻는 것이다.

이를 위해, 카테고리 유사도 산출부(150)는 개별 유저에 대해 수집된 응답선택 항목 간의 항목별 대비 결과를 활용한다. 즉, 해당 카테고리에 속하는 다수의 쟁점 이슈에 대해 이들 유저들에 대하여 동일한 응답대상 항목이 수집된 비율이 얼마나 되는지를 고려하는 것이다.

또한, 카테고리 유사도 산출부(150)는 개별 유저에 대해 획득된 카테고리별 속성기반 취향 프로파일의 기저속성별 대비 결과를 활용한다. 즉, 해당 카테고리에 대해 이들 유저의 속성기반 취향 프로파일이 유사한 정도를 고려하는 것이다. 예를 들어, 유저 A와 B의 속성기반 취향 프로파일에 속하는 다수의 기저속성 항목에 대해 개별 항목단위로 가중치 값을 비교하여 낮은 값을 남겨서 모두 합산하는 방식을 생각할 수 있다. 속성기반 취향 프로파일이 완전히 상이하다면 대부분의 기저속성 항목에 대해 낮은 값만 남겨질 것이어서 그 합산 결과도 낮게 도출될 것이다. 속성기반 취향 프로파일이 유사해질수록 일부 기저속성 항목에 대해 높은 값이 남겨질 것이어서 그 합산 결과도 점점 큰 값으로 도출될 것이다.

본 발명에서 유저들 상호간에 카테고리별 선택경향 유사도 데이터를 계량화 산출하는 바람직한 실시예를 [도 6]을 참조하여 후술한다.

단계 (S160) : 항목 유사도 산출부(160)는 특정의 쟁점 이슈에 관한 다수의 선택후보 항목들 중에서 복수의 유저들이 공통으로 선택할 것으로 여겨지는 항목, 즉 공통 선택예측 항목을 선별한다.

이를 위해, 항목 유사도 산출부(160)는 개별 유저에 대해 수집된 응답선택 항목 간의 항목별 대비 결과를 활용한다. 즉, 해당 카테고리에 대하여 유저들이 동일하게 제공한 응답대상 항목이 무엇인지 고려하는 것이다.

또한, 항목 유사도 산출부(160)는 개별 유저에 대해 획득된 카테고리별 속성기반 취향 프로파일의 기저속성별 대비 결과를 활용한다. 즉, 해당 카테고리의 속성기반 취향 프로파일에서 이들 유저가 공통으로 높은 가중치를 보이고 있는 기저속성 항목을 식별하고, 해당 카테고리에 속하는 다수의 분석대상 항목들 중에서 그 식별된 기저속성 항목들을 갖추고 있는 항목이 무엇인지 고려하는 것이다.

본 발명에서 유저들 상호간의 공통 선택예측 항목을 선별하는 바람직한 실시예를 [도 7]을 참조하여 후술한다.

[도 3]은 본 발명에서 분석환경 설정부(110)가 취향분석 환경을 설정하는 과정의 일 실시예를 나타낸 순서도이다. 이 과정은 [도 2]에 도시된 전체 프로세스에서 단계 (S110)에 대응한다.

단계 (S210, S220) : 먼저, 복수의 카테고리별로 다수의 분석대상 항목과 복수의 기저속성 항목을 설정한다.

분석환경 설정부(110)는 카테고리별로 다수의 분석대상 항목(예: 짜장면, 짜장밥, 짬뽕, 짬뽕밥, 후라이드 치킨, 양념치킨, 피자, 파스타, 햄버거, 볶음밥, 군만두, 물만두 등)을 설정한다.

또한, 분석환경 설정부(110)는 카테고리별로 분석대상 항목들의 성질을 설명할 수 있는 복수의 기저속성 항목을 설정한다. 음식 카테고리에 대한 기저속성 항목들의 예를 앞서 [표 1]로 제시한 바 있다.

이와 같은 복수의 카테고리, 다수의 분석대상 항목, 복수의 기저속성 항목은 미리 결정되어 취향 분석처리 서버(100)의 하드디스크에 저장되어 있을 수도 있고, 외부의 환경설정 서버(미도시)에서 결정하여 네트워크를 통해 취향 분석처리 서버(100)로 제공될 수도 있다.

단계 (S230) : 분석환경 설정부(110)는 다수의 분석대상 항목과 복수의 기저속성 항목을 상이하게 조합하면서 인터넷 검색을 반복 수행한다. 예를 들어 구글 검색기, 네이버 검색기, 빙 검색기를 사용하여 인터넷 검색을 반복적으로 다수 수행하는데, 이때 검색 키워드로서 다수의 분석대상 항목과 복수의 기저속성 항목을 상이하게 조합하여 적용한다.

이 과정은 해당 카테고리 내에서 사람들이 어떠한 기저속성을 더 중요하게 고려하고 반대로 어떠한 기저속성은 상대적으로 덜 중요하게 고려하는지를 간접적으로 나타내는 지표를 얻기 위한 것이다. 해당 카테고리와 관련하여 인터넷 게시물에 더많이 언급될수록 사람들이 재화 선택에 있어서 그 용어를 더 많이 고려할 가능성이 높다고 본 발명은 간주하는 것이다. 이때, 카테고리 이름을 검색 키워드에 넣는 것보다는 해당 카테고리에 속하는 분석대상 항목들을 검색 키워드에 넣는 것이 좀더 넓은 검색 범위를 얻는 데에 유리하다.

단계 (S240, S250) : 분석환경 설정부(110)는 그 반복 수행된 인터넷 검색의 결과 분량을 기저속성 항목별로 분류하고, 인터넷 검색 결과 분량에 따라 기저속성 항목들의 순위를 설정한다.

앞서의 단계 (S230)에서 반복 수행된 인터넷 검색의 결과 분량을 기저속성 항목별로 분류한다. 이때, 어떠한 기저속성 항목에 대해서는 검색 결과가 많이 도출되었을 것이고, 반대로 어떠한 기저속성 항목에 대해서는 검색 결과가 적게 도출되었을 것이다. 그에 따라, 분석환경 설정부(110)는 그 검색 결과 분량을 기준으로 기저속성 항목들의 순위를 매긴다.

본 발명에서는 상위 순위의 기저속성 항목일수록 해당 카테고리에서 사람들이 상품 또는 서비스를 선택함에 있어서 상대적으로 더 중요하게 고려하는 특성이라고 간주한다.

이때, 후속 프로세싱을 간편하게 하기 위해서 일정 순위 이상에 속하는 기저속성 항목만 남기고 나머지는 삭제할 수도 있다. 예를 들면, 인터넷 검색을 수행할 때에는 1000개의 기저속성 항목들을 사용하였으나, 단계 (S250)을 수행하면서 상위 순위 100개의 기저속성 항목만 남기는 것이다.

단계 (S260) : 분석환경 설정부(110)는 위 순위에 대응하여 기저속성 항목 각각에 대하여 가중치를 설정한다. 일반적으로는 개별 카테고리에 속하는 기저속성 항목들 전체에 부여된 가중치들의 총합은 100이며, 상위 순위의 기저속성 항목일수록 더 높은 가중치를 부여받는다. 이때. 검색 결과 분량에 비례하도록 가중치가 할당될 수도 있고, 순위에 따라서 가중치가 할당될 수도 있다.

단계 (S270) : 분석환경 설정부(110)는 분석대상 항목 각각에 대하여 해당 분석대상 항목을 묘사할 수 있는 기저속성 항목을 하나이상 설정하는데, 그 예를 앞서 [표 2]로 제시한 바 있다.

[도 4]는 본 발명에서 취향정보 계량추출부(130)가 개별 유저의 취향 정보를 카테고리별로 마련된 다수의 기저속성 항목을 기준으로 계량화 추출하는 과정의 일 실시예를 나타낸 순서도이다. 이 과정은 [도 2]에 도시된 전체 프로세스에서 단계 (S130)에 대응한다.

단계 (S310, S320) : 먼저, 취향정보 계량추출부(130)는 단계 (S120)에서 수집된 다수의 응답선택 항목을 유저별로 분류한다. 그리고 나서, 취향정보 계량추출부(130)는 각각의 유저에 대해 그 유저에 관련된 다수의 응답선택 항목을 복수의 카테고리별로 분류한다.

단계 (S330) : 그리고 나서, 취향정보 계량추출부(130)는 개별 카테고리에 대하여 해당 유저에 관련된 응답선택 항목들에 설정되어 있는 기저속성 항목들의 가중치를 기저속성 항목별로 누적한다. 응답선택 항목은 인터넷 공간에서 유저 자신에 의해 생성된 정보라는 점을 감안하면, 단계 (S330)은 카테고리별로 유저의 선택경향이 각각의 기저속성 항목에 대해 어느 정도로 연관성을 가지고 있는지를 컴퓨터 소프트웨어를 통해 산출해내는 과정이다.

예를 들어, 특정의 유저가 음식 카테고리 내에서 매운 음식들에 대한 선택 의사를 자주 밝혔거나 혹은 실제로 자주 선택하였다면 해당 유저에 대해서는 '매운'이라는 기저속성 항목의 가중치 값이 높게 산출될 것이다.

단계 (S340) : 취향정보 계량추출부(130)는 개별 카테고리에 대한 기저속성 항목의 누적 가중치 분포를 해당 유저에 대한 카테고리별 속성기반 취향 프로파일로 설정한다. 이 분포는 해당 유저가 선택행위를 할 때에 어떠한 속성에 긍정적인 영향을 받는지를 수치적으로 모델링한 것이다.

[도 5]는 본 발명에서 선택예측 계량산출부(140)가 유저별 취향 정보에 기초하여 이전에 확인된 바 없었던 신규 쟁점 이슈에 대하여 특정 유저가 어떻게 응답할 것인가를 확률적으로 예측하기 위한 근거가 될 선택예측 데이터를 계량화 산출하는 과정의 일 실시예를 나타낸 순서도이다. 이 과정은 [도 2]에 도시된 전체 프로세스에서 단계 (S140)에 대응한다.

단계 (S410) : 먼저, 선택예측 계량산출부(140)는 특정의 카테고리에 대하여 분석대상 항목에 미포함된 특정의 신규 쟁점 이슈를 설정한다. 예를 들면, 앞서 분석대상 항목에 포함되어 있지 않았던 신규 쟁점 이슈, 예컨대 '골뱅이 소면'이나 '도토리 무침'을 신규 쟁점 이슈로 설정한다.

단계 (S420) : 선택예측 계량산출부(140)는 해당 카테고리와 관련하여 앞서 설정되어 있는 다수의 기저속성 항목들 중에서 신규 쟁점 이슈의 특성을 설명해줄 수 있는 복수의 기저속성 항목을 설정한다. 예를 들면, 신규 쟁점 이슈 '골뱅이 소면'에 대해서는 일반적으로 골뱅이 소면이 갖는 특성을 나열하여 [표 3]과 같이 기저속성 항목을 설정할 수 있다.

골뱅이
소면

빨강

후루룩

쫄깃한

매콤한

말랑말랑

저녁

감칠맛

단계 (S430) : 선택예측 계량산출부(140)는 개별 유저의 해당 카테고리에 대한 속성기반 취향 프로파일에서 신규 쟁점 이슈에 관련된 복수의 기저속성 항목과 매칭되는 가중치를 누적한다.

즉, 개별 유저가 음식 카테고리에 대해 갖는 속성기반 취향 프로파일로부터 신규 쟁점 이슈 '골뱅이 소면'에 대해 설정된 [표 3]의 기저속성 항목의 가중치들을 구하여 합산하는 것이다.

단계 (S440) : 선택예측 계량산출부(140)는 그 누적된 가중치 값에 대응하여 신규 쟁점 이슈에 대한 특정 유저의 선택예측 데이터를 설정한다. 그 누적된 가중치 값이 클수록 신규 쟁점 이슈가 해당 유저의 선택 취향에 잘 맞는 것이므로 이를 선택예측 데이터로 간주할 수 있다.

[도 6]은 본 발명에서 카테고리 유사도 산출부(150)가 유저들 상호간에 카테고리 단위로 취향이 얼마나 유사한지 판단하는 근거가 될 선택경향 유사도 데이터를 계량화 산출하는 과정의 일 실시예를 나타낸 순서도이다. 이 과정은 [도 2]에 도시된 전체 프로세스에서 단계 (S150)에 대응한다.

단계 (S510 ~ S540) : 먼저, 카테고리 유사도 산출부(150)는 다수의 쟁점 이슈 중에서 유저별로 응답선택 항목이 미수집된 쟁점 이슈들(이하, '비응답 쟁점 이슈'라 함)을 식별한다. 일반적으로 유저들은 다수의 쟁점 이슈들 중에서 일부에 대해서만 응답선택 항목을 제공한다. 그에 따라, 응답선택 항목이 수집되지 못한 쟁점 이슈들을 유저별로 식별한다.

이들 비응답 쟁점 이슈에 대해서는 복수의 선택후보 항목, 즉 유저의 선택지가 미리 설정되어 있다. 예를 들어 비응답 쟁점 이슈가 "중국식당에 가면 무엇을 주로 먹는가" 였다고 가정하면 선택후보 항목으로는 짜장면, 짬뽕, 볶음밥, 군만두 등이 미리 설정되어 있는 것이다.

카테고리 유사도 산출부(150)는 이들 선택후보 항목들의 기저속성 항목을 식별하고, 이들 선택후보 항목들의 기저속성 항목과 해당 유저의 해당 카테고리에 대한 속성기반 취향 프로파일을 대비하여 매칭되는 가중치를 누적한다. 그리고 나서, 카테고리 유사도 산출부(150)는 선택후보 항목들의 누적 가중치 값을 비교하여 비응답 쟁점 이슈에 대한 응답선택 항목을 예측한다. 이 과정은 [도 5]를 참조하여 전술한 내용과 유사하므로 자세한 설명은 생략한다.

이상의 과정을 통해 카테고리 유사도 산출부(150)는 다수 유저들이 모든 쟁점 이슈에 대해 응답선택을 제공한 것처럼 가상으로 만든다.

단계 (S550, S560) : 카테고리 유사도 산출부(150)는 유저들 상호간에 카테고리별로 미리 설정되어 있는 다수의 쟁점 이슈에 대하여 위 수집 또는 예측된 응답선택 항목들을 일대일 대비한다. 그 대비 결과, 유저들이 상호 얼마나 일치하는지 정도에 대응하여 해당 카테고리에 대한 유저 상호간의 선택경향 유사도 데이터를 산출할 수 있다. 예를 들어, 음식 카테고리에 대해 유저 A와 B가 총 100개의 쟁점 이슈 중에서 78개에 대해 동일한 응답선택 항목을 제공하였다면 유저 A와 B는 음식 카테고리에 대해 선택경향 유사도가 78 퍼센트이다.

[도 7]은 본 발명에서 항목 유사도 산출부(160)가 유저들 상호간에 쟁점 이슈에 대해 동일한 응답을 보일 것으로 예측하는 근거가 될 공통 선택예측 항목을 선별하는 과정의 일 실시예를 나타낸 순서도이다. 이 과정은 [도 2]에 도시된 전체 프로세스에서 단계 (S160)에 대응한다.

단계 (S610) : 먼저, 항목 유사도 산출부(160)는 복수의 유저들 상호간에 위 수집 또는 예측된 응답선택 항목을 대비한다. 이때 활용되는 응답선택 항목으로는 직접 수집된 정보 뿐만 아니라 단계 (S510 ~ S540)를 통해 예측된 정보도 함께 활용하는 것이 바람직하다. 카테고리별 속성기반 취향 프로파일을 통해 예측한 것이므로 해당 정보의 신뢰도는 상당히 높다고 평가한다.

단계 (S620) : 그 대비한 결과, 항목 유사도 산출부(160)는 유저들 상호 간에 서로 일치하는 하나이상의 응답선택 항목을 식별하며, 이들을 해당 유저들에 대한 공통 선택예측 항목으로 선별한다.

한편, 본 발명은 컴퓨터가 읽을 수 있는 비휘발성 기록매체에 컴퓨터가 읽을 수 있는 코드의 형태로 구현되는 것이 가능하다. 이러한 비휘발성 기록매체는 컴퓨터가 읽을 수 있는 데이터를 저장하는 모든 종류의 스토리지 장치를 포함하는데 예컨대 하드디스크, SSD, CD-ROM, NAS, 자기테이프, 웹디스크, 클라우드 디스크 등이 있고 네트워크로 연결된 다수의 스토리지 장치에 코드가 분산 저장되고 실행되는 형태로 구현될 수도 있다.

100 : 취향 분석처리 서버
110 : 분석환경 설정부
120 : 응답선택 수집부
130 : 취향정보 계량추출부
140 : 선택예측 계량산출부
150 : 카테고리 유사도 산출부
160 : 항목 유사도 산출부
170 : 분석환경 데이터베이스부
180 : 수집정보 데이터베이스부
190 : 취향 프로파일 데이터베이스부

Claims

유저 취향에 관련된 정보를 취향 분석처리 서버가 기저속성 분석을 이용한 빅데이터 기반으로 분석 처리하는 방법으로서,
미리 설정된 복수의 카테고리 별로 사람들이 일상 생활에서 선택을 고민하는 다수의 분석대상 항목을 설정하는 제 1A 단계;
상기 복수의 카테고리 별로 상기 분석대상 항목들의 성질을 기술하는 복수의 기저속성 항목을 설정하는 제 1B 단계;
인터넷 검색 키워드로서 상기 다수의 분석대상 항목과 상기 복수의 기저속성 항목을 상이하게 조합하면서 인터넷 검색을 반복 수행하고, 상기 반복 수행된 인터넷 검색으로 수집된 검색 결과 분량을 상기 기저속성 항목 별로 분류하고, 그 분류된 검색 결과 분량의 상대적 비교에 대응하여 상기 기저속성 항목에 대하여 가중치를 설정하는 제 1C 단계;
상기 다수의 분석대상 항목 각각에 대하여 해당 분석대상 항목의 성질에 매칭되는 기저속성 항목을 하나이상 설정하는 제 1D 단계;
상기 분석대상 항목 사이의 선택에 관련하여 가정한 다수의 쟁점 이슈에 대하여 다수의 유저로부터 각 유저가 상기 쟁점 이슈에서 실제 선택한 분석대상 항목인 응답선택 항목을 수집하는 제 2 단계;
상기 수집된 다수의 응답선택 항목을 개별 유저별로 분류하고 각 유저에 관련된 다수의 응답선택 항목을 각 카테고리 별로 분류하는 제 3A 단계;
개별 카테고리에 대하여 해당 유저에 의해 상기 응답선택 항목으로 선택된 다수의 분석대상 항목 각각에 대하여 상기 제 1D 단계에서 설정된 기저속성 항목을 식별하고 이들 기저속성 항목에 대하여 상기 제 1C 단계에서 설정된 가중치를 각각의 기저속성 항목 별로 누적함으로써 상기 기저속성 항목들의 누적 가중치 분포를 획득하는 제 3B 단계;
개별 카테고리에 대해 상기 제 3B 단계에서 획득된 상기 기저속성 항목들의 누적 가중치 분포를 해당 유저에 대한 카테고리별 속성기반 취향 프로파일로 설정하여 개별 유저의 취향 정보를 계량화 추출하는 제 3C 단계;
를 포함하여 구성되는 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법.
청구항 1에 있어서,
상기 제 3C 단계 이후에 수행되는,
특정의 카테고리에 대하여 상기 분석대상 항목에 미포함된 특정의 신규 쟁점 이슈에 관련된 기저속성 항목과 개별 유저의 해당 카테고리에 대한 상기 속성기반 취향 프로파일을 대비함으로써 상기 신규 쟁점 이슈에 대한 특정 유저의 선택예측 데이터를 계량화 산출하는 제 4 단계;
를 더 포함하여 구성되는 것을 특징으로 하는 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법.
청구항 2에 있어서,
상기 제 3C 단계 이후에 수행되는,
개별 유저에 대해 수집된 상기 응답선택 항목 간의 항목별 대비 결과 및 개별 유저에 대해 획득된 상기 카테고리별 속성기반 취향 프로파일의 기저속성별 대비 결과에 기초하여 복수의 유저들 상호간에 카테고리별 선택경향 유사도 데이터를 계량화 산출하는 제 5 단계;
개별 유저에 대해 수집된 상기 응답선택 항목 간의 항목별 대비 결과 및 개별 유저에 대해 획득된 상기 카테고리별 속성기반 취향 프로파일의 기저속성별 대비 결과에 기초하여 다수의 선택후보 항목 중에서 복수의 유저들 상호간의 공통 선택예측 항목을 선별하는 제 6 단계;
를 더 포함하여 구성되는 것을 특징으로 하는 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법.
삭제
삭제
청구항 3에 있어서,
상기 제 4 단계는,
특정의 카테고리에 대하여 상기 분석대상 항목에 미포함된 특정의 신규 쟁점 이슈를 설정하는 단계;
상기 신규 쟁점 이슈에 대해 복수의 기저속성 항목을 설정하는 단계;
개별 유저의 해당 카테고리에 대한 상기 속성기반 취향 프로파일에서 상기 신규 쟁점 이슈에 관련된 상기 복수의 기저속성 항목과 매칭되는 가중치를 누적하는 단계;
상기 누적된 가중치 값에 대응하여 상기 신규 쟁점 이슈에 대한 특정 유저의 선택예측 데이터를 설정하는 단계;
를 포함하여 구성되는 것을 특징으로 하는 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법.
청구항 6에 있어서,
상기 제 5 단계는,
개별 유저에 대해 상기 다수의 쟁점 이슈 중에서 응답선택 항목이 미수집된 쟁점 이슈들(이하, '비응답 쟁점 이슈'라 함)을 식별하는 단계;
유저별로 상기 비응답 쟁점 이슈의 선택후보 항목들의 기저속성 항목과 해당 유저의 해당 카테고리에 대한 상기 속성기반 취향 프로파일을 대비함으로써 상기 비응답 쟁점 이슈에 대한 응답선택 항목을 예측하는 단계;
다수의 유저들 상호간에 카테고리별로 상기 다수의 쟁점 이슈에 대한 상기 수집 또는 예측된 응답선택 항목을 대비하고 그 일치 정도에 대응하여 해당 카테고리에 대한 선택경향 유사도 데이터를 산출하는 단계;
를 포함하여 구성되는 것을 특징으로 하는 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법.
청구항 7에 있어서,
상기 제 6 단계는,
복수의 유저들 상호간에 상기 수집 또는 예측된 상기 응답선택 항목을 대비하여 상호 일치하는 하나이상의 응답선택 항목을 해당 유저들에 대한 공통 선택예측 항목으로 선별하는 단계;
를 포함하여 구성되는 것을 특징으로 하는 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법.
컴퓨터에 청구항 1 내지 3, 6 내지 8 중 어느 하나의 항에 따른 기저속성 분석을 이용한 빅데이터 기반의 유저 취향 정보 처리 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독가능한 비휘발성 기록매체.