KR101664358B1 - 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법 - Google Patents

토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법 Download PDF

Info

Publication number
KR101664358B1
KR101664358B1 KR1020150025388A KR20150025388A KR101664358B1 KR 101664358 B1 KR101664358 B1 KR 101664358B1 KR 1020150025388 A KR1020150025388 A KR 1020150025388A KR 20150025388 A KR20150025388 A KR 20150025388A KR 101664358 B1 KR101664358 B1 KR 101664358B1
Authority
KR
South Korea
Prior art keywords
customer
news
information
unit
clustering
Prior art date
Application number
KR1020150025388A
Other languages
English (en)
Other versions
KR20160102822A (ko
Inventor
김남규
현윤진
조윤호
Original Assignee
국민대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국민대학교산학협력단 filed Critical 국민대학교산학협력단
Priority to KR1020150025388A priority Critical patent/KR101664358B1/ko
Publication of KR20160102822A publication Critical patent/KR20160102822A/ko
Application granted granted Critical
Publication of KR101664358B1 publication Critical patent/KR101664358B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Abstract

본 발명은 고객의 인터넷 사용패턴을 분석하여 비정형 데이터 분석 기술인 텍스트 마이닝 기반의 고객 세분화 방법론을 통해 고객을 동질적인 특성을 가진 집단으로 나누어 보다 손쉽게 고객의 니즈를 파악해 기업의 마케팅 전략을 세울 수 있는 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법을 제공하기 위한 것으로서, 인구통계학 정보를 기반으로 고객을 그룹화하는 인구통계학 정보 기반 고객 클러스터링부와, 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부와, 고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 포털사이트 검색 키워드 기반 고객 클러스터링부와, 상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 고객의 뉴스 접속 기록과 검색 키워드를 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부를 포함하여 구성되는데 있다.

Description

토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법{Apparatus and method for multi-dimensional customer's clustering using topic analysis}
본 발명은 다차원 고객 클러스터링 장치 및 방법에 관한 것으로, 특히 고객을 동질적인 특성을 가진 집단으로 나누어 보다 손쉽게 고객의 니즈를 파악해 기업의 마케팅 전략을 세울 수 있는 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법에 관한 것이다.
대부분의 기업들은 시장세분화를 통한 성장을 추구해왔으나, 기업에서 내놓는 제품과 서비스의 평균 수명이 상대적으로 매우 짧아짐과 동시에 해당 기업이 속하는 시장이 하루가 다르게 변화함은 물론 고객의 선택의 폭이 매우 다양해짐에 따라 현재는 시장이 아닌 고객이 기업의 성장에 매우 중요한 요소로 자리 잡게 되었다. 따라서 기업들은 새로운 시장에 진입하기 위해 노력하기 보다는 자신들의 고객이 원하는 것을 파악하고, 그에 맞는 맞춤형 제품과 서비스를 제공함으로써 수익을 극대화하기 위해 더 많은 노력을 기울이고 있다. 하지만 고객 개개인의 니즈(Needs)를 파악하는 것은 많은 어려움이 따를 뿐 아니라, 시간과 비용이 지나치게 많이 소비되는 비효율을 초래하게 된다. 따라서 이러한 문제를 해결하기 위해 고객 세분화 또는 고객 클러스터링을 수행하게 된다.
고객 클러스터링의 본질적인 목적은 고객을 동질적인 특성을 가진 집단으로 나누어 보다 손쉽게 고객의 니즈를 파악해 기업의 마케팅 전략을 세우는 데에 있다. 기존의 고객 클러스터링은 일반적으로 성별, 연령, 소득 등의 단순하면서도 범용적인 정보, 즉 원시적 형태의 인구통계학 정보를 활용하여 이루어져 왔다. 하지만 사회가 급격히 변화함에 따라 이러한 단순한 기준만으로는 고객을 효율적으로 분류하기가 어려워지고 있다. 따라서 기업들은 자신들이 보유하고 있는 고객의 구매 내역, 검색 내역 등의 간접적인 고객 행태 정보 및 고객의 라이프스타일까지 활용하여 데이터 마이닝, 웹 마이닝 등의 분석 기술을 이용해 고객 클러스터링을 수행하고 있다[고은주 외., 2005; 이건창 & 정남호, 2003; 진서훈, 2005].
하지만 기업이 보유하고 있는 고객의 행태 정보는 해당 고객이 자사의 사이트 내에 진입한 이후에 보이는 한정된 정보만을 활용한다는 측면에서 한계를 갖는다. 이러한 한계는 도 1을 통해 보다 자세히 설명된다.
도 1의 예를 보면 "애플" 이라는 특정 기업의 사이트에 진입한 고객들의 관심 정보가 "MacBook", "iPad", "iPhone"으로 해당 기업과 관련된 제품에 대한 관심사로 국한되어 나타나는 것을 볼 수 있다. 즉, 기업이 보유하고 있는 고객의 행태 정보는 자사의 사이트 내에서 보이는 구매 및 검색 내역 등의 제한된 정보만을 활용할 수 있기 때문에 고객의 일반적 관심사가 아닌 자사의 제품 및 서비스와 관련된 고객의 관심사로 한정된다. 따라서 해당 고객이 자사의 사이트 밖에서는 어떤 관심사를 가지고 있는지 파악하기 어렵다. 이러한 이유로 대부분의 기업에서는 아직까지도 인구통계학 정보를 기반으로 한 정형 데이터를 활용하여 고객 클러스터링을 수행하고 있다.
하지만 최근 들어 스마트 기기의 대중화가 이루어짐에 따라 고객들은 소셜미디어와 웹을 통해 다양한 정보에 직/간접적으로 노출되고 있을 뿐 아니라, 자신이 원하는 정보를 능동적으로 찾아볼 수 있게 되었으며, 자신의 의견까지도 거의 실시간으로 텍스트 형태의 비정형 데이터로 표현이 가능해졌다. 이처럼 고객이 특정 사이트 내에서 보이는 패턴이 아닌 일반적인 인터넷 사용패턴을 통해 얻을 수 있는 추가 정보가 넘쳐나고 있음에도 불구하고, 아직 이를 활용한 고객 클러스터링 연구가 많지 않은 것이 현실이다.
도 2를 보면 총 6명의 사람이 인구통계학 정보에 의해 각각 "남자" 그룹과 "여자" 그룹으로 나뉘는 것을 알 수 있다. 하지만 같은 남자 혹은 여자라고 해서 그들의 관심사가 같다고 말하기에는 무리가 따른다. "남자" 그룹의 경우, "남자"라는 동질적 특성을 가지고 하나의 그룹으로 묶였으나 개개인의 관심사는 "Galaxy", "Basketball", "Football"로 모두 다르며, "여자" 그룹 역시 "Baseball", "BlackBerry", "iPhone"으로 개개인의 관심사가 모두 다르다는 것을 알 수 있다.
한편, 도 2의 오른쪽을 보면 인구통계학 정보(왼쪽)로 그룹을 나누었을 때는 한 그룹이었던 3명의 남자가 개개인의 관심에 따라 "Smart Phone" 그룹과 "Sports" 그룹으로 나뉘어 속하게 된 것을 알 수 있다. 이처럼 특정한 하나의 기준으로만 고객을 나누기 보다는 기본적인 인구통계학 정보뿐만 아니라, 고객의 일반적인 관심사까지 고려한 고객 클러스터링이 필요하다.
공개특허공보 제10-2014-0047695호 : 소셜 네트워킹 시스템에서 사용자의 연결관계들의 클러스터링 등록특허공보 제10-0792277호 : 실시간으로 수집된 온라인 유행어 및 시사용어를 이용한 타겟팅 광고 방법 및 장치
따라서 본 발명은 상기와 같은 문제점을 해결하기 위해 안출한 것으로서, 고객의 인터넷 사용패턴을 분석하여 비정형 데이터 분석 기술인 텍스트 마이닝 기반의 고객 세분화 방법론을 통해 고객을 동질적인 특성을 가진 집단으로 나누어 보다 손쉽게 고객의 니즈를 파악해 기업의 마케팅 전략을 세울 수 있는 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명의 다른 목적은 인구통계학 정보를 활용한 고객 클러스터링과 고객의 인터넷 사용 패터링, 그리고 포털사이트 검색 키워드를 활용한 고객 클러스터링의 3가지 관점의 고객 클러스터링 방법론을 이용한 다차원 고객 클러스터링 장치 및 방법을 제공하는데 있다.
본 발명의 다른 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 토픽분석을 활용한 다차원 고객 클러스터링 장치의 특징은 인구통계학 정보를 기반으로 고객을 그룹화하는 인구통계학 정보 기반 고객 클러스터링부와, 고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 포털사이트 검색 키워드 기반 고객 클러스터링부와, 상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 검색 키워드를 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부를 포함하여 구성되는데 있다.
바람직하게 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부를 더 포함하여 구성되는데 있다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 토픽분석을 활용한 다차원 고객 클러스터링 장치의 다른 특징은 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부와, 고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 포털사이트 검색 키워드 기반 고객 클러스터링부와, 상기 고객의 뉴스 접속 기록과 검색 키워드를 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부를 포함하여 구성되는데 있다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 토픽분석을 활용한 다차원 고객 클러스터링 장치의 또 다른 특징은 인구통계학 정보를 기반으로 고객을 그룹화하는 인구통계학 정보 기반 고객 클러스터링부와, 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부와, 상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 고객의 뉴스 접속 기록을 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부를 포함하여 구성되는데 있다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 토픽분석을 활용한 다차원 고객 클러스터링 장치의 또 다른 특징은 인구통계학 정보를 기반으로 고객을 그룹화하는 인구통계학 정보 기반 고객 클러스터링부와, 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부와, 고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 포털사이트 검색 키워드 기반 고객 클러스터링부와, 상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 고객의 뉴스 접속 기록과 검색 키워드를 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부를 포함하여 구성되는데 있다.
바람직하게 상기 인구통계학 정보 기반 고객 클러스터링부는 고객의 인구통계학 정보(Demography Information)를 저장하는 인구통계학 정보 DB와, 상기 인구통계학 정보 DB에 저장된 인구통계학 정보를 기반으로 고객 클러스터링을 수행하여 고객을 그룹화하는 제 1 고객 클러스터링부를 포함하여 구성되는 것을 특징으로 한다.
바람직하게 상기 뉴스접속기록 기반 고객 클러스터링부는 고객의 웹 검색기록정보를 저장하는 검색기록정보 DB와, 상기 검색기록정보 DB에 저장된 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 뉴스기사정보를 크롤링(crawling)하여 수집 및 분류하는 크롤링부와, 상기 크롤링부에서 크롤링된 뉴스기사정보를 저장하는 뉴스기사정보 DB와, 상기 뉴스기사정보 DB에 저장된 뉴스기사정보에 대하여 토픽 분석을 통해 다수의 토픽을 추출하는 제 1 토픽정보 분석부와, 상기 뉴스기사정보 DB에 저장된 뉴스 기사와 상기 제 1 토픽정보 분석부에서 추출된 토픽간의 대응 매트릭스를 도출하는 제 1 대응 매트릭스 도출부와, 상기 검색기록정보 DB에 저장된 고객의 웹 검색기록정보를 기반으로 인터넷 뉴스 사이트의 접속 기록을 분석하는 접속기록 분석부와, 상기 분석된 인터넷 뉴스 사이트의 접속 기록을 기반으로 고객과 뉴스 기사 간 대응 매트릭스를 도출하는 제 2 대응 매트릭스 도출부와, 상기 제 1 대응 매트릭스 도출부에서 도출된 결과물인 뉴스 기사와 토픽 간 대응 매트릭스와 상기 제 2 대응 매트릭스 도출부에서 도출된 결과물인 고객과 뉴스 기사 간 대응 매트릭스를 병합하여 고객과 토픽간의 대응 매트릭스를 도출하는 제 3 대응 매트릭스 도출부와, 상기 제 3 대응 매트릭스 도출부에서 도출된 결과물인 고객과 토픽 간 대응 매트릭스를 활용하여 뉴스 접속 기록 기반의 고객 클러스터링을 수행하여 고객을 그룹화하는 제 2 고객 클러스터링부를 포함하여 구성되는 것을 특징으로 한다.
바람직하게 상기 포털 사이트 검색 키워드 기반 고객 클러스터링부는 검색기록정보 DB에 미리 저장된 검색기록정보를 기반으로 고객이 포털사이트에서 검색한 키워드를 모두 추출하는 키워드 추출부와, 상기 키워드 추출부에서 추출된 각 고객의 키워드인 검색어들을 고객별로 하나의 문서 형태로 통합하는 문서화 통합부와, 상기 문서화 통합부에서 통합하여 구성된 키워드 문서들에 대해 토픽 분석을 수행하여 다수의 토픽을 추출하는 제 2 토픽정보 분석부와, 상기 제 2 토픽정보 분석부에서 추출된 다수의 토픽을 기반으로 사용자와 토픽간의 대응 매트릭스를 도출하는 제 4 대응 매트릭스 도출부와, 상기 제 4 대응 매트릭스 도출부에서 도출된 결과물인 사용자와 토픽간의 대응 매트릭스를 활용하여 검색 키워드 기반의 고객 클러스터링을 수행하여 고객을 그룹화하는 제 3 고객 클러스터링부를 포함하여 구성되는 것을 특징으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 토픽분석을 활용한 다차원 고객 클러스터링 방법의 특징은 (A) 인구통계학 정보 DB에 미리 저장되어 있는 고객의 인구통계학 정보(Demography Information)를 검출한 후, 인구통계학 정보 기반의 고객 클러스터링을 수행하는 단계와, (B) 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스 접속 기록 기반의 고객 클러스터링을 수행하는 단계와, (C) 고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 단계와, (D) 상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 고객의 뉴스 접속 기록과 검색 키워드를 활용한 다차원 고객 클러스터링을 수행하여 다차원으로 고객을 그룹화하는 단계를 포함하여 이루어지는데 있다.
바람직하게 상기 (B) 단계는 검색기록정보 DB에 미리 저장되어 있는 고객의 검색기록정보에서 인터넷 뉴스 사이트 접속 기록을 추출하는 단계와, 상기 추출된 인터넷 뉴스 사이트 접속 기록을 크롤링(crawling)하여 해당 뉴스 기사를 수집하고 뉴스 기사 정보 DB에 저장하는 단계와, 상기 뉴스 기사 정보 DB에 저장된 뉴스 기사들을 분석하여 기사정보를 기반으로 토픽 분석을 수행하고, 뉴스 기사에 포함되어 있는 다수의 토픽들을 추출하는 단계와, 상기 추출된 다수의 토픽들을 기반으로 뉴스 기사와 상기 추출된 토픽간의 대응 매트릭스를 도출하는 단계와, 상기 검색기록정보 DB에 저장되어 있는 고객의 검색기록정보에서 인터넷 뉴스 사이트 접속 기록을 추출하는 단계와, 상기 추출된 인터넷 뉴스 사이트 접속 기록을 분석하여 고객의 인터넷 뉴스 기사 접속 기록을 기반으로 고객과 뉴스 기사 간 대응 매트릭스를 도출하는 단계와, 상기 도출된 뉴스 기사와 토픽간의 대응 매트릭스 및 고객과 뉴스 기사 간 대응 매트릭스를 병합하여 고객과 토픽 간 대응 매트릭스를 도출하는 단계와, 상기 병합된 고객과 토픽 간 대응 매트릭스를 이용하여 뉴스 접속 기록 기반의 고객 클러스터링을 수행하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
바람직하게 상기 (C) 단계는 검색기록정보 DB에 미리 저장되어 있는 고객의 검색기록정보를 추출하는 단계와, 상기 추출된 각 고객의 인터넷 포털사이트 검색 기록을 바탕으로 해당 고객이 입력한 검색 키워드를 추출하는 단계와, 상기 추출된 검색 키워드들을 고객별로 나누어 하나의 문서 형태로 통합하는 단계와, 상기 형성된 키워드 문서들을 대상으로 토픽 분석을 수행하여 키워드에 포함되어 있는 토픽들을 추출하는 단계와, 상기 추출된 다수의 토픽들을 기반으로 고객과 토픽 간의 대응 매트릭스를 도출하는 단계와, 상기 키워드 문서의 가상 토픽을 바탕으로 도출된 대응 매트릭스를 이용하여 검색 키워드 기반의 고객 클러스터링을 수행하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
이상에서 설명한 바와 같은 본 발명에 따른 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법은 고객들의 뉴스 접속 기록 및 검색 키워드 기반의 고객 클러스터링 과정을 통해 기존에는 파악할 수 없었던 고객들의 일반적인 관심사를 파악하여 새로운 관점의 고객군을 형성하여 효과적인 마케팅 전략 수립에 기여할 수 있어, 학술적, 실무적 기여가 매우 클 것으로 기대된다.
따라서 고객의 구매여부를 중요하게 생각하는 제품과 서비스 공급자 측면에서 볼 때, 인구통계학 정보와 함께 활용하여 더욱더 효과적인 마케팅 전략 수립에 기여할 수 있을 것으로 기대된다.
도 1 은 종래의 고객 클러스터링에 의한 기업 내 정보 분석의 한계를 나타낸 실시예
도 2 은 종래의 인구통계학 정보 기반의 고객 클러스터링 및 유사 관심 기반의 고객 클러스터링으로 분류된 실시예
도 3 은 본 발명의 실시예에 따른 토픽분석을 활용한 다차원 고객 클러스터링 장치의 구성을 나타낸 블록도
도 4 는 본 발명의 실시예에 따른 토픽분석을 활용한 다차원 고객 클러스터링 방법을 설명하기 위한 흐름도
도 5 는 도 4의 매트릭스 병합 과정을 나타낸 실시예
도 6 은 도 5의 매트릭스 병합과정을 네트워크 형태로 표현한 실시예
도 7 은 도 4의 포털사이트 검색 키워드 기반의 고객 클러스터링으로 분류된 실시예
본 발명의 다른 목적, 특성 및 이점들은 첨부한 도면을 참조한 실시예들의 상세한 설명을 통해 명백해질 것이다.
본 발명에 따른 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법의 바람직한 실시예에 대하여 첨부한 도면을 참조하여 설명하면 다음과 같다. 그러나 본 발명은 이하에서 개시되는 실시예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예는 본 발명의 개시가 완전하도록하며 통상의 지식을 가진자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
도 3 은 본 발명의 실시예에 따른 토픽분석을 활용한 다차원 고객 클러스터링 장치의 구성을 나타낸 블록도이다.
도 3에서 도시하고 있는 것과 같이, 본 발명은 인구통계학 정보를 기반으로 고객을 그룹화하는 인구통계학 정보 기반 고객 클러스터링부(100)와, 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부(200)와, 고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 포털사이트 검색 키워드 기반 고객 클러스터링부(300)와, 상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 고객의 뉴스 접속 기록과 검색 키워드를 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부(400)로 구성된다.
이때, 상기 인구통계학 정보 기반 고객 클러스터링부(100)는 기존에 많이 활용되고 있는 고객의 인구통계학 정보(Demography Information)를 저장하는 인구통계학 정보 DB(101)와, 상기 인구통계학 정보 DB(101)에 저장된 인구통계학 정보를 기반으로 고객 클러스터링을 수행하여 고객을 그룹화하는 제 1 고객 클러스터링부(102)로 구성된다.
그리고 상기 뉴스접속기록 기반 고객 클러스터링부(200)는 고객의 웹 검색기록정보를 저장하는 검색기록정보 DB(201)와, 상기 검색기록정보 DB(201)에 저장된 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 뉴스기사정보를 크롤링(crawling)하여 수집 및 분류하는 크롤링부(202)와, 상기 크롤링부(202)에서 크롤링된 뉴스기사정보를 저장하는 뉴스기사정보 DB(203)와, 상기 뉴스기사정보 DB(203)에 저장된 뉴스기사정보에 대하여 토픽 분석을 통해 다수의 토픽을 추출하는 제 1 토픽정보 분석부(204)와, 상기 뉴스기사정보 DB(203)에 저장된 뉴스 기사와 상기 제 1 토픽정보 분석부(204)에서 추출된 토픽간의 대응 매트릭스를 도출하는 제 1 대응 매트릭스 도출부(205)와, 상기 검색기록정보 DB(201)에 저장된 고객의 웹 검색기록정보를 기반으로 인터넷 뉴스 사이트의 접속 기록을 분석하는 접속기록 분석부(206)와, 상기 분석된 인터넷 뉴스 사이트의 접속 기록을 기반으로 고객과 뉴스 기사 간 대응 매트릭스를 도출하는 제 2 대응 매트릭스 도출부(207)와, 상기 제 1 대응 매트릭스 도출부(205)에서 도출된 결과물인 뉴스 기사와 토픽 간 대응 매트릭스와 상기 제 2 대응 매트릭스 도출부(207)에서 도출된 결과물인 고객과 뉴스 기사 간 대응 매트릭스를 병합하여 고객과 토픽간의 대응 매트릭스를 도출하는 제 3 대응 매트릭스 도출부(209)와, 상기 제 3 대응 매트릭스 도출부(209)에서 도출된 결과물인 고객과 토픽 간 대응 매트릭스를 활용하여 뉴스 접속 기록 기반의 고객 클러스터링을 수행하여 고객을 그룹화하는 제 2 고객 클러스터링부(210)로 구성된다.
또한 상기 포털 사이트 검색 키워드 기반 고객 클러스터링부(300)는 상기 검색기록정보 DB(201)에 저장된 검색기록정보를 기반으로 고객이 포털사이트에서 검색한 키워드를 모두 추출하는 키워드 추출부(301)와, 상기 키워드 추출부(301)에서 추출된 각 고객의 키워드인 검색어들을 고객별로 하나의 문서 형태로 통합하는 문서화 통합부(302)와, 상기 문서화 통합부(302)에서 통합하여 구성된 키워드 문서들에 대해 토픽 분석을 수행하여 다수의 토픽을 추출하는 제 2 토픽정보 분석부(303)와, 상기 제 2 토픽정보 분석부에서 추출된 다수의 토픽을 기반으로 사용자와 토픽간의 대응 매트릭스를 도출하는 제 4 대응 매트릭스 도출부(304)와, 상기 제 4 대응 매트릭스 도출부(304)에서 도출된 결과물인 사용자와 토픽간의 대응 매트릭스를 활용하여 검색 키워드 기반의 고객 클러스터링을 수행하여 고객을 그룹화하는 제 3 고객 클러스터링부(305)로 구성된다.
그리고 상기 다차원 고객 클러스터링부(400)는 상기 제 1 고객 클러스터링부(102)에서 그룹화된 고객과, 제 2 고객 클러스터링부(210)에서 그룹화된 고객 및 제 3 고객 클러스터링부(305)에서 그룹화된 고객을 모두 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화한다.
이와 같이 구성된 본 발명에 따른 토픽분석을 활용한 다차원 고객 클러스터링 장치의 동작을 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다. 도 1 또는 도 2와 동일한 참조부호는 동일한 기능을 수행하는 동일한 부재를 지칭한다.
도 4 는 본 발명의 실시예에 따른 토픽분석을 활용한 다차원 고객 클러스터링 방법을 설명하기 위한 흐름도이다.
도 4를 참조하여 설명하면 먼저, 인구통계학 정보 DB(101)에 저장되어 있는 고객의 인구통계학 정보(Demography Information)를 검출한 후(S10), 인구통계학 정보 기반의 고객 클러스터링을 수행한다(S20).
이때, 인구통계학 정보 기반의 고객 클러스터링은 기존에 가장 많이 활용되고 있는 고객의 인구통계학 정보를 기반으로 고객을 그룹화하는 가장 전통적인 고객 클러스터링 방법으로, 일 실시예를 통해 설명하면 다음과 같다.
일반적으로 인구통계학 정보는 나이, 성별, 연령, 직업, 소득, 학력 등에 대한 것을 의미하며, 다음 표 1은 특정 고객에 대한 인구 통계할 정보를 기반으로 고객 클러스터링을 수행한 가상의 결과를 보여주고 있다.
Figure 112015017786627-pat00001
상기 표 1을 보면 "U1", "U2", "U3" 3명의 고객이 성별은 다르나 각각 "22"세, "25"세, "27"세의 비슷한 연령대와 "학생"이라는 같은 직업을 가짐으로써 하나의 고객 그룹으로 묶인 것을 알 수 있다. 이와 마찬가지로 "U4", "U5", "U6" 3명의 고객 역시 성별은 다르지만 비슷한 연령대와 같은 직업을 가짐으로써 하나의 고객 그룹으로 묶인 것을 알 수 있다. 즉, 인구통계학 정보 기반의 고객 클러스터링은 고객의 성별, 나이, 직업 등의 비슷한 정도에 따라 고객 그룹이 형성된다.
다음으로, 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스 접속 기록 기반의 고객 클러스터링을 수행한다(S30~S100).
이를 위해, 먼저 검색기록정보 DB(201)에 저장되어 있는 고객의 검색기록정보에서 인터넷 뉴스 사이트 접속 기록을 추출하여(S10) 크롤링(crawling)을 통해 해당 뉴스 기사를 수집하여 뉴스 기사 정보 DB(203)에 저장하고(S30), 이렇게 저장된 뉴스 기사들을 분석한다(S40).
그리고 상기 뉴스 기사 분석을 통해 분석된 기사정보를 기반으로 토픽 분석을 수행하여 뉴스 기사에 포함되어 있는 다수의 토픽들을 추출한다(S50). 다음 표 2는 토픽 분석으로 추출된 가상의 토픽을 보여주고 있다.
Figure 112015017786627-pat00002
이어 추출된 다수의 토픽들을 기반으로 뉴스 기사와 상기 추출된 토픽간의 대응 매트릭스를 도출한다. 도 5(b)는 상기 표 2에서 나타내고 있는 뉴스 기사들과 토픽 조건들을 바탕으로 도출된 대응 매트릭스를 나타낸 도면이다.
또한, 검색기록정보 DB(201)에 저장되어 있는 고객의 검색기록정보에서 인터넷 뉴스 사이트 접속 기록을 추출하고(S10), 상기 추출된 뉴스 기사를 바탕으로 고객의 인터넷 뉴스 기사 접속 기록을 분석한다(S70).
그리고 상기 분석된 고객의 인터넷 뉴스 기사 접속 기록을 기반으로 고객과 뉴스 기사 간 대응 매트릭스를 도출한다(S80). 도 5(a)는 상기 표 2에서 나타내고 있는 수집된 뉴스 기사를 바탕으로 고객의 인터넷 뉴스 기사 접속 기록을 분석하여 고객과 뉴스 기사 간 도출된 대응 매트릭스를 나타낸 도면이다.
이어, 상기 S60 단계에서 도출된 뉴스 기사와 상기 추출된 토픽간의 대응 매트릭스(도 5(b))와 상기 S80 단계에서 도출된 고객과 뉴스 기사 간 대응 매트릭스(도 5(a))를 병합하여 고객과 토픽 간 대응 매트릭스를 도출한다. 도 5(c)는 표 2에서 나타내고 있는 예를 활용한 매트릭스 병합 과정을 나타낸 실시예이다(S90).
즉 도 5(c)는 각각의 고객이 각 토픽에 해당하는 기사 중 몇 건을 접속했는지 나타내고 있다. 이렇게 병합된 고객과 토픽 간 대응 매트릭스를 이용하여 뉴스 접속 기록 기반의 고객 클러스터링을 수행하게 된다(S100).
도 6(a)는 도 6의 매트릭스 병합 과정을 네트워크 형태로 표현한 도면으로, 이 결과를 활용하여 클러스터링한 결과는 도 6(b)에 나타내고 있다.
도 6(b)를 보면 표 1에서 인구통계학 정보 기반의 고객 클러스터링 수행 결과로 각각 두 개의 그룹으로 나뉘어 속해있던 "U2", "U3", "U4" 3명의 고객이 "건강"이라는 공통된 뉴스 관심사를 가짐으로써 새로운 고객 그룹이 형성된 것을 알 수 있다. 즉, 인구통계학 정보만으로는 알 수 없었던 고객의 뉴스 관심사를 파악함으로써 공통 뉴스 관심사를 갖는 새로운 고객군을 형성하게 된다.
다음으로 고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행한다(S110~S150).
이를 위해, 먼저 검색기록정보 DB(201)에 저장되어 있는 고객의 검색기록정보를 추출한 후(S10), 상기 추출된 각 고객의 인터넷 포털사이트 검색 기록을 바탕으로 해당 고객이 입력한 검색 키워드를 모두 추출한다(S110).
그리고 상기 추출된 검색 키워드들을 고객별로 나누어 하나의 문서 형태로 통합한다(S120). 즉, 고객별로 하나의 키워드 문서를 형성하게 되며, 해당 문서는 특정 고객이 포털사이트에서 검색한 모든 키워드들의 묶음을 의미한다. 다음 표 3은 고객별 키워드 문서의 실시예를 보여주고 있다.
Figure 112015017786627-pat00003
위의 과정을 통해 형성된 키워드 문서들을 대상으로 토픽 분석을 수행하여 키워드에 포함되어 있는 다수의 토픽들을 추출한다(S130). 다음 표 4는 토픽 분석으로 추출된 가상의 토픽을 보여주고 있다.
Figure 112015017786627-pat00004
그리고 상기 추출된 다수의 토픽들을 기반으로 고객과 토픽 간의 대응 매트릭스를 도출한다(S140). 도 7 은 상기 표 4에서 나타내고 있는 키워드 문서의 가상 토픽을 바탕으로 도출된 대응 매트릭스를 나타낸 도면이다.
이렇게 키워드 문서의 가상 토픽을 바탕으로 도출된 대응 매트릭스를 이용하여 검색 키워드 기반의 고객 클러스터링을 수행하게 된다(S150).
도 7을 보면 표 1에서 인구통계학 정보 기반의 고객 클러스터링 결과로 각각 두 개의 그룹으로 나뉘어 속해있던 "U3", "U4", "U5" 3명의 고객이 "캠핑"이라는 공통된 직접적 관심사를 가짐으로써 새로운 고객 그룹이 형성된 것을 알 수 있다. 또한 도 6(b)에서 "건강"이라는 공통된 뉴스 토픽 관심사를 가지고 하나의 그룹에 속해있던 "U2", "U3", "U4" 3명의 고객 중에서 "U3", "U4" 2명의 고객이 "캠핑"이라는 직접적 관심사를 공유함으로써 새로운 고객 그룹을 형성함을 알 수 있다. 즉, 인구통계학 정보만으로는 알 수 없었던 고객의 직접적 관심사를 파악함으로써 공통 관심사를 갖는 새로운 고객군을 형성하게 된다.
이어 상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 고객의 뉴스 접속 기록과 검색 키워드를 활용한 다차원 고객 클러스터링을 수행하여 다차원으로 고객을 그룹화한다(S160).
이에 따라, 기존의 인구통계학 정보를 활용한 고객 세분화 결과와 달리, 인구통계학적 특징에는 큰 차이가 없으나 고객의 일반적 관심사에 따라 전혀 다른 새로운 고객군이 형성되게 된다. 그리고 이처럼 특정 기준에 따라 고객을 여러 그룹으로 세분화하여 고객을 그룹화함으로써 각 그룹에 맞는 마케팅 전략을 수립할 수 있다.
상기에서 설명한 본 발명의 기술적 사상은 바람직한 실시예에서 구체적으로 기술되었으나, 상기한 실시예는 그 설명을 위한 것이며 그 제한을 위한 것이 아님을 주의하여야 한다. 또한, 본 발명의 기술적 분야의 통상의 지식을 가진자라면 본 발명의 기술적 사상의 범위 내에서 다양한 실시예가 가능함을 이해할 수 있을 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (10)

  1. 인구통계학 정보를 기반으로 고객을 그룹화하는 인구통계학 정보 기반 고객 클러스터링부와,
    고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 포털사이트 검색 키워드 기반 고객 클러스터링부와,
    상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 검색 키워드를 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부와,
    고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부를 포함하여 구성되는 것을 특징으로 하고,
    이때, 상기 뉴스접속기록 기반 고객 클러스터링부는
    고객의 웹 검색기록정보를 저장하는 검색기록정보 DB와,
    상기 검색기록정보 DB에 저장된 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 뉴스기사정보를 크롤링(crawling)하여 수집 및 분류하는 크롤링부와,
    상기 크롤링부에서 크롤링된 뉴스기사정보를 저장하는 뉴스기사정보 DB와,
    상기 뉴스기사정보 DB에 저장된 뉴스기사정보에 대하여 토픽 분석을 통해 다수의 토픽을 추출하는 제 1 토픽정보 분석부와,
    상기 뉴스기사정보 DB에 저장된 뉴스 기사와 상기 제 1 토픽정보 분석부에서 추출된 토픽간의 대응 매트릭스를 도출하는 제 1 대응 매트릭스 도출부와,
    상기 검색기록정보 DB에 저장된 고객의 웹 검색기록정보를 기반으로 인터넷 뉴스 사이트의 접속 기록을 분석하는 접속기록 분석부와,
    상기 분석된 인터넷 뉴스 사이트의 접속 기록을 기반으로 고객과 뉴스 기사 간 대응 매트릭스를 도출하는 제 2 대응 매트릭스 도출부와,
    상기 제 1 대응 매트릭스 도출부에서 도출된 결과물인 뉴스 기사와 토픽 간 대응 매트릭스와 상기 제 2 대응 매트릭스 도출부에서 도출된 결과물인 고객과 뉴스 기사 간 대응 매트릭스를 병합하여 고객과 토픽간의 대응 매트릭스를 도출하는 제 3 대응 매트릭스 도출부와,
    상기 제 3 대응 매트릭스 도출부에서 도출된 결과물인 고객과 토픽 간 대응 매트릭스를 활용하여 뉴스 접속 기록 기반의 고객 클러스터링을 수행하여 고객을 그룹화하는 제 2 고객 클러스터링부를 포함하여 구성되는 것을 특징으로 하는 토픽분석을 활용한 다차원 고객 클러스터링 장치.
  2. 제 1 항에 있어서, 상기 다차원 고객 클러스터링 장치는
    인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 고객의 뉴스 접속 기록과 검색 키워드를 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 것을 특징으로 하는 토픽분석을 활용한 다차원 고객 클러스터링 장치.
  3. 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부와,
    고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 포털사이트 검색 키워드 기반 고객 클러스터링부와,
    상기 고객의 뉴스 접속 기록과 검색 키워드를 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부를 포함하여 구성되고,
    이때, 상기 뉴스접속기록 기반 고객 클러스터링부는
    고객의 웹 검색기록정보를 저장하는 검색기록정보 DB와,
    상기 검색기록정보 DB에 저장된 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 뉴스기사정보를 크롤링(crawling)하여 수집 및 분류하는 크롤링부와,
    상기 크롤링부에서 크롤링된 뉴스기사정보를 저장하는 뉴스기사정보 DB와,
    상기 뉴스기사정보 DB에 저장된 뉴스기사정보에 대하여 토픽 분석을 통해 다수의 토픽을 추출하는 제 1 토픽정보 분석부와,
    상기 뉴스기사정보 DB에 저장된 뉴스 기사와 상기 제 1 토픽정보 분석부에서 추출된 토픽간의 대응 매트릭스를 도출하는 제 1 대응 매트릭스 도출부와,
    상기 검색기록정보 DB에 저장된 고객의 웹 검색기록정보를 기반으로 인터넷 뉴스 사이트의 접속 기록을 분석하는 접속기록 분석부와,
    상기 분석된 인터넷 뉴스 사이트의 접속 기록을 기반으로 고객과 뉴스 기사 간 대응 매트릭스를 도출하는 제 2 대응 매트릭스 도출부와,
    상기 제 1 대응 매트릭스 도출부에서 도출된 결과물인 뉴스 기사와 토픽 간 대응 매트릭스와 상기 제 2 대응 매트릭스 도출부에서 도출된 결과물인 고객과 뉴스 기사 간 대응 매트릭스를 병합하여 고객과 토픽간의 대응 매트릭스를 도출하는 제 3 대응 매트릭스 도출부와,
    상기 제 3 대응 매트릭스 도출부에서 도출된 결과물인 고객과 토픽 간 대응 매트릭스를 활용하여 뉴스 접속 기록 기반의 고객 클러스터링을 수행하여 고객을 그룹화하는 제 2 고객 클러스터링부를 포함하여 구성되는 것을 특징으로 하는 토픽분석을 활용한 다차원 고객 클러스터링 장치.
  4. 인구통계학 정보를 기반으로 고객을 그룹화하는 인구통계학 정보 기반 고객 클러스터링부와,
    고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부와,
    상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 고객의 뉴스 접속 기록을 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부를 포함하여 구성되고,
    이때, 상기 뉴스접속기록 기반 고객 클러스터링부는
    고객의 웹 검색기록정보를 저장하는 검색기록정보 DB와,
    상기 검색기록정보 DB에 저장된 검색기록정보의 웹 트랜잭션에 기록된 URL을 이용하여 뉴스기사정보를 크롤링(crawling)하여 수집 및 분류하는 크롤링부와,
    상기 크롤링부에서 크롤링된 뉴스기사정보를 저장하는 뉴스기사정보 DB와,
    상기 뉴스기사정보 DB에 저장된 뉴스기사정보에 대하여 토픽 분석을 통해 다수의 토픽을 추출하는 제 1 토픽정보 분석부와,
    상기 뉴스기사정보 DB에 저장된 뉴스 기사와 상기 제 1 토픽정보 분석부에서 추출된 토픽간의 대응 매트릭스를 도출하는 제 1 대응 매트릭스 도출부와,
    상기 검색기록정보 DB에 저장된 고객의 웹 검색기록정보를 기반으로 인터넷 뉴스 사이트의 접속 기록을 분석하는 접속기록 분석부와,
    상기 분석된 인터넷 뉴스 사이트의 접속 기록을 기반으로 고객과 뉴스 기사 간 대응 매트릭스를 도출하는 제 2 대응 매트릭스 도출부와,
    상기 제 1 대응 매트릭스 도출부에서 도출된 결과물인 뉴스 기사와 토픽 간 대응 매트릭스와 상기 제 2 대응 매트릭스 도출부에서 도출된 결과물인 고객과 뉴스 기사 간 대응 매트릭스를 병합하여 고객과 토픽간의 대응 매트릭스를 도출하는 제 3 대응 매트릭스 도출부와,
    상기 제 3 대응 매트릭스 도출부에서 도출된 결과물인 고객과 토픽 간 대응 매트릭스를 활용하여 뉴스 접속 기록 기반의 고객 클러스터링을 수행하여 고객을 그룹화하는 제 2 고객 클러스터링부를 포함하여 구성되는 것을 특징으로 하는 토픽분석을 활용한 다차원 고객 클러스터링 장치.
  5. 제 1 항 또는 제 4 항에 있어서, 상기 인구통계학 정보 기반 고객 클러스터링부는
    고객의 인구통계학 정보(Demography Information)를 저장하는 인구통계학 정보 DB와,
    상기 인구통계학 정보 DB에 저장된 인구통계학 정보를 기반으로 고객 클러스터링을 수행하여 고객을 그룹화하는 제 1 고객 클러스터링부를 포함하여 구성되는 것을 특징으로 하는 토픽분석을 활용한 다차원 고객 클러스터링 장치.
  6. 삭제
  7. 제 1 항 또는 제 3 항에 있어서, 상기 포털 사이트 검색 키워드 기반 고객 클러스터링부는
    검색기록정보 DB에 미리 저장된 검색기록정보를 기반으로 고객이 포털사이트에서 검색한 키워드를 모두 추출하는 키워드 추출부와,
    상기 키워드 추출부에서 추출된 각 고객의 키워드인 검색어들을 고객별로 하나의 문서 형태로 통합하는 문서화 통합부와,
    상기 문서화 통합부에서 통합하여 구성된 키워드 문서들에 대해 토픽 분석을 수행하여 다수의 토픽을 추출하는 제 2 토픽정보 분석부와,
    상기 제 2 토픽정보 분석부에서 추출된 다수의 토픽을 기반으로 사용자와 토픽간의 대응 매트릭스를 도출하는 제 4 대응 매트릭스 도출부와,
    상기 제 4 대응 매트릭스 도출부에서 도출된 결과물인 사용자와 토픽간의 대응 매트릭스를 활용하여 검색 키워드 기반의 고객 클러스터링을 수행하여 고객을 그룹화하는 제 3 고객 클러스터링부를 포함하여 구성되는 것을 특징으로 하는 토픽분석을 활용한 다차원 고객 클러스터링 장치.
  8. 인구통계학 정보를 기반으로 고객을 그룹화하는 인구통계학 정보 기반 고객 클러스터링부와, 고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 포털사이트 검색 키워드 기반 고객 클러스터링부와, 상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 검색 키워드를 활용한 다차원 고객 클러스터링을 통해 고객을 그룹화하는 다차원 고객 클러스터링부와, 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스접속기록 기반 고객 클러스터링부를 포함하여 구성되는 토픽분석을 활용한 다차원 고객 클러스터링 장치를 이용하는 토픽분석을 활용한 다차원 고객 클러스터링 방법에 있어서,
    (A) 상기 인구통계학 정보 기반 고객 클러스터링부를 통해 인구통계학 정보 DB에 미리 저장되어 있는 고객의 인구통계학 정보(Demography Information)를 검출한 후, 인구통계학 정보 기반의 고객 클러스터링을 수행하는 단계와,
    (B) 상기 뉴스접속기록 기반 고객 클러스터링부를 통해 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화하는 뉴스 접속 기록 기반의 고객 클러스터링을 수행하는 단계와,
    (C) 상기 포털사이트 검색 키워드 기반 고객 클러스터링부를 통해 고객이 직접 입력한 검색 키워드를 문서화하여 각 고객의 직접적인 관심 토픽을 기반으로 고객 클러스터링을 수행하는 단계와,
    (D) 상기 다차원 고객 클러스터링부를 통해 상기 인구통계학 정보를 활용한 고객 클러스터링 방법과 함께 고객의 뉴스 접속 기록과 검색 키워드를 활용한 다차원 고객 클러스터링을 수행하여 다차원으로 고객을 그룹화하는 단계를 포함하여 이루어지고,
    이때, 상기 (B) 단계는
    검색기록정보 DB에 미리 저장되어 있는 고객의 검색기록정보에서 인터넷 뉴스 사이트 접속 기록을 추출하는 단계와,
    상기 추출된 인터넷 뉴스 사이트 접속 기록을 크롤링(crawling)하여 해당 뉴스 기사를 수집하고 뉴스 기사 정보 DB에 저장하는 단계와,
    상기 뉴스 기사 정보 DB에 저장된 뉴스 기사들을 분석하여 기사정보를 기반으로 토픽 분석을 수행하고, 뉴스 기사에 포함되어 있는 다수의 토픽들을 추출하는 단계와,
    상기 추출된 다수의 토픽들을 기반으로 뉴스 기사와 상기 추출된 토픽간의 대응 매트릭스를 도출하는 단계와,
    상기 검색기록정보 DB에 저장되어 있는 고객의 검색기록정보에서 인터넷 뉴스 사이트 접속 기록을 추출하는 단계와,
    상기 추출된 인터넷 뉴스 사이트 접속 기록을 분석하여 고객의 인터넷 뉴스 기사 접속 기록을 기반으로 고객과 뉴스 기사 간 대응 매트릭스를 도출하는 단계와,
    상기 도출된 뉴스 기사와 토픽간의 대응 매트릭스 및 고객과 뉴스 기사 간 대응 매트릭스를 병합하여 고객과 토픽 간 대응 매트릭스를 도출하는 단계와,
    상기 병합된 고객과 토픽 간 대응 매트릭스를 이용하여 뉴스 접속 기록 기반의 고객 클러스터링을 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 토픽분석을 활용한 다차원 고객 클러스터링 방법.
  9. 삭제
  10. 제 8 항에 있어서, 상기 (C) 단계는
    검색기록정보 DB에 미리 저장되어 있는 고객의 검색기록정보를 추출하는 단계와,
    상기 추출된 각 고객의 인터넷 포털사이트 검색 기록을 바탕으로 해당 고객이 입력한 검색 키워드를 추출하는 단계와,
    상기 추출된 검색 키워드들을 고객별로 나누어 하나의 문서 형태로 통합하는 단계와,
    상기 형성된 키워드 문서들을 대상으로 토픽 분석을 수행하여 키워드에 포함되어 있는 토픽들을 추출하는 단계와,
    상기 추출된 다수의 토픽들을 기반으로 고객과 토픽 간의 대응 매트릭스를 도출하는 단계와,
    상기 키워드 문서의 가상 토픽을 바탕으로 도출된 대응 매트릭스를 이용하여 검색 키워드 기반의 고객 클러스터링을 수행하는 단계를 포함하여 이루어지는 것을 특징으로 하는 토픽분석을 활용한 다차원 고객 클러스터링 방법.
KR1020150025388A 2015-02-23 2015-02-23 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법 KR101664358B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150025388A KR101664358B1 (ko) 2015-02-23 2015-02-23 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150025388A KR101664358B1 (ko) 2015-02-23 2015-02-23 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20160102822A KR20160102822A (ko) 2016-08-31
KR101664358B1 true KR101664358B1 (ko) 2016-10-10

Family

ID=56877364

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150025388A KR101664358B1 (ko) 2015-02-23 2015-02-23 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101664358B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111523027B (zh) * 2020-04-16 2023-08-01 武汉有牛科技有限公司 基于区块链技术的数据新闻自动撰写机器人
KR102534705B1 (ko) * 2022-12-27 2023-06-13 주식회사 에이치엠씨네트웍스 간병인 매칭 특성을 고려한 간병인 접속 패턴 분류 방법 및 그 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101021763B1 (ko) 2008-01-11 2011-03-15 주식회사 케이티 Ims 기반의 유무선 복합망에서의 지능형 개인화 정보 생성 장치, 시스템 및 방법
US20130124298A1 (en) 2011-11-15 2013-05-16 Huajing Li Generating clusters of similar users for advertisement targeting

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020074271A (ko) * 2001-03-19 2002-09-30 온디지털테크(주) 고객 분석 및 관리 시스템 및 방법
KR100792277B1 (ko) 2006-03-09 2008-01-07 주식회사 나스미디어 실시간으로 수집된 온라인 유행어 및 시사용어를 이용한타겟팅 광고 방법 및 장치
US9846916B2 (en) 2011-07-10 2017-12-19 Facebook, Inc. Clustering a user's connections in a social networking system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101021763B1 (ko) 2008-01-11 2011-03-15 주식회사 케이티 Ims 기반의 유무선 복합망에서의 지능형 개인화 정보 생성 장치, 시스템 및 방법
US20130124298A1 (en) 2011-11-15 2013-05-16 Huajing Li Generating clusters of similar users for advertisement targeting

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
[논문]한국지능정보시스템학회 학술논문/2014.06/다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링*

Also Published As

Publication number Publication date
KR20160102822A (ko) 2016-08-31

Similar Documents

Publication Publication Date Title
CN107577688B (zh) 基于媒体信息采集的原创文章影响力分析系统
CN103823844B (zh) 社区问答服务中基于主客观上下文的问题转发系统和方法
Yong Ahn et al. On the design concepts for CRM system
Cheng et al. Personalized click prediction in sponsored search
CN102124462B (zh) 查询识别和关联
CN111191122A (zh) 一种基于用户画像的学习资源推荐系统
CN104077407B (zh) 一种智能数据搜索系统及方法
Suresh An unsupervised fuzzy clustering method for twitter sentiment analysis
US20090089244A1 (en) Method of detecting spam hosts based on clustering the host graph
CN103020159A (zh) 一种面向事件的新闻展现方法和装置
KR20150018880A (ko) 정보 취합 분류의 디스플레이 방법 및 시스템
KR102328881B1 (ko) 빅데이터 기반의 화장품업체 협업시스템
CN107341199A (zh) 一种基于文献信息共性模式的推荐方法
CN106776609A (zh) 网站转载数量的统计方法及装置
Tiwari et al. A web usage mining framework for business intelligence
CN113901308A (zh) 基于知识图谱的企业推荐方法及推荐装置、电子设备
KR100876214B1 (ko) 문맥기반 광고 장치와 그 방법 및 이를 구현할 수 있는컴퓨터로 읽을 수 있는 기록 매체
KR101664358B1 (ko) 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법
US9165053B2 (en) Multi-source contextual information item grouping for document analysis
CN116739836B (zh) 一种基于知识图谱的餐饮数据分析方法及系统
KR101013942B1 (ko) 추천 항목 제공 장치 및 방법
Szymkowiak et al. Applying market basket analysis to official statistical data
CN110717089A (zh) 一种基于网络日志的用户行为分析系统及方法
CN112445985A (zh) 一种基于浏览行为优化的相似人群获取方法
CN108921431A (zh) 政企客户聚类方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190923

Year of fee payment: 4