KR101784559B1 - 사용자의 소비 패턴/관심사 분석 방법 및 장치 - Google Patents

사용자의 소비 패턴/관심사 분석 방법 및 장치 Download PDF

Info

Publication number
KR101784559B1
KR101784559B1 KR1020150125160A KR20150125160A KR101784559B1 KR 101784559 B1 KR101784559 B1 KR 101784559B1 KR 1020150125160 A KR1020150125160 A KR 1020150125160A KR 20150125160 A KR20150125160 A KR 20150125160A KR 101784559 B1 KR101784559 B1 KR 101784559B1
Authority
KR
South Korea
Prior art keywords
consumption pattern
interest
analysis
basis information
user
Prior art date
Application number
KR1020150125160A
Other languages
English (en)
Other versions
KR20170028207A (ko
Inventor
임대환
Original Assignee
임대환
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 임대환 filed Critical 임대환
Priority to KR1020150125160A priority Critical patent/KR101784559B1/ko
Publication of KR20170028207A publication Critical patent/KR20170028207A/ko
Application granted granted Critical
Publication of KR101784559B1 publication Critical patent/KR101784559B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • G06F17/30318
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • G06Q50/30
    • G06Q50/32

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

사용자의 소비 패턴/관심사 분석 방법 및 장치가 개시된다. 사용자의 소비 패턴/관심사 분석 방법은 사용자 장치로부터 소비 패턴 분석 근거 정보 및 관심사 분석 근거 정보를 수신하는 단계, 문자 인식을 기반으로 소비 패턴 분석 근거 정보 및 관심사 분석 근거 정보를 텍스트 정보로 추출하는 단계, 텍스트화된 소비 패턴 분석 근거 정보를 기반으로 소비 패턴을 분석하는 단계와 텍스트화된 관심사 분석 근거 정보를 기반으로 관심사를 추출하는 단계를 포함할 수 있다.

Description

사용자의 소비 패턴/관심사 분석 방법 및 장치{Method and apparatus for analyzing pattern of consumption/interest}
본 발명은 패턴 분석 및 장치에 관한 것으로서, 보다 상세하게는, 사용자의 소비 패턴/관심사 분석 방법 및 장치에 관한 것이다.
현재 다양한 제반 기술을 기반으로 사용자의 행동 패턴을 분석하는 방법이 제안되고 있다. 예를 들어, 사용자의 이동 위치, 빅데이터, 사용자 장치에서 사용된 데이터 등을 통해 다양한 사용자의 행동 패턴에 대한 분석이 수행되고 있다.
구체적으로 위성 항법 시스템인 GPS(global positioning system)는 본래 미국 국방부에서 폭격의 정확성을 높이기 위하여 군사용으로 개발된 시스템이지만 현재는 교량, 교차로 위치 및 정보 또는 항공기의 이용, 차량 네비게이션, 스마트 폰의 위치 정보 서비스 등 수많은 분야에서 활용되고 있다. 그 중 스마트 폰에서의 GPS 활용이 다른 분야에서보다 가장 높은 활용을 보이고 있는 추세이다. GPS 기능을 스마트 폰에 본격적으로 탑재시킴으로써 이를 활용한 다양한 서비스를 제공하고 있다.
GPS의 시장 성장뿐만 아니라 최근에 각광 받는 기술은 빅 데이터이다. 빅 데이터란 기존의 DB(database)의 데이터 수집, 저장, 관리, 분석 할 수 있는 역량을 넘어서 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 현재 빅 데이터 활용 분야로는 석유 공사의 국내 유가 예보 서비스를 통한 비즈니스 최적화와 한국 도로 공사의 고객 목소리 분석 시스템을 통한 서비스 혁신이 있다.
이뿐만 아니라 사용자 장치에 설치된 어플리케이션에 대한 분석, 사용자 장치를 통해 송수신된 데이터 분석을 기반으로 사용자에게 선호될 가능성이 높은 어플리케이션, 사용자가 관심을 가질 정보를 사용자에게 제공하는 방법 또한 연구되고 있다.
KR 10-2009-0103090
본 발명의 일 측면은 사용자의 소비 패턴/관심사 분석 방법을 제공한다.
본 발명의 다른 측면은 사용자의 소비 패턴/관심사 분석 장치를 제공한다.
본 발명의 일 측면에 따른 사용자의 소비 패턴/관심사 분석 방법은 사용자 장치로부터 소비 패턴 분석 근거 정보 및 관심사 분석 근거 정보를 수신하는 단계, 문자 인식을 기반으로 상기 소비 패턴 분석 근거 정보 및 상기 관심사 분석 근거 정보를 텍스트 정보로 추출하는 단계, 상기 텍스트화된 상기 소비 패턴 분석 근거 정보를 기반으로 소비 패턴을 분석하는 단계와 상기 텍스트화된 상기 관심사 분석 근거 정보를 기반으로 관심사를 추출하는 단계를 포함할 수 있다.
한편, 상기 소비 패턴 분석 근거 정보 및 상기 관심사 분석 근거 정보는 상기 사용자 장치에서 송신 및 수신되는 SMS(short message service), 상기 사용자 장치에 의해 접속되는 SNS(social network service), 상기 사용자 장치에 의해 촬상된 영수증 이미지를 포함할 수 있다.
또한, 상기 문자 인식을 기반으로 상기 소비 패턴 분석 근거 정보 및 상기 관심사 분석 근거 정보를 텍스트 정보로 추출하는 단계는 상기 소비 패턴 분석 근거 정보 및 상기 관심사 분석 근거 정보를 포함하는 이미지 내의 텍스트의 위치를 판단하는 단계, OCR(optical character recognition)을 기반으로 상기 텍스트를 추출하는 단계, Divided line 알고리즘을 기반으로 상기 텍스트를 정렬하는 단계, 문자 분류 알고리즘을 통해 상기 텍스트를 의미있는 의미 단위로 분류하는 단계와 상기 문자 분류 알고리즘을 통해 분류된 상기 의미 단위에 대한 상호 상관(cross-correlation)을 기반으로 상기 소비 패턴 분석 근거 정보, 상기 관심사 분석 근거 정보를 상기 텍스트 정보로서 추출하는 단계를 포함할 수 있다.
또한, 상기 텍스트화된 상기 소비 패턴 분석 근거 정보를 기반으로 소비 패턴을 분석하는 단계는 전처리 절차를 기반으로 상기 소비 패턴 분석 근거 정보에서 소비 패턴 분석을 위한 키워드를 추출을 위한 전처리를 수행하는 단계, 키워드 추출 절차를 기반으로 상기 키워드를 추출하는 단계, 필터링 절차를 기반으로 상기 키워드에 대한 필터링을 수행하여 상기 키워드를 카테고리 별로 분류하여 상기 소비 패턴 분석을 수행하는 단계와 개인화 DB(database) 구현 절차를 기반으로 상기 소비 패턴 분석의 결과를 저장하는 단계를 포함할 수 있다.
또한, 상기 텍스트화된 상기 관심사 분석 근거 정보를 기반으로 관심사를 추출하는 단계는 전처리 절차를 기반으로 상기 관심사 분석 근거 정보에서 관심사 분석을 위한 키워드를 추출을 위한 전처리를 수행하는 단계, 키워드 추출 절차를 기반으로 상기 키워드를 추출하는 단계, 필터링 절차를 기반으로 상기 키워드에 대한 필터링을 수행하여 상기 키워드를 카테고리 별로 분류하여 상기 관심사 분석을 수행하는 단계와 개인화 DB(database) 구현 절차를 기반으로 상기 관심사 분석의 결과를 저장하는 단계를 포함할 수 있다.
본 발명의 다른 측면에 따른 사용자의 소비 패턴/관심사 분석 장치는 프로세서를 포함하고, 상기 프로세서는 소비 패턴 분석 근거 정보 및 관심사 분석 근거 정보를 수신하고, 문자 인식을 기반으로 상기 소비 패턴 분석 근거 정보 및 상기 관심사 분석 근거 정보를 텍스트 정보로 추출하고, 상기 텍스트화된 상기 소비 패턴 분석 근거 정보를 기반으로 소비 패턴을 분석하고, 상기 텍스트화된 상기 관심사 분석 근거 정보를 기반으로 관심사를 추출하도록 구현될 수 있다.
한편, 상기 소비 패턴 분석 근거 정보 및 상기 관심사 분석 근거 정보는 상기 사용자 장치에서 송신 및 수신되는 SMS(short message service), 상기 사용자 장치에 의해 접속되는 SNS(social network service), 상기 사용자 장치에 의해 촬상된 영수증 이미지를 포함할 수 있다.
또한, 상기 프로세서는 상기 소비 패턴 분석 근거 정보 및 상기 관심사 분석 근거 정보를 포함하는 이미지 내의 텍스트의 위치를 판단하고, OCR(optical character recognition)을 기반으로 상기 텍스트를 추출하고, Divided line 알고리즘을 기반으로 상기 텍스트를 정렬하고, 문자 분류 알고리즘을 통해 상기 텍스트를 의미있는 의미 단위로 분류하고, 상기 문자 분류 알고리즘을 통해 분류된 상기 의미 단위에 대한 상호 상관(cross-correlation)을 기반으로 상기 소비 패턴 분석 근거 정보, 상기 관심사 분석 근거 정보를 상기 텍스트 정보로서 추출하도록 구현될 수 있다.
또한, 상기 프로세서는 전처리 절차를 기반으로 상기 소비 패턴 분석 근거 정보에서 소비 패턴 분석을 위한 키워드를 추출을 위한 전처리를 수행하고, 키워드 추출 절차를 기반으로 상기 키워드를 추출하고, 필터링 절차를 기반으로 상기 키워드에 대한 필터링을 수행하여 상기 키워드를 카테고리 별로 분류하여 상기 소비 패턴 분석을 수행하고, 개인화 DB(database) 구현 절차를 기반으로 상기 소비 패턴 분석의 결과를 저장하도록 구현될 수 있다.
또한, 상기 프로세서는 전처리 절차를 기반으로 상기 관심사 분석 근거 정보에서 관심사 분석을 위한 키워드를 추출을 위한 전처리를 수행하고, 키워드 추출 절차를 기반으로 상기 키워드를 추출하고, 필터링 절차를 기반으로 상기 키워드에 대한 필터링을 수행하여 상기 키워드를 카테고리 별로 분류하여 상기 관심사 분석을 수행하고, 개인화 DB(database) 구현 절차를 기반으로 상기 관심사 분석의 결과를 저장하도록 구현될 수 있다.
본 발명의 실시예에 따른 사용자의 소비 패턴/관심사 분석 방법 및 장치는 사용자 장치로 송신 및 수신되는 다양한 데이터를 기반으로 사용자의 소비 패턴/관심사를 분석하고 사용자의 관심사를 추출하여 사용자에게 재무 컨설팅 서비스를 제공할 수 있다. 또한, 사용자의 관심사에 따라 사용자에게 제공되는 정보의 우선 순위를 다르게 설정할 수 있다.
도 1은 본 발명의 실시예에 따른 사용자 소비 패턴/관심사 분석 장치의 동작을 나타낸 순서도이다.
도 2는 본 발명의 실시예에 따른 문자 인식 방법을 나타낸 순서도이다.
도 3은 본 발명의 실시예에 따른 소비 패턴 분석 엔진을 나타낸 개념도이다.
도 4는 본 발명의 실시예에 따른 관심사 추출 엔진을 나타낸 개념도이다.
도 5는 본 발명의 실시예에 따른 추천 시스템을 나타낸 개념도이다.
도 6은 본 발명의 실시예에 따른 재무 컨설팅 방법을 나타낸 개념도이다.
도 7은 본 발명의 실시예에 따른 재무 컨설팅 방법을 나타낸 개념도이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예와 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조 부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하, 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다.
이하, 본 발명의 실시예에서는 스마트 폰 내부의 사용자 정보와 사용자 장치(예를 들어, 스마트폰)을 통해 송신 및 수신된 데이터(예를 들어, SMS(short message service), SNS(social network service), 메신저를 통해서 추출되는 데이터)를 통해서 사용자 관심 분야를 분류하고 더불어 사용자의 소비 패턴을 분석하는 방법이 개시된다.
구체적으로 사용자가 카드 또는 현금을 통해서 결제하는 계산서, 영수증 등의 문자 인식을 통하여 문자를 취득하고 취득한 문자를 통해서 사용자의 소비 패턴 및 재무 현황을 분석하여 최적의 소비 패턴 및 재무 컨설팅 서비스를 제공하기 위한 상황 인지 기반의 지능형 큐레이터 서비스 및 그 시스템이 개시된다.
도 1은 본 발명의 실시예에 따른 사용자 소비 패턴/관심사 분석 장치의 동작을 나타낸 순서도이다.
도 1을 참조하면, 사용자 장치로부터 소비 패턴/관심사 분석을 위한 정보를 수신한다(단계 S100).
이하, 사용자의 소비 패턴 분석을 위한 정보는 소비 패턴 분석 근거 정보라는 용어로 표현될 수 있고 관심사 분석을 위한 정보는 관심사 분석 근거 정보라는 용어로 표현될 수 있다. 소비 패턴 분석 근거 정보는 소비 패턴의 분석을 위한 소비 패턴 분석 키워드를 포함할 수 있고, 관심사 분석 근거 정보는 관심사의 분석을 위한 관심사 분석 키워드를 포함할 수 있다. 소비 패턴 분석 근거 정보와 관심사 분석 근거 정보라는 일정 부분에서 서로 겹칠 수도 있다.
예를 들어, 사용자 장치를 통해 송신 또는 수신된 사용자의 결제 관련 정보를 포함하고 있는 SMS(short message service)는 소비 패턴 분석 근거 정보일 수 있다. 또한, 사용자의 관심 물건에 대한 정보를 포함하는 SNS(social network service) 기반의 정보는 관심사 분석 근거 정보일 수 있다 또한, 결제 관련 정보를 포함하고 있는 SMS가 관심사 분석 근거 정보로 활용될 수도 있다.
또한, 사용자 장치의 카메라 촬상부를 통해 촬상된 이미지가 소비 패턴 분석 근거 정보, 관심사 분석 근거 정보로서 사용될 수 있다. 예를 들어, 사용자의 소비 패턴을 분석하기 위해 카메라 촬상부는 영수증 또는 사용자의 소비 패턴의 분석을 위한 기록(예를 들어, 가계부 등) 등을 촬상할 수 있고, 촬상된 이미지는 소비 패턴 분석 근거 정보, 관심사 분석 근거 정보로서 사용될 수 있다.
SNS 나 SMS와 같은 소비 패턴 분석 근거 정보는 문자가 이미 텍스트 데이터화되어 있으므로 정보 처리를 위한 텍스트 데이터로 추출하기 위한 별도의 문자 인식이 필요 없으나, 소비 패턴 분석 근거 정보를 포함하는 촬상된 이미지에 대해서는 텍스트 데이터로의 추출을 위한 문자 인식이 필요하다.
문자 인식을 통해 소비 패턴 분석 근거 정보/관심사 분석 근거 정보를 추출한다(단계 S110).
소비 패턴 분석 근거 정보/관심사 분석 근거 정보를 포함하는 촬상 이미지에서 소비 패턴 분석 근거 정보/관심사 분석 근거 정보가 텍스트 데이터로서 추출될 수 있다. 문자 인식을 통한 소비 패턴 분석 근거 정보/관심사 분석 근거 정보의 추출을 위해 문자 패턴 위치 판단 알고리즘, OCR(optical character recognition), divided line 알고리즘, 문자 분류 알고리즘, 교차 상관(cross-correlation) 등이 사용될 수 있다. 이러한 문자 인식을 통해 소비 패턴 분석 근거 정보/관심사 분석 근거 정보의 추출에 대해서는 구체적으로 후술한다.
추출된 소비 패턴 분석 근거 정보/관심사 분석 근거 정보의 오류 여부 판단 및 오류 정정 절차를 수행한다(단계 S120).
추출된 소비 패턴 분석 근거 정보/관심사 분석 근거 정보 중 사용자의 소비 패턴 분석, 관심사 분석을 위해 불필요한 정보가 존재하는지 여부 및/또는 오기인 용어가 있는지 여부에 대한 분석이 수행될 수 있다. 추출된 소비 패턴 분석 근거 정보/관심사 분석 근거 정보에 오기/불필요한 용어가 존재하는 경우, 오기/불필요한 용어에 대한 정정 절차가 수행될 수 있다. 불필요한 용어는 제거하고, 오기인 용어는 정정할 수 있다. 오기인 용어에 대한 정정은 유사 용어를 근거로 수행될 수 있다.
추출된 소비 패턴 분석 근거 정보/관심사 분석 근거 정보를 기반으로 사용자의 소비 패턴을 분석하고 사용자의 관심사를 추출한다(단계 S130).
구체적으로 추출된 소비 패턴 분석 근거 정보에 포함된 소비 패턴 분석 키워드를 기반으로 소비 패턴 분석 엔진을 사용하여 전처리/키워드 추출, 주제별 필터링 등을 통해 사용자의 소비 패턴에 대한 분석이 수행될 수 있다.
또한 추출된 관심사 분석 근거 정보에 포함된 관심사 분석 키워드를 기반으로 관심사 추출 엔진을 사용하여 전처리/키워드 추출, 주제별 필터링 등을 통해 사용자의 관심사에 대한 추출이 수행될 수 있다.
이하, 본 발명의 실시예에서는 설명의 편의상 관심사 추출 엔진 및 소비 패턴 분석 엔진이 별도로 구현되는 것을 가정하나, 관심사 추출 엔진이 추천 엔진 문자 마이닝 처리부로서 사용자의 관심사 분석하여 상황에 맞게 추천하는 소비 패턴 분석 엔진의 일부로 구현될 수도 있다.
도 2는 본 발명의 실시예에 따른 문자 인식 방법을 나타낸 순서도이다.
도 2에서는 소비 패턴 분석 근거 정보/관심사 분석 근거 정보를 포함하는 촬상 이미지에서 소비 패턴 분석 근거 정보/관심사 분석 근거 정보를 텍스트 데이터로서 추출하는 방법이 개시된다.
도 2를 참조하면, 문자 인식 절차를 위해 우선 촬상 이미지에서 문자 패턴의 위치를 판단한다(단계 S200).
소비 패턴 분석 근거 정보/관심사 분석 근거 정보를 포함하는 촬상 이미지에서 텍스트에 대응되는 객체 이미지만을 추출하기 위해 우선적으로 촬상 이미지에 포함된 텍스트 객체의 위치에 대해 판단한다. 우선 객체와 배경을 분리하고, 객체 에 대응되는 이미지와 한글, 영어 등과 같은 텍스트에 대한 템플릿 이미지를 비교할 수 있다. 객체 중 중 템플릿 이미지와 유사도가 임계치 이상인 객체는 텍스트 객체로 결정될 수 있다. 결정된 텍스트 객체의 위치 정보를 기반으로 OCR을 사용하여 해당 텍스트 객체에 대응되는 텍스트가 추출될 수 있다.
OCR을 기반으로 텍스트를 추출한다(단계 S210).
텍스트 객체에 대해 OCR 기반의 인식 절차를 통해 텍스트가 추출될 수 있다. OCR을 통해 텍스트 객체가 어떠한 문자인지 여부가 결정될 수 있고, 텍스트 객체는 이미지 정보에서 텍스트 정보로 추출될 수 있다.
Divided line 알고리즘을 기반으로 텍스트를 정렬한다(단계 S220).
Divided line 알고리즘을 통해 추출된 텍스트가 정렬될 수 있다.
문자 분류 알고리즘을 통해 추출된 문자를 분석을 위해 의미있는 단위로 분류한다(단계 S230).
정렬된 텍스트에서 의미 있는 문자 단위(예를 들어, 명사, 동사 등)이 문자 분류 알고리즘에 의해 분류되어 추출될 수 있다.
문자 분류 알고리즘을 통해 분류된 문자 단위에 대한 상호 상관(cross-correlation)을 기반으로 소비 패턴 분석 근거 정보. 관심사 분석 근거 정보로서 사용될 가능성이 있는 문자 단위가 추출될 수 있다(단계 S240).
소비 패턴 분석 근거 정보. 관심사 분석 근거 정보로서 사용될 수 있는 단어, 용어들이 저장된 DB에 포함된 단어(또는 용어)와 문자 분류 알고리즘을 통해 분류된 문자 단위에 대한 상호 상관(cross-correlation)을 기반으로 소비 패턴 분석 근거 정보. 관심사 분석 근거 정보로서 사용될 가능성이 있는 문자 단위가 추출될 수 있다.
도 3은 본 발명의 실시예에 따른 소비 패턴 분석 엔진을 나타낸 개념도이다.
도 3을 참조하면, 소비 패턴 분석 엔진(300)은 전처리부(310), 키워드 추출부(320), 주제별 필터링부(330), 개인화 DB부(340)를 포함할 수 있다.
전처리부(310)는 소비 패턴 분석을 위한 핵심 키워드의 도출을 위한 전처리 절차를 수행하기 위해 구현될 수 있다. 예를 들어, 전처리부(310)는 stopword, stemming 과 같은 전처리 기술을 통해 소비 패턴 분석을 위한 핵심 키워드를 추출할 수 있다.
키워드 추출부(320)는 전처리 이후, 사용자의 소비 패턴의 핵심 키워드를 추출을 위해 구현될 수 있다. 키워드 추출부(320)는 taxonomy 분석, thesaurus 처리, semantic 추출을 기반으로 키워드를 추출할 수 있다.
주제별 필터링부(330)는 키워드 추출부(320)에 의해 추출된 소비 패턴 키워드를 필터링하기 위해 구현될 수 있다. 주제별 필터링부(330)는 주제별 카테고리를 고려하여 소비 패턴 키워드를 카테고리 별로 분류할 수 있다. 예를 들어, 주제별 필터링부(330)는 협업 기반 필터링을 사용하여 소비 패턴 키워드를 카테고리 별로 분류할 수 있다.
개인화 DB부(340)는 소비 패턴 분석 엔진에 의해 분류된 소비 패턴 분석 결과를 데이터베이스에 저장하기 위해 구현될 수 있다. 예를 들어, 개인화 DB부(340)는 빅데이터 저장소, MongoDB, Solr등을 사용하여 소비 패턴 분석 결과를 데이터베이스에 저장할 수 있다.
도 4는 본 발명의 실시예에 따른 관심사 추출 엔진을 나타낸 개념도이다.
도 4를 참조하면, 관심사 추출 엔진(400)은 전처리부(410), 키워드 추출부(420), 주제별 필터링부(430), 추천 엔진부(440)를 포함할 수 있다.
전처리부(410)는 관심사 추출을 위한 핵심 키워드의 도출을 위한 전처리 절차를 수행하기 위해 구현될 수 있다. 예를 들어, 전처리부(410)는 stopword, stemming 과 같은 전처리 기술을 통해 관심사 추출을 위한 핵심 키워드를 추출할 수 있다.
키워드 추출부(420)는 전처리 이후, 사용자의 관심사 추출을 위한 핵심 키워드의 추출을 위해 구현될 수 있다. 키워드 추출부(420)는 taxonomy 분석, thesaurus 처리, semantic 추출을 기반으로 키워드를 추출할 수 있다.
주제별 필터링부(430)는 키워드 추출부(420)에 의해 추출된 관심사 키워드를 필터링하기 위해 구현될 수 있다. 주제별 필터링부(430)는 주제별 카테고리를 고려하여 관심사 키워드를 카테고리 별로 분류할 수 있다. 예를 들어, 주제별 필터링부(430)는 협업 기반 필터링을 사용하여 관심사 키워드를 카테고리 별로 분류할 수 있다.
추천 엔진부(440)는 카테고리 별로 분류된 관심사 키워드에 따라 추천 알고리즘을 기반으로 관심사에 따른 추천 컨텐츠를 결정하고 사용자에게 제공하기 위해 구현될 수 있다.
도 5는 본 발명의 실시예에 따른 추천 시스템을 나타낸 개념도이다.
도 5에서는 영수증 수집을 기반으로 한 사용자의 관심사 분석 및 추천 컨텐츠 결정 방법이 예시적으로 개시된다.
도 5를 참조하면, 관심사 분석 엔진은 협업 필터링을 기반으로 사용자의 관심사를 분석하여 사용자에게 추천 컨텐츠를 제공할 수 있다.
우선, 영수증에 표시된 판매 업종 분류의 빈도를 특정 분야에 대한 개인의 선호도로 볼 수 있다. 판매 업종 d가 Ud= {U1d, U2d, … Und}와 같이 벡터로 표현되면 Uid는 i번째 사용자가 구매한 판매 업종의 수를 나타낸다. 관심사 분석 엔진은 이 행렬로부터 사용자가 구매한 판매업종과 다른 판매업종 간의 유사도를 계산하여 유사 계수 값이 기준치를 넘는 판매 업종을 대상으로 순위화된 추천 리스트를 제공할 수 있다.
본 발명의 실시예에 따르면, 판매업종과 가장 유사한 판매업종을 찾기 위해 피어슨 유사 계수와 코사인 유사계수가 사용될 수 있다. 아래의 수학식 1은 피어슨 유사 계수를 산출하기 위한 수학식이고, 아래의 수학식 2는 코사인 유사 계수를 산출하기 위한 수학식이다.
<수학식 1>
Figure 112015086010690-pat00001
<수학식 2>
Figure 112015086010690-pat00002
두 판매점 간의 유사도를 측정하기 위해 아래와 같이 피어슨 유사 계수 공식을 사용 할 경우, i, j는 사용자 u가 공통으로 구매한 영수증의 판매업종을 나타내며, Ru,i 와 Ru,j는 각각 판매업종 i, j에 대해 사용자 u의 영수증 판매업종의 선호도를 표현하는 누적 개수를 나타내고 Ri와 Rj는 두 판매업종 각각에서 평균 구매한 기록의 판매업종 수를 나타낸다. Ru는 사용자 u의 평균 구매한 영수증의 판매 업종 수를 나타낸다.
관심사 분석 엔진은 위와 같은 유사 계수를 통해 사용자의 관심 업종을 결정하고 사용자에게 제공할 수 있다.
도 6은 본 발명의 실시예에 따른 재무 컨설팅 방법을 나타낸 개념도이다.
도 6을 참조하면, 사용자의 소비 패턴을 분석하여 사용자가 주기적으로 구매하는 상품 또는 사용자가 주기적으로 제공받는 서비스의 경우, 사용자가 최적의 가격으로 상품 및 서비스를 구매 및 제공받을 수 있도록 하기 위한 정보가 소비 패턴/관심사 분석 장치에 의해 제공될 수 있다.
*예를 들어, 사용자에 의해 주기적으로 구매되는 생필품인 쌀, 물과 같은 경우, 소비 패턴/관심사 분석 장치는 사용자의 합리적인 구매를 위해 해당 물품에 대한 구매 주기 및 구매 방법 등에 대한 정보를 사용자에게 제공할 수 있다. 소비 패턴/관심사 분석 장치는 해당 물품의 구매 주기를 분석하여 해당 물품의 구매 예상일 이전에 사용자에게 가장 저렴하게 구매할 수 있는 추천 웹 사이트 또는 추천 오프라인 몰에 대한 정보를 사용자에게 제공할 수 있다. 이러한 경우, 사용자는 추천 웹 사이트 또는 추천 오프라인 몰을 통해 해당 물품을 구매할 수 있고, 이러한 경우, 사용자의 해당 물품을 구매하기 위한 금액이 절약될 수 있다.
마찬가지로 소비 패턴/관심사 분석 장치는 사용자가 주기적으로 제공받는 서비스에 대해 사용자가 합리적인 금액으로 서비스받게 하기 위한 정보를 제공할 수 있다.
소비 패턴/관심사 분석 장치는 사용자에게 이러한 상품 또는 서비스에 대한 구매 정보를 제공하기 위하여 웹 사이트, 오프라인 몰에서 제공되는 상품 또는 서비스에 대한 정보를 수집하여 데이터베이스로 관리할 수 있다. 소비 패턴/관심사 분석 장치는 등록된 웹 사이트, 오프라인 몰로부터 상품/서비스의 가격 정보를 수신하고 사용자의 구매 상품에 대한 최저가 분석을 수행하여 사용자의 구매 상품에 대한 최저가 정보를 사용자의 구매 예상 시점을 예측하여 제공할 수 있다.
도 7은 본 발명의 실시예에 따른 재무 컨설팅 방법을 나타낸 개념도이다.
도 7에서는 소비 패턴/관심사 분석 장치가 사용자에 의해 구매된 상품, 서비스에 대해 카테고리 별로 분류하여 사용자의 소비 패턴에 대한 정보를 제공하는 방법이 개시된다.
도 7을 참조하면, 소비 패턴/관심사 분석 장치는 카테고리 분류를 위한 데이터베이스를 기반으로 사용자의 소비 패턴을 분석할 수 있다. 사용자에 의해 소비된 상품/서비스와 가격은 하나의 정보로서 관리될 수 있고, 사용자에 의해 구매된 상품/서비스는 미리 설정된 카테고리에 따라 자동적으로 분류될 수 있다.
예를 들어, 생필품 카테고리, 취미 카테고리, 이동 수단 카테고리, 공과금 카테고리 등 다양한 카테고리가 사용자의 소비 패턴을 분석하기 위해 미리 설정될 수 있다. 이러한 카테고리는 하나의 예시로서 다른 카테고리로도 사용자에 의해 구매된 상품 또는 서비스가 분류될 수 있다.
데이터베이스는 각 카테고리에 대응되는 단어가 저장되어 있을 수 있고 소비 패턴 분석 엔진에 의해 추출된 키워드와 각 카테고리와의 유사도가 산출되어 가장 유사도가 높은 카테고리가 추출된 키워드의 카테고리로 결정될 수 있다.
사용자에 의해 구매된 상품 또는 서비스는 구매된 상품 또는 서비스의 가격 정보와 함께 추출되어 관리될 수 있고, 카테고리 별 지출 금액이 소비 패턴/관심사 분석 장치에 의해 산출될 수 있다.
사용자는 카테고리 별 지출 금액을 확인하고, 각 카테고리 별 목표 지출 금액을 설정할 수 있다. 예를 들어, 취미 카테고리에서 20만원이 이번 달에 사용된 경우, 다음 달의 취미 카테고리에 대하 목표 지출 금액을 10만원으로 설정할 수 있다. 특정 카테고리에 목표 지출 금액이 설정되는 경우, 소비 패턴/관심사 분석 장치는 해당 카테고리에 지출을 계속적으로 분석하여 해당 카테고리에 지출이 목표 지출 금액에 가까워 오는 경우, 사용자에게 경고를 할 수 있다.
이와 같은 사용자의 소비 패턴/관심사 분석 방법은 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.
상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거니와 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.
프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서는 실시예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (10)

  1. 사용자의 소비 패턴/관심사 분석 방법은,
    사용자 장치로부터 송신 및 수신되는 SMS(short message service), 상기 사용자 장치에 의해 접속되는 SNS(social network service), 및 상기 사용자 장치에 의해 촬상된 영수증 이미지를 통해서 소비 패턴 분석 근거 정보 및 관심사 분석 근거 정보를 프로세서에서 수신하는 단계;
    상기 프로세서에서 수신된 상기 소비 패턴 분석 근거 정보 및 상기 관심사 분석 근거 정보를 포함하는 이미지 내의 텍스트의 위치를 판단하는 단계;
    OCR(optical character recognition)을 기반으로 상기 텍스트를 추출하는 단계;
    Divided line 알고리즘을 기반으로 상기 텍스트를 정렬하는 단계;
    문자 분류 알고리즘을 통해 상기 텍스트를 의미있는 의미 단위로 분류하는 단계;
    상기 문자 분류 알고리즘을 통해 분류된 상기 의미 단위에 대한 상호 상관(cross-correlation)을 기반으로 상기 소비 패턴 분석 근거 정보, 상기 관심사 분석 근거 정보를 텍스트 정보로서 상기 프로세서에서 추출하는 단계;
    상기 프로세서에서 상기 텍스트 정보화된 상기 소비 패턴 분석 근거 정보를 기반으로 소비 패턴 분석 엔진으로 소비 패턴을 분석하는 단계; 및
    상기 프로세서에서 상기 텍스트 정보화된 상기 관심사 분석 근거 정보를 기반으로 관심 추출 엔진으로 관심사를 추출하는 단계를 포함하는 것을 특징으로 하는
    사용자의 소비 패턴/관심사 분석 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서, 상기 텍스트 정보화된 상기 소비 패턴 분석 근거 정보를 기반으로 상기 소비 패턴 분석 엔진으로 소비 패턴을 분석하는 단계는,
    전처리 절차를 기반으로 상기 소비 패턴 분석 근거 정보에서 소비 패턴 분석을 위한 키워드를 추출을 위한 전처리를 수행하는 단계;
    키워드 추출 절차를 기반으로 상기 키워드를 추출하는 단계;
    필터링 절차를 기반으로 상기 키워드에 대한 필터링을 수행하여 상기 키워드를 카테고리 별로 분류하여 상기 소비 패턴 분석을 수행하는 단계; 및
    개인화 DB(database) 구현 절차를 기반으로 상기 소비 패턴 분석의 결과를 저장하는 단계를 포함하는 것을 특징으로 하는
    사용자의 소비 패턴/관심사 분석 방법.
  5. 제1항에 있어서, 상기 텍스트 정보화된 상기 관심사 분석 근거 정보를 기반으로 상기 관심 추출 엔진으로 관심사를 추출하는 단계는,
    전처리 절차를 기반으로 상기 관심사 분석 근거 정보에서 관심사 분석을 위한 키워드를 추출을 위한 전처리를 수행하는 단계;
    키워드 추출 절차를 기반으로 상기 키워드를 추출하는 단계;
    필터링 절차를 기반으로 상기 키워드에 대한 필터링을 수행하여 상기 키워드를 카테고리 별로 분류하여 상기 관심사 분석을 수행하는 단계; 및
    개인화 DB(database) 구현 절차를 기반으로 상기 관심사 분석의 결과를 저장하는 단계를 포함하는 것을 특징으로 하는
    사용자의 소비 패턴/관심사 분석 방법.
  6. 사용자의 소비 패턴/관심사 분석 장치에 있어서,
    상기 소비 패턴/관심사 분석 장치는 프로세서를 포함하고,
    상기 프로세서는 사용자 장치에서 송신 및 수신되는 SMS(short message service), 상기 사용자 장치에 의해 접속되는 SNS(social network service), 상기 사용자 장치에 의해 촬상된 영수증 이미지를 포함하는 소비 패턴 분석 근거 정보 및 관심사 분석 근거 정보를 수신하고,
    상기 소비 패턴 분석 근거 정보 및 상기 관심사 분석 근거 정보를 포함하는 이미지 내의 텍스트의 위치를 판단하며,
    OCR(optical character recognition)을 기반으로 상기 텍스트를 추출하고,
    Divided line 알고리즘을 기반으로 상기 텍스트를 정렬하며,
    문자 분류 알고리즘을 통해 상기 텍스트를 의미있는 의미 단위로 분류하고,
    상기 문자 분류 알고리즘을 통해 분류된 상기 의미 단위에 대한 상호 상관(cross-correlation)을 기반으로 상기 소비 패턴 분석 근거 정보, 상기 관심사 분석 근거 정보를 텍스트 정보로 상기 프로세서에서 추출하고,
    상기 프로세서에서 상기 텍스트 정보화된 상기 소비 패턴 분석 근거 정보를 기반으로 소비 패턴 분석 엔진으로 소비 패턴을 분석하고,
    상기 프로세서에서 상기 텍스트 정보화된 상기 관심사 분석 근거 정보를 기반으로 관심사 추출 엔진으로 관심사를 추출하도록 구현되는 것을 특징으로 하는
    사용자의 소비 패턴/관심사 분석 장치.
  7. 삭제
  8. 삭제
  9. 제6항에 있어서,
    상기 소비 패턴 분석 엔진은 전처리 절차를 기반으로 상기 소비 패턴 분석 근거 정보에서 소비 패턴 분석을 위한 키워드를 추출을 위한 전처리를 수행하고,
    키워드 추출 절차를 기반으로 상기 키워드를 추출하고,
    필터링 절차를 기반으로 상기 키워드에 대한 필터링을 수행하여 상기 키워드를 카테고리 별로 분류하여 상기 소비 패턴 분석을 수행하고,
    개인화 DB(database) 구현 절차를 기반으로 상기 소비 패턴 분석의 결과를 저장하도록 구현되는 것을 특징으로 하는
    사용자의 소비 패턴/관심사 분석 장치.
  10. 제6항에 있어서,
    상기 관심사 추출 엔진은 전처리 절차를 기반으로 상기 관심사 분석 근거 정보에서 관심사 분석을 위한 키워드를 추출을 위한 전처리를 수행하고,
    키워드 추출 절차를 기반으로 상기 키워드를 추출하고,
    필터링 절차를 기반으로 상기 키워드에 대한 필터링을 수행하여 상기 키워드를 카테고리 별로 분류하여 상기 관심사 분석을 수행하고,
    개인화 DB(database) 구현 절차를 기반으로 상기 관심사 분석의 결과를 저장하도록 구현되는 것을 특징으로 하는
    사용자의 소비 패턴/관심사 분석 장치.
KR1020150125160A 2015-09-03 2015-09-03 사용자의 소비 패턴/관심사 분석 방법 및 장치 KR101784559B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150125160A KR101784559B1 (ko) 2015-09-03 2015-09-03 사용자의 소비 패턴/관심사 분석 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150125160A KR101784559B1 (ko) 2015-09-03 2015-09-03 사용자의 소비 패턴/관심사 분석 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20170028207A KR20170028207A (ko) 2017-03-13
KR101784559B1 true KR101784559B1 (ko) 2017-11-06

Family

ID=58412146

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150125160A KR101784559B1 (ko) 2015-09-03 2015-09-03 사용자의 소비 패턴/관심사 분석 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101784559B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102509553B1 (ko) 2022-05-17 2023-03-10 백승훈 빅데이터 분석 프레임워크 플랫폼을 활용한 소비 패턴 분석 및 미래 수요 예측 시스템

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102140376B1 (ko) * 2018-09-14 2020-08-11 조성철 신혼 재무 설계 시스템 및 방법
KR102251612B1 (ko) * 2020-09-25 2021-05-13 김형준 콘텐츠의 분류 관리 방법 및 시스템
KR102218651B1 (ko) * 2020-10-23 2021-02-22 권동하 지리정보 기반의 고객 맞춤형 생활 관리샵 정보 제공 시스템
KR102477840B1 (ko) * 2020-10-29 2022-12-14 씨제이올리브영 주식회사 사용자 정보를 활용한 상품 정보 검색 장치 및 이를 위한 제어방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101002266B1 (ko) 2008-03-27 2010-12-20 (주)맥신 가변 지지대

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102509553B1 (ko) 2022-05-17 2023-03-10 백승훈 빅데이터 분석 프레임워크 플랫폼을 활용한 소비 패턴 분석 및 미래 수요 예측 시스템

Also Published As

Publication number Publication date
KR20170028207A (ko) 2017-03-13

Similar Documents

Publication Publication Date Title
CN109359244B (zh) 一种个性化信息推荐方法和装置
US11954739B2 (en) Methods and systems for automatically detecting fraud and compliance issues in expense reports and invoices
KR101784559B1 (ko) 사용자의 소비 패턴/관심사 분석 방법 및 장치
CN107016026B (zh) 一种用户标签确定、信息推送方法和设备
CN109816134B (zh) 收货地址预测方法、装置以及存储介质
TW202001736A (zh) 分類模型的訓練方法、店鋪分類的方法及裝置
CN103412882B (zh) 一种识别消费意图的方法及装置
US20160155202A1 (en) Systems and methods for tax data capture and use
Fayaz et al. Ensemble machine learning model for classification of spam product reviews
US20120136812A1 (en) Method and system for machine-learning based optimization and customization of document similarities calculation
US20190080352A1 (en) Segment Extension Based on Lookalike Selection
Salamai et al. Risk identification-based association rule mining for supply chain big data
KR101596632B1 (ko) 빅데이터 이미지를 이용한 상품 추천 방법
Sihombing et al. Fake review detection on yelp dataset using classification techniques in machine learning
CN111582932A (zh) 场景间信息推送方法、装置、计算机设备及存储介质
CN115147130A (zh) 问题预测方法、设备、存储介质及程序产品
CN111435357A (zh) 加油站客户流失预测方法、装置、电子设备及存储介质
Sadman et al. Detect review manipulation by leveraging reviewer historical stylometrics in amazon, yelp, facebook and google reviews
CN103324641A (zh) 信息记录推荐方法和装置
US20150106158A1 (en) Method and apparatus for providing folksonomic object scoring
KR102295053B1 (ko) 중고 휴대폰 거래 시스템
CN118193806A (zh) 一种目标检索方法、装置、电子设备及存储介质
US20150073902A1 (en) Financial Transaction Analytics
Kumar et al. Fraud detection in online transactions using supervised learning techniques
KR101815558B1 (ko) 비콘을 이용한 소비 패턴 분석 및 마케팅 시스템 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
GRNT Written decision to grant