KR101754124B1 - 레스토랑 추천 시스템 및 추천 방법 - Google Patents

레스토랑 추천 시스템 및 추천 방법 Download PDF

Info

Publication number
KR101754124B1
KR101754124B1 KR1020140098741A KR20140098741A KR101754124B1 KR 101754124 B1 KR101754124 B1 KR 101754124B1 KR 1020140098741 A KR1020140098741 A KR 1020140098741A KR 20140098741 A KR20140098741 A KR 20140098741A KR 101754124 B1 KR101754124 B1 KR 101754124B1
Authority
KR
South Korea
Prior art keywords
restaurant
user
profile
spam
class
Prior art date
Application number
KR1020140098741A
Other languages
English (en)
Other versions
KR20160015858A (ko
Inventor
도해용
박혜지
Original Assignee
(주)레드테이블
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)레드테이블 filed Critical (주)레드테이블
Priority to KR1020140098741A priority Critical patent/KR101754124B1/ko
Publication of KR20160015858A publication Critical patent/KR20160015858A/ko
Application granted granted Critical
Publication of KR101754124B1 publication Critical patent/KR101754124B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/12Hotels or restaurants
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

실시예는 유선 또는 무선통신망을 통해 특정 사용자의 사용자 단말로부터 레스토랑 추천 의뢰를 수신하는 통신부, 복수의 저장 서버와 연계되어 웹 크롤러(web crawler) 및 래퍼 베이스드 웹 크롤러(wrapper-based web crawler)를 수행하여 복수의 사용자가 작성한 복수의 레스토랑에 대한 특징을 저장하는 전처리부, 그리고 상기 통신부로부터 의뢰요청 신호를 수신하고, 상기 전처리부로부터 상기 레스토랑에 대한 특징을 수신하여 특정 사용자와 프로파일이 유사한 후보자를 선택하고, 선택된 상기 후보자가 작성한 상기 레스토랑 특징과 상기 특정 사용자의 프로파일을 비교하여 유사도가 높은 상기 레스토랑을 추천하는 제어부 를 포함하는 레스토랑 추천 시스템을 제공한다. 따라서, 빅데이터를 분석하여 레스토랑의 이미지와 사용자의 이미지 사이의 자아일치성을 충족할 수 있는 레스토랑을 추천하여, 만족도를 향상시킬 수 있다.

Description

레스토랑 추천 시스템 및 추천 방법{THE RESTAURANT RECOMMENDING SYSTEM AND THE RECOMMENDING METHOD THEREOF}
본 발명은 레스토랑을 추천하는 방법에 관한 것이다. 보다 상세하게는, 빅데이터 분석기법을 이용하여 수집된 레스토랑에 대한 리뷰로부터 레스토랑의 이미지를 분석하여 사용자에게 매칭되는 레스토랑을 추천하는 시스템 및 방법에 대한 것이다.
소비자는 외식에 대한 구매의사 결정을 내릴 때 레스토랑의 위치, 음식품질, 서비스품질, 분위기품질, 가격, 과거 구매경험 및 브랜드 등 다양한 속성들을 고려한다.
소비자는 브랜드를 선택할 때 자신이 브랜드에 대해 가지고 있는 평가와 신념을 토대로 선택하게 된다.
한편, 과거에는 너무 커서 분석을 할 수 없었던 데이터의 분석이 가능해짐에 따라 실시간에 가까운 속도로 생성되는 데이터를 통해 새로운 가치를 찾을 수 있게 되었다.
오늘날 이러한 데이터를 이용한 분석 기술들이 현실화 되고 있으며, 빅 데이터의 분석을 위한 IT의 발전은 최근 들어 그 속도를 더하고 있다. 새롭게 생성되는 데이터를 이해하고 유용한 지식을 추출하여 현재의 주요 이슈를 탐지하고 모니터링하며, 미래를 예측하기 위한 연구가 활발히 진행되고 있다.
또한 외식산업에서의 빅데이터 분석은 위치기반서비스를 통해 활발히 시도되고 있으며, 새롭게 생성되는 데이터를 이해하고 유용한 지식을 추출하여 현재의 주요 이슈를 탐지하고 모니터링하며, 미래를 예측하기 위한 연구가 활발히 진행되고 있다.
이처럼 현업과 학계에서 빅데이터에 관심을 가지는 이유는 고객의 생각이 빅데이터 안에 있기 때문이다.
그러나, 이미지의 측정을 공학의 기술인 빅데이터 분석기법은 경영 분야에서 많이 연구되어 학제간에 소통이 어려워 한계가 있었다.
본 발명은 빅데이터를 분석하여 레스토랑의 이미지와 사용자의 이미지 사이의 갭을 파악하여 맞춤형 레스토랑을 추천할 수 있는 추천 시스템 및 추천 방법을 제공한다.
실시예는 유선 또는 무선통신망을 통해 특정 사용자의 사용자 단말로부터 레스토랑 추천 의뢰를 수신하는 통신부, 복수의 저장 서버와 연계되어 웹 크롤러(web crawler) 및 래퍼 베이스드 웹 크롤러(wrapper-based web crawler)를 수행하여 복수의 사용자가 작성한 복수의 레스토랑에 대한 특징을 저장하는 전처리부, 그리고 상기 통신부로부터 의뢰요청 신호를 수신하고, 전처리부로부터 상기 레스토랑에 대한 특징을 수신하여 특정 사용자와 프로파일이 유사한 후보자를 선택하고, 선택된 상기 후보자가 작성한 상기 레스토랑 특징과 상기 특정 사용자의 프로파일을 비교하여 유사도가 높은 상기 레스토랑을 추천하는 제어부를 포함하는 레스토랑 추천 시스템을 제공한다.
상기 후보자는 다음의 수학식으로 연산된 유사도가 높은 사용자일 수 있다.
Figure 112014072985202-pat00001
이때,
Figure 112014072985202-pat00002
는 특정 사용자의 프로파일이고,
Figure 112014072985202-pat00003
는 n명의 다른 사용자의 프로파일이며.
Figure 112014072985202-pat00004
는 각 사용자가 가지고 있는 특징 값에 대한 빈도수이다.
상기 전처리부는 상기 웹 크롤러 및 래퍼 베이스드 웹 크롤러를 수행하여 특정 데이터를 수득하고, 상기 특정 데이터를 클리닝하고 스팸 필터링을 진행한 뒤 비스팸 데이터로부터 상기 레스토랑 이미지를 분석할 수 있다.
상기 스팸 필터링은 다음의 수학식을 통하여 스팸 및 비스팸의 클래스가 갖는 확률을 연산할 수 있다.
Figure 112014072985202-pat00005
이때,
Figure 112014072985202-pat00006
는 클래스 확률로서 (클래스 j에서 유일한 단어의 수 / 전체 클래스에서 유일한 단어의 수) 와 같이 계산한다.
Figure 112014072985202-pat00007
는 특정 단어가 특정 클래스에 속할 확률로서 (단어의 빈도수 + 1)*(클래스 j에의 단어 빈도수 + 전체 클래스에서 유일한 단어 수)와 같이 계산한다.
상기 제어 서버는 각각의 상기 레스토랑 이미지 및 상기 사용자의 프로파일을 저장하는 저장부를 더 포함할 수 있다.
한편, 실시예는 복수의 저장 서버와 연계되어 웹 크롤러(web crawler) 및 래퍼 베이스드 웹 크롤러(wrapper-based web crawler)를 수행하여 복수의 사용자가 작성한 복수의 레스토랑에 대한 특징을 저장하는 전처리 단계, 사용자 단말을 통하여 특정 사용자의 레스토랑 추천 의뢰에 대한 요청 신호를 수신하는 단계, 특정 사용자와 프로파일이 유사한 후보자를 선택하는 단계, 그리고 선택된 상기 후보자가 작성한 상기 레스토랑 특징과 상기 특정 사용자의 프로파일을 비교하여 유사도가 높은 상기 레스토랑을 추천하는 단계를 포함하는 레스토랑 추천 방법을 제공한다.
본 발명은 빅데이터를 분석하여 레스토랑의 이미지와 사용자의 이미지 사이의 자아일치성 및 자아향상성을 충족할 수 있는 레스토랑을 추천할 수 있다.
따라서 개별 사용자에게 레스토랑 추천의 정확성 및 만족도를 향상시킬 수 있다.
도 1은 본 발명의 레스토랑 추천 시스템을 포함하는 전체 시스템을 나타내는 개념도이다.
도 2는 본 발명의 레스토랑 추천 시스템의 상세 구성도이다.
도 3은 본 발명의 레스토랑 추천 시스템의 동작을 나타내는 순서도이다.
도 4는 도 3의 전처리 단계의 상세 순서도이다.
도 5는 도 4의 웹 크롤러 단계를 나타내는 상세 순서도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
이하에서는 사용자와 레스토랑 사이의 이미지 차이를 측정하여 만족도가 높은 레스토랑을 제공하는 레스토랑 추천 시스템을 설명한다.
상품 및 여행지의 특성을 측정하는 5가지 속성(Sincerity, Sophistication, Excitement, Competence, Ruggedness)을 이용하여 개인의 이미지(Self Image)와 상품의 이미지를 측정하고 둘 간의 차이를 비교하여, 차이가 적거나(자아일치성), 차이가 클 경우(자아향상성) 구매한 상품에 대한 만족도(Satisfaction)가 높아진다는 이론이 있다.
소비자들은 어떤 제품이나 서비스를 소비함으로써 자아-규정 의식(sense of self-definition)을 느끼며 그것을 다른 사람들에게 커뮤니케이션 하게 된다. 그렇기 때문에 자아개념을 잘 반영하고 표현할 수 있는 브랜드에 동일시를 느끼고 그 브랜드를 선호하게 된다. 브랜드 동일시가 높아질수록 브랜드 충성도도 높아지게 된다.
자아 일치성 이론(Self congruity theory)은 소비행위가 소비 대상의 효용성이 아닌 상징적 기능에 초점을 맞추어 이루어진다는 내용의 이론이다(Sirgy, Johar, Samli, & Claiborne, 1991; Ekinci & Hosany, 2006). 즉, 상품 혹은 브랜드의 소비는 소비자의 자아 이미지를 표출하고 강화시키는 전략적 행위라는 측면을 강조한 행동이론이라고 이해할 수 있다.
소비자는 자신이 실제 가지고 있는 자아 개념과 유사한 이미지를 가진 제품을 사용함으로써 자아 일치감에 대한 욕구를 충족시킬 수 있다. 또한 자신이 되고 싶은 이상적 자아 개념과 유사한 이미지를 가진 제품을 사용함으로써 자아 향상성의 욕구를 충족시킨다. 자아 일치성은 그 대상에 따라 제품 전체에 대한 경우도 있고(Sirgy 1982), 구체적인 브랜드 이미지와의 일치성을 의미하는 경우도 있다(Fournier 1998).
소비자는 자신의 이미지와 일치한다고 지각하는 브랜드에 대해 보다 호의적인 태도와 구매의도를 지닌다. 즉 소비자의 지각된 자아 이미지와 브랜드의 이미지 간의 일치성은 소비자 상품선택, 구매 및 구매 후 만족을 강화시키는데 유의적인 영향을 미치며, 자신의 이미지와 일치한다고 지각하는 브랜드에 대해서는 일반적으로 높은 선호도 및 충성도를 가진다.
자아이미지 연구들에서 제시되고 있는 가장 대표적인 유형은 실제적 자아이미지와 이상적 자아이미지 라고 볼 수 있다. 구체적으로, 실제적 자아는 실제 자신의 모습, 이상적 자아는 되고 싶은 자신의 모습, 실제적 사회 자아는 남들이 실제로 인식하는 자신에 대한 모습, 이상적 사회 자아는 남들이 보아주길 바라는 자신의 모습을 말한다.
따라서, 브랜드가 브랜드-자아의 연결과정에서 자아를 입증해 줄 수 있고 자아를 향상시킬 수 있을 때, 소비자로부터 좋은 평가를 받고 선택될 수 있다. 즉, 소비자는 자아를 입증하고 자아를 향상시키는 브랜드를 사용하여 자아욕구를 충족시킨다.
본 발명은 이러한 자아일치성 이론을 바탕으로 소비자의 기대를 충족할 수 있는 레스토랑 추천 시스템을 제공한다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 레스토랑 추천 시스템을 포함하는 전체 시스템을 나타내는 개념도이고, 도 2는 본 발명의 레스토랑 추천 시스템의 상세 구성도이다.
도 1 및 도 2를 참조하면, 본 발명의 실시예에 따른 레스토랑 추천 시스템을 포함하는 전체 시스템은 소비자 단말(100), 제어서버(200) 및 저장서버(300)를 포함한다.
소비자 단말(100)은 사용자가 제어서버(200)에 접속하여 제어 서버(100)에 레스토랑 추천을 의뢰할 수 있는 단말로서, 스마트폰, 노트북, 태블릿 피씨 또는 퍼스널 컴퓨터 등을 포함한다.
이러한 소비자 단말(100)은 유선 또는 무선 인터넷을 통해 제어 서버(200)와 연동하며, 이때 무선 인터넷은 wifi, 블루투스 등일 수 있다.
소비자 단말(100)은 제어서버(200)에 대한 어플리케이션을 탑재할 수 있다.
복수의 저장 서버(300)는 각종 웹사이트, 블로그 및 트위터 등의 소셜 미디어의 데이터를 저장하는 저장 서버일 수 있다.
제어서버(200)는 레스토랑 추천 시스템으로서, 유선 또는 무선 인터넷을 통하여 상기 사용자 단말(100)로부터 전송되는 레스토랑 추천 요청을 수신한 후 해당 사용자에 최적화된 레스토랑을 선정하여 발송한다.
이러한 제어서버(200)의 상세 구성은 도 2와 같다.
도 2를 참고하면, 제어서버(200)는 통신부(210), 제어부(250), 전처리부(220) 및 저장부(230)를 포함한다.
통신부(210)는 유선 또는 무선으로 전송되는 신호를 수신하기 위한 통신모듈을 포함하며, 무선으로 신호를 수신하는 경우, 안테나, 밴드패스필터 등의 구성을 포함할 수 있다.
상기 통신부(210)는 사용자 단말(100)로부터 전송되는 요청 신호를 수신하거나, 요청 신호에 대한 결과를 전송한다.
상기 통신부(210)는 무선으로 신호를 수신할 때, Wi-Fi 통신망을 이용하여 외부에 있는 사용자 단말(100)로부터 전송되는 요청신호를 수신할 수 있는 와이파이 모듈(Wi-Fi Module)과, 유선으로 신호를 수신할 때, 데이터케이블에 의해 연결되어 시리얼 통신 방식에 의해 요청신호를 수신할 수 있는 USB 단자 등 시리얼 통신모듈로 구성된다.
제어부(250)는 마이크로 프로세서로서, 사용자 단말(100)로부터 레스토랑 추천 요청을 수신하면, 전처리부(220)를 통하여 전처리된 다양한 웹 상의 레스토랑 이미지를 수신하고, 사용자의 이미지와 상호 분석을 수행하여 최적화된 레스토랑을 선정한다.
전처리부(220)는 제어부(250)의 명령에 따라 연계되어 있는 저장 서버(300)들 내의 레스토랑에 대한 다양한 평가를 수신하고, 이를 전처리하여 각 레스토랑의 이미지를 생성한다.
이와 같이 생성된 각 레스토랑의 이미지는 저장부(230)에 저장된다.
이하에서는 도 3 내지 도 5를 참고하여, 본 발명의 레스토랑 추천 시스템의 동작을 설명한다. 이하에서는 레스토랑 추천 시스템을 제어 서버로 단일화한다.
먼저, 특정 사용자로부터 사용자 단말(100)을 통해 통신부(210)로 레스토랑 추천 의뢰가 수신되면(S10), 제어 서버(200)는 레스토랑 추천 동작을 시작한다.
다음으로 제어 서버(200)의 제어부(250)는 전처리부(220)를 통해 특정 사용자에 대한 정보 및 다양한 레스토랑에 대한 정보를 수득하고 전처리하여 이미지를 추출한다(S20).
더욱 상세하게는, 도 4를 참고하여 전처리 단계를 설명한다.
먼저, 웹 크롤러를 진행하여 다양한 저장 서버(300)로부터 웹 상의 정보를 수득한다(S21).
웹 크롤러 단계는 각종 웹사이트, 블로그, 트위터 등 소셜 미디어로부터 레스토랑에 대한 데이터를 수집하기 위한 것으로 트위터 등 소셜 미디어 사이트에서는 API(application programming interface)를 제공하여 데이터를 가져갈 수 있도록 공개하고 있기 때문에 API를 이용하여 크롤러를 개발하고 데이터를 수집한다.
한편, 블로그 등의 일반 사이트에서는 API를 제공하고 있지 않기 때문에 데이터를 수집하기 위해서는 래퍼 베이스드 웹 크롤러(wrapper-based web crawler)를 추가로 수행할 수 있다.
도 5를 참고하면, 래퍼 베이스드 웹 크롤러 단계에서 래퍼 베이스드 웹 크롤러는 수집한 웹 페이지 내에서 원하는 정보를 추출하기 위한 구조 정보를 의미한다.
즉, 일반적인 웹 크롤러와 달리 래퍼 베이스드 웹 크롤러에서는 추출 대상 정보가 포함된 웹 페이지의 주소를 직접 구축하여야 하고, 원하는 데이터를 추출하기 위해 웹 페이지의 구조 정보를 이용해야 한다.
먼저, 방문하여야 하는 URL을 설정한다.
이러한 방문할 URL 설정은 다양한 블로그 등의 URL을 저장부에 직접 저장하여 진행할 수 있다.
래퍼 베이스드 웹 크롤러 단계가 시작되면, 저장되어 있는 URL 중 몇몇의 URL을 취득한다(S211).
이때, 취득하는 URL은 저장부(230)에 저장되어 있는 방문하여야 하는 URL 정보를 의미한다.
다음으로, 해당 URL에 방문하여 해당하는 컨텐츠의 페이지 취득 단계를 수행한다(S213).
컨텐츠가 있는 페이지를 취득하면 각 사이트의 구조를 이용하여 원하는 컨텐츠의 데이터만을 선별하여 취득하는 래퍼링을 진행한다(S215).
선별된 데이터를 저장하고 취득한 URL에서 데이터가 모두 선별되었다고 판단되면 래퍼 베이스드 웹 크롤러를 종료하여 크롤러 단계를 종료한다(S219).
이와 같이 API를 제공하지 않는 정보의 경우, 래퍼 베이스드 웹 크롤러를 별도로 진행함으로써 더욱 다양한 사이트의 정보를 취득할 수 있다.
다음으로 도 4의 전처리 클린단계를 진행한다(S22).
전처리 클린단계는 취득한 웹 데이터에 포함되어 있는 불필요한 문자, 기호, 숫자 등을 제거하는 과정이다.
주로 html tag, 자/모음과 같이 표현되는 문자를 제거하여 다음 단계에서 데이터 가공 시 오류를 줄이기 위해 수행되는 과정으로 이 단계에서는 제거해야 할 문자의 특성을 분석하고, 그 특성을 기반으로 프로그램에서 규칙을 정의할 수 있다.
예를 들어, html tag는 이를 제거하기 위해 '<'로 시작하고 '>' 로 종료하는 문자열을 하나의 규칙으로 정의하면 되고, 자/모음 또는 숫자 같은 경우 문자열 매칭 검사를 이용하면 되는데 해당 문서 내에 특정 문자가 포함되어 있을 경우 이를 제거할 수 있다.
이와 같이 전처리 클린 단계에서는 제거해야 할 문자의 특성을 분석하고, 분석한 내용을 바탕으로 프로그램 내에 규칙으로 정의하여 정보를 정리한다.
전처리 클린 단계가 종료하면, 스팸 필터링 단계를 수행한다(S23).
스팸 필터링 단계는 훈련 모델을 구축하고, 훈련 모델을 이용하여 스팸 문서를 분류한다.
먼저, 전처리 클린 단계를 지나면 문서로부터 불필요한 문자(html tag, 기호, 자/모음 등)이 제거된다. 예를 들어 “<b><h1>가격과 기능 동영상 화질 모두 만족이에요.</h1></b>”와 같은 내용을 담고 있는 문서에서 첫째 단계를 거치면 태그가 제거된 “가격과 기능 동영상 화질 모두 만족이에요”와 같은 결과를 얻을 수 있다.
다음으로, 품사 태거를 사용하여 품사를 태깅한다. 위의 예로 활용하면, "N_가격, N_기능, N_동영상, N_화질, Z_모두, N_만족“과 같은 태깅 결과를 얻을 수 있다. 이때, N은 명사, Z는 부사이다.
다음으로, 품사가 태깅된 각 단어에 대한 빈도수와 클래스 값 (ex. 스팸, 비스팸) 을 명시하면 하나의 훈련 모델이 생성된다.
위의 예에 따른 훈련 모델은 다음의 표로 정리될 수 있다.
No. 특징 값 빈도수 클래스 값
1 N_가격 1 비스팸
2 N_기능 1 비스팸
3 N_동영상 1 비스팸
4 N_화질 1 비스팸
5 Z_모두 1 비스팸
6 N_만족 1 비스팸
7 V_좋 1 비스팸
... ... ...
다음으로 훈련 모델을 통해 분류를 진행한다.
문서로부터 불필요한 문자(html tag, 기호, 자/모음 등)를 제거한다.
예를 들어 “<BR><H3>진짜 좋아요. 화질도 좋고 동영상 화질도 좋아요.</H3>”와 같은 내용을 담고 있는 문서에서 첫째 단계를 거치면 태그가 제거된 “진짜 좋아요. 화질도 좋고 동영상 화질도 좋아요”와 같은 결과를 얻는다.
다음으로, 품사 태거를 사용하여 품사를 태깅한다. 앞의 단계의 결과를 활용하면 "N_진짜, V_좋, N_화질, N_동영상"과 같은 태깅 결과를 얻을 수 있다. 여기서 N은 명사, V는 동사/형용사이다.
마지막으로, 추출한 특징 값은 다음 식을 이용하여 분류를 수행한다.
Figure 112014072985202-pat00008
이때,
Figure 112014072985202-pat00009
는 클래스 확률로서 (클래스 j에서 유일한 단어의 수 / 전체 클래스에서 유일한 단어의 수) 와 같이 계산한다.
Figure 112014072985202-pat00010
는 특정 단어가 특정 클래스에 속할 확률로서 (단어의 빈도수 + 1)*(클래스 j에의 단어 빈도수 + 전체 클래스에서 유일한 단어 수)와 같이 계산한다.
예를 들어, 비스팸 클래스에서 단어의 유일한 수를 18, 단어의 빈도수를 23이라고 하고, 스팸 클래스에서 단어의 유일한 수를 19, 단어의 빈도수를 24라고 했을 때, 비스팸 및 스팸에 대한 우도는 다음과 같이 구할 수 있다.
likelihood(비스팸)=
P("N_진짜"|비스팸)*P("V_좋"|비스팸)*P("N_화질"|비스팸)*P("N_동영상"|비스팸)*P(비스팸) =(1+1)/(24+37)*(1+1)/(24+37)*(1+1)/(24+37)*(1+1)/(24+37)*(19/37)
= 5.93407E-07
likelihood(스팸) =
P("N_진짜"|스팸)*P("V_좋"|스팸)*P("N_화질"|스팸)*P("N_동영상"|스팸)*P(스팸)
= (0+1)/(23+37)*(0+1)/(23+37)*(0+1)/(23+37)*(0+1)/(23+37)*(18/37)
= 3.75375E-08
이에 따라 비스팸 확률은 비스팸 우도 / (스팸 우도+비스팸 우도) = 0.941 이고 스팸 확률은 스팸 우도 /(스팸 우도+비스팸 우도) = 0.059이다.
따라서 예문은 비스팸으로 분류된다.
이와 같은 분류를 통하여 스팸 데이터를 필터링하고 비스팸 데이터만을 추출할 수 있다.
다음으로, 추출된 데이터를 이용하여 해당 레스토랑의 이미지를 분석한다.
Sincerity(성실), Excitement(흥분), Competence(경쟁력), Sophistication(세련), Ruggedness(강인)의 5개요인(Factor)과 15개의 속성(Facet Name), 42개의 측정항목(Traits)을 활용하여 브랜드에 결부되는 일련의 인간적 특성들을 의미하며, 고객에게 무형적 가치를 제공하는 혜택들의 근원을 나타낸다.
레스토랑 이미지 분석은 데이터를 추출하고 이를 양적 자료로 변환하여 의미 있는 결과를 이끌어 내는 방법으로 타당성 있는 기준을 설정하여 수집된 표본들을 일정한 범주로 분류하여, 그 분류된 범주들간의 관계를 통계적 방법으로 추론해 낸다.
이미지 측정 항목은 다음의 표 2와 같다.
요인(Factor) 속성(FacetName) 측정항목(Traits) 확장한 측정항목(E-Traits)
세련
(sophistication)
상류사회의
(upperclass)
상류사회의(upperclass) upperclass
잘생긴(goodlooking) goodlooking
매력적인
(charming)
매력적인(charming) charming, magic, magical, sorcerous, witching, wizard, wizardly
부드러운(smooth) smooth, politic, smooth, suave, bland, fluent, fluid, liquid, legato, placid, quiet, still, tranquil, unruffled
성실
(sincerity)
유익한
(wholesome)
유익한(wholesome) wholesome
원래의(original) original
정직한
(honest)
정직한(honest) honest, honorable, dependable, reliable, true, good, fair
사실적인(real) real, existent, tangible, actual, genuine, literal, substantial, material, veridical
진실된(sincere) sincere, earnest, solemn
현실적인
(down-to-earth)
현실적인(down-to-earth) down-to-earth, earthy
소도시의(small-town) small-town
가족중심의(family-oriented) family-oriented
쾌활한
(cheerful)
쾌활한(cheerful) pollyannaish
친절한(friendly) friendly, well-disposed, welldisposed, audacious
감성적인(sentimental) sentimental, upbeat, bathetic, drippy, hokey, maudlin, mawkish, kitschy, mushy, schmaltzy, schmalzy, sentimental, sappy, soppy, soupy, slushy
강인함
(ruggedness)
거친
(tough)
거친(tough) rugged, tough, toughened, sturdy, ruffianly, bad, hard, baffling, elusive, knotty, problematic, problematical
강인한(rugged) furrowed, rugged, broken
야외의
(outdoorsy)
야외의(outdoorsy) outdoorsy
서부의(western) western, westerly
남성적인(masculine) masculine
흥분
(excitement)
최신의
(up-to-date)
최신의(up-to-date) up-to-date, uptodate, cutting-edge, with-it
현대적인(contemporary) contemporary, modern-day, present-day, contemporaneous
독립적인(independent) independent, autonomous, self-governing, sovereign, main
활발한
(spirited)
활발한(spirited) spirited, bouncing, bouncy, peppy, zippy, game, gamy, gamey, gritty, mettlesome, spunky, enlivened
멋진(cool) cool, coolheaded, nerveless, allright, fine, okay, hunky-dory
젊은(young) young, immature, new, youthful, vernal, unseasoned, untested, untried
상상의
(imaginative)
상상의(imaginative) imaginative, inventive
독특한(unique) unique, alone, unequaled, unequalled, unparalleled, singular
대담한
(daring)
대담한(daring) daring, audacious, venturesome, venturous
유행의(trendy) trendy, voguish
흥분되는(exciting) exciting
능력
(competence)
성공적인
(successful)
성공적인(successful) successful
확신하는(confident) confident, convinced, positive, surefooted, sure-footed
신뢰할만한
(reliable)
신뢰할만한(reliable) reliable, dependable, honest, true, authentic
확실한(secure) secure, unafraid, untroubled, impregnable, inviolable, strong, unassailable, unattackable, dependable, good, safe
지적인
(intelligent)
지적인(intelligent) intelligent, well-informed, healthy, levelheaded, level-headed, sound, reasoning, thinking
기업의(corporate) corporate, bodied, corporal, embodied, incarnate, collective, incorporated
기술적인(technical) technical, proficient, technological, mechanical, mechanicallyskillful, expert
즉, 확장된 측정 항목에 대한 표현이 있는 경우 요인 5개 중 하나의 이미지를 가지는 레스토랑으로 선정한다.
이와 같이 각 레스토랑의 이미지가 선정되면 이를 저장하고, 전처리 단계를 종료한다.
전처리 단계가 종료되면, 추천을 의뢰한 사용자와 정보가 유사하거나 차이가 큰 후보자를 탐색한다(S30).
특정 사용자에게 추천 정보를 제공해주어야 할 경우, 특정 사용자와 다른 사용자간의 프로파일 정보의 유사성을 계산한다.
이러한 프로파일 정보의 유사성은 다음의 수학식으로부터 도출될 수 있다.
Figure 112014072985202-pat00011
이때,
Figure 112014072985202-pat00012
는 특정 사용자의 프로파일이고,
Figure 112014072985202-pat00013
는 n명의 다른 사용자의 프로파일이며.
Figure 112014072985202-pat00014
는 각 사용자가 가지고 있는 요인 값에 대한 빈도수이다.
예를 들어, 특정 사용자와 다른 사용자의 프로파일이
Figure 112014072985202-pat00015
,
Figure 112014072985202-pat00016
와 같을 때 다음과 같은 유사도 값을 얻을 수 있다.
{(1*1)+(2*0)+(1*1)+(1*0)+(1*1)+(0*0)}/(√12+22+12+12+12+02*√12+02+12+02+12+02 ) = 3 / √24 = 0.612
유사도가 연산되면, 특정 사용자와 유사하거나 차이가 큰 후보자를 탐색한다.
다음으로, 후보자가 살펴봤던 레스토랑의 특징 값을 추출한다(S40).
이러한 레스토랑의 특징 값을 추출하는 과정은 개체명 인식, 품사 태깅, 바이그램(bigram), 트리그램(trigram) 등의 문자 추출 기법을 이용하여 추출할 수도 있으나, 본 발명에서는 유사도 값이 정확하게 나타나는 품사 태깅을 통해 추출한 특징 값의 예를 보여준다.
다음으로, 특정 사용자의 프로파일과 후보 레스토랑 사이의 유사도를 비교한다(S50).
후보 레스토랑의 문서로부터 추출한 특징 값은 각 특징 값 별로 빈도수를 계산하여 다음과 같이 정량화된 벡터 형태로 표현한다.
Figure 112014072985202-pat00017
이때, 수학식 3은 문서
Figure 112014072985202-pat00018
를 정량화 한 형태로 표현한 것으로
Figure 112014072985202-pat00019
는 요인 값에 대한 빈도수를 의미한다.
특정 사용자의 프로파일
Figure 112014072985202-pat00020
와 문서
Figure 112014072985202-pat00021
와의 유사도를 계산한다. 이 때, 코사인 유사도 또는 유클리언 거리 계산 식 등을 통해 유사도를 계산할 수 있다.
유사도가 계산되면, 제어 서버(200)는 특정 사용자에게 유사도가 높은 순으로 레스토랑을 추천할 수 있다.
이때, 레스토랑 추천 시에도 제어 서버(200)는 5RRI를 이용하여 특정 사용자에게 맞는 레스토랑을 추천할 수 있다.
이를 위해 해당 레스토랑과 특정 사용자의 자아일치성에 대해 진단함으로써 자아 일치성의 격차를 분석할 수 있으며, 분석 결과를 토대로 소비자의 자아일치성(Self-Congruity)달성 시킬 수 있는 레스토랑을 추천한다.
5RRI는 다음의 수학식을 통하여 연산할 수 있다.
Figure 112014072985202-pat00022
이때, 5RRI(5 Restaurant Recommand Index) : 레스토랑 추천 지수, II(Ideal Image) : 목표하는 레스토랑의 이미지AI(Actual Image) : 자아의 이미지, n : 이미지 측정 지수 차원의 속성 항목수, I : 레스토랑 이미지 측정 지수의 속성을 각각 의미할 수 있다.
이와 같이 빅데이터를 분석하여 사용자와 자아일치성이 크거나 유사한 레스토랑을 추천함으로써 최적화된 레스토랑 추천이 가능하며 만족도를 높일 수 있다.
해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (6)

  1. 유선 또는 무선통신망을 통해 특정 사용자의 사용자 단말로부터 레스토랑 추천 의뢰를 수신하는 통신부,
    복수의 저장 서버와 연계되어 웹 크롤러(web crawler) 및 래퍼 베이스드 웹 크롤러(wrapper-based web crawler)를 수행하여 수집한 문서에 기초하여 복수의 사용자가 작성한 복수의 레스토랑의 각각에 대한 특징 값을 추출 및 저장하는 전처리부, 그리고
    상기 통신부로부터 의뢰요청 신호를 수신하고, 상기 전처리부로부터 상기 복수의 레스토랑의 각각에 대한 상기 특징 값을 수신하여, 상기 특정 사용자와 프로파일이 가장 유사한 후보자가 작성한 레스토랑들에 대한 특징 값들과 상기 특정 사용자의 상기 프로파일을 비교하여, 상기 특정 사용자와 프로파일이 가장 유사한 후보자가 작성한 상기 레스토랑들 중, 상기 특정 사용자의 상기 프로파일과 유사도가 가장 높은 특징 값을 갖는 레스토랑을 추천하는 제어부;를 포함하며,
    상기 전처리부는,
    상기 웹 크롤러 및 래퍼 베이스드 웹 크롤러를 수행하여 특정 데이터를 수득하고, 상기 특정 데이터를 클리닝하고 스팸 필터링을 진행한 뒤 비스팸 데이터로부터 레스토랑 이미지를 분석하며,
    상기 스팸 필터링은 다음의 수학식을 통하여 스팸 및 비스팸의 클래스가 갖는 확률을 연산하고, 비스팸의 클래스가 갖는 확률이 높은 데이터만을 상기 레스토랑 이미지 분석에 사용하는,
    Figure 112016113018959-pat00035

    (이때,
    Figure 112016113018959-pat00036
    는 클래스 확률로서 (클래스 j에서 유일한 단어의 수 / 전체 클래스에서 유일한 단어의 수) 와 같이 계산하며,
    Figure 112016113018959-pat00037
    는 특정 단어가 특정 클래스에 속할 확률로서 (단어의 빈도수 + 1)*(클래스 j에의 단어 빈도수 + 전체 클래스에서 유일한 단어 수)와 같이 계산함)
    레스토랑 추천 시스템.
  2. 제1항에 있어서,
    상기 후보자는 다음의 수학식으로 연산된 유사도가 가장 높은 사용자인,
    Figure 112016113018959-pat00038

    (이때,
    Figure 112016113018959-pat00039
    는 특정 사용자의 프로파일이고,
    Figure 112016113018959-pat00040
    는 n명의 다른 사용자의 프로파일이며.
    Figure 112016113018959-pat00041
    는 각 사용자가 가지고 있는 특징 값에 대한 빈도수임),
    레스토랑 추천 시스템.
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 레스토랑 추천 시스템은, 각각의 상기 레스토랑 이미지 및 상기 사용자의 프로파일을 저장하는 저장부를 더 포함하는, 레스토랑 추천 시스템.
  6. 삭제
KR1020140098741A 2014-08-01 2014-08-01 레스토랑 추천 시스템 및 추천 방법 KR101754124B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140098741A KR101754124B1 (ko) 2014-08-01 2014-08-01 레스토랑 추천 시스템 및 추천 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140098741A KR101754124B1 (ko) 2014-08-01 2014-08-01 레스토랑 추천 시스템 및 추천 방법

Publications (2)

Publication Number Publication Date
KR20160015858A KR20160015858A (ko) 2016-02-15
KR101754124B1 true KR101754124B1 (ko) 2017-07-26

Family

ID=55356714

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140098741A KR101754124B1 (ko) 2014-08-01 2014-08-01 레스토랑 추천 시스템 및 추천 방법

Country Status (1)

Country Link
KR (1) KR101754124B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101998400B1 (ko) * 2017-08-01 2019-07-09 (주)레드테이블 빅데이터를 이용한 모바일 커머스 정보 추천 시스템 및 방법
KR101998399B1 (ko) * 2017-08-01 2019-07-09 (주)레드테이블 빅데이터를 이용한 모바일 커머스 시스템 및 서비스 방법
KR102087824B1 (ko) * 2018-03-27 2020-04-23 주식회사 와인그래프 취향 분석 알고리즘을 이용한 와인추천 방법

Also Published As

Publication number Publication date
KR20160015858A (ko) 2016-02-15

Similar Documents

Publication Publication Date Title
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
CN107861972B (zh) 一种用户录入商品信息后显示商品全结果的方法及设备
CN108304526B (zh) 一种数据处理方法、装置及服务器
CN104636371B (zh) 信息推荐方法及设备
US9760945B2 (en) Visually generated consumer product presentation
US10467507B1 (en) Image quality scoring
CN107833082B (zh) 一种商品图片的推荐方法和装置
JP6381775B2 (ja) 情報処理システム及び情報処理方法
CN108038161A (zh) 基于相册的信息推荐方法、装置及计算设备
KR102322668B1 (ko) 콘텐츠 크리에이터의 창작활동 활성화를 위한 다중 플랫폼 서비스 제공 시스템
CN113946754A (zh) 基于用户画像的权益推荐方法、装置、设备及存储介质
CN106708871A (zh) 一种社交业务特征用户的识别方法和装置
KR101754124B1 (ko) 레스토랑 추천 시스템 및 추천 방법
CN111666513A (zh) 页面处理方法、装置、电子设备及可读存储介质
CN114691990A (zh) 查询选项的推荐方法、装置、服务器、存储介质及产品
CN114579858A (zh) 内容推荐方法和装置、电子设备、存储介质
Ashraf et al. Personalized news recommendation based on multi-agent framework using social media preferences
KR102449602B1 (ko) 멀티미디어 콘텐츠 내 상품 정보 처리 장치 및 그 방법
CN117217875A (zh) 商品推荐方法及装置、电子设备及存储介质
CN117745349A (zh) 一种基于用户特征的个性化推券方法及系统
KR20220091948A (ko) 소셜 미디어 활동 분석을 통한 추천 서비스 제공 장치 및 방법
Zhao et al. Tourism e-commerce recommender system based on web data mining
Kulkarni et al. Restaurants rating prediction using machine learning algorithms
US20240062264A1 (en) Ai- backed e-commerce for all the top rated products on a single platform
CN114840659A (zh) 信息推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right