KR20160089177A - 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템 - Google Patents

폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템 Download PDF

Info

Publication number
KR20160089177A
KR20160089177A KR1020150008803A KR20150008803A KR20160089177A KR 20160089177 A KR20160089177 A KR 20160089177A KR 1020150008803 A KR1020150008803 A KR 1020150008803A KR 20150008803 A KR20150008803 A KR 20150008803A KR 20160089177 A KR20160089177 A KR 20160089177A
Authority
KR
South Korea
Prior art keywords
morpheme
polarity
user
positive
score
Prior art date
Application number
KR1020150008803A
Other languages
English (en)
Inventor
전종훈
임종현
Original Assignee
(주)프람트테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)프람트테크놀로지 filed Critical (주)프람트테크놀로지
Priority to KR1020150008803A priority Critical patent/KR20160089177A/ko
Publication of KR20160089177A publication Critical patent/KR20160089177A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0278Product appraisal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F17/2755
    • G06F17/30011
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템에 관한 것으로, 보다 상세하세는 ⅰ)일사용자의 검색어 입력을 받아 서버에서 타 사용자의 리뷰 문서를 일반 검색엔진을 이용하여 검색하는 단계; ⅱ)형태소 분석기를 이용하여 상기 리뷰 문서에서 형태소를 분석하고 불용어를 필터링하여 형태소를 추출하는 단계,; ⅲ)추출된 형태소에 대하여 미리 제작된 긍정적 및 부정적 폴라리티 사전을 참조하여 각 형태소에 부여된 폴라리티 값을 모두 합산하고 전체 형태소의 개수로 나누어 의견점수를 산출하는 단계 및; ⅳ)상기 의견점수와 일반 검색 엔진의 유사도 점수를 합한 다음 정규화하여 동일 상품 또는 서비스에 대한 정규화한 합산점수가 높은 순서대로 순위를 부여하는 단계를 포함한 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템에 관한 것으로, 본 발명은 일반적인 검색의 유사도 결과 타사용자의 의견이 추가된 결과를 보여 줌으로써 사용자가 요구한 키워드를 포함하고 있는 리뷰문서를 검색할 뿐만 아니라 검색 결과의 정렬 순서는 실제로 해당 상품 또는 서비스에 경험이 있는 타사용자들의 평가 글의 의견이 반영되어 긍정적인 평가가 많은 결과를 선순위에 위치하고 부정적인 평가가 많은 결과를 후순위에 나타날 수 있도록 한다.

Description

폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템{POLARITY-BASED USER OPINION RANKING ALGORITHM AND SYSTEM}
본 발명은 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템에 관한 것으로, 보다 상세하게는 인터넷을 통해 접근가능한 상품 또는 서비스에 대한 타 사용자의 리뷰를 맞춤화하여 순위에 따라 나열하여 보여주는 사용자 의견 랭킹 산정방법에 있어서, ⅰ)일사용자의 검색어 입력을 받아 서버에서 타사용자의 리뷰 문서를 일반 검색엔진을 이용하여 검색 하는 단계; ⅱ)형태소 분석기를 이용하여 상기 리뷰 문서에서 형태소를 분석하고 불용어를 필터링하여 형태소를 추출하는 단계,; ⅲ)추출된 형태소에 대하여 미리 제작된 긍정적 및 부정적 폴라리티 사전을 참조하여 각 형태소에 부여된 폴라리티 값을 모두 합산하고 전체 형태소의 개수로 나누어 의견점수를 산출하는 단계,; ⅳ)상기 의견점수와 일반 검색 엔진의 유사도 점수를 합하여 정규화하여 동일 상품 또는 서비스에 대한 정규화한 합산점수가 높은 순서대로 순위를 부여하는 단계를 포함한 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템에 관한 것이다.
인터넷을 통해 상품에 대한 정보나 식당, 카페, 관광명소 등 서비스업소나 이름이 알려진 명소 등(이하, '식당 등'으로 표시)을 평가하고 그 평가 정보를 참조하여 상품구매 또는 어디를 방문하여 무엇을 할 것인지 선택하는 행위는 일반적인 검색 패턴으로 자리 잡았다. 특히, 최근에는 스마트폰의 일반화를 통해 이를 앱 형태로 개발한 예도 다양하게 찾아볼 수 있다. 이러한 식당 등에 대한 평가는 블로그, SNS, 포털 사이트 등을 통해 다양한 형태의 평가가 올라오는데, 그 양이 방대하여 사용자들이 방문할 식당 등을 선택하는데 어려움을 겪는다. 특히, 일반적으로 원하는 식당 등을 찾기 위해서는 일반 검색 포털 사이트를 통해 원하는 지역과 키워드를 입력하여 블로그를 검색하고 수많은 블로그를 통하여 방문하고자 하는 식당 등을 선택한다.
그러나, 검색 결과의 랭킹을 결정하는 방법은 상당부분 단순 키워드 매칭(Keyword matching)에 의해 정렬되며, 키워드 매칭 방식을 악용하여 사용자들이 자주 검색하는 키워드로 블로그를 구성하여 상위 랭킹을 차지하는 경우가 많아 졌다. 또한 검색 결과에 대해서 긍정적인 글인지 부정적인 글인지를 사용자가 일일이 확인하며 판단하여야 한다. 또한, 포털 사이트의 경우에는 식당 등의 평가에 대해 특징별로 점수를 부여할 수 있도록 하여 평가 정보에 의미를 부여하고 있으나 이러한 식당 평가 정보를 검색 결과에는 반영하지 못하고 있다.
따라서, 상기 식당 등에 대한 자료에 대한 랭킹산정 또는 필터링 방법에 대한 여러 가지 시도가 있어왔다. 기존에 Web Page Scoring System(WPSS) 알고리즘은 구글 검색 엔진에서 사용하는 PageRank가 웹 문서의 내용은 고려하지 않고 하이퍼링크의 구조만을 고려하여 랭킹을 계산한다는 점을 단점으로 지적하고 있다. 또한, 블로그 포스트에는 하이퍼링크가 포함되어 있지 않기 때문에 기존에 제안된 PageRank나 HITS와 같은 링크 기반 웹 문서 랭킹 알고리즘을 포스트 랭킹에 적용할 수 없어 블로그의 소유자인 블로거를 PageRank에서의 노드 개념으로 보고, 블로그에서 일어나는 스크랩, 덧글 쓰기, 엮인글 쓰기 등을 간선의 개념으로 하여 PageRank의 변형된 계산방법을 활용하여 포스트에 대한 랭킹을 결정하는 방법이 개발된 바도 있다. 또한, 대한민국 특허 제1218141호의 특허공보에는 웹 상에서 검색되는 복수의 식당에 관한 정보를 수집하고, 식당 데이터베이스에 상기 복수의 식당에 관한 정보를 데이터베이스화하여 관리하는 식당 정보 수집부, 웹 상에서 검색되는 식당에 관하여 작성된 복수의 리뷰 문서를 수집하고, 리뷰 데이터베이스에 상기 리뷰 문서를 데이터베이스화하여 관리하는 리뷰 수집부, 랭킹 최종 결과를 생성하기 위하여 사용되는 중간 계산 테이블을 적어도 하나 생성하고, 상기 중간 계산 테이블을 데이터베이스화하여 관리하기 위한 적어도 하나의 중간 데이터베이스를 포함하는 중간 테이블 생성부, 적어도 하나의 상기 중간 계산 테이블을 활용하여 각 식당의 최종 랭킹 값을 산출하는 랭킹 계산부 및 각각의 상기 최종 랭킹 값을 랭킹 데이터베이스에 데이터베이스화하여 저장 및 관리하는 랭킹 결과 저장부를 포함하는 랭킹 계산 시스템으로서, 상기 랭킹 계산부는, 복수의 식당 중 특정 식당의 랭킹 점수 RANK가, 상기 특정 식당에 대한 모든 리뷰 작성자의 영향력 점수의 합계와 상기 특정 식당에 대한 별점 점수 평균인 AVG(CS)를 합한 값이 되도록 아래 식을 이용하여 산출하되, 상기 리뷰 작성자의 각각의 상기 영향력 점수 PI는, 상기 리뷰 작성자의 최근 활동성 점수와 지속성 지수 및 전파력 점수를 합한 값이 되도록 산출하며, 상기 중간 계산 테이블은 상기 영향력 점수, 상기 별점 점수, 상기 활동성 점수, 상기 지속성 지수 및 상기 전파력 점수를 계산하여 상기 랭킹 계산부에 제공하며, 상기 최근 활동성 점수는 상기 사용자들의 각각에 대한 최근 활동성을 수치화한 점수이고, 상기 지속성 점수는 상기 사용자들의 각각에 대한 지속 참여 정도를 수치화한 점수이고, 상기 전파력 점수는 특정 리뷰 문서의 작성 이후 시점의 리뷰 문서의 개수를 통하여 상기 특정 리뷰 문서를 작성한 사용자의 영향력을 수치화한 점수인 랭킹 계산 시스템 및 방법이 개시되어 있다. 또한, 대한민국 특허 제1171599호에는 신뢰할 수 있는(trusted) 사용자 생성 콘텐트(user generated content; UGC)에 액세스하는 방법으로서, 사용자 등록 정보를 수신하는 단계 ― 상기 등록 정보는 각 사용자에 대한 하나 이상의 아이덴티티(identity)를 포함하고, 각 아이덴티티는 복수의 소셜 네트워크 사이트들(social network sites) 중 하나에 의해 촉진되는 소셜 네트워크에 대응함 ―; 상기 복수의 소셜 네트워크 사이트들로부터 각 사용자에 대한 아이덴티티들에 대응하는 소셜 관계들(social relationships)을 수집하는 단계; 상기 수집된 소셜 관계들을 결합(join)함으로써 각 사용자에 대한 사용자 확장된 소셜 네트워크들을 생성하는 단계; 상기 복수의 소셜 네트워크 사이트들로부터 UGC를 수집하는 단계; 상기 수집된 UGC를 상기 확장된 소셜 네트워크들과 상관시키는 단계; 요청하는 사용자의 사용자 구성에 따라 또는 상기 UGC 저자의 사용자 구성에 따라 상기 상관된 UGC를 필터링하는 단계; 및 상기 요청하는 사용자에게 상기 콘텐트를 제공하는 단계 ― 상기 콘텐트는 디스플레이에서 프리젠테이션하기 위해 이용 가능함 ―를 포함하는, 신뢰할 수 있는 사용자 생성 콘텐트에 액세스하는 방법이 개시되어 있다.
그러나, 전술한 종래의 랭킹산정 또는 필터링 알고리즘은 리뷰 내용에 대한 평가보다는 작성자를 둘러싼 친소관계나 작성자의 영향력 등 작성자 본인에 대한 인적 평가가 우선되는 것이기 때문에 정확한 평가로 보기 어려운 측면이 있었다.
대한민국 특허 제1218141호 대한민국 특허 제1171599호
따라서, 본 발명이 이루고자 하는 기술적 과제는 일반 키워드 기반 검색엔진을 이용하여 TF/IDF (Term Frequency/Inversed Document Frequency)기반의 일반적인 키워드 검색을 통해 사용자 평가를 유사도 점수와 함께 계산하고 계산된 사용자 평가의 폴라리티를 분석하여 통합하는 알고리즘을 제안하고 통합된 점수를 이용하여 랭킹 점수(Ranking Score)에 반영함으로써 사용자 평가 폴라리티가 반영된 랭킹 순위를 보여주는 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템을 제공하는 것이다.
상기 기술적 과제를 달성하기 위하여, 본 발명은 인터넷을 통해 접근가능한 상품 또는 서비스에 대한 타 사용자의 리뷰를 맞춤화하여 순위에 따라 나열하여 보여주는 사용자 의견 랭킹 산정방법에 있어서, ⅰ)일사용자의 검색어 입력을 받아 서버에서 타사용자의 리뷰 문서를 일반 검색엔진을 이용하여 검색하는 단계; ⅱ)형태소 분석기를 이용하여 상기 리뷰 문서에서 형태소를 분석하고 불용어를 필터링하여 형태소를 추출하는 단계,; ⅲ)추출된 형태소에 대하여 미리 제작된 긍정적 및 부정적 폴라리티 사전을 참조하여 각 형태소에 부여된 폴라리티 값을 모두 합산하고 전체 형태소의 개수로 나누어 의견점수를 산출하는 단계 및 ; ⅳ)상기 의견점수와 일반 검색 엔진의 유사도 점수를 합한 다음 정규화하여 동일 상품 또는 서비스에 대한 정규화한 합산점수가 높은 순서대로 순위를 부여하는 단계를 포함한 폴라리티 기반 사용자 의견 랭킹 산정방법을 제공한다.
또한, 본 발명은 상기 긍정적 및 부정적 폴라리티 사전이 관계형 데이터베이스 형태로서 각 형태소의 고유 ID, 형태소의 품사, 형태소, 형태소의 리뷰 ID 및 폴라리티 값을 포함한 긍정적 및 부정적 의미의 형태소를 저장한 것임을 특징으로 하는 폴라리티 기반 사용자 의견 랭킹 산정방법을 제공한다.
또한, 본 발명은 상기 폴라리티 값이 긍정적인 경우 +1이고 부정적인 경우 -1인 것을 특징으로 하는 폴라리티 기반 사용자 의견 랭킹 산정방법을 제공한다.
본 발명의 또 다른 측면은 일사용자의 단말기로부터 검색어를 입력받아 정보를 처리하는 서버와,; 상기 서버와 연결되어 입력된 검색어 관련 타사용자의 리뷰 문서를 검색하고 유사도를 제공하는 탄력적 검색 클러스터와,; 관계형 데이터베이스 형태로서 각 형태소의 고유 ID, 형태소의 품사, 형태소, 형태소의 리뷰 ID 및 폴라리티 값을 포함한 긍정적 및 부정적 의미의 형태소를 각각 저장한 긍정적 및 부정적 폴라리티 사전과,; 상기 탄력적 검색 클러스터와 연결되어 검색된 리뷰 문서의 형태소를 분류하고 불용어를 필터링하며 각 형태소에 대하여 상기 폴라리티 사전과 매칭하여 그 점수를 합산하는 의견 반영 모듈 및 ; 상기 탄력적 검색 클러스터에서 제공된 유사도와 의견반영 모듈에서 수득된 점수를 더한 통합점수가 높은 순서에 따라 리뷰 문서를 일사용자에 보여주는 인터페이스를 포함한 폴라리티 기반 사용자 의견 랭킹 산정 시스템을 제공한다.
본 발명의 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템은 일반적인 검색의 유사도 결과 타사용자의 의견이 추가된 결과를 보여 줌으로써 사용자가 요구한 키워드를 포함하고 있는 리뷰문서를 검색할 뿐만 아니라 검색 결과의 정렬 순서는 실제로 해당 상품 또는 서비스에 경험이 있는 타사용자들의 평가 글의 의견이 반영되어 긍정적인 평가가 많은 결과를 선순위에 위치하고 부정적인 평가가 많은 결과를 후순위에 나타날 수 있도록 한다.
도 1은 본 발명의 폴라리티 기반 사용자 의견 랭킹 산정방법에 따라 폴라리티 사전을 구축하기 위한 순서를 설명하기 위한 이해도
도 2는 본 발명의 폴라리티 기반 사용자 의견 랭킹 산정방법의 알고리즘 적용 절차를 예를 들어 표현한 것
도 3은 본 발명의 폴라리티 기반 사용자 의견 랭킹 산정시스템에 따른 일예의 구성도를 표현한 것
이하, 본 명세서에 첨부된 도면을 참조하여 본 발명의 일실시예를 들어 본 발명에 대해 보다 상세히 설명한다. 하기 실시예는 상품 또는 서비스의 대표적인 예로 식당을 든다. 다만, 하기 실시예는 본 발명의 이해를 돕기 위한 것으로 본 발명의 범위가 하기 실시예로 제한되는 것은 아니다.
본 발명의 폴라리티 기반 사용자 의견 랭킹 산정방법은 인터넷을 통해 접근가능한 상품 또는 서비스에 대한 타 사용자의 리뷰를 맞춤화하여 순위에 따라 나열하여 보여주는 사용자 의견 랭킹 산정방법에 있어서, ⅰ)일사용자의 검색어 입력을 받아 서버에서 타 사용자의 리뷰 문서를 일반 검색엔진을 이용하여 검색하는 단계; ⅱ)형태소 분석기를 이용하여 상기 리뷰 문서에서 형태소를 분석하고 불용어를 필터링하여 형태소를 추출하는 단계,; ⅲ)추출된 형태소에 대하여 미리 제작된 긍정적 및 부정적 폴라리티 사전을 참조하여 각 형태소에 부여된 폴라리티 값을 모두 합산하고 전체 형태소의 개수로 나누어 의견점수를 산출하는 단계 및; ⅳ)상기 의견점수와 일반 검색 엔진의 유사도 점수를 합한 다음 정규화하여 동일 상품 또는 서비스에 대한 정규화한 합산점수가 높은 순서대로 순위를 부여하는 단계를 포함한다. 또한, 도 3은 본 발명의 폴라리티 기반 사용자 의견 랭킹 산정시스템에 따른 일예의 구성도를 표현한 것이다. 도 3에서 볼 수 있는 바와 같이, 본 발명의 폴라리티 기반 사용자 의견 랭킹 산정시스템은 일사용자의 단말기로부터 검색어를 입력받아 정보를 처리하는 서버와,; 상기 서버와 연결되어 입력된 검색어 관련 타사용자의 리뷰 문서를 검색하고 유사도를 제공하는 탄력적 검색 클러스터와,; 관계형 데이터베이스 형태로서 각 형태소의 고유 ID, 형태소의 품사, 형태소, 형태소의 리뷰 ID 및 폴라리티 값을 포함한 긍정적 및 부정적 의미의 형태소를 각각 저장한 긍정적 및 부정적 폴라리티 사전과,; 상기 탄력적 검색 클러스터와 연결되어 검색된 리뷰 문서의 형태소를 분류하고 불용어를 필터링하며 각 형태소에 대하여 상기 폴라리티 사전과 매칭하여 그 점수를 합산하는 의견 반영 모듈 및;상기 탄력적 검색 클러스터에서 제공된 유사도와 의견반영 모듈에서 수득된 점수를 더한 통합점수가 높은 순서에 따라 리뷰 문서를 일사용자에 보여주는 인터페이스를 포함한다.
본 발명의 폴라리티 기반 사용자 의견 랭킹 산정방법은 타사용자의 의견을 분석하기 위해서는 ⅰ)일사용자의 검색어 입력을 받아 서버에서 타 사용자의 리뷰 문서를 일반 검색엔진을 이용하여 검색하는 단계를 포함한다. 본 명세서에서 '일반 검색엔진'은 포털 사이트를 비롯한 각종 인터넷 사이트 등에서 이용하는 유사도 기반의 검색결과를 제공하는 검색엔진을 의미한다. 상기 인터넷 사이트에서 제공하는 리뷰에는 타사용자가 작성한 리뷰 글뿐만 아니라 추가적인 장소 또는 상품 평가 정보가 포함되어 있다. 예를 들면 대부분의 식당 포털 사이트에서 맛, 분위기, 가격 등과 같은 식당 평가 요소에 별점을 부여하는 평가 방식을 이용하여 정보를 제공하고 있다. 이러한 일반 검색엔진을 이용하여 크롤링된 문서를 검색한다.
본 발명의 폴라리티 기반 사용자 의견 랭킹 산정방법은 ⅱ)형태소 분석기를 이용하여 상기 리뷰 문서에서 형태소를 분석하고 불용어를 필터링하여 형태소를 추출하는 단계를 포함한다. 리뷰 문서에는 긍정과 부정의 여러 표현이 혼재하는 것이 일반적이며, 평가에 적절치 않은 표현 또한 존재한다. 따라서, 긍정과 부정으로 분리된 리뷰의 형태소를 추출하고 폴라리티 분석에 필요하지 않은 불용어를 필터링하여 제거한다. 형태소 분석을 위해 한글 형태소 분석기를 이용하여 여러 형태소 중 긍정과 부정을 판단하는 형용사와 동사를 추출하고, 긍정으로 분류된 리뷰에 속해있는 형태소는 긍정적 폴라리티 사전에, 부정으로 분류된 리뷰에 속해있는 형태소는 부정적 폴라리티 사전에 저장한다. 도 1은 본 발명의 폴라리티 기반 사용자 의견 랭킹 산정방법에 따라 폴라리티 사전을 구축하기 위한 순서를 설명하기 위한 이해도이다. 도 1에 나타난 바와 같이, 사용자가 작성한 식당의 평가글로부터 폴라리티를 계산하기 위해서는 형태소에 대한 긍정, 부정정보를 가지고 있는 폴라리티 사전를 구축하여야 한다. 폴라리티 사전은 특정 형태소가 긍정인지 부정인지에 대한 정보를 저장하고 있다. 이를 이용하여 사용자의 형태소를 분석하고 해당 형태소가 긍정인지 부정인지를 판단하는 것이다. 각 사전은 관계형 데이터베이스 형태로 설계하여 스키마는 아래 식 1과 같이 구성된다.
[식 1]
[폴라리티 사전(ID, tag, content, review_id, 폴라리티)]
긍정 폴라리티 사전과 부정 폴라리티 사전은 동일한 구조로 구성하며, 형태소의 고유 ID, 형태소의 품사, 형태소, 형태소의 리뷰 ID, 폴라리티 값로 구성하여, 폴라리티 컬럼이 가지는 폴라리티 값은 특별히 제한되지는 않으며 본 발명의 실시예에서는 각각 +1과 -1로 구성되며 해당 형태소가 긍정인지 부정인지를 나타내는 것이다. 긍정 폴라리티 사전과 부정 폴라리티에 저장되는 형태소가 서로 중복이 될 수 있으며 이러한 경우에 폴라리티 점수를 계산할 시에 혼동이 올 수 있다. 때문에 긍정 폴라리티 사전과 부정 폴라리티 사전에 중복되는 형태소는 빈도수가 더 많은 쪽의 폴라리티 사전에 저장하고 빈도수가 적은 쪽의 폴라리티 사전에서 제거한다.
본 발명의 폴라리티 기반 사용자 의견 랭킹 산정방법은 ⅲ)추출된 형태소에 대하여 미리 제작된 긍정적 및 부정적 폴라리티 사전을 참조하여 각 형태소에 부여된 폴라리티 값을 모두 합산하고 전체 형태소의 개수로 나누어 의견점수를 산출하는 단계를 포함한다. 각각의 리뷰에 대한 의견 점수를 구하는 공식은 식 2와 같다.
[식 2]
Figure pat00001
리뷰 d 에 있는 형용사를 추출하여 긍정 사전에 매칭 된 형용사와 부정 사전에 매칭된 형용사들의 합을 구하고 양쪽 모두에 매칭된 횟수로 나눈 값이다. 동일한 형용사가 중복되어도 폴라리티 점수에 반영이 된다. 리뷰의 형용사를 추출하여 해당 형용사가 긍정 폴라리티 사전에 있는지 혹은 부정 폴라리티 사전에 있는지 확인한 후 폴라리티 점수를 합하여 최종 의견 점수가 결정된다. 폴라리티 사전 구축 시에 긍정 폴라리티 사전과 부정 폴라리티 사전에 중복되는 부분을 해결하였기 때문에 하나의 형용사당 1 혹은 -1의 값으로 계산 된다. 또한 한 형용사가 중복되어 폴라리티가 한쪽으로 치우치는 현상을 방지하고자 매칭된 형용사 수로 정규화를 한다. 이렇게 정규화를 하게 되면 결국 의견점수는 -1과 1 사이의 값을 갖게 된다.
본 발명의 폴라리티 기반 사용자 의견 랭킹 산정방법은 ⅳ)상기 의견점수와 일반 검색 엔진의 유사도 점수를 합한 다음 정규화하여 동일 상품 또는 서비스에 대한 정규화한 합산점수가 높은 순서대로 순위를 부여하는 단계를 포함한다. 의견 점수가 계산된 리뷰를 식당 ID를 기준으로 통합한 뒤 식당의 부가정보를 추가한다. 이는 사용자에게 결과를 식당으로 보여주기 위함이며 동시에 식당에 리뷰들 점수를 통합하여 최종 식당 랭킹 점수를 계산하기 위함이다. 식당의 부가정보에는 식당의 이미지, 주소, 메뉴정보 등이 있을 수 있다. 그러나 리뷰를 통합하는 과정에 있어서 식당마다 리뷰의 개수가 다르다는 문제점이 있다. 이를 해결하기 위해서 계산된 리뷰의 개수로 나눔으로써 정규화를 진행한다. 정규화는 점수 통합에 있어서 검색엔진의 유사도 점수와 폴라리티 점수의 가중치를 조절 하여 구현하는 시스템에서 검색 엔진과 폴라티티의 반영의 조정할 수 있도록 하는 변수를 각각에 곱할 수 있다. 가중치의 수치는 검색엔진의 비율(search weight)과 폴라리티 점수비중(opinion weight)의 합이 1이 되도록 한다. 상기 검색엔진의 비율(search weight)과 폴라리티 점수비중(opinion weight)은 특별히 제한되는 것은 아니고 기본적으로 각각 0.5의 값을 부여할 수 있으나, 검색분야에 따라 유사도에 더 비중을 두거나 사용자의 폴라리티 점수에 더 높은 비중을 둘 수 있음은 당연하다. 따라서 최종 식당의 랭킹 점수를 구하는 수식은 [식 3] 과 같다.
[식 3]
Figure pat00002
도 3에 도시된 바와 같이, 본 발명의 폴라리티 기반 사용자 의견 랭킹 알고리즘을 적용한 시스템의 구성은 사용자로부터 질의를 입력받아 일반 키워드 기반 검색엔진을 이용해 키워드기반 유사도 검색을 통해 리뷰를 가져오고 폴라리티 사전을 이용하여 의견을 반영한 뒤 그 결과를 사용자에게 반환하도록 하여 긍정적 평가가 많은 타사용자의 리뷰 문서와 유사도 검색결과를 반영하여 사용자의 검색시 보다 정확한 리뷰결과를 제공하도록 한 구조이다.
앞에서 설명된 본 발명의 일실시예는 본 발명의 기술적 사상을 한정하는 것으로 해석되어서는 안 된다. 본 발명의 보호범위는 청구범위에 기재된 사항에 의하여만 제한되고, 본 발명의 기술분야에서 통상의 지식을 가진 자는 본 발명의 기술적 사상을 다양한 형태로 개량 변경하는 것이 가능하다. 따라서 이러한 개량 및 변경은 통상의 지식을 가진 자에게 자명한 것인 한 본 발명의 보호범위에 속하게 될 것이다.

Claims (4)

  1. 인터넷을 통해 접근가능한 상품 또는 서비스에 대한 타 사용자의 리뷰를 맞춤화하여 순위에 따라 나열하여 보여주는 사용자 의견 랭킹 산정방법에 있어서,
    ⅰ)일사용자의 검색어 입력을 받아 서버에서 타 사용자의 리뷰 문서를 일반 검색엔진을 이용하여 검색하는 단계;
    ⅱ)형태소 분석기를 이용하여 상기 리뷰 문서에서 형태소를 분석하고 불용어를 필터링하여 형태소를 추출하는 단계,;
    ⅲ)추출된 형태소에 대하여 미리 제작된 긍정적 및 부정적 폴라리티 사전을 참조하여 각 형태소에 부여된 폴라리티 값을 모두 합산하고 전체 형태소의 개수로 나누어 의견점수를 산출하는 단계 및;
    ⅳ)상기 의견점수와 일반 검색 엔진의 유사도 점수를 합한 다음 정규화하여 동일 상품 또는 서비스에 대한 정규화한 합산점수가 높은 순서대로 순위를 부여하는 단계를 포함한 폴라리티 기반 사용자 의견 랭킹 산정방법.
  2. 제1항에 있어서,
    상기 긍정적 및 부정적 폴라리티 사전은 관계형 데이터베이스 형태로서 각 형태소의 고유 ID, 형태소의 품사, 형태소, 형태소의 리뷰 ID 및 폴라리티 값을 포함한 긍정적 및 부정적 의미의 형태소를 저장한 것임을 특징으로 하는 폴라리티 기반 사용자 의견 랭킹 산정방법.
  3. 제2항에 있어서,
    상기 폴라리티 값은 긍정적인 경우 +1이고 부정적인 경우 -1인 것을 특징으로 하는 폴라리티 기반 사용자 의견 랭킹 산정방법.
  4. 일사용자의 단말기로부터 검색어를 입력받아 정보를 처리하는 서버와,;
    상기 서버와 연결되어 입력된 검색어 관련 타사용자의 리뷰 문서를 검색하고 유사도를 제공하는 탄력적 검색 클러스터와,;
    관계형 데이터베이스 형태로서 각 형태소의 고유 ID, 형태소의 품사, 형태소, 형태소의 리뷰 ID 및 폴라리티 값을 포함한 긍정적 및 부정적 의미의 형태소를 각 저장한 긍정적 및 부정적 폴라리티 사전과,;
    상기 탄력적 검색 클러스터와 연결되어 검색된 리뷰 문서의 형태소를 분류하고 불용어를 필터링하며 각 형태소에 대하여 상기 폴라리티 사전과 매칭하여 그 점수를 합산하는 의견 반영 모듈 및;
    상기 탄력적 검색 클러스터에서 제공된 유사도와 의견반영 모듈에서 수득된 점수를 더한 통합점수가 높은 순서에 따라 리뷰 문서를 일사용자에 보여주는 인터페이스를 포함한 폴라리티 기반 사용자 의견 랭킹 산정 시스템.
KR1020150008803A 2015-01-19 2015-01-19 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템 KR20160089177A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150008803A KR20160089177A (ko) 2015-01-19 2015-01-19 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150008803A KR20160089177A (ko) 2015-01-19 2015-01-19 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20160089177A true KR20160089177A (ko) 2016-07-27

Family

ID=56617078

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150008803A KR20160089177A (ko) 2015-01-19 2015-01-19 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템

Country Status (1)

Country Link
KR (1) KR20160089177A (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107871254A (zh) * 2016-09-23 2018-04-03 阿里巴巴集团控股有限公司 提供数据对象信息的方法及装置
KR20180080492A (ko) * 2017-01-04 2018-07-12 (주)프람트테크놀로지 사용자 리뷰를 이용한 상품 평가 시스템 및 방법
KR20190105979A (ko) * 2018-03-07 2019-09-18 경기대학교 산학협력단 에디터 추천 장치 및 방법
CN113806237A (zh) * 2021-11-18 2021-12-17 杭州费尔斯通科技有限公司 一种基于词典的语言理解模型的测评方法和系统
KR102365875B1 (ko) 2021-03-31 2022-02-23 주식회사 써니마인드 언어 모델을 기초로 생성된 인공신경망을 이용한 텍스트 분류 및 분석 방법 및 이를 이용한 장치
KR20220120871A (ko) * 2021-02-24 2022-08-31 뷰티한국주식회사 인기 투표 서비스를 제공하는 서버 및 그 동작 방법
KR20220135798A (ko) 2021-03-31 2022-10-07 김선희 언어 모델을 기초로 생성된 인공신경망을 이용한 리뷰 분석 방법 및 장치
KR20230115731A (ko) 2022-01-27 2023-08-03 주식회사 써니마인드 언어 모델을 기초로 생성된 인공신경망을 이용한 게임 리뷰 분석 방법 및 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101171599B1 (ko) 2008-03-31 2012-08-06 야후! 인크. 소셜 네트워크를 이용한 신뢰할 수 있는 사용자 생성 콘텐트에의 액세스
KR101218141B1 (ko) 2011-09-27 2013-01-03 (주)레드테이블 랭킹 계산 방법 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101171599B1 (ko) 2008-03-31 2012-08-06 야후! 인크. 소셜 네트워크를 이용한 신뢰할 수 있는 사용자 생성 콘텐트에의 액세스
KR101218141B1 (ko) 2011-09-27 2013-01-03 (주)레드테이블 랭킹 계산 방법 및 시스템

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107871254A (zh) * 2016-09-23 2018-04-03 阿里巴巴集团控股有限公司 提供数据对象信息的方法及装置
KR20180080492A (ko) * 2017-01-04 2018-07-12 (주)프람트테크놀로지 사용자 리뷰를 이용한 상품 평가 시스템 및 방법
KR20190105979A (ko) * 2018-03-07 2019-09-18 경기대학교 산학협력단 에디터 추천 장치 및 방법
KR20220120871A (ko) * 2021-02-24 2022-08-31 뷰티한국주식회사 인기 투표 서비스를 제공하는 서버 및 그 동작 방법
KR102365875B1 (ko) 2021-03-31 2022-02-23 주식회사 써니마인드 언어 모델을 기초로 생성된 인공신경망을 이용한 텍스트 분류 및 분석 방법 및 이를 이용한 장치
KR20220135798A (ko) 2021-03-31 2022-10-07 김선희 언어 모델을 기초로 생성된 인공신경망을 이용한 리뷰 분석 방법 및 장치
CN113806237A (zh) * 2021-11-18 2021-12-17 杭州费尔斯通科技有限公司 一种基于词典的语言理解模型的测评方法和系统
CN113806237B (zh) * 2021-11-18 2022-03-08 杭州费尔斯通科技有限公司 一种基于词典的语言理解模型的测评方法和系统
KR20230115731A (ko) 2022-01-27 2023-08-03 주식회사 써니마인드 언어 모델을 기초로 생성된 인공신경망을 이용한 게임 리뷰 분석 방법 및 장치

Similar Documents

Publication Publication Date Title
US9201880B2 (en) Processing a content item with regard to an event and a location
KR20160089177A (ko) 폴라리티 기반 사용자 의견 랭킹 산정방법 및 시스템
US9836511B2 (en) Computer-generated sentiment-based knowledge base
US6564210B1 (en) System and method for searching databases employing user profiles
US7996393B1 (en) Keywords associated with document categories
US8370334B2 (en) Dynamic updating of display and ranking for search results
US20090119268A1 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US7765209B1 (en) Indexing and retrieval of blogs
US8332426B2 (en) Indentifying referring expressions for concepts
US20050222989A1 (en) Results based personalization of advertisements in a search engine
US20050010605A1 (en) Information retrieval systems with database-selection aids
US20110112993A1 (en) Search methods and various applications
Yoshinaga et al. Open-domain attribute-value acquisition from semi-structured texts
Behnert et al. Known-item searches resulting in zero hits: considerations for discovery systems
US20120130972A1 (en) Concept disambiguation via search engine search results
US20090094212A1 (en) Natural local search engine
JP2017134870A (ja) 検索結果内に添付された情報データベースに基づいた検索リスト及び検索語順位の提供方法及びシステム
JP4759600B2 (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
Zaghoul et al. Website search engine optimization: geographical and cultural point of view
Delgado et al. Person name disambiguation on the web in a multilingual context
US20130226854A1 (en) Search Methods and Various Applications
Conrad et al. Query-based opinion summarization for legal blog entries
Mohamed et al. Toward multi-lingual information retrieval system based on internet linguistic diversity measurement
JP2006139484A (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
Delgado et al. A survey of person name disambiguation on the web

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application