KR102119083B1 - 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체 - Google Patents

사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체 Download PDF

Info

Publication number
KR102119083B1
KR102119083B1 KR1020180022050A KR20180022050A KR102119083B1 KR 102119083 B1 KR102119083 B1 KR 102119083B1 KR 1020180022050 A KR1020180022050 A KR 1020180022050A KR 20180022050 A KR20180022050 A KR 20180022050A KR 102119083 B1 KR102119083 B1 KR 102119083B1
Authority
KR
South Korea
Prior art keywords
evaluation
partial
user
score
rating
Prior art date
Application number
KR1020180022050A
Other languages
English (en)
Other versions
KR20190101718A (ko
Inventor
김남규
부현경
이동훈
고은정
정해강
Original Assignee
국민대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국민대학교산학협력단 filed Critical 국민대학교산학협력단
Priority to KR1020180022050A priority Critical patent/KR102119083B1/ko
Publication of KR20190101718A publication Critical patent/KR20190101718A/ko
Application granted granted Critical
Publication of KR102119083B1 publication Critical patent/KR102119083B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0278Product appraisal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Computational Mathematics (AREA)
  • Development Economics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 사용자 리뷰 기반 평점 재산정 장치 및 방법에 관한 것으로, 특정 평가대상에 대한 전체평점, 평가항목별 부분평점 및 사용자 리뷰를 포함하는 적어도 하나의 사용자 평가를 기초로 부분평점 예측 모델을 생성하는 예측 모델 생성부, 상기 부분평점이 누락된 사용자 평가에 대해 상기 부분평점 예측 모델을 통해 누락된 상기 부분평점을 예측하는 부분평점 예측부 및 상기 부분평점 및 평가항목별 가중치를 기초로 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 전체평점 재산정부를 포함한다. 따라서, 본 발명은 사용자 리뷰의 분석을 통해 예측된 세부 항목에 대한 평점을 기초로 전체평점을 재산정할 수 있다.

Description

사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체{USER REVIEW BASED RATING RE-CALCULATION APPARATUS AND METHOD, STORAGE MEDIA STORING THE SAME}
본 발명은 사용자 리뷰 기반 평점 재산정 기술에 관한 것으로, 보다 상세하게는 사용자 리뷰의 분석을 통해 예측된 세부 항목에 대한 평점을 기초로 전체평점을 재산정할 수 있는 사용자 리뷰 기반 평점 재산정 장치 및 방법에 관한 것이다.
대부분의 사이트에서 수행되는 사용자 평가는 정량적인 평점과 리뷰 텍스트의 두 가지 형태로 제공될 수 있다. 정량적인 평점은 특정 상품에 대한 전체 평점 뿐 아니라, 다양한 평가 기준에 따른 세부 평점으로 구성될 수 있다. 세부 항목에 대한 평점을 모두 입력하도록 강요하는 것은 평가자에게 큰 부담을 주기 때문에, 대부분의 사이트는 전체 평점은 필수 입력, 세부 평점은 선택 입력 항목으로 요구하고 있다. 이로 인해 세부 항목별 평점 기입 누락은 높은 비율로 발생하고 있고, 누락 평점을 무시한 단순 평균은 실제 현상을 충분히 왜곡할 수 있는 한계를 갖게 된다.
한국등록특허 제10-1054524(2011.07.29)호는 평점 계산 방법 및 그 시스템에 관한 것으로, 상기 정보들 중 평가대상을 결정하는 단계, 결정한 평가대상에 해당하는 단어들을 상기 인터넷 사이트상에서 수집하는 단계, 상기 단어들이 평가문 형태로 구성된 단어들인지 판단하는 단계, 상기 단어들이 평가문 형태로 구성되어 있으면, 상기 평가문 형태로 구성된 단어들을 텍스트 마이닝 방식으로 분석하여 각각 수치화된 점수로 시각화하는 단계, 그리고 상기 수치화된 점수들을 합산하여, 합산한 결과를 토대로 평점을 계산하는 단계를 포함한다.
한국등록특허 제10-1054524(2011.07.29)호
본 발명의 일 실시예는 사용자 리뷰의 분석을 통해 예측된 세부 항목에 대한 평점을 기초로 전체평점을 재산정할 수 있는 사용자 리뷰 기반 평점 재산정 장치 및 방법을 제공하고자 한다.
본 발명의 일 실시예는 부분평점 예측 모델을 통해 예측된 부분평점 및 평가항목별 가중치를 기초로 전체평점을 재산정할 수 있는 사용자 리뷰 기반 평점 재산정 장치 및 방법을 제공하고자 한다.
본 발명의 일 실시예는 토픽 모델링을 통해 산출된 사용자 리뷰에 대한 토픽 가중치, 부분평점 및 전체평점을 학습하여 부분평점 예측 모델을 생성할 수 있는 사용자 리뷰 기반 평점 재산정 장치 및 방법을 제공하고자 한다.
실시예들 중에서, 사용자 리뷰 기반 평점 재산정 장치는 특정 평가대상에 대한 전체평점, 평가항목별 부분평점 및 사용자 리뷰(Review)를 포함하는 적어도 하나의 사용자 평가를 기초로 부분평점 예측 모델을 생성하는 예측 모델 생성부, 상기 부분평점이 누락된 사용자 평가에 대해 상기 부분평점 예측 모델을 통해 누락된 상기 부분평점을 예측하는 부분평점 예측부 및 상기 부분평점 및 평가항목별 가중치를 기초로 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 전체평점 재산정부를 포함한다.
상기 예측 모델 생성부는 상기 적어도 하나의 사용자 평가에 포함된 상기 사용자 리뷰에 대해 토픽 모델링(Topic Modeling)을 통해 핵심토픽을 추출하고 상기 사용자 리뷰 및 상기 핵심토픽에 관한 가중치 행렬을 생성할 수 있다.
상기 예측 모델 생성부는 평가항목별로 상기 부분평점이 유효한 사용자 평가에 대해 상기 사용자 리뷰의 토픽 가중치, 상기 전체평점 및 상기 부분평점으로 구성된 적어도 하나의 원소쌍을 포함하는 학습 집합을 생성할 수 있다.
상기 예측 모델 생성부는 평가항목별로 상기 학습 집합에 포함된 상기 적어도 하나의 원소쌍에 대해 상기 사용자 리뷰의 토픽 가중치 및 상기 전체평점을 입력으로 하고 상기 부분평점을 출력으로 하는 학습을 통해 상기 부분평점 예측 모델을 생성할 수 있다.
상기 부분평점 예측부는 상기 부분평점이 누락된 사용자 평가에 대해 상기 사용자 리뷰의 토픽 가중치와 상기 전체평점을 상기 부분평점 예측 모델에 입력하여 누락된 상기 부분평점을 예측할 수 있다.
상기 전체평점 재산정부는 상기 적어도 하나의 사용자 평가에 대해 상기 부분평점 및 상기 평가항목별 가중치 간의 가중합을 통해 상기 특정 평가대상에 대한 상기 전체평점을 재산정할 수 있다.
실시예들 중에서, 사용자 리뷰 기반 평점 재산정 방법은 (a) 특정 평가대상에 대한 전체평점, 평가항목별 부분평점 및 사용자 리뷰(Review)를 포함하는 적어도 하나의 사용자 평가를 기초로 부분평점 예측 모델을 생성하는 단계, (b) 상기 부분평점이 누락된 상기 사용자 평가에 대해 상기 부분평점 예측 모델을 통해 누락된 상기 부분평점을 예측하는 단계 및 (c) 상기 부분평점 및 평가항목별 가중치를 기초로 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 단계를 포함한다.
상기 (a) 단계는 상기 적어도 하나의 사용자 평가에 포함된 상기 사용자 리뷰에 대해 토픽 모델링(Topic Modeling)을 통해 핵심토픽을 추출하고 상기 사용자 리뷰 및 상기 핵심토픽에 관한 가중치 행렬을 생성하는 단계일 수 있다.
상기 (a) 단계는 평가항목별로 상기 부분평점이 유효한 사용자 평가에 대해 상기 사용자 리뷰의 토픽 가중치, 상기 전체평점 및 상기 부분평점으로 구성된 적어도 하나의 원소쌍을 포함하는 학습 집합을 생성하는 단계일 수 있다.
상기 (a) 단계는 평가항목별로 상기 학습 집합에 포함된 상기 적어도 하나의 원소쌍에 대해 상기 사용자 리뷰의 토픽 가중치 및 상기 전체평점을 입력으로 하고 상기 부분평점을 출력으로 하는 학습을 통해 상기 부분평점 예측 모델을 생성하는 단계일 수 있다.
상기 (b) 단계는 상기 부분평점이 누락된 사용자 평가에 대해 상기 사용자 리뷰의 토픽 가중치와 상기 전체평점을 상기 부분평점 예측 모델에 입력하여 누락된 상기 부분평점을 예측하는 단계일 수 있다.
상기 (c) 단계는 상기 적어도 하나의 사용자 평가에 대해 상기 부분평점 및 상기 평가항목별 가중치 간의 가중합을 통해 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 단계일 수 있다.
실시예들 중에서, 컴퓨터 수행 가능한 기록매체는 특정 평가대상에 대한 전체평점, 평가항목별 부분평점 및 사용자 리뷰(Review)를 포함하는 적어도 하나의 사용자 평가를 기초로 부분평점 예측 모델을 생성하는 과정, 상기 부분평점이 누락된 상기 사용자 평가에 대해 상기 부분평점 예측 모델을 통해 누락된 상기 부분평점을 예측하는 과정 및 상기 부분평점 및 평가항목별 가중치를 기초로 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 과정을 포함한다.
개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
본 발명의 일 실시예에 따른 사용자 리뷰 기반 평점 재산정 장치 및 방법은 부분평점 예측 모델을 통해 예측된 부분평점 및 평가항목별 가중치를 기초로 전체평점을 재산정할 수 있다.
본 발명의 일 실시예에 따른 사용자 리뷰 기반 평점 재산정 장치 및 방법은 토픽 모델링을 통해 산출된 사용자 리뷰에 대한 토픽 가중치, 부분평점 및 전체평점을 학습하여 부분평점 예측 모델을 생성할 수 있다.
도 1은 본 발명의 일 실시예에 따른 사용자 리뷰 기반 평점 재산정 시스템을 설명하는 도면이다.
도 2는 도 1에 있는 평점 재산정 장치를 설명하는 블록도이다.
도 3은 도 1에 있는 평점 재산정 장치에서 수행되는 평점 재산정 과정을 설명하는 순서도이다.
도 4는 본 발명의 일 실시예에 따른 사용자 리뷰 기반 평점 재산정 시스템의 전체적인 개요를 나타내는 도면이다.
도 5는 도 2에 있는 예측 모델 생성부에서 예측 모델 생성을 위해 사용하는 사용자 평가의 구성을 설명하는 예시도이다.
도 6은 도 2에 있는 예측 모델 생성부에서 유효한 부분평점을 가진 사용자 평가만을 추출하는 과정을 설명하는 예시도이다.
도 7은 도 2에 있는 예측 모델 생성부에서 토픽 모델링을 통해 부분평점 예측 모델 생성을 위한 학습 데이터를 생성하는 과정을 설명하는 예시도이다.
도8은 도 1에 있는 평점 재산정 장치에서 사용자가 입력한 평가항목별 가중치를 기초로 평점을 재산정한 결과를 표시한 화면을 나타내는 예시도이다.
본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
도 1은 본 발명의 일 실시예에 따른 사용자 리뷰 기반 평점 재산정 시스템을 설명하는 도면이다.
도 1을 참조하면, 사용자 리뷰 기반 평점 재산정 시스템(이하, 평점 재산정 시스템이라 한다.)(100)은 사용자 단말(110), 평점 재산정 장치(130) 및 데이터베이스(150)를 포함할 수 있다.
사용자 단말(110)은 특정 대상에 대한 평가를 수행하고 평가 결과를 확인할 수 있는 컴퓨팅 장치에 해당할 수 있고, 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC 등 다양한 디바이스로도 구현될 수 있다. 사용자 단말(110)은 평점 재산정 장치(130)와 네트워크를 통해 연결될 수 있고, 복수의 사용자 단말(110)은 평점 재산정 장치(130)와 동시에 연결될 수 있다. 예를 들어, 사용자 단말(110)은 특정 상품이나 온라인 서비스에 대한 평가를 수행할 수 있고, 평점 순으로 정렬된 상품 리스트 또는 서비스 리스트를 확인할 수 있다.
평점 재산정 장치(130)는 사용자 단말(110)로부터 수신한 요청에 따라 특정 대상에 대한 전체평점을 재산정하여 해당 결과를 사용자 단말(110)에 제공할 수 있는 컴퓨터 또는 프로그램에 해당하는 서버로 구현될 수 있다. 평점 재산정 장치(130)는 사용자 단말(110)과 블루투스, WiFi 등을 통해 무선으로 연결될 수 있고, 네트워크를 통해 사용자 단말(110)과 데이터를 주고 받을 수 있다.
일 실시예에서, 평점 재산정 장치(130)는 사용자 단말(110)에 세부 평가항목별 가중치를 부여할 수 있는 인터페이스(Interface)를 제공할 수 있다. 사용자는 사용자 단말(110)을 통해 세부 평가항목별로 가중치를 부여함으로써 자신이 중요하게 생각하는 평가항목에 높은 우선순위를 부여할 수 있고, 평점 재산정 장치(130)는 사용자 단말(110)로부터 입력 받은 가중치 정보를 기초로 평점을 재산정함으로써 사용자에게 최적화된 정보를 제공할 수 있다.
평점 재산정 장치(130)는 데이터베이스(150)를 포함하여 구현될 수 있고, 데이터베이스(150)와 독립적으로 구현될 수 있다. 데이터베이스(150)와 독립적으로 구현된 경우 평점 재산정 장치(130)는 데이터베이스(150)와 유선 또는 무선으로 연결되어 데이터를 주고 받을 수 있다.
데이터베이스(150)는 평점 재산정을 위해 필요한 다양한 정보들을 저장할 수 있는 저장장치이다. 데이터베이스(150)는 사용자 단말(110)로부터 수신한 세부 평가항목별 가중치 정보들을 저장할 수 있고, 평점 재산정 장치(130)가 사용자 리뷰에 대한 토픽 모델링(Topic Modeling)을 수행하여 추출한 핵심토픽 정보 및 세부 평가항목별 부분평점 정보들을 저장할 수 있다. 데이터베이스(150)는, 반드시 이에 한정되지 않고, 특정 대상에 대한 전체평점, 부분평점 및 사용자 리뷰를 포함하는 사용자 평가를 기초로 예측 모델을 생성하고 누락된 부분평점을 예측하여 평점을 재산정하는 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다.
데이터베이스(150)는 특정 범위에 속하는 정보들을 저장하는 적어도 하나의 독립된 서브-데이터베이스들로 구성될 수 있고, 적어도 하나의 독립된 서브-데이터베이스들이 하나로 통합된 통합 데이터베이스로 구성될 수 있다. 적어도 하나의 독립된 서브-데이터베이스들로 구성되는 경우에는 각각의 서브-데이터베이스들은 블루투스, WiFi 등을 통해 무선으로 연결될 수 있고, 네트워크를 통해 상호 간의 데이터를 주고 받을 수 있다. 데이터베이스(150)는 통합 데이터베이스로 구성되는 경우 각각의 서브-데이터베이스들을 하나로 통합하고 상호 간의 데이터 교환 및 제어 흐름을 관리하는 제어부를 포함할 수 있다.
도 2는 도 1에 있는 평점 재산정 장치를 설명하는 블록도이다.
도 2를 참조하면, 평점 재산정 장치(130)는 예측 모델 생성부(210), 부분평점 예측부(230), 전체평점 재산정부(250) 및 제어부(270)를 포함할 수 있다.
예측 모델 생성부(210)는 특정 평가대상에 대한 전체평점, 평가항목별 부분평점 및 사용자 리뷰를 포함하는 적어도 하나의 사용자 평가를 기초로 부분평점 예측 모델을 생성할 수 있다. 특정 평가대상은 평가의 대상이 되는 상품이나 서비스에 해당할 수 있다. 예를 들어, 평가대상은 호텔, 골프장 등의 서비스에 해당하거나 또는 어플리케이션(Application), TV 등의 상품에 해당할 수 있다.
전체평점 및 부분평점은 일정 범위를 가진 점수로 표현될 수 있고, 일정 수의 단계를 가진 등급으로 표현될 수 있으며, 반드시 이에 한정되지 않고, 일정한 규칙에 의해 수치화될 수 있는 다양한 평가방법으로 표현될 수 있다. 사용자 리뷰(Review)는 평가 대상에 대한 사용자의 평가를 담은 텍스트에 해당할 수 있다. 사용자는 평가 대상에 대한 경험을 바탕으로 자신이 느낀 감정을 사용자 단말(110)을 통해 일정한 크기로 제한된 글로 표현함으로써 사용자 리뷰를 생성할 수 있다.
일 실시예에서, 예측 모델 생성부(210)는 적어도 하나의 사용자 평가에 포함된 사용자 리뷰에 대해 토픽 모델링(Topic Modeling)을 통해 핵심토픽을 추출하고 사용자 리뷰 및 핵심토픽에 관한 가중치 행렬을 생성할 수 있다. 예측 모델 생성부(210)는 복수의 사용자 리뷰들에 대해 토픽 모델링을 수행하여 미리 설정된 개수의 핵심토픽을 결정할 수 있고, 각 사용자 리뷰의 핵심토픽에 대한 대응도를 토픽 가중치(Topic Weight) 형태로 산출할 수 있다. 또한, 사용자 리뷰에 대한 토픽 모델링을 통해 추출된 핵심토픽은 적어도 하나의 주요 키워드를 포함하여 구성될 수 있고, 주요 키워드의 수는 미리 설정될 수 있다.
토픽 모델링은 대량의 텍스트 묶음에 숨겨진 토픽 구조를 찾아내는 알고리즘을 통해 코퍼스(Corpus)를 요약, 시각화, 탐색 및 이론화 하는 일련의 과정을 의미한다. 즉, 토픽 모델링은 대량의 문서 집합에 포함된 문서 간 유사도에 기반을 두어 키워드 및 토픽을 추출하는 기법으로, 텍스트 뿐만 아니라 유전자 데이터, 이미지 및 소셜 네트워크 등 다양한 분야에서 널리 활용되고 있다.
토픽 모델링의 주요 알고리즘으로는 SVD(Singular Value Decomposion)를 활용하여 단어-문서 기반의 행렬을 생성한 후 가중치를 적용한 뒤 문서를 분류하는 LSA(Latent Semantic Analysis), 확률론적 방법을 사용한 통계 모델인 pLSA(probabilistic Latent Semantics Analysis), pLSA와 유사하나 문서 토픽 및 토픽 키워드 추출에 대해서는 디히클레 분포를 사용한 LDA(Latent Dirichlet Allocation), 가우시안 시계열 모델을 사용한 DTM(Dynamic Topic Model) 등이 있다.
일 실시예에서, 예측 모델 생성부(210)는 평가항목별로 부분평점이 유효한 사용자 평가에 대해 사용자 리뷰의 토픽 가중치, 전체평점 및 부분평점으로 구성된 적어도 하나의 원소쌍을 포함하는 학습 집합을 생성할 수 있다. 예를 들어, 호텔에 대한 평점을 재산정하는 경우에 있어서, 호텔에 대한 평가항목으로는 '가격', '서비스', '입지', '객실', '침대' 및 '청결도' 등을 포함할 수 있다. 예측 모델 생성부(210)는 평가항목별로 예측 모델을 독립적으로 생성할 수 있고, 예측 모델 생성을 위하여 학습 데이터에 해당하는 학습 집합을 평가항목별로 생성할 수 있다.
예측 모델 생성부(210)는 평가항목 '가격'에 대한 부분평점이 존재하는 사용자 평가를 결정할 수 있고, 해당 사용자 평가에 포함된 전체 평점과 부분평점을 추출할 수 있다. 예측 모델 생성부(210)는 토픽 모델링을 통해 생성된 가중치 행렬로부터 해당 사용자 평가에 포함된 사용자 리뷰와 연관된 토픽 가중치를 추출할 수 있다. 예측 모델 생성부(210)는 추출된 전체 평점, 부분평점 및 토픽 가중치를 하나의 원소쌍으로 묶어 평가항목 '가격'에 대한 학습 집합에 추가할 수 있다. 예측 모델 생성부(210)는 모든 평가항목에 대해 동일한 방식으로 학습 집합을 생성할 수 있다.
일 실시예에서, 예측 모델 생성부(210)는 평가항목별로 학습 집합에 포함된 적어도 하나의 원소쌍에 대해 사용자 리뷰의 토픽 가중치 및 전체평점을 입력으로 하고 부분평점을 출력으로 하는 학습을 통해 부분평점 예측 모델을 생성할 수 있다. 보다 구체적으로, 예측 모델 생성부(210)는 학습 집합에 포함된 원소쌍 각각을 하나의 학습 데이터로 하여 반복 학습을 통해 최종적으로 부분평점 예측 모델을 생성할 수 있다. 예측 모델 생성부(210)는 하나의 사용자 평가에 대응되는 원소쌍을 학습함으로써 토픽 가중치 및 전체평점을 입력하는 경우 부분평점이 결과로서 도출되도록 하는 부분평점 예측 모델을 생성할 수 있다.
예측 모델 생성부(210)는 특정 대상에 대한 모든 세부 평가항목에 대해서도 동일한 방식으로 부분평점 예측 모델을 생성할 수 있고, 부분평점 예측 모델 생성을 위한 학습에는 인공신경망(Artificial Neural Network, ANN), 의사결정나무(Decision Tree) 등을 사용할 수 있다.
부분평점 예측부(230)는 부분평점이 누락된 사용자 평가에 대해 부분평점 예측 모델을 통해 누락된 부분평점을 예측할 수 있다. 부분평점 예측부(230)는 예측 모델 생성부(210)에 의해 평가항목별로 생성된 부분평점 예측 모델을 이용하여 평가항목별로 누락된 부분평점을 예측할 수 있다.
일 실시예에서, 부분평점 예측부(230)는 부분평점이 누락된 사용자 평가에 대해 사용자 리뷰의 토픽 가중치와 전체평점을 부분평점 예측 모델에 입력하여 누락된 부분평점을 예측할 수 있다. 보다 구체적으로, 부분평점 예측부(230)는 토픽 모델링을 통해 도출된 사용자 리뷰의 토픽 가중치와 전체평점을 예측 모델에 입력하여 출력된 결과를 부분평점으로 결정할 수 있다. 여기에서, 예측 모델의 입력으로 사용된 토픽 가중치의 수는 예측 모델 생성에 사용된 토픽 가중치의 수에 대응될 수 있다.
전체평점 재산정부(250)는 부분평점 및 평가항목별 가중치를 기초로 특정 평가대상에 대한 전체평점을 재산정할 수 있다. 전체평점 재산정부(250)는 특정 평가대상에 대하여 누락된 부분평점들을 부분점수 예측부(230)에 의해 예측된 부분평점들로 대체할 수 있고, 대체된 부분평점들을 반영하여 도출된 최종 부분평점을 기초로 해당 평가대상에 대한 전체평점을 재산정할 수 있다. 여기에서, 평가항목별 가중치는 평점 재산정 장치(130)에 의해 미리 설정될 수 있고, 사용자 단말(110)로부터 수신한 가중치에 해당할 수 있다.
일 실시예에서, 전체평점 재산정부(250)는 특정 평가대상에 대하여 누락된 부분평점을 부분점수 예측부(230)에 의해 예측된 부분평점들로 대체할 수 있고, 대체된 부분평점들을 반영하여 도출된 평가항목별 최종 부분평점들의 평균을 해당 평가 대상에 대한 전체평점으로서 재산정할 수 있다. 여기에서, 전체평점 및 평가항목별 부분평점은 동일한 범위를 가지는 점수로 표현될 수 있고, 전체평점 재산정부(250)는 평가항목별 가중치가 모두 동일한 것으로 결정할 수 있다.
일 실시예에서, 전체평점 재산정부(250)는 적어도 하나의 사용자 평가에 대해 부분평점 및 평가항목별 가중치 간의 가중합을 통해 특정 평가대상에 대한 전체평점을 재산정할 수 있다. 전체평점 재산정부(250)는 부분평점 예측부(230)에 의해 예측된 부분평점을 반영하여 평가항목별 최종 부분평점을 도출할 수 있고, 평가항목별 가중치를 적용하여 최종적인 전체평점을 재산정할 수 있다.
일 실시예에서, 전체평점 재산정부(250)는 기존의 전체평점, 부분평점 예측부(230)에 의해 예측된 부분평점 및 평가항목별 가중치 중 적어도 하나를 기초로 최종적인 전체평점을 재산정할 수 있다. 예를 들어, 전체평점 재산정부(250)는 기존의 전체평점 및 예측된 부분평점을 반영하여 재산정된 전체평점 간의 평균을 최종적인 전체평점으로 결정할 수 있다. 여기에서, 기존의 전체평점은 사용자 평가에 포함된 전체평점들의 평균을 통해 산출할 수 있다.
또한, 전체평점 재산정부(250)는 기존의 전체평점 및 예측된 부분평점을 반영하여 재산정된 전체평점 간의 가중합을 최종적인 전체평점으로 결정할 수 있다. 여기에서, 각 전체평점에 대한 가중치는 평점 재산정 장치(130)에 의해 미리 설정될 수 있고, 전체 사용자 평가 수에 대한 누락된 부분평점 수의 비율에 따라 재산정된 전체평점의 가중치를 결정할 수 있다. 보다 구체적으로, 전체 사용자 평가 수에 대한 누락된 부분평점 수의 비율이 높을수록 재산정된 전체평점의 가중치는 높아질 수 있다.
제어부(270)는 평점 재산정 장치(130)의 전체적인 동작을 제어하고, 예측 모델 생성부(210), 부분평점 예측부(230) 및 전체평점 재산정부(250) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.
도 3은 도 1에 있는 평점 재산정 장치에서 수행되는 평점 재산정 과정을 설명하는 순서도이다.
도 3을 참조하면, 평점 재산정 장치(130)는 예측 모델 생성부(210)를 통해 특정 평가대상에 대한 전체평점, 평가항목별 부분평점 및 사용자 리뷰(Review)를 포함하는 적어도 하나의 사용자 평가를 기초로 부분평점 예측 모델을 생성할 수 있다(단계 S310).
평점 재산정 장치(130)는 부분평점 예측부(230)를 통해 부분평점이 누락된 사용자 평가에 대해 부분평점 예측 모델을 통해 누락된 부분평점을 예측할 수 있다(단계 S330). 평점 재산정 장치(130)는 전체평점 재산정부(250)를 통해 부분평점 및 평가항목별 가중치를 기초로 특정 평가대상에 대한 전체평점을 재산정할 수 있다(단계 S350).
도 4는 본 발명의 일 실시예에 따른 사용자 리뷰 기반 평점 재산정 시스템의 전체적인 개요를 나타내는 도면이다.
도 4를 참조하면, 평점 재산정 시스템(100)이 가장 대표적인 호텔 평가 사이트인 TripAdvisor를 이용하는 사용자들의 호텔에 관한 평점 정보를 기초로 각 호텔에 대한 전체평점을 재산정하는 과정의 전체적인 개요가 표시되어 있다. Phase 1은 세부 평가항목별 누락값을 예측하는 과정을 나타내고, Phase 2는 보정된 세부 평가항목별 부분평점과 평가항목별 가중치를 이용해 재산정한 호텔 평점을 도출하는 과정을 나타낸다.
Phase 1에서, 평점 재산정 장치(130)는 각 세부 평가항목별 유효 평가를 추출하는 과정, 즉 세부 평가항목별로 부분평점이 누락된 사용자 평가를 제외하는 과정을 수행할 수 있다(410). 평점 재산정 장치(130)는 이 과정을 통해 세부 평가항목 수에 해당하는 데이터 집합을 생성할 수 있다. 평점 재산정 장치(130)는 사용자 리뷰에 대한 토픽 모델링을 통해 리뷰를 구조화하는 과정을 수행할 수 있고(420), 위의 과정 (410) 및 (420)를 통합하여 각 세부 평가항목별 부분평점 예측 모델을 생성하는 과정을 수행할 수 있다(430). 평점 재산정 장치(130)는 과정 (420)의 구조화된 리뷰와 과정 (410)의 전체평점을 입력(Input) 변수로 사용하고 과정 (410)의 세부 평가항목의 부분평점을 목표(Target) 변수로 사용하여 모델을 학습할 수 있다. 평점 재산정 장치(130)는 과정 (430)에서 생성된 예측 모델을 이용하여 누락된 세부 평가항목별 부분평점을 예측하는 과정을 수행할 수 있다(440).
Phase 2에서, 평점 재산정 장치(130)는 과정 (440)로부터 누락값이 보정된 세부 평가항목별 부분평점과 과정 (450)에서 설정된 세부 평가항목별 사용자 가중치를 이용하여 사용자 관점에 따른 세부 평가항목별 부분평점을 도출하는 과정을 수행할 수 있다(460). 평점 재산정 장치(130)는 과정 (460)에서 산출된 세부 평가항목별 부분평점을 이용하여 호텔 전체평점을 재산정하는 과정을 수행할 수 있다(470).
도 5는 도 2에 있는 예측 모델 생성부에서 예측 모델 생성을 위해 사용하는 사용자 평가의 구성을 설명하는 예시도이다.
도 5를 참조하면, 호텔에 대한 사용자 평가 데이터(500)는 호텔 ID(510), 평가 ID(520), 전체평점(530), 세부평점(540)(여기에서, 세부평점은 부분평점에 해당할 수 있다.) 및 리뷰(550)로 구성될 수 있다. 여기에서, 리뷰(550)를 제외한 모든 구성 요소는 정형 데이터로 분류될 수 있다.
전체평점(530)과 세부평점(540)은 일반적으로 1점 ~ 5점 사이의 척도로 입력할 수 있고, 전체평점(530)은 세부평점(540)과는 별개로 입력 받을 수 있다. 즉, 세부평점(540)의 평균으로 전체평점(530)을 계산하는 것이 아니라, 세부평점(540)과 무관하게 사용자가 전체평점(530)을 부여할 수 있다. 또한, 전체평점(530)은 일반적으로 필수 입력 항목이기 때문에 결측값이 없는 반면, 세부평점(540)은 선택 입력 항목인 경우가 많아서 결측값이 다수 존재할 수 있다. 예를 들어, 도 5에서, '입지', '침대' 및 '청결도'에 대한 세부평점(540)이 누락되었음을 알 수 있다.
도 6은 도 2에 있는 예측 모델 생성부에서 유효한 부분평점을 가진 사용자 평가만을 추출하는 과정을 설명하는 예시도이다.
도 6을 참조하면, 평점 재산정 장치(130)는 예측 모델 생성부(210)를 통해 복수의 사용자 평가(610) 중에서 평가항목별 유효 부분평점(630)을 가진 사용자 평가만을 추출할 수 있다. 사용자 리뷰 R1(620)을 포함하는 사용자 평가의 경우 평가항목 중 '가격', '서비스' 및 '객실'에 대한 부분평점은 유효하고, '입지', '침대' 및 '청결도'에 대한 부분평점은 누락되어 있다. 예측 모델 생성부(210)는 평가항목 중 '가격', '서비스' 및 '객실'에 대해 유효한 부분평점으로서 사용자 리뷰 R1(620)을 추출할 수 있다.
평점 재산정 장치(130)는 세부 평가항목별로 예측 모델을 생성할 수 있고, 이를 위해 세부 평가항목별로 학습 집합을 생성할 수 있다. 평점 재산정 장치(130)는 부분평점이 누락된 사용자 평가의 경우 해당 평가항목의 학습 집합에서 제외할 수 있다. 예를 들어, 도 6에서, 세부 평가항목 '가격'의 예측 모델 생성에는 8개의 사용자 평가가 사용될 수 있고, 해당 평가항목의 부분평점이 누락된 'R2'와 'R7'은 사용되지 않을 수 있다. 또한, 세부 평가항목 '서비스'의 예측 모델 생성에는 6개의 사용자 평가가 사용될 수 있고, 'R3', 'R5', 'R8' 및 'R10'은 사용되지 않을 수 있다.
도 7은 도 2에 있는 예측 모델 생성부에서 토픽 모델링을 통해 부분평점 예측 모델 생성을 위한 학습 데이터를 생성하는 과정을 설명하는 예시도이다.
도 7을 참조하면, 평점 재산정 장치(130)는 사용자 평가에 포함된 사용자 리뷰에 대해 토픽 모델링을 통해 핵심토픽을 추출할 수 있고, 각 사용자 리뷰의 핵심토픽에 대한 대응도(710)를 토픽 가중치(Topic Weight) 형태로 산출할 수 있다. 사용자 리뷰 10건에 대해 핵심토픽 4개를 추출하고, 사용자 리뷰 및 핵심토픽 간의 가중치를 산출한 예가 왼쪽 테이블에 나타나 있다.
예측 모델 생성부(210)는 각 사용자 리뷰의 대응도(T1 ~ T4) 및 해당 사용자 평가가 호텔에 부여한 전체평점을 입력(Input) 변수로 하고 해당 사용자 평가가 호텔에 부여한 평가항목별 부분평점을 목표(Target) 변수로 하여 학습 데이터(730)를 생성할 수 있다. 학습 데이터(730)는 도 6에서의 평가항목별 유효 부분평점(630) 중 평가항목 '입지'의 부분평점 예측 모델 생성에 사용될 수 있다.
학습 데이터(730)는 전체 사용자 리뷰 10건 중 세부 평가항목 '입지'의 유효 평가에 해당되는 사용자 리뷰인 R2, R4, R5 및 R9에 대한 정보만을 포함하고 있다. 또한, 예측 모델 생성부(210)는 토픽 가중치 T1 ~ T4 및 전체평점을 입력으로 하여 목표 변수인 '입지'의 부분평점을 예측하므로, 이를 통해 생성되는 예측 모델은 다음과 같이 정의될 수 있다.
f: (T1, T2, T3, T4, 전체) → (입지)
도8은 도 1에 있는 평점 재산정 장치에서 사용자가 입력한 평가항목별 가중치를 기초로 평점을 재산정한 결과를 표시한 화면을 나타내는 예시도이다.
도 8을 참조하면, 화면 1(810)은 평점 재산정 장치(130)에서 각 호텔에 대한 사용자 평가 중 전체평점(811)을 기초로 전체평점(811)이 높은 순으로 정렬된 호텔 리스트를 사용자 단말(110)에 제공한 모습을 나타낸다. 화면 2(830)는 평점 재산정 장치(130)에서 사용자가 입력한 평가항목별 가중치(831)를 기초로 재산정된 전체평점(833)에 따라 정렬된 호텔 리스트를 사용자 단말(110)에 제공한 모습을 나타낸다. 사용자는 사용자 단말(110)을 통해 평가항목별 가중치(831)를 입력할 수 있고, 평점 재산정 장치(130)로부터 재산정된 전체평점(833) 결과를 수신받아 확인할 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 사용자 리뷰 기반 평점 재산정 시스템
110: 사용자 단말 130: 평점 재산정 장치
150: 데이터베이스
210: 예측 모델 생성부 230: 부분평점 예측부
250: 전체평점 재산정부 270: 제어부
500: 사용자 평가 510: 호텔 ID
520: 평가 ID 530: 전체평점
540: 세부평점 550: 사용자 리뷰
610: 사용자 평가 620: 사용자 리뷰 R1
630: 평가항목별 유효 부분평점
710: 각 사용자 리뷰의 핵심토픽에 대한 대응도
730: 학습 데이터
810: 화면 1 811: 전체평점
830: 화면 2 831: 평가항목별 가중치
833: 재산정된 전체평점

Claims (13)

  1. 특정 평가대상에 대한 수치화된 평가로서 전체평점과 평가항목별 부분평점 및 텍스트화된 평가로서 사용자 리뷰(Review)를 포함하는 적어도 하나의 사용자 평가에 대해, 평가항목별로 유효한 부분평점들 만으로 구성된 평가항목별 부분평점 집합과 전체 사용자 리뷰 집합에서 도출되는 토픽 가중치를 기초로 부분평점 예측 모델-상기 부분평점 예측 모델은 상기 토픽 가중치 및 상기 전체평점을 입력으로 하고 상기 평가항목별 부분평점을 출력으로 함-을 생성하는 예측 모델 생성부;
    평가항목별로 상기 부분평점이 누락된 사용자 평가에 대해 상기 부분평점 예측 모델을 통해 누락된 상기 부분평점을 예측하는 부분평점 예측부; 및
    상기 부분평점 및 평가항목별 가중치를 기초로 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 전체평점 재산정부를 포함하는 사용자 리뷰 기반 평점 재산정 장치.
  2. 제1항에 있어서, 상기 예측 모델 생성부는
    상기 적어도 하나의 사용자 평가에 포함된 상기 사용자 리뷰에 대해 토픽 모델링(Topic Modeling)을 통해 핵심토픽을 추출하고 상기 사용자 리뷰 및 상기 핵심토픽에 관한 가중치 행렬을 생성하는 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 장치.
  3. 제2항에 있어서, 상기 예측 모델 생성부는
    평가항목별로 상기 부분평점이 유효한 사용자 평가에 대해 상기 사용자 리뷰의 토픽 가중치, 상기 전체평점 및 상기 부분평점으로 구성된 적어도 하나의 원소쌍을 포함하는 학습 집합을 생성하는 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 장치.
  4. 제3항에 있어서, 상기 예측 모델 생성부는
    평가항목별로 상기 학습 집합에 포함된 상기 적어도 하나의 원소쌍에 대해 상기 사용자 리뷰의 토픽 가중치 및 상기 전체평점을 입력으로 하고 상기 부분평점을 출력으로 하는 학습을 통해 상기 부분평점 예측 모델을 생성하는 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 장치.
  5. 제4항에 있어서, 상기 부분평점 예측부는
    상기 부분평점이 누락된 사용자 평가에 대해 상기 사용자 리뷰의 토픽 가중치와 상기 전체평점을 상기 부분평점 예측 모델에 입력하여 누락된 상기 부분평점을 예측하는 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 장치.
  6. 제1항에 있어서, 상기 전체평점 재산정부는
    상기 적어도 하나의 사용자 평가에 대해 상기 부분평점 및 상기 평가항목별 가중치 간의 가중합을 통해 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 장치.
  7. 사용자 리뷰 기반 평점 재산정 장치에서 수행되는 평점 재산정 방법에 있어서,
    (a) 특정 평가대상에 대한 수치화된 평가로서 전체평점과 평가항목별 부분평점 및 텍스트화된 평가로서 사용자 리뷰(Review)를 포함하는 적어도 하나의 사용자 평가에 대해, 평가항목별로 유효한 부분평점들 만으로 구성된 평가항목별 부분평점 집합과 전체 사용자 리뷰 집합에서 도출되는 토픽 가중치를 기초로 부분평점 예측 모델-상기 부분평점 예측 모델은 상기 토픽 가중치 및 상기 전체평점을 입력으로 하고 상기 평가항목별 부분평점을 출력으로 함-을 생성하는 단계;
    (b) 평가항목별로 상기 부분평점이 누락된 상기 사용자 평가에 대해 상기 부분평점 예측 모델을 통해 누락된 상기 부분평점을 예측하는 단계; 및
    (c) 상기 부분평점 및 평가항목별 가중치를 기초로 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 단계를 포함하는 사용자 리뷰 기반 평점 재산정 방법.
  8. 제7항에 있어서, 상기 (a) 단계는
    상기 적어도 하나의 사용자 평가에 포함된 상기 사용자 리뷰에 대해 토픽 모델링(Topic Modeling)을 통해 핵심토픽을 추출하고 상기 사용자 리뷰 및 상기 핵심토픽에 관한 가중치 행렬을 생성하는 단계인 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 방법.
  9. 제8항에 있어서, 상기 (a) 단계는
    평가항목별로 상기 부분평점이 유효한 사용자 평가에 대해 상기 사용자 리뷰의 토픽 가중치, 상기 전체평점 및 상기 부분평점으로 구성된 적어도 하나의 원소쌍을 포함하는 학습 집합을 생성하는 단계인 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 방법.
  10. 제9항에 있어서, 상기 (a) 단계는
    평가항목별로 상기 학습 집합에 포함된 상기 적어도 하나의 원소쌍에 대해 상기 사용자 리뷰의 토픽 가중치 및 상기 전체평점을 입력으로 하고 상기 부분평점을 출력으로 하는 학습을 통해 상기 부분평점 예측 모델을 생성하는 단계인 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 방법.
  11. 제10항에 있어서, 상기 (b) 단계는
    상기 부분평점이 누락된 사용자 평가에 대해 상기 사용자 리뷰의 토픽 가중치와 상기 전체평점을 상기 부분평점 예측 모델에 입력하여 누락된 상기 부분평점을 예측하는 단계인 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 방법.
  12. 제7항에 있어서, 상기 (c) 단계는
    상기 적어도 하나의 사용자 평가에 대해 상기 부분평점 및 상기 평가항목별 가중치 간의 가중합을 통해 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 단계인 것을 특징으로 하는 사용자 리뷰 기반 평점 재산정 방법.
  13. 사용자 리뷰 기반 평점 재산정 장치에서 수행되는 평점 재산정 방법을 저장하는 컴퓨터 수행 가능한 기록매체에 있어서,
    특정 평가대상에 대한 수치화된 평가로서 전체평점과 평가항목별 부분평점 및 텍스트화된 평가로서 사용자 리뷰(Review)를 포함하는 적어도 하나의 사용자 평가에 대해, 평가항목별로 유효한 부분평점들 만으로 구성된 평가항목별 부분평점 집합과 전체 사용자 리뷰 집합에서 도출되는 토픽 가중치를 기초로 부분평점 예측 모델-상기 부분평점 예측 모델은 상기 토픽 가중치 및 상기 전체평점을 입력으로 하고 상기 평가항목별 부분평점을 출력으로 함-을 생성하는 과정;
    평가항목별로 상기 부분평점이 누락된 상기 사용자 평가에 대해 상기 부분평점 예측 모델을 통해 누락된 상기 부분평점을 예측하는 과정; 및
    상기 부분평점 및 평가항목별 가중치를 기초로 상기 특정 평가대상에 대한 상기 전체평점을 재산정하는 과정을 포함하는 기록매체.
KR1020180022050A 2018-02-23 2018-02-23 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체 KR102119083B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180022050A KR102119083B1 (ko) 2018-02-23 2018-02-23 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180022050A KR102119083B1 (ko) 2018-02-23 2018-02-23 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체

Publications (2)

Publication Number Publication Date
KR20190101718A KR20190101718A (ko) 2019-09-02
KR102119083B1 true KR102119083B1 (ko) 2020-06-04

Family

ID=67951364

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180022050A KR102119083B1 (ko) 2018-02-23 2018-02-23 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체

Country Status (1)

Country Link
KR (1) KR102119083B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598954B (zh) * 2019-09-24 2022-03-11 中国人民大学 基于深度学习的利用评审意见预测论文被引用数的方法
KR102330970B1 (ko) * 2020-02-18 2021-11-24 연세대학교 원주산학협력단 인공지능 기반의 교육평가시스템 및 평가방법
CN113726849B (zh) * 2021-07-20 2023-11-24 浙江吉利控股集团有限公司 一种饮用酒制作方式的共享方法、装置及服务器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007133903A (ja) * 2007-01-18 2007-05-31 Nec Corp 意見抽出装置、意見抽出方法、意見抽出プログラム
KR101491627B1 (ko) * 2013-07-30 2015-02-11 성균관대학교산학협력단 모바일 애플리케이션 평가를 위한 리뷰 정량화 방법, 장치 및 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101054524B1 (ko) 2009-02-27 2011-08-04 한국전자통신연구원 평점 계산 방법 및 그 시스템
US20140136332A1 (en) * 2012-11-14 2014-05-15 Facebook, Inc. Providing social context for products in advertisements
KR101573601B1 (ko) * 2014-03-10 2015-12-04 단국대학교 산학협력단 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007133903A (ja) * 2007-01-18 2007-05-31 Nec Corp 意見抽出装置、意見抽出方法、意見抽出プログラム
KR101491627B1 (ko) * 2013-07-30 2015-02-11 성균관대학교산학협력단 모바일 애플리케이션 평가를 위한 리뷰 정량화 방법, 장치 및 시스템

Also Published As

Publication number Publication date
KR20190101718A (ko) 2019-09-02

Similar Documents

Publication Publication Date Title
Riaz et al. Opinion mining on large scale data using sentiment analysis and k-means clustering
KR101981075B1 (ko) 데이터 분석 시스템, 데이터 분석 방법, 데이터 분석 프로그램, 및 기록매체
Barushka et al. Review spam detection using word embeddings and deep neural networks
Banerjee et al. Using supervised learning to classify authentic and fake online reviews
Rai Identifying key product attributes and their importance levels from online customer reviews
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
CN108073568A (zh) 关键词提取方法和装置
Shaheen et al. Sentiment analysis on mobile phone reviews using supervised learning techniques
Khurshid et al. Enactment of ensemble learning for review spam detection on selected features
Zhang et al. Combining sentiment analysis with a fuzzy kano model for product aspect preference recommendation
KR101806452B1 (ko) 텍스트 마이닝을 기반으로 한 상품 자동 매핑 방법 및 장치
KR102119083B1 (ko) 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체
Phan et al. An approach for a decision-making support system based on measuring the user satisfaction level on twitter
CN112182145A (zh) 文本相似度确定方法、装置、设备和存储介质
Jonathan et al. Sentiment analysis of customer reviews in zomato bangalore restaurants using random forest classifier
JP7065718B2 (ja) 判断支援装置および判断支援方法
Daniati et al. Decision Making Framework Based On Sentiment Analysis in Twitter Using SAW and Machine Learning Approach
CN111429161A (zh) 特征提取方法、特征提取装置、存储介质及电子设备
Das et al. A review on text analytics process with a CV parser model
JP6178480B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
KR102601804B1 (ko) 신경망 모델 기반의 채용 추천 서비스 제공 전자 장치 및 방법
Beheshti-Kashi et al. Social media analytics for decision support in fashion buying processes
JP7351502B2 (ja) 変数データ生成装置、予測モデル生成装置、変数データ生産方法、予測モデル生産方法、プログラム及び記録媒体
Davis et al. Customer Review Analysis: A Systematic Review
Hossain Fake review detection using data mining

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right