KR102351745B1 - 사용자 리뷰 기반 평점 재산정 장치 및 방법 - Google Patents

사용자 리뷰 기반 평점 재산정 장치 및 방법 Download PDF

Info

Publication number
KR102351745B1
KR102351745B1 KR1020200013465A KR20200013465A KR102351745B1 KR 102351745 B1 KR102351745 B1 KR 102351745B1 KR 1020200013465 A KR1020200013465 A KR 1020200013465A KR 20200013465 A KR20200013465 A KR 20200013465A KR 102351745 B1 KR102351745 B1 KR 102351745B1
Authority
KR
South Korea
Prior art keywords
rating
review
unit
user
positive
Prior art date
Application number
KR1020200013465A
Other languages
English (en)
Other versions
KR20210099739A (ko
Inventor
정동윤
Original Assignee
정동윤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정동윤 filed Critical 정동윤
Priority to KR1020200013465A priority Critical patent/KR102351745B1/ko
Publication of KR20210099739A publication Critical patent/KR20210099739A/ko
Application granted granted Critical
Publication of KR102351745B1 publication Critical patent/KR102351745B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0278Product appraisal

Abstract

본 발명은 사용자 리뷰의 분석을 통해 예측된 세부 항목에 대한 평점을 기초로 전체 평점을 재산정할 수 있는 사용자 리뷰 기반 평점 재산정 장치 및 방법을 제공하기 위한 것으로서, 분석 대상에 존재하는 사용자 리뷰 및 제1 평점을 포함하는 리뷰 데이터를 수집하는 리뷰 데이터 수집부와, 상기 리뷰 데이터 수집부에서 수집된 리뷰 텍스트 데이터 중 사용자 리뷰에서 문장 분리 및 형태소 분석을 수행하여, 불용어 처리가 된 문장을 세트로 분리하는 전처리부와, 상기 전처리부에서 분리된 각 세트당 수식어를 추출해 똑같은 수식어가 들어간 데이터베이스에 있는 리뷰들의 평점을 모은 뒤, 그 평균을 산출하는 용어사전 처리부와, 상기 용어사전 처리부에서 산출된 평균을 기준으로 긍정/부정을 분류하는 리뷰 유닛 분류부와, 상기 리뷰 유닛 분류부에서 분류된 긍정/부정정보를 이용하여 긍정 및 부정의 개수를 기반으로 제2 평점을 생성하는 평점 생성부를 포함할 수 있다.

Description

사용자 리뷰 기반 평점 재산정 장치 및 방법{User Review Based Rating Re-calculation Apparatus and Method}
본 발명은 사용자 리뷰 기반 평점 재산정 기술에 관한 것으로, 특히, 사용자 리뷰의 분석을 통해 예측된 세부 항목에 대한 평점을 기초로 전체 평점을 재산정할 수 있는 사용자 리뷰 기반 평점 재산정 장치 및 방법에 관한 것이다.
소득 수준이 향상되고, 주 5일 근무제로 시간적인 여유가 생기고, 여성의 사회 진출이 보편화됨에 따라 외식을 하는 경우가 증가하고 있다. 국민 소비 가운데 외식비가 차지하는 비중이 높아지고 있으며, 특히 식품비 가운데 절반 가까이가 외식비용이 차지하는 등 국민 경제에 있어 외식이 차지하는 비중이 점차 늘어나고 있고, 그 중요성 또한 크게 확대되고 있다.
최근 스마트폰에 설치된 주문 배달 요청 어플리케이션(이하, '배달앱')이 개발되어 대중화되고 있다. 주변 배달 음식점 검색, 음식 검색 및 집주소 입력 등을 스마트폰에 설치된 배달앱을 통해 가능하게 되었다.
이때, 각 음식점을 이용하는데 있어 이전 구매자가 남긴 리뷰나 평점을 중요한 정보로 참고하는 것은 보편화 되어 있다. 따라서 배달앱의 경우, 음식점 이용 예정자에게 다른 사용자들의 평점 및 사용자 리뷰를 제공하고 있다.
그리고 최근에는 이러한 사용자 리뷰들을 자동으로 리뷰 마이닝을 수행하여 리뷰에 대한 긍정/부정에 대한 어휘 정보를 분석하고, 각 음식점의 평점을 자동으로 제공하고 있다.
이때, 기존의 연구들은 평점과 함께 문서 전체에 대해 또는 문장 단위로 긍정/부정 오피니언을 판단하였다.
그러나 사용자가 특정 음식이나 서비스에 대해 전체적으로 부정적인 인상을 받았지만 특정 평가요소에 대해서는 긍정적인 리뷰를 작성할 수 있다. 예를 들어, 사용자가 특정 음식점에 대해 전체적으로 부정적인 인상을 받았지만, 이 음식점은 양은 많다고 리뷰를 작성할 수 있다.
또한, 사용자가 전체적으로 부정적인 리뷰를 작성한 후, 평점에 있어서는 실수로 리뷰의 내용과 상반되게 별 5개로 만점을 줄 수도 있다. 또는 그 반대로 모든 부분에 대해서 매우 긍정적인 리뷰를 작성한 후, 평점에 있어서는 별 1개로 나쁨을 선택할 수도 있다.
또한, 긍정/부정에 있어서 동일한 정도의 리뷰를 작성한 경우에도 평가하는 사용자에 따라 별을 4개의 평점을 주는 사용자가 있는가 하면, 별 2개의 평점을 주는 사용자도 있어, 리뷰와 평점 간에 형평성(equity)이 없게 되는 문제점이 발생될 수 있다.
이러한 문제점으로 인해, 무엇에 대한 오피니언인지, 평가 대상과 오피니언을 정확하게 연결하는 것이 매우 중요하다.
기존 한국 등록특허공보 제10-1319413호 "제품 및 서비스 관련 리뷰에 대한 요약 정보 생성 시스템 및 방법"의 경우, 제품 또는 서비스가 속하는 도메인과 관련된 단서 단어를 자동으로 추출하고, 각 평가요소별 오피니언 정보를 추출하여, 평가요소별 오피니언 정보를 포함하는 리뷰 요약 정보를 생성하는 것을 개시하고 있다. 하지만, 리뷰 데이터 내에서 평가요소와 관련된 단어와 오피니언에 관련된 단어가 동시에 발생하는 빈도만을 이용하고 있어, 리뷰와 평점 간의 오류에 대한 문제점을 해결할 수 없다는 점에서 한계를 지닌다.
기존 한국공개특허 제10-2011-0044112호 "상품 속성별 리뷰의 마이닝을 위한 패턴 데이터베이스의 반자동적인 구축 방법"의 경우, 상품의 속성별로 사용되는 어휘에 대한 긍정/부정 여부를 사전에 구축해 놓은 뒤에 이를 통해 새로운 문장에 대해 긍정/부정으로 분류를 수행하는 방법으로 상품평 패턴 사전을 구축하는 것을 개시하고 있다. 하지만, 상품에 대한 구체적인 평가요소별 오피니언을 구축하는 것에 대해서는 개시하고 있지 않다.
또한, 기존 논문 "k-Structure를 이용한 한국어 상품평 단어 추출 방법"의 경우, 한국어 상품평 중 감정어를 자동으로 추출할 수 있도록 하는 k-Structure 기법을 제안하고 있으나, "좋다/나쁘다"의 직접적인 표현만을 추출할 수 있을 뿐, 연어 형태로 구성된 긍정/부정 표현을 찾아낼 수 없다.
논문 "오피니언 마이닝 기술을 이용한 효율적 상품평 검색 기법"의 경우, 사용자의 검색어뿐만 아니라 상품평 내의 주관적인 의견의 포함 여부 및 감정 극성의 엔트로피 등을 고려하여 상품평의 가치를 판단하지만, 긍정 및 부정의 의미를 반영하는 단어 목록을 구축하는 수작업을 수행하며, 평가요소와 오피니언 간의 연결 관계에 대해서 분석하지 못하였다.
논문 "상품평 극성 분류를 위한 특징별 서술어 긍정/부정 사전 자동 구축"의 경우, 상품평에서 제품 특징을 추출한 후 상품평에 존재하는 평점을 활용하여 도메인별로 초기 긍정/부정 서술어를 추출하고, 초기 긍정/부정 서술어와 접속 정보를 분석함으로써 도메인별로 긍정/부정 사전을 구축한다. 하지만, 이 논문은 키워드를 추출하기 위하여 사용자 별점을 이용하고, 수작업으로 이루어진다는 점에서 한계를 지닌다.
한국 등록특허공보 제10-1319413호 (등록일자 2013.10.11.) 한국 공개특허공보 제10-2011-0044112호 (공개일자 2011.04.28.)
k-Structure를 이용한 한국어 상품평 단어 자동 추출 방법(강한훈, 유성준, 한동일, 한국정보과학회논문지 소프트웨어 및 응용 v.37 no.6, pp.470-479, 2010) 오피니언 마이닝 기술을 이용한 효율적 상품평 검색 기법(윤홍준, 김한준, 장재영, 한국정보과학회논문지, 컴퓨팅의 실제 및 레터, v.16, no.2, pp.222-226, 2010) 상품평 극성 분류를 위한 특징별 서술어 긍정/부정 사전 자동 구축(송종석, 이수원, 한국정보과학회논문지, 소프트웨어 및 응용, v.38, no3, pp.157-169, 2011)
따라서 본 발명은 상기와 같은 문제점을 해결하기 위해 안출한 것으로서, 사용자 리뷰의 분석을 통해 예측된 세부 항목에 대한 평점을 기초로 전체 평점을 재산정할 수 있는 사용자 리뷰 기반 평점 재산정 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명은 사용자가 작성한 사용자 리뷰와 반하는 평점이 평가된 경우의 오류들을 고려하여 더욱 정확한 총평점이 도출될 수 있도록 하는 사용자 리뷰 기반 평점 재산정 장치 및 방법을 제공하는데 그 목적이 있다.
본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 사용자 리뷰 기반 평점 재산정 장치의 특징은 분석 대상에 존재하는 사용자 리뷰 및 제1 평점을 포함하는 리뷰 데이터를 수집하는 리뷰 데이터 수집부와, 상기 리뷰 데이터 수집부에서 수집된 리뷰 텍스트 데이터 중 사용자 리뷰에서 문장 분리 및 형태소 분석을 수행하여, 불용어 처리가 된 문장을 세트로 분리하는 전처리부와, 상기 전처리부에서 분리된 각 세트당 수식어를 추출해 똑같은 수식어가 들어간 데이터베이스에 있는 리뷰들의 평점을 모은 뒤, 그 평균을 산출하는 용어사전 처리부와, 상기 용어사전 처리부에서 산출된 평균을 기준으로 긍정/부정을 분류하는 리뷰 유닛 분류부와, 상기 리뷰 유닛 분류부에서 분류된 긍정/부정정보를 이용하여 긍정 및 부정의 개수를 기반으로 제2 평점을 생성하는 평점 생성부를 포함할 수 있다.
바람직하게 상기 사용자 리뷰 기반 평점 재산정 장치는 상기 리뷰 데이터 수집부에서 수집된 리뷰 텍스트 데이터 중 제1 평점을 추출하는 평점 추출부와, 상기 평점 생성부에서 생성한 제2 평점과 상기 평점 추출부에서 추출한 제1 평점을 서로 비교하고, 그 차이가 미리 설정된 설정값 이내인지 여부를 판단하는 평점 처리부와, 상기 제1 평점 및 제2 평점 간의 차이가 설정값 이상이면, 상기 용어사전 처리부에서 텍스트 분석을 위한 유사도를 판단하는 제1 기준값의 범위를 더 넓게 설정된 제2 기준값으로 변경하는 관계 추출부와, 상기 평점 처리부에서 판단된 제2 평점 및 제1 평점의 차이가 설정값 미만으로 판단되면, 제1 평점을 총평점으로 산정하고, 상기 평점 처리부에서 판단된 제2 평점 및 제1 평점의 차이가 설정값 이상으로 판단되면, 제2 평점 및 제1 평점의 평균을 총평점으로 산정하는 평점 산정부를 더 포함할 수 있다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 사용자 리뷰 기반 평점 재산정 방법의 특징은 (A) 리뷰 데이터 수집부를 이용하여 분석 대상에 존재하는 리뷰 데이터를 수집하는 단계와, (B) 전처리부를 이용하여 상기 수집된 리뷰 텍스트 데이터 중 사용자 리뷰에서 문장 분리 및 형태소 분석을 수행하여, 불용어 처리가 된 문장을 세트로 분리하는 단계와, (C) 용어사전 처리부를 이용하여 상기 전처리부에서 분리된 각 세트당 수식어를 추출해 똑같은 수식어가 들어간 데이터베이스에 있는 리뷰들의 평점을 모은 뒤, 그 평균을 산출하는 단계와, (D) 리뷰 유닛 분류부를 이용하여 산출된 평균을 기준으로 긍정/부정을 분류하는 단계와, (E) 평점 생성부를 이용하여 상기 각 평가기준별로 분류된 긍정/부정정보를 기반으로 긍정 및 부정의 개수를 반영하여 제2 평점을 생성하는 단계를 포함할 수 있다.
바람직하게 상기 (E) 단계 이후에, (F) 평점 추출부를 이용하여 상기 수집된 리뷰 텍스트 데이터 중 사용자가 평가한 제1 평점을 추출하는 단계와, (G) 평점 처리부를 이용하여 상기 생성한 제2 평점과 상기 추출한 제1 평점을 서로 비교하는 단계와, (H) 상기 (G) 단계의 비교결과, 상기 제1 평점 및 상기 제2 평점 간의 차이가 설정값 이상이면, 관계 추출부를 이용하여 상기 텍스트 분석 방법에서 유사도를 판단하는 제1 기준값의 범위를 더 넓게 설정된 제2 기준값으로 변경한 후, 상기 (C) 단계부터 다시 수행하는 단계와, (I) 상기 (G) 단계의 비교결과, 상기 제1 평점 및 상기 제2 평점 간의 차이가 설정값 미만으로 판단되면, 평점 산정부를 이용하여 상기 제1 평점을 총평점으로 산정하는 단계와, (J) 상기 (G) 단계의 비교결과, 상기 제1 평점 및 상기 제2 평점 간의 차이가 설정값 이상으로 판단되면, 평점 산정부를 이용하여 상기 제1 평점 및 상기 제2 평점의 평균값을 총평점으로 산정하는 단계를 포함할 수 있다.
이상에서 설명한 바와 같은 본 발명에 따른 사용자 리뷰 기반 평점 재산정 장치 및 방법은 다음과 같은 효과가 있다.
첫째, 기본적으로 문장 단위의 분석을 사용하되 사용자의 평점을 추가 적용하여 문장을 선별적으로 사용함으로써, 분석의 용이성과 결과의 신뢰성 측면에서 우수성을 나타내는 효과가 있다.
둘째, 사용자가 번거롭게 직접 평점을 입력하지 않아도 되고, 인공지능(AI)에서 직접 리뷰의 내용 자체를 기반으로 그 긍정도/부정도를 분석해 별점을 도출하기 때문에 더욱 정확한 총평점이 도출될 수 있다.
셋째, 총평점은 사용자가 그 배달앱 음식점에서 음식을 주문할 것인지 결정하는 중요한 요소 중 하나이기 때문에 정확한 총평점은 더욱 나은 배달앱의 신뢰와 유저의 편의성으로 이어질 수 있다.
넷째, 배달앱을 중심으로 소개되었지만, 여타의 쇼핑정보 사이트, 나아가서는 사용자의 리뷰를 다루는 모든 사이트의 개선에 적용될 수 있을 것으로 기대한다. 특히, 기존의 리뷰를 자동으로 구분하여 평점을 도출하는 과정을 포함하고 있기 때문에, 벼로의 평가기준을 갖고 있지 않은 기존 사이트의 리뷰 제공 체계 개선에도 크게 기여할 수 있다.
상술한 효과와 더불어 본 발명의 구체적인 효과는 이하 발명을 실시하기 위한 구체적인 사항을 설명하면서 함께 기술한다.
도 1은 본 발명의 실시예에 따른 사용자 리뷰 기반 평점 재산정 장치의 구성을 나타낸 블록도이다.
도 2는 본 발명의 실시예에 따른 사용자 리뷰 기반 평점 재산정 방법을 설명하기 위한 흐름도이다.
도 3은 도 2에서 나타내는 오류 중 배달앱을 통해 주문한 사용자가 자신이 작성한 사용자 리뷰와는 반하는 평점으로 평가한 경우를 나타낸 실시예이다.
본 발명의 다른 목적, 특성 및 이점들은 첨부한 도면을 참조한 실시예들의 상세한 설명을 통해 명백해질 것이다.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
본 발명에 따른 사용자 리뷰 기반 평점 재산정 장치 및 방법의 바람직한 실시예에 대하여 첨부한 도면을 참조하여 설명하면 다음과 같다. 그러나 본 발명은 이하에서 개시되는 실시예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예는 본 발명의 개시가 완전하도록하며 통상의 지식을 가진자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
이하에서 구성요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 상기 구성요소들은 서로 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성요소 사이에 다른 구성요소가 "개재"되거나, 각 구성요소가 다른 구성요소를 통해 "연결", "결합" 또는 "접속"될 수도 있는 것으로 이해되어야 할 것이다.
도 1은 본 발명의 실시예에 따른 사용자 리뷰 기반 평점 재산정 장치의 구성을 나타낸 블록도이다. 도 1에 도시된 사용자 리뷰 기반 평점 재산정 장치는 일 실시예에 따른 것이고, 그 구성요소들이 도 1에 도시된 실시예에 한정되는 것은 아니며, 필요에 따라 일부 구성요소가 부가, 변경 또는 삭제될 수 있다.
도 1에서 도시하고 있는 것과 같이, 본 발명의 사용자 리뷰 기반 평점 재산정 장치는 리뷰 데이터 수집부(100)와, 전처리부(200)와, 용어사전 처리부(300)와, 리뷰 유닛 분류부(400)와, 평점 생성부(500)와, 평점 추출부(600)와, 평점 처리부(700)와, 관계 추출부(800)와, 평점 산정부(900)를 포함할 수 있다.
리뷰 데이터 수집부(100)는 분석 대상에 존재하는 리뷰 데이터를 수집하여 저장한다. 그리고 리뷰 데이터 수집부(100)는 상기 분석 대상에 리뷰 데이터가 추가되는 경우 추가되는 리뷰 데이터만을 다시 수집한다. 이때, 리뷰 데이터는 음식점 등의 분석 대상을 이용한 후 남긴 이용 후기(사용자 리뷰) 및 제1 평점(사용자 별점)을 포함할 수 있다.
전처리부(200)는 리뷰 데이터 수집부(100)에서 수집된 리뷰 텍스트 데이터 중 사용자 리뷰에서 문장 분리 및 형태소를 분리하고 그에 따른 태깅을 실시한다. 문장 분리는 마침표와 같은 문장 부호에 기반하여 수행되며, 형태소 분석은 총 10개의 품사 집합을 가지고 있는 국민대 형태소 분석기(http://nlp.kookmin.ac.kr/HAM/kor/index.html) Korean Language Technology (KLT)를 이용하여 수행될 수 있다. 이때, 형태소 분석은 하나의 실시예일 뿐, 이에 한정되지는 않으며 현재 공지되어 있는 다양한 형태소 분석기 또는 자연어처리기법(natural language sentiment) 알고리즘을 이용하여 수행될 수 있다.
이어서, 전처리부(200)는 해당 태깅이 된 형태소들 중 불용어(검색엔진이 무시해버리는 형태소들로, 은, 는, 이, 가, 을, 를, 기타 등등이 있다) 처리를 실시하며 컴퓨터의 연산 속도를 늦추고 AI의 오해의 소지를 제공하는 불용어들을 제거한 후, 표준어로 모두 바꿔준다. 다음으로는 전처리부(200)는 이렇게 불용어 처리가 된 문장을 [수식어 + 동사/명사] 혹은 [동사/명사 + 수식어]의 세트들로 분리하는 작업을 진행합니다. 각 세트는 무조건 1가지의 평가요소를 포함하고 있어야 한다. 그렇지 않을 시 해당 세트는 무시되는데, 예외적으로 동사나 형용사, 수식어가 평가요소의 의미를 직접적으로 내포하고 있는 경우 세트로 유지된다.
용어사전 처리부(300)는 각 세트당 수식어를 추출해 똑같은 수식어가 들어간 데이터베이스에 있는 리뷰들의 평점을 모은 뒤, 그 평균을 산출한다. 이 작업은 bag of words 기법을 사용하여 벡터화 된 데이터를 사용한다. 그리고 그 평균을 3점을 기준으로 최소 -1, 최대 1 까지 환산한 값이 해당 세트의 긍부정도이고, 그것은 곧 해당 리뷰에서 그 세트에 들어간 평가요소의 긍부정도일 수 있다. 긍정적이면 +1, 부정적이면 -1을 무조건 부여하는 기존 방법과는 다르게, 본 발명은 bag of words 기법까지 겸용하기 때문에 단어의 긍정도의 정도까지 파악할 수 있는 장점이 있다.
이렇게 파악한 데이터를 사용한다면 해당 리뷰의 평점은 각 세트들의 긍정도를 모두 합한 값을 별점으로 치환한 값이 되고, 각 평가요소별로 판단된 긍정도는 모여 그 식당의 해당 평가요소에 대한 긍정도가 되고, 해당 식당의 총평점은 그 평가요소들의 긍정도의 평균이 된다.
리뷰 유닛 분류부(400)는 용어사전 처리부(300)에서 산출된 평균을 기준으로 긍정/부정을 분류한다. 이때, 긍정/부정은 학습데이터로 학습데이터 DB(10)에 미리 저장되어 있으며, 학습데이터와의 유사도 분석을 통해 긍정 또는 부정 등을 식별할 수 있다. 그리고 평가기준에 대한 사항은 음식의 양, 맛, 가격, 배달의 시간, 친절도, 포장상태, 서비스 등을 포함할 수 있다.
평점 생성부(500)는 리뷰 유닛 분류부(400)에서 분류된 긍정/부정정보를 이용하여 긍정 및 부정의 평균을 기반으로 제2 평점을 생성할 수 있다.
일반적으로 총 평점의 정의는 모든 판단 요소들의 전체적인 평점을 아우르는 최종적인 것으로서, 아무리 한 판단 요소에 대한 긍정적인 평가가 많고 다른 판단 요소에 대해서는 긍정적인 평가가 무척 적더라도 모든 평가 요소가 같은 비율로 총평점을 계산하는 데에 기여 되어야 한다. 따라서, 총평점이 계산될 때, 예를 들어 맛에 대한 긍정적인 평가가 900개, 부정적인 평가가 100개인 반면, 위생에 대한 긍정적인 평가가 1개, 부정적인 평가가 9개라면 이 두 평가 요소를 아우르는 총평점은 901:101 로 약 90%에 육박하는 긍정도가 나오게 된다. 이렇게 되면 좋지 않은 위생에 대한 평가는 완전히 묻혀버리게 될 것이다. 하지만 실제로 사용자들이 원하는 총평점은 모른 평가요소를 골고루 반영한 평점이다. 따라서 평점 생성부(500)는 모든 요소들의 긍부정 평가 횟수를 기반으로 비율을 매기는 것이 아니라, 각 평가 요소들의 평균으로, 즉 위에서 서술한 예로는 맛은 90%의 긍정도, 위생은 10%의 긍정도를 가지고 있기 때문에 그 평균인 총평점으로 50%의 긍정도를 가지고 있다고 분석한다.
평점 추출부(600)는 리뷰 데이터 수집부(100)에서 수집된 리뷰 텍스트 데이터 중 제1 평점(사용자 별점)을 추출한다.
평점 처리부(700)는 상기 평점 생성부(500)에서 생성한 제2 평점과 상기 평점 추출부(600)에서 추출한 제1 평점을 서로 비교하고, 그 차이가 미리 설정된 설정값 이내인지 여부를 판단한다.
이때, 평점 생성부(500)에서 생성한 제2 평점은 사용자 리뷰의 내용을 기반으로 생성된 평점이며, 평점 추출부(600)에서 추출된 제1 평점은 해당 사용자 리뷰를 작성한 사용자가 평가한 평점이다. 따라서 제2 평점과 제1 평점의 차이가 설정값 이상으로 나타난다면, 이는 생성된 제2 평점에 문제가 있거나, 또는 사용자가 평가한 평점에 문제가 있는 것으로 판단할 수 있다.
제2 평점에 문제가 있는 경우는 평정 생성부(500)에서 평점을 생성할 때 분류된 긍정/부정정보에 문제가 있는 것으로 판단할 수 있다. 이는 리뷰 유닛 분류부(400)에서 긍정/부정 서술어를 분류함에 있어, 분류된 단어에 오류가 있는 경우에 발생될 수 있다.
또는, 제1 평점에 문제가 있는 경우는 사용자가 자신이 작성한 사용자 리뷰와는 반하는 평점으로 평가한 경우이다. 예로서, 작성한 사용자 리뷰에는 해당 음식점에 대해 부정적인 내용 없이 매우 긍정적인 내용으로만 작성한 이후에 평점에서는 매우 안 좋은 별 1점으로 평가하거나, 반대로, 작성한 사용자 리뷰에는 해당 음식점에 대해 긍정적인 내용 없이 매우 부정적인 내용으로만 작성한 이후에 평점에서는 매우 좋은 별 5점으로 평가한 경우에 해당될 수 있다.
그러나 사용자가 자신이 작성한 사용자 리뷰와 반하는 평점으로 평가한 경우는 사용자가 평점을 선택할 때 실수로 잘못 평가한 경우도 있지만, 사용자 리뷰에서는 부정적인 내용만을 기재하였지만, 기재하지 않았지만 긍정적인 부분이 있음에 따라, 마음적으로 평점을 높게 평가하는 경우도 있을 수 있다. 따라서 사용자 리뷰와 반하는 평점을 평가하였다고 해서 무조건 사용자가 평가한 평점이 잘못되었다고 판단되면 또 다른 오류를 발생시킬 수 있게 된다.
본 발명은 이러한 여러 가지의 오류들을 고려함에 따라 더욱 정확한 총평점이 도출될 수 있도록 하는데 그 특징이 있다.
이러한 오류를 고려하기 위해, 관계 추출부(800)는 상기 평점 처리부(700)에서의 비교 결과, 제1 평점 및 제2 평점 간의 차이가 설정값 이상이면, 상기 용어사전 처리부(300)에서 텍스트 분석을 위한 유사도를 판단하는 제1 기준값의 범위를 더 넓게 설정된 제2 기준값을 이용할 수 있다. 이에 따라, 용어사전 처리부(300)는 텍스트 분석 방법(BOW, Word2Vec, TF-IDF)을 통해 유사도가 제2 기준값 이상일 경우에 특정 단어와 유사하다 판단하여 해당 단어를 판단된 해당 평가기준으로 분류한다.
그리고 리뷰 유닛 분류부(400)는 다시 용어사전 처리부(300)에서 제2 기준값을 이용하여 평가기준별로 분류된 단어를 통해 긍정/부정 서술어를 추출하고, 추출된 긍정/부정 서술어를 분석함으로써 각 평가기준별 긍정/부정을 재분류한다.
그리고 평점 생성부(500)는 리뷰 유닛 분류부(400)에서 각 평가기준별로 재분류된 긍정/부정정보를 이용하여 긍정 및 부정의 평균을 기반으로 제3 평점을 생성한다.
이어서, 평점 처리부(700)는 상기 평점 생성부(500)에서 생성한 제3 평점과 상기 평점 추출부(600)에서 추출한 제1 평점을 다시 비교하고, 그 차이가 미리 설정된 설정값 이내인지 여부를 재판단 한다.
평점 산정부(900)는 평점 처리부(700)에서 판단된 제2 평점 및 제1 평점의 차이, 또는 제3 평점 및 제1 평점의 차이가 설정값 이내로 판단되면, 제1 평점을 총평점으로 산정할 수 있다. 그리고 평점 산정부(900)는 평점 처리부(700)에서 판단된 제2 평점 및 제1 평점의 차이, 또는 제3 평점 및 제1 평점의 차이가 설정값 이상으로 판단되면, 제2 평점 및 제1 평점의 평균, 또는 제3 평점 및 제1 평점의 평균값을 총평점으로 산정할 수 있다.
이처럼, 평점 생성부(500)에서 생성된 평점과 평점 추출부(600)에서 추출된 사용자가 평가한 평점이 설정값 이내이면, 사용자가 평가한 평점을 총평점으로 산정함으로써, 산정되는 총평점을 사용자의 의견이 적극 반영될 수 있다.
한편, 평점 생성부(500)에서 생성된 평점과 평점 추출부(600)에서 추출된 사용자가 평가한 평점이 설정값 이내이면, 위에서 설명하고 있는 여러 가지의 오류들을 고려할 수 있도록 상기 생성된 평점과 상기 추출된 평점의 평균값을 총평점으로 산정함으로써, 산정되는 총평점의 오류를 보완하여 더욱 정확한 총평점이 도출될 수 있다.
이와 같이 구성된 본 발명에 따른 사용자 리뷰 기반 평점 재산정 장치의 동작을 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다. 도 1과 동일한 참조부호는 동일한 기능을 수행하는 동일한 부재를 지칭한다.
도 2는 본 발명의 실시예에 따른 사용자 리뷰 기반 평점 재산정 방법을 설명하기 위한 흐름도이다.
도 2를 참조하여 설명하면, 먼저 리뷰 데이터 수집부(100)를 이용하여 분석 대상에 존재하는 리뷰 데이터를 수집한다(S10).
이때, 리뷰 데이터 수집부(100)는 상기 분석 대상에 리뷰 데이터가 추가되는 경우 추가되는 리뷰 데이터만을 다시 수집할 수 있다. 리뷰 데이터는 음식점 등의 분석 대상을 이용한 후 남긴 이용 후기(사용자 리뷰) 및 제1 평점(사용자 별점)을 포함할 수 있다.
이어서, 전처리부(200)를 이용하여 상기 수집된 리뷰 텍스트 데이터 중 사용자 리뷰에서 문장 분리 및 형태소를 분리하고 그에 따른 태깅을 실시한다(S20). 문장 분리는 마침표와 같은 문장 부호에 기반하여 수행되며, 형태소 분석은 총 10개의 품사 집합을 가지고 있는 국민대 형태소 분석기(http://nlp.kookmin.ac.kr/HAM/kor/index.html) Korean Language Technology (KLT)를 이용하여 수행될 수 있다. 이때, 형태소 분석은 하나의 실시예일 뿐, 이에 한정되지는 않으며 현재 공지되어 있는 다양한 형태소 분석기 또는 자연어처리기법(natural language sentiment) 알고리즘을 이용하여 수행될 수 있다.
그리고 전처리부(200)는 해당 태깅이 된 형태소들 중 불용어(검색엔진이 무시해버리는 형태소들로, 은, 는, 이, 가, 을, 를, 기타 등등이 있다) 처리를 실시하며 컴퓨터의 연산 속도를 늦추고 AI의 오해의 소지를 제공하는 불용어들을 제거한 후, 표준어로 모두 바꿔준다. 다음으로는 전처리부(200)는 이렇게 불용어 처리가 된 문장을 [수식어 + 동사/명사] 혹은 [동사/명사 + 수식어]의 세트들로 분리하는 작업을 진행합니다. 각 세트는 무조건 1가지의 평가요소를 포함하고 있어야 한다. 그렇지 않을 시 해당 세트는 무시되는데, 예외적으로 동사나 형용사, 수식어가 평가요소의 의미를 직접적으로 내포하고 있는 경우 세트로 유지된다.
다음으로, 용어사전 처리부(300)를 이용하여 상기 각 세트당 수식어를 추출해 똑같은 수식어가 들어간 데이터베이스에 있는 리뷰들의 평점을 모은 뒤, 그 평균을 산출한다(S30). 이 작업은 bag of words 기법을 사용하여 벡터화 된 데이터를 사용한다. 그리고 그 평균을 3점을 기준으로 최소 -1, 최대 1 까지 환산한 값이 해당 세트의 긍부정도이고, 그것은 곧 해당 리뷰에서 그 세트에 들어간 평가요소의 긍부정도일 수 있다.
이렇게 파악한 데이터를 사용한다면 해당 리뷰의 평점은 각 세트들의 긍정도를 모두 합한 값을 별점으로 치환한 값이 되고, 각 평가요소별로 판단된 긍정도는 모여 그 식당의 해당 평가요소에 대한 긍정도가 되고, 해당 식당의 총평점은 그 평가요소들의 긍정도의 평균이 된다.
다음으로, 리뷰 유닛 분류부(400)를 이용하여 상기 산출된 평균을 기준으로 긍정/부정을 분류한다(S40).
이때, 긍정/부정은 학습데이터로 학습데이터 DB(10)에 미리 저장되어 있으며, 학습데이터와의 유사도 분석을 통해 긍정 또는 부정 등을 식별할 수 있다. 그리고 평가기준에 대한 사항은 음식의 양, 맛, 가격, 배달의 시간, 친절도, 포장상태, 서비스 등을 포함할 수 있다.
다음으로, 평점 생성부(500)를 이용하여 상기 분류된 긍정/부정정보를 기반으로 긍정 및 부정의 평균을 반영하여 제2 평점을 생성할 수 있다(S50).
제2 평점을 생성할 때, 긍정 및 부정의 평균을 반영하는 것은 총 평점의 정의는 모든 판단 요소들의 전체적인 평점을 아우르는 최종적인 것으로서, 아무리 한 판단 요소에 대한 긍정적인 평가가 많고 다른 판단 요소에 대해서는 긍정적인 평가가 무척 적더라도 모든 평가 요소가 같은 비율로 총평점을 계산하는 데에 기여 되어야 한다. 예를 들어 맛에 대한 긍정적인 평가가 900개, 부정적인 평가가 100개인 반면, 위생에 대한 긍정적인 평가가 1개, 부정적인 평가가 9개라면 이 두 평가 요소를 아우르는 총평점은 901:101 로 약 90%에 육박하는 긍정도가 나오게 된다. 이렇게 되면 좋지 않은 위생에 대한 평가는 완전히 묻혀버리게 되는 문제점이 있다.하지만 실제로 유저들이 원하는 총평점은 모른 평가요소를 골고루 반영한 평점이다. 따라서 모든 요소들의 긍부정 평가 횟수를 기반으로 비율을 매길 것이 아니라, 각 평가 요소들의 평균으로, 즉 위에서 서술한 예로는 맛은 90%의 긍정도, 위생은 10%의 긍정도를 가지고 있기 때문에 그 평균인 총평점으로 50%의 긍정도를 가지고 있다고 분석하는 것이 바람직할 것이다.
한편, 평점 추출부(600)를 이용하여 상기 수집된 리뷰 텍스트 데이터 중 사용자가 평가한 제1 평점(사용자 별점)을 추출한다(S60).
그리고 평점 처리부(700)를 이용하여 상기 생성한 제2 평점과 상기 추출한 제1 평점을 서로 비교한다(S70).
이때, 평점 생성부(500)에서 생성한 제2 평점은 사용자 리뷰의 내용을 기반으로 생성된 평점이며, 평점 추출부(600)에서 추출된 제1 평점은 해당 사용자 리뷰를 작성한 사용자가 평가한 평점이다. 따라서 제2 평점과 제1 평점의 차이가 설정값 이상으로 나타난다면, 이는 생성된 제2 평점에 문제가 있거나, 또는 사용자가 평가한 평점에 문제가 있는 것으로 판단할 수 있다.
제2 평점에 문제가 있는 경우는 평정 생성부(500)에서 평점을 생성할 때 적용되는 분류된 긍정/부정정보에 문제가 있는 것으로 판단할 수 있다. 이는 리뷰 유닛 분류부(400)에서 긍정/부정 서술어를 분류함에 있어, 평가기준별로 분류된 단어에 오류가 있는 경우에 발생될 수 있다.
또는, 제1 평점에 문제가 있는 경우는 사용자가 자신이 작성한 사용자 리뷰와는 반하는 평점으로 평가한 경우이다. 예로서, 작성한 사용자 리뷰에는 해당 음식점에 대해 부정적인 내용 없이 매우 긍정적인 내용으로만 작성한 이후에 평점에서는 매우 안 좋은 별 1점으로 평가하거나, 반대로, 작성한 사용자 리뷰에는 해당 음식점에 대해 긍정적인 내용 없이 매우 부정적인 내용으로만 작성한 이후에 평점에서는 매우 좋은 별 5점으로 평가한 경우에 해당될 수 있다.
도 3은 도 2에서 나타내는 오류 중 배달앱을 통해 주문한 사용자가 자신이 작성한 사용자 리뷰와는 반하는 평점으로 평가한 경우를 나타낸 실시예이다.
도 3에서 나타내고 있는 것과 같이, 작성된 사용자 리뷰(20)에서 "시킨거 먹고 화장실만 몇 번째... 상한걸 팔면 어쩌자는 겁니까?"라고, 매우 부정적인 내용의 리뷰를 작성하고 있다. 그런데, 평가에서는 실수로 최고점인 별 5점의 평점(30)으로 평가하고 있다.
이러한 오류가 사용자들의 실수로 인해 꽤 자주, 식당마다 서너 번씩 일어나고 있다. 이렇게 되면, 특히 사용자 리뷰의 개수가 적은 식당일수록 사용자들이 배달앱에서 시킬 식당을 고르는데 가장 큰 결정요소가 되는 총평점(40)에 부정확한 영향을 끼치게 되는 문제점을 발생시킬 수 있다. 특히, 대부분의 사용자들은 시간상 리뷰의 내용을 일일이 확인하기 보다는 총평점(40)만을 확인하는 경향이 높아 이러한 문제점은 더욱 크게 나타날 수 있다.
그러나 사용자가 자신이 작성한 사용자 리뷰와 반하는 평점으로 평가한 경우는 사용자가 평점을 선택할 때 실수로 잘못 평가한 경우도 있지만, 사용자 리뷰에서는 부정적인 내용만을 기재하였지만, 기재하지 않았지만 긍정적인 부분이 있음에 따라, 마음적으로 평점을 높게 평가하는 경우도 있을 수 있다. 따라서 사용자 리뷰와 반하는 평점을 평가하였다고 해서 무조건 사용자가 평가한 평점이 잘못되었다고 판단되면 또 다른 오류를 발생시킬 수 있게 된다.
따라서 본 발명은 이러한 여러 가지의 오류들을 고려함에 따라 더욱 정확한 총평점이 도출될 수 있도록 하는데 그 특징이 있다.
이에 따라, 상기 비교결과(S60), 제1 평점 및 제2 평점 간의 차이가 설정값 이상이면, 관계 추출부(800)를 이용하여 상기 텍스트 분석 방법에서 유사도를 판단하는 제1 기준값의 범위를 더 넓게 설정된 제2 기준값으로 변경한 후, 상기 S30 단계부터 다시 반복한다. 이를 통해, 용어사전 처리부(300)는 텍스트 분석 방법(BOW, Word2Vec, TF-IDF)을 통해 유사도가 제2 기준값 이상일 경우에 특정 단어와 유사하다 판단하여 해당 단어를 판단된 해당 평가기준으로 분류할 수 있다.
상기 비교결과(S60)에 따라 상기 S30 단계부터 다시 반복하는 횟수는 적어도 한 번이다. 다만, 반복 횟수가 증가할수록 재산정되는 총평점의 정확도는 높아질 수 있으나, 총평점을 산정하는데 더 많은 시간이 소요될 수 있다. 또한, 고려되는 오류에 있어서, 장치 내의 오류가 아닌 사용자 평가의 오류인 경우는 총평점의 정확도가 높아지는 확률은 횟수가 많아지는 경우에도 크게 변화가 없을 수도 있다. 따라서 본 발명에서는 반복의 횟수를 1회로 한정하여 설명한다. 그러나 반복되는 횟수는 이에 한정되는 것은 아니다.
그리고 상기 비교 결과(S60), 제1 평점 및 제2 평점 간의 차이가 설정값 이내로 판단되면, 평점 산정부(900)를 이용하여 제1 평점을 총평점으로 산정할 수 있다(S80).
이처럼, 평점 생성부(500)에서 생성된 평점과 평점 추출부(600)에서 추출된 사용자가 평가한 평점이 설정값 이내이면, 사용자가 평가한 평점을 총평점으로 산정함으로써, 산정되는 총평점을 사용자의 의견이 적극 반영될 수 있다.
또한, 그리고 평점 산정부(900)는 제1 평점 및 제2 평점 간의 차이가 설정값 이상으로 판단되면, 평점 산정부(900)를 이용하여 제1 평점 및 제2 평점의 평균값을 총평점으로 산정할 수 있다(S90).
이처럼, 평점 생성부(500)에서 생성된 평점과 평점 추출부(600)에서 추출된 사용자가 평가한 평점이 설정값 이내이면, 위에서 설명하고 있는 여러 가지의 오류들을 고려할 수 있도록 상기 생성된 평점과 상기 추출된 평점의 평균값을 총평점으로 산정함으로써, 산정되는 총평점의 오류를 보완하여 더욱 정확한 총평점이 도출될 수 있다.
한편, 개시된 실시예에 따른 장치는 프로세서, 프로그램 데이터를 저장하고 실행하는 메모리, 디스크 드라이브와 같은 영구 저장부(permanent storage), 외부 장치와 통신하는 통신 포트, 터치 패널, 키(key), 버튼 등과 같은 사용자 인터페이스 장치 등을 포함할 수 있다. 소프트웨어 모듈 또는 알고리즘으로 구현되는 방법들은 상기 프로세서 상에서 실행 가능한 컴퓨터가 읽을 수 있는 코드들 또는 프로그램 명령들로서 컴퓨터가 읽을 수 있는 기록매체 상에 저장될 수 있다. 여기서 컴퓨터가 읽을 수 있는 기록 매체로 마그네틱 저장 매체(예컨대, ROM(read-only memory), RAM(random-access memory), 플로피 디스크, 하드 디스크 등) 및 광학적 판독 매체(예컨대, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc)) 등이 있다. 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템들에 분산되어, 분산 방식으로 컴퓨터가 판독 가능한 코드가 저장되고 실행될 수 있다.  매체는 컴퓨터에 의해 판독가능하며, 메모리에 저장되고, 프로세서에서 실행될 수 있다.
개시된 실시예에서 인용하는 공개 문헌, 특허 출원, 특허 등을 포함하는 모든 문헌들은 각 인용 문헌이 개별적으로 및 구체적으로 병합하여 나타내는 것 또는 게시된 실시예에서 전체적으로 병합하여 나타낸 것과 동일하게 개시된 실시예에 병합될 수 있다.
개시된 실시예의 이해를 위하여, 도면에 도시된 바람직한 실시예들에서 참조 부호를 기재하였으며, 개시된 실시예들을 설명하기 위하여 특정 용어들을 사용하였으나, 특정 용어에 의해 개시된 실시예가 한정되는 것은 아니며, 개시된 실시예들은 당업자에 있어서 통상적으로 생각할 수 있는 모든 구성 요소들을 포함할 수 있다.
개시된 실시예는 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 개시된 실시예는 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩업 테이블(look-up table) 등과 같은 집적회로 구성들을 채용할 수 있다. 개시된 실시예의 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 개시된 실시예는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다.  또한, 개시된 실시예는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. "매커니즘", "요소", "수단", "구성"과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다.  상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.
개시된 실시예에서 설명하는 특정 실행들은 일실시 예들로서, 어떠한 방법으로도 개시된 실시예의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다.  또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다.  또한, "필수적인", "중요하게" 등과 같이 구체적인 언급이 없다면 개시된 실시예의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다. 또한, 본 발명의 기술적 분야의 통상의 지식을 가진자라면 본 발명의 기술적 사상의 범위 내에서 다양한 실시예가 가능함을 이해할 수 있을 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
10: 학습 데이터 DB 20: 사용자 리뷰
30: 평점 40: 총평점
100: 리뷰 데이터 수집부 200: 전처리부
300: 용어사전 처리부 400: 리뷰 유닛 분류부
500: 평점 생성부 600: 평점 추출부
700: 평점 처리부 800: 관계 추출부
900: 평점 산정부

Claims (4)

  1. 분석 대상에 존재하는 사용자 리뷰 및 제1 평점을 포함하는 리뷰 데이터를 수집하는 리뷰 데이터 수집부와,
    상기 리뷰 데이터 수집부에서 수집된 리뷰 텍스트 데이터 중 사용자 리뷰에서 문장 분리 및 형태소 분석을 수행하여, 불용어 처리가 된 문장을 세트로 분리하는 전처리부와,
    상기 전처리부에서 분리된 각 세트당 수식어를 추출해 똑같은 수식어가 들어간 데이터베이스에 있는 리뷰들의 평점을 모은 뒤, 그 평균을 산출하는 용어사전 처리부와,
    상기 용어사전 처리부에서 산출된 평균을 기준으로 긍정/부정을 분류하는 리뷰 유닛 분류부와,
    상기 리뷰 유닛 분류부에서 분류된 긍정/부정정보를 이용하여 긍정 및 부정의 개수를 기반으로 제2 평점을 생성하는 평점 생성부와,
    상기 리뷰 데이터 수집부에서 수집된 리뷰 텍스트 데이터 중 제1 평점을 추출하는 평점 추출부와,
    상기 평점 생성부에서 생성한 제2 평점과 상기 평점 추출부에서 추출한 제1 평점을 서로 비교하고, 그 차이가 미리 설정된 설정값 이내인지 여부를 판단하는 평점 처리부와,
    상기 제1 평점 및 제2 평점 간의 차이가 설정값 이상이면, 상기 용어사전 처리부에서 텍스트 분석을 위한 유사도를 판단하는 제1 기준값의 범위를 더 넓게 설정된 제2 기준값으로 변경하는 관계 추출부와,
    상기 평점 처리부에서 판단된 제2 평점 및 제1 평점의 차이가 설정값 미만으로 판단되면, 제1 평점을 총평점으로 산정하고, 상기 평점 처리부에서 판단된 제2 평점 및 제1 평점의 차이가 설정값 이상으로 판단되면, 제2 평점 및 제1 평점의 평균을 총평점으로 산정하는 평점 산정부를 포함하는 사용자 리뷰 기반 평점 재산정 장치.
  2. 삭제
  3. (A) 리뷰 데이터 수집부를 이용하여 분석 대상에 존재하는 리뷰 데이터를 수집하는 단계와,
    (B) 전처리부를 이용하여 상기 수집된 리뷰 텍스트 데이터 중 사용자 리뷰에서 문장 분리 및 형태소 분석을 수행하여, 불용어 처리가 된 문장을 세트로 분리하는 단계와,
    (C) 용어사전 처리부를 이용하여 상기 전처리부에서 분리된 각 세트당 수식어를 추출해 똑같은 수식어가 들어간 데이터베이스에 있는 리뷰들의 평점을 모은 뒤, 그 평균을 산출하는 단계와,
    (D) 리뷰 유닛 분류부를 이용하여 산출된 평균을 기준으로 긍정/부정을 분류하는 단계와,
    (E) 평점 생성부를 이용하여 상기 분류된 긍정/부정정보를 기반으로 긍정 및 부정의 개수를 반영하여 제2 평점을 생성하는 단계와,
    (F) 평점 추출부를 이용하여 상기 수집된 리뷰 텍스트 데이터 중 사용자가 평가한 제1 평점을 추출하는 단계와,
    (G) 평점 처리부를 이용하여 상기 생성한 제2 평점과 상기 추출한 제1 평점을 서로 비교하는 단계와,
    (H) 상기 (G) 단계의 비교결과, 상기 제1 평점 및 상기 제2 평점 간의 차이가 설정값 이상이면, 관계 추출부를 이용하여 텍스트 분석을 위한 유사도를 판단하는 제1 기준값의 범위를 더 넓게 설정된 제2 기준값으로 변경한 후, 상기 (C) 단계부터 다시 수행하는 단계와,
    (I) 상기 (G) 단계의 비교결과, 상기 제1 평점 및 상기 제2 평점 간의 차이가 설정값 미만으로 판단되면, 평점 산정부를 이용하여 상기 제1 평점을 총평점으로 산정하는 단계와,
    (J) 상기 (G) 단계의 비교결과, 상기 제1 평점 및 상기 제2 평점 간의 차이가 설정값 이상으로 판단되면, 평점 산정부를 이용하여 상기 제1 평점 및 상기 제2 평점의 평균값을 총평점으로 산정하는 단계를 포함하는 사용자 리뷰 기반 평점 재산정 방법.
  4. 삭제
KR1020200013465A 2020-02-05 2020-02-05 사용자 리뷰 기반 평점 재산정 장치 및 방법 KR102351745B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200013465A KR102351745B1 (ko) 2020-02-05 2020-02-05 사용자 리뷰 기반 평점 재산정 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200013465A KR102351745B1 (ko) 2020-02-05 2020-02-05 사용자 리뷰 기반 평점 재산정 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20210099739A KR20210099739A (ko) 2021-08-13
KR102351745B1 true KR102351745B1 (ko) 2022-01-17

Family

ID=77313617

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200013465A KR102351745B1 (ko) 2020-02-05 2020-02-05 사용자 리뷰 기반 평점 재산정 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102351745B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102384763B1 (ko) 2021-11-08 2022-04-08 농업회사법인 주식회사 유비무환 사용자의 위치정보를 기반으로 지역 인증을 통한 각 지역별 업체 리뷰제공시스템
KR102520248B1 (ko) * 2022-06-30 2023-04-10 주식회사 애자일소다 주요 구절 추출을 이용한 관련리뷰 필터링 장치 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101975419B1 (ko) 2018-11-26 2019-05-07 (주)위세아이텍 빅데이터 분석을 위한 비정형 텍스트 데이터의 용어 군집화 장치 및 방법
KR102047385B1 (ko) 2018-09-21 2019-11-21 삼성생명보험주식회사 챗봇 구동 방법, 장치 및 컴퓨터 판독가능 매체

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110044112A (ko) 2009-10-22 2011-04-28 건국대학교 산학협력단 상품 속성별 리뷰의 마이닝을 위한 패턴 데이터베이스의 반자동적인 구축 방법
KR101319413B1 (ko) * 2012-01-10 2013-10-17 한국과학기술연구원 제품 및 서비스 관련 리뷰에 대한 요약 정보 생성 시스템 및 방법
KR101842361B1 (ko) * 2016-09-01 2018-03-26 성균관대학교산학협력단 리뷰 데이터의 감성을 분류하기 위한 방법 및 장치
KR20180080492A (ko) * 2017-01-04 2018-07-12 (주)프람트테크놀로지 사용자 리뷰를 이용한 상품 평가 시스템 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102047385B1 (ko) 2018-09-21 2019-11-21 삼성생명보험주식회사 챗봇 구동 방법, 장치 및 컴퓨터 판독가능 매체
KR101975419B1 (ko) 2018-11-26 2019-05-07 (주)위세아이텍 빅데이터 분석을 위한 비정형 텍스트 데이터의 용어 군집화 장치 및 방법

Also Published As

Publication number Publication date
KR20210099739A (ko) 2021-08-13

Similar Documents

Publication Publication Date Title
RU2657173C2 (ru) Сентиментный анализ на уровне аспектов с использованием методов машинного обучения
CN110232112B (zh) 文章中关键词提取方法及装置
RU2686000C1 (ru) Извлечение информационных объектов с использованием комбинации классификаторов, анализирующих локальные и нелокальные признаки
RU2635257C1 (ru) Сентиментный анализ на уровне аспектов и создание отчетов с использованием методов машинного обучения
RU2636098C1 (ru) Использование глубинного семантического анализа текстов на естественном языке для создания обучающих выборок в методах машинного обучения
CN103870973A (zh) 基于电子信息的关键词提取的信息推送、搜索方法及装置
RU2601166C2 (ru) Разрешение анафоры на основе технологии глубинного анализа
US11893537B2 (en) Linguistic analysis of seed documents and peer groups
Moghaddam et al. Opinion polarity identification through adjectives
CN110287405B (zh) 情感分析的方法、装置和存储介质
KR101319413B1 (ko) 제품 및 서비스 관련 리뷰에 대한 요약 정보 생성 시스템 및 방법
KR102351745B1 (ko) 사용자 리뷰 기반 평점 재산정 장치 및 방법
RU2665261C1 (ru) Восстановление текстовых аннотаций, связанных с информационными объектами
CN114997288A (zh) 一种设计资源关联方法
Touahri et al. Deep analysis of an Arabic sentiment classification system based on lexical resource expansion and custom approaches building
JPH1049543A (ja) 文書検索装置
US11783129B2 (en) Interactive control system, interactive control method, and computer program product
Song et al. A lexical updating algorithm for sentiment analysis on Chinese movie reviews
JP6375367B2 (ja) 反論生成方法,反論生成システム
CN111814025A (zh) 一种观点提取方法及装置
WO2016189594A1 (ja) 不満情報処理装置及びシステム
Thamizharasi et al. An approach to product rating based on aspect ranking in opinion mining
Ferret et al. A bootstrapping approach for robust topic analysis
JP3939264B2 (ja) 形態素解析装置
JP7138981B1 (ja) 類似度判定装置、類似度判定システム、類似度判定方法、およびプログラム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant