KR20210023452A - 속성 단위 리뷰 분석 장치 및 방법 - Google Patents

속성 단위 리뷰 분석 장치 및 방법 Download PDF

Info

Publication number
KR20210023452A
KR20210023452A KR1020190103646A KR20190103646A KR20210023452A KR 20210023452 A KR20210023452 A KR 20210023452A KR 1020190103646 A KR1020190103646 A KR 1020190103646A KR 20190103646 A KR20190103646 A KR 20190103646A KR 20210023452 A KR20210023452 A KR 20210023452A
Authority
KR
South Korea
Prior art keywords
review
attribute
unit
word
attributes
Prior art date
Application number
KR1020190103646A
Other languages
English (en)
Other versions
KR102310487B1 (ko
Inventor
최진영
김현조
Original Assignee
주식회사 리뷰쉐어
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 리뷰쉐어 filed Critical 주식회사 리뷰쉐어
Priority to KR1020190103646A priority Critical patent/KR102310487B1/ko
Publication of KR20210023452A publication Critical patent/KR20210023452A/ko
Application granted granted Critical
Publication of KR102310487B1 publication Critical patent/KR102310487B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

리뷰 데이터로부터 리뷰 대상의 속성들을 추출하여 속성 별로 감성 분석을 수행할 수 있는 속성 단위 리뷰 분석 장치 및 방법, 기록 매체가 개시된다. 본 발명의 실시예에 따른 속성 단위 리뷰 분석 방법은, 리뷰 속성 정의부에 의해, 다양한 리뷰 대상들의 카테고리 및 상기 리뷰 대상들 각각의 속성들을 정의하는 단계; 단어군집 생성부에 의해, 워드 임베딩에 의해 단어들을 벡터화하고 군집화하여 단어 군집을 생성하는 단계; 근접단어 추출부에 의해, 리뷰 대상의 속성 별로 상기 단어 군집에서 각 속성과 관련된 근접 단어들을 추출하는 단계; 리뷰 텍스트 추출부에 의해, 리뷰 데이터에서 상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 리뷰 텍스트를 추출하는 단계; 및 감성 분석부에 의해, 상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 상기 리뷰 텍스트를 감성 분석하는 단계를 포함한다.

Description

속성 단위 리뷰 분석 장치 및 방법{APPARATUS AND METHOD FOR REVIEW ANALYSIS PER ATTRIBUTE}
본 발명은 속성 단위 리뷰 분석 장치 및 방법에 관한 것으로, 보다 상세하게는 리뷰 데이터로부터 리뷰 대상의 속성들을 추출하고 속성 별로 감성 분석을 수행하는 속성 단위 리뷰 분석 장치 및 방법에 관한 것이다.
온라인 쇼핑몰, 소셜 네트워크 서비스(SNS; Social Network Service), 블로그 등에서 사용자들의 상품평을 분석하여 마케팅에 활용하거나, 상품 개발 등을 하기 위한 목적으로, 사용자들의 리뷰 데이터에서 사용자의 긍정, 부정적인 감정을 분석하는 감성 분석(Sentimental Analysis)이 수행되고 있다. 종래의 감성 분석은 리뷰 텍스트(Review Text) 전체의 긍정/부정 여부를 판단하는데 그치고 있으며 이로 인해 여러 문제점이 발생한다. 예를 들어, 하나의 리뷰 텍스트에 리뷰 대상과 관련하여 3개의 긍정적 평가와 1개의 부정적 평가가 포함되어 있는 경우에, 종래의 감정 분석은 해당 리뷰 텍스트에 대해 긍정적인 감정 평가 결과로 분류하게 된다. 이와 같이 단순히 리뷰 텍스트에서 긍정/부정 단어의 출현 빈도를 기반으로 감성 분석을 하는 것으로는 리뷰 대상의 다양한 속성 별로 감성을 세분화하여 분석할 수 없으며, 리뷰 텍스트에 포함되어 있는 중요한 정보를 고려하지 못하고 리뷰 텍스트를 잘못 해석하는 결과를 초래할 수 있다.
본 발명은 리뷰 데이터로부터 리뷰 대상의 속성들을 추출하여 리뷰 대상의 속성 별로 감성 분석을 수행할 수 있는 속성 단위 리뷰 분석 장치 및 방법, 기록 매체를 제공하기 위한 것이다.
또한, 본 발명은 패스트텍스트(FastText) 기반의 단어 클러스터링 및 n-그램(n-gram) 기반의 감성 분석을 통해 리뷰 대상을 속성 단위로 정확하게 분석할 수 있는 속성 단위 리뷰 분석 장치 및 방법, 기록 매체를 제공하기 위한 것이다.
또한, 본 발명은 리뷰 대상의 신규 속성을 추가하거나 하위 속성들을 분류하는 속성 갱신을 통해 리뷰 대상의 다양한 속성 별로 감정 분석이 가능한 속성 단위 리뷰 분석 장치 및 방법, 기록 매체를 제공하기 위한 것이다.
본 발명의 실시예에 따른 속성 단위 리뷰 분석 방법은, 리뷰 속성 정의부에 의해, 다양한 리뷰 대상들의 카테고리 및 상기 리뷰 대상들 각각의 속성들을 정의하는 단계; 단어군집 생성부에 의해, 워드 임베딩에 의해 단어들을 벡터화하고 군집화하여 단어 군집을 생성하는 단계; 근접단어 추출부에 의해, 리뷰 대상의 속성 별로 상기 단어 군집에서 각 속성과 관련된 근접 단어들을 추출하는 단계; 리뷰 텍스트 추출부에 의해, 리뷰 데이터에서 상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 리뷰 텍스트를 추출하는 단계; 및 감성 분석부에 의해, 상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 상기 리뷰 텍스트를 감성 분석하는 단계를 포함한다.
상기 단어 군집을 생성하는 단계는 n-그램(n-gram) 기반의 패스트텍스트(FastText) 단어 클러스터링에 의해 상기 단어 군집을 생성할 수 있다.
본 발명의 실시예에 따른 속성 단위 리뷰 분석 방법은, 감정사전 구축부에 의해, 상기 속성들에 대해 감성을 평가하는 감성어를 정의하여 감정 사전을 구축하는 단계를 더 포함할 수 있다. 상기 리뷰 텍스트를 감성 분석하는 단계는 상기 감정 사전에서 상기 속성 별로 감성어를 추출하여 감성을 분석할 수 있다.
상기 리뷰 텍스트를 감성 분석하는 단계는 n-그램(n-gram)을 기반으로 상기 속성 별로 감성을 분석할 수 있다. 상기 속성들은 리뷰 대상 상품 또는 서비스의 성능, 디자인, 배송 품질, 및 비용 중의 적어도 2 이상을 포함할 수 있다.
본 발명의 실시예에 따른 속성 단위 리뷰 분석 방법은, 리뷰 속성 갱신부에 의해, 상기 리뷰 대상들에 정의되지 않은 신규 속성을 추가하여 상기 리뷰 대상들의 속성들을 갱신하는 단계를 더 포함할 수 있다. 상기 속성들을 갱신하는 단계는, 상기 리뷰 대상 별로, 상기 리뷰 데이터에서 상기 리뷰 대상들의 속성을 나타내는 속성 단어들을 추출하는 단계; 상기 속성 단어들 중 리뷰 속성 정의부에 의해 미리 정의된 속성들 또는 상기 근접 단어들과의 유사도가 기준값보다 낮은 신규 속성 단어들을 추출하는 단계; 상기 신규 속성 단어들을 패스트텍스트(FastText) 단어 클러스터링에 의해 군집화하는 단계; 및 상기 리뷰 대상 별로 군집 단위로 속성명을 추가하여 상기 리뷰 대상 별로 속성들을 갱신하는 단계를 포함할 수 있다.
본 발명의 실시예에 따른 속성 단위 리뷰 분석 방법은, 리뷰 속성 갱신부에 의해, 상기 리뷰 대상의 속성들 중의 적어도 하나의 속성을 하위 속성들로 분류하는 단계를 더 포함할 수 있다. 상기 하위 속성들로 분류하는 단계는, 상기 리뷰 텍스트에 상기 리뷰 대상의 리뷰 대상 속성에 대한 긍정 감성 평가와 부정 감성 평가가 모두 포함되어 있는지를 판단하는 단계; 상기 리뷰 텍스트에서 상기 긍정 감성 평가와 관련된 제1 단어와 상기 부정 감성 평가와 관련된 제2 단어를 각각 추출하는 단계; 및 상기 제1 단어 및 상기 제2 단어를 기반으로, 상기 리뷰 대상 속성을 상기 긍정 감성 평가와 관련된 제1 하위 속성과 상기 부정 감성 평가와 관련된 제2 하위 속성으로 분류하는 단계를 포함할 수 있다.
본 발명의 실시예에 따르면, 상기 속성 단위 리뷰 분석 방법을 실행하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체가 제공된다.
본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치는, 다양한 리뷰 대상들의 카테고리 및 상기 리뷰 대상들 각각의 속성들을 정의하는 리뷰 속성 정의부; 워드 임베딩에 의해 단어들을 벡터화하고 군집화하여 단어 군집을 생성하는 단어군집 생성부; 리뷰 대상의 속성 별로 상기 단어 군집에서 각 속성과 관련된 근접 단어들을 추출하는 근접단어 추출부; 리뷰 데이터에서 상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 리뷰 텍스트를 추출하는 리뷰 텍스트 추출부; 및 상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 상기 리뷰 텍스트를 감성 분석하는 감성 분석부를 포함한다.
상기 단어군집 생성부는 n-그램(n-gram) 기반의 패스트텍스트(FastText) 단어 클러스터링에 의해 상기 단어 군집을 생성할 수 있다.
본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치는, 상기 속성들에 대해 감성을 평가하는 감성어를 정의하여 감정 사전을 구축하는 감정사전 구축부를 더 포함할 수 있다. 상기 감정사전 구축부는 상기 감정 사전에서 상기 속성 별로 감성어를 추출하여 감성을 분석할 수 있다.
상기 감성 분석부는 n-그램(n-gram)을 기반으로 상기 속성 별로 감성을 분석할 수 있다. 상기 속성들은 리뷰 대상 상품 또는 서비스의 성능, 디자인, 배송 품질, 및 비용 중의 적어도 2 이상을 포함할 수 있다.
본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치는, 상기 리뷰 대상들에 정의되지 않은 신규 속성을 추가하여 상기 리뷰 대상들의 속성들을 갱신하는 리뷰 속성 갱신부를 더 포함할 수 있다. 상기 리뷰 속성 갱신부는, 상기 리뷰 대상 별로, 상기 리뷰 데이터에서 상기 리뷰 대상들의 속성을 나타내는 속성 단어들을 추출하고; 상기 속성 단어들 중 리뷰 속성 정의부에 의해 미리 정의된 속성들 또는 상기 근접 단어들과의 유사도가 기준값보다 낮은 신규 속성 단어들을 추출하고; 상기 신규 속성 단어들을 패스트텍스트(FastText) 단어 클러스터링에 의해 군집화하고; 그리고 상기 리뷰 대상 별로 군집 단위로 속성명을 추가하여 상기 리뷰 대상 별로 속성들을 갱신하도록 구성될 수 있다.
본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치는, 상기 리뷰 대상의 속성들 중의 적어도 하나의 속성을 하위 속성들로 분류하는 리뷰 속성 갱신부를 더 포함할 수 있다. 상기 리뷰 속성 갱신부는, 상기 리뷰 텍스트에 상기 리뷰 대상의 리뷰 대상 속성에 대한 긍정 감성 평가와 부정 감성 평가가 모두 포함되어 있는지를 판단하고; 상기 리뷰 텍스트에서 상기 긍정 감성 평가와 관련된 제1 단어와 상기 부정 감성 평가와 관련된 제2 단어를 각각 추출하고; 그리고 상기 제1 단어 및 상기 제2 단어를 기반으로, 상기 리뷰 대상 속성을 상기 긍정 감성 평가와 관련된 제1 하위 속성과 상기 부정 감성 평가와 관련된 제2 하위 속성으로 분류하도록 구성될 수 있다.
본 발명의 실시예에 의하면, 리뷰 데이터로부터 리뷰 대상의 속성들을 추출하여 속성 별로 감성 분석을 수행할 수 있는 속성 단위 리뷰 분석 장치 및 방법, 기록 매체가 제공된다.
또한, 본 발명의 실시예에 의하면, 패스트텍스트(FastText) 기반의 단어 클러스터링(Clustering) 및 n-그램(n-gram) 기반의 감성 분석을 통해 리뷰 대상을 속성 단위로 세분화하여 정확하게 분석할 수 있다.
또한, 본 발명의 실시예에 의하면, 리뷰 데이터를 기반으로 리뷰 대상의 신규 속성을 추가하거나 속성을 하위 속성들로 분류하는 속성 갱신을 통해 리뷰 대상의 다양한 속성 별로 감정 분석을 수행할 수 있다.
도 1은 본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치의 구성도이다.
도 2는 본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치의 세부 구성도이다.
도 3은 본 발명의 실시예에 따른 속성 단위 리뷰 분석 방법의 순서도이다.
도 4는 도 3에 도시된 속성 단위 리뷰 분석 방법을 구성하는 단계 S190의 구체적인 순서도이다.
도 5는 도 3에 도시된 속성 단위 리뷰 분석 방법을 구성하는 단계 S190의 다른 실시예에 따른 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
본 명세서에서, 어떤 부분이 어떤 구성요소를 '포함'한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 본 명세서에서 사용되는 '~부'는 적어도 하나의 기능이나 동작을 처리하는 단위로서, 예를 들어 소프트웨어, FPGA 또는 하드웨어 구성요소를 의미할 수 있다. '~부'에서 제공하는 기능은 복수의 구성요소에 의해 분리되어 수행되거나, 다른 추가적인 구성요소와 통합될 수도 있다. 본 명세서의 '~부'는 반드시 소프트웨어 또는 하드웨어에 한정되지 않으며, 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고, 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다.
본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치 및 방법은 단순히 리뷰 데이터에서 리뷰 대상에 대한 긍정/부정과 같은 감성 분석을 하는 것이 아니라, 리뷰 대상의 속성들을 추출하여 속성 단위의 감성 분석을 수행한다. 예를 들어, 리뷰 대상 상품이 스마트폰인 경우, 리뷰 대상의 속성은 해당 스마트폰의 성능, 스크린, 무게와 같은 리뷰 대상의 다양한 특징을 의미한다.
속성 단위의 감성 분석을 하기 위해서는 우선 리뷰 대상이 어떤 속성으로 구성되어 있는지 속성명을 추출한 다음, 각각의 속성에 따른 감성어를 찾아 그 감성어가 긍정에 해당하는지, 혹은 부정에 해당하는지를 분류하는 과정이 필요하다. 본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치 및 방법은 패스트텍스트(FastText)를 이용한 단어 클러스터링(단어들의 벡터화 및 군집화)을 통해 리뷰 데이터 또는 리뷰 텍스트를 여러 속성의 문장으로 분류하고, 속성에 따른 감성어를 찾아내어 리뷰 대상의 각 속성 별로 감성 분석을 실시할 수 있다. 이하에서는 도면을 참조하여 본 발명의 실시예에 대해서 구체적으로 설명하기로 한다.
도 1은 본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치의 구성도이다. 도 1을 참조하면, 본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치(100)는 리뷰어(Reviewer)가 온라인 쇼핑몰이나 소셜 네트워크 서비스(SNS; Social Network Service), 블로그 등에 작성한 리뷰 데이터에서 리뷰 대상 별로 정의된 다양한 속성(예를 들어, 리뷰 대상 상품 또는 서비스의 성능, 디자인, 배송 품질, 비용 등) 별로 리뷰 텍스트를 추출하고, 다양한 속성 별로 리뷰 텍스트를 감성 분석할 수 있다.
도 2는 본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치의 세부 구성도이다. 도 3은 본 발명의 실시예에 따른 속성 단위 리뷰 분석 방법의 순서도이다. 도 1 내지 도 3을 참조하면, 본 발명의 실시예에 따른 속성 단위 리뷰 분석 장치(100)는 리뷰 속성 정의부(110), 감정사전 구축부(120), 리뷰 데이터 수집부(130), 전처리부(140), 단어군집 생성부(150), 근접단어 추출부(160), 리뷰 텍스트 추출부(170), 감성 분석부(180) 및 리뷰속성 갱신부(190)를 포함할 수 있다.
리뷰 대상에 대한 속성별 감성 평가를 위해, 리뷰 속성 정의부(110)는 다양한 리뷰 대상들(리뷰 대상 상품/서비스)의 카테고리 및 리뷰 대상들 각각의 속성들을 정의할 수 있다(S110). 리뷰 대상의 속성들은 리뷰 대상 상품 또는 서비스마다 가지는 고유 속성으로, 예를 들어 리뷰 대상 상품 또는 서비스의 성능, 디자인, 배송 품질, 및 비용 중의 적어도 2 이상을 포함할 수 있다.
리뷰 대상의 속성들은 리뷰 대상 별로 상이하게 정의될 수 있다. 리뷰 속성 정의부(110)는 리뷰 대상에 관하여 작성된 리뷰 데이터나 리뷰 데이터 이외의 다양한 데이터를 기반으로 리뷰 대상의 속성들을 정의할 수 있다. 실시예에서, 리뷰 대상의 속성들은 패스트텍스트(FastText) 기반의 단어 클러스터링에 의해 군집화되어 정의될 수 있으며, 군집 별로 대표 속성명이 부여되고, 대표 속성명과 벡터 거리가 근접한 순으로 근접 단어들이 정의될 수 있다. 속성들은 속성 단위 리뷰 분석 장치(100)를 관리하는 관리자의 도메인 지식을 활용하여 관리자가 직접 부여하거나 수정하는 것도 가능하다.
감정사전 구축부(120)는 리뷰 대상의 속성들에 대해 각각 감성을 평가하는 감성어들을 정의하여 감정 사전을 구축할 수 있다(S120). 예를 들어, 리뷰 대상이 스마트폰이고, 리뷰 대상의 속성이 스마트폰의 무게인 경우, 해당 속성에 대한 감성어는 '가볍다', '경량', '무겁다' 등으로 정의될 수 있다. 감정사전 구축부(120)는 리뷰 데이터나 리뷰 데이터 이외의 다양한 데이터를 기반으로 감정 사전을 구축할 수 있다.
감정 사전은 n-그램(n-gram) 기반으로 정의될 수 있다. 예를 들어, "It's good, not bad at all", "It's bad, not good at all"과 같은 상반된 의미의 문장에 대해 긍정/부정 감성 평가를 정확하게 하기 위하여, 감정사전 구축부(120)는 n개의 토큰(Token)을 사용하는 n-그램을 기반으로 단어의 순서를 반영하는 감성어를 정의하여 감정 사전을 구축할 수 있다.
리뷰 데이터 수집부(130)는 리뷰 데이터를 수집할 수 있다. 리뷰 데이터 수집부(130)는 크롤링(Crawling)에 의해 다양한 리뷰 대상에 관하여 작성된 리뷰 데이터를 수집할 수 있다(S130). 리뷰 데이터 수집부(130)는 SNS/쇼핑몰/자체보유 리뷰들의 패턴 별로 비정형 데이터 파싱을 수행하고 수집된 리뷰 데이터를 저장할 수 있다.
전처리부(140)는 리뷰 데이터 수집부(130)에 의해 수집된 리뷰 데이터의 문장들에 대해 형태소 분석을 수행하고, 전처리(불용어 제거, 어근 추출 등)를 수행할 수 있다(S140). 전처리부(140)는 리뷰 데이터에서 의미 없는 단어 토큰을 제거함으로써 불용어를 제거하고, 유의미한 단어 토큰만을 선별할 수 있으며, 유의미한 단어의 기본 형태인 어근을 추출할 수 있다.
속성 단위의 리뷰 분석을 위하여, 단어군집 생성부(150)는 워드 임베딩(Word Embedding)에 의해 단어들을 벡터화하고 군집화하여 단어 군집을 생성할 수 있다(S150). 단어군집 생성부(150)는 리뷰 데이터 또는 리뷰 데이터 이외의 학습 데이터를 기반으로 단어 군집을 생성할 수 있다. 단어군집 생성부(150)는 n-그램(n-gram) 기반의 패스트텍스트(FastText) 단어 클러스터링에 의해 단어 군집을 생성할 수 있다.
자연어를 컴퓨터가 이해하고, 효율적으로 처리하게 하기 위해 컴퓨터가 이해할 수 있도록 자연어를 적절히 변환할 필요가 있다. 그러기 위해서 단어들의 벡터화가 필요하며, 대표적인 방법으로 'Word2Vec'과 'FastText'가 있다. 패스트텍스트(FastText)는 워드 임베딩 및 텍스트 분류를 학습하기 위한 라이브러리로, 단어를 벡터로 만드는 방법 중 하나이다. 패스트텍스트는 단어를 쪼개질 수 없는 단위로 생각하는 'Word2vec'과 달리 하나의 단어 안에 여러 단어들이 존재하는 것으로 간주하며, 단어 안의 여러 단어들(subword)을 고려한 학습을 수행한다.
'FastText'에서, 각 단어는 n개의 연속적인 단어 나열을 의미하는 n-그램으로 나타낼 수 있다. n을 몇으로 결정하는 지에 따라서 단어들이 얼마나 분리되는지가 결정될 수 있다. 예를 들어, n = 3에 해당하는 트라이그램(tri-gram)의 경우, 각 단어는 3개의 내부단어들로 분리되어 임베딩될 수 있다.
'Word2Vec'과 달리, 'FastText'는 내부단어(subword), 모르는 단어(Out of Vocabulary)에 대해서도 다른 단어와의 유사도를 계산할 수 있다. 예를 들어, '배터리충전'이라는 단어를 학습하지 않은 상태라고 할 때, 다른 단어의 n-그램으로 '배터리'와 '충전'을 학습한 적이 있다면, '배터리충전'의 임베딩 벡터를 만들 수 있다.
n-그램을 통해 벡터화된 단어들의 유클리디언 거리(Euclidean Distance)와 같은 벡터 거리(vector distance)를 기준으로 클러스터링을 진행하여 유사 단어들의 군집을 만들 수 있다. 예를 들어, '배송', '택배', '디자인', '성능' 등의 속성은 아래와 같이 벡터화될 수 있으며, 벡터 거리가 근접한 단어들은 근접 단어들로 군집화될 수 있다.
Figure pat00001
근접단어 추출부(160)는 리뷰 대상의 속성 별로, 단어군집 생성부(150)에 의해 생성된 단어 군집에서 각 속성과 관련된 근접 단어들(유사 단어들)을 선택, 추출할 수 있다(S160). 근접단어 추출부(160)는 패스트텍스트(FastText) 단어 군집에서 유사한 근접 단어들을 추출할 수 있다.
근접단어 추출부(160)는 벡터화된 단어를 통해 단어들의 군집을 기반으로 속성 별로 관련된 유사 단어들을 반환할 수 있다. 근접단어 추출부(160)는 예를 들어, '무게' 속성에 관하여 '중량', '질량' 등의 근접 단어들을 단어 군집에서 추출할 수 있다. 근접단어 추출부(160)에 의해 추출된 근접 단어들은 리뷰 데이터의 속성 별 분리에 활용될 수 있다.
리뷰 텍스트 추출부(170)는 리뷰 데이터에서 추출된 속성들과 각각 관련된 근접 단어들과의 유사도를 기반으로, 속성 별로 리뷰 텍스트를 추출할 수 있다(S170). 리뷰 텍스트 추출부(170)는 근접 단어들과 리뷰 데이터의 각 문장들 간의 유사도를 측정하여 문장들을 속성 별로 분류하여 속성 별로 리뷰 텍스트를 추출할 수 있다.
감성 분석부(180)는 감성어와 관련된 근접 단어들과의 유사도를 기반으로 속성 별로 리뷰 텍스트를 감성 분석할 수 있다(S180). 감성 분석부(180)는 감정 사전에서 속성 별로 감성어를 추출하여 감성을 분석할 수 있다. 감성 분석(Sentiment Analysis)은 텍스트 정보를 추출하는 텍스트 마이닝과는 다르게 어떤 주제에 대한 주관적인 인상, 감정, 태도, 개인의 의견들을 분석하는 방법이다. 감성 분석부(180)는 찬성/반대, 좋음/싫음 같이 2진형식으로 감성 분석 결과를 나타낼 수 있으며, 주어진 텍스트에서 긍정, 부정 혹은 중립 등을 파악하여 텍스트의 극성(polarity)를 알아내거나, 분노, 슬픔, 기쁨 같은 감정 상태도 분석할 수 있다.
감성 분석부(180)는 n-그램(n-gram)을 기반으로 속성 별로 감성을 분석할 수 있다. BOW(bags of words)는 텍스트 데이터를 표현하는 방법 중 하나로 가장 간단하여 기계 학습에 널리 쓰인다. 하지만 오타, 줄임말 등의 단어들에 대해 처리 불가능한 문제와 단어의 순서가 무시되는 단점이 존재한다.
예를 들어, "It's good, not bad at all", "It's bad, not good at all"과 같은 문장들은 그 의미가 상반되지만, BOW를 이용해 처리하면 동일 결과를 반환하게 된다. 이러한 단점을 보완하기 위해, 보다 개선된 n-그램을 사용하여 감성 분석을 수행할 수 있다. BOW는 하나의 토큰을 사용하지만 n-그램은 n개의 토큰을 사용하여 단어의 순서를 반영한다. 예를 들어, “good, not bad”와 “bad, not good”을 BOW와 tri-gram을 사용하여 처리하면 아래와 같다.
BOW: [good, not, bad], [bad, not, good]
tri-gram: [good not bad], [bad not good]
BOW를 사용하면 "It's good, not bad at all", "It's bad, not good at all"의 두 문장은 같은 벡터의 값을 갖지만, tri-gram을 사용하면 3개의 단어의 배열을 고려하여 학습을 하게 되므로, 단어의 순서를 고려하여 감성어를 학습할 수 있다. 따라서, n-그램은 부정어나 강조 부사와 같이, 2 이상의 단어들로 이루어진 감성 표현을 인식하는데 효과적일 수 있다.
상술한 바와 같이, 본 발명의 실시예에 의하면, 리뷰 데이터로부터 리뷰 대상의 속성들을 추출하여 리뷰 대상의 속성 별로 감성 분석을 수행할 수 있다. 또한, 본 발명의 실시예에 의하면, 패스트텍스트(FastText) 기반의 단어 클러스터링 및 n-그램(n-gram) 기반의 감성 분석을 통해 리뷰 대상을 속성 단위로 정확하게 분석할 수 있다.
도 4는 도 3에 도시된 속성 단위 리뷰 분석 방법을 구성하는 단계 S190의 구체적인 순서도이다. 도 1 내지 도 4를 참조하면, 리뷰 속성 갱신부(190)는 리뷰 데이터에서 추출한 속성 단어들을 분석하여, 리뷰 대상들에 정의되지 않은 신규 속성을 추가하여 리뷰 대상들의 속성들을 갱신할 수 있다(S190).
리뷰 속성 갱신부(190)는 예를 들어, 리뷰 대상이 스마트폰인 경우, 리뷰 데이터에 '폴딩 주름'에 관한 속성 단어가 추출되었으나, 스마트폰에 관하여 '폴딩 주름' 속성이 정의되어 있지 않은 경우, 스마트폰에 관하여 '폴딩 주름' 속성을 추가하여 스마트폰에 정의된 속성들을 갱신할 수 있다.
리뷰 속성의 갱신을 위해, 리뷰 속성 갱신부(190)는 먼저 리뷰 대상 별로, 리뷰 데이터에서 리뷰 대상들의 속성을 나타내는 속성 단어들을 추출할 수 있다(S191). 리뷰 속성 갱신부(190)는 속성 단어들 중 리뷰 속성 정의부(110)에 의해 미리 정의된 속성들(속성명들) 또는 속성명들과 관련된 단어 군집의 근접 단어들과의 유사도가 미리 설정된 기준값보다 낮은 신규 속성 단어들을 추출할 수 있다(S192). 리뷰 속성 정의부(110)에 정의된 속성들과 리뷰 데이터에서 추출된 속성 단어들 간의 유사도는 예를 들어, 유클리디언 거리와 같은 벡터 거리를 기반으로 산출될 수 있다.
유사한 속성들이 상이한 속성명으로 중복 정의되는 것을 방지하기 위하여, 리뷰 속성 갱신부(190)는 리뷰 데이터에서 추출된 신규 속성 단어들을 패스트텍스트(FastText) 단어 클러스터링에 의해 군집화할 수 있다(S193). 리뷰 속성 갱신부(190)는 리뷰 대상 별로 군집 단위로 대표 속성명을 추가하여 리뷰 대상 별로 속성들을 갱신할 수 있다(S194).
도 4에 도시된 실시예에 의하면, 리뷰 데이터를 기반으로 리뷰 대상의 신규 속성을 추가하는 속성 갱신을 통해 리뷰 대상의 다양한 속성 별로 감성 분석을 수행할 수 있다. 따라서, 폴더형 스마트폰과 같이 새로운 유형의 리뷰 대상이 출현하더라도, 그와 관련된 속성을 업데이트함으로써, 리뷰 대상에 대해 다양한 속성 별로 감성 분석을 할 수 있다.
도 5는 도 3에 도시된 속성 단위 리뷰 분석 방법을 구성하는 단계 S190의 다른 실시예에 따른 순서도이다. 도 1 내지 도 3, 및 도 5를 참조하면, 리뷰 속성 갱신부(190)는 리뷰 데이터에서 추출된 리뷰 대상의 속성들 중의 적어도 하나의 속성을 하위 속성들로 분류할 수 있다.
리뷰 속성의 갱신을 위해, 리뷰 속성 갱신부(190)는 먼저 리뷰 데이터에 리뷰 대상의 리뷰 대상 속성에 대한 긍정 감성 평가와 부정 감성 평가가 모두 포함되어 있는지를 판단할 수 있다(S195). 리뷰 속성 갱신부(190)는 리뷰 텍스트에서 긍정 감성 평가와 관련된 제1 단어와 부정 감성 평가와 관련된 제2 단어를 각각 추출할 수 있다(S196).
리뷰 속성 갱신부(190)는 긍정 감성 평가와 관련하여 추출한 제1 단어 및 부정 감성 평가와 관련하여 추출된 제2 단어를 기반으로, 리뷰 대상 속성을 긍정 감성 평가와 관련된 제1 하위 속성과 부정 감성 평가와 관련된 제2 하위 속성으로 분류할 수 있다(S197).
예를 들어, 자동차의 디자인 속성에 관하여, 긍정적 감성 평가와 관련하여 '내부', '내장' 등의 단어가 추출되고, 부정적 감성 평가와 관련하여 '외부', '외장' 등의 단어가 추출되는 경우, 자동차의 디자인 속성을 '외장 디자인'과 '내장 디자인'의 하위 속성들로 분류할 수 있다. 도 5에 도시된 실시예에 의하면, 리뷰 데이터를 기반으로 리뷰 대상의 속성을 하위 속성들로 세분화하여 분류하는 속성 갱신을 통해, 리뷰 대상에 대해 다양한 속성 및 하위 속성 별로 감성 분석을 할 수 있다.
본 발명의 실시예에 의하면, 리뷰 데이터로부터 속성 단어별 감성 분석을 통해 제품 또는 서비스에 대한 시장 반응을 속성 별로 평가할 수 있으며, 디자인, 배송, 활용도, 비용 등과 같이 다양한 속성에 대한 감성 평가를 제공함으로써 리뷰 대상에 대해 보다 세분화된 평가 결과를 제공할 수 있으며, 리뷰 전체의 감성 평가에서 벗어나 속성 별로 세분화하여 감성 평가를 수행하여 리뷰 분석 시의 오류를 최소화할 수 있다.
또한, 본 발명의 실시예에 의하면, 시장 현황이나 경쟁업체의 활동, 소비자 트렌드를 속성 별로 상세하게 추적할 수 있으며, 수집되는 리뷰 데이터를 바탕으로 더욱 진화된 선행 학습 데이터(Pre-trained data)를 적용하여 단어 군집 및 단어 유사도의 정확도 향상이 가능하다.
또한, 본 발명의 실시예에 의하면, 리뷰의 속성별 분석을 통한 마케팅 전략을 위한 인사이트 제공이 가능하고, 관련 업체의 활동이나 관련 이슈에 대한 대중의 반응을 속성 별로 측정 가능하며, 제품/서비스에 대한 요소별 평가를 기반으로 사용자의 기호 분석이 가능하다. 또한, 사용자가 자주 사용하는 키워드와 그에 매칭되는 속성을 분석할 수 있다.
이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/ 또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(Arithmetic Logic Unit), 디지털 신호 프로세서(Digital Signal Processor), 마이크로컴퓨터, FPGA(Field Programmable Gate Array), PLU(Programmable Logic Unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다.
처리 장치는 운영 체제 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술 분야에서 통상의 지식을 가진 자는 처리 장치가 복수 개의 처리 요소(Processing Element) 및/또는 복수 유형의 처리요소를 포함할 수 있음을 이해할 것이다.
예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(Parallel Processor) 와 같은, 다른 처리 구성(Processing configuration)도 가능하다. 소프트웨어는 컴퓨터 프로그램(Computer Program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.
소프트웨어 및/ 또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody) 될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CDROM, DVD와 같은 광기록 매체(optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.
100: 속성 단위 리뷰 분석 장치
110: 리뷰 속성 정의부
120: 감정사전 구축부
130: 리뷰 데이터 수집부
140: 전처리부
150: 단어군집 생성부
160: 근접단어 추출부
170: 리뷰 텍스트 추출부
180: 감성 분석부
190: 리뷰속성 갱신부

Claims (15)

  1. 리뷰 속성 정의부에 의해, 다양한 리뷰 대상들의 카테고리 및 상기 리뷰 대상들 각각의 속성들을 정의하는 단계;
    단어군집 생성부에 의해, 워드 임베딩에 의해 단어들을 벡터화하고 군집화하여 단어 군집을 생성하는 단계;
    근접단어 추출부에 의해, 리뷰 대상의 속성 별로 상기 단어 군집에서 각 속성과 관련된 근접 단어들을 추출하는 단계;
    리뷰 텍스트 추출부에 의해, 리뷰 데이터에서 상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 리뷰 텍스트를 추출하는 단계; 및
    감성 분석부에 의해, 상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 상기 리뷰 텍스트를 감성 분석하는 단계를 포함하는 속성 단위 리뷰 분석 방법.
  2. 제1항에 있어서,
    상기 단어 군집을 생성하는 단계는 n-그램(n-gram) 기반의 패스트텍스트(FastText) 단어 클러스터링에 의해 상기 단어 군집을 생성하는 속성 단위 리뷰 분석 방법.
  3. 제1항에 있어서,
    감정사전 구축부에 의해, 상기 속성들에 대해 감성을 평가하는 감성어를 정의하여 감정 사전을 구축하는 단계를 더 포함하고,
    상기 리뷰 텍스트를 감성 분석하는 단계는 상기 감정 사전에서 상기 속성 별로 감성어를 추출하여 감성을 분석하는 속성 단위 리뷰 분석 방법.
  4. 제1항에 있어서,
    상기 리뷰 텍스트를 감성 분석하는 단계는 n-그램(n-gram)을 기반으로 상기 속성 별로 감성을 분석하는 속성 단위 리뷰 분석 방법.
  5. 제1항에 있어서,
    상기 속성들은 리뷰 대상 상품 또는 서비스의 성능, 디자인, 배송 품질, 및 비용 중의 적어도 2 이상을 포함하는 속성 단위 리뷰 분석 방법.
  6. 제1항에 있어서,
    리뷰 속성 갱신부에 의해, 상기 리뷰 대상들에 정의되지 않은 신규 속성을 추가하여 상기 리뷰 대상들의 속성들을 갱신하는 단계를 더 포함하고,
    상기 속성들을 갱신하는 단계는,
    상기 리뷰 대상 별로, 상기 리뷰 데이터에서 상기 리뷰 대상들의 속성을 나타내는 속성 단어들을 추출하는 단계;
    상기 속성 단어들 중 리뷰 속성 정의부에 의해 미리 정의된 속성들 또는 상기 근접 단어들과의 유사도가 기준값보다 낮은 신규 속성 단어들을 추출하는 단계;
    상기 신규 속성 단어들을 패스트텍스트(FastText) 단어 클러스터링에 의해 군집화하는 단계; 및
    상기 리뷰 대상 별로 군집 단위로 속성명을 추가하여 상기 리뷰 대상 별로 속성들을 갱신하는 단계를 포함하는 속성 단위 리뷰 분석 방법.
  7. 제1항에 있어서,
    리뷰 속성 갱신부에 의해, 상기 리뷰 대상의 속성들 중의 적어도 하나의 속성을 하위 속성들로 분류하는 단계를 더 포함하고,
    상기 하위 속성들로 분류하는 단계는,
    상기 리뷰 텍스트에 상기 리뷰 대상의 리뷰 대상 속성에 대한 긍정 감성 평가와 부정 감성 평가가 모두 포함되어 있는지를 판단하는 단계;
    상기 리뷰 텍스트에서 상기 긍정 감성 평가와 관련된 제1 단어와 상기 부정 감성 평가와 관련된 제2 단어를 각각 추출하는 단계; 및
    상기 제1 단어 및 상기 제2 단어를 기반으로, 상기 리뷰 대상 속성을 상기 긍정 감성 평가와 관련된 제1 하위 속성과 상기 부정 감성 평가와 관련된 제2 하위 속성으로 분류하는 단계를 포함하는 속성 단위 리뷰 분석 방법.
  8. 제1항 내지 제7항 중 어느 한 항의 속성 단위 리뷰 분석 방법을 실행하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체.
  9. 다양한 리뷰 대상들의 카테고리 및 상기 리뷰 대상들 각각의 속성들을 정의하는 리뷰 속성 정의부;
    워드 임베딩에 의해 단어들을 벡터화하고 군집화하여 단어 군집을 생성하는 단어군집 생성부;
    리뷰 대상의 속성 별로 상기 단어 군집에서 각 속성과 관련된 근접 단어들을 추출하는 근접단어 추출부;
    리뷰 데이터에서 상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 리뷰 텍스트를 추출하는 리뷰 텍스트 추출부; 및
    상기 근접 단어들과의 유사도를 기반으로 상기 속성 별로 상기 리뷰 텍스트를 감성 분석하는 감성 분석부를 포함하는 속성 단위 리뷰 분석 장치.
  10. 제9항에 있어서,
    상기 단어군집 생성부는 n-그램(n-gram) 기반의 패스트텍스트(FastText) 단어 클러스터링에 의해 상기 단어 군집을 생성하는 속성 단위 리뷰 분석 장치.
  11. 제9항에 있어서,
    상기 속성들에 대해 감성을 평가하는 감성어를 정의하여 감정 사전을 구축하는 감정사전 구축부를 더 포함하고,
    상기 감정사전 구축부는 상기 감정 사전에서 상기 속성 별로 감성어를 추출하여 감성을 분석하는 속성 단위 리뷰 분석 장치.
  12. 제9항에 있어서,
    상기 감성 분석부는 n-그램(n-gram)을 기반으로 상기 속성 별로 감성을 분석하는 속성 단위 리뷰 분석 장치.
  13. 제9항에 있어서,
    상기 속성들은 리뷰 대상 상품 또는 서비스의 성능, 디자인, 배송 품질, 및 비용 중의 적어도 2 이상을 포함하는 속성 단위 리뷰 분석 장치.
  14. 제9항 내지 제13항 중 어느 한 항에 있어서,
    상기 리뷰 대상들에 정의되지 않은 신규 속성을 추가하여 상기 리뷰 대상들의 속성들을 갱신하는 리뷰 속성 갱신부를 더 포함하고,
    상기 리뷰 속성 갱신부는,
    상기 리뷰 대상 별로, 상기 리뷰 데이터에서 상기 리뷰 대상들의 속성을 나타내는 속성 단어들을 추출하고;
    상기 속성 단어들 중 리뷰 속성 정의부에 의해 미리 정의된 속성들 또는 상기 근접 단어들과의 유사도가 기준값보다 낮은 신규 속성 단어들을 추출하고;
    상기 신규 속성 단어들을 패스트텍스트(FastText) 단어 클러스터링에 의해 군집화하고; 그리고
    상기 리뷰 대상 별로 군집 단위로 속성명을 추가하여 상기 리뷰 대상 별로 속성들을 갱신하도록 구성되는 속성 단위 리뷰 분석 장치.
  15. 제9항 내지 제13항 중 어느 한 항에 있어서,
    상기 리뷰 대상의 속성들 중의 적어도 하나의 속성을 하위 속성들로 분류하는 리뷰 속성 갱신부를 더 포함하고,
    상기 리뷰 속성 갱신부는,
    상기 리뷰 텍스트에 상기 리뷰 대상의 리뷰 대상 속성에 대한 긍정 감성 평가와 부정 감성 평가가 모두 포함되어 있는지를 판단하고;
    상기 리뷰 텍스트에서 상기 긍정 감성 평가와 관련된 제1 단어와 상기 부정 감성 평가와 관련된 제2 단어를 각각 추출하고; 그리고
    상기 제1 단어 및 상기 제2 단어를 기반으로, 상기 리뷰 대상 속성을 상기 긍정 감성 평가와 관련된 제1 하위 속성과 상기 부정 감성 평가와 관련된 제2 하위 속성으로 분류하도록 구성되는 속성 단위 리뷰 분석 장치.
KR1020190103646A 2019-08-23 2019-08-23 속성 단위 리뷰 분석 장치 및 방법 KR102310487B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190103646A KR102310487B1 (ko) 2019-08-23 2019-08-23 속성 단위 리뷰 분석 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190103646A KR102310487B1 (ko) 2019-08-23 2019-08-23 속성 단위 리뷰 분석 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20210023452A true KR20210023452A (ko) 2021-03-04
KR102310487B1 KR102310487B1 (ko) 2021-10-08

Family

ID=75174601

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190103646A KR102310487B1 (ko) 2019-08-23 2019-08-23 속성 단위 리뷰 분석 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102310487B1 (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102363958B1 (ko) * 2021-08-05 2022-02-16 재단법인차세대융합기술연구원 이중 클러스터링 기반 소비자 인식 분석 방법, 장치 및 프로그램
KR102365875B1 (ko) * 2021-03-31 2022-02-23 주식회사 써니마인드 언어 모델을 기초로 생성된 인공신경망을 이용한 텍스트 분류 및 분석 방법 및 이를 이용한 장치
KR102502734B1 (ko) * 2022-10-07 2023-02-23 주식회사 세마그룹 환자 후기 관리를 위한 병원의 환자 만족도 평가 서비스 제공 시스템
KR20230026669A (ko) * 2021-08-18 2023-02-27 씨제이올리브영 주식회사 복수의 제품들 간의 시너지 효과를 고려한 리뷰 작성 및 ai 모델에 기반한 리뷰에 대한 시너지 효과 분석 방법 및 시스템
KR102520248B1 (ko) * 2022-06-30 2023-04-10 주식회사 애자일소다 주요 구절 추출을 이용한 관련리뷰 필터링 장치 및 방법
KR20230169538A (ko) * 2022-06-08 2023-12-18 주식회사 닉컴퍼니 금융 마이데이터 기반 기계학습을 위한 말뭉치를 이용한 거래 적요 데이터 분석 장치 및 방법과 이를 위한 컴퓨터 프로그램
KR102658456B1 (ko) * 2023-11-28 2024-04-18 주식회사 에스티이노베이션 대규모 언어 서베이 모델 기반 조사분석보고서 자동생성 시스템
KR20240121138A (ko) 2023-01-31 2024-08-08 코드크레인 유한회사 온라인 리뷰에서 시맨틱 정보를 추출하는 장치 및 방법

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230052609A (ko) * 2021-10-13 2023-04-20 주식회사 스켈터랩스 기계독해를 이용한 리뷰 분석 시스템 및 방법
KR102496212B1 (ko) 2022-06-30 2023-02-06 주식회사 애자일소다 주요 구절 추출 장치 및 그 방법
KR102538519B1 (ko) 2022-06-30 2023-05-31 주식회사 애자일소다 주요 구절 추출을 이용한 관련상품 추천 장치 및 방법
KR20240137309A (ko) * 2023-03-08 2024-09-20 네이버 주식회사 리뷰 데이터 기반의 방송용 큐 시트 생성 방법 및 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110044112A (ko) * 2009-10-22 2011-04-28 건국대학교 산학협력단 상품 속성별 리뷰의 마이닝을 위한 패턴 데이터베이스의 반자동적인 구축 방법
KR101540683B1 (ko) * 2014-10-20 2015-07-31 숭실대학교산학협력단 감정어의 극성을 분류하는 방법 및 서버
KR20190064312A (ko) * 2017-11-30 2019-06-10 삼성에스디에스 주식회사 감성 분석 방법 및 그 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110044112A (ko) * 2009-10-22 2011-04-28 건국대학교 산학협력단 상품 속성별 리뷰의 마이닝을 위한 패턴 데이터베이스의 반자동적인 구축 방법
KR101540683B1 (ko) * 2014-10-20 2015-07-31 숭실대학교산학협력단 감정어의 극성을 분류하는 방법 및 서버
KR20190064312A (ko) * 2017-11-30 2019-06-10 삼성에스디에스 주식회사 감성 분석 방법 및 그 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
텍스트 마이닝 기반의 온라인 상품 리뷰 추출을 통한 목적별 맞춤화 정보 도출 방법론 연구(2016.05.)* *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102365875B1 (ko) * 2021-03-31 2022-02-23 주식회사 써니마인드 언어 모델을 기초로 생성된 인공신경망을 이용한 텍스트 분류 및 분석 방법 및 이를 이용한 장치
KR102363958B1 (ko) * 2021-08-05 2022-02-16 재단법인차세대융합기술연구원 이중 클러스터링 기반 소비자 인식 분석 방법, 장치 및 프로그램
KR20230026669A (ko) * 2021-08-18 2023-02-27 씨제이올리브영 주식회사 복수의 제품들 간의 시너지 효과를 고려한 리뷰 작성 및 ai 모델에 기반한 리뷰에 대한 시너지 효과 분석 방법 및 시스템
KR20230169538A (ko) * 2022-06-08 2023-12-18 주식회사 닉컴퍼니 금융 마이데이터 기반 기계학습을 위한 말뭉치를 이용한 거래 적요 데이터 분석 장치 및 방법과 이를 위한 컴퓨터 프로그램
KR102520248B1 (ko) * 2022-06-30 2023-04-10 주식회사 애자일소다 주요 구절 추출을 이용한 관련리뷰 필터링 장치 및 방법
KR102502734B1 (ko) * 2022-10-07 2023-02-23 주식회사 세마그룹 환자 후기 관리를 위한 병원의 환자 만족도 평가 서비스 제공 시스템
KR20240121138A (ko) 2023-01-31 2024-08-08 코드크레인 유한회사 온라인 리뷰에서 시맨틱 정보를 추출하는 장치 및 방법
KR102658456B1 (ko) * 2023-11-28 2024-04-18 주식회사 에스티이노베이션 대규모 언어 서베이 모델 기반 조사분석보고서 자동생성 시스템

Also Published As

Publication number Publication date
KR102310487B1 (ko) 2021-10-08

Similar Documents

Publication Publication Date Title
KR102310487B1 (ko) 속성 단위 리뷰 분석 장치 및 방법
Arora et al. Character level embedding with deep convolutional neural network for text normalization of unstructured data for Twitter sentiment analysis
US10725836B2 (en) Intent-based organisation of APIs
US20180025121A1 (en) Systems and methods for finer-grained medical entity extraction
CN104350490A (zh) 用于组织与产品相关的数据的方法、装置以及计算机可读介质
US20200160196A1 (en) Methods and systems for detecting check worthy claims for fact checking
US11030402B2 (en) Dictionary expansion using neural language models
Maurya et al. Deceptive opinion spam detection approaches: a literature survey
US20230134798A1 (en) Reasonable language model learning for text generation from a knowledge graph
Addepalli et al. A proposed framework for measuring customer satisfaction and product recommendation for ecommerce
Shilov et al. Machine learning for enterprise modeling assistance: an investigation of the potential and proof of concept
CN113204643B (zh) 一种实体对齐方法、装置、设备及介质
Trisal et al. K-RCC: A novel approach to reduce the computational complexity of KNN algorithm for detecting human behavior on social networks
WO2022039803A1 (en) Identifying noise in verbal feedback using artificial text from non-textual parameters and transfer learning
US20240028952A1 (en) Apparatus for attribute path generation
Sun et al. A scenario model aggregation approach for mobile app requirements evolution based on user comments
KR102299618B1 (ko) 리뷰 광고 매칭 장치 및 방법
US11829386B2 (en) Identifying anonymized resume corpus data pertaining to the same individual
Haripriya et al. Detection of sarcasm from consumer sentiments on social media about luxury brands
Shanmugam et al. Twitter sentiment analysis using novelty detection
Pinto et al. Intelligent and fuzzy systems applied to language & knowledge engineering
Maltseva et al. Social media sentiment analysis with context space model
singh et al. Context-Based Persuasion Analysis of Sentiment Polarity Disambiguation in Social Media Text Streams
CN116453702B (zh) 孤独症行为特征集的数据处理方法、设备、系统及介质
CN116910175B (zh) 自动化移动设备故障层级树构建方法、装置及储存介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right