KR20240009192A - 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법 - Google Patents

딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법 Download PDF

Info

Publication number
KR20240009192A
KR20240009192A KR1020220086360A KR20220086360A KR20240009192A KR 20240009192 A KR20240009192 A KR 20240009192A KR 1020220086360 A KR1020220086360 A KR 1020220086360A KR 20220086360 A KR20220086360 A KR 20220086360A KR 20240009192 A KR20240009192 A KR 20240009192A
Authority
KR
South Korea
Prior art keywords
emotional
attribute
product
words
word
Prior art date
Application number
KR1020220086360A
Other languages
English (en)
Other versions
KR102646613B1 (ko
Inventor
서효원
우제혁
정민규
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020220086360A priority Critical patent/KR102646613B1/ko
Publication of KR20240009192A publication Critical patent/KR20240009192A/ko
Application granted granted Critical
Publication of KR102646613B1 publication Critical patent/KR102646613B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 개시는 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법을 제공하며, 상품평 데이터로부터의 토큰들에서 적어도 하나의 속성과 적어도 하나의 감성어를 추출하고, 속성과 감성어 사이의 관계 세트를 구축하고, 관계 세트에 기반하여 속성에 대한 감성 점수를 평가하며, 속성에 대한 감정 점수를 고객 요구사항으로 활용하여, 신규 제품의 대안 설계를 수행하도록 구성될 수 있다.

Description

딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법{COMPUTER DEVICE FOR ASPECT-BASED SENTIMENT ANALYSIS ON CUSTOMER ONLINE REVIEW BASED ON DEEP LEARNING AND FOR APPLICATION TO PRODUCT DEVELOPMENT, AND METHOD OF THE SAME}
본 개시는 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법에 관한 것이다.
온라인 쇼핑몰이 점차 확대되면서 소비자들은 자신들이 구매한 제품에 대한 상품평을 남겨 판매자 및 다른 소비자들과 제품에 대한 경험을 공유하며 소통하고 있다. 온라인 상품평 관련 데이터가 급증하면서 해당 빅 데이터는 추후 제품 개발 과정에 큰 도움을 줄 수 있을 것이라 기대되고 있다.
제품 개발자들은 고객의 소리(voice of customer; VOC)를 획득하기 위해, 일반 사용자들에게 설문 조사를 진행하거나 전문 테스트 집단을 구성하여 제품에 대한 평가를 진행하였다. 하지만, 이러한 방식으로는 데이터를 충분하게 수집하기가 어렵고, 얻은 데이터 또한 고객으로부터의 즉각적인 피드백이 아니라는 단점이 존재한다. 상품 개발 리드 타임이 점차 감소하는 추세의 제조업계에서는, 이러한 VOC 획득 방식으로는 소비자들의 트렌드에 따라가지 못해 경쟁력이 떨어질 수 있다고 지적한다.
온라인 상품평 데이터는 여러 인터넷 쇼핑몰 사이트에서 많은 양의 데이터를 어렵지 않게 수집할 수 있으며, 소비자들의 즉각적인 피드백을 바로 활용할 수 있다는 장점이 있다. 또한, 온라인 상품평 데이터는 제품 개발 과정에 있어 고객 요구와 밀접한 유사성이 있는 점이 연구를 통해 밝혀진 바 있어, 제품 개발 분야에서 이 데이터의 활용 방안 연구들이 진행 중이다.
본 개시는 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법을 제공한다.
본 개시의 컴퓨터 장치의 방법은, 상품평 데이터로부터의 토큰들에서 적어도 하나의 속성과 적어도 하나의 감성어를 추출하는 단계, 상기 속성과 상기 감성어 사이의 관계 세트를 구축하는 단계, 및 상기 관계 세트에 기반하여 상기 속성에 대한 감성 점수를 평가하는 단계를 포함할 수 있다.
본 개시의 컴퓨터 장치는, 메모리, 및 상기 메모리와 연결되고, 상기 메모리에 저장된 적어도 하나의 명령을 실행하도록 구성되는 프로세서를 포함하고, 상기 프로세서는, 상품평 데이터로부터의 토큰들에서 적어도 하나의 속성과 적어도 하나의 감성어를 추출하고, 상기 속성과 상기 감성어 사이의 관계 세트를 구축하고, 상기 관계 세트에 기반하여 상기 속성에 대한 감성 점수를 평가하도록 구성될 수 있다.
본 개시의 컴퓨터 프로그램은, 컴퓨터 장치에 방법을 실행시키기 위해 비-일시적인 컴퓨터 판독 가능한 기록 매체에 저장되며, 상기 방법은, 상품평 데이터로부터의 토큰들에서 적어도 하나의 속성과 적어도 하나의 감성어를 추출하는 단계, 상기 속성과 상기 감성어 사이의 관계 세트를 구축하는 단계, 및 상기 관계 세트에 기반하여 상기 속성에 대한 감성 점수를 평가하는 단계를 포함할 수 있다.
본 개시에 따르면, 온라인 상품평에 대한 속성 기반 감성 분석을 통해, 제품에 대한 고객의 소리(VOC)가 용이하게 획득되고 정량화될 수 있다. 즉, 별도의 설문 조사 또는 전문 테스트 집단에 의한 평가 없이도, 고객의 소리(VOC)가 용이하게 획득되고 정량화될 수 있다. 따라서, 제품에 대한 고객의 소리(VOC)를 획득하고 정량화되는 데 소요되는 시간과 비용이 현저하게 절감될 수 있을 뿐 아니라, 소비자의 즉각적인 피드백과 많은 양의 데이터를 활용함으로써, 고객의 소리(VOC)에 대한 정확도는 상당히 증대될 수 있다. 아울러, 이러한 고객의 소리(VOC)를 새로운 제품 개발에 효과적으로 활용될 수 있다.
도 1은 다양한 실시예들에 따른 컴퓨터 장치의 구성을 개략적으로 도시하는 도면이다.
도 2는 도 1의 프로세서의 구성을 세부적으로 도시하는 도면이다.
도 3은 다양한 실시예들에 따른 컴퓨터 장치의 방법을 개략적으로 도시하는 도면이다.
도 4, 도 5, 도 6, 도 7, 도 8, 도 9, 도 10 및 도 11은 다양한 실시예들에 따른 컴퓨터 장치의 방법을 예시적으로 설명하기 위한 도면들이다.
감성 분석은 텍스트에 들어있는 의견이나 감성과 같은 주관적인 정보를 컴퓨터 과학적인 측면에서 분석하는 자연어 처리 과정을 가리킨다. 감성 분석은 분석 대상 텍스트의 범위에 따라 '문서 단위(document-based)', '문장 단위(sentence-based)', '속성 단위(aspect-based)'의 분석으로 분류할 수 있다.
문서 단위 감성 분석은 문서 전체에 대한 종합적인 감성을 평가하는 방식이며, 문장 단위 감성 분석(sentence-based sentiment analysis; 이하 SBSA)은 문장별 감성을 평가하는 작업을 의미한다. 최근까지 진행된 연구들은 온라인 상품평 데이터를 활용하여 문서 단위 감성 분석을 통해 제품에 대한 전반적인 감성 정도를 파악하고자 하였다. 최근에는 온라인 상품평 전체에 대한 감성보다는 리뷰 내 존재하는 중요 속성들의 감성을 파악하는 것이 유용하여 속성 단위 감성 분석(aspect-based sentiment analysis; 이하 ABSA) 연구도 증가하였다.
ABSA는 크게 '속성 추출', '추출된 속성 카테고리 분류', '추출된 속성에 대한 감성 평가'로 구성되어 있다. 그리고 ABSA를 접근방식을 기준으로 분류하자면, '기계학습 기반 ABSA', '지식 기반 ABSA', '복합 기법 활용 ABSA' 로 나눌 수 있으며, 각각의 구성에 대한 접근방식은 연구마다 다르다. 지식 기반 ABSA는 속성 추출 및 감성 평가 등 모든 과정을 온톨로지 및 사전을 바탕으로 한 지식 기반 방식을 활용하여 소비자 리뷰에 대한 ABSA를 진행하였다면, 복합 기법 활용 ABSA는 속성 추출 과정을 지식 기반 방식을 활용한 후, 추출된 속성이 포함된 문장에 대한 긍정/부정 여부를 기계학습 방식을 활용해 판단한 후, 해당 속성도 문장 전체의 감성과 같을 것이라는 가정하에 속성에 대한 감성 평가를 진행하였다. 기계학습 기반 ABSA는 속성과 감성어의 쌍을 추출하기 위해 문장 내 POS(position of speech) 태그 정보를 활용하여 각 단어를 추출한 후, 제품 속성에 대한 해당 감성 관련 부분을 어텐션 기반(attention-based) 모델을 통해 긍정/부정 여부를 판단하는 방식으로 접근했다.
온라인 상품평 데이터는 제품의 특성에 대한 구체적인 평가를 담고 있으면서도 인터넷 상에서 쉽게 수집할 수 있기에 제품의 장단점 및 긍정/부정 척도를 판단하기에 높은 효용 가치를 가진다. 기존의 감성 분석 연구들은 여러 문장으로 구성된 상품평 전체 단위의 감성 평가 방법을 제안하였다. 제품의 여러 속성별로 감성 평가 결과를 얻을 수 있으면 후속 제품 개발 과정에 유효한 입력이 될 수 있다. 본 개시에서는 제품의 속성 단위의 감성 분석을 하기 위해 상품평의 문장 단위로부터 제품 속성을 추출하여 감성 평가를 수행하는 방식을 제안한다. 먼저 양방향 LSTM과 조건부 무작위장(conditional random field; CRF)을 활용한 문장분석 모델을 통해 제품 속성과 감성어를 추출한다. 추출된 제품 속성별 감성 평가 결과는 본 개시에서 제안하는 감성 평가 규칙을 활용하여 계산된다. 제품 속성별 감성 평가 결과는 품질 전개 기법에 적용되어 후속 제품 개발 과정에 반영된다. 구체적으로, 온라인 상품평으로부터 제품의 속성별 소비자들의 감성 평가를 계산한 결과는 최종적으로 QFD(quality function deployment) 방법론의 고객 요구사항 입력값으로 활용되어 신규 제품의 대안 설계에 활용될 수 있다.
이하, 본 개시의 다양한 실시예들이 첨부된 도면을 참조하여 설명된다.
도 1은 다양한 실시예들에 따른 컴퓨터 장치(100)의 구성을 개략적으로 도시하는 도면이다. 도 2는 도 1의 프로세서(140)의 구성을 세부적으로 도시하는 도면이다.
도 1을 참조하면, 컴퓨터 장치(100)는 입력 모듈(110), 출력 모듈(120), 메모리(130), 또는 프로세서(140) 중 적어도 하나를 포함할 수 있다. 어떤 실시예에서, 컴퓨터 장치(100)의 구성 요소들 중 적어도 하나가 생략될 수 있으며, 적어도 하나의 다른 구성 요소가 추가될 수 있다. 어떤 실시예에서, 컴퓨터 장치(100)의 구성 요소들 중 적어도 두 개가 하나의 통합된 회로로 구현될 수 있다.
입력 모듈(110)은 컴퓨터 장치(100)의 적어도 하나의 구성 요소에 사용될 신호를 입력할 수 있다. 입력 모듈(110)은, 사용자에 의해 직접적으로 입력되는 신호를 검출할 수 있는 입력 유닛, 주변의 변화를 감지하여 신호를 발생할 수 있는 센서 모듈, 또는 외부 기기로부터 신호를 수신하도록 구성되는 수신 모듈 중 적어도 하나를 포함할 수 있다. 예를 들면, 입력 유닛은은 마이크로폰(microphone), 적어도 하나의 물리 버튼(button), 또는 터치 패드 중 적어도 하나를 포함할 수 있다. 수신 모듈에 대해서는, 보다 상세하게 후술될 것이다.
출력 모듈(120)은 컴퓨터 장치(100)의 외부로 정보를 출력할 수 있다. 출력 모듈(120)은 촉각 인터페이스를 제공하기 위한 촉각 디스플레이로 구현될 수 있다. 이를 위해, 출력 모듈(130)은 정보를 시각적으로 출력하도록 구성되는 표시 모듈, 정보를 오디오 신호로 출력할 수 있는 오디오 출력 모듈 또는 정보를 무선으로 송신할 수 있는 송신 모듈 중 적어도 하나를 포함할 수 있다. 예를 들면, 오디오 출력 모듈은 스피커 또는 리시버 중 적어도 하나를 포함할 수 있다. 송신 모듈에 대해서는, 보다 상세하게 후술될 것이다.
일부 실시예들에 따르면, 수신 모듈과 송신 모듈은 통신 모듈로 구현될 수 있다. 통신 모듈은 컴퓨터 장치(100)에서 외부 기기와 통신을 수행할 수 있다. 통신 모듈은 컴퓨터 장치(100)와 외부 기기 간 통신 채널을 수립하고, 통신 채널을 통해, 외부 기기와 통신을 수행할 수 있다. 여기서, 외부 기기는 다른 컴퓨터 장치, 위성, 기지국, 또는 서버 중 적어도 하나를 포함할 수 있다. 통신 모듈은 유선 통신 모듈 또는 무선 통신 모듈 중 적어도 하나를 포함할 수 있다. 유선 통신 모듈은 외부 기기와 유선으로 연결되어, 유선으로 통신할 수 있다. 무선 통신 모듈은 근거리 통신 모듈 또는 원거리 통신 모듈 중 적어도 하나를 포함할 수 있다. 근거리 통신 모듈은 외부 기기와 근거리 통신 방식으로 통신할 수 있다. 예를 들면, 근거리 통신 방식은, 블루투스(Bluetooth), 와이파이 다이렉트(WiFi direct), 또는 적외선 통신(IrDA; infrared data association) 중 적어도 하나를 포함할 수 있다. 원거리 통신 모듈은 외부 기기와 원거리 통신 방식으로 통신할 수 있다. 여기서, 원거리 통신 모듈은 네트워크를 통해 외부 기기와 통신할 수 있다. 예를 들면, 네트워크는 셀룰러 네트워크, 인터넷, 또는 LAN(local area network)이나 WAN(wide area network)과 같은 컴퓨터 네트워크 중 적어도 하나를 포함할 수 있다.
메모리(130)는 컴퓨터 장치(100)의 적어도 하나의 구성 요소에 의해 사용되는 다양한 데이터를 저장할 수 있다. 예를 들면, 메모리(130)는 휘발성 메모리 또는 비휘발성 메모리 중 적어도 하나를 포함할 수 있다. 데이터는 적어도 하나의 프로그램 및 이와 관련된 입력 데이터 또는 출력 데이터를 포함할 수 있다. 프로그램은 메모리(130)에 적어도 하나의 명령을 포함하는 소프트웨어로서 저장될 수 있으며, 운영 체제, 미들 웨어 또는 어플리케이션 중 적어도 하나를 포함할 수 있다.
프로세서(140)는 메모리(130)의 프로그램을 실행하여, 컴퓨터 장치(100)의 적어도 하나의 구성 요소를 제어할 수 있다. 이를 통해, 프로세서(140)는 데이터 처리 또는 연산을 수행할 수 있다. 이 때, 프로세서(140)는 메모리(130)에 저장된 명령을 실행할 수 있다. 프로세서(140)는 제품의 속성 단위의 감성 분석을 하기 위해 상품평 데이터의 문장 단위로부터 제품 속성을 추출하여 감성 평가를 수행할 수 있다. 그리고, 프로세서(140)는 제품 속성별 감성 평가 결과를 후속 제품 개발과정에 반영되게 할 수 있다. 구체적으로, 프로세서(140)는, 도 2에 도시된 바와 같이, 토큰화 모듈(210), 추출 모듈(220), 평가 모듈(230), 및 개발 모듈(240)을 포함할 수 있다.
토큰화 모듈(210)은 상품평 데이터를 토큰들로 분리할 수 있다. 먼저, 토큰화 모듈(210)은 상품평 데이터에 대해 전처리를 수행할 수 있다. 이 때, 긴 문장의 경우 제품의 속성별 감성 관련 언급보다 불필요한 설명이 많아 학습에 안좋은 영향을 줄 수 있으므로, 토큰화 모듈(210)은 상품평 데이터로부터 단어 개수가 30 개 이하인 문장을 추출할 수 있다. 그런 다음, 토큰화 모듈(210)은 추출된 문장에 대해 토큰화를 진행할 수 있다. 이 때, 토큰화 모듈(210)은 추출된 문장을 토큰들로 분리할 수 있다.
추출 모듈(220)은 토큰들에서 속성과 감성어를 추출할 수 있다. 토큰들을 분류하기 위해, 다음과 같은 3가지 분류명이 정의될 수 있다: 이는 상품평 데이터에서 추출되어야 하는 제품(device)(DEV), 속성(feature)(FEA), 및 감성어(sentiment)(SEN)를 의미할 수 있다. 제품(DEV)은 제품 또는 제품을 지칭하는 표현들, 예컨대, '드라이기', 'UN-B1453', '전에 쓰던 것', '이 모델' 등을 포함할 수 있다. 속성(FEA)은 제품 특성이나 성능을 지칭하는 표현들, 예컨대, '성능', '바람 세기', '음 이온 기능', '스위치' 등을 포함할 수 있다. 감성어(SEN)는 소비자의 감성을 지칭하는 표현들, 예컨대, '너무 좋습니다', '뜨거워요', '별로예요', '매우 약하다' 등을 포함할 수 있다. 이 때, 추출 모듈(220)은 학습 모델을 이용하여, 토큰들에서 속성과 감성어를 추출할 수 있다. 여기서, 학습 모델은 양방향 LSTM(Bi-LSTM)과 CRF가 결합되어 구현될 수 있다(Bi-LSTM+CRF 모델). 학습 모델에 대해서는, 보다 상세하게 후술될 것이다.
평가 모듈(230)은 속성 및 감성어 간 관계 세트를 구축할 수 있다. 한 개의 상품평 데이터에도 여러 속성(FEA)나 제품(DEV)이 등장할 수 있고, 각각의 속성(FEA)나 제품(DEV)이 가지는 감성어(SEN)는 다를 수 있으므로, 각각의 속성(FEA)나 제품(DEV)이 어떠한 감성어(SEN)를 가지는지를 묶는 과정이 필요하다. 따라서, 프로세서(140)는 속성 및 감성어를 (Feature, Sentiment) 또는 (Device, Sentiment)처럼 묶은 결과를 '속성 및 감성어 간 관계 세트'로 정의할 수 있다. 그리고, 평가 모듈(230)은 관계 세트에 기반하여 감성 평가를 수행할 수 있다. 이 때, 평가 모듈(230)은 사전에 구축해 둔 감성 사전 시스템을 통해 구체적인 감성 점수로 평가할 수 있다. 감성 사전 시스템에 대해서는, 보다 상세하게 후술될 것이다.
개발 모듈(240)은 감성 평가 결과를 기반으로 제품 개발을 수행할 수 있다. 즉, 감성 평가 결과는 품질 전개 기법에 적용되어 후속 제품 개발 과정에 반영될 수 있다. 구체적으로, 프로세서(140)는 감성 평가 결과를 최종적으로 QFD 방법론의 고객 요구사항 입력값으로 활용하여, 신규 제품의 대안 설계에 활용할 수 있다.
도 3은 다양한 실시예들에 따른 컴퓨터 장치(100)의 방법을 개략적으로 도시하는 도면이다. 도 4, 도 5, 도 6, 도 7, 도 8, 도 9, 도 10 및 도 11은 다양한 실시예들에 따른 컴퓨터 장치(100)의 방법을 예시적으로 설명하기 위한 도면들이다.
도 3을 참조하면, 컴퓨터 장치(100)는 310 단계에서 상품평 데이터를 토큰들로 분리할 수 있다. 먼저, 프로세서(140)는 상품평 데이터에 대해 전처리를 수행할 수 있다. 이 때, 긴 문장의 경우 제품의 속성별 감성 관련 언급보다 불필요한 설명이 많아 학습에 안좋은 영향을 줄 수 있으므로, 프로세서(140)는 상품평 데이터로부터 단어 개수가 30 개 이하인 문장을 추출할 수 있다. 그런 다음, 프로세서(140)는 추출된 문장에 대해 토큰화를 진행할 수 있다. 이 때, 프로세서(140)는 추출된 문장을 토큰들로 분리할 수 있다.
다음으로, 컴퓨터 장치(100)는 320 단계에서 토큰들에서 속성과 감성어를 추출할 수 있다. 토큰들을 분류하기 위해, 다음과 같은 3가지 분류명이 정의될 수 있다: 이는 상품평 데이터에서 추출되어야 하는 제품(device)(DEV), 속성(feature)(FEA), 및 감성어(sentiment)(SEN)를 의미할 수 있다. 제품(DEV)은 제품 또는 제품을 지칭하는 표현들, 예컨대, '드라이기', 'UN-B1453', '전에 쓰던 것', '이 모델' 등을 포함할 수 있다. 속성(FEA)은 제품 특성이나 성능을 지칭하는 표현들, 예컨대, '성능', '바람 세기', '음 이온 기능', '스위치' 등을 포함할 수 있다. 감성어(SEN)는 소비자의 감성을 지칭하는 표현들, 예컨대, '너무 좋습니다', '뜨거워요', '별로예요', '매우 약하다' 등을 포함할 수 있다. 이 때, 프로세서(140)는 학습 모델을 이용하여, 토큰들에서 속성과 감성어를 추출할 수 있다. 여기서, 학습 모델은 양방향 LSTM(Bi-LSTM)과 CRF가 결합되어 구현될 수 있다(Bi-LSTM+CRF 모델).
Bi-LSTM+CRF 모델은 BIO 방식으로 태그된 훈련 데이터를 이용하여 학습되어 있을 수 있다. BIO 태그 방식은 하나의 개체명이 여러 개의 토큰들으로 구분되어 있을 때, 개체명의 시작 토큰에는 'B-'를 붙여 개체명의 시작임을 표현하고, 같은 개체명 내에서 이어지는 토큰들에는 'I-'를 붙이며, 속성 및 감성어가 아닌 토큰들에 대해서는 'O'로 태깅하는 방식이다. 예를 들어, 도 4에 도시된 바와 같이 BIO 방식으로 태깅하여 만든 훈련 데이터에서, 속성 및 감성어로 판단할 수 있는 부분은 감성어(SEN)인 '좀 무거운 감은 없지 않아 있지만', 속성(FEA)인 '바람', 감성어(SEN)인 '은 세요~' 부분이다. 각각의 속성 및 감성어의 시작 토큰마다 'B-'가 부착되어 속성 및 감성어의 시작임이 표시되고, 연결되는 모든 토큰들에는 'I-'가 부착되었다.
Bi-LSTM+CRF 모델은 도 5에 도시된 바와 같이 구현될 수 있으며, 딥러닝 모델의 정확도를 개선하기 위해, 입력값으로 토큰과 함께 토큰별 POS 정보를 같이 활용할 수 있다. 토큰의 임베딩 결과와 POS 정보를 원-핫 벡터(one-hot-vector)로 결합하여 입력값으로 사용할 수 있다. Bi-LSTM+CRF 모델에서 토큰에 대한 임베딩은 300차원의 랜덤 초기화(random Initialization) 방식의 벡터, POS 정보는 55차원의 원-핫 벡터, 배치 크기(batch size)는 16, LSTM 유닛 크기는 30, 에폭(epochs)은 10으로 설정되며, 이는 하이퍼 -파라미터 튜닝 과정을 통해 결정된 값이다. POS 태깅이 완료된 문장들은 8:1:1의 비율로 학습 데이터와 검증 데이터, 모델 테스트용 데이터로 분리된다. 분리된 데이터 중 학습 데이터로 Bi-LSTM+CRF 모델을 학습하고, 검증 데이터는 해당 Bi-LSTM+CRF 모델이 과적되었는지 평가하는 데 활용된다. 모델 테스트용 데이터는 학습 모델이 적절한지를 평가하기 위한 데이터이다. Bi-LSTM+CRF 학습 모델이 만들어지면 제 품 개선하고자 하는 신규 상품평 데이터에 적용하여 토큰별 개체명을 예측한다. 예측이 완료된 테스트 데이터는 'O'로 표기된 불필요한 토큰들을 제외하고 개체명이 예측된 부분을 도 6에 도시된 바와 같이 문장 별로 정리한다.
다음으로, 컴퓨터 장치(100)는 330 단계에서 속성 및 감성어 간 관계 세트를 구축할 수 있다. 한 개의 상품평 데이터에도 여러 속성(FEA)나 제품(DEV)이 등장할 수 있고, 각각의 속성(FEA)나 제품(DEV)이 가지는 감성어(SEN)는 다를 수 있으므로, 각각의 속성(FEA)나 제품(DEV)이 어떠한 감성어(SEN)를 가지는지를 묶는 과정이 필요하다. 따라서, 프로세서(140)는 속성 및 감성어를 (Feature, Sentiment) 또는 (Device, Sentiment)처럼 묶은 결과를 '속성 및 감성어 간 관계 세트'로 정의할 수 있다.
관계 세트를 자동으로 묶기 위해, 토큰과 함께 정리해 두었던 POS 정보와 상품평 데이터 내 문장 번호를 바탕으로 정의한 규칙을 사용할 수 있다. 관계 세트를 잘 구성할 수 있는 5가지 규칙들이 도 7에 도시된 바와 같이 정의될 수 있다. 규칙들 중 다섯 번째 규칙(Rule 5)은 문장에서 감성어만 남아있는 경우를 고려하였다. 감성어만 남은 경우는 제품이나 속성을 지칭하지 않고 암묵적으로 감성을 표현한 문장들이다. 예를 들어, '무게가 무겁다'라는 (Feature, Sentiment)의 조합으로 표현하기보단, 단순하게 '무겁다'라는 표현을 하는 경우가 있다. 따라서, '무게'라는 속성은 상품평 데이터에 언급되지 않았기에 앞선 과정에서 빠질 수밖에 없고, 이러한 속성들이 누적되면 소비자들의 제품 요소별 감성 평가의 정확성에 안 좋은 영 향을 주게 된다. 만약 '무겁다'라는 표현이 있고, 이것이 다섯 번째 규칙(Rule 5)에 의해 관계 세트를 구축할 때 ['???', '무겁다']처럼 암묵적 속성(implicit feature)의 후보를 '???'로 지칭하도록 규칙을 정의하였다. 암묵적 속성은 이후 암묵적 속성 라이브러리를 활용하여, 해당 세트 내 감성 단어에 어울리는 속성으로 추론하는 과정을 진행한다.
암묵적 속성을 추론하는 과정은 다음과 같을 수 있다. 암묵적 속성에 대한 '???' 표기는 전체 제품을 암묵적으로 지칭하거나 특정 속성을 지칭하는 경우이다. 전체 제품을 지칭하는 경우는 '좋아요'와 같은 표현인데 이는 제품 개발과정에서는 특정 속성에 대한 평가가 없는 부분이기에 고려하지 않는다. 특정 속성을 지칭하는 감성어 표현은 '무겁다'와 같은 표현이다. 이는 '무게'라는 속성을 암묵적으로 지칭한다고 볼 수 있다. 이처럼 특정 감성어 표현은 속성을 고려하여 사용되기 때문에 이와 같은 관계를 사전에 정의한 참조표가 있으면 암묵적으로 표현된 속성을 추론할 수 있다. 실제 테스트 데이터에 해당 규칙을 적용하였을 때의 예시는 도 8에 도시된 바와 같고, 암묵적 속성을 추론하기 위한 참조표는 도 9에 도시된 바와 같다.
다음으로, 컴퓨터 장치(100)는 340 단계에서 관계 세트에 기반하여 감성 평가를 수행할 수 있다. 이 때, 프로세서(140)는 사전에 구축해 둔 감성 사전 시스템을 통해 구체적인 감성 점수로 평가할 수 있다. 일반적으로, 영문 데이터의 경우 SentiwordNet이 감성 사전으로 많이 활용되며, 한글 데이터의 경우 KNU 한국어 감성 사전과 같은 오픈소스 감성 사전이 존재한다. 하지만, 이러한 감성 사전들으로는 특정 제품에 특화된 감성 표현을 추출하기 어렵다는 한계점이 있으므로, 본 개시에서는 별도의 감성 사전 시스템이 구축 및 활용될 수 있다. 감성을 수치화시키기 위해 5개의 감성 사전들로 구성된 감성 사전 시스템이 구축될 수 있다. 각 감성 사전에 따르면, 감성어 토큰의 종류에 따라 점수가 부여될 수 있다. 감성 사전별 계산의 우선순위가 존재하는데, 감성 점수는 긍정일 경우는 (+)로 표현되고, 부정일 경우는 (-)로 표현되며, 그 절댓값은 감성에 대한 정도를 나타낼 수 있다. 감성 사전 시스템은 '일반 토큰(generic token)(3순위)', '부정 토큰(negative token)(4순위)', '증폭 부사 토큰(amplify adverb token)(5순위)', '복합 감성 토큰(complex sentiment token)(2순위)', '감성 단어 + 속성 조합 한정 토큰(sentiment words + feature combination limit token)(1순위)'의 5개 감성 사전들로 구성될 수 있다. 예를 들어, 감성 사전 시스템의 각 감성 사전은 도 10에 도시된 바와 같이 구현될 수 있다.
1 순위의 '감성 단어 + 속성 조합 한정 토큰'은, 감성어만으로 긍정/부정을 판단하기 어렵지만, 특정 속성과 조합되었을 때 판단할 수 있는 경우에 대한 감성 사전일 수 있다. 예를 들어, '적다'라는 표현은 때에 따라 긍정과 부정이 달라질 수 있지만, 소음이라는 속성과 조합되었을 땐 확실하게 긍정이므로 +1이 될 수 있다.
2 순위의 '복합 감성 토큰'은, 감성어 토큰 1 개만으로는 감성 평가가 불가능하지만, 2개 이상의 감성어 토큰들이 조합되었을 때 판단할 수 있는 경우에 대한 감성 사전일 수 있다. 예를 들어, '맘에 들다'라는 긍정 부분은 토큰화 과정에서 '맘'과 '들'로 분리되는데, '맘'과 '들' 각각의 토큰만으로는 감성을 평가할 수 없다. 하지만, '맘'과 '들'이 모두 존재할 때에는 이것에 대한 감성이 긍정이라는 것을 판단할 수 있기에 +1이 될 수 있다.
3 순위의 '일반 토큰'은, 일반적인 감성어에 대한 감성 사전일 수 있다. 예를 들어, '저렴'이라는 표현은 소비자 입장에서 긍정인 감성 단어라 +1이 될 수 있고, '비싸'라는 표현은 소비자 입장에서 부정인 감성 단어이므로 -1이 될 수 있다.
4 순위의 '부정 토큰'은, 속성 및 감성어의 관계 세트에 대한 감성 평가를 반대로 뒤바꿀 수 있는 토큰에 대한 감성 사전일 수 있다. 3순위까지의 감성 평가 값에 해당 값이 곱해질 수 있다. 예를 들어, '좋다'라는 감성어가 있을 때 +1이 될 수 있지만, 앞에 '안'이라는 부정 표현이 붙을 때 감성 평가가 180도 변하게 될 수 있다. 따라서 이 경우, (+1) Х (-1) = -1점의 감성 점수를 가질 수 있다.
5 순위의 '증폭 부사 토큰'은 4순위까지의 감성 평가 값을 증폭시켜주는 토큰들에 대한 감성 사전일 수 있다. 예를 들어, '좋다'와 '정말 좋다'는 둘 다 긍정의 표현이지만, 그 정도의 크기는 다를 수 있다. 따라서 '좋다'가 +1 점의 긍정을 가졌다면, '정말 좋다'는 (+1) Х (+2) = +2 점의 감성 평가를 가질 수 있도록 구성될 수 있다. 마찬가지로 '정말 안좋다'라는 표현은 앞선 4순위까지의 계산 과정에서 (-1) 점을 가졌기에, (-1) Х (+2) = -2 점을 갖게 될 수 있다.
도 11은 감성 사전 시스템을 적용했을 때, 추출된 관계 세트별 감성 점수 예시이다.
다음으로, 컴퓨터 장치(100)는 350 단계에서 감성 평가 결과를 기반으로 제품 개발을 수행할 수 있다. 즉, 감성 평가 결과는 품질 전개 기법에 적용되어 후속 제품 개발 과정에 반영될 수 있다. 구체적으로, 프로세서(140)는 감성 평가 결과를 최종적으로 QFD 방법론의 고객 요구사항 입력값으로 활용하여, 신규 제품의 대안 설계에 활용할 수 있다.
QFD 제품 개발 방법론은 크게 2단계들로 구성될 수 있다. QFD 1단계는 고객 요구사항(customer needs; CN)와 제품 특성(product characteristics; PC)를 연결하는 과정이며, 2단계는 PC와 설계 파라미터(design parameter; DP)를 연결하는 과정일 수 있다. 속성 및 감성어의 관계 세트들에서 속성끼리의 유사성을 바탕으로 그룹화 과정을 거치면 유사한 속성들로 묶인 각 그룹은, 그들의 특징을 대표할 수 있는 이름을 가진 CN으로 정의될 수 있다. 각 그룹으로 묶여진 관계 세트에서의 감성 점수는 CN의 감성 점수로 반영이 될 수 있다. 각 그룹에 속한 관계 세트들의 수도 CN의 빈도수로 대응될 수 있다. 이는 QFD 1단계 내의 개선 기획 부분에 '등장 빈도 반영 중요도'와 '자사/타사 비 교'부분에 반영되어 제품 개발 과정에 사용될 수 있다. PC와 DP는 도메인 전문가가 작성하게 되고, CN-PC 와 PC-DP 간의 크로스 매트릭스(cross matrix) 역시 전문가에 의해 작성될 수 있다. CN-PC 및 PC-DP 간의 크로스 매트릭스는 강한 상관관계일 경우 9 점, 일반 상관관계일 경우 3점, 약한 상관관계일 경우 1점, 관계가 없을 때 0점으로 책정될 수 있다.
구체적으로, 관계 세트로부터 CN 정의 및 CN 감성 평가에 있어서, 관계 세트를 QFD의 1단계 CN으로 연결하는 과정은 수작업으로 진행될 수 있다. 예를 들어, 테스트 헤어 드라이기 모델로부터 추출된 각각의 관계 세트의 속성 부분을 보고 그룹화 과정을 통해 총 24가지의 그룹을 구성할 수 있고, 이 중 23 개의 CN을 정의하고 나머지 1 개의 기타 그룹 은 기타 분류로 정의될 수 있다. 이후 분류된 CN으로 관계 세트의 감성 점수를 다음과 같이 이동시킬 수 있다. 예를 들어, [가격(FEA), 싸다(SEN), +1(감성 점수)] → [가격 경쟁력(CN), +1] [무게(FEA), 무겁다(SEN), -1(감성 점수)] → [무게(CN), -1]. 이후, 각 CN에 대한 빈도수와 (각 CN에 대한 감성 점수의 총합/각 CN에 대한 빈도수)로 CN 별 평균 감성 점수가 도출될 수 있다.
또한, CN 빈도수 및 감성 점수의 QFD 적용에 있어서, QFD 1단계에서 PC의 중요도는 CN-PC 간 크로스 매트릭스와 개선 기획 부분을 통해 계산된 CN 별 중요도의 내적을 통해 계산될 수 있다. 상품평 데이터로부터의 소비자 의견을 반영하는 부분은 이 중 개선 기획 부분 중 '중요도'부분과 '자사/타사 비교'부분일 수 있다. 기존의 QFD 방법과의 차이 점은 정성적인 '중요도' 대신 정량적인 '등장 빈도 중요도'라는 개념이 사용될 수 있다는 점일 수 있다. 그리고, 자사/타사 비교 부분을 평균 감성 점수를 바탕으로 수치화를 자동화할 수 있다는 점이다. 등장 빈도 중요도는 (전문가 평가 중요도 + 등장 빈도 반영계수 Х 등장 빈도)를 통해 새로 정의한 중요도일 수 있다. 자사/타사 비교 점수 작성 자동화 방식은 다음과 같을 수 있다. CN에 대한 감성 점수는 상대적인 점수이기에 모든 CN에 대해 절대적인 수치로 평가될 수 없다. 예를 들어, 소음에서의 -1점과 가격에서의 -1점은 그 가치가 다르기에, 절대적인 수치로 이용될 수 없고, 같은 CN에 대해서만 상대적인 평가를 할 수 있다. 한 가지 CN에 대해 모든 모델의 점수 중 가장 높은 점수를 가진 드라이기 모델에게는 5점, 가장 낮은 점수를 가진 드라이기 모델에게는 1점이 부여될 수 있다. 다른 모델들의 감성 점수도 이를 기준으로 상대적 평가하여 수치화된 점수가 적용될 수 있다.
요컨대, 본 개시는 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치(100) 및 그의 방법을 제공한다. 본 개시에 따르면, 온라인 상품평에 대한 속성 기반 감성 분석을 통해, 제품에 대한 고객의 소리(VOC)가 용이하게 획득되고 정량화될 수 있다. 즉, 별도의 설문 조사 또는 전문 테스트 집단에 의한 평가 없이도, 고객의 소리(VOC)가 용이하게 획득되고 정량화될 수 있다. 따라서, 제품에 대한 고객의 소리(VOC)를 획득하고 정량화되는 데 소요되는 시간과 비용이 현저하게 절감될 수 있을 뿐 아니라, 소비자의 즉각적인 피드백과 많은 양의 데이터를 활용함으로써, 고객의 소리(VOC)에 대한 정확도는 상당히 증대될 수 있다. 아울러, 이러한 고객의 소리(VOC)를 새로운 제품 개발에 효과적으로 활용될 수 있다.
본 개시의 컴퓨터 장치(100)의 방법은, 상품평 데이터로부터의 토큰들에서 적어도 하나의 속성과 적어도 하나의 감성어를 추출하는 단계(320 단계), 속성과 감성어 사이의 관계 세트를 구축하는 단계(330 단계), 및 관계 세트에 기반하여 속성에 대한 감성 점수를 평가하는 단계(340 단계)를 포함할 수 있다.
다양한 실시예들에 따르면, 속성은 제품을 직접 또는 간접적으로 지칭하는 표현, 또는 제품의 특성이나 성능을 나타내는 표현 중 적어도 하나를 포함하고, 감성어는 제품의 소비자의 감성을 나타내는 표현일 수 있다.
다양한 실시예들에 따르면, 속성과 감성어를 추출하는 단계(320 단계)는, 상품평 데이터로부터 추출되는 각 문장에서 분리되는 토큰들에 대해, 속성과 감성어를 추출할 수 있다.
다양한 실시예들에 따르면, 속성과 감성어를 추출하는 단계(320 단계)는, 문장에 속성과 감성어가 모두 있는 경우, 속성과 감성어를 추출하는 단계, 및 문장에 감성어만 있는 경우, 감성어에 기반하여 속성을 추론함으로써, 속성과 감성어를 추출하는 단계를 포함할 수 있다.
다양한 실시예들에 따르면, 속성에 대한 감성 점수를 평가하는 단계(330 단계)는, 미리 구축된 감성 사전 시스템을 이용하여, 관계 세트 내에서 속성에 대한 감성어를 수치화함으로써, 감성 점수를 도출하는 단계를 포함할 수 있다.
다양한 실시예들에 따르면, 감성 사전 시스템은, 감성어 자체를 점수화하기 위한 감성 사전, 감성어에서의 부정적 표현을 점수화하기 위한 감성 사전, 감성어에서의 증폭 부사를 점수화하기 위한 감성 사전, 속성과 감성어의 조합에 따라 감성어를 점수화하기 위한 감성 사전, 또는 복수의 감성어들의 조합을 점수화하기 위한 감성 사전 중 적어도 하나를 포함할 수 있다.
다양한 실시예들에 따르면, 컴퓨터 장치(100)의 방법은, 속성에 대한 감정 점수를 고객 요구사항으로 활용하여, 신규 제품의 대안 설계를 수행하는 단계(350 단계)를 더 포함할 수 있다.
본 개시의 컴퓨터 장치(100)는, 메모리(130), 및 메모리와 연결되고, 메모리(130)에 저장된 적어도 하나의 명령을 실행하도록 구성되는 프로세서(140)를 포함하고, 프로세서(140)는, 상품평 데이터로부터의 토큰들에서 적어도 하나의 속성과 적어도 하나의 감성어를 추출하고, 속성과 감성어 사이의 관계 세트를 구축하고, 관계 세트에 기반하여 속성에 대한 감성 점수를 평가하도록 구성될 수 있다.
다양한 실시예들에 따르면, 속성은 제품을 직접 또는 간접적으로 지칭하는 표현, 또는 제품의 특성이나 성능을 나타내는 표현 중 적어도 하나를 포함하고, 감성어는 제품의 소비자의 감성을 나타내는 표현일 수 있다.
다양한 실시예들에 따르면, 프로세서(140)는, 상품평 데이터로부터 추출되는 각 문장에서 분리되는 토큰들에 대해, 속성과 감성어를 추출하도록 구성될 수 있다.
다양한 실시예들에 따르면, 프로세서(140)는, 문장에 속성과 감성어가 모두 있는 경우, 속성과 감성어를 추출하고, 문장에 감성어만 있는 경우, 감성어에 기반하여 속성을 추론함으로써, 속성과 감성어를 추출하도록 구성될 수 있다.
다양한 실시예들에 따르면, 프로세서(140)는, 미리 구축된 감성 사전 시스템을 이용하여, 관계 세트 내에서 속성에 대한 감성어를 수치화함으로써, 감성 점수를 도출하도록 구성될 수 있다.
다양한 실시예들에 따르면, 감성 사전 시스템은, 감성어 자체를 점수화하기 위한 감성 사전, 감성어에서의 부정적 표현을 점수화하기 위한 감성 사전, 감성어에서의 증폭 부사를 점수화하기 위한 감성 사전, 속성과 감성어의 조합에 따라 감성어를 점수화하기 위한 감성 사전, 또는 복수의 감성어들의 조합을 점수화하기 위한 감성 사전 중 적어도 하나를 포함할 수 있다.
다양한 실시예들에 따르면, 프로세서(140)는, 속성에 대한 감정 점수를 고객 요구사항으로 활용하여, 신규 제품의 대안 설계를 수행하도록 구성될 수 있다.
이상에서 설명된 장치는 하드웨어 구성 요소, 소프트웨어 구성 요소, 및/또는 하드웨어 구성 요소 및 소프트웨어 구성 요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성 요소는, 프로세서, 컨트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 컨트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성 요소(component), 물리적 장치, 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
다양한 실시예들에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터-판독 가능 매체에 기록될 수 있다. 이 때, 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 그리고, 매체는 단일 또는 수 개의 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 어플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 해당 실시 예의 다양한 변경, 균등물, 및/또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성 요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및/또는 B 중 적어도 하나", "A, B 또는 C" 또는 "A, B 및/또는 C 중 적어도 하나" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", "첫째" 또는 "둘째" 등의 표현들은 해당 구성 요소들을, 순서 또는 중요도에 상관없이 수식할 수 있고, 한 구성 요소를 다른 구성 요소와 구분하기 위해 사용될 뿐 해당 구성 요소들을 한정하지 않는다. 어떤(예: 제 1) 구성 요소가 다른(예: 제 2) 구성 요소에 "(기능적으로 또는 통신적으로) 연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성 요소가 상기 다른 구성 요소에 직접적으로 연결되거나, 다른 구성 요소(예: 제 3 구성 요소)를 통하여 연결될 수 있다.
본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구성된 유닛을 포함하며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 모듈은 ASIC(application-specific integrated circuit)으로 구성될 수 있다.
다양한 실시예들에 따르면, 기술한 구성 요소들의 각각의 구성 요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성 요소들 중 하나 이상의 구성 요소들 또는 단계들이 생략되거나, 또는 하나 이상의 다른 구성 요소들 또는 단계들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성 요소들(예: 모듈 또는 프로그램)은 하나의 구성 요소로 통합될 수 있다. 이런 경우, 통합된 구성 요소는 복수의 구성 요소들 각각의 구성 요소의 하나 이상의 기능들을 통합 이전에 복수의 구성 요소들 중 해당 구성 요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 단계들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 단계들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 단계들이 추가될 수 있다.

Claims (11)

  1. 컴퓨터 장치의 방법에 있어서,
    상품평 데이터로부터의 토큰들에서 적어도 하나의 속성과 적어도 하나의 감성어를 추출하는 단계;
    상기 속성과 상기 감성어 사이의 관계 세트를 구축하는 단계; 및
    상기 관계 세트에 기반하여 상기 속성에 대한 감성 점수를 평가하는 단계
    를 포함하고,
    상기 속성은 제품을 직접 또는 간접적으로 지칭하는 표현, 또는 상기 제품의 특성이나 성능을 나타내는 표현 중 적어도 하나를 포함하고,
    상기 감성어는 상기 제품의 소비자의 감성을 나타내는 표현인,
    방법.
  2. 제 1 항에 있어서,
    상기 속성과 상기 감성어를 추출하는 단계는,
    상기 상품평 데이터로부터 추출되는 각 문장에서 분리되는 토큰들에 대해, 상기 속성과 상기 감성어를 추출하는,
    방법.
  3. 제 2 항에 있어서,
    상기 속성과 상기 감성어를 추출하는 단계는,
    상기 문장에 상기 속성과 상기 감성어가 모두 있는 경우, 상기 속성과 상기 감성어를 추출하는 단계; 및
    상기 문장에 상기 감성어만 있는 경우, 상기 감성어에 기반하여 상기 속성을 추론함으로써, 상기 속성과 상기 감성어를 추출하는 단계
    를 포함하는,
    방법.
  4. 제 1 항에 있어서,
    상기 속성에 대한 상기 감성 점수를 평가하는 단계는,
    미리 구축된 감성 사전 시스템을 이용하여, 상기 관계 세트 내에서 상기 속성에 대한 상기 감성어를 수치화함으로써, 상기 감성 점수를 도출하는 단계
    를 포함하고,
    상기 감성 사전 시스템은,
    감성어 자체를 점수화하기 위한 감성 사전, 감성어에서의 부정적 표현을 점수화하기 위한 감성 사전, 감성어에서의 증폭 부사를 점수화하기 위한 감성 사전, 속성과 감성어의 조합에 따라 감성어를 점수화하기 위한 감성 사전, 또는 복수의 감성어들의 조합을 점수화하기 위한 감성 사전 중 적어도 하나를 포함하는,
    방법.
  5. 제 1 항에 있어서,
    상기 속성에 대한 상기 감정 점수를 고객 요구사항으로 활용하여, 신규 제품의 대안 설계를 수행하는 단계
    를 더 포함하는,
    방법.
  6. 컴퓨터 장치에 있어서,
    메모리; 및
    상기 메모리와 연결되고, 상기 메모리에 저장된 적어도 하나의 명령을 실행하도록 구성되는 프로세서를 포함하고,
    상기 프로세서는,
    상품평 데이터로부터의 토큰들에서 적어도 하나의 속성과 적어도 하나의 감성어를 추출하고,
    상기 속성과 상기 감성어 사이의 관계 세트를 구축하고,
    상기 관계 세트에 기반하여 상기 속성에 대한 감성 점수를 평가하도록 구성되고,
    상기 속성은 제품을 직접 또는 간접적으로 지칭하는 표현, 또는 상기 제품의 특성이나 성능을 나타내는 표현 중 적어도 하나를 포함하고,
    상기 감성어는 상기 제품의 소비자의 감성을 나타내는 표현인,
    컴퓨터 장치.
  7. 제 6 항에 있어서,
    상기 프로세서는,
    상기 상품평 데이터로부터 추출되는 각 문장에서 분리되는 토큰들에 대해, 상기 속성과 상기 감성어를 추출하도록 구성되는,
    컴퓨터 장치.
  8. 제 7 항에 있어서,
    상기 프로세서는,
    상기 문장에 상기 속성과 상기 감성어가 모두 있는 경우, 상기 속성과 상기 감성어를 추출하고,
    상기 문장에 상기 감성어만 있는 경우, 상기 감성어에 기반하여 상기 속성을 추론함으로써, 상기 속성과 상기 감성어를 추출하도록 구성되는,
    컴퓨터 장치.
  9. 제 6 항에 있어서,
    상기 프로세서는,
    미리 구축된 감성 사전 시스템을 이용하여, 상기 관계 세트 내에서 상기 속성에 대한 상기 감성어를 수치화함으로써, 상기 감성 점수를 도출하도록 구성되고,
    상기 감성 사전 시스템은,
    감성어 자체를 점수화하기 위한 감성 사전, 감성어에서의 부정적 표현을 점수화하기 위한 감성 사전, 감성어에서의 증폭 부사를 점수화하기 위한 감성 사전, 속성과 감성어의 조합에 따라 감성어를 점수화하기 위한 감성 사전, 또는 복수의 감성어들의 조합을 점수화하기 위한 감성 사전 중 적어도 하나를 포함하는,
    컴퓨터 장치.
  10. 제 6 항에 있어서,
    상기 프로세서는,
    상기 속성에 대한 상기 감정 점수를 고객 요구사항으로 활용하여, 신규 제품의 대안 설계를 수행하도록 구성되는,
    컴퓨터 장치.
  11. 컴퓨터 장치에 방법을 실행시키기 위해 비-일시적인 컴퓨터 판독 가능한 기록 매체에 저장되는 컴퓨터 프로그램에 있어서,
    상기 방법은,
    상품평 데이터로부터의 토큰들에서 적어도 하나의 속성과 적어도 하나의 감성어를 추출하는 단계;
    상기 속성과 상기 감성어 사이의 관계 세트를 구축하는 단계; 및
    상기 관계 세트에 기반하여 상기 속성에 대한 감성 점수를 평가하는 단계
    를 포함하고,
    상기 속성은 제품을 직접 또는 간접적으로 지칭하는 표현, 또는 상기 제품의 특성이나 성능을 나타내는 표현 중 적어도 하나를 포함하고,
    상기 감성어는 상기 제품의 소비자의 감성을 나타내는 표현인,
    컴퓨터 프로그램.
KR1020220086360A 2022-07-13 2022-07-13 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법 KR102646613B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220086360A KR102646613B1 (ko) 2022-07-13 2022-07-13 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220086360A KR102646613B1 (ko) 2022-07-13 2022-07-13 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법

Publications (2)

Publication Number Publication Date
KR20240009192A true KR20240009192A (ko) 2024-01-22
KR102646613B1 KR102646613B1 (ko) 2024-03-13

Family

ID=89716553

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220086360A KR102646613B1 (ko) 2022-07-13 2022-07-13 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법

Country Status (1)

Country Link
KR (1) KR102646613B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018010570A (ja) * 2016-07-15 2018-01-18 Kddi株式会社 感情要因推定支援装置、感情要因推定支援方法及び感情要因推定支援用プログラム
KR20200048693A (ko) * 2018-10-30 2020-05-08 삼성에스디에스 주식회사 감성 분석 시스템 및 그 방법
KR20210047229A (ko) * 2019-10-21 2021-04-29 배재대학교 산학협력단 구매 우선순위와 상품 리뷰 감성분석을 반영한 상품 추천 시스템 및 방법
KR20220000485A (ko) * 2020-06-26 2022-01-04 주식회사 드림아이디어소프트 온라인 쇼핑몰 후기 데이터를 이용한 사용자 추론 및 감성 분석 시스템 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018010570A (ja) * 2016-07-15 2018-01-18 Kddi株式会社 感情要因推定支援装置、感情要因推定支援方法及び感情要因推定支援用プログラム
KR20200048693A (ko) * 2018-10-30 2020-05-08 삼성에스디에스 주식회사 감성 분석 시스템 및 그 방법
KR20210047229A (ko) * 2019-10-21 2021-04-29 배재대학교 산학협력단 구매 우선순위와 상품 리뷰 감성분석을 반영한 상품 추천 시스템 및 방법
KR20220000485A (ko) * 2020-06-26 2022-01-04 주식회사 드림아이디어소프트 온라인 쇼핑몰 후기 데이터를 이용한 사용자 추론 및 감성 분석 시스템 및 방법

Also Published As

Publication number Publication date
KR102646613B1 (ko) 2024-03-13

Similar Documents

Publication Publication Date Title
Zhou et al. A machine learning approach to customer needs analysis for product ecosystems
Liu et al. Assessing product competitive advantages from the perspective of customers by mining user-generated content on social media
CN108491377B (zh) 一种基于多维度信息融合的电商产品综合评分方法
Singla et al. Statistical and sentiment analysis of consumer product reviews
Zhang et al. Product sales forecasting using macroeconomic indicators and online reviews: a method combining prospect theory and sentiment analysis
Shah et al. Sentiment analysis
KR20190125153A (ko) 텍스트 기반 사용자심리상태예측 및 콘텐츠추천 장치 및 그 방법
US10387568B1 (en) Extracting keywords from a document
Tang et al. Generating behavior features for cold-start spam review detection with adversarial learning
CN110795913B (zh) 一种文本编码方法、装置、存储介质及终端
CN106611375A (zh) 一种基于文本分析的信用风险评估方法及装置
WO2018184518A1 (zh) 微博数据处理方法、装置、计算机设备及存储介质
CN108319734A (zh) 一种基于线性组合器的产品特征结构树自动构建方法
Etikala et al. Text2Dec: extracting decision dependencies from natural language text for automated DMN decision modelling
CN111563377A (zh) 数据增强方法与装置
Oh et al. Asymmetric effect of feature level sentiment on product rating: an application of bigram natural language processing (NLP) analysis
Gaye et al. Sentimental analysis for online reviews using machine learning algorithms
Jain et al. E-commerce review sentiment score prediction considering misspelled words: A deep learning approach
CN114022192A (zh) 一种基于智能营销场景的数据建模方法及系统
Chatterjee et al. Examining the Dimensions of Adopting Natural Language Processing and Big Data Analytics Applications in Firms
Shou et al. Predictions on usefulness and popularity of online reviews: evidence from mobile phones for older adults
KR102646613B1 (ko) 딥러닝 기반 온라인 상품평에 대한 속성 기반 감성 분석 및 제품 개발에 적용을 위한 컴퓨터 장치 및 그의 방법
CN115828914A (zh) 一种考虑用户属性偏好的满意度评估方法
JP6936370B1 (ja) 情報処理システム、及び情報処理プログラム
JP2019133563A (ja) 情報処理装置および情報処理システム