KR20190048781A - 온라인 의견 정보 수집 및 분석 시스템 - Google Patents

온라인 의견 정보 수집 및 분석 시스템 Download PDF

Info

Publication number
KR20190048781A
KR20190048781A KR1020170143990A KR20170143990A KR20190048781A KR 20190048781 A KR20190048781 A KR 20190048781A KR 1020170143990 A KR1020170143990 A KR 1020170143990A KR 20170143990 A KR20170143990 A KR 20170143990A KR 20190048781 A KR20190048781 A KR 20190048781A
Authority
KR
South Korea
Prior art keywords
user
information
opinion
opinion information
late
Prior art date
Application number
KR1020170143990A
Other languages
English (en)
Inventor
배지은
Original Assignee
(주) 애드잇
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주) 애드잇 filed Critical (주) 애드잇
Priority to KR1020170143990A priority Critical patent/KR20190048781A/ko
Publication of KR20190048781A publication Critical patent/KR20190048781A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • G06F17/27
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0278Product appraisal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 제품 또는 서비스를 사용하는 사용자와 제품 또는 서비스를 제공하는 사업자가 모두 신뢰할 수 있고, 더 개선된 제품 또는 서비스를 추구할 수 있는 방향성을 모색할 수 있도록 해주는 온라인 의견 정보 수집 및 분석 시스템을 제공한다.

Description

온라인 의견 정보 수집 및 분석 시스템{System for crawling and analyzing online reviews about merchandise or service}
본 발명은 온라인 의견 정보 수집 및 분석 시스템에 관한 것으로, 보다 상세하게는 제품 또는 서비스를 사용하는 사용자와 제품 또는 서비스를 제공하는 사업자가 모두 신뢰할 수 있고, 더 개선된 제품 또는 서비스를 추구할 수 있는 방향성을 모색할 수 있도록 해주는 온라인 의견 정보 수집 및 분석 시스템에 관한 것이다.
최근 인터넷으로 대표되는 네트워크 기술이 발전함에 따라 온라인 웹사이트 상의 게시판을 비롯하여 블로그, 카페 및 소셜 네트워크 서비스(SNS)와 같이 다양한 소셜 네트워크 환경을 통해 사용자 자신의 의견 등을 표현하고 있다.
한국공개특허 제10-2012-0105602호에는 온라인에서의 사용자 의견 정보 분석 시스템 및 이를 이용한 온라인 활동 분석 방법에 대하여 기재되어 있다. 온라인에서 사용자 의견 정보를 추출하고 추출한 사용자 의견 정보의 유형 및 사용자 의견 정보가 노출되는 채널 종류에 따라 가중치를 부여하여 사용자 의견 정보들이 특정 기업의 제품 또는 서비스에 대하여 어떤 영향을 미치는지 그 효과의 크기를 지능적으로 정량화하고 정량화된 결과를 비율 기반의 분석 지수와 결합하여 특정 관심 영역에서의 온라인 활동 경향을 분석하는 내용을 개시하고 있다.
한국등록특허 제10-1532252호에는 소셜 네트워크 정보를 실시간으로 수집 및 분석함에 있어서, 소셜 네트워크 상에 존재하는 다양한 유형의 문서나 정보를 모두 수용할 수 있고, 이용자의 필요에 따라 적응적으로 분석 결과를 제공할 수 있는 소셜 네트워크 정보 수집 및 분석 시스템을 개시하고 있다.
그러나 현재 특정 제품 또는 서비스를 직접 사용해 본 경험적 사실에 근거하여 해당 제품 또는 서비스를 추천·보증하는 ‘진성 후기’와 특정 제품 또는 서비스에 대해 추천·보증하는 내용이 광고주와 경제적 이해관계가 존재하는 ‘대가성 후기’를 분류하는 기술은 아직 개발되지 않고 있다. ‘진성 후기’와 ‘대가성 후기’는 특정 제품 또는 서비스에 대해, 사용자 및 사업자가 신뢰성과 방향성을 형성함에 있어서 전혀 다른 효과를 발생시킨다. 이에 ‘진성 후기’와 ‘대가성 후기’를 분류하고 ‘진성 후기’와 ‘대가성 후기’에 대한 분석 결과를 제공할 수 있는 기술이 필요한 실정이다.
한국공개특허 제10-2012-0105602호(공개일 2012.09.26) 한국등록특허 제10-1532252호(등록일 2015.06.23)
본 발명은 상기와 같은 배경에서 제안된 것으로, 제품 또는 서비스를 사용하는 사용자와 제품 또는 서비스를 제공하는 사업자가 모두 신뢰할 수 있고, 더 개선된 제품 또는 서비스를 추구할 수 있는 방향성을 모색할 수 있도록 해주는 온라인 의견 정보 수집 및 분석 시스템을 제공한다.
본 발명의 다른 목적들은 이하의 실시예에 대한 설명을 통해 쉽게 이해될 수 있을 것이다.
상기와 같은 목적을 달성하기 위하여, 본 발명에 따른 온라인 의견 정보 수집 및 분석 시스템은, 블로그, 카페, 게시판, 및 소셜 네트워킹 사이트를 포함하는 복수의 웹 서버로부터 사업자가 제공하는 제품 또는 서비스에 대한 사용자들의 의견 정보를 수집하는 데이터 수집부와;
상기 데이터 수집부에서 수집한 사용자 의견 정보가 진성 후기인지 대가성 후기인지를 판단하고, 판단결과에 따라 진성 후기에 해당하는 사용자 의견 정보와 대가성 후기에 해당하는 사용자 의견 정보를 분류해 사용자 의견 데이터베이스에 저장하는 사용자 의견정보 분석부와;
상기 진성 후기에 해당하는 사용자 의견 정보에서 사용자의 감정어를 추출한 후 상기 감정어에 대하여 긍정, 중립, 또는 부정 여부를 판단하고, 판단결과에 따라 긍정에 해당하는 사용자 의견 정보와 중립에 해당하는 사용자 의견 정보와 부정에 해당하는 사용자 의견 정보를 분류해 진성후기분석 데이터베이스에 저장하는 진성 후기 분석처리부와;
상기 진성후기분석 데이터베이스와 사용자 의견 데이터베이스에 저장된 데이터를 이용하여 특정 제품 또는 서비스에 대한 사용자 화면정보 또는 사업자 화면정보를 생성하고, 생성된 사용자 화면정보 또는 사업자 화면정보를 사용자 단말기 또는 사업자 단말기에 제공하는 화면정보 처리부를 포함한다.
본 발명에 따르면 사용자 의견정보 분석부는 사용자 의견 정보에 본문과 구별되는 시작 문구 또는 마지막 문구가 포함되어 있는지를 판단하고, 판단결과 긍정이면 상기 사용자 의견 정보를 대가성 후기로 분류하는 것을 특징으로 한다.
본 발명에 따르면 사용자 의견정보 분석부는 사용자 의견 정보에 포함된 시작 문구 또는 마지막 문구가 경제적 이해관계를 표시하는 문구인지를 판단하고, 판단결과 긍정이면 상기 사용자 의견 정보를 대가성 후기로 분류하는 것을 특징으로 한다.
본 발명에 따르면 사용자 의견정보 분석부는 사용자 의견 정보에 포함된 시작 문구 또는 마지막 문구의 글자 크기가 상기 본문의 글자 크기보다 크거나 글자색이 다른지를 판단하고, 판단결과 긍정이면 사용자 의견 정보를 대가성 후기로 분류하는 것을 특징으로 한다.
본 발명에 따르면 화면정보 처리부는 사용자 의견 정보에 대해 긍정과 중립과 부정의 비율을 나타내는 그래프와, 진성 후기에 해당하는 사용자 의견 정보 중, 긍정에 해당하는 사용자 의견 정보와 중립에 해당하는 사용자 의견 정보와 부정에 해당하는 사용자 의견 정보와 해당 사용자 의견 정보가 게재된 웹 사이트 정보와, 대가성 후기에 해당하는 사용자 의견 정보를 포함하는 사용자 화면정보를 생성하는 것을 특징으로 한다.
본 발명에 따르면 화면정보 처리부는 사용자 의견 정보를 작성한 사용자의 성별 비율에 대한 그래프와, 진성 후기와 대가성 후기 비율에 대한 그래프와, 일자별 사용자 의견 정보 작성현황에 대한 그래프와, 소셜 네트워킹 사이트별 진성 후기 작성 개수 및 비율에 대한 그래프와, 긍정과 중립과 부정에 대한 키워드 분포도에 대한 그래프와, 소셜 네트워킹 사이트별 진성 후기에 해당하는 사용자 의견 정보에 대한 ‘상세보기’아이콘을 포함하는 사업자 화면정보를 생성하는 것을 특징으로 한다.
상술한 바와 같이 본 발명에 따른 온라인 의견 정보 수집 및 분석 시스템에 따르면, 사용자 의견정보를‘진성 후기’와 ‘대가성 후기’를 분류하고 ‘진성 후기’와 ‘대가성 후기’에 대한 분석 결과를 제공하도록 구현됨으로써, 제품 또는 서비스를 사용하는 사용자와 제품 또는 서비스를 제공하는 사업자가 사용자 의견 정보와 그 분석 결과를 모두 신뢰할 수 있고, 더 개선된 제품 또는 서비스를 추구할 수 있는 방향성을 모색할 수 있도록 해준다.
본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 후술하는 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니된다.
도 1 은 본 발명의 온라인 의견 정보 수집 및 분석 시스템(100)의 구성을 설명하기 위한 예시도이다.
도 2 는 본 발명의 온라인 의견 정보 수집 및 분석 시스템에서 진성 후기로 분류된 사용자 의견 정보를 설명하기 위한 예시도이다.
도 3 은 본 발명의 온라인 의견 정보 수집 및 분석 시스템에서 생성하는 사용자 화면정보를 설명하기 위한 예시도이다.
도 4 는 본 발명의 온라인 의견 정보 수집 및 분석 시스템에서 생성하는 사업자 화면정보를 설명하기 위한 예시도이다.
본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로서, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 본 명세서에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 나타낸다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미가 있는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부된 도면을 참조하여 전술한, 그리고 추가적인 양상을 기술되는 바람직한 실시예를 통하여 본 발명을 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.
본 발명의 온라인 의견 정보 수집 및 분석 시스템(100)은 도 1 에 도시한 바와 같이, 데이터 수집부(110)와 사용자 의견정보 분석부(130)와 진성 후기 분석처리부(150)와 화면정보 처리부(170)를 포함하여 구현될 수 있다.
데이터 수집부(110)는 웹 크롤러(Web Crawler)로 구현될 수 있다. 웹 크롤러(Web Crawler)는 웹 사이트에서 그 사이트의 콘텐츠를 복사하고 가져오는 작업을 처리한다. 웹 크롤러(Web Crawler)는 사용자 의견 정보(제목, 본문, 태그, URL, 이미지 등) 정보를 HTML Tag를 이용해 수집한다. 사용자 의견 데이터베이스(120)에는 웹 크롤링 대상이 되는 웹 페이지의 구조 데이터가 저장될 수 있다. 웹 크롤러(Web Crawler)는 웹 페이지의 구조를 이용하여 데이터를 수집함으로써 기존의 URL link를 따라 HTML 문서의 모든 내용을 수집하는 일반적 웹 크롤러와 달리 특정 데이터만 추출한다. 데이터 수집부(110)는 JSOAP HTML 파싱 라이브러리를 이용한다.
데이터 수집부(110)는 블로그, 카페, 게시판, 및 소셜 네트워킹 사이트를 포함하는 복수의 웹 서버(11, 12)로부터 사업자가 제공하는 제품 또는 서비스에 대한 사용자들의 의견 정보를 수집한다. 사용자 의견 정보는 블로그, 카페, 게시판, 및 소셜 네트워킹 사이트에 게재된 문서, 게재된 문서에 부가된 게시물인 댓글, 상품평을 포함한다.
사용자 의견정보 분석부(130)는 데이터 수집부(110)에서 수집한 사용자 의견 정보를 전처리하고 범주화한다. 전처리는 문서로부터 불필요한 기호, 숫자, TAG 등을 제거하는 과정이다. 사용자 의견정보 분석부(130)는 사용자 의견 정보에서 문장 분리 및 형태소 분석을 수행한다. 문장 분리는 마침표와 같은 문장 부호에 기반하여 수행되며, 오픈 소스 형태소 분석 엔진인 MeCab-ko-dic 사용하여 형태소 분석한국어 형태소 분석을 수행한다.
범주화(Categorization)는 텍스트 마이닝 분석을 위한 중간단계로 텍스트 마이닝 도구(tools)나 알고리즘을 활용하기 위해 비구조적 문서를 구조적 문서로 조직화시켜 유사한 내용의 문서를 그룹화하는 것이다. 사용자 의견정보 분석부(130)는 단어 필터, 형태소 필터 또는 의미 필터를 통해 텍스트 범주화를 수행할 수 있다. 단어 필터는 전통적인 방식의 필터링으로, 분류의 근거가 되는 단어/패턴/속성을 이용한다. 형태소 필터는 자연언어처리(NLP)의 형태소 문법 패턴을 이용하여 분류의 근거가 되는 문법 패턴을 이용한다. 의미 필터는 기계학습을 이용한 방식으로 학습 데이터로 만든 모델를 이용한다.
사용자 의견정보 분석부(130)는 데이터 수집부(110)에서 수집한 사용자 의견 정보가 진성 후기인지 대가성 후기인지를 판단한다. 도 2를 참조하면, 사용자 의견정보 분석부(130)는 사용자 의견 정보에 본문(132)과 구별되는 시작 문구(132) 또는 마지막 문구가 있는지를 판단한다. 사용자 의견정보 분석부(130)는 판단결과에 따라 진성 후기에 해당하는 사용자 의견 정보와 대가성 후기에 해당하는 사용자 의견 정보를 분류해 사용자 의견 데이터베이스(120)에 저장한다.
사용자 의견정보 분석부(130)는 일례로, 사용자 의견 정보에 본문과 구별되는 시작 문구 또는 마지막 문구가 경제적 이해관계를 표시하는 문구인지를 판단한다. 예를 들어, 파워블로거가 B 기업의 20만원짜리 살균세척기의 공동구매를 주선하기 위해 자신의 블로그에 추천글을 게재하면서 B 기업으로부터 수수료를 받기로 한 경우 본문과 구별되는 시작 문구 또는 마지막 문구에‘저는 해당제품의 공동구매를 주선하기 위해 추천글을 게재하면서 B 기업으로부터 일정 수수료를 받기로 함’이라는 문구가 포함된다. 다른 예로, A포털사이트 이용자 B가 전체 공개된 인터넷 카페 또는 포털사이트의 질의응답 게시판에 C사와 관련된 상품 등의 추천·보증글 또는 답변글을 게재하고 C사로부터 수수료를 받기로 한 경우 본문과 구별되는 시작 문구 또는 마지막 문구에 ‘유료광고’, ‘대가성 광고’라는 문구가 포함된다.
사용자 의견정보 분석부(130)는 사용자 의견 정보에 본문과 구별되는 시작 문구 또는 마지막 문구가 경제적 이해관계를 표시하는 문구를 포함하면 사용자 의견 정보를 대가성 후기로 분류하도록 구현될 수 있다.
사용자 의견정보 분석부(130)는 도 2를 참조하면, 본문(132)과 구별되는 시작 문구(131)의 글자 크기가 본문(132)의 글자 크기보다 크거나 글자색이 다른지를 판단하고, 판단결과 긍정이면 사용자 의견 정보를 대가성 후기로 분류하도록 구현될 수 있다.
진성 후기 분석처리부(150)는 진성 후기에 해당하는 사용자 의견 정보에서 사용자의 감정어를 추출한다. 진성 후기 분석처리부(150)는 감정어에 대하여 긍정, 중립, 또는 부정 여부를 판단하고, 판단결과에 따라 긍정에 해당하는 사용자 의견 정보와 중립에 해당하는 사용자 의견 정보와 부정에 해당하는 사용자 의견 정보를 분류해 진성후기분석 데이터베이스(160)에 저장한다.
진성 후기 분석처리부(150)는 레빈쉬타인 거리(Levenshtein Distance), PMI(pointwise Mutual Information), 지지벡터기계(SVMs, Support Vector Machines)와 나이브 베이즈(Naive Bayes)와 같은 관련 기술을 사용할 수 있다.
화면정보 처리부(170)는 진성후기분석 데이터베이스(160)와 사용자 의견 데이터베이스(120)에 저장된 데이터를 이용하여 특정 제품 또는 서비스에 대해 사용 화면정보 또는 사업자 화면정보를 생성하고, 생성된 사용자 화면정보 또는 사업자 화면정보를 사용자 단말기 또는 사업자 단말기에 제공한다.
화면정보 처리부(170)는 도 3을 참조하면 사용자 의견 정보에 대해 긍정과 중립과 부정의 비율을 나타내는 그래프(①), 진성 후기에 해당하는 사용자 의견 정보 중, 긍정에 해당하는 사용자 의견 정보(②)와 중립에 해당하는 사용자 의견 정보(④)와 부정에 해당하는 사용자 의견 정보(⑥)와 해당 사용자 의견 정보가 게재된 웹 사이트 정보(③, ⑤, ⑦)와, 대가성 후기(⑧)에 해당하는 사용자 의견 정보를 포함하는 사용자 화면정보를 생성할 수 있다.
화면정보 처리부(170)는 도 4를 참조하면 사용자 의견 정보를 작성한 사용자의 성별 비율에 대한 그래프(①), 진성 후기와 대가성 후기 비율에 대한 그래프(②), 지역별 사용자 의견 정보 작성 인원에 대한 그래프(③), 일자별 사용자 의견 정보 작성현황에 대한 그래프(④), 소셜 네트워킹 사이트별 진성 후기 작성 개수 및 비율에 대한 그래프(⑤), 긍정과 중립과 부정에 대한 비율 값(⑥), 긍정과 중립과 부정에 대한 키워드 분포도에 대한 그래프(⑦), 소셜 네트워킹 사이트(페이스북, 카카오 스토리, 네이버블로그, 인스타그램)별 진성 후기에 해당하는 사용자 의견 정보에 대한 ‘상세보기’아이콘(⑧, ⑨)을 포함하는 사업자 화면정보를 생성할 수 있다.
지금까지, 본 명세서에는 본 발명이 속하는 기술 분야에서 통상의 지식을 지닌 자가 본 발명을 용이하게 이해하고 재현할 수 있도록 도면에 도시한 실시예들을 참고로 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술분야에 통상의 지식을 지닌 자라면 본 발명의 실시예들로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부된 청구범위에 의해서만 정해져야 할 것이다.

Claims (6)

  1. 블로그, 카페, 게시판, 및 소셜 네트워킹 사이트를 포함하는 복수의 웹 서버로부터 사업자가 제공하는 제품 또는 서비스에 대한 사용자들의 의견 정보를 수집하는 데이터 수집부와;
    상기 데이터 수집부에서 수집한 사용자 의견 정보가 진성 후기인지 대가성 후기인지를 판단하고, 판단결과에 따라 진성 후기에 해당하는 사용자 의견 정보와 대가성 후기에 해당하는 사용자 의견 정보를 분류해 사용자 의견 데이터베이스에 저장하는 사용자 의견정보 분석부와;
    상기 진성 후기에 해당하는 사용자 의견 정보에서 사용자의 감정어를 추출한 후 상기 감정어에 대하여 긍정, 중립, 또는 부정 여부를 판단하고, 판단결과에 따라 긍정에 해당하는 사용자 의견 정보와 중립에 해당하는 사용자 의견 정보와 부정에 해당하는 사용자 의견 정보를 분류해 진성후기분석 데이터베이스에 저장하는 진성 후기 분석처리부와;
    상기 진성후기분석 데이터베이스와 사용자 의견 데이터베이스에 저장된 데이터를 이용하여 특정 제품 또는 서비스에 대한 사용자 화면정보 또는 사업자 화면정보를 생성하고, 생성된 사용자 화면정보 또는 사업자 화면정보를 사용자 단말기 또는 사업자 단말기에 제공하는 화면정보 처리부;
    를 포함하는 온라인 의견 정보 수집 및 분석 시스템.
  2. 청구항 1 에 있어서,
    상기 사용자 의견정보 분석부는,
    상기 사용자 의견 정보에 본문과 구별되는 시작 문구 또는 마지막 문구가 포함되어 있는지를 판단하고, 판단결과 긍정이면 상기 사용자 의견 정보를 대가성 후기로 분류하는 것,
    을 특징으로 하는 온라인 의견 정보 수집 및 분석 시스템.
  3. 청구항 2 에 있어서,
    상기 사용자 의견정보 분석부는,
    상기 시작 문구 또는 마지막 문구가 경제적 이해관계를 표시하는 문구인지를 판단하고, 판단결과 긍정이면 상기 사용자 의견 정보를 대가성 후기로 분류하는 것,
    을 특징으로 하는 온라인 의견 정보 수집 및 분석 시스템.
  4. 청구항 2 에 있어서,
    상기 사용자 의견정보 분석부는,
    상기 본문과 구별되는 시작 문구 또는 마지막 문구의 글자 크기가 상기 본문의 글자 크기보다 크거나 글자색이 다른지를 판단하고, 판단결과 긍정이면 상기 사용자 의견 정보를 대가성 후기로 분류하는 것,
    을 특징으로 하는 온라인 의견 정보 수집 및 분석 시스템.
  5. 청구항 1 에 있어서,
    상기 화면정보 처리부는,
    사용자 의견 정보에 대해 긍정과 중립과 부정의 비율을 나타내는 그래프와,
    진성 후기에 해당하는 사용자 의견 정보 중, 긍정에 해당하는 사용자 의견 정보와 중립에 해당하는 사용자 의견 정보와 부정에 해당하는 사용자 의견 정보와 해당 사용자 의견 정보가 게재된 웹 사이트 정보와,
    대가성 후기에 해당하는 사용자 의견 정보를 포함하는 사용자 화면정보를 생성하는 것,
    을 특징으로 하는 온라인 의견 정보 수집 및 분석 시스템.
  6. 청구항 1 에 있어서,
    상기 화면정보 처리부는,
    상기 사용자 의견 정보를 작성한 사용자의 성별 비율에 대한 그래프와,
    진성 후기와 대가성 후기 비율에 대한 그래프와,
    일자별 사용자 의견 정보 작성현황에 대한 그래프와,
    소셜 네트워킹 사이트별 진성 후기 작성 개수 및 비율에 대한 그래프와,
    긍정과 중립과 부정에 대한 키워드 분포도에 대한 그래프와,
    소셜 네트워킹 사이트별 진성 후기에 해당하는 사용자 의견 정보에 대한 ‘상세보기’아이콘을 포함하는 사업자 화면정보를 생성하는 것,
    을 특징으로 하는 온라인 의견 정보 수집 및 분석 시스템.
KR1020170143990A 2017-10-31 2017-10-31 온라인 의견 정보 수집 및 분석 시스템 KR20190048781A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170143990A KR20190048781A (ko) 2017-10-31 2017-10-31 온라인 의견 정보 수집 및 분석 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170143990A KR20190048781A (ko) 2017-10-31 2017-10-31 온라인 의견 정보 수집 및 분석 시스템

Publications (1)

Publication Number Publication Date
KR20190048781A true KR20190048781A (ko) 2019-05-09

Family

ID=66546673

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170143990A KR20190048781A (ko) 2017-10-31 2017-10-31 온라인 의견 정보 수집 및 분석 시스템

Country Status (1)

Country Link
KR (1) KR20190048781A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210044017A (ko) 2019-10-14 2021-04-22 한양대학교 산학협력단 상품 리뷰 다차원 분석 방법 및 그 장치
KR102259358B1 (ko) * 2019-11-28 2021-06-02 (주)양유 신규 브랜드 크리에이팅 시스템 및 방법
KR102307662B1 (ko) * 2020-09-24 2021-09-30 윤성민 상품 정보 제공 시스템 및 그 방법
KR20230049935A (ko) * 2021-10-07 2023-04-14 문예진 뒷광고 리스크 관리를 이용한 sns 광고 콘텐츠 제공 장치 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120105602A (ko) 2011-03-11 2012-09-26 에스케이플래닛 주식회사 온라인 상에서의 사용자 의견 정보 분석 시스템 및 이를 이용한 온라인 활동 분석 방법
KR101532252B1 (ko) 2013-08-23 2015-07-01 (주)타파크로스 소셜 네트워크 정보 수집 및 분석 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120105602A (ko) 2011-03-11 2012-09-26 에스케이플래닛 주식회사 온라인 상에서의 사용자 의견 정보 분석 시스템 및 이를 이용한 온라인 활동 분석 방법
KR101532252B1 (ko) 2013-08-23 2015-07-01 (주)타파크로스 소셜 네트워크 정보 수집 및 분석 시스템

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210044017A (ko) 2019-10-14 2021-04-22 한양대학교 산학협력단 상품 리뷰 다차원 분석 방법 및 그 장치
KR102259358B1 (ko) * 2019-11-28 2021-06-02 (주)양유 신규 브랜드 크리에이팅 시스템 및 방법
KR102307662B1 (ko) * 2020-09-24 2021-09-30 윤성민 상품 정보 제공 시스템 및 그 방법
WO2022065812A1 (ko) * 2020-09-24 2022-03-31 윤성민 상품정보 제공을 위한 전자상거래관리컴퓨터, 상품정보관리컴퓨터 및 상품정보제공방법
KR20230049935A (ko) * 2021-10-07 2023-04-14 문예진 뒷광고 리스크 관리를 이용한 sns 광고 콘텐츠 제공 장치 및 방법

Similar Documents

Publication Publication Date Title
Manek et al. Aspect term extraction for sentiment analysis in large movie reviews using Gini Index feature selection method and SVM classifier
Garimella et al. Quantifying controversy on social media
Riaz et al. Opinion mining on large scale data using sentiment analysis and k-means clustering
US10748164B2 (en) Analyzing sentiment in product reviews
Heydari et al. Detection of fake opinions using time series
US9990356B2 (en) Device and method for analyzing reputation for objects by data mining
US7788086B2 (en) Method and apparatus for processing sentiment-bearing text
US7788087B2 (en) System for processing sentiment-bearing text
KR101361992B1 (ko) 발전된 탐색 결과 페이지 콘텐츠를 제공하는 시스템 및 방법
Kim et al. Opinion-mining methodology for social media analytics
Lopez Barbosa et al. Evaluating hotels rating prediction based on sentiment analysis services
Bhatia et al. Sentiment analysis and mining of opinions
KR20120108095A (ko) 소셜 데이터 분석 시스템
KR20190048781A (ko) 온라인 의견 정보 수집 및 분석 시스템
JP6529133B2 (ja) 複数地域でのトピックの評価を分析する装置、プログラム及び方法
Potthast et al. Information retrieval in the commentsphere
JP4970919B2 (ja) 閲覧対象情報の評価システム、方法、およびプログラム
Chen et al. Research on credit evaluation model of online store based on SnowNLP
Rahman et al. Social crisis detection using Twitter based text mining-a machine learning approach
Pappas et al. Extracting informative textual parts from web pages containing user-generated content
Sheikhattar et al. A thematic analysis–based model for identifying the impacts of natural crises on a supply chain for service integrity: A text analysis approach
KR101850853B1 (ko) 빅데이터를 이용한 검색 방법 및 장치
Masood et al. Semantic analysis to identify students’ feedback
Chakraborty et al. Text mining and analysis
Rao et al. Product insights: Analyzing product intents in web search

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application