KR101730883B1 - 코멘트 데이터의 계층화된 정보를 시각화하는 장치 및 방법 - Google Patents
코멘트 데이터의 계층화된 정보를 시각화하는 장치 및 방법 Download PDFInfo
- Publication number
- KR101730883B1 KR101730883B1 KR1020160067650A KR20160067650A KR101730883B1 KR 101730883 B1 KR101730883 B1 KR 101730883B1 KR 1020160067650 A KR1020160067650 A KR 1020160067650A KR 20160067650 A KR20160067650 A KR 20160067650A KR 101730883 B1 KR101730883 B1 KR 101730883B1
- Authority
- KR
- South Korea
- Prior art keywords
- semantic
- data
- statistical information
- user
- visualizing
- Prior art date
Links
Images
Classifications
-
- G06F17/30696—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G06F17/30705—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0217—Discounts or incentives, e.g. coupons or rebates involving input on products or services in exchange for incentives or rewards
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- General Business, Economics & Management (AREA)
- Algebra (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 코멘트 데이터의 평가 대상으로부터 수집한 코멘트(리뷰) 데이터의 표현정보를 시각화하는 방법 및 장치에 관한 기술로, 보다 상세하게는 평가 대상에 대한 감정 또는 의견을 표현하는 언어적 표현 또는 비언어적 표현으로부터 추출한 표현요소를 게층적으로 시각화하는 기술에 관한 것이다. 본 발명의 데이터 시각화 장치 및 방법은 객체에 대하여 기대되는 사용자들의 감정 또는 의견에 대한 통계적 분석, 및 긍정/부정적인 평가에 대한 분석 결과를 계층 정보를 반영하여 시각화한다.
Description
본 발명은 평가 대상으로부터 수집한 코멘트(리뷰) 데이터의 표현정보를 시각화하는 방법 및 장치에 관한 기술로 보다 상세하게는 평가 대상에 대한 감정 또는 의견을 표현한 텍스트로부터 추출한 표현요소를 계층적으로 시각화하는 기술에 관한 것이다.
(고령화 사회의 정신건강을 위한 디지털 품앗이)
이 연구는 2015년도 정부(미래창조과학부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임 (No. 2015R1A5A7037630).
This work was supported by the National Research Foundation of Korea(NRF) Grant funded by the Korean Government(MSIP) (No.2015R1A5A7037630).
('빅데이터' 분석 기반 한국사 권련 메커니즘)
이 연구는 2015년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임 (NRF-2015S1A5B6037107).
This work was supported by the Ministry of Education of the Republic of Korea and the National Research Foundation of Korea (NRF-2015S1A5B6037107).
일반적으로, 서비스 업체(음식점, 통신사 등)의 상품 또는 서비스를 이용한 사용자들은 서비스 업체(제공자)의 상품 또는 서비스(이하 "객체"라 함)를 이용한 감정 또는 의견을 코멘트(리뷰)형식으로 표현한다.
이러한 코멘트는 텍스트에 기반하여 구성되어 있으므로, 객체에 관련된 종합적인 평가를 확인하기 위해 사용자는 일일히 코멘트 별로 구성된 감정어휘, 평가어휘 등과 같이 객체를 평가할 수 있는 표현요소들을 분석하는데 상당히 많은 시간을 소비하고 있었다.
특히 객체에 대한 코멘트의 양이 방대하거나, 다수의 사용자가 코멘트를 남겼거나, 오랜 시간 동안 코멘트 데이터가 누적된 경우, 사용자가 코멘트들의 일부분만을 분석하게 됨으로써, 객체와 관련된 부정확한 평가를 제공받는 문제점이 있었다.
따라서 이러한 문제점을 해결하고자 하는 종래기술로서, 한국등록특허 제10-1491627호 "모바일 어플리케이션 평가를 위한 리뷰 정량화 방법, 장치 및 시스템"을 들 수 있다.
상기 선행기술은 정성적 데이터인 애플리케이션의 리뷰 데이터를 분석하고, 분석된 리뷰 데이터에서 추출된 키워드를 기초로, 애플리케이션을 평가하는 최종 평점을 산출함으로써, 사용자에게 애플리케이션의 평가를 정량적 데이터로 간략하게 제공해주는 기술이다. 요약하면 정성적인 리뷰 데이터의 키워드를 카테고리(흥미도, 생산성, 디자인)에 참조하여 얻은 키워드의 평점이 애플리케이션에 대한 구체적인 평가로써 사용자에게 제공하는 기술이다.
그러나, 위의 선행기술은 애플리케이션과 정성적인 데이터를 분석하여 사용자가 쉽게 이해할 수 있는 정량적 정보로 제공하는 기술에 대해서는 언급하고 있지만, 사용자에게 제공하기 위한 정량적 데이터를 산출하기 위해 리뷰 데이터의 범주 내에서 일률적인 척도로만 키워드를 추출하여 평점을 산출함으로써, 사용자는 리뷰 데이터를 구성하고 있는 복수의 키워드의 의미가 제대로 반영되지 않은 채로 부정확한 평가를 여전히 제공받는 문제점이 발견된다.
따라서, 관련 분야에서는 하나의 객체(상품 또는 서비스)에 대하여 기대되는 전반적인 감정이나 의견을, 단순한 집계 외에 다각도의 분석을 통해, 보다 효과적으로 시각화하고 평가할 수 있는 기술 개발이 요구된다.
본 발명은 상기와 같은 종래 기술의 문제점을 해결하고자 도출된 것으로서, 객체에 대하여 기대되는 전반적인 감정 또는 의견을, 단순한 집계 외에 긍정/부정 평가와 같은 다각도의 분석을 할 수 있도록 시각화하는 것을 목적으로 한다.
본 발명은 객체에 대하여 기대되는 전반적인 감정 또는 의견을 다각도에서 분석할 수 있도록 다양한 분석 툴(인터페이스)을 제공하는 것을 목적으로 한다.
본 발명은 의미 기반으로 계층 관계(hierarchical relation)가 설정된 카테고리에 집합적 데이터로부터 추출된 복수의 표현요소를 매칭시켜 시각화하는 것을 목적으로 한다.
본 발명의 시각화 기술은 기존의 계층 구조 시각화 기술과도 차별화된 기법을 제공하는 것을 목적으로 한다. 기존의 계층 구조 시각화는 계층 간의 관계 및 전체적인 구조, 계층의 각 요소들의 속성 값을 표현하기에 적합하였다. 하지만 계층 구조의 데이터가 지표(指標) 성향을 갖는 경우 및 시간에 따라 데이터의 성향이 변화하는 경우가 생길 때에는 기존의 시각화 방법으로는 효율적인 분석을 하기에 부적합하다. 본 발명에서는 공지의 Sunburst 시각화 기법 등을 이용하되, 개선된 시각적 요소와 인터페이스를 추가하여 시간에 따라 변화하는 데이터의 양에 비례하여 계층 구조의 면적이 변화하고, 시간지표에 따라 각각의 면적이 쌓이게 하는 Stack 구조를 갖도록 한다. 또한 데이터의 성향에 따라서 계층 면적이 고유의 색상 채도를 가질 수 있도록 보완한다. 이상의 방법을 적용시킨다면 시간에 따른 데이터의 성향 변화를 효과적으로 연출할 수 있고, 그에 따라 온톨로지 구조 분석이 효율적으로 이루어질 수 있다.
또한 본 발명은 어플리케이션 및 비즈니스 모델과 연동하여 효율적으로 사용자와의 인터랙션을 이끌어낼 수 있는 시각화 기법 및 사용자 인터페이스를 제공하는 것을 목적으로 한다.
이러한 목적을 달성하기 위하여 본 발명의 일 실시예에 따른 데이터를 시각화하는 방법은 디지털 문서를 포함하는 집합적 데이터로부터 추출된 복수의 표현요소(expression element)들을 계층 관계(hierarchical relation)가 설정된 의미 기반 카테고리 상에 매핑하는 단계, 의미 기반 카테고리 각각에 매핑된 표현요소들의 통계 정보를 획득하는 단계, 및 의미 기반 카테고리 각각을 계층 관계 및 표현요소들의 통계 정보를 반영하여 시각화하는 단계를 포함한다. 이때 표현요소는 평가의 대상인 맛, 메뉴에 대한 감정어휘, 평가어휘, 가치의견을 포함하는 언어적 또는 비언어적 표현의 요소를 의미한다.
본 발명의 데이터를 시각화하는 방법은 복수의 표현요소들을 의미 기반 카테고리 상에 매핑하는 단계 이전에, 표현요소들을 분류하기 위한 의미 기반 카테고리를 정의하고, 정의된 의미 기반 카테고리를 시각화하기 위한 의미 기반 카테고리 간의 계층 관계를 설정하는 단계를 더 포함할 수 있다.
본 발명의 다른 일 실시예로서 데이터를 시각화하는 방법은 의미 기반 카테고리 간의 계층 관계를 미리 설정된 표현요소들의 의미에 기반하여 설정하거나 또는 사용자로부터 입력된 명령에 의하여 설정할 수 있다. 즉, 미리 설정된 논리를 통하여 자동적으로 표현요소들의 의미에 기반하여 계층 관계를 설정할 수 있고, 인터페이스 또는 사용자 메뉴를 이용하여 사용자가 임의로 계층 관계를 설정할 수 있다. 본 발명의 또 다른 일 실시예에서는 미리 설정된 논리를 통하여 자동적으로 표현요소들의 의미에 기반한 계층 관계 설정 과정 이후에 사용자 메뉴 또는 사용자 인터페이스를 통하여 계층 관계에 대한 사용자의 편집이 가능하다.
본 발명의 데이터를 시각화하는 방법은 매핑하는 단계 이전에, 미리 정의된 서비스, 서비스 제공자 또는 제품 중 적어도 하나에 대한 디지털화된 사용자 코멘트를 수집하고, 수집된 디지털화된 사용자 코멘트를 집합적 데이터로서 생성하는 단계를 더 포함할 수 있다.
본 발명의 데이터를 시각화하는 방법은 시각화된 의미 기반 카테고리 중 어느 하나에 대한 사용자 입력을 수신하는 단계를 더 포함할 수 있다. 이때 의미 기반 카테고리 각각을 시각화하는 단계는 수신된 사용자 입력에 대응하여 의미 기반 카테고리에 대하여 심화된 또는 확장된(더 하위의 계층 관계까지 세분화된) 계층 관계를 반영하여 통계 정보를 시각화할 수 있다.
통계 정보는 의미 기반 카테고리 각각에 매핑된 표현요소들의 개수, 표현요소들로부터 추출된 긍정 또는 부정의 강도를 지표화한 척도 및 표현요소가 생성된 시간 지표 중 적어도 하나 이상을 포함할 수 있다. 본 발명의 데이터를 시각화하는 방법은 통계 정보를 기반으로 다각도에서 리뷰데이터를 분석할 수 있도록 다양한 툴을 제공할 수 있다.
리뷰데이터의 분석 및 탐색을 통한 시각화에서는 의미 기반 카테고리 각각에 매핑된 표현요소들이 생성된 시간 지표를 참조하여 시간 구간 별로 의미 기반 카테고리 각각에 매핑된 표현요소들의 통계 정보를 시각화할 뿐만 아니라 통계 정보의 제1 요소를 제1 시각 정보의 형태로 반영하여 표현하고, 통계 정보의 제2 요소를 제2 시각 정보의 형태로 반영하여 표현할 수 있다. 즉, 통계 정보의 한가지 요소뿐만 아니라 통계 정보의 복수의 조합으로 시각화를 진행하여 사용자에게 많은 정보를 간략하게 축약하여 전달할 수 있다.
본 발명의 일 실시예에 따른 표현요소를 시각화하는 장치는 컴퓨팅 장치 내의 프로세서의 형태로 구현될 수 있다. 프로세서는 디지털 문서를 포함하는 집합적 데이터로부터 추출된 복수의 표현요소 및 통계 정보(리뷰/코멘트의 개수, 긍정/부정에 대한 평가, 리뷰/코멘트의 수집일 또는 작성일)를 저장하는 스토리지 장치, 상기 저장된 복수의 표현요소를 계층 관계가 설정된 의미 기반 카테고리 상에 매핑하는 표현요소 매핑부, 상기 의미 기반 카테고리 각각에 매핑된 표현요소들의 상기 통계 정보를 획득하는 통계 정보 획득부 및 상기 의미 기반 카테고리 각각을 상기 계층 관계 및 상기 표현요소들의 통계 정보를 반영하여 시각화하는 시각화부를 포함한다.
데이터 시각화 장치는 표현요소들을 분류하기 위한 의미 기반 카테고리를 정의하고, 정의된 의미 기반 카테고리를 시각화하기 위한 의미 기반 카테고리 간의 계층 관계를 설정하는 계층 관계 설정부를 더 포함할 수 있다.
데이터 시각화 장치는 미리 정의된 서비스, 서비스 제공자 또는 제품 중 적어도 하나에 대한 디지털화된 사용자 코멘트를 수집하고, 수집된 디지털화된 사용자 코멘트를 상기 집합적 데이터로서 생성하는 집약적 데이터 생성부를 더 포함할 수 있다.
데이터 시각화 장치는 시각화된 상기 의미 기반 카테고리 중 어느 하나에 대한 사용자 입력을 수신하는 인터페이스부를 더 포함할 수 있다.
본 발명에 따르면 객체에 대하여 기대되는 전반적인 감정 또는 의견을, 단순한 집계 외에 긍정/부정 평가와 같은 다각도의 분석을 할 수 있도록 시각화할 수 있다.
본 발명에 따르면 객체를 분석한 다양한 지표 데이터를 색상, 면적, 길이 등 직관적인 비교가 가능한 시각 정보로 변환하여 시각화함으로써 가독성을 높일 수 있다.
본 발명에 따르면 객체에 대하여 기대되는 전반적인 감정 또는 의견을 다각도에서 분석할 수 있도록 다양한 분석 툴(인터페이스)을 제공할 수 있다.
본 발명에 따르면 의미 기반으로 계층 관계(hierarchical relation)가 설정된 카테고리를 시각화함으로써 사용자로 하여금 손쉽게 원하는 리뷰 데이터의 계층으로 빠르게 탐색할 수 있다. 본 발명에 따르면 각종 통계 및 분석 지표를 직관적으로 비교하기 용이한 시각적 표현을 기반으로 가독성을 높이고, 객체의 분석 결과에 대한 계층화된 정보를 제공함으로써 접근성을 향상시킨 사용자 인터페이스 및 사용자 분석 툴이 제공될 수 있다.
본 발명에 따르면 종래의 계층 구조에서 표현할 수 없었던 시간에 따른 성향 변화를 해석할 수 있는 효과가 있다. 또한 본 발명에 따르면 평가 리뷰의 양이 시간에 따라 변화하는 것을 보여주기 때문에 변화율이 급격한 지점을 찾아서 추가적인 통찰력을 얻을 수 있다는 효과가 있다. 이러한 두 가지 효과를 통해 지표적 성향을 띠는 온톨로지 계층 구조 데이터를 보다 편리하게 분석할 수 있다.
도 1은 본 발명의 일 실시예에 따른 데이터 시각화 장치를 나타낸 도면이다.
도 2는 본 발명의 다른 일 실시예에 따른 데이터 시각화 장치로서 집약적 데이터 생성부의 구성이 추가된 도면이다.
도 3은 본 발명의 또 다른 일 실시예에 따른 데이터 시각화 장치로서 의미 기반 카테고리의 계층 관계를 설정하는 계층 관계 설정부의 구성이 추가된 도면이다.
도 4는 본 발명의 일 실시예에 따른 시각화된 카테고리의 사용자 인터페이스를 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 시각화된 데이터 계층 구조의 사용자 인터페이스를 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 시간에 따라 시각화된 데이터 계층 구조 및 통계 정보의 사용자 인터페이스를 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 데이터 시각화 방법을 나타낸 동작 흐름도이다.
도 8은 본 발명의 일 실시예에 따른 데이터 시각화 방법의 일부 구성을 상세히 나타낸 동작 흐름도이다.
도 9는 본 발명의 일 실시예에 따른 사용자와의 인터랙션에 의하여 시각화된 데이터 계층 구조의 사용자 인터페이스를 나타낸 도면이다.
도 10 내지 도 12는 본 발명의 일 실시예에 따른 사용자와의 인터랙션에 의하여 시간 경과를 반영하여 시각화된 통계 정보의 사용자 인터페이스를 나타낸 도면이다.
도 13은 본 발명의 일 실시예에 따른 사용자와의 인터랙션에 의하여 시각화된 통계 정보 및 집합적 데이터의 사용자 인터페이스를 나타낸 도면이다.
도 14 내지 도 16은 본 발명의 일 실시예에 따른 어플리케이션 및 사용자 인터랙션에 의한 데이터 시각화의 사용자 인터페이스를 나타낸 도면이다.
도 2는 본 발명의 다른 일 실시예에 따른 데이터 시각화 장치로서 집약적 데이터 생성부의 구성이 추가된 도면이다.
도 3은 본 발명의 또 다른 일 실시예에 따른 데이터 시각화 장치로서 의미 기반 카테고리의 계층 관계를 설정하는 계층 관계 설정부의 구성이 추가된 도면이다.
도 4는 본 발명의 일 실시예에 따른 시각화된 카테고리의 사용자 인터페이스를 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 시각화된 데이터 계층 구조의 사용자 인터페이스를 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 시간에 따라 시각화된 데이터 계층 구조 및 통계 정보의 사용자 인터페이스를 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 데이터 시각화 방법을 나타낸 동작 흐름도이다.
도 8은 본 발명의 일 실시예에 따른 데이터 시각화 방법의 일부 구성을 상세히 나타낸 동작 흐름도이다.
도 9는 본 발명의 일 실시예에 따른 사용자와의 인터랙션에 의하여 시각화된 데이터 계층 구조의 사용자 인터페이스를 나타낸 도면이다.
도 10 내지 도 12는 본 발명의 일 실시예에 따른 사용자와의 인터랙션에 의하여 시간 경과를 반영하여 시각화된 통계 정보의 사용자 인터페이스를 나타낸 도면이다.
도 13은 본 발명의 일 실시예에 따른 사용자와의 인터랙션에 의하여 시각화된 통계 정보 및 집합적 데이터의 사용자 인터페이스를 나타낸 도면이다.
도 14 내지 도 16은 본 발명의 일 실시예에 따른 어플리케이션 및 사용자 인터랙션에 의한 데이터 시각화의 사용자 인터페이스를 나타낸 도면이다.
상기 목적 외에 본 발명의 다른 목적 및 특징들은 첨부 도면을 참조한 실시 예에 대한 설명을 통하여 명백히 드러나게 될 것이다.
본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 이해될 수 있을 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 해당 분야의 종사자(skilled person)이라면 쉽게 파악할 수 있을 것이다.
본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
그러나, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
본 발명은 객체의 코멘트 데이터에서 수집된 표현요소(expression element)를 이용한 시각화 장치 및 방법에 관한 것으로서, 객체는 사용자가 선택한 서비스 업체의 상품 또는 서비스 등 사람의 감정 및 평가가 포함되는 객체를 의미하며, 사람의 감정 및 평가가 포함되는 객체에 대한 코멘트 또는 리뷰로부터 나타내는 감정 및 평가를 시각화할 수 있다. 본 명세서에서 표현요소는 집합적 데이터로부터 추출된 어휘 또는 형태소를 의미한다. 표현요소의 예로는 감정을 나타내는 감정어휘, 평가 의견을 나타내는 평가어휘, 가치에 관한 의견을 나타내는 가치어휘, 대상의 성질을 설명하기 위한 형용사, 명사 등을 들 수 있다.
도 1은 본 발명의 일 실시예에 따른 데이터 시각화 장치를 나타낸 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 데이터 시각화 장치는 컴퓨팅 시스템(100)의 형태로 구현될 수 있다. 컴퓨팅 시스템(100)은 프로세서(110)와 스토리지 장치(120)를 포함할 수 있다. 프로세서(110)는 서브 모듈로서 표현요소 매핑부(130), 통계 정보 획득부(140) 및 시각화부(150)를 포함한다.
스토리지 장치(120)는 디지털 문서를 포함하는 집합적 데이터로부터 추출된 복수의 표현요소 및 상기 복수의 표현요소와 연관되어 생성된 통계 정보를 저장한다.
프로세서(110) 내부의 표현요소 매핑부(130)는 스토리지 장치(120)에 저장된 복수의 표현요소를 계층 관계가 설정된 의미 기반 카테고리 상에 매핑한다. 의미 기반 카테고리는 온톨로지(ontology)에 기초하여 설정될 수 있다.
온톨로지는 클래스(class)의 구성원들(요소)에 관한 사실과 구성원들 간의 관계를 기술하는 데이터의 집합을 의미하며, 온톨로지의 전체 구조는 이러한 관계들의 집합으로 이루어진다. 온톨로지는 구조 상 클래스 간의 계층 구조 및 클래스의 속성 값에 대한 기술, 클래스 요소 간의 관계 기술 등으로 세분화하여 기술할 수 있다. 온톨로지 구조를 시각화하는 데에 계층 구조 시각화 기법이 이용되며, 본 발명에서는 특히 의미 기반 카테고리를 따라 설정된 온톨로지의 계층 구조가 효율적으로 시각화될 수 있다.
통계 정보 획득부(140)는 의미 기반 카테고리 각각에 매핑된 표현요소들의 통계 정보를 획득한다. 통계 정보는 의미 기반 카테고리 각각에 매핑된 표현요소들의 개수, 표현요소로부터 추출된 긍정 또는 부정의 강도를 지표화한 척도 및 표현요소가 생성된 시간 지표를 포함할 수 있다. 통계 정보 획득부(140)는 통계 정보를 스토리지 장치(120)로부터 획득할 수 있다. 스토리지 장치(120)는 의미 기반 카테고리 각각에 대하여 매핑된 표현요소들의 통계 정보를, 의미 기반 카테고리의 계층 관계에 따라 분류하여 저장한다.
시각화부(150)는 의미 기반 카테고리 각각을 계층 관계 및 표현요소들의 통계 정보를 반영하여 시각화한다. 프로세서(110)는 시각화된 의미 기반 카테고리 중 어느 하나에 대한 사용자 입력을 수신하는 인터페이스부(160)를 더 포함할 수 있다.
인터페이스부(160)를 경유하여 수신된 사용자 입력은, 시각화되는 표현요소, 의미 기반 카테고리, 계층 관계, 통계 정보의 선택, 변형, 가공, 저장, 입력, 출력 등의 동작을 수행하도록 해석될(translated) 수 있다. 즉 인터페이스부(160)를 경유하여 수신된 사용자 입력은 표현요소, 의미 기반 카테고리, 계층 관계, 통계 정보의 선택, 변형, 가공, 저장, 입력, 출력 등의 동작에 대한 명령(command)으로 인식될 수 있다.
사용자 입력은 마우스, 키보드, 키패드, 터치, 음성 인식 등을 포함하며 마우스의 클릭 또는 드래그, 싱글 터치, 멀티 터치, 터치로 인한 제스쳐 등 복합적인 사용자 입력의 조합을 통하여 고도화된 사용자 명령을 형성할 수 있다. 사용자 입력에 의한 사용자와의 인터랙션에 의하여 데이터 시각화 장치(100)는 의미 기반 카테고리의 하위의 계층 관계까지 반영된 심화된 통계 정보를 시각화할 수 있다.
시각화부(150)는 다양한 분석을 제공하기 위해 통계 정보의 제1 요소를 제1 시각 정보의 형태로 반영하여 표현하고, 상기 통계 정보의 제2 요소를 제2 시각 정보의 형태로 반영하여 표현할 수 있다. 즉, 통계 정보에 포함된 복수의 차원의 정보를 한 가지 차원만을 사용하여 시각화하는 것이 아니라 복수의 차원의 정보를 조합하여 많은 양의 데이터도 한 눈에 파악할 수 있도록 시각 정보로 처리하여 표현할 수 있다.
예를 들면, 통계 정보의 제1 요소를 사용자가 확인하려는 객체의 카테고리에 매핑된 표현요소들의 개수로 정의하고, 제1 시각 정보는 시각화 요소의 면적으로 정의할 수 있다. 통계 정보의 제2 요소를 표현요소로부터 추출된 긍정 또는 부정의 강도를 지표화한 척도로 정의하고, 제2 시각 정보는 시각화 요소의 색상으로 정의할 수 있다. 좀 더 구체화하면 표현요소에 대응하는 시각화되는 요소(원, 타원, 원 또는 타원의 일부, 직사각형, 삼각형, 다각형, 등 도형의 일부)가 정의되면, 통계 정보의 제1 요소(개수/빈도수)와 제2 요소(표현요소로부터 추출된 긍정/부정의 지표)를 각각 제1 시각 정보(면적)와 제2 시각 정보(색상)으로 정의하여 표현할 수 있다. 표현요소가 특정 도형에 대응할 경우 개수/빈도수가 면적, 긍정/부정의 평가 지표가 색상으로 반영되는 등, 통계 정보 상의 두 가지 이상의 차원의 정보를 한꺼번에 직관적이고 간략화된 방식으로 제공할 수 있다. 이로 인하여 사용자는 종합적이고 직관적인 시각화의 형태로 정보를 전달받을 수 있다.
시각화부(150)는 의미 기반 카테고리 각각에 매핑된 표현요소들이 생성된 시간 지표를 참조할 수 있다. 표현요소들의 원본 데이터(raw data)가 생성된 시간 지표가 추출되면, 표현요소들의 원본 데이터의 시간 지표에 따라 표현요소들의 통계 정보의 또 다른 요소를 도출할 수 있다. 즉, 시간의 흐름에 따른 표현요소들의 개수/빈도의 변화, 시간의 흐름에 따른 표현요소들의 긍정/부정적인 해석 상의 변화를 통계 정보로서 추가할 수 있다.
보다 구체화하면, 사용자의 선택에 대응하는 의미 기반 카테고리의 통계 정보를 시간, 년도 및 요일 등과 같은 개념으로 층(Layer)을 형성하고 객체에 대한 사용자들의 반응에 대한 통계 정보를 시간 구간 별로 구하고 시각할 수 있다. 사용자는 특정 객체에 대한 표현요소들의 변화 추이, 특정 객체에 대한 평가의 추이를 확인할 수 있다.
이 같은 시각화의 다양한 기법은 어플리케이션, 또는 비즈니스 모델과도 연관되어 설계될 수 있다. 예를 들어, 특정 객체에 대한 평가 의견을 도출한 결과 부정적인 의견이 많았다면, 이를 개선하기 위한 조치를 취하였거나, 평가 의견을 개선하기 위한 이벤트를 진행한 경우, 상기 조치 또는 이벤트의 효과를 통계적으로 분석하고 직관적으로 시각화하기 위하여 시간 구간을 특정 이벤트의 전후로 구분하여 분석할 수 있다. 특정 조치 또는 이벤트가 복수 회 발생한다면, 각 발생 시점을 기준으로 시간 구간을 조정하여 특정 조치가 수행된 횟수 또는 이벤트가 다수의 제3자들에게 노출되는 횟수/비율에 따른 객체에 대한 평가 의견의 변화를 분석할 수 있다. 다수의 조치와 이벤트가 복합적으로 진행되었다면 효과적인 조치 또는 이벤트를 선별해 낼 수 있는 통계 정보의 획득 또한 가능하다. 이렇게 얻어진 통계 정보는 다시 객체가 속한 환경, 특수 조건, 조치 또는 이벤트의 발생 시점 등을 반영하여 계층화되어 분석될 수 있고, 비즈니스 모델 또는 어플리케이션과 연동되어 특정 조치 또는 이벤트의 발생 시점, 횟수, 및 노출 대상의 특정에 대한 구체적인 가이드 라인을 도출할 수 있다.
도 2는 본 발명의 다른 일 실시예에 따른 데이터 시각화 장치로서 집약적 데이터 생성부의 구성이 추가된 도면이다.
도 2를 참조하면, 본 발명의 다른 실시예에 따른 데이터 시각화 장치(200)는 프로세서(210)와 스토리지 장치(230)를 포함하며, 프로세서(210)는 집약적 데이터 생성부(220), 스토리지 장치(230), 표현요소 매핑부(240), 통계 정보 획득부(250), 시각화부(260) 및 인터페이스부(270)를 포함한다.
도 2에 도시된 표현요소 매핑부(240), 통계 정보 획득부(250), 시각화부(260) 및 인터페이스부(270)의 기능은 도 1에 도시된 표현요소 매핑부(130), 통계 정보 획득부(140), 시각화부(150) 및 인터페이스부(160)의 기능과 동일하므로, 중복되는 설명은 이하 생략하기로 한다.
도 2를 참조하면, 집약적 데이터 생성부(220)는 미리 정의된 서비스, 서비스 제공자, 상품(product), 상품의 생산자, 또는 상품의 공급자 중 적어도 하나에 대한 디지털화된 사용자 코멘트를 수집하고, 수집된 디지털화된 사용자 코멘트를 집합적 데이터로서 생성한다. 즉, 코멘트의 평가 대상은 서비스, 서비스 제공자, 상품(product), 상품의 생산자, 또는 상품의 공급자 중 적어도 하나일 수 있으며, 디지털화된 사용자 코멘트는 원본 데이터(raw data)로서 통계 분석, 의미 기반 분석, 의미 기반 카테고리 매핑, 계층화 과정을 거쳐 유의미한 통계 정보로서 가공될 수 있다.
집약적 데이터 생성부(220)에서 다루어지는 디지털화된 사용자 코멘트는 서비스 업체(음식점, 상점 또는 통신사 등)의 사용자에 의해 구축된 웹 서비스를 통해 수집된 데이터를 이용한 것일 수도 있고, 또는 대형 포털 및 동호회 게시판에 축적되는 코멘트 데이터를 프로그램을 이용하여 개별적으로 수집하여 생성한 것일 수도 있다. 집약적 데이터 생성부(220)는 서비스 업체의 객체에 대한 코멘트 데이터로부터 사용자의 감정을 포함하고 있는 감정 및 평가 어휘 수집을 자동화하기 위하여 데이터를 수집할 수 있는 웹 크롤러(Web crawler)를 이용할 수 있으며, 크롤러는 대형 포털(네이버, 다음 등)에 개설된 서비스 업체의 홈페이지를 통해 객체에 대한 코멘트 및 리뷰들을 정제되지 않은 데이터의 형태로 수집하고, 수집된 데이터를 시각화가 가능한 데이터로 가공할 수 있으며, 정제된 데이터를 분류하여 집합적 데이터로 생성할 수 있다.
스토리지 장치(230)는 집약적 데이터 생성부(220)에 의하여 생성된 원본 데이터를 저장하고, 표현요소 매핑부(240)의 분석에 의하여 원본 데이터 내의 각 표현요소가 의미 기반 카테고리에 매핑되면 계층 정보, 카테고리 정보에 연동된 상태로 표현요소를 분류하여 저장할 수 있다. 이때 스토리지 장치(230)는 원본 데이터를 백업(back-up)의 형태로 저장할 수 있다.
통계 정보 획득부(250)는 분류된 상태로 저장된 데이터를 분석하여 통계 정보를 획득할 수 있다. 이때 각 카테고리에 분류된 표현요소가 저장될 수도 있고, 표현요소는 원본 데이터로서 저장되며 각 카테고리 상에는 분류된 표현요소의 원본 데이터 영역 내의 인덱스/링크/주소가 저장될 수도 있다. 시각화부(260) 또는 인터페이스부(270)는 사용자와의 인터랙션에 의하여 스토리지 장치(230)에 저장된 표현요소를 필요에 따라 검색하여 표시할 수도 있다.
도 3은 본 발명의 또 다른 일 실시예에 따른 데이터 시각화 장치로서 의미 기반 카테고리의 계층 관계를 설정하는 계층 관계 설정부의 구성이 추가된 도면이다.
도 3을 참조하면, 본 발명의 또 다른 일 실시예에 따른 데이터 시각화 장치(300)는 프로세서(310)와 스토리지 장치(320)를 포함하며, 프로세서(310)는 계층관계 설정부(330), 표현요소 매핑부(340), 통계 정보 획득부(350), 시각화부(360) 및 인터페이스부(370)를 포함한다.
이때, 도 3에 도시된 표현요소 매핑부(340), 통계 정보 획득부(350), 시각화부(360) 및 인터페이스부(370)는 도 1에 도시된 표현요소 매핑부(130), 통계 정보 획득부(140), 시각화부(150) 및 인터페이스부(160)와 동일하므로, 중복되는 설명은 이하 생략하기로 한다.
도 3을 참조하면, 계층 관계 설정부(320)는 표현요소들을 분류하기 위한 의미 기반 카테고리를 정의하고, 정의된 의미 기반 카테고리를 시각화하기 위한 의미 기반 카테고리 간의 계층 관계를 설정한다.
계층 관계 설정부(320)는 의미 기반 카테고리 간의 계층 관계를 미리 설정된 표현요소들의 의미에 기반하여 설정할 수도 있고, 또는 사용자로부터 입력된 명령에 의하여 설정할 수도 있다. 표현요소들의 의미 기반 카테고리의 계층 관계는 온톨로지(ontology) 분석에 의하여 설정될 수 있다. 계층 구조(hierarchical structure)는 상위/하위의 개념이 명확히 구분되며, 각 계층은 노드(node)로 표현되고 노드 간의 관계가 상위/하위 또는 부모/자식으로 정의된다. 계층 관계 설정부(320)는 의미 사전, 온톨로지 등의 참고 정보를 이용하여 표현요소들의 계층 관계를 분화시키고 설정할 수 있다. 여기에 인터페이스부(370)를 통한 사용자와의 인터랙션, 사용자 입력을 수신하여 계층 관계에 대한 추가적인 정보를 보완할 수 있다. 계층 관계 설정부(320)는 인터페이스부(370)를 통하여 현재 설정된 표현요소들의 계층 관계를 트리 구조 등으로 시각화하여 표시할 수 있고, 사용자 입력을 통하여 보완할 수 있는 메뉴를 함께 제공할 수 있다.
일반적으로 계층 관계를 시각화하는 데 있어서는 상위의 계층을 먼저 보여주고, 세밀하게 살펴보고자 하는 요소를 선택하면 숨겨져 있던 하위 계층을 보여주는 방식으로 이루어질 수 있다. 이러한 기술을 축약적인 형태의 시각화 기술이라 부르기도 한다. 축약적인 기술을 이용한 계층 관계의 시각화는 표현요소 데이터베이스의 전체적인 구조를 효율적으로 정리하고 속성값을 보여주기에 적합한 요소를 갖출 수 있다.
축약적인 형태의 시각화 기법으로는 썬버스트 파이 차트(Sunburst pie chart) 또는 트리맵(Tree-map) 등을 들 수 있으나, 이러한 공지의 시각화 기술들로는 표현요소 데이터베이스가 특정 개체에 대한 평가 지표의 값을 가지는 경우에 효율적인 시각화가 어려울 수 있으므로 개선된 인터페이스가 필요할 수 있다. 특히 평가 지표가 긍정/부정, 양/음의 부호와 함께 연속적인/이산적인(continuous / discrete) 값을 가지거나, 시간에 따라 데이터의 종합적인 지표가 변화하는 경우, 한정된 공간 내에서 시간에 따른 데이터의 변화를 나타내기에 효과적인 인터페이스로 개량되어 표시될 수 있다.
본 발명에서 제안하는 개선된 시각화 인터페이스의 예시는 아래의 도 4 내지 도 16을 통하여 설명하기로 한다.
도 4는 본 발명의 일 실시예에 따른 시각화된 카테고리의 사용자 인터페이스를 나타낸 도면이다.
도 4를 참조하면, 계층화된 의미 기반 카테고리는 상위 계층에 "음식", "환경", "특기사항"의 3가지 요소를 포함한다. 상위 계층의 "음식" 카테고리 내에는 하위 계층으로서 가격, 재료, 반찬, 분식, 밥, 소스, 주류, 양, 식감, 향, 안주 등의 카테고리가 포함된다. 각 카테고리에 매핑된 표현요소들의 통계 정보를 반영하여 각 카테고리의 시각 정보(시각적인 속성, 면적, 색상, 채도 등)가 결정될 수 있다. 이로 인하여 하나의 차트를 통하여 각 카테고리 상에 매핑된 표현요소들의 통계 정보의 다양한 속성값들을 직관적으로 시각화할 수 있다.
도 4와 같은 시각화된 차트는 예를 들어 음식점에 대한 고객의 평가 코멘트 데이터 분석에 활용될 수 있다. 이러한 평가 코멘트는 일반적으로 "리뷰"라 불리는 형태로 다양한 웹 사이트에서 수집할 수 있다. 음식점에 대한 리뷰 데이터는 데이터의 특성 상 음식점에 대한 리뷰어들의 전체적인 평가 성향을 효과적으로 분석해야 할 뿐만 아니라 시간에 따른 변화, 리뷰어가 해당 음식점에 대하여 어떠한 성향의 변화를 보였는지를 분석하는 것이 어플리케이션 및 비즈니스 모델과 관련하여 중요한 과제일 수 있다.
수집된 리뷰 데이터의 원본 데이터(raw data)는 형태소 분석을 통하여 온톨로지 계층 구조에 매핑된다. 계층화된 온톨로지는 의미 기반으로 사전에 설정될 수 있으며 머신 러닝(machine-learning) 기법 등에 의하여 보완되고 강화될 수 있다.
리뷰 데이터에서 추출된 표현요소들(형용사, 명사, 평가 의견, 가치 의견, 설명 등)은 긍정 또는 부정적인 요소를 어느 정도 반영하는 지 수치화될 수 있다. 이때 긍정인지 또는 부정인지, 긍정 또는 부정적인 표현의 강도 등은 사전에 계획된 온톨로지와 대비되어 수치화될 수 있다.
리뷰 데이터에서 추출된 표현요소들은 맞춤법 등 권장된 표기 사항을 항상 따르는 것은 아니므로, 실제 언어 표현과 평가 개념 사이의 추가적인 Mapping 작업이 필요하다. 음식점의 리뷰에 관한 특화된 온톨로지를 추가로 설정할 수 있다. 특화된 온톨로지는 음식점에 대한 리뷰 데이터 중 샘플을 채취하여 형태소를 분석하고, 형태소를 맛과 음식점에 대한 평가어 등으로 분류하여 수집된 표현요소들의 데이터베이스로서 구축될 수 있다. 또한 특정 표현요소의 사용 빈도가 반영되어 데이터베이스 상의 중심적인 표현요소가 선택될 수 있다.
데이터베이스 상의 중심적인 표현요소는 새로운 표현요소가 발견될 때 새로운 표현요소의 의미 상 거리를 판단하는 기준이 되는 표현요소를 의미한다.
표현요소에 대한 통계 정보는 의미 기반 카테고리 각각에 매핑된 표현요소들의 개수, 긍정 또는 부정의 강도를 지표화한 척도, 및 표현요소가 생성된 시간 지표에 관한 정보를 포함할 수 있다. 긍정 또는 부정의 강도를 지표화한 척도는 리커트 척도(Likert-type scale) 등의 방식으로 수치화될 수 있다.
도 4를 참조하면, 각 카테고리의 면적은 의미 기반 카테고리 각각에 매핑된 표현요소들의 개수를 의미할 수 있다. 각 카테고리의 중심으로부터의 거리는 상위 계층일 수록 중심에서 가깝고, 하위 계층일 수록 중심에서 멀 수 있다. 동일한 계층에 속하는 카테고리 간의 면적의 비율은 각 카테고리에 매핑된 표현요소들의 개수 간의 비율을 의미할 수 있다. 즉, "음식"에 매핑된 표현요소들의 개수가 "환경" 또는 "특기사항" 카테고리에 매핑된 표현요소들의 개수보다 많음이 도 4를 통하여 나타내어진다.
설명의 편의상 각 카테고리에 매핑된 표현요소들의 개수를 면적에 대응시켰는데, 각 카테고리에 매핑된 표현요소들이 추출된 원본 데이터의 리뷰의 개수를 면적에 대응시키는 실시예도 가능하다. 리뷰어들의 관심을 많이 받은 카테고리의 면적이 다른 카테고리보다 크게 나타나도록 면적에 대응하는 통계 정보를 설정할 수 있다.
각 카테고리의 시각 정보 중 색상은 긍정 또는 부정의 극성(polarity) 또는 평가의 강도를 지표화한 척도를 반영할 수 있다. 예를 들어 각 카테고리에 속한 표현요소들을 통계처리한 대표값이 긍정적인 극성을 가질 경우 한색(Cool Color) 계열의 색상으로, 대표값이 부정적인 극성을 가질 경우 난색(Warm Color) 계열의 색상으로 시각 정보를 제공할 수 있다.
표현요소들의 통계처리된 대표값은 평균, 가중 평균, 최빈값, 중간값 등을 들 수 있으며 리커트 척도와 같은 방식으로 긍정 또는 부정의 강도를 지표화할 수 있다. 카테고리 각각에 대하여 통계처리된 대표값의 긍정적인 평가의 척도가 높은 경우에는 짙은 한색으로, 긍정적인 평가이면서도 척도가 높지 않은 경우에는 옅은 한색으로 나타낼 수도 있다. 이처럼 긍정 또는 부정의 척도에 따라 그라데이션(Gradation)을 이용하여 색상을 표현함으로써 객체를 사용한 리뷰어들의 감정 및 의견을 세밀하게 미래 고객 또는 미래 사용자들에게 전달할 수 있다.
중립적인 평가 척도를 대표값으로 가지는 카테고리는 도 4에 도시된 것처럼 무채색으로 시각화할 수 있다. 또한 평가를 받지 않았거나 데이터가 없는 항목은 계층 시각화에서 제외될 수도 있다. 이 경우 리뷰어들의 관심을 받지 못한 항목은 시각화에서 제외됨으로써 모바일 단말기 등 제한된 공간을 활용하는 시각화에서 효과적으로 필요한 정보를 우선적으로 사용자에게 제공할 수 있다.
도 4를 참조하면 "음식" 카테고리에 속하는 하위 카테고리 중 "주류"에 대한 표현요소들이 빈번하게 나타났고 평가의견이 긍정적인 강도도 높은 것으로 나타난 반면, "특기사항" 카테고리에 속하는 하위 카테고리 중 "서비스" 항목과 "환경" 카테고리에 속하는 하위 카테고리 중 "위생상태"에 대한 평가는 부정적으로 치우쳐 있는 것으로 시각화된다. 한편 "음식" 카테고리의 하위 카테고리 중에서도 "양", "반찬", "분식" 등에 대한 평가는 부정적인 극성을 띠며 그 강도는 약한 것으로 나타난다.
도 4를 참조하면 해당 음식점의 평가는 음식은 대체로 긍정적인 평가를 받았고 특기사항 중 서비스 항목에서 부정적인 평가가 많았으며 환경과 관련하여 접근성(위치), 공간, 위생상태에 대한 부정적인 평가가 많았음을 알 수 있다. 이 경우 향후 해당 음식점에 위생상태 및 공간 활용의 개선, 접근성(위치)에 대해서는 지속적인 홍보 등을 개선 사항으로서 알림으로써 해당 음식점에 대한 종합적인 평가를 개선하는 데에 활용할 수 있도록 지원하는 서비스 모델이 가능하다.
도 5는 본 발명의 일 실시예에 따른 시각화된 데이터 계층 구조의 사용자 인터페이스를 나타낸 도면이다.
도 5를 참조하면, 사용자와의 인터랙션을 통하여 원하는 부분에 대하여 세분화되고 강조된 시각화 영상을 제공할 수 있다. 즉, "음식" - "주류" 카테고리가 긍정적인 평가를 얻었음을 확인한 이후에, 해당 음식점에 대한 평가를 더욱 상세히 확인하기를 원하는 사용자를 위하여 인터랙티브 메뉴를 제공할 수 있다.
사용자가 "음식" - "주류" 카테고리를 상세히 보기를 원하여 "음식" - "주류" 카테고리를 선택하면, 시각화 장치는 "음식" 카테고리를 활성화시키고 나머지 카테고리를 비활성화시키며(크기를 축소하고 색상을 무채색으로 변환), "주류" 카테고리의 하위 카테고리에 대한 통계 정보를 상세히 시각화할 수 있다.
도 5를 참조하면 "주류" 카테고리의 하위 카테고리로서 "막걸리", "소주", "맥주"의 항목이 시각화되고, 이 음식점의 주류 중 가장 긍정적인 평가를 받은 아이템은 "맥주"임이 시각화된다. 단순히 해당 카테고리의 평가의 긍정/부정 뿐만이 아니라, 해당 카테고리가 얼마나 리뷰에서 빈번하게 언급되었는지도 면적을 통하여 확인할 수 있으므로, 이 음식점에 대해서는 다수의 리뷰어들이 맥주에 대해서 긍정적인 의견을 제시했음을 추론할 수 있다.
이처럼 변형된 썬버스트(Sunburst) 그래프를 인터랙티브하게 운용함으로써 사용자의 직관적인 이해를 돕고 필요한 정보만을 효율적으로 전달할 수 있다. 사용자가 선택한 카테고리는 서로 연관성을 가지고, 세분화된 카테고리에서 방대한 정보를 시각 정보로 축약하여 사용자에게 간략하게 제공할 수 있다. 도 4와 도 5에서는 음식점의 평가에 대한 전체적인 계층 구조 및 사용자의 성향을 색상 패턴을 통하여 확인할 수 있다.
본 발명의 데이터 시각화는 특정 음식점을 경영 및 관리하는 관리자의 관점에서도 유용한 정보를 제공할 수 있고, 특정 음식점을 방문하고자 하는 잠재적인 고객의 관점에서도 유용한 정보를 제공할 수 있다. 음식점에 대한 평가 데이터는 특성 상 리뷰어들의 전체적인 평가 성향을 분석하는 것 외에도 시간에 따른 리뷰어의 평가 성향의 변화를 모니터링하고 파악하는 것 또한 중요하다. 도 4와 도 5와 같은 변형된 썬버스트 그래프만으로는 각 계층 및 카테고리의 속성값이 시간에 따라 변화할 때, 또는 한정된 공간 안에서 시간에 따른 데이터의 변화를 나타내기에는 어려움이 있다. 본 발명의 다른 실시예에 따른 시각화 사례에서는 시간에 따라 변화하는 데이터의 효율적인 시각화 기법을 소개한다. 이하 도 6을 통하여 시간에 따른 데이터 변화의 시각화 실시예가 도시된다.
도 6은 본 발명의 일 실시예에 따른 시간에 따라 시각화된 데이터 계층 구조 및 통계 정보의 사용자 인터페이스를 나타낸 도면이다.
도 6을 참조하면, 도 5에 도시된 바와 같이 "음식"(610)의 하위 카테고리인 "주류"(620)를 사용자가 선택하고 "음식"(610) - "주류"(620)에 대한 시각화 정보가 강조된 상태에서 사용자가 "주류"(620)의 통계 정보를 시간에 따라 시각화하는 메뉴를 선택한 경우, "주류"(620)의 통계 정보가 시간에 따라 Stack 구조를 가지고 시각화되는 타임라인 디스플레이(630)가 도시된다.
또한 타임라인 디스플레이(630)에 시각화되는 정보를 선택적으로 표시/비표시할 수 있는 타임라인 네비게이션 메뉴(640)가 함께 제공된다.
도 6에 도시된 바와 같이 시간에 따라 변화하는 데이터의 양(표현요소들이 나타나는 빈도) 및 성향(긍정/부정에 대한 평가의견)에 비례하여 각 타임라인 세그먼트의 면적 및 색상이 변화하고, 시간 지표에 따라 각각의 세그먼트가 쌓이는 것처럼 디스플레이되는 Stack 구조가 시각화된다. 타임라인 디스플레이(630) 내의 각 세그먼트는 일종의 Layer와 같이 표현될 수도 있는데, 각 세그먼트는 할당된 시간 구간에 대한 통계처리된 대표값을 반영하여 면적, 색상 등 시각 정보가 결정된다.
타임라인 네비게이션 메뉴(640)는 사용자의 필요에 따라 자유롭게 원하는 시간 구간까지 선택하여 시각화할 수 있도록 사용자에게 선택할 수 있는 기회를 제공할 수 있다. 이러한 시간 지표를 통한 코멘트 데이터의 분석은 지정된 시간 구간 안에서 어느 기간에 많은 평가 의견이 있는지 확인할 수 있으며, 급격하게 코멘트의 양이 변화하는 시점을 발견하여 사용자의 니즈(Needs)를 파악해 빠른 대응책을 도출할 수 있다. 또한 해당 음식점의 잠재적인 고객 입장에서는 최근의 업데이트된 사용자 리뷰를 확인할 수 있어, 해당 음식점에 대한 고도화된 리뷰 정보를 얻을 수 있는 장점이 있다.
이하에서는 본 발명의 일 실시예에 따른 데이터 시각화 방법의 워크플로우를 간략히 도면을 참조하여 설명하기로 한다.
도 7은 본 발명의 일 실시예에 따른 데이터 시각화 방법을 나타낸 동작 흐름도이다.
도 7을 참조하면, 프로세서(110, 210, 310)의 표현요소 매핑부(130, 240, 340)는 스토리지 장치(120, 230, 320)에 저장된 집합적 데이터로부터 추출한 복수의 표현요소들을 계층 관계가 설정된 의미 기반 카테고리 상에 매핑한다(S710). 이때, 복수의 표현요소들은 웹 상에서 사용자가 객체에 대하여 코멘트 또는 리뷰한 디지털화된 문서 또는 문장의 어휘를 분석한 감정 또는 평가를 표현요소로 추출한 것일 수 있다.
통계 정보 획득부(140, 250, 350)는 의미 기반 카테고리 각각에 매핑된 표현요소들의 통계 정보를 획득한다(S720). 이때, 통계 정보는 분석을 통하여 추출된 감정 또는 평가에 대한 표현요소들의 긍정 또는 부정의 척도를 시각화하기 쉽게 지표화한 데이터 이외에도 의미 기반 카테고리 각각에 매칭된 표현요소들의 개수 및 표현요소가 생성된 시간 지표를 포함할 수 있다.
시각화부(150, 260, 360)는 의미 기반 카테고리 각각을 계층 관계 및 표현요소들의 통계 정보를 반영하여 시각화한다(S730).
또한, 도 7에 도시되지는 않았지만, 본 발명의 표현요소를 시각화하는 방법은 단계 S730 이후에 인터페이스부(160, 270, 370)에 의하여, 시각화된 의미 기반 카테고리 중 어느 하나에 대한 사용자 입력을 수신하는 단계를 더 포함할 수 있으며, 이때, 사용자의 의미 기반 카테고리 중 어느 하나에 대한 선택에 따라 사용자의 입력에 대응하는 의미 기반 카테고리에 대하여 심화된(확장, 세분화) 계층 관계를 반영하는 통계 정보를 시각화하여 제공할 수 있다.
도 8은 본 발명의 일 실시예에 따른 데이터 시각화 방법의 일부 구성을 상세히 나타낸 동작 흐름도이다.
도 8을 참조하면, 프로세서(110, 210, 310)는 단계 S710 이전에, 미리 정의된 서비스, 서비스 제공자 또는 제품 중 적어도 하나에 대한 디지털화된 사용자 코멘트를 수집하고, 수집된 디지털화된 사용자 코멘트를 집합적 데이터로서 생성한다(S810). 이때, 집합적 데이터는 서비스 업체의 홈페이지를 통해 객체에 대한 사용자들의 코멘트 및 리뷰들을 정제되지 않은 데이터의 형태로 수집하고, 수집된 데이터를 시각화가 가능한 데이터로 가공한 정제된 데이터일 수 있다.
프로세서(110, 210, 310)는 단계 S710 이전에, 표현요소들을 분류하기 위한 의미 기반 카테고리를 정의하고, 정의된 의미 기반 카테고리를 시각화하기 위한 의미 기반 카테고리 간의 계층 관계를 설정한다(S820). 이때, 의미 기반 카테고리 간의 계층 관계는 복수의 카테고리를 의미적으로 상위개념에서 하위개념으로 설정하여 복수의 표현요소가 연관성을 가지도록 매칭할 수 있다.
이상에서 설명한 바와 같이 도 8의 사전 과정을 거친 후 도 7의 시각화 과정이 진행될 수 있다.
도 9 내지 도 16은 본 발명의 다양한 실시예들에 따라 데이터가 시각화된 사용자 인터페이스를 나타낸 도면들이다.
도 9는 본 발명의 일 실시예에 따른 사용자와의 인터랙션에 의하여 시각화된 데이터 계층 구조의 사용자 인터페이스를 나타낸 도면이다.
도 9를 참조하면, 도 5에 도시된 사용자 인터페이스에서 "주류" 카테고리에 속하는 시각화 영역의 테두리에 강조 표시가 도시된다. 사용자와의 인터랙션에 의하여 "주류" 카테고리에 해당하는 통계 정보를 타임라인에 따라 디스플레이하는 사용자 명령이 수신되면, 도 10 내지 도 12와 같이 타임라인 디스플레이가 도시된다.
타임라인 디스플레이를 요구하는 사용자 명령은 활성화된 영역에 대한 미리 정의된 키(key), 미리 정의된 터치(touch), 미리 정의된 음성 입력 등을 통하여 프로세서(110, 210, 310)에 의하여 인식될 수 있다.
도 10 내지 도 12는 본 발명의 일 실시예에 따른 사용자와의 인터랙션에 의하여 시간 경과를 반영하여 시각화된 통계 정보의 사용자 인터페이스를 나타낸 도면이다.
도 10 내지 도 12에서는 시간이 지남에 따라 리뷰 데이터의 세그먼트가 방사형 형태의 시간 축을 따라 축적되는 형태의 구조를 이루고 있다. 리뷰 데이터의 각 세그먼트는 마치 지층(layer)들이 시간에 따라 축적되는 것처럼 시각화될 수 있다.
도 9에서 사용자와의 인터랙션에 의하여 "주류" 카테고리에 대한 타임라인 디스플레이가 요구된 것을 전제로 하면, 도 10 내지 도 12의 타임라인 디스플레이는 "주류" 카테고리에 매핑된 표현요소들을, 출처인 리뷰 데이터의 생성 시점을 기준으로 타임라인에 따라 통계처리한 대표값이 반영된다.
도 10 내지 도 12에서는 도 6에 소개된 것과 같은 타임라인 디스플레이와 타임라인 네비게이션 메뉴가 함께 제공된다.
사용자와의 인터랙션에 의하여 "주류" 카테고리의 계층 영역(hierarchical area)에 속하는 표현요소들 중 각 시간-면적 층(layer)에 속하는 표현요소들에 대한 통계처리된 대표값이 시각화된다.
도 10을 예로 들면, 사용자가 타임라인 네비게이션 메뉴를 통하여 2010년 8월부터 2011년 8월까지의 리뷰 데이터의 통계 정보를 선택한 상황이 도시된다.
도 10에서는 6개월 단위로 구분된 시간-면적 층이 표시되는데, 사용자가 선택한 시간의 범위 또는 프로세서가 제공할 수 있는 시간의 범위에 따라 표시되는 방사형의 면적 및 시간 단위도 적응적으로 조정될 수 있다.
도 10에서 선택된 2011년 8월까지의 "주류"에 대한 평가의견은 부정적인 내용이 많았으나, 언급되는 빈도가 줄어들면서 부정적인 평가도 약화되고 있음이 도시된다.
도 11에서는 2013년 2월까지의 리뷰 데이터 통계값이 도시된다. 시간-면적 층에 대하여 리뷰의 수가 많을수록 면적이 커지고 긍정적인 리뷰가 많을 수록 한색 계열의 색상을 띠는 것은 앞의 도 4 내지 도 6과 같다. 즉, 타임라인 디스플레이에서는 기본적으로 제공되는 시각화 디스플레이와 동등한 옵션이 제공되어 사용자에게 일관된 관점을 제공할 수 있다.
도 11에 도시된 것처럼 "주류"에 대한 평가 의견은 중립적인 수준에 이르렀다가 다시 부정적인 색상을 나타낸다.
도 12에서는 2015년 2월까지의 리뷰 데이터의 통계처리된 대표값이 반영되어 시각화된다. 2013년 8월을 기준으로 부정적인 의견보다 긍정적인 의견이 다수를 이루었으며, 시간이 지남에 따라 긍정적인 의견의 강도가 높아지고 있음이 도시된다.
또한 6개월 단위로 구분된 시간 구간을 분석하면, 최근 3년간에는 하절기에 리뷰 데이터가 증가함을 알 수 있는데, 이는 해당 음식점에 방문하는 고객들의 성향을 파악하는 데에도 도움을 줄 것이다.
이처럼 본 발명의 시각화를 통해서 시간에 따른 평가의 성향 변화를 한 눈에 파악할 수 있으며, 지정된 시간 범위 안에서 어느 기간에 많은 평가 의견이 있는지 확인할 수 있으며 급격하게 리뷰의 양이 변화되는 시점을 발견하여 해당 음식점이 성공 또는 실패를 하게 된 원인을 분석할 수 있다.
사용자는 도 10 내지 도 12의 시각화된 실시예를 보고 리뷰의 수가 급격하게 증가하는 구간, 또한 리뷰의 평가의견이 급격하게 변화하는 구간을 직관적으로 파악할 수 있으므로, 해당 음식점의 이슈를 가장 잘 표현하는 리뷰 데이터를 탐색하는 데에도 용이한 사용자 인터페이스가 제공될 수 있다.
도 13은 본 발명의 일 실시예에 따른 사용자와의 인터랙션에 의하여 시각화된 통계 정보 및 집합적 데이터의 사용자 인터페이스를 나타낸 도면이다.
도 13을 통하여 사용자는 특정 시기의 리뷰 데이터를 구체적으로 확인함으로써 해당 음식점의 이슈를 가장 잘 표현하는 리뷰 데이터를 직접적으로 탐색할 수 있다.
사용자가 도 13과 같이 부정적인 의견이 다시 많아진 2013년 2월 근처의 시간 구간에 대한 사용자 리뷰를 상세히 보기를 원하는 경우, 해당 구간에 대한 사용자 리뷰의 원본 데이터를 디스플레이할 수 있다.
이때 인터페이스부(160, 270, 370)에 의하여 특정 카테고리의 특정 시간 구간에 해당하는 리뷰 데이터를 조회하는 사용자 명령이 수신된 경우, 프로세서(110, 210, 310)는 스토리지 장치(120, 230, 320)로부터 특정 카테고리와 특정 시간 구간을 검색 조건으로 하여 필요한 리뷰 데이터의 원본 데이터를 검색할 수 있다.
검색된 원본 데이터는 생성 일자 순으로 그대로 디스플레이될 수도 있으나, 특정 시간 구간의 긍정/부정 의견의 통계처리된 대표값을 반영하여, 대표값과 동일한 극성을 가지는 리뷰 데이터를 우선적으로 디스플레이할 수도 있다.
도 13과 같이 부정적인 의견이 다시 증가한 2013년 2월의 경우, 부정적인 의견을 나타내는 리뷰 데이터가 우선적으로 디스플레이됨으로써 사용자는 해당 시간 구간에 해당 카테고리에 관한 이슈가 무엇이었는지를 빠르게 인식할 수 있다.
도 14 내지 도 16은 본 발명의 일 실시예에 따른 어플리케이션 및 사용자 인터랙션에 의한 데이터 시각화의 사용자 인터페이스를 나타낸 도면이다.
본 발명의 데이터 시각화 방법은 어플리케이션 소프트웨어에 의하여 실행될 수 있다. 어플리케이션 소프트웨어가 실행되면, 도 14와 같은 지도 기반의 간략화된 데이터 시각화 사용자 인터페이스가 제공될 수 있다. 지도 상에 시각화 서비스가 제공되는 대상 음식점들의 위치가 표시되고, 음식점 각각에 대한 간략화된 카테고리가 제공될 수 있다.
상위의 카테고리 "음식", "환경", "특기사항"의 3개에 대한 표현요소들의 통계 정보가 간략히 제공될 수 있으며, 지도의 우측 하단에는 주변 지역의 서비스가 제공되는 음식점의 리스트에 대응하는 리스트 버튼이 표시된다. 리스트 버튼에 대한 사용자 입력에 응답하여 주변 지역의 음식점의 리스트가 제공될 수 있다.
도 14에서 특정 음식점을 선택하면, 도 15에서 선택된 음식점의 리뷰 데이터의 시각화 사용자 인터페이스가 도시된다. 선택된 음식점의 리뷰 데이터에 대한 시각화 디스플레이가 화면의 중심에 나타난다. 배경의 지도는 선택된 음식점의 지도 상의 위치를 화면의 중심으로 두고 표시될 수 있다.
도 14에서 제1 계층(hierarchy)까지만 표시되었던 시각화는 도 15에서는 하위의 계층(hierarchy)/까지도 표시될 수 있다. 상세하게 표시되는 계층의 범위는 미리 설정될 수도 있고 사용자에 의하여 변경될 수도 있다.
도 15에서는 도 14와의 관련성과 추가적인 상세 정보를 제공할 수 있는 사용자 메뉴가 추가적으로 제공된다. 예를 들어 화면의 우측 하단의 "매장정보" 버튼은 선택된 음식점의 좌석 수, 흡연석의 유무, 전화번호, 영업시간 등의 기본 정보를 제공하기 위한 사용자 메뉴이다. 화면 좌측 상단의 "Back to MAP" 버튼은 이전 화면인 도 14로 돌아갈 수 있는 기능을 제공하는 사용자 메뉴이다.
도 15에서 "음식" - "주류" 카테고리를 선택하여 상세한 통계 정보를 요구하는 사용자 명령이 수신되면, 시각화 장치(100, 200, 300)의 프로세서(110, 210, 310)는 도 16과 같이 선택된 분류를 기준으로 강조된 사용자 인터페이스를 제공할 수 있다. 도 16의 강조된 사용자 인터페이스는 선택된 분류에 대한 상세하게 계층화된 통계 정보를 시각화할 수 있다.
도 16에서 더 이상의 상세 정보를 원하지 않고 이전 화면인 도 15로 돌아가기를 원하는 사용자를 위하여 도 16의 화면의 좌측 상단의 "Back to 2ND Viewer" 버튼이 제공될 수 있다.
본 발명은 웹 사이트 상에서 업데이트되는 음식점에 대한 리뷰 데이터에 나타나는 평가어휘(표현요소)에 대한 통계 정보를 시각화함으로써 음식점에 대한 평가를 직관적으로 사용자에게 전달할 수 있다.
본 발명은 음식점을 평가하는 온톨로지 체계를 구축하는 단계와 시간에 따라 변화하는 음식점 리뷰의 긍정/부정 의견의 계층(hierarchy)에 따른 통계 정보를 효율적으로 시각화하는 단계를 포함한다.
본 발명의 일 실시예에서는 Sunburst 그래프와 같은 방사형 그래프를 기반으로 계층화된 온톨로지의 통계 정보를 시각화할 수 있다. 계층화된 온톨로지 대비 실제로 수집된 리뷰 데이터에 나타난 카테고리 및 표현요소의 통계 정보가 시각화될 수 있으며, 계층 정보는 온톨로지의 계층 정보를 기반으로 하되, 실제 수집된 데이터의 빈도, 표현요소가 나타나는 패턴을 기반으로 취사 선택될 수 있다. 시간의 변화에 따라 도출된 통계 정보는 온톨로지 요소의 영역 및 색상(채도)이 변화하는 시각화 기법을 적용하여 시각화된다.
본 발명의 다른 일 실시예에서는 Sunburst 그래프와 같은 방사형 그래프를 기반으로 계층화된 온톨로지의 시각화 요소의 외곽 둘레에 시간에 따른 긍정/부정적 변화를 보여줄 수 있는 시각화 요소를 결합할 수 있다. 즉, 특정 카테고리에 대응하는 면적의 외곽 둘레에 대한 사용자 인터랙션에 의하여 특정 카테고리가 선택되고, 선택된 카테고리에 대한 시간에 따른 긍정/부정의 평가의견의 변화에 대한 시각화가 제공될 수 있다.
본 발명의 또 다른 일 실시예에서는 온톨로지의 계층 구조를 노드 네트워크 형태로 표현한 뒤 시간에 따른 긍정/부정의 평가의견의 변화를 방사형 그래프 기반의 시각화로 표현할 수 있다.
본 발명의 또 다른 일 실시예에서는 온톨로지의 계층 구조를 노드 네트워크 형태로 표현한 뒤 시간에 따른 긍정/부정의 평가의견의 변화를 노드의 Tracing 패턴 형태로 표현할 수 있다.
이상 제안된 본 발명의 다양한 실시예에 따른 데이터 시각화 기법은 기존에 정적인 형태로 평가 결과를 보여주는 서비스와는 달리 시간에 따라서 평가 결과의 변화패턴을 볼 수 있다는 점이 특징이다.
본 발명의 일 실시 예에 따른 데이터 시각화 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
100, 200, 300: 데이터 시각화 장치
110, 210, 310: 프로세서
120, 230, 320: 스토리지 장치
130, 240, 340: 표현요소 매핑부
140, 250, 350: 통계 정보 획득부
150, 260 360: 시각화부
160, 270, 370: 인터페이스부
220: 집약적 데이터 생성부
330: 계층 관계 설정부
110, 210, 310: 프로세서
120, 230, 320: 스토리지 장치
130, 240, 340: 표현요소 매핑부
140, 250, 350: 통계 정보 획득부
150, 260 360: 시각화부
160, 270, 370: 인터페이스부
220: 집약적 데이터 생성부
330: 계층 관계 설정부
Claims (17)
- 디지털 문서를 포함하는 집합적 데이터로부터 추출된 복수의 표현요소들을 계층 관계가 설정된 의미 기반 카테고리 상에 매핑하는 단계;
상기 의미 기반 카테고리 각각에 매핑된 표현요소들의 통계 정보를 획득하는 단계; 및
상기 의미 기반 카테고리 각각을 상기 계층 관계 및 상기 표현요소들의 통계 정보를 반영하여 시각화하는 단계;
를 포함하는 데이터 시각화 방법. - 제1항에 있어서,
상기 복수의 표현요소들을 상기 의미 기반 카테고리 상에 매핑하는 단계 이전에, 상기 표현요소들을 분류하기 위한 의미 기반 카테고리를 정의하고, 상기 정의된 의미 기반 카테고리를 시각화하기 위한 상기 의미 기반 카테고리 간의 계층 관계를 설정하는 단계;
를 더 포함하는 데이터 시각화 방법. - 제1항에 있어서,
상기 매핑하는 단계 이전에, 미리 정의된 서비스, 서비스 제공자 또는 제품 중 적어도 하나에 대한 디지털화된 사용자 코멘트를 수집하고, 상기 수집된 디지털화된 사용자 코멘트를 상기 집합적 데이터로서 생성하는 단계;
를 더 포함하는 데이터 시각화 방법. - 제1항에 있어서,
상기 시각화된 상기 의미 기반 카테고리 중 어느 하나에 대한 사용자 입력을 수신하는 단계;
를 더 포함하고,
상기 시각화하는 단계는
상기 사용자의 입력에 대응하는 상기 의미 기반 카테고리에 대하여 심화된 계층 관계를 반영하는 통계 정보를 시각화하는 것
을 특징으로 하는 데이터 시각화 방법. - 제1항에 있어서,
상기 통계 정보는
상기 의미 기반 카테고리 각각에 매핑된 표현요소들의 개수, 상기 표현요소로부터 추출된 긍정 또는 부정의 강도를 지표화한 척도 및 상기 표현요소가 생성된 시간 지표 중 적어도 하나 이상을 포함하는 것
을 특징으로 하는 데이터 시각화 방법. - 제1항에 있어서,
상기 시각화하는 단계는
상기 의미 기반 카테고리 각각에 매핑된 표현요소들이 생성된 시간 지표를 참조하여 시간 구간 별로 상기 의미 기반 카테고리 각각에 매핑된 표현요소들의 통계 정보를 시각화하는 것
을 특징으로 하는 데이터 시각화 방법. - 제1항에 있어서,
상기 시각화하는 단계는
상기 통계 정보의 제1 요소를 제1 시각 정보의 형태로 반영하여 표현하고, 상기 통계 정보의 제2 요소를 제2 시각 정보의 형태로 반영하여 표현하는 것
을 특징으로 하는 데이터 시각화 방법. - 제2항에 있어서,
상기 계층 관계를 설정하는 단계는
상기 의미 기반 카테고리 간의 계층 관계를 미리 설정된 상기 표현요소들의 의미에 기반하여 또는 사용자로부터 입력된 명령에 의하여 설정하는 것
을 특징으로 하는 데이터 시각화 방법. - 디지털 문서를 포함하는 집합적 데이터로부터 추출된 복수의 표현요소 및 생성된 통계 정보를 저장하는 스토리지 장치;
상기 저장된 복수의 표현요소를 계층 관계가 설정된 의미 기반 카테고리 상에 매핑하는 표현요소 매핑부;
상기 의미 기반 카테고리 각각에 매핑된 표현요소들의 상기 통계 정보를 획득하는 통계 정보 획득부; 및
상기 의미 기반 카테고리 각각을 상기 계층 관계 및 상기 표현요소들의 통계 정보를 반영하여 시각화하는 시각화부;
를 포함하는 데이터 시각화 장치. - 제9항에 있어서,
상기 표현요소들을 분류하기 위한 의미 기반 카테고리를 정의하고, 상기 정의된 의미 기반 카테고리를 시각화하기 위한 상기 의미 기반 카테고리 간의 계층 관계를 설정하는 계층 관계 설정부;
를 더 포함하는 데이터 시각화 장치. - 제9항에 있어서,
미리 정의된 서비스, 서비스 제공자 또는 제품 중 적어도 하나에 대한 디지털화된 사용자 코멘트를 수집하고, 상기 수집된 디지털화된 사용자 코멘트를 상기 집합적 데이터로서 생성하는 집약적 데이터 생성부;
를 더 포함하는 데이터 시각화 장치. - 제9항에 있어서,
상기 시각화된 상기 의미 기반 카테고리 중 어느 하나에 대한 사용자 입력을 수신하는 인터페이스부;
를 더 포함하고,
상기 시각화부는
상기 사용자의 입력에 대응하는 상기 의미 기반 카테고리에 대하여 심화된 계층 관계를 반영하는 통계 정보를 시각화하는 것
을 특징으로 하는 데이터 시각화 장치. - 제9항에 있어서,
상기 통계 정보는
상기 의미 기반 카테고리 각각에 매핑된 표현요소들의 개수, 상기 표현요소로부터 추출된 긍정 또는 부정의 강도를 지표화한 척도 및 상기 표현요소가 생성된 시간 지표 중 적어도 하나 이상을 포함하는 것
을 특징으로 하는 데이터 시각화 장치. - 제9항에 있어서,
상기 시각화부는
상기 의미 기반 카테고리 각각에 매핑된 표현요소들이 생성된 시간 지표를 참조하여 시간 구간 별로 상기 의미 기반 카테고리 각각에 매핑된 표현요소들의 통계 정보를 시각화하는 것
을 특징으로 하는 데이터 시각화 장치. - 제9항에 있어서,
상기 시각화부는
상기 통계 정보의 제1 요소를 제1 시각 정보의 형태로 반영하여 표현하고, 상기 통계 정보의 제2 요소를 제2 시각 정보의 형태로 반영하여 표현하는 것
을 특징으로 하는 데이터 시각화 장치. - 제10항에 있어서,
상기 계층 관계 설정부는
상기 의미 기반 카테고리 간의 계층 관계를 미리 설정된 상기 표현요소들의 의미에 기반하여 또는 사용자로부터 입력된 명령에 의하여 설정하는 것
을 특징으로 하는 데이터 시각화 장치. - 제1항 내지 제8항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160067650A KR101730883B1 (ko) | 2016-05-31 | 2016-05-31 | 코멘트 데이터의 계층화된 정보를 시각화하는 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160067650A KR101730883B1 (ko) | 2016-05-31 | 2016-05-31 | 코멘트 데이터의 계층화된 정보를 시각화하는 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101730883B1 true KR101730883B1 (ko) | 2017-04-28 |
Family
ID=58702214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160067650A KR101730883B1 (ko) | 2016-05-31 | 2016-05-31 | 코멘트 데이터의 계층화된 정보를 시각화하는 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101730883B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112084378A (zh) * | 2020-09-27 | 2020-12-15 | 中国建设银行股份有限公司 | 数据的单图表展示方法及装置 |
KR102368875B1 (ko) * | 2021-07-19 | 2022-03-02 | 한국과학기술정보연구원 | 데이터셋 연관 관계 가시화 방법 및 장치 |
KR20220064055A (ko) * | 2020-11-11 | 2022-05-18 | 신하영 | 다수의 사용자의 코멘트를 공유하는 방법 및 디바이스 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7412093B2 (en) | 2004-12-17 | 2008-08-12 | Electronics And Telecommunications Research Institute | Hybrid apparatus for recognizing answer type |
-
2016
- 2016-05-31 KR KR1020160067650A patent/KR101730883B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7412093B2 (en) | 2004-12-17 | 2008-08-12 | Electronics And Telecommunications Research Institute | Hybrid apparatus for recognizing answer type |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112084378A (zh) * | 2020-09-27 | 2020-12-15 | 中国建设银行股份有限公司 | 数据的单图表展示方法及装置 |
KR20220064055A (ko) * | 2020-11-11 | 2022-05-18 | 신하영 | 다수의 사용자의 코멘트를 공유하는 방법 및 디바이스 |
KR102476662B1 (ko) * | 2020-11-11 | 2022-12-12 | 신하영 | 다수의 사용자의 코멘트를 공유하는 방법 및 디바이스 |
KR102368875B1 (ko) * | 2021-07-19 | 2022-03-02 | 한국과학기술정보연구원 | 데이터셋 연관 관계 가시화 방법 및 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gaur et al. | Capitalizing on big data and revolutionary 5G technology: Extracting and visualizing ratings and reviews of global chain hotels | |
Lee et al. | Exploring influential factors affecting guest satisfaction: Big data and business analytics in consumer-generated reviews | |
Bilgihan et al. | Identifying restaurant satisfiers and dissatisfiers: Suggestions from online reviews | |
Gensler et al. | Listen to your customers: Insights into brand image using online consumer-generated product reviews | |
Antonio et al. | Hotel online reviews: different languages, different opinions | |
Duan et al. | Mining online user-generated content: using sentiment analysis technique to study hotel service quality | |
CN109992650A (zh) | 用于在运行中提供个性化洞察的认知对话代理 | |
Ertug et al. | From the editors—A brief primer on data visualization opportunities in management research | |
CN114514546A (zh) | 用于促进产品研发的系统、方法和用户界面 | |
Ladeira et al. | Acceptance of service robots: A meta-analysis in the hospitality and tourism industry | |
John et al. | MultiCloud: Interactive word cloud visualization for multiple texts | |
Ting et al. | What does hotel website content say about a property—an evaluation of upscale hotels in Taiwan and China | |
Alper et al. | Opinionblocks: Visualizing consumer reviews | |
Singh et al. | Twenty years of journal of quality assurance in hospitality & tourism: A bibliometric assessment | |
US20160343004A1 (en) | Process journey sentiment analysis | |
Shamim et al. | Evaluation of opinion visualization techniques | |
Jia | Measuring tourists’ meal experience by mining online user generated content about restaurants | |
KR101730883B1 (ko) | 코멘트 데이터의 계층화된 정보를 시각화하는 장치 및 방법 | |
Burley | Information visualization as a knowledge integration tool | |
Wanner et al. | Integrated visual analysis of patterns in time series and text data-workflow and application to financial data analysis | |
Portenoy et al. | Leveraging citation networks to visualize scholarly influence over time | |
Yang et al. | Exploring service quality model from the perspective of sensory perception | |
JP2004021445A (ja) | テキストデータ分析システム、テキストデータ分析方法およびコンピュータプログラム | |
Braşoveanu et al. | Visualizing statistical linked knowledge for decision support | |
Zhao et al. | Modeling customer satisfaction and revisit intention from online restaurant reviews: An attribute-level analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |