KR102022944B1 - 빅데이터 분석 보고서를 자동으로 생성하는 방법 및 이를 수행하는 장치 - Google Patents

빅데이터 분석 보고서를 자동으로 생성하는 방법 및 이를 수행하는 장치 Download PDF

Info

Publication number
KR102022944B1
KR102022944B1 KR1020180043764A KR20180043764A KR102022944B1 KR 102022944 B1 KR102022944 B1 KR 102022944B1 KR 1020180043764 A KR1020180043764 A KR 1020180043764A KR 20180043764 A KR20180043764 A KR 20180043764A KR 102022944 B1 KR102022944 B1 KR 102022944B1
Authority
KR
South Korea
Prior art keywords
analysis result
result data
analysis
data
importance
Prior art date
Application number
KR1020180043764A
Other languages
English (en)
Other versions
KR20180122275A (ko
Inventor
이동연
장석호
유재명
Original Assignee
비씨카드(주)
주식회사 퀀트랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 비씨카드(주), 주식회사 퀀트랩 filed Critical 비씨카드(주)
Publication of KR20180122275A publication Critical patent/KR20180122275A/ko
Application granted granted Critical
Publication of KR102022944B1 publication Critical patent/KR102022944B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • G06F17/243
    • G06F17/248
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Abstract

본 발명의 일 실시예에 따르면, 장치가, 빅데이터 분석 보고서를 자동으로 생성하는 방법에 있어서, (a) 보고서 생성 신호가 획득되면, 미리 설정된 적어도 하나의 분석 프로세스에 따라 데이터를 분석하거나 분석하도록 지원하는 단계; (b) 상기 분석 결과로서 생성된 데이터 구조에 포함된 적어도 하나의 분석 결과 데이터에 대하여 데이터 위상 또는 연관도 순으로 중요도를 설정하거나 설정하도록 지원하는 단계; (c) 상기 설정된 중요도를 기초로 하여 일 이상의 분석 결과 데이터를 보고서 내용으로 선택하는 단계; 및 (d) 상기 선택된 일 이상의 분석 결과 데이터를 소정의 보고서 템플릿에 반영하여 보고서를 생성하여 제공하는 단계를 포함하는, 빅데이터 분석 보고서 자동 생성 방법이 제공된다.

Description

빅데이터 분석 보고서를 자동으로 생성하는 방법 및 이를 수행하는 장치{METHOD FOR GENERATING BIG DATA ANALYSIS REPORT AUTOMATICALLY AND DEVICE PERFORMING THE SAME}
본 발명은 빅데이터 분석 보고서를 자동으로 생성하는 방법 및 이를 수행하는 장치에 관한 것으로, 더욱 상세하게는, 특정 학습에 의해 빅데이터가 분석되고 분석 결과에 대해 중요도가 설정되며, 설정된 중요도를 기초로 소정의 분석 결과가 선택되도록 함으로써, 수요자가 필요로 할 정보만을 담은 빅데이터 분석 보고서가 신속하고 정확하게 자동 생성될 수 있도록 하는 방법에 관한 것이다.
최근, 빅데이터를 기반으로 하는 학습을 통해 수요자가 필요로 하는 정보를 도출해내어 제공하는 빅데이터 분석 기술에 대한 연구가 활발히 진행되고 있다. 특히, 수요자가 방대한 양의 정보를 직접 분석하여 작성하지 않아도 기계 학습을 통해 빅데이터 분석 보고서가 자동으로 생성되는 기술에 대한 개발이 집중적으로 이루어지고 있다.
하지만, 현재까지 개발된 빅데이터 분석 보고서 자동 생성 기술은, 분석 방법과 보고서 템플릿만이 미리 설정되어, 분석 결과에 관계없이 분석된 내용이 모두 보고서로 출력되어 과도하게 많은 양의 보고서가 생성된다는 단점이 있다.
또한, 수요자가 분석된 보고서를 확인 후, 분석 결과에 따라 필요로 하는 정보 종류만을 별도로 설정하려면, 다시 말해, 분석 결과에 따라 보고서의 내용을 변경하고자 하면, 다른 복잡한 보고서 생성 프로그램을 별도로 마련해야 한다는 문제가 있다.
따라서, 분석 결과에 대해 중요도를 계산하고, 중요도가 높은 순서에 따라 보고서에 포함될 분석 결과를 채택하여, 이를 기반으로 보고서가 작성됨으로써, 수요자가 필요로 하는 정보만이 포함된 빅데이터 분석 보고서가 신속하고 정확하게 자동 생성될 수 있도록 하는 방법에 대한 요구가 점차 증대되고 있으며, 상술한 문제점을 해결하기 위한 방안이 시급한 실정이다.
본 발명은 전술한 종래기술의 문제점을 해결하기 위한 것으로, 특정 학습에 의해 빅데이터가 분석되고 분석 결과에 대해 중요도가 설정되며, 설정된 중요도를 기초로 소정의 분석 결과가 선택되도록 함으로써, 빅데이터 수동 분석 또는 보고서 작성 등의 분석가 개입 없이도 수요자가 필요로 할 정보만을 담은 빅데이터 분석 보고서가 신속하고 정확하게 자동 생성될 수 있도록 하는 것을 그 목적으로 한다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.
상술한 목적을 달성하기 위한 본 발명의 일 실시예에 따르면, 장치가, 빅데이터 분석 보고서를 자동으로 생성하는 방법에 있어서, (a) 보고서 생성 신호가 획득되면, 미리 설정된 적어도 하나의 분석 프로세스에 따라 데이터를 분석하거나 분석하도록 지원하는 단계; (b) 상기 분석 결과로서 생성된 데이터 구조에 포함된 적어도 하나의 분석 결과 데이터에 대하여 데이터 위상 또는 연관도 순으로 중요도를 설정하거나 설정하도록 지원하는 단계; (c) 상기 설정된 중요도를 기초로 하여 일 이상의 분석 결과 데이터를 보고서 내용으로 선택하는 단계; 및 (d) 상기 선택된 일 이상의 분석 결과 데이터를 소정의 보고서 템플릿에 반영하여 보고서를 생성하여 제공하는 단계를 포함하는, 빅데이터 분석 보고서 자동 생성 방법이 제공된다.
상기 데이터 구조에 제1 분석 결과 데이터 및 (i) 상기 제1 분석 결과 데이터에 대한 하위 분석 결과 데이터 또는 (ii) 상기 제1 분석 결과 데이터와 소정의 연관도를 갖는, 제2 분석 결과 데이터가 포함되는 경우, 상기 (b) 단계에서, 상기 제1 분석 결과 데이터에 대해 중요도가 설정된 후, 상기 제2 분석 결과 데이터에 대해 중요도가 설정되는 것을 특징으로 할 수 있다.
상기 데이터 구조에 상기 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재할 때, 상기 (b) 단계에서, 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대해, 분석 변수를 일정 비율로 조정했을 경우의 예상되는 목표지표의 변화를 각각 산출한 후, 상기 목표지표의 변화 정도에 기초하여 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 할 수 있다.
상기 데이터 구조에 상기 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 존재할 때, 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터 각각이 상기 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 할 수 있다.
상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도의 합은 상기 제1 분석 결과 데이터의 중요도보다 작거나 같은 것을 특징으로 할 수 있다.
상기 데이터 구조에 상기 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재할 때, 상기 (b) 단계에서, 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터 각각을 전체 분석 결과 데이터의 평균 또는 분포와 비교하고, 이에 기초하여, 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 할 수 있다.
상기 데이터 구조에 상기 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 존재할 때, 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터 각각이 상기 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 할 수 있다.
상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도의 합은 상기 제1 분석 결과 데이터의 중요도보다 작거나 같은 것을 특징으로 할 수 있다.
상기 (a) 단계에서, 복수의 분석 프로세스에 따라 데이터 분석이 이루어지는 경우, 상기 복수의 분석 프로세스는 상호 계층 관계 또는 연관 관계를 형성하고, 상위 계층 분석 프로세스가 우선적으로 이용되거나 최초 이용된 분석 프로세스와 연관도가 높은 분석 프로세스가 우선적으로 이용되어 데이터 분석이 이루어지는 것을 특징으로 할 수 있다.
상기 데이터 분석이 이루어진 후, 소정의 실행 규칙이 만족되면, 이전의 분석 프로세스와 다른 새로운 분석 프로세스에 따라 데이터 분석이 이루어지고, 상기 실행 규칙은, 상기 이전의 분석 프로세스에 따라 데이터가 분석된 결과에 의미적으로 연관된 새로운 분석 프로세스에 따른 데이터 분석 여부를 결정하기 위한 소정의 조건 규칙일 수 있다.
상기 (c) 단계는, 상기 설정된 중요도 순으로 소정의 개수의 분석 결과 데이터를 선택하는 것을 특징으로 할 수 있다.
상기 (c) 단계는, 상기 설정된 중요도가 미리 설정된 하한값 이상인 분석 결과 데이터를 선택하는 것을 특징으로 할 수 있다.
상기 (d) 단계는, 상기 선택된 일 이상의 분석 결과 데이터를 상기 소정의 보고서 템플릿에 따라 자연어, 표 및 그래프 중 적어도 어느 하나의 형태로 변환함으로써 보고서를 생성하여 제공하는 것을 특징으로 할 수 있다.
한편, 본 발명의 다른 실시예에 따르면, 보고서 생성 신호가 획득되면, 미리 설정된 적어도 하나의 분석 프로세스에 따라 데이터를 분석하거나 분석하도록 지원하는 데이터 분석부; 상기 분석 결과로서 생성된 데이터 구조에 포함된 적어도 하나의 분석 결과 데이터에 대하여 데이터 위상 또는 연관도 순으로 중요도를 설정하거나 설정하도록 지원하는 중요도 설정부; 상기 설정된 중요도를 기초로 하여 일 이상의 분석 결과 데이터를 보고서 내용으로 선택하는 내용 선택부; 및 상기 선택된 일 이상의 분석 결과 데이터를 소정의 보고서 템플릿에 반영하여 보고서를 생성하여 제공하는 보고서 생성부를 포함하는, 장치가 제공된다.
상기 데이터 구조에 제1 분석 결과 데이터 및 (i) 상기 제1 분석 결과 데이터에 대한 하위 분석 결과 데이터 또는 (ii) 상기 제1 분석 결과 데이터와 소정의 연관도를 갖는, 제2 분석 결과 데이터가 포함되는 경우, 상기 (b) 단계에서, 상기 제1 분석 결과 데이터에 대해 중요도가 설정된 후, 상기 제2 분석 결과 데이터에 대한 중요도가 설정되는 것을 특징으로 할 수 있다.
상기 데이터 구조에 상기 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재할 때, 상기 중요도 설정부에서, 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대해, 분석 변수를 일정 비율로 조정했을 경우의 예상되는 목표지표의 변화를 각각 산출한 후, 상기 목표지표의 변화 정도에 기초하여 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 할 수 있다.
상기 데이터 구조에 상기 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 존재할 때, 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터 각각이 상기 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 할 수 있다.
상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도의 합은 상기 제1 분석 결과 데이터의 중요도보다 작거나 같은 것을 특징으로 할 수 있다.
상기 데이터 구조에 상기 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재할 때, 상기 중요도 설정부에서, 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터 각각을 전체 분석 결과 데이터의 평균 또는 분포와 비교하고, 이에 기초하여, 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 할 수 있다.
상기 데이터 구조에 상기 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 존재할 때, 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터 각각이 상기 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 할 수 있다.
상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도의 합은 상기 제1 분석 결과 데이터의 중요도보다 작거나 같은 것을 특징으로 할 수 있다.
상기 데이터 분석부에서, 복수의 분석 프로세스에 따라 데이터 분석이 이루어지는 경우, 상기 복수의 분석 프로세스는 상호 계층 관계 또는 연관 관계를 형성하고, 상위 계층 분석 프로세스가 우선적으로 이용되거나 최초 이용된 분석 프로세스와 연관도가 높은 분석 프로세스가 우선적으로 이용되어 데이터 분석이 이루어지는 것을 특징으로 할 수 있다.
상기 데이터 분석이 이루어진 후, 소정의 실행 규칙이 만족되면, 이전의 분석 프로세스와 다른 새로운 분석 프로세스에 따라 데이터 분석이 이루어지고, 상기 실행 규칙은, 상기 이전의 분석 프로세스에 따라 데이터가 분석된 결과에 의미적으로 연관된 새로운 분석 프로세스에 따른 데이터 분석 여부를 결정하기 위한 소정의 조건 규칙일 수 있다.
상기 내용 선택부는, 상기 설정된 중요도 순으로 소정의 개수의 분석 결과 데이터를 선택하는 것을 특징으로 할 수 있다.
상기 내용 선택부는, 상기 설정된 중요도가 미리 설정된 하한값 이상인 분석 결과 데이터를 선택하는 것을 특징으로 할 수 있다.
상기 보고서 생성부는, 상기 선택된 일 이상의 분석 결과 데이터를 상기 소정의 보고서 템플릿에 따라 자연어, 표 및 그래프 중 적어도 어느 하나의 형태로 변환함으로써 보고서를 생성하여 제공하는 것을 특징으로 할 수 있다.
본 발명의 일 실시예에 따르면, 보고서를 생성함에 있어, 분석 결과 데이터마다 데이터 위상 또는 연관도 순으로 중요도를 설정하고, 설정된 중요도를 기초로 보고서에 포함될 분석 결과 데이터를 선택함으로써, 수요자가 필요로 하는 정보만이 포함된 빅데이터 분석 보고서가 신속하고 정확하게 자동 생성될 수 있도록 한다.
본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 본 발명의 일 실시예에 따른 빅데이터 분석 보고서를 자동으로 생성하는 장치의 구성을 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따라 빅데이터 분석 보고서가 자동으로 생성되는 과정을 도시한 순서도이다.
도 3은 분석 결과 데이터에 대한 중요도 설정의 일 실시예를 개략적으로 나타낸 도면이다.
도 4는 분석 결과 데이터에 대한 중요도 설정의 다른 실시예를 개략적으로 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따라 빅데이터 분석 보고서 자동 생성 시 제공되는 화면을 예시하는 도면이다.
이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시예로 한정되는 것은 아니다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 구비할 수 있다는 것을 의미한다.
이하 첨부된 도면을 참고하여 본 발명의 실시예를 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 빅데이터 분석 보고서를 자동으로 생성하는 장치의 구성을 도시한 블록도이다.
먼저, 장치(100)는 휴대폰, 스마트폰, PDA(Personal Digital Assistant), PMP(Portable Multimedia Player), 태블릿 PC 등과 같이 터치 스크린 패널이 구비된 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있으며, 이 외에도 데스크탑 PC, 태블릿 PC, 랩탑 PC, 셋탑 박스를 포함하는 IPTV와 같이, 애플리케이션을 설치하고 실행할 수 있는 기반이 마련된 장치도 포함할 수 있다.
본 발명의 일 실시예에 따르면, 장치(100)가 상기와 같이 애플리케이션을 설치하고 실행할 수 있는 기반이 마련된 장치인 경우, 장치(100)는 빅데이터 분석 보고서 자동 생성 서비스를 제공하는 애플리케이션을 설치하여 메모리에 저장할 수 있다. 예를 들어, 장치(100)는 각종 애플리케이션이 업로드 되어 있는 앱 스토어 서버(미도시)에 접속한 후, 보고서 양식 자료 업로드 서비스, 분석 프로세스 설정 서비스 등 다양한 서비스를 제공하는 빅데이터 분석 보고서 자동 생성 서비스 제공 애플리케이션을 다운로드 하여 설치할 수 있다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 장치(100)는 데이터 분석부(110), 중요도 설정부(120), 내용 선택부(130) 및 보고서 생성부(140)를 포함한다.
데이터 분석부(110)는 보고서 생성 신호가 획득되면, 미리 설정된 적어도 하나의 분석 프로세스에 따라 데이터 분석을 실시하거나 데이터 분석이 실시되도록 할 수 있다. 이 때, 분석 대상인 데이터는 장치(100) 내 저장된 빅데이터일 수 있으며, 외부 장치 또는 서버(미도시)로부터 별도 수신된 빅데이터일 수도 있다.
본 발명의 일 실시예에 따르면, 복수의 분석 프로세스에 따라 데이터 분석이 이루어지는 경우, 데이터 분석부(110)는 데이터 간 상호 계층 관계 또는 연관 관계를 형성하고, 상위 계층 분석 프로세스를 우선적으로 이용하거나 최초 이용된 분석 프로세스와 연관도가 높은 분석 프로세스를 우선적으로 이용함으로써 데이터를 분석할 수 있다.
구체적으로, 데이터 분석부(110)는 데이터 분석 후, 소정의 실행 규칙이 만족되면, 이전의 분석 프로세스와 다른 새로운 분석 프로세스에 따라 데이터 분석을 실시할 수 있다.
상기 실행 규칙은, 이전의 분석 프로세스에 따라 데이터가 분석된 결과에 의미적으로 연관된 새로운 분석 프로세스에 따른 데이터 분석 여부를 결정하기 위한 소정의 조건 규칙일 수 있다. 다시 말해, 분석 결과에 종속되는 다음 분석 프로세스를 수행하기 위한 조건으로, 다음 분석 프로세스의 실시 여부를 판단하기 위한 조건을 의미한다.
예를 들어, 가맹점 매출 고객에 대한 성비 분석 프로세스에 따라 분석된 결과가 여성 99%, 남성 1% 라고 가정하면, 남성의 선호 물품에 대한 추가 분석은 무의미하기 때문에, 20% 미만인 분석 결과에 대하여 다음 분석 프로세스에 따른 데이터 분석이 실시되지 않도록 성비 어느 한쪽의 비율을 20% 이상으로 설정하는 소정의 실행 규칙이 존재할 수 있다.
중요도 설정부(120)는 데이터 분석부(110)를 통해 분석 결과로서 생성된 데이터 구조에 포함된 적어도 하나의 분석 결과 데이터에 대하여 데이터 위상 또는 연관도 순으로 중요도를 설정하거나 설정하도록 지원할 수 있다.
구체적으로, 상기 분석 결과로서 생성된 데이터 구조에 제1 분석 결과 데이터 및 제1 분석 결과 데이터에 대한 하위 분석 결과 데이터이거나, 또는 제1 분석 결과 데이터와 소정의 연관도를 갖는 제2 분석 결과 데이터가 포함되는 경우, 중요도 설정부(120)는 제1 분석 결과 데이터에 대한 중요도 설정 후 제2 분석 결과 데이터에 대한 중요도를 설정할 수 있다.
중요도를 배분하는 방법에는 다음과 같은 방법이 있다.
첫째, 목표지표(예를 들어, 매출)와 분석 절차에서 분석할 변수(예를 들어, 고객 성비)의 관계를 기계학습을 통해 학습한 후, 현재 보고서 작성 중인 대상에서 각 분석 절차의 변수들을 일정 비율로 조정했을 때 목표지표의 예상되는 변화를 측정한다. 이렇게 구한 각 변수의 변화량 또는 변화량의 제곱 등 수학적 변환의 비율에 따라 해당 변수에 대한 분석 절차의 중요도를 합이 100%가 되도록 배분할 수 있다.
둘째, 목표지표 없이 분석 절차에서 분석할 변수 또는 분석 절차의 결과를 전체 평균이나 전체 분포 등과 비교하여 차이를 구한다. 이 차이 또는 차이의 제곱 등 수학적 변환의 비율에 따라 해당 분석 절차의 중요도를 합이 100%가 되도록 배분할 수 있다.
본 발명의 일 실시예에 따르면, 상기 분석 결과로서 생성된 데이터 구조에 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재하는 경우, 중요도 설정부(120)는 제1 분석 결과 데이터 및 제3 분석 결과 데이터에 대해, 분석 변수를 일정 비율로 조정한 경우에 예상되는 목표지표의 변화를 각각 산출하고, 산출한 목표지표의 변화 정도에 기초하여 제1 분석 결과 데이터 및 제3 분석 결과 데이터에 대한 중요도를 각각 설정할 수 있다.
예를 들어, 목표지표가 "매출"이고, 제1 분석 결과 데이터가 "고객 성비"에 대한 분석 결과, 제3 분석 결과 데이터가 "고객 연령대"에 대한 분석 결과이며, 제1 분석 결과 데이터와 제3 분석 결과 데이터가 데이터 구조 상에서 대응되는 위상에 있다고 가정하면, 중요도 설정부(120)는 "고객 성비"에 대한 분석 결과를 일정 비율로 조정한 경우에 예상되는 매출 변화량을 산출하고, "고객 연령대"에 대한 분석 결과를 일정 비율로 조정한 경우에 예상되는 매출 변화량을 산출할 수 있다. 이 후, 중요도 설정부(120)는 산출한 "고객 성비" 및 "고객 연령대" 각각에 대한 매출 변화량을 기초로 매출 변화량의 제곱 등 수학적 변환을 실시함으로써, "고객 성비"에 대한 중요도와 및 "고객 연령대"에 대한 중요도를 각각 설정할 수 있다.
본 발명의 다른 실시예에 따르면, 상기 분석 결과로서 생성된 데이터 구조에 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재하는 경우, 중요도 설정부(120)는 제1 분석 결과 데이터 및 제3 분석 결과 데이터 각각을 전체 분석 결과 데이터의 평균 또는 분포와 비교하고, 이를 기초로 하여, 제1 분석 결과 데이터 및 제3 분석 결과 데이터에 대한 중요도를 각각 설정할 수 있다.
예를 들어, 제1 분석 결과 데이터가 "고객 성비"에 대한 분석 결과이며, 제3 분석 결과 데이터가 "고객 연령대"에 대한 분석 결과라고 가정하면, 중요도 설정부(120)는 전체 분석 결과 데이터의 분포와 "고객 성비"에 대한 분석 결과를 비교하고, 전체 분석 결과 데이터의 분포와 "고객 연령대"에 대한 분석 결과를 비교할 수 있다. 이 후, 중요도 설정부(120)는 "고객 성비"에 대한 분석 결과 및 "고객 연령대"에 대한 분석 결과 각각에 대한 전체 분석 결과 데이터 분포와의 차이 정도를 숫자 등 정량적으로 표현하여, 표현된 각각의 차이값을 기초로 차이값의 제곱 등 수학적 변환을 실시함으로써, "고객 성비"에 대한 중요도와 및 "고객 연령대"에 대한 중요도를 각각 설정할 수 있다.
상기 분석 결과로서 생성된 데이터 구조에, 제1 분석 결과 데이터에 대하여 하위 분석 결과 데이터이거나 소정의 연관도를 갖는 분석 결과 데이터인 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 존재하는 경우, 중요도 설정부(120)는 제2 분석 결과 데이터 및 제4 분석 결과 데이터에 대하여, 제2 분석 결과 데이터 및 제4 분석 결과 데이터 각각이 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 제2 분석 결과 데이터 및 제4 분석 결과 데이터에 대한 중요도를 각각 설정할 수 있다.
또한, 중요도 설정부(120)는 제2 분석 결과 데이터 및 제4 분석 결과 데이터에 대한 중요도의 합이 제1 분석 결과 데이터의 중요도보다 작거나 같도록 제2 분석 결과 데이터 및 제4 분석 결과 데이터 각각의 중요도를 설정할 수 있다.
예를 들어, 제1 분석 결과 데이터의 중요도가 60%, 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터의 중요도가 40%로 설정되었다고 가정하면, 중요도 설정부(120)는 제1 분석 결과 데이터의 하위 분석 결과 데이터인 제2 분석 결과 데이터 및 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터에 대해, 제2 분석 결과 데이터와 제4 분석 결과 데이터의 중요도 합이 상위 분석 결과 데이터인 제1 분석 결과 데이터의 중요도 60%와 일치하거나 60% 미만이 되도록 제2 분석 결과 데이터와 제4 분석 결과 데이터에 대한 중요도를 각각 설정할 수 있다.
내용 선택부(130)는 중요도 설정부(120)를 통해 설정된 중요도를 기초로 일 이상의 분석 결과 데이터를 보고서 내용으로 선택할 수 있다.
본 발명의 일 실시예에 따르면, 내용 선택부(130)는 다수의 분석 결과 데이터가 포함된 전체 분석 결과 데이터에서 각각 설정된 중요도가 높은 순으로 소정의 개수만큼 분석 결과 데이터를 선택할 수 있다.
예를 들어, 전체 분석 결과 데이터 각각에 대한 중요도가 제1 분석 결과 데이터 60%, 제2 분석 결과 데이터 40%, 제3 분석 결과 데이터 15%, 제4 분석 결과 데이터 25%, 제5 분석 결과 데이터 20%로 설정되어 있으며, 선택되는 소정의 분석 결과 데이터 개수가 3개라고 가정하면, 내용 선택부(130)는 중요도가 높은 순으로 3개의 분석 결과 데이터, 즉, 제1 분석 결과 데이터, 제2 분석 결과 데이터 및 제4 분석 결과 데이터를 보고서 내용으로 선택할 수 있다.
본 발명의 다른 실시예에 따르면, 내용 선택부(130)는 다수의 분석 결과 데이터가 포함된 전체 분석 결과 데이터에서 각각 설정된 중요도가 미리 설정된 하한값 이상인 분석 결과 데이터를 선택할 수 있다.
예를 들어, 전체 분석 결과 데이터 각각에 대한 중요도가 제1 분석 결과 데이터 60%, 제2 분석 결과 데이터 40%, 제3 분석 결과 데이터 15%, 제4 분석 결과 데이터 25%, 제5 분석 결과 데이터 20%로 설정되어 있으며, 미리 설정되어 있는 중요도 하한값이 30%라고 가정하면, 내용 선택부(130)는 중요도가 30% 이상인 분석 결과 데이터, 즉, 제1 분석 결과 데이터 및 제2 분석 결과 데이터만을 보고서 내용으로 선택할 수 있다.
보고서 생성부(140)는 내용 선택부(130)를 통해 선택된 일 이상의 분석 결과 데이터를 기초로 소정의 보고서 템플릿에 따라, 일 이상의 분석 결과 데이터를 자연어, 표, 그래프 등의 형태로 변환함으로써 보고서 내용을 작성할 수 있다.
보고서 생성부(140)는 작성된 보고서 내용을 PPTX, PDF, HTML 등의 형식으로 파일 생성하여 제공할 수 있다.
도 2는 본 발명의 일 실시예에 따라 빅데이터 분석 보고서가 자동으로 생성되는 과정을 도시한 순서도이다.
먼저, 장치(100)는 보고서 생성 신호가 획득되면(S201), 미리 설정된 적어도 하나의 분석 프로세스에 따라 빅데이터에 대한 데이터 분석을 실시할 수 있다(S202).
데이터 분석은 도 3 및 도 4에 도시된 바와 같이, 복수의 분석 프로세스에 따라 이루어질 수 있다.
복수의 분석 프로세스에 따라 데이터 분석이 이루어지면, 분석 결과로서 상호 계층 관계 또는 연관 관계가 형성된 데이터 구조인 트리(tree) 형태의 분석 결과가 도출될 수 있다.
예를 들어, 도 3 및 도 4에 도시된 바와 같이, 분석 프로세스에 따라 목표지표에 대한 데이터 분석이 이루어지면, 제1 분석 결과 데이터 및 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 도출될 수 있으며, 다른 또는 동일한 분석 프로세스에 따라 제1 분석 결과 데이터에 대한 하위 분석 결과 데이터 또는 제1 분석 결과 데이터와 소정의 연관도를 갖는 제2 분석 결과 데이터 및 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 도출될 수 있다.
이 때, 데이터 분석에 있어서, 분석 프로세스는, 상위 계층 분석 프로세스가 우선적으로 이용되거나 최초 이용된 분석 프로세스와 연관도가 높은 분석 프로세스가 우선적으로 이용될 수 있다.
본 발명의 일 실시예에 따르면, 데이터 분석이 이루어진 후, 소정의 실행 규칙이 만족되면, 이전의 분석 프로세스와 다른 새로운 분석 프로세스에 따라 데이터 분석이 이루어질 수 있다. 이 때, 실행 규칙은, 이전의 분석 프로세스에 따라 데이터가 분석된 결과에 의미적으로 연관된 새로운 분석 프로세스에 따른 데이터 분석 여부를 결정하기 위한 소정의 조건 규칙일 수 있다.
데이터 분석이 완료되면, 장치(100)는 분석 결과로서 생성된 데이터 구조에 포함된 적어도 하나의 분석 결과 데이터에 대하여 데이터 위상 또는 연관도 순으로 중요도를 설정할 수 있다(S203).
즉, 장치(100)는 제1 분석 결과 데이터 및 제3 분석 결과 데이터에 대한 중요도 설정 후, 제2 분석 결과 데이터 및 제4 분석 결과 데이터에 대한 중요도를 설정할 수 있다.
본 발명의 일 실시예에 따르면, 장치(100)는 제1 분석 결과 데이터 및 제3 분석 결과 데이터에 대해, 분석 변수를 일정 비율로 조정했을 경우 예상되는 목표지표의 변화를 각각 산출하여, 산출된 목표지표의 변화 정도를 기초로 제1 분석 결과 데이터 및 제3 분석 결과 데이터에 대한 중요도를 각각 설정할 수 있다.
본 발명의 다른 실시예에 따르면, 장치(100)는 제1 분석 결과 데이터 및 제3 분석 결과 데이터 각각을 전체 분석 결과 데이터의 평균 또는 분포와 비교하여, 비교 결과를 기초로 제1 분석 결과 데이터 및 제3 분석 결과 데이터에 대한 중요도를 각각 설정할 수 있다.
제2 분석 결과 데이터 및 제4 분석 결과 데이터에 대해서는, 장치(100)는 제2 분석 결과 데이터 및 제4 분석 결과 데이터 각각이 상위 분석 결과 데이터인 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 중요도를 각각 설정할 수 있다.
또한, 제2 분석 결과 데이터 및 제4 분석 결과 데이터에 대하여, 장치(100)는 제2 분석 결과 데이터 및 제4 분석 결과 데이터에 대한 중요도의 합이 상기 제1 분석 결과 데이터의 중요도보다 작거나 같도록 중요도를 각각 설정할 수 있다.
본 발명의 일 실시예에 따르면, 도 3에 도시된 바와 같이, 장치(100)는 제2 분석 결과 데이터 및 제4 분석 결과 데이터의 중요도 합이 제1 분석 결과 데이터의 중요도와 동일하도록 제2 분석 결과 데이터 및 제4 분석 결과 데이터에 대한 중요도를 각각 42%와 18%로 설정할 수 있다. 이 때, 제2 분석 결과 데이터의 중요도와 제4 분석 결과 데이터의 중요도는, 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 따라 배분되어 설정된 것일 수 있다.
본 발명의 다른 실시예에 따르면, 도 4에 도시된 바와 같이, 장치(100)는 제2 분석 결과 데이터 및 제4 분석 결과 데이터의 중요도 합이 제1 분석 결과 데이터의 중요도 보다 소정 비율 작도록 제2 분석 결과 데이터 및 제4 분석 결과 데이터에 대한 중요도를 각각 37.8%와 16.2%로 설정할 수 있다. 이 때, 제2 분석 결과 데이터의 중요도와 제4 분석 결과 데이터의 중요도는, 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 따라 배분되어 설정된 것일 수 있다.
장치(100)는 일 이상의 분석 결과 데이터에 대한 중요도 설정이 완료되면, 설정된 중요도를 기초로 하여 보고서 내용에 포함될 일 이상의 분석 결과 데이터를 선택할 수 있다(S204).
본 발명의 일 실시예에 따르면, 장치(100)는 상기 설정된 중요도를 기초로 하여, 중요도가 높은 순으로 소정의 분석 결과 데이터 개수만큼 보고서에 포함될 분석 결과 데이터를 선택할 수 있다.
예를 들어, 도 3을 일 실시예로 참고하여 설명하면, 소정의 분석 결과 데이터 개수가 3개라고 가정했을 경우, 장치(100)는 중요도가 가장 높게 배분되어 있는 3개의 분석 결과 데이터, 즉, 제1 분석 결과 데이터, 제2 분석 결과 데이터 및 제3 분석 결과 데이터를 보고서 내용으로 포함될 분석 결과 데이터로 선택할 수 있다.
본 발명의 다른 실시예에 따르면, 장치(100)는 상기 설정된 중요도를 기초로 하여, 설정된 중요도가 미리 설정된 중요도 하한값 이상인 분석 결과 데이터를 보고서에 포함될 분석 결과 데이터로 선택할 수 있다.
예를 들어, 도 3을 일 실시예로 참고하여 설명하면, 미리 설정되어 있는 중요도 하한값이 20%인 경우, 장치(100)는 중요도가 20% 이상인 분석 결과 데이터, 즉, 제1 분석 결과 데이터, 제2 분석 결과 데이터 및 제3 분석 결과 데이터를 보고서 내용으로 포함될 분석 결과로 선택할 수 있다.
이 후, 장치(100)는 선택한 일 이상의 분석 결과 데이터를 소정의 보고서 템플릿에 반영하여 자연어, 표 및 그래프 중 적어도 어느 하나의 형태로 변환함으로써 보고서를 작성할 수 있으며, 작성된 보고서를 파일로 생성하여 제공할 수 있다(S205).
도 5는 본 발명의 일 실시예에 따라 빅데이터 분석 보고서 자동 생성 시 제공되는 화면을 예시하는 도면이다.
도 5의 (a) 및 (b)에 도시된 바와 같이, 장치(100)는 빅데이터 분석 보고서 자동 생성을 위한 설정 정보 입력 인터페이스를 제공할 수 있다.
빅데이터 분석 보고서 자동 생성을 위한 설정 정보 입력 인터페이스에는, 보고서 템플릿 업로드 인터페이스, 글꼴 설정 인터페이스, 보고서 생성 파일 형식 설정 인터페이스 및 보고서 유형 설정 인터페이스가 포함될 수 있으며, 별도의 빅데이터 자료 업로드가 가능하도록 하는 인터페이스도 추가로 포함될 수 있다.
장치(100)를 통해 보고서 생성이 완료되면, 도 5의 (c)에 도시된 바와 같이 해당 보고서 파일이 제공될 수 있다. 이 때, 보고서 파일의 형식은 PPTX, PDF, HTML 중 어느 하나의 형식일 수 있으며, 이는 상기 분석 보고서 자동 생성을 위한 설정 정보 입력 인터페이스를 통해 설정된 파일 형식일 수 있다.
이와 같이, 본 발명의 일 실시예에 따르면, 보고서를 생성함에 있어, 분석 결과 데이터마다 데이터 위상 또는 연관도 순으로 중요도를 설정하고, 설정된 중요도를 기초로 보고서에 포함될 분석 결과 데이터를 선택함으로써, 수요자가 필요로 하는 정보만이 포함된 빅데이터 분석 보고서가 신속하고 정확하게 자동 생성될 수 있도록 한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100 : 장치
110 : 데이터 분석부
120 : 중요도 설정부
130 : 내용 선택부
140 : 보고서 생성부

Claims (26)

  1. 장치가, 빅데이터 분석 보고서를 자동으로 생성하는 방법에 있어서,
    (a) 보고서 생성 신호가 획득되면, 미리 설정된 적어도 하나의 분석 프로세스에 따라 데이터를 분석하거나 분석하도록 지원하는 단계;
    (b) 상기 분석 결과로서 생성된 데이터 구조에 포함된 적어도 하나의 분석 결과 데이터에 대하여 데이터 위상 또는 연관도 순으로 중요도를 설정하거나 설정하도록 지원하는 단계;
    (c) 상기 설정된 중요도를 기초로 하여 일 이상의 분석 결과 데이터를 보고서 내용으로 선택하는 단계; 및
    (d) 상기 선택된 일 이상의 분석 결과 데이터를 소정의 보고서 템플릿에 반영하여 보고서를 생성하여 제공하는 단계를 포함하고,
    상기 (a) 단계에서,
    복수의 분석 프로세스에 따라 데이터 분석이 이루어지는 경우,
    상기 복수의 분석 프로세스는 상호 계층 관계 또는 연관 관계를 형성하고, 상위 계층 분석 프로세스가 우선적으로 이용되거나 최초 이용된 분석 프로세스와 연관도가 높은 분석 프로세스가 우선적으로 이용되어 데이터 분석이 이루어지는 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  2. 제 1항에 있어서,
    상기 데이터 구조에 제1 분석 결과 데이터 및 (i) 상기 제1 분석 결과 데이터에 대한 하위 분석 결과 데이터 또는 (ii) 상기 제1 분석 결과 데이터와 소정의 연관도를 갖는, 제2 분석 결과 데이터가 포함되는 경우,
    상기 (b) 단계에서,
    상기 제1 분석 결과 데이터에 대해 중요도가 설정된 후, 상기 제2 분석 결과 데이터에 대한 중요도가 설정되는 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  3. 제 2항에 있어서,
    상기 데이터 구조에 상기 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재할 때,
    상기 (b) 단계에서,
    상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대해, 분석 변수를 일정 비율로 조정했을 경우의 예상되는 목표지표의 변화를 각각 산출한 후, 상기 목표지표의 변화 정도에 기초하여 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  4. 제 3항에 있어서,
    상기 데이터 구조에 상기 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 존재할 때,
    상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터 각각이 상기 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  5. 제 4항에 있어서,
    상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도의 합은 상기 제1 분석 결과 데이터의 중요도보다 작거나 같은 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  6. 제 2항에 있어서,
    상기 데이터 구조에 상기 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재할 때,
    상기 (b) 단계에서,
    상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터 각각을 전체 분석 결과 데이터의 평균 또는 분포와 비교하고, 이에 기초하여, 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  7. 제 6항에 있어서,
    상기 데이터 구조에 상기 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 존재할 때,
    상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터 각각이 상기 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  8. 제 7항에 있어서,
    상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도의 합은 상기 제1 분석 결과 데이터의 중요도보다 작거나 같은 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  9. 삭제
  10. 제 1항에 있어서,
    상기 (a) 단계에서,
    상기 복수의 분석 프로세스에 따라 데이터 분석이 이루어지는 경우,
    상기 데이터 분석이 이루어진 후, 소정의 실행 규칙이 만족되면, 이전의 분석 프로세스와 다른 새로운 분석 프로세스에 따라 데이터 분석이 이루어지고,
    상기 실행 규칙은, 상기 이전의 분석 프로세스에 따라 데이터가 분석된 결과에 의미적으로 연관된 새로운 분석 프로세스에 따른 데이터 분석 여부를 결정하기 위한 소정의 조건 규칙인, 빅데이터 분석 보고서 자동 생성 방법.
  11. 제 1항에 있어서,
    상기 (c) 단계는,
    상기 설정된 중요도 순으로 소정의 개수의 분석 결과 데이터를 선택하는 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  12. 제 1항에 있어서,
    상기 (c) 단계는,
    상기 설정된 중요도가 미리 설정된 하한값 이상인 분석 결과 데이터를 선택하는 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  13. 제 1항에 있어서,
    상기 (d) 단계는,
    상기 선택된 일 이상의 분석 결과 데이터를 상기 소정의 보고서 템플릿에 따라 자연어, 표 및 그래프 중 적어도 어느 하나의 형태로 변환함으로써 보고서를 생성하여 제공하는 것을 특징으로 하는, 빅데이터 분석 보고서 자동 생성 방법.
  14. 보고서 생성 신호가 획득되면, 미리 설정된 적어도 하나의 분석 프로세스에 따라 데이터를 분석하거나 분석하도록 지원하는 데이터 분석부;
    상기 분석 결과로서 생성된 데이터 구조에 포함된 적어도 하나의 분석 결과 데이터에 대하여 데이터 위상 또는 연관도 순으로 중요도를 설정하거나 설정하도록 지원하는 중요도 설정부;
    상기 설정된 중요도를 기초로 하여 일 이상의 분석 결과 데이터를 보고서 내용으로 선택하는 내용 선택부; 및
    상기 선택된 일 이상의 분석 결과 데이터를 소정의 보고서 템플릿에 반영하여 보고서를 생성하여 제공하는 보고서 생성부를 포함하고,
    상기 데이터 분석부에서,
    복수의 분석 프로세스에 따라 데이터 분석이 이루어지는 경우,
    상기 복수의 분석 프로세스는 상호 계층 관계 또는 연관 관계를 형성하고, 상위 계층 분석 프로세스가 우선적으로 이용되거나 최초 이용된 분석 프로세스와 연관도가 높은 분석 프로세스가 우선적으로 이용되어 데이터 분석이 이루어지는 것을 특징으로 하는, 장치.
  15. 제 14항에 있어서,
    상기 데이터 구조에 제1 분석 결과 데이터 및 (i) 상기 제1 분석 결과 데이터에 대한 하위 분석 결과 데이터 또는 (ii) 상기 제1 분석 결과 데이터와 소정의 연관도를 갖는, 제2 분석 결과 데이터가 포함되는 경우,
    상기 중요도 설정부에서,
    상기 제1 분석 결과 데이터에 대해 중요도가 설정된 후, 상기 제2 분석 결과 데이터에 대한 중요도가 설정되는 것을 특징으로 하는, 장치.
  16. 제 15항에 있어서,
    상기 데이터 구조에 상기 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재할 때,
    상기 중요도 설정부에서,
    상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대해, 분석 변수를 일정 비율로 조정했을 경우의 예상되는 목표지표의 변화를 각각 산출한 후, 상기 목표지표의 변화 정도에 기초하여 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 하는, 장치.
  17. 제 16항에 있어서,
    상기 데이터 구조에 상기 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 존재할 때,
    상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터 각각이 상기 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 하는, 장치.
  18. 제 17항에 있어서,
    상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도의 합은 상기 제1 분석 결과 데이터의 중요도보다 작거나 같은 것을 특징으로 하는, 장치.
  19. 제 15항에 있어서,
    상기 데이터 구조에 상기 제1 분석 결과 데이터와 대응되는 위상을 갖는 제3 분석 결과 데이터가 존재할 때,
    상기 중요도 설정부에서,
    상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터 각각을 전체 분석 결과 데이터의 평균 또는 분포와 비교하고, 이에 기초하여, 상기 제1 분석 결과 데이터 및 상기 제3 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 하는, 장치.
  20. 제 19항에 있어서,
    상기 데이터 구조에 상기 제2 분석 결과 데이터와 대응되는 위상을 갖는 제4 분석 결과 데이터가 존재할 때,
    상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터 각각이 상기 제1 분석 결과 데이터에 미치는 통계적 영향력의 비율에 기초하여 상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도가 각각 설정되는 것을 특징으로 하는, 장치.
  21. 제 20항에 있어서,
    상기 제2 분석 결과 데이터 및 상기 제4 분석 결과 데이터에 대한 중요도의 합은 상기 제1 분석 결과 데이터의 중요도보다 작거나 같은 것을 특징으로 하는, 장치.
  22. 삭제
  23. 제 14항에 있어서,
    상기 데이터 분석부에서,
    복수의 분석 프로세스에 따라 데이터 분석이 이루어지는 경우,
    상기 데이터 분석이 이루어진 후, 소정의 실행 규칙이 만족되면, 이전의 분석 프로세스와 다른 새로운 분석 프로세스에 따라 데이터 분석이 이루어지고,
    상기 실행 규칙은, 상기 이전의 분석 프로세스에 따라 데이터가 분석된 결과에 의미적으로 연관된 새로운 분석 프로세스에 따른 데이터 분석 여부를 결정하기 위한 소정의 조건 규칙인, 장치.
  24. 제 14항에 있어서,
    상기 내용 선택부는,
    상기 설정된 중요도 순으로 소정의 개수의 분석 결과 데이터를 선택하는 것을 특징으로 하는, 장치.
  25. 제 14항에 있어서,
    상기 내용 선택부는,
    상기 설정된 중요도가 미리 설정된 하한값 이상인 분석 결과 데이터를 선택하는 것을 특징으로 하는, 장치.
  26. 제 14항에 있어서,
    상기 보고서 생성부는,
    상기 선택된 일 이상의 분석 결과 데이터를 상기 소정의 보고서 템플릿에 따라 자연어, 표 및 그래프 중 적어도 어느 하나의 형태로 변환함으로써 보고서를 생성하여 제공하는 것을 특징으로 하는, 장치.
KR1020180043764A 2017-05-02 2018-04-16 빅데이터 분석 보고서를 자동으로 생성하는 방법 및 이를 수행하는 장치 KR102022944B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20170056449 2017-05-02
KR1020170056449 2017-05-02

Publications (2)

Publication Number Publication Date
KR20180122275A KR20180122275A (ko) 2018-11-12
KR102022944B1 true KR102022944B1 (ko) 2019-09-20

Family

ID=64398029

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180043764A KR102022944B1 (ko) 2017-05-02 2018-04-16 빅데이터 분석 보고서를 자동으로 생성하는 방법 및 이를 수행하는 장치

Country Status (1)

Country Link
KR (1) KR102022944B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220000436A (ko) 2020-06-25 2022-01-04 윤성종 빅데이터와 인공지능을 활용한 소셜 빅데이터 분석보고서 자동 제공 시스템

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102321845B1 (ko) 2021-01-06 2021-11-05 쿠팡 주식회사 정보를 제공하는 전자 장치 및 그 정보 제공 방법
KR102476181B1 (ko) * 2021-02-09 2022-12-12 주식회사 수산아이앤티 탄소배출권 문서 자동생성 방법 및 그 시스템
KR102571350B1 (ko) * 2023-03-24 2023-08-29 (주)유알피 딥러닝 모델 기반 태깅 기술을 활용한 맞춤형 분석보고서 제공방법 및 그 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140277604A1 (en) 2013-03-14 2014-09-18 Fisher-Rosemount Systems, Inc. Distributed big data in a process control system
US9031992B1 (en) 2011-09-30 2015-05-12 Emc Corporation Analyzing big data

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040028408A (ko) * 2002-09-30 2004-04-03 주식회사 케이티 신경망을 이용한 변수 중요도 측정방법
KR100728136B1 (ko) * 2005-09-20 2007-06-14 주식회사 지지옥션 경매 부동산 분석보고서 생성시스템 및 그 방법
KR101443028B1 (ko) * 2012-06-28 2014-09-19 한국원자력연구원 기술동향 분석 보고서 생성 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9031992B1 (en) 2011-09-30 2015-05-12 Emc Corporation Analyzing big data
US20140277604A1 (en) 2013-03-14 2014-09-18 Fisher-Rosemount Systems, Inc. Distributed big data in a process control system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220000436A (ko) 2020-06-25 2022-01-04 윤성종 빅데이터와 인공지능을 활용한 소셜 빅데이터 분석보고서 자동 제공 시스템

Also Published As

Publication number Publication date
KR20180122275A (ko) 2018-11-12

Similar Documents

Publication Publication Date Title
KR102022944B1 (ko) 빅데이터 분석 보고서를 자동으로 생성하는 방법 및 이를 수행하는 장치
US9507480B1 (en) Interface optimization application
US9336184B2 (en) Representation of an interactive document as a graph of entities
US20120137308A1 (en) Adaptive tree structure for visualizing data
US20180349924A1 (en) Peer-group based business information system
US10282360B2 (en) Uniform chart formatting based on semantics in data models
US9390141B2 (en) Systems and methods for determining application installation likelihood based on probabilistic combination of subordinate methods
CN108920543B (zh) 查询和交互的方法及装置、计算机装置、存储介质
US20150066598A1 (en) Predicting service delivery costs under business changes
US9015591B2 (en) Dynamic visualization generation and implementation
CN103777936A (zh) Erp表单的可变用户级视图的实现方法及装置
Mi et al. Optimizing resource allocation for multistage selection in plant breeding with R package selectiongain
US9141514B1 (en) System, method, and computer program for automatically comparing a plurality of software testing environments
US20160162539A1 (en) Computer executable method of generating analysis data and apparatus performing the same and storage medium for the same
US9633081B1 (en) Systems and methods for determining application installation likelihood based on user network characteristics
Tsotsolas et al. Criteria weights assessment through prioritizations (WAP) using linear programming techniques and visualizations
CN110807002A (zh) 一种基于工作流的报表生成方法、系统及设备和存储介质
US10168990B1 (en) Automatic replacement of a floating-point function to facilitate fixed-point program code generation
Myka et al. Comparative analysis of usability of data entry design patterns for mobile applications
CN110765735B (zh) 数学表达式输入方法、装置及电子设备
Neilson et al. Is there a mass discrepancy in the Cepheid binary OGLE-LMC-CEP0227?
US9792706B2 (en) Graph processing system, graph processing method, and non-transitory computer readable medium
WO2015163322A1 (ja) データ分析装置、データ分析方法およびプログラム
Nielsen On the distribution of likelihood ratio test statistics for cointegration rank
US20160140212A1 (en) Data object classification using feature generation through crowdsourcing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right