KR20140139521A - 데이터 솔루션 시스템 - Google Patents

데이터 솔루션 시스템 Download PDF

Info

Publication number
KR20140139521A
KR20140139521A KR1020147027279A KR20147027279A KR20140139521A KR 20140139521 A KR20140139521 A KR 20140139521A KR 1020147027279 A KR1020147027279 A KR 1020147027279A KR 20147027279 A KR20147027279 A KR 20147027279A KR 20140139521 A KR20140139521 A KR 20140139521A
Authority
KR
South Korea
Prior art keywords
data
analysis
module
solutions
data sets
Prior art date
Application number
KR1020147027279A
Other languages
English (en)
Inventor
크리시난 칼틱
딩그라 데에핀델
Original Assignee
무 시그마 비지니스 솔루션스 피브이티 엘티디
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 무 시그마 비지니스 솔루션스 피브이티 엘티디 filed Critical 무 시그마 비지니스 솔루션스 피브이티 엘티디
Publication of KR20140139521A publication Critical patent/KR20140139521A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Automatic Analysis And Handling Materials Therefor (AREA)
  • Debugging And Monitoring (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템이 제공된다. 본 발명에 따른 시스템은 다수의 소스로부터 다수의 데이터 세트를 수신하고, 상기 다수의 데이터 세트를 상기 분석 데이터 세트로 변환하는 데이터 처리 모듈을 사용하여 다수의 데이터 세트를 분석하는 분석 모듈을 포함한다. 상기 시스템은 또한 상기 분석 데이터 세트 내에 존재하며 상기 하나 이상의 솔루션을 판단하는데 사용되는 다수의 상관관계를 판단하는 탐구 분석 모듈을 포함한다. 상기 시스템은 상기 분석 모듈에 연결되어 사용자로 하여금 상기 분석 모듈과 인터페이스할 수 있도록 하는 그래픽 사용자 인터페이스 및 상기 다수의 데이트 세트 및 분석 데이터 세트를 저장하는 저장 모듈을 더 포함한다.

Description

데이터 솔루션 시스템{DATA SOLUTIONS SYSTEM}
본 발명은 데이터 솔루션 시스템 및 기법에 관한 것으로, 특히 특정 문제에 대하여 하나 이상의 최적의 솔루션을 제공하기 위하여 다양한 소스로부터 수신된 여러 개의 데이터 세트를 분석하는 것에 관한 것이다.
최근, 분석론 업계가 성숙 단계에 이르고 경쟁이 늘어남에 따라, 분석학에 대한 투자수익률(ROI)을 정당화하고 그 사업적 가치를 증명하고자 하는 요구가 늘고 있다. 분석학이 비즈니스의 속도로 유지되도록 하는 것이 중요한데, 특히 분석학을 기반으로 한 의사결정을 위한 사업상 문제의 범위와 수가 기하급수적으로 늘어나고 있기 때문에 그러하다. 오늘날의 급속히 성장하는 글로벌 사업 환경 환경에서, 유능한 분석 솔루션에 대한 요구는 그 어느 때보다 높다.
그러나, 기존 솔루션 상의 주요 도전과제 중 일부는, 조직 내에서 모범 실무를 수행하고 부서간의 협력 및 교차 학습을 보장하는데 어려움이 있다. 코딩 및 실행에서 사업상의 해석으로 자원시간을 재구성하여야 할 필요도 있다. 또한, 분석을 실행하면서 모범 실무로 이어질 수 있는 도구를 제공한다면 바람직할 것이다.
그러므로, 재사용성을 가능케 하고 신규 채용자들을 위한 생산성 향상에 소요되는 시간을 단축하며 현재의 사회간접시설의 투자로부터 가치를 극대화하는 플랫폼을 구축할 수 있는 시스템 및 방법이 필요하다.
본 발명의 일 실시예에 따라, 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템이 제공된다. 상기 시스템은 다수의 소스로부터 다수의 데이터 세트를 수신하고 상기 다수의 데이터 세트를 분석 데이터 세트로 변환하는 데이터 처리 모듈을 사용하여 상기 다수의 데이터 세트를 분석하는 분석 모듈을 포함한다. 상기 분석 모듈은 상기 분석 데이터 세트 내에 존재하는 다수의 상관관계를 판단하는 탐구 분석 모듈을 포함하며, 상기 다수의 상관관계는 상기 하나 이상의 솔루션을 판단하는데 사용된다. 상기 시스템은 상기 분석 모듈에 결합되어 1인 이상의 사용자가 상기 분석 모듈과 인터페이스할 수 있도록 하는 그래픽 사용자 인터페이스(GUI) 및 상기 다수의 데이터 세트 및 분석 데이터 세트를 저장하는 저장 모듈을 더 포함한다.
또 다른 실시예에서, 하나 이상의 비일시적인(non-transitory) 컴퓨터로 판독가능한 저장 매체를 포함하는 하나 이상의 프로세서를 가지는 컴퓨터 구현 시스템이 제공된다. 상기 시스템은 상기 하나 이상의 프로세서가 다수의 소스로부터 다수의 데이터 세트를 수신하고, 분석 데이터 세트를 생성하기 위하여 상기 다수의 데이터 세트를 조정하고 상기 분석 데이터 세트 내에 존재하는 다수의 상관관계를 판단하기 위하여 상기 분석 데이터 세트에 대한 탐구 데이터 분석을 수행하는 것을 포함하여 작업을 수행하도록 하는 명령어를 포함한다. 상기 프로세서는 상기 탐구 데이터 분석 결과를 기반으로 다수의 모델을 생성하는 작업을 포함하여 여러 작업을 더 수행하며, 각 모델은 사용자가 정의한 목표를 달성하기 위하여 하나 이상의 솔루션을 제공한다.
본 발명의 여러 특징, 측면 및 장점은 첨부 도면과 상세 설명에 의하여 더 명확해지며, 첨부 도면에서 동일한 특징은 동일한 구성요소를 나타낸다.
도 1은 본 기법의 양상에 따라 구현되는 데이터 분석 시스템의 일 실시예를 도시한 블록도이며;
도 2는 본 기법의 양상에 따라 구현되는 분석 모듈의 일 실시예를 도시한 블록도이며,
도 3은 상이한 소스에서 제공된 다양한 데이터 세트가 본 기법의 양상에 따라 처리되는 방법을 도시한 흐름도이며;
도 4는 본 기법의 양상에 따라 구현되는 범용 컴퓨터를 도시한 블록도이며;
도 5 내지 도 12는 본 기법의 양상에 따라 구현되는 그래픽 사용자 인터페이스의 예시 스크린 화면을 도시한 도면이다.
이하 구체적인 설명은 본 명세서의 일부를 구성하는 첨부 도면을 참조하여 이루어진다. 문맥에서 달리 설명하지 않는 한, 도면에서 동일한 참조번호는 일반적으로 동일한 구성요소를 나타낸다. 구체적인 설명, 도면 및 청구범위에 기재된 실시예는 해당 실시예로 제한되는 것을 의미하지 않는다. 본 명세서의 주제의 사상이나 범위에서 벗어나지 않은 채 다른 실시예들이 활용되고 기타 변경이 이루어질 수 있다. 본 명세서에서 일반적으로 설명되고 도면에 도시된 개시 내용은 다양한 구성으로 마련, 대체, 결합, 분리 및 고안될 수 있으며 이는 본 명세서에 명시적으로 예정된다는 점이 이해된다.
실시예는 하나 이상의 문제에 대한 솔루션을 판단하기 위하여 여러 소스로부터 수신된 다수의 데이터 세트를 분석하는 데이터 솔루션 시스템에 관한 것이다. 본 명세서에서, 수신된 데이터 세트는 다양한 소셜 미디어에서 수신된 데이터 세트, 제품 판매에 관한 데이터 세트, 특정 제품에 대한 마케팅 캠페인 중에 수집된 마케팅 데이터 등을 의미할 수 있다.
도 1은 다양한 입력 데이터 소스로부터 다수의 데이터 세트를 수신하는 데이터 솔루션 시스템의 일 실시예에 관한 블록도이다. 상기 데이터솔루션 시스템(10)은 분석을 실행하기 위하여 안내를 제공하고, 상호작용하는 흰색 상자 형태의 환경을 제공하기 위하여 다양한 소스로부터 수신한 데이터 세트를 분석한다. 데이터 솔루션 시스템(10)의 각 블록은 아래에서 더 구체적으로 설명된다.
데이터 솔루션 시스템(10)은 다양한 입력 데이터 소스(18, 20, 22)에 연결되고 각각 데이터 세트(24, 26, 28)에 접속한다. 데이터 세트의 예로는 소셜 미디어, 판매 수치, 판매경로 등으로부터의 데이터 세트가 있다. 일 실시예에서, 사용자는 데이터 세트를 얻을 수 있는 입력 데이터 소스를 선택할 수 있다. 본 명세서에서, "사용자"는 자연인 및 "사용자"로 기능하는 기타 실체를 의미할 수 있다. 그 예로는 법인, 단체, 기업, 부서 또는 기타 집단이 있다. 사용자는 상이한 경로에서 수신된 데이터 세트를 분석하도록 교육받은 데이터 분석가를 의미할 수 있다.
데이터 솔루션 시스템(10)은 1인 이상의 사용자가 분석 모듈(14)에 입력을 제공하도록 할 수 있는 그래픽 사용자 인터페이스(12)를 포함한다. 일 실시예에서, 상기 그래픽 사용자 인터페이스는 사용자가 관심있는 옵션을 선택하도록 하는 확장 메뉴를 포함한다.
분석 모듈(14)은 사용자가 정의한 문제에 대하여 구체적인 통계 분석을 기반으로 최적의 솔루션을 생성하기 위하여 수신된 데이터 세트를 분석한다. 이러한 문제의 예로는 제품의 판매에 대한 핵심 요소(drivers)에 대한 판단 또는 고객에게 영향을 미치는 핵심 요소 등이 있다. 일반적으로, 분석 모듈(14)은 실행 과정이 안내에 따라 효율적으로 진행되는 방식으로 분석 노하우 및 프로젝트 업무흐름을 수집한다. 이에 사용자는 통찰력(insight)을 생성하는데 소요되는 시간을 증가시킬 수 있게 된다. 분석 모듈(14)은 분석 데이터 세트에 수행된 분석에 대한 시각 자료를 생성한다.
저장 모듈(16)은 다수의 데이터 세트 및 분석 데이터 세트를 저장한다. 저장 모듈(16)은 분석 모듈이 생성한 시각 자료도 저장한다. 분석 모듈은 여러 개의 모듈을 포함하며, 각 모듈은 아래에서 더 구체적으로 설명된다.
도 2는 본 기법의 양상에 따라 구현된 분석 모듈의 실시예를 도시한 블록도이다. 앞서 설명한 바와 같이, 분석 모듈(14)은 여러 개의 데이터 세트를 분석하여 하나 이상의 데이터 모델을 생성함으로써 사용자가 자신이 정의한 목표에 대한 하나 이상의 솔루션을 판단할 수 있도록 해준다. 분석 모듈(14)은 핵심적인 사업상의 의사 결정을 하면서 사용자에게 이익이 되는 출력을 생성하기 위하여 여러 차례의 통계 과정을 수행하는 다수의 모듈을 포함한다. 아래에서 설명되는 모듈은 문제를 해결하거나 목표를 달성하기 위하여 사용자가 필요한 것으로 판단하는 순서로 결합될 수 있다. 분석 모듈(14)의 각 블록은 아래에서 더 구체적으로 설명된다.
데이터 처리 모듈(30)은 다수의 소스에서 수신된 다수의 데이터 세트를 분석 데이터 세트에 결합시킨다. 분석 데이터 세트는 분석 모듈을 위하여 적절한 형식으로 되어 있다.
품질 분석 모듈(32)은 분석 데이터 세트의 속성을 판단한다. 예를 들어, 독특한 가치 프로비저닝(provisioning), 데이터 프로파일링, 결측치(missing) 또는 이상치(outlier) 처리 및 데이터 변환은 품질 분석 모듈이 수행하는 기능 중 일부이다. 품질 분석 모듈은 콘텐츠 보고서를 생성하며 이에 데이터 세트 내의 모든 변수들에 대한 기본적인 특성을 추출할 수 있도록 해준다.
탐구 데이터 분석(EDA) 모듈(34)은 분석 데이터 세트 내에 존재하는 다수의 상관관계를 판단한다. 일 실시예에서, 상기 다수의 상관관계는 상기 하나 이상의 솔루션을 판단하는데 사용된다. EDA 모듈(34)은 데이터세트 작업, 변수 프로세싱, 데이터 요약, 데이터 탐구 및 데이터 처리를 가능케 한다.
데이터 세트 작업은 분석 중 어느 단계에서든지 데이터 세트를 추가하고 보낼(export) 수 있도록 해준다. EDA 모듈(34)은 데이터 세트의 변수 전체에 대한 데이터 분석을 가능케 해준다. EDA 상의 변수 프로세싱은 변수상의 구별되는 값을 기초로 한 변수의 명칭 변경 및 변수의 수치, 일련 및 수동 분류를 포함한다. 또한, EDA 상의 변수 프로세싱은 분류 지표, 이벤트 지표, 비닝(binning), 애드 스톡 변수, lag/lead 변환, 이동 평균 등을 포함하여 신규 변수 생성도 포함한다.
EDA 모듈(34)의 다른 기능으로는 분석 데이터 세트의 시각적 자료를 포함한 데이터 요약, 변수상의 독특한 값의 카운트 및 광범위한 옵션을 포함한 통계 요약이 있다. 또한, 데이터 탐구도 EDA의 핵심 지원 기능 중의 하나이다. EDA 모듈(34)은 빈도 분석을 포함하여 시각화(차트) 및 맞춤형 모듈을 지원한다. EDA 모듈(34)은 데이터를 일변량, 다변량, 결측치, 이상치 및 변환 처리로 처리한다.
일 실시예에서, EDA 모듈(34)은 분석 데이터 세트에 대한 일변량 및 다변량 분석을 수행한다. 일 실시예에서, 일변량 분석을 통하여 분석 데이터 세트에 대한 양적(통계) 분석이 수행된다. 상기 분석은 단일 변수에 대한 설명 및 적용가능한 분석 단위인 속성들과 함께 수행된다. 일변량 분석은 위치 측정, 산포도 측정, 정규성 검정, 분포, 백분율 및 그 조합 등의 요소를 허용한다. 또 다른 실시예에서, 탐구 분석 모듈은 분석 데이터 세트에 다변량 분석을 적용한다. 이변량 분석은 하나 이상의 통계 요소에 대한 차이를 판단하는 작업을 포함한다.
분석 모듈(14)은 사용자가 정한 문제에 대한 하나 이상의 솔루션을 대표하는 하나 이상의 모델을 생성하는 데이터 모델링 모듈(36)을 더 포함한다. 일 실시예에서, 모델링 모듈(36)은 회귀 기법을 사용하여 깊이있는 분석을 제공한다. 일 실시예에서, 모델은 분석 데이터 세트의 평균, 분산 및 공분산을 기반으로 생성된다. 데이터 모델링 모듈은 종속 변수 전체에 걸쳐서 독립 변수의 분포를 연구하기 위하여 다변량 처리, 신규 변수 생성 및 이변량 분석을 지원한다.
단계적인 변수 제거, 상관관계 및 요소 분석을 기반으로 한 변수 세분화 등의 모델 구축 옵션이 사용가능하며 편향된 모집단 상에 구축될 수 있다. 모델 구축은 다수의 반복을 통하여 반복작업을 하고 가장 적절한 모델을 얻기 위하여 용이한 변수 제거를 허용한다. 모델 구축은 변수 제거를 위한 알고리즘 회귀를 포함하며 고급 영향 통계를 기반으로 한 다변량 이상점 진단을 더 포함한다.
분석 모듈(14)은 모델 평가 및 검증 기능을 더 제공한다. 이는 모델 통계, 변수 통계 및 출력 차트 및 표를 기반으로 한다. 이러한 기능은 정확성과 안정성을 위하여 다양한 시나리오 상에서 표본 내 및 표본 외 검증을 제공한다. 부트스트랩(bootstrapping)은 반복에 있어서 모델 통계를 비교하는데 수행될 수 있다. 모델 평점(scoring)도 지원되는데 이는 다수의 챔피언 모델에 대한 평점 및 출력을 비교한다.
보고 모듈(38)은 단일 사용자 인터페이스에서 분석 모듈이 생성하는 모든 보고에 대하여 용이한 접근을 제공한다. 보고 유형의 예로는 다수의 범주 변수에 대하여 구별되는 단계 전체에 대한 콘텐츠 보고, 빈도 보고, 단변량 요약 보고, 다변량 요약 보고 등이 있다. 또한, 상이한 변수 및 옵션을 포함한 다수의 보고가 생성될 수 있으며 엑셀, PDF 등의 포맷으로 직접 보내질 수 있다.
보고 모듈(38)은 모든 출력이 사용자에게 더 나은 통찰력을 제공할 수 있도록 한 장소에서 수집된다. 상이한 보고는 보고 체계에서 한 장소에서 볼 수 있으며 결과 비교도 산정될 수 있다. 결과는 용이하게 보고 전체에 대하여 비교될 수 있다. 통찰력 생성도 또 다른 기능이다. 통찰력은 보고 체계를 사용하여 신속하게 생성될 수 있으며 비즈니스 논리에 용이하게 연결될 수 있다.
도 3은 다양한 소스로부터의 다양한 데이터 세트가 본 기법의 양상에 따라 처리되는 방법을 도시한 흐름도이다. 앞서 설명한 바와 같이, 다양한 데이터 세트는 판매, 마케팅 소셜 미디어 데이터세트 등을 말한다. 상기 소셜 미디어 데이터를 분석하는 프로세스(40)는 아래에서 더 구체적으로 설명된다.
데이터 세트가 하나 이상의 입력 데이터 소스에서 검색된다(42). 여러 소스로부터 수신된 데이터 세트는 특정 문제에 대한 솔루션을 판단하기 위하여 분석된다. 일반적으로, 입력 데이터 세트는 특정 제품에 대한 키워드, 제품명, 사업이나 단체 명칭 등을 포함할 수 있다. 일 실시예에서, 데이터 세트는 문자열 및 수치 데이터를 포함한다.
수신된 데이터 세트는 분석 데이터 세트를 생성하기 위하여 조건이 부여된다(44). 데이터 처리는 특정 조건을 적용하여 신규 변수를 생성하기 위하여 수행된다. 신규 데이터 세트도 기존 데이터 세트를 조작하여 생성될 수 있다.
일 실시예에서, 데이터세트에 대한 일변량 조작이 수행된다. 일변량 조작은 증감 작업 및 변수가 변경되어야 하는 특정 값을 선정하는 것과 관련된다. 또 다른 실시예에서, 데이터 세트에 대한 이변량 조작이 수행된다. 이변량 조작은 2개 또는 다수의 변수에 대한 작업을 선택하여 상기 작업 값을 신규 변수에 부여함으로써 수행된다.
분석 데이터 세트의 품질이 평가된다(46). 품질 평가는 작업에 대한 중요한 차원을 확인하고 차원을 구성하는 변수를 정확히 정의하도록 요구한다. 품질 평가를 위하여 사용되는 요소의 예로는 정확성, 완전성, 일관성 및 적시성이 있다.
세분화 모델은 특성을 기초로 하여 분석 데이터 세트를 군집화하며, 특성은 사용자가 그래픽 사용자 인터페이스를 사용하여 선택한다(48).
다음으로, 탐구 데이터 분석이 분석 데이터 세트에 대하여 수행된다(50). 탐구 데이터 분석은 사용자 정의 문제에 대하여 하나 이상의 솔루션을 판단하는데 도움이 되는 분석 데이터 세트 내에 존재하는 다수의 상관관계를 판단한다. 탐구 데이터 분석은 단변량 분석, 이변량 분석, 기본 및 고급 시각화, 크로스탭(crosstab) 분석, 빈도 및 특성 분석, 상관관계 및 시계열 등 다수의 분석을 허용한다.
데이터 모델이 하나 이상의 솔루션을 판단하기 위하여 생성된다(52). 데이터 모델링은 깊이있는 회귀 분석 기법을 제공하며 사전 모델 프로세싱을 포함한다. 저장소는 데이터 처리, 품질 분석, 탐구 데이터 분석 및 데이터 모델 생성 단계에서 생성된 모든 보고서에 대한 접근을 허용한다.
위에서 설명된 기법은 도 1 및 도 2에 도시된 데이터 분석 시스템에 의하여 수행 가능하다. 상기 기법은 장치, 시스템, 방법 및/또는 컴퓨터 프로그램 제품으로 구현될 수 있다. 이에, 상기 주제의 일부 또는 전부는 하드웨어 및/또는 소프트웨어(펌웨어, 상주 소프트웨어, 마이크로 코드, 상태 기계, 게이트 어레이 등)에서 구현될 수 있다. 또한, 또한, 상기 주제는 명령어 수행 시스템에 의하여 사용되거나 이와 관련하여 컴퓨터 사용가능 저장매체 또는 컴퓨터 판독가능 저장매체에 구현된 컴퓨터 사용가능 프로그램 코드 또는 컴퓨터 판독가능 프로그램 코드를 포함하는 상기 저장매체 상에서 분석 도구 등 컴퓨터 프로그램 제품의 형태를 가질 수 있다. 이러한 설명의 범위 내에서, 컴퓨터 사용가능 저장매체 또는 컴퓨터 판독가능 저장매체는 명령어 수행 시스템 또는 장치 등이 사용하거나 이와 관련한 프로그램을 포함, 저장, 통신, 배포 또는 전달할 수 있는 매체일 수 있다.
상기 컴퓨터 사용가능 매체 또는 컴퓨터 저장가능 매체는 예를 들어, 전자, 자기, 광학, 전자기, 적외선 또는 반도체 시스템, 장치 또는 배포 매체일 수 있으나 이에 제한되지 않는다. 일례로, 컴퓨터 판독가능 매체는 컴퓨터 저장매체 및 통신매체를 포함하나 이에 제한되지 않는다.
상기 주제가 컴퓨터 수행가능 명령어의 일반적인 범위 내에서 구현되는 경우, 실시예는 하나 이상의 시스템, 컴퓨터 또는 기타 장치에 의하여 수행되는 프로그램 모듈을 포함할 수 있다. 일반적으로, 프로그램 모듈은 특정한 업무를 수행하거나 특정한 추상 데이터 종류를 구현하는 루틴, 프로그램, 오브젝트, 구성요소, 데이터 구조 등을 포함한다. 일반적으로, 상기 프로그램 모듈의 기능은 다양한 실시예에서 바람직하게 결합하거나 분배될 수 있다.
도 4는 다양한 소스로부터 검색된 데이터 세트에 대한 특정 문제를 해결하는 데이터 솔루션을 생성하는 컴퓨터(100)의 실시예를 도시한 블록도이다. 컴퓨터(100)는 도 3에 도시된 단계를 수행하는 데이터 솔루션 도구에 대한 명령어를 실행한다. 기본구성(102)에서, 컴퓨터(100)는 일반적으로 하나 이상의 프로세서(1024) 및 시스템 메모리(106)를 포함한다. 메모리 버스(124)는 프로세서(104)와 시스템 메모리(106)간의 통신에 사용될 수 있다.
바람직한 구성에 따라, 상기 프로세서(104)는 마이크로프로세서, 마이크로컨트롤러, DSP(Digital Signal Processor), 또는 그 조합을 포함하나 이에 제한되지 않는 모든 종류일 수 있다. 상기 프로세서(104)는 L1캐시(110) 및 L2캐시(1122) 등 하나 이상의 단계의 캐시 및 프로세서 코어(114) 및 레지스터(116)를 포함할 수 있다. 일례로, 프로세서 코어(114)는 ALU(Arithmetic Logic Unit), FPU(Floating Point Unit), DSP Core(Digital Signal Processing Core) 또는 그 조합을 포함할 수 있다. 일례로, 메모리 컨트롤러(118)도 상기 프로세서(104)와 함께 사용되거나, 일부 구현예에서, 메모리 컨트롤러(118)는 프로세서(104)의 내부 요소일 수 있다.
바람직한 구성에 따라, 시스템 메모리(106)는 휘발성 메모리(RAM), 비휘발성 메모리(ROM, 플래시 메모리 등), 또는 그 조합을 포함하나 이에 제한되지 않는 모든 종류일 수 있다. 시스템 메모리(106)는 운영체제(OS)(120), 하나 이상의 애플리케이션(122) 및 프로그램 데이터(124)를 포함할 수 있다. 애플리케이션(122)은 다양한 소스에서 검색된 다수의 데이터 세트를 분석하는 데이터 솔루션 도구(120)를 포함한다. 프로그램 데이터(126)는 소셜 미디어 데이터, 마케팅 데이터, 영업 데이터 등을 포함할 수 있다. 일부 실시예에서, 애플리케이션(122)은 OS(120) 상에서 프로그램 데이터(126)와 함께 동작할 수 있으며 이에 분배장치(dispensing device)와 외부 실체간의 인터페이스가 모니터링된다. 상기 기본 구성(102)은 도 4에서 안쪽의 파선 내에 위치한 구성요소에 의하여 도시된다.
컴퓨터(100)는 추가적인 특징이나 기능 및 기본구성(102)과 필요한 장치 및 인터페이스 간의 통신을 가능케 하기 위하여 추가 인터페이스를 가질 수 있다. 예를 들어, 버스/인터페이스 제어부(130)는 저장 인터페이스 버스(138)를 통하여 기본구성(102)과 하나 이상의 데이터 저장장치(132) 간의 통신을 수행하는데 사용될 수 있다. 데이터 저장장치(132)는 이동식 저장장치(134), 비이동식 저장장치(136) 또는 그 조합일 수 있다. 이동식 저장장치 및 비이동식 저장장치의 예로는 플렉시블 디스크 드라이브(flexible disk drive) 및 하드 디스크 드라이브 등 자기 디스크 장치, CD 또는 DVD 등 광학 디스크 드라이브, SSD(Solid State Drives) 및 테이프 드라이브 등이 있다. 일례로, 컴퓨터 저장매체는 컴퓨터 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터 등 정보를 저장하기 위한 방법 또는 기술에서 구현되는 휘발성/비휘발성 매체 및 이동식/비이동식 매체가 있을 수 있다.
시스템 메모리(106), 이동식 저장장치(134) 및 비이동식 저장장치(136)는 컴퓨터 저장매체의 예이다. 컴퓨터 저장매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(Digital Versatile disks) 또는 기타 광학 저장장치, 자기 카세트, 자기 테이프, 자기 디스크 저장장치 또는 기타 자기 저장장치 또는 원하는 정보를 저장하는데 사용가능하고 컴퓨터(100)가 접속가능한 다른 매체를 포함하나 이에 제한되지 않는다. 이러한 컴퓨터 저장매체는 컴퓨터(100)의 일부일 수 있다.
컴퓨터(100)는 버스/인터페이스 제어부(130)를 통하여 다양한 인터페이스 장치(예를 들어, 출력장치(140), 주변 인터페이스(148) 및 통신 장치(160))와 기본구성(102)간의 통신을 수행하기 위하여 인터페이스 버스(138)를 포함할 수 있다. 출력장치(142)의 예로는 그래픽 처리부(144) 및 오디오 처리부(146)가 있으며, 그래픽 처리부(144)와 오디오 처리부(146)는 하나 이상의 A/V 포트(142)를 통하여 디스플레이부 또는 스피커 등의 다양한 외부장치와 통신할 수 있다. 주변 인터페이스(148)의 예로는 하나 이상의 I/O 포트(148)를 통하여 입력장치(예를 들어, 키보드, 마우스, 펜, 음성입력장치, 터치입력장치 등) 등의 외부장치와 통신할 수 있는 직렬 인터페이스 제어부(150) 또는 병렬 인터페이스 제어부(152)가 있다. 통신장치(160)의 예로는 하나 이상의 통신 포트(156)를 통하여 네트워크 통신 링크 상에서 하나 이상의 다른 컴퓨터(158)와 통신하도록 마련된 네트워크 제어부(154)가 있다.
상기 네트워크 통신 링크는 통신매체의 일례일 수 있다. 통신매체는 일반적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파 또는 기타 전달 수단 등 데이터 신호 상의 데이터에 의하여 구현될 수 있으며, 정보 전달 매체를 포함할 수 있다. "변조 데이터 신호"는 해당 신호에 정보를 인코딩하는 방식으로 하나 이상의 특징이 설정되거나 변경된 신호일 수 있다. 일례로, 통신매체는 유선 네트워크 또는 직접 유선 연결 등 유선 매체 및 음향, RF, 마이크로파, IR 등의 무선 매체 및 기타 무선 매체를 포함할 수 있으나 이에 제한되지 않는다. 본 명세서에서 사용되는 컴퓨터 판독가능 매체는 저장매체와 통신매체를 모두 포함할 수 있다.
컴퓨터(100)는 휴대전화, PDA, PMP, 무선 웹와치, 개인용 헤드셋 장치, 애플리케이션 전용 장치 또는 위 기능을 포함하는 하이브리드 장치 등 소형 폼팩터 휴대용(또는 모바일) 전자 장치의 일부로 구성될 수 있다. 컴퓨터(100)는 노트북 컴퓨터 및 노트북 외의 다른 컴퓨터 구성을 모두 포함하는 PC로 구현될 수도 있다. 앞서 설명한 바와 같이, 데이터 분석 도구 및 시스템은 소셜 미디어 플랫폼에서 검색된 소셜 미디어 데이터를 검색한다. 데이터 솔루션 도구 및 시스템은 사용자로 하여금 입력 데이터를 제공하고 데이터 솔루션 시스템이 제공하는 필요한 작업을 선정할 수 있도록 그래픽 사용자 인터페이스를 포함할 수 있다. 사용자 인터페이스 화면의 예시는 도 5 내지 도12를 참조하여 아래에서 설명된다.
도 5는 데이터 분석가 등 사용자가 분석 데이터 세트를 생성하기 위하여 상기 데이터 세트에 대한 데이터 처리 작업을 수행할 수 있도록 해주는 그래픽 사용자 인터페이스이다. 상기 데이터 처리 모듈은 데이터 분석가가 화면(56)에 도시된 바와 같이 새로운 변수를 추가하거나 기존 데이터 세트를 조작할 수 있도록 해준다. 데이터 분석가는 데이터 세트에 대하여 공통적이고 독점적인 변수도 선정할 수 있으며, 데이터 처리 작업으로부터 관련 보고서도 생성할 수 있다.
도 6은 분석 데이터 세트에 대한 데이터 품질 분석에 관한 시각 자료를 도시한 화면이다. 도시된 바와 같이, 화면(58)에서 품질 분석은 일변량 요약을 통한 양적(통계) 분석을 지원한다. 일변량 요약은 한 번에 다수의 변수를 위하여 위치 측정(Measures of Locations), 분산도 측정(Measures of Dispersion), 정규성 검정, 분산도, 백분율 및 그 조합 등의 속성을 허용한다.
도 7은 분석 데이터 세트를 위한 탐구 데이터 분석의 시각적 자료를 도시한 화면이다. 화면(60)은 확률 도표, 박스 도표, 자동수정 도표, 히스토그램, 평균 백분위 도표 및 표준 편차 도표 등의 여러 도표 형태로 표현되는 분석 데이터 세트의 일변량 분석을 도시한다.
이와 유사하게, 도 8의 화면(62)은 특정 데이터 세트의 다양한 변수에 대한 빈도 분석 및 특성 분석을 도시한다. 그래픽 사용자 인터페이스는 데이터 분석가가 빈도, 빈도율, 고유 카운트(distinct count), 평균 등 다양한 파라미터가 그래프나 표 형식으로 도시되도록 선택할 수 있도록 한다. 도 9는 다수의 반복상의 데이터 세트에 대한 시계열 분석을 도시한다. 화면(64)은 단일 반복에 대한 시계열 도표를 도시한다.
도 10은 탐구 데이터 분석의 분석 결과를 나타내는 하나 이상의 모델을 생성하는 데이터 모델링을 도시한 화면이다. 도시된 바와 같이, 도 11의 화면(66, 68)상에, 데이터 모델링은 선형 회귀, 로지스틱스 회귀, VARMAX, ARIMAX 등 다양한 범주 내의 모델 정의, 모델 구축, 모델 진단 및 모델의 시각화 이력 등의 가능성을 허용한다. 분석 데이터 세트의 평균, 분산 및 공분산을 기반으로 하여 모델 구축 중에 하나 이상의 모델이 생성된다. 도 12는 데이터 분석가가 다양한 단계에서 수행한 데이터 분석을 기반으로 한 컨텐츠 보고서, 평균 영업 보고서 등 생성될 수 있는 다양한 보고서, 차트 또는 그래프를 도시한 화면(70)이다.
일반적으로 본 명세서에서 사용된 용어는, 특히 청구항에서(예를 들어, 청구항의 본문) 일반적으로 "개방적인" 용어로 의도된다(예를 들어, "포함하는"은 "포함하나 이에 제한되지 않는"으로, "가지다"는 "적어도 그 이상으로 가지다"로, "포함하는"는 "포함하나 이에 제한되지 않는"로 해석되어야 함). 도입된 청구항 기재에 대하여 특정한 개수가 의도되는 경우, 이러한 의도는 해당 청구항에서 명시적으로 기재되며, 이러한 기재가 부재하는 경우 이러한 의도는 존재하지 않는 것으로 이해된다.
예를 들어, 이해를 돕기 위하여, 다음에 첨부된 청구항은 청구항 기재를 시작하기 위하여 시작 문구인 "적어도 하나 이상의" 및 "하나 이상의"의 사용을 포함할 수 있다. 다만, 이러한 문구의 사용은 부정관사에 의한 청구항 기재의 시작이 단 하나의 기재를 포함한 실시예에 대하여 이러한 청구항 기재를 포함하는 특정 청구항으로 제한함을 암시하는 것으로 해석되어서는 아니되며, 특히 동일한 청구항이 서두 문구 "하나 이상의" 또는 적어도 하나 이상의" 및 부정관사(예를 들어, "a" 및 "an"은 "적어도 하나 이상의" 또는 "하나 이상의"를 의미하는 것으로 해석되어야 함)를 포함하는 경우에도 그러하며, 이는 청구항 기재를 시작하기 위하여 사용되는 정관사의 사용에 대하여도 동일하다. 또한, 청구항 기재의 특정 수가 명시적으로 기재된다 하더라도, 당업자는 이러한 기재가 적어도 기재된 수 이상을 의미하는 것으로 해석되어야 한다는 점을 인식할 것이다(예를 들어, 수식어 없이 "두 개의 기재"의 있는 그대로의 기재는 적어도 두 개 이상의 기재 또는 둘 이상의 기재를 의미한다).
실시예의 특정 특징만이 본 명세서에서 도시되고 설명되었으며, 다양한 수정 및 변경이 당업자에 대하여 발생할 수 있다. 그러므로, 청구항은 본 발명의 사상 내에 속하는 변경 및 수정을 포함하는 것으로 의도된다는 점이 이해된다.

Claims (15)

  1. 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템에 있어서,
    다수의 소스로부터 다수의 데이터 세트를 수신하고, 상기 다수의 데이터 세트를 분석하는 분석 모듈;
    상기 분석 모듈에 연결되어 사용자로 하여금 상기 분석 모듈과 인터페이스할 수 있도록 하는 그래픽 사용자 인터페이스; 및
    상기 다수의 데이트 세트 및 분석 데이터 세트를 저장하는 저장 모듈;
    을 포함하고,
    상기 분석 모듈은
    상기 다수의 데이터 세트를 상기 분석 데이터 세트로 변환하는 데이터 처리 모듈;
    상기 분석 데이터 세트 내에 존재하며 상기 하나 이상의 솔루션을 판단하는데 사용되는 다수의 상관관계를 판단하는 탐구 분석 모듈;
    을 사용하여 상기 다수의 데이터 세트를 분석하는, 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  2. 제1항에 있어서,
    상기 분석 모듈은 상기 탐구 분석 모듈이 생성하는 상기 하나 이상의 솔루션을 대표하는 하나 이상의 모델을 생성하는 데이터 모델링 모듈을 더 포함하는 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  3. 제2항에 있어서,
    상기 하나 이상의 모델은 상기 분석 데이터 세트의 평균, 분산 및 공분산을 기반으로 생성되는 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  4. 제1항에 있어서,
    상기 분석 모듈은 사용자로 하여금 단일 장소에서 상기 탐구 분석 모듈과 데이터 모델링 모델이 생성한 다수의 보고서에 접속할 수 있도록 하는 보고 모듈을 더 포함하는 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  5. 제1항에 있어서,
    상기 분석 모듈은 상기 데이터 처리 모듈에 연결되어 상기 분석 데이터 세트의 품질을 평가하는 품질 분석 모듈을 더 포함하는 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  6. 제1항에 있어서,
    상기 탐구 분석 모듈은 상기 분석 데이터 세트에 일변량 분석을 적용하며 상기 일변량 분석은 하나 이상의 통계 속성에 따라 상기 분석 데이터 세트를 나타내는 것을 포함하는 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  7. 제1항에 있어서,
    상기 탐구 분석 모듈은 상기 분석 데이터 세트에 다변량 분석을 적용하며, 상기 다변량 분석은 하나 이상의 통계 속성에 대한 변동을 판단하는 것을 포함하는 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  8. 제7항에 있어서,
    상기 탐구 분석 모듈은 상기 분석 데이터 세트의 시각 자료를 생성하는 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  9. 제1항에 있어서,
    상기 분석 모듈은 속성을 기반으로 상기 분석 데이터 세트를 군집화하는 세분화 모듈을 더 포함하며, 상기 속성은 사용자에 의하여 선택되는 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  10. 제8항에 있어서,
    상기 분석 모듈이 사용하는 다수의 경계 파라미터는 사용자에 의하여 정의되는 하나 이상의 문제에 대한 하나 이상의 솔루션을 판단하기 위하여 다수의 데이터 세트를 분석하는 시스템.
  11. 하나 이상의 프로세서; 및
    상기 하나 이상의 프로세서가 단계들을 수행하도록 하는 명령어를 포함하는 하나 이상의 비일시적인 컴퓨터 판독가능 저장 매체;
    를 포함하고,
    상기 단계들은
    다수의 소스로부터 다수의 데이터 세트를 수신하는 단계;
    분석 데이터 세트를 생성하기 위하여 상기 다수의 데이터 세트를 조정하는 단계;
    상기 분석 데이터 세트 내에 존재하는 다수의 상관관계를 판단하기 위하여 상기 분석 데이터 세트에 대하여 탐구 데이터 분석을 수행하는 단계;
    상기 탐구 데이터 분석의 결과를 기반으로 다수의 모델을 생성하는 단계;
    를 포함하며, 상기 모델의 각각은 사용자가 정한 소정의 목표를 달성하기 위하여 하나 이상의 솔루션을 제공하는, 컴퓨터 구현 시스템.
  12. 제11항에 있어서,
    상기 분석 데이터 세트의 품질을 평가하는 단계를 더 포함하는 컴퓨터 구현 시스템.
  13. 제11항에 있어서,
    탐구 데이터 분석 및 데이터 모델링을 위하여 다수의 보고서를 생성하는 단계를 더 포함하는 컴퓨터 구현 시스템.
  14. 제13항에 있어서,
    사용자로 하여금 단일 장소에서 상기 다수의 보고서에 접속할 수 있도록 상기 다수의 보고서를 저장하는 단계를 더 포함하는 컴퓨터 구현 시스템.
  15. 제11항에 있어서,
    상기 사용자가 선택한 속성을 기반으로 상기 분석 데이터 세트를 군집화하는 단계를 더 포함하는 컴퓨터 구현 시스템.
KR1020147027279A 2012-03-29 2013-03-27 데이터 솔루션 시스템 KR20140139521A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IN1226CH2012 2012-03-29
IN1226/CHE/2012 2012-03-29
PCT/IN2013/000202 WO2013144980A2 (en) 2012-03-29 2013-03-27 Data solutions system

Publications (1)

Publication Number Publication Date
KR20140139521A true KR20140139521A (ko) 2014-12-05

Family

ID=48050465

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147027279A KR20140139521A (ko) 2012-03-29 2013-03-27 데이터 솔루션 시스템

Country Status (10)

Country Link
US (1) US20130262348A1 (ko)
EP (1) EP2648152A1 (ko)
JP (1) JP2013232183A (ko)
KR (1) KR20140139521A (ko)
CN (1) CN103440164A (ko)
AU (1) AU2013202136A1 (ko)
BR (1) BR102013007775A2 (ko)
SG (1) SG193764A1 (ko)
WO (1) WO2013144980A2 (ko)
ZA (1) ZA201305211B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160143379A (ko) * 2015-06-05 2016-12-14 강원대학교산학협력단 로우 데이터 처리 장치 및 방법

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2755170A1 (en) * 2013-01-10 2014-07-16 Mu Sigma Business Solutions Pvt. Ltd. Data management system and tool
US11309060B2 (en) * 2013-06-24 2022-04-19 Koninklijke Philips N.V. System and method for real time clinical questions presentation and management
CN104751235A (zh) * 2013-12-27 2015-07-01 伊姆西公司 用于数据挖掘的方法和装置
US10346393B2 (en) * 2014-10-20 2019-07-09 International Business Machines Corporation Automatic enumeration of data analysis options and rapid analysis of statistical models
US10579627B2 (en) 2016-01-08 2020-03-03 Microsoft Technology Licensing, Llc Database operation using metadata of data sources
US11250343B2 (en) 2017-06-08 2022-02-15 Sap Se Machine learning anomaly detection
US10929421B2 (en) * 2017-06-08 2021-02-23 Sap Se Suggestion of views based on correlation of data
WO2019148040A1 (en) * 2018-01-26 2019-08-01 Ge Inspection Technologies, Lp Autonomous hybrid analytics modeling platform
US20210071242A1 (en) * 2018-01-29 2021-03-11 Gen-Probe Incorporated Analytical systems and methods
US10445422B2 (en) * 2018-02-09 2019-10-15 Microsoft Technology Licensing, Llc Identification of sets and manipulation of set data in productivity applications
CN108399951B (zh) * 2018-03-12 2022-03-08 东南大学 呼吸机相关性肺炎决策辅助方法、装置、设备及介质
EP3570227A1 (en) * 2018-05-16 2019-11-20 Ernst & Young GmbH Wirtschaftsprüfungsgesellschaft Interactive user interface for regression planning and evaluation system
US10684762B2 (en) 2018-08-27 2020-06-16 Sap Se Analytics design system
US20200334442A1 (en) * 2019-04-18 2020-10-22 Microsoft Technology Licensing, Llc On-platform analytics
KR102615133B1 (ko) * 2021-06-30 2023-12-19 (주)브릭 데이터 분포 변환 방법 및 장치

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6243615B1 (en) * 1999-09-09 2001-06-05 Aegis Analytical Corporation System for analyzing and improving pharmaceutical and other capital-intensive manufacturing processes
US6757667B1 (en) * 2000-04-12 2004-06-29 Unilever Home & Personal Care Usa, Division Of Conopco, Inc. Method for optimizing formulations
EP1146687A3 (en) * 2000-04-12 2004-08-25 Hewlett-Packard Company, A Delaware Corporation Internet usage analysis system and method
US6768973B1 (en) * 2000-04-12 2004-07-27 Unilever Home & Personal Care Usa, Division Of Conopco, Inc. Method for finding solutions
US7617201B1 (en) * 2001-06-20 2009-11-10 Microstrategy, Incorporated System and method for analyzing statistics in a reporting system
US7284204B2 (en) * 2002-03-29 2007-10-16 International Business Machines Corporation System, method, and visual user interface for evaluating and selecting suppliers for enterprise procurement
JP2004133652A (ja) * 2002-10-10 2004-04-30 Business Brain Showa Ota Inc 経営ソリューションシステム、およびコンピュータ・プログラム
AU2003296939A1 (en) * 2002-12-10 2004-06-30 Stone Investments, Inc Method and system for analyzing data and creating predictive models
US20040138933A1 (en) * 2003-01-09 2004-07-15 Lacomb Christina A. Development of a model for integration into a business intelligence system
CA2533016A1 (en) * 2003-07-18 2005-01-27 Commonwealth Scientific And Industrial Research Organisation A method and system for selecting one or more variables for use with a statistical model
US7251578B1 (en) * 2006-03-10 2007-07-31 Yahoo! Inc. Method and system of measuring data quality
US8027864B2 (en) * 2006-11-22 2011-09-27 Proclivity Systems, Inc. System and method for providing e-commerce consumer-based behavioral target marketing reports
JP2009064191A (ja) * 2007-09-05 2009-03-26 Sharp Corp 情報検索支援装置、情報検索支援方法、プログラムおよび記録媒体
JP5108558B2 (ja) * 2008-02-27 2012-12-26 株式会社電通 情報処理装置、情報処理方法及び情報処理用プログラム
BRPI0917246A2 (pt) * 2008-08-04 2015-11-10 Quid Inc método e sistema para medir um desempenho de uma entidade, meio legível por computador, e, métodos para determinar um panorama competitivo para entidades em uma indústria, para conectar entidades competitivas em uma indústria, e para prognosticar um desempenho futuro de uma entidade
US7974983B2 (en) * 2008-11-13 2011-07-05 Buzzient, Inc. Website network and advertisement analysis using analytic measurement of online social media content
US8756229B2 (en) * 2009-06-26 2014-06-17 Quantifind, Inc. System and methods for units-based numeric information retrieval
US8401984B2 (en) * 2009-08-26 2013-03-19 Yahoo! Inc. Identification and measurement of social influence and correlation
US8554756B2 (en) * 2010-06-25 2013-10-08 Microsoft Corporation Integrating social network data with search results
US9262517B2 (en) * 2010-08-18 2016-02-16 At&T Intellectual Property I, L.P. Systems and methods for social media data mining
US9207251B2 (en) * 2011-04-19 2015-12-08 Roche Molecular Systems, Inc. User interaction with automated analytical apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160143379A (ko) * 2015-06-05 2016-12-14 강원대학교산학협력단 로우 데이터 처리 장치 및 방법

Also Published As

Publication number Publication date
WO2013144980A2 (en) 2013-10-03
EP2648152A1 (en) 2013-10-09
BR102013007775A2 (pt) 2018-01-23
ZA201305211B (en) 2014-05-28
CN103440164A (zh) 2013-12-11
SG193764A1 (en) 2013-10-30
WO2013144980A3 (en) 2013-12-05
JP2013232183A (ja) 2013-11-14
AU2013202136A1 (en) 2013-10-17
US20130262348A1 (en) 2013-10-03

Similar Documents

Publication Publication Date Title
KR20140139521A (ko) 데이터 솔루션 시스템
CN103678457B (zh) 基于初始数据可视化确定替代性数据可视化的方法和系统
EP3201804B1 (en) Cloud process for rapid data investigation and data integrity analysis
US20070156787A1 (en) Apparatus and method for strategy map validation and visualization
US20180075175A1 (en) Automated model development process
US11341449B2 (en) Data distillery for signal detection
US10083263B2 (en) Automatic modeling farmer
US8160920B2 (en) System and method of measuring process compliance
US11037096B2 (en) Delivery prediction with degree of delivery reliability
US10467226B2 (en) Method for in-database feature selection for high-dimensional inputs
WO2013161850A1 (ja) テキストマイニングシステム、テキストマイニング方法及びプログラム
SG192380A1 (en) Social media data analysis system and method
WO2018113521A1 (en) Generating knowledge base to assist with the modeling of large datasets
US20160154830A1 (en) Systems and methods for data integration
JP2016045928A (ja) 実験を生成および評価するためのシステムおよび方法
JP2018005883A (ja) 誘導型分析システムおよび方法
US20160239766A1 (en) Systems, methods, and user interfaces for evaluating quality, health, safety, and environment data
Sharma et al. A RESEARCH REVIEW ON COMPARATIVE ANALYSIS OF DATA MINING TOOLS, TECHNIQUES AND PARAMETERS.
Saeed et al. Supply chain sustainability performance indicators-A systematic literature review
US7992126B2 (en) Apparatus and method for quantitatively measuring the balance within a balanced scorecard
Pujari et al. Exploiting data mining techniques for improving the efficiency of time series data using spss-clementine
US20170124177A1 (en) Method and system for locating underlying patterns in datasets using hierarchically structured categorical clustering
US20240220907A1 (en) Data distillery for signal detection
US20160125538A1 (en) Creative generation of financial portfolios
Gram Equipment Efficiency Metrics in Production Systems a Literature Review and Survey

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid