KR101017504B1 - 단순화된 분석 발견법을 이용한 자동화된 차원 모델 정의 및 구축을 위한 데이터 분석 시스템, 방법, 디바이스 및 컴퓨터 판독가능 기록 매체 - Google Patents

단순화된 분석 발견법을 이용한 자동화된 차원 모델 정의 및 구축을 위한 데이터 분석 시스템, 방법, 디바이스 및 컴퓨터 판독가능 기록 매체 Download PDF

Info

Publication number
KR101017504B1
KR101017504B1 KR1020040021008A KR20040021008A KR101017504B1 KR 101017504 B1 KR101017504 B1 KR 101017504B1 KR 1020040021008 A KR1020040021008 A KR 1020040021008A KR 20040021008 A KR20040021008 A KR 20040021008A KR 101017504 B1 KR101017504 B1 KR 101017504B1
Authority
KR
South Korea
Prior art keywords
data
dimensional model
automated
group
user
Prior art date
Application number
KR1020040021008A
Other languages
English (en)
Other versions
KR20040085044A (ko
Inventor
크리스티안 펫철레스쿠
넷즈아미르
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20040085044A publication Critical patent/KR20040085044A/ko
Application granted granted Critical
Publication of KR101017504B1 publication Critical patent/KR101017504B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 차원 모델을 자동으로 정의하고 구축하기 위해 단순화된 분석 발견적방법을 활용함으로써 관계 스키마의 상호관계를 레버리지한다. 사용자는 프로세스를 정의하고 구축하는데 모두 인터렉티브하게 참여하여 결과에 영향을 미칠 수 있다. 관계 스키마는 관계 데이터베이스 등을 포함한다. 차원 모델은 ROLAP 및 MOLAP 오브젝트와 같은 OLAP 오브젝트 등을 포함한다. 차원 모델 정의, 차원 모델 구축, 및 차원 모델의 정의 및 구축을 사용자가 단일 컴퓨터 마우스 클릭과 같은 단일 사용자 액션을 통해 개시할 수 있도록 하기 위한 수단이 또한 제공된다.
Figure R1020040021008
차원 모델, 관계 데이터베이스, 오브젝트, 관계 스키마, 데이터베이스

Description

단순화된 분석 발견법을 이용한 자동화된 차원 모델 정의 및 구축을 위한 데이터 분석 시스템, 방법, 디바이스 및 컴퓨터 판독가능 기록 매체{SYSTEMS, METHODS AND APPARATUS FOR AUTOMATED DIMENSIONAL MODEL DEFINITIONS AND BUILDS UTILIZING SIMPLIFIED ANALYSIS HEURISTICS}
도 1은 본 발명의 하나의 양태에 따른 데이터 분석 시스템의 블록도.
도 2는 본 발명의 하나의 양태에 따른 데이터베이스 분석 시스템의 페이징(phasing)의 블록도.
도 3은 본 발명의 하나의 양태에 따라 차원 모델을 구성하는 방법의 흐름도.
도 4는 본 발명의 하나의 양태에 따라 차원 모델을 정의하는 방법의 흐름도.
도 5는 본 발명의 하나의 양태에 따라 차원 모델을 구축하는 방법의 흐름도.
도 6은 본 발명의 하나의 양태에 따라 사용자와 인터페이스하는 소프트웨어 프로세스의 표.
도 7은 본 발명의 하나의 양태에 따른 환영(welcome) 사용자 인터페이스의 스크린 샷.
도 8은 본 발명의 하나의 양태에 따른 큐브 정의 사용자 인터페이스의 스크린 샷.
도 9는 본 발명의 하나의 양태에 따른 데이터 소스 선택 사용자 인터페이스의 스크린 샷.
도 10은 본 발명의 하나의 양태에 따른 표 타입 검출 사용자 인터페이스의 스크린 샷.
도 11은 본 발명의 하나의 양태에 따른 표 타입 선택 사용자 인터페이스의 스크린 샷.
도 12는 본 발명의 하나의 양태에 따른 존재하는 차원 사용자 인터페이스의 스크린 샷.
도 13은 본 발명의 하나의 양태에 따른 측정 선택 사용자 인터페이스의 스크린 샷.
도 14는 본 발명의 하나의 양태에 따른 차원 계층 생성 사용자 인터페이스의 스크린 샷.
도 15는 본 발명의 하나의 양태에 따른 기간 정의 사용자 인터페이스의 스크린 샷.
도 16은 본 발명의 하나의 양태에 따른 새롭게-생성된 차원 사용자 인터페이스의 스크린 샷.
도 17은 본 발명의 하나의 양태에 따른 큐브 생성 종료 사용자 인터페이스의 스크린 샷.
도 18은 본 발명의 하나의 양태에 따른 새로운 수동 측정 정의 사용자 인터페이스의 스크린 샷.
도 19는 본 발명의 하나의 양태에 따른 수동 존재 차원 사용자 인터페이스의 스크린 샷.
도 20은 본 발명의 하나의 양태에 따른 새로운 수동 차원 정의 사용자 인터페이스의 스크린 샷.
도 21은 본 발명의 하나의 양태에 따른 수동 기간 정의 사용자 인터페이스의 스크린 샷.
도 22는 본 발명이 기능할 수 있는 동작 환경의 예를 예시한 도.
도 23은 본 발명이 기능할 수 있는 다른 동작 환경의 예를 예시한 도.
<도면의 주요 부호에 대한 간단한 설명>
102 : 관계 스키마
104 : 데이터 분석 컴포넌트
106 : 차원 모델
108 : 사용자
본 발명은 일반적으로는 데이터 분석에 관한 것으로, 특히 단순화된 분석 발견적 방법을 이용하여 관계 스키마에 기초하여 차원 모델을 자동으로 생성하고 구축하기 위한 시스템 및 방법에 관한 것이다.
현대 사회는 컴퓨터 및 컴퓨터 기술에 더 많이 의존하게 되었다. 특히 회사들이 고객과 제품 판매를 위해 치열하게 경쟁하는 비즈니스 영역에서 특히 심하다. 저스트-인-타임 재고품 및 잘 집중된 광고 전략을 가진 회사는 일반적으로 경쟁자 보다 제품을 더 싸게 생산하고, 고객에게 더 빨리 전달한다. 컴퓨터 기술은 비즈니스, 정보 및 고객을 함께 네트워킹함으로써 이러한 타입의 비즈니스 우위를 가능하게 한다. 원래 컴퓨터가 로컬 영역 네트워크(LAN)로만 구성되는 네트워크를 통해서 다른 컴퓨터에 통신을 했지만, 인터넷의 출현으로 인해 컴퓨터를 가진 누구나가 실질적으로 글로벌 네트워크에 참여할 수 있게 되었다. 이것으로 인해 소규모 비지니스가 자금조달 및 네트워크 구조를 구축할 필요없이 더 큰 비지니스와 경쟁할 수 있게 되었다.
컴퓨팅 및 네트워킹 기술이 더 강력하고 안전하며 신뢰할만하게 됨에 따라, 더 많은 소비자, 도매업자, 소매업자, 기업가, 교육기관등은 패러다임을 시프트하여 전통적인 수단 대신에 인터넷과 같은 네트워크를 채용하여 비즈니스를 수행한다. 많은 비즈니스들은 현재 웹 사이트 및 온라인 서비스를 제공하고 있다. 예를 들면, 오늘날 소비자는 인터넷을 통해 자신의 계좌에 액세스하여 잔액 조회, 자금 이체 및 대금 지불과 같은 증가하는 다수의 가용한 거래를 수행할 수 있다.
통상, 비즈니스는 고객과 비즈니스 정보를 수집하여 데이터베이스로서 알려진 큰 실체에 저장한다. 이들은 컴퓨터 프로그램이 원하는 데이터를 신속하게 선택할 수 있도록 조직화된 정보의 집합이다. 데이터베이스는 기술이 더 많은 데이터가 수집될 수 있도록 허용함에 따라 그 크기가 방대하고 지수함수적으로 확장될 수 있다. 일반적으로, 데이터베이스는 필드, 레코드 및 파일로 구성된다. 필드는 하나의 정보 조각이고, 레코드는 하나의 완벽한 필드 셋트이며, 파일은 레코드의 집합이다. 데이터베이스 관리 시스템(DBMS)은 데이터베이스로부터 정보를 액세스 하는데 활용된다. DBMS는 사용자가 데이터베이스에서 데이터를 입력하고, 구조화하며 선택할 수 있도록 하는 프로그램의 그룹이다.
비즈니스에서 자주 발생하는 바와 같이, 이익을 증가시키고 더 낮은 동작 비용을 낮추려는 압박이 항상 존재한다. 그러므로, 비즈니스 인텔리전스(BI) 솔루션이 개발되어 큰 데이터베이스로부터 정보를 액세스하는 것을 도와준다. 최근에 대부분의 비즈니스는 데이터가 상호관계되는 관계형 데이터베이스(relational type database)로 이동되었다. 데이터 집적(warehouse)은 이전 이벤트와 관련된 저장된 데이터에 관한 "누구의" 및 "어떤" 질문인가에 답하는 전술적인 정보를 저장하도록 개발되었다. 그러나, 이것은 데이터 집적이 단지 역사적인 데이터를 검색하는 능력만을 가졌다는 사실로 인해 제한적인 것으로 증명되었다. 그러므로, 온라인 분석적 처리(OLAP) 시스템은 데이터의 "누구의" 및 "어떤"뿐만 아니라 "가정" 및 "이유"도 답하도록 개발되었다. OLAP 시스템은 분석가, 비즈니스 매니저, 행정가 등이 신속하고, 신뢰할만하며, 상호작용하는 프로세스를 통해 정보에 대한 통찰력을 얻을 수 있게 하는 집합 데이터의 다차원적 뷰이다. OLAP의 메인 컴포넌트는 OLAP 서버이고, 이것은 클라이언트와 DBMS 사이에 위치한다. OLAP 서버는 데이터베이스에서 데이터가 조직화되는 방법을 알고 있고 데이터를 분석하기 위한 특별한 기능들을 가지고 있다.
OLAP 도구를 포함하는 분석 도구들은 엄청난 양의 데이터로의 액세스 시간을 줄이는데 도움을 준다. 이들 도구들을 이용함으로써, 사용자는 모든 데이터를 축어적으로 검색하기 보다는 데이터에 관한 일반적인 질문이나 "질의"를 물을 수 있 다. 그러므로, "데이터에 관한 데이터"또는 메타 데이터는 질의 프로세스를 신속히 처리하여 필요한 네트워크 대역폭을 감소시키는데 도움을 준다. OLAP 오브젝트와 같은 차원 모델은 이러한 타입의 분석에 중요한 역할을 한다. 차원 모델은 데이터베이스내의 데이터로부터 구성되거나 "구축"된다. 대부분의 데이터 분석 시스템에서 전형적인 바와 같이, 사용자에게 공급되는 최종 데이터는 이것이 기반하고 있는 차원 모델의 무결성(integrity)에 크게 좌우된다. 그러므로, 차원 모델이 데이터베이스의 데이터로부터 도출된 정보를 정확하게 반영하도록 구축되는 것이 더욱 더 중요하다.
데이터베이스 크기가 증가하는 경우에, 차원 모델도 그 크기가 증가한다는 것은 당연하다. 이것은 요구되는 차원 모델의 복잡성을 증가시킨다. 모델을 구축하려고 시도하는 사용자는 다량의 시간과 노력을 요구하면서도 적절하게 구축되도록 보장하라는 계속적인 도전을 가지게 된다. 이것에 더해, 3차원 이상, 다량의 측정 및 복잡한 타이밍, 등을 가지는 모델의 복잡성이 증가되며, 이것은 큰 일이 된다. 모델이 구축되는 경우, 엔드 사용자의 질의에 대한 답변을 추출하도록 채용될 수 있는 정보를 항상 포함해야 한다. 그러므로, 차원 모델 또는 "큐브"의 구조화가 동일하게 중요하다. 데이터베이스 정보가 유사할 지라도, 다른 비즈니스는 다른 질의에 대한 답변을 요구한다. 동일한 비즈니스에서의 상이한 부문들은 다른 부문들과는 상이한 답변을 요구할 수도 있다.
비즈니스가 경쟁력을 유지하기 위해서는, 그 경쟁자들보다 더 양호하게 수행하려고 항상 노력해야 한다. 더 스마트하고 더 직관적인 비즈니스 솔루션을 활용하는 것은 이러한 성능을 증대시킨다. OLAP 오브젝트와 같은 차원 모델링은 최고가 되려고 하는 그 전쟁에서 비즈니스를 도와주는 핵심이다. 이것은 이러한 분석 기술없이는 가용할 수 없는, 데이터 저장소로부터 가치있고 "숨어있는" 정보가 추출될 수 있도록 한다. 더 많은 비즈니스가 그 숨겨진 데이터를 발견할수록, 차원 모델링은 엄격한 시장 환경에서 비즈니스 성공에 핵심적인 것으로 나타날 것이다.
이하는 본 발명의 여러 양태들의 기본적인 이해를 제공하기 위해 본 발명의 단순화된 요약을 제공한다. 본 요약은 본 발명의 광범위한 개관은 아니다. 이것은 본 발명의 핵심/결정적 요소들을 식별하거나 본 발명의 범주를 개괄적으로 나타내려고 하는 것은 아니다. 그 단지 목적은 나중에 제공되는 상세한 설명에 대한 전주로서 본 발명의 일부 개념을 단순화된 형태로 제공하는 것이다.
본 발명은 일반적으로는 데이터 분석에 관한 것으로, 특히 단순화된 분석 발견적방법을 활용하여 관계 스키마에 기초한 차원 모델을 자동으로 생성하고 구축하는 것에 관한 것이다. 분석 발견적방법은 차원 모델의 정의를 자동으로 생성하고 정의들로부터 차원 모델을 구성하는 수단으로 이용된다. 데이터베이스 정보를 MOLAP(다차원 OLAP) 및/또는 ROLAP(관계 OLAP) 오브젝트 등과 같은 OLAP 오브젝트 와 같은 차원 모델로 자동으로 변환함으로써, 사용자는 컴퓨터 마우스의 한 번 클릭으로 모델을 구축하거나 구성 동안에 모델의 구축에 인터렉티브하게 영향을 줄 수 있는 능력을 얻을 수 있다. 본 발명은 모델을 자동으로 정의하고 사용자가 모델을 구축하기 전에 정의를 인터렉티브하게 변경할 수 있도록 허용함으로써, OLAP 도구와 함께 사용하기 위해 개발하는 오브젝트의 더 빠르고 더 사용자-친숙한 방법 및 시스템을 제공한다.
본 발명은 차원 모델을 정의하는데 필요한 요구되는 기술 레벨을 감소시킴으로써 데이터 분석을 용이하게 하고 또한 모델 정의에서 사람에 의한 에러의 양을 감소시킨다. 모델을 정의하는 지루함을 줄이면서도, 본 발명은 사용자 인터렉션을 허가하여 고급 사용자들이 자동화된 특징으로부터 잇점을 가질 수 있고 여전히 결과에 영향을 줄 수 있음으로써, 전문가 사용자를 제한시키지 않고 사용자의 더 넓은 경험 기반을 허용한다. 본 발명은 또한 차원 모델의 구축과는 별개로 차원 모델의 정의가 제어될 수 있도록 하는 멀티-페이즈의 접근법을 제공한다. 이와 같이, 프로세스의 전체 또는 일부는 사용자 인터페이스를 통해 자동화되거나 인터렉티브하게 영향을 받을 수 있다. 이러한 유연성은 차원 모델의 개발 시간을 급격하게 감소시키고, 동시에 상호작용을 가능하게 하여, 사용자가 모델을 신속하게 구축하고 필요한 대로 적응할 수 있게 하며, 사용자-친숙도를 최대화하고, 모델 개발 속도를 증가시키며, 신뢰할 만하고 높은 무결성의 OLAP 오브젝트를 제공한다.
상기 및 관련 목적을 달성하기 위해, 본 발명의 특정 예시적 양태들이 이하의 상세한 설명 및 첨부 도면과 관련하여 기재된다. 그러나, 이들 양태들은 본 발명의 원리들이 채용될 수 있는 다양한 방법들 중 단지 일부만을 나타내고 있고, 본 발명은 모든 그러한 양태 및 그 등가물도 포함한다. 본 발명의 다른 장점 및 특징들은 도면을 참조하여 설명된 이하의 본 발명의 상세한 설명으로부터 명백하게 될 것이다.
이제, 본 발명은 유사한 참조 부호는 유사한 구성요소를 지칭하는데 이용되는 도면들을 참조하여 설명된다. 이하의 설명에서, 설명의 목적상, 본 발명의 철저한 이해를 제공하기 위해 다수의 특정 세부사항이 제시된다. 그러나, 본 발명은 이들 특정 세부항목없이 실시될 수 있다는 것은 자명하다. 다른 예들에서, 주지의 구조 및 디바이스는 본 발명의 설명을 용이하게 하기 위해 블록도 형태로 도시된다.
본 명세서에서 이용되는 바와 같이, "컴포넌트"라는 용어는 컴퓨터 관련 실체, 즉 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어, 또는 실행중인 소프트웨어 중 하나를 지칭하는데 이용된다. 에를 들면, 컴포넌트는 프로세서 상에서 실행되는 프로세스, 프로세서, 오브젝트, 실행가능(executable), 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있고, 이들로 제한되지는 않는다. 예를 들면, 서버 상에서 운용중인 어플리케이션 및 서버가 모두 컴퓨터 컴포넌트가 될 수 있다. 하나 이상의 컴포넌트는 프로세스 및/또는 실행 스레드 내에 상주할 수 있고, 컴포넌트는 하나의 컴퓨터에 로컬로 위치하거나 2개 이상의 컴퓨터 사이에 분산될 수도 있다. "스레드"는 오퍼레이팅 시스템 커널이 실행을 위해 예약해 둔 프로세스 내의 실체이다. 본 기술분야에 공지된 바와 같이, 각 스레드는 스레드의 실행과 연관된 휘발성 데이터인 연관 "컨텍스트"를 가지고 있다. 스레드의 컨텍스트는 시스템 레지스터의 컨텐트 및 스레드의 프로세스에 속하는 가상 어드레스를 포함한다. 그러므로, 스레드의 컨텍스트를 포함하는 실제 데이터는 이것이 실행함에 따라 가 변된다.
OLAP 시스템이 동작하기 위해서는, 정보를 도출할 차원 오브젝트 또는 "모델"을 필요로 한다. 차원 오브젝트는 일반적으로 데이터베이스로부터 도출되고 3차원 이상을 포함할 수 있다. 통상, 차원 오브젝트는 "큐브"로서 지칭된다. 이것은 차원 오브젝트를 지칭할 때 간단한 예시를 제공한다. OLAP 시스템은 사용자로부터의 질의가 제출된 경우에 차원 오브젝트로부터 정보를 검색한다. 그러므로, 질의에 대한 답변시 OLAP 시스템의 성공은 양호하고 잘-구조화된 차원 오브젝트 또는 모델을 갖는 것에 크게 비중을 갖게 된다. 서툴게 구성된 모델은 질의 응답 시간을 느리게 할 수 있고 또는 질의에 정확하게 응답하는 능력을 OLAP 시스템이 가질 수 없도록 할 수 있다. 일반적으로 말하면, 모델을 구성하는 사용자는 채용될 데이터베이스 및 OLAP 시스템이 답변하도록 요청되는 질의 타입, 모두에 관해 매우 잘 알아야 한다. 이것은 심지어 고도로 숙련된 사용자에게도 길고 지루한 수고가 될 수 있다.
본 발명은 차원 모델이 한번의 사용자 액션으로 정의되고 구축될 수 있도록 한다. 또한 사용자가 프로세스와 상호작용할 수 있게 하여 정의 및/또는 구축의 결과에 영향을 준다. 그러므로, 더 적은 경험을 가진 사용자는 차원 모델 또는 "큐브"가 단일 마우스 클릭으로 정의되고 구축될 수 있게 한다. 그러나, 고급 사용자는 여전히 큐브의 정의 및/또는 큐브의 구축에 인터렉티브한 레벨로 영향을 주는 능력을 가지고 있다. 이것은 사용자가 피트(fit)를 봄에 따라 큐브가 맞추어 만들어 질수 있다. 본 발명을 채용하는 전형적인 비즈니스는 OLAP 시스템을 동작하는 데 필요한 기술 레벨에 있어서의 본 발명의 사용 편이성 및 유연성으로 인해 비즈니스 목적을 충족하는 OLAP 시스템을 개발하는 시간과 경비를 절감한다. 이것은 비즈니스 정보를 제공하는 비용 및 복잡성을 감소시킴으로써, 적절한 차원 모델을 구성하는데 전문가를 고용할 필요를 제거할 가능성을 허용한다. 차원 모델은 사용자의 비즈니스 수요를 충족시키는 데이터 분석 시스템을 공식화하도록 필요한 대로 미조정될 수 있다.
통상, 데이터가 데이터베이스내에 상주하는 다른 데이터로의 링크를 가지고 있다는 의미에서, 데이터베이스는 본질적으로 관계적이다. 본 발명은 단순화된 분석 발견적방법을 채용하여 관계 데이터베이스와 같은 관계 스키마로부터 이들 링크를 활용한다. 이와 같이, 큐브 또는 차원 모델 정의가 구성된다. 일단 정의가 완료되면, 본 발명은 큐브 정의에 기초하여 큐브를 구축한다. 양쪽 양상들이 어떠한 사용자 개입없이도 자동으로 수행될 수 있다. 그러나, 사용자는 본 발명의 양쪽 양상과 인터렉트할 수 있다. 이것은 "한번 클릭"솔루션(예를 들면, 컴퓨터 마우스의 한번 클릭) 및 인터렉티브한 솔루션을 제공하여, 유연성을 증가시킨다.
도 1에서, 본 발명의 하나의 양태에 따른 데이터 분석 시스템(100)의 블록도가 예시되어 있다. 데이터 분석 시스템(100)은 관계 데이터베이스 등과 같은 관계 스키마(102), 데이터 분석 컴포넌트(104), OLAP 오브젝트 등과 같은 차원 모델(106) 또는 큐브, 및 사용자 인터페이스(108)를 포함한다. 데이터 분석 컴포넌트(104)는 관계 스키마(102)로부터 데이터를 처리하여 차원 오브젝트(106)를 생성한다. 이것은 우선 차원 모델을 정의한 후 그 정의로부터 차원 모델(106)을 구 축함으로써 달성된다. 사용자 인터페이스(108)는 사용자가 데이터 분석 컴포넌트(104)에서 발생하는 처리와 상호작용할 수 있게 한다. 이것은 사용자가 차원 모델 정의를 재정의하거나 차원 모델(106)이 구축되는 방법에 영향을 미칠 수 있게 한다. 이것은 또한 사용자가 컴퓨터 마우스 클릭 등과 같은 단일 사용자 액션을 간단하게 수행하고, 데이터 분석 컴포넌트(104)를 개시하여 차원 모델(106)을 자동으로 정의하거나, 차원 모델(106)을 자동으로 구성할 수 있도록 한다. 그러므로, 더 경험이 적은 사용자가 최소한의 노력으로 본 발명을 활용할 수 있다. 마찬가지로, 전문가는 본 발명과 여전히 상호작용할 수 있고, 그들이 피트를 보는대로 프로세스에 영향을 미친다. 관계 스키마(102)는 관계 스키마(102)에서 발견되는 다른 데이터와의 상호관련성을 가지고 있는 데이터를 포함하고 있다. 단순화된 분석 발견적 방법을 이용하여 차원 모델을 공식화하는데 레버리지되는 것은 이들 관계들이다.
관계 데이터베이스는 2차원인 표에 데이터를 저장한다. 표는 로우(레코드 또는 오브젝트) 및 칼럼(필드 또는 속성)을 구비하고 있다. 로우와 칼럼이 교차하는 데이터 아이템은 셀이라 불리고, 속성값으로 구성되어 있다. 다중 값들이 하나의 셀에 저장되지는 않는다. 관계 데이터베이스 표는 "정규화되고"따라서 데이터는 필요한 것보다 더 자주 반복되지 않는다. 표 칼럼은 주요 키, pk(칼럼에서 고유값)에 의존하여, 칼럼을 식별한다. 일단 특정 칼럼이 식별되면, 그 칼럼에 연관된 하나 이상의 로우로부터의 데이터가 얻어지거나 변경될 수 있다. 외부 키, fk는 관심사가 되는 주요 키를 가지는 표와 연관된 정보를 관련시키는 다른 표의 정 보로의 주요 키이다.
주요 키 및 외부 키들과 같은 수 개의 실체들 간의 관계는 갯수(cardinality)를 표현하도록 매핑될 수 있다. 실체 세트 간의 이진 관계 세트에 대해, 매핑 갯수는 일대일, 일대다, 다대일, 및 다대다가 될 수 있다. 주요 키, pk("다수"중 하나를 표현함) 및 외부 키 fk간의 관계는 fk/pk 쌍으로서 표현될 수 있다. 그래픽적으로는, 관계는 주요 키와 외부 키 간의 "호"로서 도시될 수 있다. 방향성은 호 상에 화살표를 활용함으로써 지시되어, 관계 방향성이 "안으로" 또는 "밖으로"인지 여부를 보여준다.
마찬가지로, 차원 모델은 투플(tuple)과 같은 그 구조를 정의하는데 도움을 주는 특성 또는 파라미터를 가지고 있다. 투플은 큐브로부터 데이터의 슬라이스를 정의하는데 이용된다. 이것은 하나 이상의 차원들로부터 하나의 멤버의 순서화된 집합으로 구성된다. 투플은 큐브로부터 다차원 데이터의 특정 섹션을 식별하는데 이용된다. 이것은 큐브의 각 차원에서 하나의 멤버로 구성되어 셀 값을 완전하게 기술한다.
도 2를 참조하면, 본 발명의 하나의 양태에 따른 데이터 분석 시스템의 페이징(200)의 블록도가 도시되어 있다. 본 발명의 하나의 양태에서, 처리는 2개의 페이지로 분리된다. 그러므로, 페이징(200)은 라벨 페이즈(202) 및 차원 모델 구조 페이즈(204)를 포함한다. 라벨링 페이즈(202)는 단순화된 분석 발견적 방법을 활용하여 차원 모델을 정의하는 처리를 포함한다. 이것은 관계 스키마내 데이터 간의 상호관계를 분석하는 것을 포함하고, 이것으로 한정되지 않는다. 예를 들면, 관계 스키마의 연관된 그래프는 "투플(V,A,f)"인 것으로 정의되고, 여기에서 V는 스키마에서 발견되는 매 표마다의 정점(vertex)의 세트이고, A는 스키마에서 매 관계에 대한 호의 세트이며, f는 v1 및 v2(각각 t1 및 t2로 명명됨)에 연관된 표들 사이에 관계가 있고 관계가 t1:t2=n:1(여기에서, n은 1에서 무한대까지의 정수를 나타낸다)인 경우 및 경우에만 f(v1,v2)=a12(v는 세트 V의 멤버를 나타내고, a는 세트 A의 멤버를 나타낸다)인 함수이다. 그리고 나서, "라벨"은 연관 구조(예를 들면, 표)로부터 외부키/주요키(fk/pk) 접속 쌍으로부터의 호의 특성에 기초하여, 표와 같은 각 구조에 대해 정의된다. 라벨링의 세부사항은 이하에 기재된다.
본 발명의 또 다른 예에서, 차원 모델 구조 페이즈(204)는 라벨 페이즈(202) 동안에 정의된 대로 차원 모델을 구축하는 것을 포함한다. 그러므로, 본 발명은 이러한 정의에 기초하여 큐브(차원 모델)를 자동으로 구축할 수 있다. 그러나, 본 발명의 다른 양태에서, 사용자는 큐브가 구성되기 전에, 정의를 조정하여 확대시키거나 변경할 수 있다. 이것은 사용자가 필요한만큼 또는 원하는 만큼 페이징(200)과 상호작용할 수 있도록 한다. 차원 오브젝트를 구성하는 실제 세부사항은 이하에 설명된다.
본 발명의 또 다른 예에서, 데이터 분석 시스템은 관계 데이터 스키마로부터의 데이터 상호관계에 기초하여 차원 모델을 정의하기 위한 단순화된 분석 발견적방법을 활용하기 위한 수단, 자동화된 구조 라벨링 시스템에 의해 정의된 차원 모델을 구축하기 위한 수단, 사용자가 자동화된 구조 라벨링 시스템 및/또는 자동화된 모델 구축 시스템과 상호작용할 수 있게 하는 수단, 및 사용자가 단일 사용자 액션으로 자동화된 구조 라벨링 시스템 및/또는 자동화된 모델 구축 시스템을 개시할 수 있도록 하기 위한 수단을 포함한다.
도시되고 상기 설명된 시스템 예를 감안하여, 본 발명에 따라 구현된 방법들은 도 3 내지 5의 플로우차트를 참조하여 더 잘 이해될 것이다. 설명을 간략하게 하기 위해, 방법이 블록의 열로서 도시되고 기재되어 있지만, 본 발명은 상기 블록 순서로 한정되지 않고, 일부 블록들은 본 발명에 따라 다른 순서로 배열되거나 여기에 도시되고 기재된 것과 다른 블록들과 동시에 발생될 수도 있다는 것은 자명하다. 또한, 모든 예시된 블록들이 본 발명에 따른 방법을 구현하도록 요구되는 것은 아니다.
본 발명은 하나 이상의 컴포넌트에 의해 실행되는 프로그램 모듈과 같은 컴퓨터-실행가능 명령들의 일반적인 컨텍스트로 기재될 수 있다. 일반적으로, 프로그램 모듈은 특정 태스크를 수행하거나 특정 추상적 데이터 타입을 구현하는 루틴, 프로그램, 오브젝트, 데이터 구조, 등을 포함한다. 통상, 프로그램 모듈의 기능은 다양한 실시에에서 원하는 대로 조합되거나 분산될 수도 있다.
본 발명에서 큰 유연성을 허용하기 위해, 사용자 상호작용이 통합되어 결과적인 차원 모델에 영향을 주어야 한다. 도 3에서, 본 발명의 하나의 양태에 따라 차원 모델을 구성하는 방법(300)의 플로우 다이어그램이 예시되어 있다. 방법(300)은 시작하여(302), 관계 데이터베이스의 표 등과 같은 관계 스키마의 컴포넌트를 라벨링한다(304). 컴포넌트의 라벨링에 대해 임의의 사용자 입력이 가용한지 여부에 관한 결정이 수행된다(306). 사용자 입력이 가용하다면, 사용자 입 력이 통합되고(308), 큐브 구조가 정의된다(310). 그러나, 입력이 가용하지 않는다면, 큐브 구조는 임의의 사용자 입력없이 컴포넌트의 라벨로부터 정의된다(310). 일단 큐브 구조가 정의되면(310), 큐브의 정의에 관한 임의의 사용자 입력이 가용한 지 여부가 결정이 수행된다(312). 사용자 입력이 가용하다면, 이들이 큐브의 정의로 통합되고(314), 큐브가 구축되며(316), 플로우가 종료한다(318). 큐브의 정의에 대한 어떠한 사용자 입력도 가용하지 않는다면(312), 임의의 사용자 입력없이 큐브 정의를 이용하여 큐브가 구축되고(316), 플로우를 종료한다(318). 본 발명의 이러한 양태가 사용자 입력이 수락되는 이산 포인트로 예시되어 있지만, 본 발명의 다른 양태들은 100% 인터렉티브 성능까지 및 이를 포함하는 처리 동안에 임의의 포인트에서 사용자 입력을 수락할 수 있다. 마찬가지로, 프로세스는 사용자에 의한 인터렉티브한 참여가 전혀없이 완전히 자동화될 수 있다.
본 발명의 하나의 양태에 따라 차원 모델을 정의하기 위해, 데이터베이스와 관련된 표 등과 같은 구조는 차원 모델을 구축하는데 도움을 주도록 라벨링되어야 한다. 도 4를 참조하면, 본 발명의 하나의 양태에 따라 차원 모델을 정의하는 방법(400)의 플로우 다이어그램이 도시되어 있다. 방법(400)은 시작하여(402), 파티션 클러스터를 식별한다(404). 단지 "밖으로" 호를 가지는 모든 정점들은 등가 라벨링(즉, 동일한 pk, fk/pk 쌍에 이용되지 않는 측정 타입을 가지는 칼럼의 동일한 갯수)을 가지고 있는 이들 구조를 식별하도록 검토된다. 파티션은 세부 클러스터로 그룹화되고 단일 정점으로서 분석된다. 적절한 파티션이 생성되는 것은 단지 큐브를 실제로 구축하는 때뿐이다. 그리고 나서, 단지 "밖으로" 호를 가지는 모든 구조들이 스트롱 팩트(strong fact)로 라벨링된다(406). 2개 이상의 "안으로" 호를 가지는 모든 구조들은 스트롱 차원으로 라벨링된다(408). 차원으로부터 하나의 "안으로" 호를 가지는 모든 구조들은 스트롱 차원으로 라벨링된다(410). 팩트 표로부터 하나의 "안으로" 호 및 제로 또는 하나의 "밖으로" 호를 가지는 모든 구조들은 스트롱 차원으로 라벨링된다(412). 팩트 구조로부터 정확하게 하나의 "안으로" 호 및 다른 팩트 구조로부터 시작하는 것으로 라벨링된 차원들을 포함하는 클러스터에 들어가는 2개 이상의 호를 가지는 모든 구조들은 차원 및 팩트 모두로 라벨링된다(414). 팩트 표로부터 하나의 "안으로" 호를 가지는 모든 구조들은 차원으로 라벨링되고(416), 플로우를 종료한다(418). 구조는 관계 데이터베이스 등과 같은 관계 스키마에서 발견되는 바와 같은 표 등을 포함한다. 표 타입은 팩트 표, 축퇴 표, 및 차원 표를 포함할 수 있다. 본 기술분야의 숙련자라면, 본 발명의 다른 양태들이 상기 설명한 것보다 더 많거나 더 적은 단계를 가지는 방법을 포함할 수 있고 이것도 또한 본 발명의 범주 내에 든다는 것을 잘 알고 있을 것이다. 유의할 점은, 사용자는 이러한 프로세스 동안에 임의의 포인트에서 상호작용할 수 있다는 점이다.
본 발명의 다른 예들에서, 사용자는 구조 라벨링 시스템을 편집하거나 확대할 수 있다는 것은 자명하다. 이것은 차원 모델을 구성하는 정의 페이즈 동안에 구조의 라벨링을 지배하는 규칙에 영향을 줄 수 있는 진보된 레벨의 상호작용을 사용자에게 허용한다. 이와 같이, 라벨링 스키마가 미조정되어 차원 모델을 자동으로 구성하기 위한 동조된 프로세스를 제공할 수 있다. 본 발명의 또 다른 예에서, 사용자가 차원 모델 구성 동안에 허용되는 상호작용의 정도를 결정하는 사용자 상호작용 레벨을 결정할 수 있도록 허용할 수도 있다. 그러한 레벨은 완전 자동, 제한적 상호작용, 및/또는 완전 상호작용(예를 들면, 수동) 타입 모드를 포함하고, 이들로 제한되지 않는다. 이들 모드들은 단지 라벨링 및 정의 처리로 한정되지 않고, 이하에 설명되는 차원 모델을 구축하는데 적용될 수 있다.
통상, 정의가 데이터베이스로부터 도출되고 임의의 사용자 입력이 고려된 후, 본 발명의 다른 양태는 도출된 정의에 기초하여 차원 모델을 구축한다. 도 5를 보면, 본 발명의 하나의 양태에 따라 차원 모델을 구축하는 방법(500)의 플로우 다이어그램(500)이 도시되어 있다. 방법(500)이 개시되어(502), 팩트 클러스터가 존재하는 것만큼의 디테일을 가지는 큐브를 생성한다(504). 그리고 나서, 다중 파티션이 존재하는지 여부에 관한 결정이 수행된다(506). 단지 하나의 파티션이 존재하고 모든 디테일이 호스트하는 팩트 표의 이름을 유지하고 있다면, 활용되는 이름은 제1 및 하나의 파티션의 이름이다(508). 다중 파티션이 존재하고 모든 디테일이 호스트하는 팩트 표의 이름을 유지하는 경우, 이름은 팩트 표 이름의 공통 서브스트링의 가변 백분율 길이이다(510). 팩트 표의 숫자 칼럼이 존재하는지 여부에 관한 결정이 수행된다(512). 숫자 칼럼이 존재하지 않는 경우, 카운트 측정은 "카운트(*)"의 표현으로 생성된다(514). 그러나, 숫자 칼럼이 실제 존재하는 경우, 팩트 표의 숫자 칼럼은 측정 칼럼이고, 측정은 이들에 대해 생성된다(516). 일단 이것이 달성되면, 모든 디테일이 차원에 링크된다(518). 그리고나서, 팩트 표 내부의 숨겨진 시간 차원들이 모든 디테일에 대해 검출된다(520). 이것은 "(All)-Y-Q-M 계층"을 가지는 시간 차원으로 스팬하는 시간 칼럼을 포함하고, 이는 년별, 분기별 및 월별을 각각 표현한다. 그리고나서, 모든 차원에 대한 실제적이거나 가상의 계층들이 구축된다(522). 그리고 나서, 큐브 구조를 향상시키는 것이 바람직한지 여부에 관한 결정이 수행된다(524). 그렇지 않으면, 플로우가 종료한다(526). 큐브 구조를 향상시키는 것이 바람직하다면, 차원 표 내부의 숨겨진 계층들은 차원 속성의 관심대상 쌍(즉, 함께 일어나는 것으로 통상 연관되는 쌍들)을 분석함으로써 검출되고(528), 플로우를 종료한다(526).
상기 언급한 플로우들은 본 발명의 다양한 방법들의 대표적인 플로우를 의미한다. 이들은 본 발명의 범주내의 모든 반복 및 가변을 모두 포함하지는 않는다. 본 기술분야의 숙련자라면, 방법은 변형을 포함할 수 있고 여전히 본 발명의 범주내에 든다는 것을 잘 알고 있을 것이다.
본 발명은 임의의 원하는 레벨에서의 사용자 상호작용을 허용한다. 이것은 풋내기 사용자가 단일 사용자 액션으로 자동화된 프로세스를 개시할 수 있도록 하고, 전문 사용자가 마음대로 끼어들어 특정 수요를 위해 차원 모델을 세부 조정할 수 있도록 한다. 이러한 레벨의 사용자 상호작용성을 허용하는 하나의 방법은 그래픽 스타일 사용자 인터페이스를 제공하는 것이다. 그러면, 사용자는 본 발명을 용이하게 개시하고, 변경하며, 검토하거나 확대시킬 수 있다. 본 기술분야의 숙련자라면, 다수의 가변 그래픽 인터페이스가 가능하다는 것을 잘 알고 있을 것이다. 본 발명의 단지 하나의 가능한 인터페이스의 예로서, 그래픽 사용자 인터페이스 세트 또는 "프로세스"의 예시가 설명된다. 일반적으로, 사용자 인터페이스는 컴퓨팅 디바이스에 의해 생성되어 사용자에 의한 시각적 참조 및 상호작용을 위해 디스플레이 상에 보여지는 적어도 하나의 그래픽, 종종은 그래픽 세트로 구성된다. 이러한 그래픽 세트는 통상 하나 이상의 그래픽을 포함하더라도 "그래픽 사용자 인터페이스"(GUI)로서 지칭된다. 그러므로, 서브-그래픽, 드롭다운 메뉴 및 표, 선택 디바이스, 및 텍스트 엔트리 박스 등과 같은 컴포넌트들은 모두 그래픽 사용자 인터페이스의 일부로 간주된다.
마찬가지로, 본 발명은 텍스트 기반 사용자 인터페이스와 같은 비-그래픽 사용자 인터페이스를 포함한다. 일반적으로 그래픽 인터페이스와 상호작용하는 것보다 용이하지는 않지만, 텍스트 기반 인터페이스가 본 발명에 의해 채용되어, 임의의 레벨의 사용자 상호작용을 허용하고, 키 스트로크와 같은 단일 사용자 액션이 자동화된 프로세스를 개시할 수 있도록 한다.
도 6을 참조하면, 본 발명의 하나의 양태에 따라 사용자와 상호작용하는 그래픽 사용자 인터페이스 프로세스(600)의 표가 예시되어 있다. 이러한 프로세스(600)는 본 발명에서 채용될 수 있는 다른 그래픽 인터페이스의 개관을 예시하고 있다. 이들 인터페이스의 실제 스크린 샷의 예들은 도 7-21에 도시되어 있다. 일반적으로, 웰컴 단계(602)는 도 7에 예시된 사용자 인터페이스(700)와 같은 사용자를 환영하는 스크린을 띄운다. 이러한 인터페이스(700)는 본 발명의 양태의 목적을 설명하고, 이것과 상호작용하기 위한 사용자를 준비시킨다. 그러면, 큐브 생성 방법 인터페이스 단계(604)는 사용자가 수동 트랙(606) 또는 자동/반자동 트랙(608, 각각 RDBMS/DW 트랙, 관계 데이터베이스 관리 시스템 및 데이터 웨어하우 스)을 선택할 수 있도록 한다. 도 8의 그래픽 사용자 인터페이스(800)는 그러한 인터페이스의 예를 도시하고 있다. 본 인터페이스에서, 사용자는 정의 및 큐브 구축 프로세스 동안에 제안을 수락(본 발명과 상호작용)하도록 선택할 수 있다. 통상, 디폴트는 제안을 허용하도록(즉, 사용자가 상호작용할 수 있도록) 설정된다.
자동/반자동 트랙이 선택되면, 사용자에게는 도 9의 사용자 인터페이스(900)에 도시된 것과 같은 소스 선택 성능(610)이 제공된다. 사용자는 큐브 처리를 기초할 원하는 데이터 소스를 선택할 수 있다. 일단 소스가 선택되면, 관계 및 주요 및 외부 키를 식별하고 잠재적인 팩트 표, 차원 표 및 이들 차원들에 대한 계층을 제안하는 처리로부터의 결과가 사용자에게 제공된다(612). 일반적으로, 처리가 도 10에 도시된 그래픽 사용자 인터페이스(1000)에 예시된 대로 발견됨에 따라, 정보가 사용자에게 제공된다. 프로세스는 선택된 데이터 소스의 각 표에 대한 표 타입을 자동으로 검출하고 제안한다. 그러면, 사용자는 큐브를 생성하는데 필요한 표들만을 선택할 수 있다. 그러한 인터페이스는 도 11에 도시된 그래픽 사용자 인터페이스(1100)에 도시되어 있다. 본 발명의 다른 예에서(도시되지 않음), 표 그래픽 사용자 인터페이스와 반대인, 다이어그램 그래픽 사용자 인터페이스가 사용자에게 제공될 수 있다.
표가 선택된 후, 사용자는 도 12에 도시된 바와 같이 그래픽 사용자 인터페이스(1200)를 통해 이전에 생성된(616) 큐브 정의 차원을 선택하여 첨가될 수 있다. 그러면, 프로세스(600)는 분석으로부터 정보를 취하여 이전에 공급된 데이터로부터 측정 칼럼에 대해 사용자 제안에 보고한다. 사용자는 예를 들면 도 13에 도시된 그래픽 사용자 인터페이스(1300)를 통해 이러한 데이터를 재정의할 수 있다. 통상, 측정들은 측정 그룹 함수에 의해 자동으로 그룹화된다. 이러한 함수는 측정들을 토픽 및 차원 세분성에 의해 그룹화한다. 일반적으로, 그룹화의 디폴트 이름은 표 이름의 인간 판독가능한 버전이다(예를 들면, 밑줄은 이름에서 제거된다). 또한, 그래픽 사용자 인터페이스(1300)를 통해 측정 그룹을 재명명하는 것도 가능하다. 그러면, 프로세스(600)는 차원 및 계층을 생성하는 분석으로부터의 결과를 사용자에게 제공한다(620). 그러한 그래픽 사용자 인터페이스(1400)는 도 14에 도시되어 있다. 사용자는 언제라도 분석을 중지하여 그 시점까지 생성된 계층으로 진행할 수 있다. 분석은 현재의 차원 리스트에 의해 생성된 필터링 이후에 남아있는 모든 차원 표에 대한 계층을 검출한다. 큐브에 가산되는 임의의 현재의 차원에 의해 이용되는 모든 차원 표들은 차원을 생성하는 잠재적인 차원 표의 리스트로부터 제거된다. 다른 차원 표가 자신이 모든 팩트 표로부터 분리된 것을 발견한 경우(임의의 다른 잔여 차원 표를 통한 직접적인 링크 또는 링크가 전혀 없음), 이것이 또한 차원 표 리스트로부터 제거된다. 일단 이러한 프로세스가 완료되면, 차원 리스트가 잔여 차원들로부터 생성된다.
선택적 단계로서, 이전 선택에서 "시간"으로서 정의된 표에 대해 어느 칼럼이 기간을 포함할 지를 지정하는 그래픽 사용자 인터페이스가 사용자에게 제공될 수 있다(622). 도 15에 도시된 그래픽 사용자 인터페이스(1500)는 이것이 사용자에게 제공되는 방법의 예를 도시하고 있다. 그리고나서, 새로운 차원에 대한 계층 및 속성를 자동으로 생성하는 분석으로부터 정보를 중계하는 그래픽 사용자 인터페 이스가 사용자에게 제공된다(624). 사용자는 도 16에 도시된 그래픽 사용자 인터페이스(1600)과 같은 인터페이스내에 이들 파라미터들을 재정의할 수 있다. 사용자는 추가적인 차원들을 생성하거나 분석에 의해 자동으로 공급되는 것들을 편집할 수 있는 능력을 가지고 있다. 일단 모든 파라미터들이 분석에 대해 만족되면, 큐브를 완성하는 그래픽 사용자 인터페이스가 사용자에게 제공된다(626). 예를 들면, 도 17에 도시된 그래픽 사용자 인터페이스(1700)는 사용자가 큐브를 명명하고, 그 구조를 검토하며 큐브를 저장할 수 있도록 한다.
상기 설명은 자동화된 프로세스와 상호작용하기를 원하는 사용자에 관련된 것이다. 그러나, 사용자는 큐브를 수동으로 구성하면서, 동시에 도 6에 도시된 프로세스(600)에 지시된 대로 그래픽 사용자 인터페이스에 의해 지원된다. 수동 트랙(606)은 새로운 수동 측정 정의 인터페이스 생성, 현재의 차원 인터페이스 선택, 새로운 수동 차원 정의 인터페이스 생성, 및 시간 차원 인터페이스 선택적 정의로 구성되는 인터페이스(628)를 포함한다. 전형적인 그래픽 사용자 인터페이스는 그래픽 사용자 인터페이스(1800-2100)에 의해 각각 지칭된 도 18-21에 도시되어 있다. 그러므로, 본 발명은 사용자가 사용자에 의해 요구되는 참여 정도 및 숙련도에 관해 큰 유연성을 가질 수 있도록 한다. 이것은 본 발명을 채용함으로써 엄청난 장점을 허용한다.
그러므로, 본 발명의 하나의 양태는 자동화된 데이터 분석 시스템과 통신하도록 적응된 인터페이스, 상기 인터페이스와 연관되고 적어도 하나의 특성과 관련된 데이터 분석 시스템 내에서 데이터 처리의 표시를 제공하는 적어도 하나의 출 력, 및 차원 모델을 정의하는 방법 및/또는 차원 모델을 구성하는 방법의 사용자 선호도에 적어도 부분적으로는 기초하여 데이터 처리에 영향을 주는 적어도 하나의 입력을 포함한다. 본 발명의 다른 양태에서, 자동화된 데이터 분석 시스템은 관계 데이터 스키마로부터 데이터 상호관계에 기초하여 차원 모델을 정의하기 위한 단순화된 분석 발견적 방법을 활용하는 자동화된 구조 라벨링 시스템, 및 자동화된 구조 라벨링 시스템에 의해 정의된 차원 모델을 구축하기 위한 자동화된 모델 구축 시스템을 포함한다. 본 발명의 또 다른 예에서, 출력은 차원, 속성, 집합 함수, 표 타입, 측정, 및/또는 측정 그룹을 포함한다. 본 발명의 또 다른 예에서, 입력은 차원, 속성, 집합 함수, 표 타입, 측정, 및/또는 측정 그룹을 포함한다. 본 발명의 또 다른 예는 자동화된 구조 라벨링 시스템 및/또는 자동화된 모델 구축 시스템과 같은 단일 사용자 액션을 통해 개시하는 입력을 포함한다.
본 발명의 다양한 양태들을 구현하기 위한 추가 컨텍스트를 제공하기 위해, 도 22 및 이하의 설명은 본 발명의 다양한 양태들이 구현될 수 있는 적절한 컴퓨팅 환경(2200)의 단순하고 일반적인 설명을 제공하려고 한다. 본 발명이 로컬 컴퓨터 및/또는 원격 컴퓨터 상에서 운용되는 컴퓨터 프로그램의 컴퓨터-실행가능 명령의 일반적인 컨텍스트로 상기 설명되었지만, 본 기술분야의 숙련자라면 본 발명은 다른 프로그램 모듈과 조합하여 구현될 수 있다는 것은 자명하다. 일반적으로, 프로그램 모듈은 특정 태스크를 수행하거나 특정 추상적인 데이터 타입을 구현하는 루틴, 프로그램, 컴포넌트, 데이터 구조 등을 포함한다. 더구나, 본 기술분야의 숙련자라면, 본 발명에 따른 방법은 각각이 하나 이상의 연관된 디바이스와 동작성으 로 통신가능한 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 디바이스, 마이크로프로세서 기반 및/또는 프로그램가능한 소비자 전자장치뿐만 아니라 단일 프로세서 또는 멀티-프로세서 컴퓨터 시스템, 미니컴퓨터, 메인프레임 컴퓨터 등을 포함하는 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 잘 알고 있을 것이다. 본 발명의 예시된 양태들은 통신 네트워크를 통해 링크되는 원격 처리 디바이스에 의해 특정 태스크들이 수행되는 분산 컴퓨팅 환경에서 실시될 수도 있다. 그러나, 본 발명의 모두는 아니지만 일부 양태들은 단독 컴퓨터 상에서 실시될 수도 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및/또는 원격 메모리 저장 디바이스에 위치될 수 있다.
본 명세서에 이용되는 바와 같이, "컴포넌트"라는 용어는 컴퓨터 관련 실체, 즉 하드웨어, 하드웨어 및 소프트웨어의 조합, 소프트웨어 또는 실행중인 소프트웨어 중 하나를 지칭하려고 한 것이다. 예를 들면, 컴포넌트는 프로세서 상에서 운용 중인 프로세스, 프로세서, 오브젝트, 실행가능, 실행 스레드, 프로그램 및 컴퓨터일 수 있고, 이들로 제한되지 않는다. 예로써, 서버 상에서 운용중인 어플리케이션 및/또는 서버가 컴포넌트가 될 수 있다. 또한, 컴포넌트는 하나 이상의 서브컴포넌트들을 포함할 수 있다.
도 22를 참조하면, 본 발명의 다양한 양태들을 구현하기 위한 시스템 환경(2200) 예는 처리 유닛(2204), 시스템 메모리(2206), 및 시스템 메모리를 포함하는 다양한 시스템 컴포넌트를 처리 유닛(2204)에 결합시키는 시스템 버스(2208)를 포함하는 종래 컴퓨터(2202)를 포함한다. 처리 유닛(2204)은 임의의 상용으로 가용하거나 전용 프로세서일 수 있다. 또한, 처리 유닛은 병렬로 접속되는 바와 같이, 하나 이상의 프로세서로 형성되는 멀티-프로세서로서 구현될 수 있다.
시스템 버스(2208)는 메모리 버스 또는 메모리 컨트롤러, 주변 버스, 및 몇 개를 지칭하면 PCI, VESA, 마이크로채널, ISA 및 EISA와 같은 다양한 종래 버스 구조 중 임의의 하나를 이용하는 로컬 버스를 포함하는 수개 타입의 버스 구조중 임의의 하나가 될 수 있다. 시스템 메모리(2206)는 판독 전용 메모리(ROM, 2210) 및 랜덤 액세스 메모리(RAM, 2212)를 포함한다. 시동 동안과 같이, 컴퓨터(2202) 내의 소자들간에 정보를 전달하는데 도와주는 기본 루틴을 포함하는 기본 입출력 시스템(BIOS, 2214)이 ROM(2210)에 저장된다.
컴퓨터(2202)는 예를 들면, 제거가능한 디스크(2220)에 판독 및 기록하는 하드 디스크 드라이브(2216), 자기 디스크 드라이브(2218), 및 CD-ROM 디스크(2224) 또는 광학 매체에 기록하고 판독하기 위한 광학 디스크 드라이브(2222)를 포함할 수 있다. 하드 디스크 드라이브(2216), 자기 디스크 드라이브(2218), 및 광학 디스크 드라이브(2222)가 각각 하드 디스크 드라이브 인터페이스(2226), 자기 디스크 드라이브 인터페이스(2228) 및 광학 드라이브 인터페이스(2230)에 의해 시스템 버스(2208)에 접속된다. 드라이브(2216-2222) 및 관련 컴퓨터-판독가능 매체는 컴퓨터(2202)에 대해 데이터, 데이터 구조, 컴퓨터 실행가능한 명령 등의 비휘발성 저장을 제공한다. 상기 컴퓨터 판독가능 매체의 설명은 하드 디스크, 제거가능한 자기 디스크 및 CD를 지칭하고 있지만, 본 기술분야의 숙련자라면, 자기 카세트, 플래시 메모리 카드, 디지털 비디오 디스크, 베르놀리 카트리지 등과 같이, 컴퓨터에 의해 판독가능한 다른 타입의 매체가 오퍼레이팅 환경(2200) 예에 이용될 수 있고 임의의 그러한 매체는 본 발명의 방법을 수행하기 위한 컴퓨터 실행가능 명령들을 포함할 수 있다는 것을 잘 알고 있을 것이다.
오퍼레이팅 시스템(2232), 하나 이상의 어플리케이션 프로그램(2234), 다른 프로그램 모듈(2236), 및 프로그램 데이터(2238)를 포함하는 다수의 프로그램 모듈이 드라이브(2216-2222) 및 RAM(2212)에 저장될 수 있다. 오퍼레이팅 시스템(2232)은 임의의 적절한 오퍼레이팅 시스템 또는 오퍼레이팅 시스템들의 조합일 수 있다. 예를 들어, 어플리케이션 프로그램(2234)은 본 발명의 하나의 양태에 따라 데이터를 활용하는 데이터베이스 분석 시스템 및/또는 인터렉티브한 차원 모델 구축 시스템을 포함할 수 있다. 추가적으로, 프로그램 데이터(2238)는 본 발명의 하나의 양태에 따라 차원 모델을 제어하거나 바이어싱하기 위한 입력 데이터를 포함할 수 있다.
사용자는 키보드(2240) 및 포인팅 디바이스(예를 들면, 마우스(2242))와 같은 하나 이상의 사용자 입력 디바이스를 통해 명령 및 정보를 컴퓨터(2202)에 입력할 수 있다. 다른 입력 디바이스(도시되지 않음)는 마이크로폰, 조이스틱, 게임 패드, 위성 디시, 무선 리모트, 스캐너 등을 포함할 수 있다. 이들 및 다른 입력 디바이스들은 시스템 버스(2208)에 결합되는 직렬 포트 인터페이스(2244)를 통해 처리 유닛(2204)에 접속되지만, 병렬 포트, 게임 포트 또는 범용 직렬 포트(USB)와 같은 다른 인터페이스에 의해 접속될 수 있다. 모니터(2246) 또는 다른 타입의 표시 디바이스는 비디오 어댑터(2248)와 같은 인터페이스를 통해 시스템 버스(2208) 에 접속된다. 모니터(2246)뿐만 아니라, 컴퓨터(2202)는 스피커, 프린터 등과 같은 다른 주변 출력 디바이스(도시되지 않음)를 포함할 수 있다.
컴퓨터(2202)는 하나 이상의 원격 컴퓨터(2260)로의 논리적 접속을 이용하여 네트워킹된 환경에서 동작할 수 있다는 것은 자명하다. 원격 컴퓨터(2260)는 워크스테이션, 서버 컴퓨터, 라우터, 피어 디바이스 또는 다른 공통 네트워크 노드일 수 있고, 간단함을 위해 단지 메모리 저장 디바이스(2262)만이 도 22에 예시되어 있지만, 컴퓨터(2202)에 대해 기재된 요소들 중 다수 또는 모두를 포함한다. 도 22에 도시된 논리적 접속은 로컬 영역 네트워크(LAN, 2264) 및 와이드 영역 네트워크(WAN, 2266)를 포함할 수 있다. 그러한 네트워킹 환경은 사무실, 기업-와이드 컴퓨터 네트워크, 인트라넷 및 인터넷에서 흔한 것이다.
LAN 네트워킹 환경에서 이용되는 경우, 예를 들면, 컴퓨터(2202)는 네트워크 인터페이스 또는 어댑터(2268)를 통해 로컬 네트워크(2264)에 접속된다. WAN 네트워킹 환경에 이용되는 경우, 컴퓨터(2202)는 모뎀(예를 들면, 전화, DSL, 케이블, 등)을 포함하거나, LAN 상에서 통신 서버에 접속되거나, 인터넷과 같이 WAN(2266)을 통해 통신을 확립하기 위한 다른 수단을 가지고 있다. 컴퓨터(2202)에 대해 내부 또는 외부에 존재할 수 있는 모뎀(2270)은 직렬 포트 인터페이스(2244)를 통해 시스템 버스(2208)에 접속된다. 네트워킹된 환경에서, 프로그램 모듈(어플리케이션 프로그램(2234)을 포함함) 및/또는 프로그램 데이터(2238)는 원격 메모리 저장 디바이스(2262)에 저장될 수 있다. 도시된 네트워크 접속은 예로 든 것이고 컴퓨터(2202 및 2260)간에 통신 링크를 확립하는 다른 수단(예를 들면, 유선 또는 무 선)이 본 발명의 하나의 양태를 실행할 때 이용될 수 있다는 것은 자명하다.
컴퓨터 프로그래밍 분야에서 숙련된 기술자들의 관례에 따라, 달리 지적되지 않은 경우, 본 발명이 컴퓨터(2202) 또는 원격 컴퓨터(2260)와 같은 컴퓨터에 의해 수행되는 액트 및 오퍼레이션의 심볼 표현을 참조하여 설명되었다. 그러한 액트 및 오퍼레이션들은 종종 컴퓨터 실행되는 것으로서 지칭된다. 액트 및 심볼적으로 표현된 오퍼레이션은 전기적 신호 표현의 결과적인 변형 또는 감축을 유발하는 데이터 비트를 나타내는 전기 신호의 처리 유닛(2204)에 의한 조작, 및 메모리 시스템(시스템 메모리(2206), 하드 드라이브(2216), 플로피 디스크(2220), CD-ROM(2224), 및 원격 메모리(2262)를 포함함)내의 메모리 위치에서 데이터 비트의 유지를 포함하여, 다른 신호 처리뿐만 아니라 컴퓨터 시스템의 오퍼레이션을 재구성하거나 또는 다르게는 변경할 수 있다는 것은 자명하다. 그러한 데이터 비트가 유지되는 메모리 위치는 데이터 비트에 대응하는 특정 전기적, 자기적 또는 광학적 속성을 가지는 물리적 위치이다.
도 23은 본 발명이 상호작용할 수 있는 컴퓨팅 환경(2300) 예의 다른 블록도이다. 시스템(2300)은 하나 이상의 클라이언트(들)(2302)를 포함하는 시스템을 더 예시하고 있다. 클라이언트(2302)는 하드웨어 및/또는 소프트웨어(예를 들면, 스레드, 프로세스, 컴퓨팅 디바이스)일 수 있다. 시스템(2300)은 또한 하나 이상의 서버(2304)를 포함한다. 서버(2304)는 하드웨어 및/또는 소프트웨어(예를 들면, 스레드, 프로세스, 컴퓨팅 디바이스)일 수 있다. 서버(2304)는 예를 들면 본 발명을 채용함으로써 변형을 수행하는 스레드를 하우징할 수 있다. 클라이언트(2302)와 서버(2304) 간의 하나의 가능한 통신은 2개 이상의 컴퓨터 프로세스들 사이에서 송신되도록 적응되는 데이터 패킷의 형태일 수 있다. 시스템(2300)은 클라이언트(2302)와 서버(2304)간의 통신을 용이하게 하도록 채용될 수 있는 통신 프레임워크(2308)를 포함한다. 클라이언트(2302)는 정보를 클라이언트(2302)에 로컬로 저장하도록 채용될 수 있는 하나 이상의 클라이언트 데이터 저장소(2310)에 동작가능하게 접속된다. 마찬가지로, 서버(2304)는 정보를 서버(2304)에 로컬로 저장하도록 채용될 수 있는 하나 이상의 서버 데이터 저장소(2306)에 동작가능하게 접속된다.
본 발명의 하나의 예에서, 데이터 분석을 용이하게 하는 2개 이상의 컴퓨터 컴포넌트 사이에 송신된 데이터 패킷은, 관계 데이터 스키마(예를 들면 관계 데이터베이스)로부터의 데이터 상호관계에 기초하여 차원 모델(예를 들면, OLAP 오브젝트, ROLAP 오브젝트, 및 MOLAP 오브젝트 등)을 정의하기 위한 단순화된 분석 발견적방법을 활용한 자동화된 구조 라벨링 시스템으로부터의 데이터, 자동화된 구조 라벨링 시스템에 의해 정의된 차원 모델을 구성하기 위한 자동화된 모델 구축 시스템으로부터의 데이터, 자동화된 구조 라벨링 시스템 및/또는 자동화된 모델 구축 시스템과 같이 단일 사용자 액션을 통해 개시하는 입력으로부터의 데이터(예를 들면, 컴퓨터 마우스 클릭으로부터의 데이터), 데이터 분석의 데이터 처리 표시를 제공하는 인터페이스와 연관된 출력으로부터의 데이터(그래픽 사용자 인터페이스에 대한 데이터), 및/또는 차원 모델을 정의하는 방법 및/또는 차원 모델을 구성하는 방법의 사용자 선호도에 적어도 부분적으로 기초하여 데이터 처리에 영향을 미치는 인터페이스와 연관된 입력으로부터의 데이터에 부분적으로 기초하는 차원 모델 분석 데이터를 포함한다.
본 발명의 다른 예에서, 데이터 분석을 용이하게 하기 위한 시스템의 컴퓨터 실행가능 컴포넌트를 저장하는 컴퓨터 판독가능 매체는 관계 데이터 스키마(예를 들면 관계 데이터베이스)로부터의 데이터 상호관계에 기초하여 차원 모델(예를 들면, OLAP 오브젝트, ROLAP 오브젝트, 및 MOLAP 오브젝트 등)을 정의하기 위한 단순화된 분석 발견적방법을 활용한 자동화된 구조 라벨링 시스템으로부터의 데이터, 자동화된 구조 라벨링 시스템에 의해 정의된 차원 모델을 구성하기 위한 자동화된 모델 구축 시스템으로부터의 데이터, 자동화된 구조 라벨링 시스템 및/또는 자동화된 모델 구축 시스템과 같이 단일 사용자 액션을 통해 개시하는 입력으로부터의 데이터(예를 들면, 컴퓨터 마우스 클릭으로부터의 데이터), 데이터 분석의 데이터 처리 표시를 제공하는 인터페이스와 연관된 출력으로부터의 데이터(그래픽 사용자 인터페이스에 대한 데이터), 및/또는 차원 모델을 정의하는 방법 및/또는 차원 모델을 구성하는 방법의 사용자 선호도에 적어도 부분적으로 기초하여 데이터 처리에 영향을 미치는 인터페이스와 연관된 입력으로부터의 데이터에 적어도 부분적으로 기초하여, 데이터 세트와 연관된 정보를 제공하는 자동화된 데이터 분석 시스템을 포함한다.
본 발명의 장치, 시스템 및/또는 방법들은 컴퓨터 컴포넌트 및 컴퓨터 비관련 컴포넌트를 용이하게 하는 데이터 분석 스킴에서 동일하게 활용될 수 있다는 것은 자명하다. 또한, 본 기술분야의 숙련자라면, 본 발명의 장치, 시스템 및/또는 방법은 컴퓨터, 서버 및/또는 핸드헬드 전자 디바이스 등을 포함하고 이들로 제한되지 않는 광범위한 전자 관련 기술 분야에 채용될 수 있다는 것을 잘 알고 있을 것이다.
상기 설명한 것은 본 발명의 예들을 포함한다. 물론, 본 발명을 설명하기 위해 모든 고안가능한 컴포넌트 조합 또는 방법을 설명할 수는 없지만, 본 기술분야의 숙련자라면, 본 발명의 추가 조합 및 치환이 가능하다는 것을 잘 알고 있을 것이다. 따라서, 본 발명은 이하에 첨부된 특허청구범위의 사상과 범주내에 드는 모든 변경, 변형 및 변동을 포함한다. 또한, "포함한다(include)"라는 용어가 상세한 설명이나 특허청구범위에 이용되는 한, 그러한 용어는 "포함하는(comprising)"이 청구항에서 전조어로서 채용될 때와 같이 용어 "포함하는(comprising)"과 동일한 방식으로 내재적인 것을 의미한다.
본 발명에 따르면, 데이터베이스 정보를 MOLAP(다차원 OLAP) 및/또는 ROLAP(관계 OLAP) 오브젝트 등과 같은 OLAP 오브젝트 와 같은 차원 모델로 자동으로 변환함으로써, 사용자는 컴퓨터 마우스의 한 번 클릭으로 모델을 구축하거나 구성 동안에 모델의 구축에 인터렉티브하게 영향을 줄 수 있는 능력을 얻을 수 있다. 본 발명은 모델을 자동으로 정의하고 사용자가 모델을 구축하기 전에 정의를 인터렉티브하게 변경할 수 있도록 허용함으로써, OLAP 도구와 함께 사용하기 위해 개발하는 오브젝트의 더 빠르고 더 사용자-친숙한 방법 및 시스템을 제공한다.
본 발명은 차원 모델을 정의하는데 필요한 요구되는 기술 레벨을 감소시킴으로써 데이터 분석을 용이하게 하고 또한 모델 정의에서 사람에 의한 에러의 양을 감소시킨다. 모델을 정의하는 지루함을 줄이면서도, 본 발명은 사용자 인터렉션을 허가하여 고급 사용자들이 자동화된 특징으로부터 잇점을 가질 수 있고 여전히 결과에 영향을 줄 수 있음으로써, 전문가 사용자를 제한시키지 않고 사용자의 더 넓은 경험 기반을 허용한다. 본 발명은 또한 차원 모델의 구축과는 별개로 차원 모델의 정의가 제어될 수 있도록 하는 멀티-페이즈의 접근법을 제공한다. 이와 같이, 프로세스의 전체 또는 일부는 사용자 인터페이스를 통해 자동화되거나 인터렉티브하게 영향을 받을 수 있다. 이러한 유연성은 차원 모델의 개발 시간을 급격하게 감소시키고, 동시에 상호작용을 가능하게 하여, 사용자가 모델을 신속하게 구축하고 필요한 대로 적응할 수 있게 하며, 사용자-친숙도를 최대화하고, 모델 개발 속도를 증가시키며, 신뢰할 만하고 높은 무결성의 OLAP 오브젝트를 제공한다.

Claims (48)

  1. 데이터 분석 시스템에 있어서,
    관계 데이터 스키마(relational data schema)로부터의 데이터 상호관계(data interrelation)에 기초하여 차원 모델(dimensional model)을 정의하기 위해 단순화된 분석 발견법(simplified analysis heuristics)을 활용하는 자동화된 구조 라벨링 시스템(automated structure labeling system); 및
    상기 자동화된 구조 라벨링 시스템에 의해 정의되는 차원 모델을 구성하기 위한 자동화된 모델 구축 시스템
    을 포함하는 데이터 분석 시스템.
  2. 제1항에 있어서,
    사용자가 상기 자동화된 구조 라벨링 시스템 및 상기 자동화된 모델 구축 시스템으로 구성되는 그룹으로부터 선택된 적어도 하나와 상호작용할 수 있도록 해주는 사용자 인터페이스 컴포넌트를 더 포함하는 데이터 분석 시스템.
  3. 제2항에 있어서, 상기 사용자 인터페이스 컴포넌트는 그래픽 사용자 인터페이스를 포함하는 데이터 분석 시스템.
  4. 제1항에 있어서,
    사용자가 상기 자동화된 구조 라벨링 시스템 및 상기 자동화된 모델 구축 시스템으로 구성되는 그룹으로부터 선택된 적어도 하나를 단일 사용자 액션을 통해 개시할 수 있도록 해주는 입력 컴포넌트를 더 포함하는 데이터 분석 시스템.
  5. 제4항에 있어서, 상기 입력 컴포넌트는 단일 컴퓨터 마우스 클릭을 포함하는 데이터 분석 시스템.
  6. 제1항에 있어서, 상기 관계 데이터 스키마는 관계 데이터베이스를 포함하는 데이터 분석 시스템.
  7. 제1항에 있어서, 상기 차원 모델은 OLAP 오브젝트, ROLAP 오브젝트, 및 MOLAP 오브젝트로 구성되는 그룹에서 선택된 적어도 하나를 포함하는 데이터 분석 시스템.
  8. 데이터 분석 방법에 있어서,
    단순화된 분석 발견법을 활용하여 관계 데이터 스키마로부터의 데이터 상호관계에 기초하여 자동으로 차원 모델을 정의하는 단계를 포함하는 데이터 분석 방법.
  9. 제8항에 있어서,
    상기 차원 모델을 정의한 후에 상기 차원 모델을 자동으로 구축하는 단계를 더 포함하는 데이터 분석 방법.
  10. 제8항에 있어서,
    사용자가 상기 차원 모델의 정의를 단일 사용자 액션을 통해 개시할 수 있도록 해주는 수단을 제공하는 단계를 더 포함하는 데이터 분석 방법.
  11. 제9항에 있어서,
    사용자가 차원 모델의 정의, 차원 모델의 구축, 및 차원 모델의 정의 및 구축으로 구성되는 그룹에서 선택된 적어도 하나를 단일 사용자 액션을 통해 개시할 수 있도록 해주는 수단을 제공하는 단계를 더 포함하는 데이터 분석 방법.
  12. 제8항에 있어서, 상기 차원 모델의 적어도 하나의 구조 및 적어도 하나의 특성을 사용자에게 인터렉티브하게 제공하는 단계를 더 포함하는 데이터 분석 방법.
  13. 제12항에 있어서, 상기 구조는 적어도 하나의 팩트 표(fact table), 적어도 하나의 축퇴 표(degenerate table), 및 적어도 하나의 차원 표(dimension table)로 구성되는 그룹으로부터 선택된 적어도 하나를 포함하는 데이터 분석 방법.
  14. 제12항에 있어서, 상기 특성은 적어도 하나의 차원, 적어도 하나의 속성, 적어도 하나의 측정, 및 적어도 하나의 측정 그룹으로 구성되는 그룹에서 선택된 적어도 하나를 포함하는 데이터 분석 방법.
  15. 제8항에 있어서, 상기 차원 모델을 정의하는 것을 용이하게 하는 사용자 입력을 채용하는 단계를 더 포함하는 데이터 분석 방법.
  16. 제15항에 있어서, 상기 사용자 입력은 전체 자동, 제한된 상호작용, 및 완전 상호작용 모드들로 구성되는 그룹으로부터 선택된 적어도 하나를 포함하는 사용자 상호작용 레벨을 적어도 부분적으로 포함하는 데이터 분석 방법.
  17. 제9항에 있어서, 상기 차원 모델을 구축하는 것을 용이하게 하는 사용자 입력을 채용하는 단계를 더 포함하는 데이터 분석 방법.
  18. 제17항에 있어서, 상기 사용자 입력은 전체 자동, 제한된 상호작용, 및 완전 상호작용 모드들로 구성되는 그룹으로부터 선택된 적어도 하나를 포함하는 사용자 상호작용 레벨을 적어도 부분적으로 포함하는 데이터 분석 방법.
  19. 제8항에 있어서, 상기 관계 데이터 스키마는 관계 데이터베이스를 포함하는 데이터 분석 방법.
  20. 제8항에 있어서, 상기 차원 모델을 정의하는 단계는,
    상기 차원 모델의 적어도 하나의 구조를, 스토롱 팩트, 스트롱 차원, 팩트 및 차원 둘 다, 차원, 팩트로 구성되는 그룹에서 선택된 적어도 하나로서 라벨링하는 단계를 포함하는 데이터 분석 방법.
  21. 제20항에 있어서, 상기 구조는 표를 포함하는 데이터 분석 방법.
  22. 제20항에 있어서, 상기 라벨링 단계는
    단지 밖으로 호(out arcs)를 가지는 구조를 포함하는 스트롱 팩트들,
    적어도 2개의 안으로 호(in arcs)를 가지는 구조, 차원으로부터 하나의 안으로 호를 가지는 구조, 및 팩트 구조로부터 하나의 안으로 호 및 제로 및 하나의 밖으로 호들로 구성되는 그룹에서 선택된 적어도 하나를 가지는 구조로 구성되는 그룹에서 선택되는 적어도 하나를 포함하는 스트롱 차원들,
    팩트 구조에서 하나의 안으로 호 및 다른 팩트 구조로부터 개시함으로써 라벨링되는 차원들을 포함하는 클러스터로의 적어도 2개의 호를 가지는 구조를 포함하는 팩트 및 차원 둘 다, 및
    팩트 구조로부터 하나의 안으로 호를 가지는 구조를 포함하는 차원들
    로 구성되는 그룹에서 선택된 적어도 하나에 기초하는 데이터 분석 방법.
  23. 제20항에 있어서, 단지 밖으로 호를 가지는 정점에 대해 등가 라벨링을 가지는 구조를 식별함으로써 파티션들의 클러스터들을 결정하는 단계를 더 포함하는 데이터 분석 방법.
  24. 제23항에 있어서, 상기 등가 라벨링은 외부 키/주요 키 쌍에 이용되지 않는 측정 타입을 가지는 동일한 주요 키 및 동일한 칼럼의 개수(identical cardinalities of columns)를 포함하는 데이터 분석 방법.
  25. 제23항에 있어서, 디테일 클러스터들의 파티션들을 그룹화하여 단일 정점으로서 분석하는 단계를 더 포함하는 데이터 분석 방법.
  26. 제9항에 있어서, 상기 차원 모델을 구축하는 단계는,
    팩트 클러스터만큼 다수의 디테일들을 생성하는 단계;
    팩트 구조 이름을 해당 팩트 구조가 상주하는 디테일에 저장하는 단계;
    팩트 구조의 디테일 내부에 숫자 칼럼들을 측정 칼럼들로서 정의하고, 상기 측정 칼럼들에 대한 측정을 생성하는 단계;
    팩트 구조의 디테일 내부에 어떠한 숫자 칼럼들도 존재하지 않을 때 카운트 측정을 생성하는 단계;
    디테일들을 차원들에 링크하는 단계;
    팩트 구조 내부에서 숨겨진 시간 차원들을 검출하는 단계;
    임의의 다른 디테일보다 더 많은 측정을 가지는 디테일에 기초하여 차원 모델을 명명하는 단계; 및
    적어도 하나의 차원에 대한 실제적인 계층 및 가상적 계층으로 구성되는 그룹에서 선택된 적어도 하나를 구축하는 단계
    를 포함하는 데이터 분석 방법.
  27. 제8항에 있어서, 상기 차원 모델은 OLAP 오브젝트, ROLAP 오브젝트, 및 MOLAP 오브젝트로 구성되는 그룹에서 선택된 적어도 하나를 포함하는 데이터 분석 방법.
  28. 데이터 분석 시스템에 있어서,
    관계 데이터 스키마로부터의 데이터 상호관계에 기초하여 차원 모델을 정의하기 위해 단순화된 분석 발견법을 활용하기 위한 수단; 및
    자동화된 구조 라벨링 시스템에 의해 정의된 차원 모델을 구축하기 위한 수단
    을 포함하는 데이터 분석 시스템.
  29. 제28항에 있어서,
    사용자가 자동화된 구조 라벨링 시스템 및 자동화된 모델 구축 시스템으로 구성되는 그룹으로부터 선택되는 적어도 하나와 상호작용할 수 있도록 해주는 수단을 더 포함하는 데이터 분석 시스템.
  30. 제28항에 있어서,
    사용자가 자동화된 구조 라벨링 시스템 및 자동화된 모델 구축 시스템으로 구성되는 그룹으로부터 선택되는 적어도 하나를 단일 사용자 액션으로 개시할 수 있도록 해주는 수단을 더 포함하는 데이터 분석 시스템.
  31. 사용자 인터페이스를 제공하기 위한 컴퓨터 실행가능 명령어들이 저장되어 있는 컴퓨터 판독가능 기록 매체에 있어서,
    상기 사용자 인터페이스는,
    자동화된 데이터 분석 시스템과 통신하도록 적응된 인터페이스;
    상기 인터페이스와 연관되어, 적어도 하나의 특성과 관련된 상기 데이터 분석 시스템 내의 데이터 처리의 표시를 제공하는 적어도 하나의 출력; 및
    차원 모델을 정의하는 방식 및 차원 모델을 구성하는 방식으로 구성되는 그룹에서 선택된 적어도 하나의 사용자의 선호도에 적어도 부분적으로 기초하여 데이터 처리에 영향을 미치는 적어도 하나의 입력
    을 포함하는 컴퓨터 판독가능 기록 매체.
  32. 제31항에 있어서, 상기 자동화된 데이터 분석 시스템은,
    관계 데이터 스키마로부터의 데이터 상호관계에 기초하여 차원 모델을 정의하기 위해 단순화된 분석 발견법을 활용하는 자동화된 구조 라벨링 시스템; 및
    상기 자동화된 구조 라벨링 시스템에 의해 정의된 차원 모델을 구성하기 위한 자동화된 모델 구축 시스템
    으로 구성되는 그룹에서 선택된 적어도 하나를 포함하는 컴퓨터 판독가능 기록 매체.
  33. 제31항에 있어서, 상기 출력은 차원, 속성, 집합 함수(aggregate function), 표 타입, 측정, 및 측정 그룹으로 구성되는 그룹에서 선택된 적어도 하나를 포함하는 컴퓨터 판독가능 기록 매체.
  34. 제31항에 있어서, 상기 입력은 차원, 속성, 집합 함수, 표 타입, 측정, 및 측정 그룹으로 구성되는 그룹에서 선택된 적어도 하나를 포함하는 컴퓨터 판독가능 기록 매체.
  35. 제32항에 있어서, 상기 사용자 인터페이스는 상기 자동화된 구조 라벨링 시스템 및 상기 자동화된 모델 구축 시스템으로 구성되는 그룹에서 선택된 적어도 하나를 단일 사용자 액션으로 개시하는 입력을 더 포함하는 컴퓨터 판독가능 기록 매체.
  36. 제31항에 있어서, 상기 사용자 인터페이스는 그래픽 사용자 인터페이스 및 텍스트 기반 인터페이스로 구성되는 그룹에서 선택된 적어도 하나를 포함하는 컴퓨터 판독가능 기록 매체.
  37. 데이터 분석을 용이하게 하는 2개 이상의 컴퓨터 컴포넌트 사이에 송신되는 데이터 패킷을 저장하고 있는 컴퓨터 판독가능 기록 매체에 있어서,
    상기 데이터 패킷은,
    관계 데이터 스키마로부터의 데이터 상호관계에 기초하여 차원 모델을 정의하기 위해 단순화된 분석 발견법을 활용하는 자동화된 구조 라벨링 시스템으로부터의 데이터;
    상기 자동화된 구조 라벨링 시스템에 의해 정의된 차원 모델을 구성하기 위한 자동화된 모델 구축 시스템으로부터의 데이터;
    상기 자동화된 구조 라벨링 시스템 및 상기 자동화된 모델 구축 시스템으로 구성되는 그룹에서 선택된 적어도 하나를 단일 사용자 액션을 통해 개시하는 입력으로부터의 데이터;
    데이터 분석의 데이터 처리의 표시를 제공하는 인터페이스와 연관된 출력으로부터의 데이터; 및
    차원 모델을 정의하는 방식 및 차원 모델을 구성하는 방식으로 구성되는 그룹에서 선택된 적어도 하나의 사용자 선호도에 적어도 부분적으로 기초하여 데이터 처리에 영향을 미치는 인터페이스와 연관된 입력으로부터의 데이터
    로 구성되는 그룹에서 선택된 적어도 하나에 부분적으로 기초하는 차원 모델 분석 데이터를 포함하는 컴퓨터 판독가능 기록 매체.
  38. 제37항에 있어서, 상기 단일 사용자 액션을 통해 개시하는 입력은 컴퓨터 마우스 클릭으로부터의 데이터를 포함하는 컴퓨터 판독가능 기록 매체.
  39. 제37항에 있어서, 상기 인터페이스와 연관된 출력은 그래픽 사용자 인터페이스에 대한 데이터를 포함하는 컴퓨터 판독가능 기록 매체.
  40. 제37항에 있어서, 상기 관계 데이터 스키마는 관계 데이터베이스를 포함하는 컴퓨터 판독가능 기록 매체.
  41. 제37항에 있어서, 상기 차원 모델은 OLAP 오브젝트, ROLAP 오브젝트, 및 MOLAP 오브젝트로 구성되는 그룹에서 선택된 적어도 하나를 포함하는 컴퓨터 판독가능 기록 매체.
  42. 데이터 분석을 용이하게 하기 위한 시스템의 컴퓨터 실행가능 컴포넌트를 저장하는 컴퓨터 판독가능 기록 매체에 있어서,
    관계 데이터 스키마로부터의 데이터 상호관계에 기초하여 차원 모델을 정의하기 위해 단순화된 분석 발견법을 활용하는 자동화된 구조 라벨링 시스템;
    상기 자동화된 구조 라벨링 시스템에 의해 정의된 차원 모델을 구성하기 위한 자동화된 모델 구축 시스템;
    상기 자동화된 구조 라벨링 시스템 및 상기 자동화된 모델 구축 시스템으로 구성되는 그룹에서 선택된 적어도 하나를 단일 사용자 액션을 통해 개시하는 입력;
    상기 자동화된 데이터 분석 시스템의 데이터 처리의 표시를 제공하는 인터페이스와 연관된 출력; 및
    차원 모델을 정의하는 방식 및 차원 모델을 구성하는 방식으로 구성되는 그룹에서 선택된 적어도 하나의 사용자 선호도에 적어도 부분적으로 기초하여 자동화된 데이터 처리에 영향을 미치는 인터페이스와 연관된 입력
    으로 구성되는 그룹에서 선택된 적어도 하나에 부분적으로 기초하여, 데이터 세트와 연관된 정보를 제공하는 자동화된 데이터 분석 시스템을 포함하는 컴퓨터 판독가능 기록 매체.
  43. 제42항에 있어서, 상기 단일 사용자 액션을 통해 개시하는 입력은 컴퓨터 마우스 클릭으로부터의 데이터를 포함하는 컴퓨터 판독가능 기록 매체.
  44. 제42항에 있어서, 상기 인터페이스와 연관된 출력은 그래픽 사용자 인터페이스에 대한 데이터를 포함하는 컴퓨터 판독가능 기록 매체.
  45. 제42항에 있어서, 상기 관계 데이터 스키마는 관계 데이터베이스를 포함하는 컴퓨터 판독가능 기록 매체.
  46. 제42항에 있어서, 상기 차원 모델은 OLAP 오브젝트, ROLAP 오브젝트, 및 MOLAP 오브젝트로 구성되는 그룹에서 선택된 적어도 하나를 포함하는 컴퓨터 판독가능 기록 매체.
  47. 제8항의 방법을 채용하는 디바이스에 있어서, 컴퓨터, 서버, 및 핸드헬드 전자 디바이스로 구성되는 그룹에서 적어도 하나를 포함하는 디바이스.
  48. 제1항의 시스템을 채용하는 디바이스에 있어서, 컴퓨터, 서버, 및 핸드헬드 전자 디바이스로 구성되는 그룹에서 적어도 하나를 포함하는 디바이스.
KR1020040021008A 2003-03-28 2004-03-27 단순화된 분석 발견법을 이용한 자동화된 차원 모델 정의 및 구축을 위한 데이터 분석 시스템, 방법, 디바이스 및 컴퓨터 판독가능 기록 매체 KR101017504B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/402,026 US20040193633A1 (en) 2003-03-28 2003-03-28 Systems, methods, and apparatus for automated dimensional model definitions and builds utilizing simplified analysis heuristics
US10/402,026 2003-03-28

Publications (2)

Publication Number Publication Date
KR20040085044A KR20040085044A (ko) 2004-10-07
KR101017504B1 true KR101017504B1 (ko) 2011-02-25

Family

ID=32825035

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040021008A KR101017504B1 (ko) 2003-03-28 2004-03-27 단순화된 분석 발견법을 이용한 자동화된 차원 모델 정의 및 구축을 위한 데이터 분석 시스템, 방법, 디바이스 및 컴퓨터 판독가능 기록 매체

Country Status (5)

Country Link
US (1) US20040193633A1 (ko)
EP (1) EP1462957A3 (ko)
JP (1) JP5025891B2 (ko)
KR (1) KR101017504B1 (ko)
CN (1) CN1551015B (ko)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7225200B2 (en) * 2004-04-14 2007-05-29 Microsoft Corporation Automatic data perspective generation for a target variable
US8762191B2 (en) * 2004-07-02 2014-06-24 Goldman, Sachs & Co. Systems, methods, apparatus, and schema for storing, managing and retrieving information
JP2006053745A (ja) * 2004-08-11 2006-02-23 Saora Inc データ処理方法及びその装置、及びそのプログラム
US20060074928A1 (en) * 2004-09-28 2006-04-06 Microsoft Corporation Selection based container listing
US7418438B2 (en) * 2004-11-30 2008-08-26 International Business Machines Corporation Automated default dimension selection within a multidimensional enterprise software system
US7593955B2 (en) * 2004-11-30 2009-09-22 International Business Machines Corporation Generation of aggregatable dimension information within a multidimensional enterprise software system
US7610300B2 (en) * 2004-11-30 2009-10-27 International Business Machines Corporation Automated relational schema generation within a multidimensional enterprise software system
US7505888B2 (en) * 2004-11-30 2009-03-17 International Business Machines Corporation Reporting model generation within a multidimensional enterprise software system
US7548925B2 (en) * 2005-01-24 2009-06-16 Microsoft Corporation Diagrammatic access and arrangement of data
US7958456B2 (en) * 2005-12-23 2011-06-07 Apple Inc. Scrolling list with floating adjacent index symbols
US20070162493A1 (en) * 2005-12-30 2007-07-12 Matthias Schmitt Business object duplicates
WO2007095959A1 (en) * 2006-02-24 2007-08-30 Timextender A/S Method for generating data warehouses and olap cubes
US8239379B2 (en) * 2007-07-13 2012-08-07 Xerox Corporation Semi-supervised visual clustering
JP5252388B2 (ja) * 2007-11-20 2013-07-31 国立大学法人大阪大学 多次元データ分析方法、多次元データ分析装置、及びプログラム
US20090327339A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Partition templates for multidimensional databases
KR101055556B1 (ko) * 2009-02-09 2011-08-08 고려대학교 산학협력단 누적 및 비누적 확산 모형을 이용한 기술 수요 예측 장치 및 방법
US8688748B2 (en) * 2010-01-21 2014-04-01 Siemens Product Lifecycle Management Software Inc. Adaptive table sizing for multiple-attribute parameters
US20110307281A1 (en) * 2010-06-11 2011-12-15 Satterfield & Pontikes Construction, Inc. Model inventory manager
JP5706137B2 (ja) * 2010-11-22 2015-04-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 複数の投稿(データのグループ)を複数の軸に沿ってリアルタイムにコンピュータ画面に表示する方法およびコンピュータ・プログラム
US8965895B2 (en) 2012-07-30 2015-02-24 International Business Machines Corporation Relationship discovery in business analytics
CN103020143B (zh) * 2012-11-21 2016-12-21 用友网络科技股份有限公司 合并单元格的装置和方法
US9626388B2 (en) 2013-09-06 2017-04-18 TransMed Systems, Inc. Metadata automated system
US10204150B2 (en) * 2014-03-21 2019-02-12 Sap Se Simplified hierarchy definition for multidimensional data analysis
US10977266B2 (en) * 2014-08-27 2021-04-13 Sap Se Ad-hoc analytical query of graph data
US10733155B2 (en) 2015-10-23 2020-08-04 Oracle International Corporation System and method for extracting a star schema from tabular data for use in a multidimensional database environment
CN107483517B (zh) * 2016-06-07 2019-10-29 中国移动通信有限公司研究院 一种控制方法、系统、服务器及终端
CN111026817B (zh) * 2019-12-09 2023-11-28 北京中电普华信息技术有限公司 一种多维计算方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819086A (en) 1995-06-07 1998-10-06 Wall Data Incorporated Computer system for creating semantic object models from existing relational database schemas
JP2001265783A (ja) 2000-03-23 2001-09-28 Nec Corp スタースキーマ検索方式およびそのプログラム記録媒体
KR20030022663A (ko) * 2001-09-10 2003-03-17 한국과학기술원 영역-합 질의를 위한 동적 업데이트 큐브와 하이브리드질의 검색방법
US6768986B2 (en) 2000-04-03 2004-07-27 Business Objects, S.A. Mapping of an RDBMS schema onto a multidimensional data model

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978788A (en) * 1997-04-14 1999-11-02 International Business Machines Corporation System and method for generating multi-representations of a data cube
US5940818A (en) * 1997-06-30 1999-08-17 International Business Machines Corporation Attribute-based access for multi-dimensional databases
US5905985A (en) * 1997-06-30 1999-05-18 International Business Machines Corporation Relational database modifications based on multi-dimensional database modifications
US5943668A (en) * 1997-06-30 1999-08-24 International Business Machines Corporation Relational emulation of a multi-dimensional database
US6205477B1 (en) * 1998-10-20 2001-03-20 Cisco Technology, Inc. Apparatus and method for performing traffic redirection in a distributed system using a portion metric
AU2851600A (en) * 1999-01-15 2000-08-01 Metaedge Corporation Method for visualizing information in a data warehousing environment
US6385604B1 (en) * 1999-08-04 2002-05-07 Hyperroll, Israel Limited Relational database management system having integrated non-relational multi-dimensional data store of aggregated data elements

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819086A (en) 1995-06-07 1998-10-06 Wall Data Incorporated Computer system for creating semantic object models from existing relational database schemas
JP2001265783A (ja) 2000-03-23 2001-09-28 Nec Corp スタースキーマ検索方式およびそのプログラム記録媒体
US6768986B2 (en) 2000-04-03 2004-07-27 Business Objects, S.A. Mapping of an RDBMS schema onto a multidimensional data model
KR20030022663A (ko) * 2001-09-10 2003-03-17 한국과학기술원 영역-합 질의를 위한 동적 업데이트 큐브와 하이브리드질의 검색방법

Also Published As

Publication number Publication date
EP1462957A3 (en) 2006-07-05
CN1551015B (zh) 2010-05-26
JP2004303213A (ja) 2004-10-28
US20040193633A1 (en) 2004-09-30
KR20040085044A (ko) 2004-10-07
CN1551015A (zh) 2004-12-01
JP5025891B2 (ja) 2012-09-12
EP1462957A2 (en) 2004-09-29

Similar Documents

Publication Publication Date Title
KR101017504B1 (ko) 단순화된 분석 발견법을 이용한 자동화된 차원 모델 정의 및 구축을 위한 데이터 분석 시스템, 방법, 디바이스 및 컴퓨터 판독가능 기록 매체
US7398268B2 (en) Systems and methods that facilitate data mining
JP4233541B2 (ja) 目標変数の自動データパースペクティブ生成
CN104205039B (zh) 使用兴趣驱动数据管线进行数据分析的兴趣驱动商业智能系统和方法
US9665637B2 (en) Method and apparatus for creating binary attribute data relations
Shariat et al. Conceptualizing business intelligence architecture
US8943087B2 (en) Processing data from diverse databases
US20060010156A1 (en) Relational reporting system and methodology
US20110119227A1 (en) System And Method For Graphically Distinguishing Levels Of A Multidimensional Database
US20140143186A1 (en) Hybrid clustering for data analytics
JP2008522253A (ja) Kストア(KStore)データアナライザ
US20240126815A1 (en) Data Preparation Using Semantic Roles
Su Introduction to big data
US7243106B2 (en) Static drill-through modelling
US11816573B1 (en) Robust systems and methods for training summarizer models
Rupnik et al. Integrating data mining and decision support through data mining based decision support system
US10289704B1 (en) Method and system for implementing categorically organized relationship effects
Richer et al. Scalability in visualization
CN106941419B (zh) 网络体系结构和网络通信模式的可视分析方法及系统
CN112667869A (zh) 数据处理方法、设备、系统及存储介质
Rupnik et al. Decision support system to support decision processes with data mining
US20240202212A1 (en) Contextualizing data to augment processes using semantic technologies and artificial intelligence
Rupnik et al. DMDSS: Data mining based decision support system to integrate data mining and decision support
US11609971B2 (en) Machine learning engine using a distributed predictive analytics data set
Kaveh ETL and Analysis of IoT data using OpenTSDB, Kafka, and Spark

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140123

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150121

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160119

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170119

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee