KR101034428B1 - 다차원 표현식과 데이타 마이닝 확장을 결합하여 olap큐브를 마이닝하는 방법 - Google Patents
다차원 표현식과 데이타 마이닝 확장을 결합하여 olap큐브를 마이닝하는 방법 Download PDFInfo
- Publication number
- KR101034428B1 KR101034428B1 KR1020050037086A KR20050037086A KR101034428B1 KR 101034428 B1 KR101034428 B1 KR 101034428B1 KR 1020050037086 A KR1020050037086 A KR 1020050037086A KR 20050037086 A KR20050037086 A KR 20050037086A KR 101034428 B1 KR101034428 B1 KR 101034428B1
- Authority
- KR
- South Korea
- Prior art keywords
- multidimensional
- data
- data mining
- extensions
- computer
- Prior art date
Links
Images
Classifications
-
- E—FIXED CONSTRUCTIONS
- E06—DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
- E06C—LADDERS
- E06C1/00—Ladders in general
- E06C1/02—Ladders in general with rigid longitudinal member or members
- E06C1/14—Ladders capable of standing by themselves
- E06C1/16—Ladders capable of standing by themselves with hinged struts which rest on the ground
- E06C1/18—Ladders capable of standing by themselves with hinged struts which rest on the ground with supporting struts formed as ladders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
- G06F16/244—Grouping and aggregation
-
- E—FIXED CONSTRUCTIONS
- E06—DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
- E06C—LADDERS
- E06C7/00—Component parts, supporting parts, or accessories
- E06C7/02—Extending means
- E06C7/04—Hand-operated extending means carried by the ladder
-
- E—FIXED CONSTRUCTIONS
- E06—DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
- E06C—LADDERS
- E06C7/00—Component parts, supporting parts, or accessories
- E06C7/06—Securing devices or hooks for parts of extensible ladders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Mechanical Engineering (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
OLAP 큐브에 존재하는 데이타에 대해 데이타 마이닝 동작을 수행하기 위하여 다차원 확장(예컨대, MDX)과 데이타 마이닝 확장(예컨대, DMX)을 통합하는 언어 스키마가 제공된다. 이 스키마는 <source-data-query>가 관계형 쿼리가 될 수 있을 뿐만 아니라 예컨대, MDX를 사용하여 형성된 다차원 쿼리가 될 수 있다는 것을 제공한다. 모델 형성, 트레이닝 및 예측 동작들이 기술된다.
OLAP, 큐브, 데이타 마이닝, 다차원 표현식, 데이타베이스, 다차원 쿼리
Description
도 1은 본 발명에 따른 다차원 표현식 및 데이타 마이닝 확장 통합을 용이하게 하는 시스템.
도 2는 본 발명에 따른 다차원 데이타 마이닝의 한 방법의 흐름도.
도 3은 본 발명에 따라 다차원 표현식들을 데이타 마이닝 확장에 대한 입력으로 사용하는 예시적인 방법의 흐름도.
도 4는 개시된 아키텍쳐를 실행하도록 동작가능한 컴퓨터의 블럭도.
도 5는 본 발명에 따른 예시적인 컴퓨팅 환경의 도식적인 블럭도.
<도면의 주요부분에 대한 부호의 설명>
102: 데이타 큐브
104: 데이타 마이닝 컴포넌트
106: 다차원 표현식 컴포넌트
108: 데이타 마이닝 확장 컴포넌트
본 발명은 데이타베이스에 관한 것이며, 보다 구체적으로는, 이러한 데이타베이스를 검색하고 분석하는 방법에 관한 것이다.
인터넷과 같은 글로벌 통신 네트워크의 도래는 엄청난 양의 정보의 교환을 지속시켜 왔다. 또한, 이러한 정보를 저장하고 유지하는 데 드는 비용도 줄어들어, 대용량 데이타 저장 구조에 액세스할 필요가 있게 되었다. 엄청난 양의 데이타는, 일반적으로 조직의 사업 이력을 나타내는 데이타베이스인 데이타 웨어하우스(data warehouse)로서 저장될 수 있다. 이력 데이타는 전략적 계획에서 개별 조직부의 수행 평가에 이르기까지 많은 레벨에서 사업 결정을 지원하는 분석에 사용된다. 또한, 이는 관계형 데이타베이스에 저장된 데이타를 가져오고 이 데이타를 처리하여 쿼리와 분석에 보다 더 효과적인 도구로 만드는 것도 포함할 수 있다. 보다 더 작은 규모로 데이타 웨어하우징을 보다 더 효과적으로 관리하기 위해서, 데이타의 목표 서브세트만이 관리되는 데이타 마트(data mart)의 개념이 채용된다.
SQL(Structured Query Language)과 같이 데이타 정의 및 조작에 사용되는 많은 언어들은 이차원적으로 데이타를 검색하도록 구성되어 있는 반면, 다차원 데이타는 이차원 이상의 구조로 표현될 수 있다. 이러한 다차원 구조를 큐브(cube)라고 한다. 큐브는 관계형 데이타베이스라기 보다는 3-D 스프레드시트에 유사한 데이타를 나타내는 다차원 데이타베이스이다. 큐브는 차원(dimension)과 측정값(measure)의 개념을 도입하여 데이타의 상이한 면들이 빠르게 표시되도록 한다. 차원은 큐브의 구조(예컨대, 지정학적 위치나 제품 형태)를 정의하는 한편, 측정값은 최종 사용자에게 흥미로운 정량적인 값(예컨대, 판매 가격, 재고량 및 총비용)을 제공한다. 큐브 내의 셀 포지션은 차원 성분들의 교차에 의해 정의되고, 측정값들이 모여 셀 내의 값을 제공한다.
데이타 웨어하우스 또는 데이타 마트 내의 정보는 OLAP(online analytical processing)를 사용하여 처리될 수 있다. OLAP는 데이타를 큐브로 본다. OLAP는 데이타 웨어하우스 및 데이타 마트가 온라인 분석에 효과적으로 사용되고 반복적인 복잡한 분석 쿼리에 빠른 응답을 제공할 수 있도록 한다. OLAP 시스템은 실시간 분석을 지원하기 위한 속도와 유연성을 제공한다.
다차원 쿼리 및 분석을 위한 OLAP를 용이하게 할 수 있는 한가지 종래의 아키텍쳐는 MDX(Multi-Dimensional eXpressions)이다. MDX는 다차원 오브젝트와 데이타의 정의 및 조작을 지원하여 다수의 차원으로부터의 데이타의 액세스를 보다 더 용이하게 하고 보다 더 직관적으로 하게 하는 구문이다. MDX는 여러 면에서 SQL(Structured Query Language) 구문과 유사하다(그러나 SQL 언어의 확장은 아니다). SQL 쿼리와 같이, 각 MDX 쿼리는 데이타 요청(SELECT 절), 개시점(FROM 절) 및 필터(WHERE 절)를 요구한다. 이러한 키워드들과 기타의 키워드들은 분석을 위한 큐브로부터 데이타의 특정 부분들을 추출하는데 사용되는 도구를 제공한다. MDX는 또한, 검색된 데이타를 조작하기 위한 강력한 기능들의 로버스트 세트 뿐만 아니라 사용자 정의된 기능들로 MDX를 확장하는 능력을 제공한다.
데이타 마이닝(data mining)은 데이타에서 흥미로운 구조들(예컨대, 패턴 및 규칙)을 발견하는 것에 관한 것으로, 데이타에 관한 지식으로 해석될 수도 있고 혹은 데이타에 관련된 이벤트들을 예측하는 데 사용될 수도 있다. 이러한 구조들은 데이타 세트의 간결한 기술인 패턴의 형태를 취한다. 데이타 마이닝은 데이타를 가지고 있으나 통계나 데이타 분석에 숙련되지 못한 자들에게 쉽고 편리하고 실용적으로 대량의 데이타베이스를 연구하고 이용하도록 한다. 데이타 마이닝 알고리즘에 의해 추출된 "지식"은 많은 형태와 많은 이용을 가질 수 있다. 이는 다른 많은 가능한 것들 중에서, 규칙 세트, 결정 트리(decision tree), 회귀 모델(regression model), 또는 연관 세트(set of association)의 형태가 될 수 있다. 이는 데이타의 요약을 생성하거나 이전에 공지된 상관관계들을 통찰하는 데 사용될 수 있다. 이는 또한 데이타에 관련된 이벤트 - 예컨대, 값 손실, 일부 정보가 공지되지 않은 기록 등을 예측하는 데 사용될 수 있다. 다른 많은 데이타 마이닝 기술들이 있는데, 그들의 대부분은 기계 학습, 통계, 및 데이타베이스 프로그래밍 분야에서 기원한 것이다.
OLAP 큐브를 통한 데이타 마이닝 동작들의 상호작용을 용이하게 하는 스키마가 필요하다.
<발명의 개요>
다음은 본 발명의 일부 측면에 대한 기본적 이해를 제공하기 위해 본 발명의 간단한 개요를 제시한다. 이 개요는 본 발명의 광범위한 개괄이 아니다. 이는 본 발명의 주요/핵심적인 구성요소들을 식별하거나 본 발명의 범위를 한정하려는 것이 아니다. 그 유일한 목적은 후술될 보다 더 상세한 설명에 대한 서두로서 본 발명 의 일부 개념을 보다 더 간단한 형태로 제공하는 것이다.
본 명세서에 개시되고 청구된 본 발명은, 그 일 측면에서, OLAP 큐브에 존재하는 데이타에 대해 데이타 마이닝 동작을 수행하기 위하여 다차원 확장(예컨대, MDX)과 데이타 마이닝 확장(예컨대, DMX)을 통합하는 형식 언어를 포함한다. 데이타 마이닝 동작은 일반적으로 <source-data-query>로 표시되는 소스 데이타의 세트데 대한 동작을 수행한다. 지금까지 <source-data-query> 엘리먼트는 관계형 데이타 베이스에 직접적으로 작용하는 관계형 쿼리, 또는 관계형 쿼리를 취하여 이들을 네트스형 로우세트(nested rowset)로 형성하는 SHAPE 구문에 한정되어 있었다. 본 발명은 <source-data-query>가 관계형 쿼리 뿐만이 아니라 예컨대, MDX를 사용하여 형성된 다차원 쿼리가 될 수 있음을 제공한다.
본 발명의 다른 측면에서, 데이타 마이닝 모델은 OLAP 큐브 내에 포함된 데이타에 대한 예측을 수행하는 데 사용된다.
본 발명의 다른 측면에서, 모델 형성에 대해, 본 발명은, 형성시에 소스 데이타 타입은 공지되어 있지 않고 트레이닝(training) 단계까지 설정되지 않는다고 한다. 종래의 시스템에서, 모델의 "타입"은 형성시에 암시되는데, 이 타입은 관계형-소스 또는 OLAP-소스 모델이다.
또한, 마이닝 모델은 그 관계형 성질이나 다차원 성질에 무관하게, 임의의 데이타 소스로부터 트레이닝될 수 있다. 컬럼 바인딩이 마이닝 모델과 OLAP 큐브 사이의 이름 매칭을 통해 수반되는 종래의 시스템과 달리, 다차원 소스와 관계형 소스 모두에서 명시적인 컬럼 순으로 일관되게 컬럼 바인딩이 다루어진다.
또한, 마이닝 모델은 그 관계형 성질이나 다차원 성질에 무관하게, 예측을 위한 데이타 소스로서 임의의 데이타 소스를 취할 수 있다. 개시된 아키텍쳐는 DMX를 이용하여 예측이 발생하게 하고, OLAP 큐브가, 어떻게 형성되었고 트레이닝되었는지에 관계없이, 임의의 모델로부터 예측을 제공하게 한다. 전통적으로, OLAP 큐브의 데이타에 대한 예측은 MDX로, 그리고 동일 큐브 상에서 트레이닝된 마이닝 모델을 이용하여서만 수행된다.
이상의 목적과 관련 목적을 달성하기 위해, 본 발명의 특정 예시적인 측면들이 이하의 상세한 설명 및 첨부 도면과 함께 기술된다. 그러나, 이러한 측면들은 본 발명의 원리가 이용될 수 있는 다양한 방식 중 몇가지만을 나타내는 것이며, 본 발명은 이러한 측면과 그 균등물을 모두 포함하는 것이다. 본 발명의 기타 이점 및 신규한 특징은 도면과 함께 이하의 발명의 상세한 설명으로부터 명백해질 것이다.
이제 본 발명이 도면을 참조하여 기술되는데, 전체 도면에서 유사한 참조번호는 유사한 구성요소를 나타내는 데 사용된다. 이하의 기술에서는, 설명을 목적으로, 본 발명의 완전한 이해를 제공하기 위해 많은 구체적인 세부사항들이 설명된다. 그러나, 이러한 구체적인 세부사항 없이도 본 발명이 실행될 수 있다는 것은 명백하다. 다른 경우, 본 발명의 설명을 용이하게 하기 위하여 공지의 구조들과 장치들은 블럭도 형태로 도시하였다.
본 출원에서 사용되는 용어 "컴포넌트"와 "시스템"은 컴퓨터 관련 엔티티를 말하는 것으로, 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어, 또는 실행 중인 소프트웨어가 될 수 있다. 예를 들어, 컴포넌트는 프로세서 상에서 작동하는 프로세스, 프로세서, 객체, 실행파일, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있으나 이에 한정되지 않는다. 예를 들어, 서버 상에서 작동하는 애플리케이션과 서버 모두가 컴포넌트가 될 수 있다. 하나 이상의 컴포넌트가 프로세스 및/또는 실행 스레드 내에 존재할 수 있고, 컴포넌트는 하나의 컴퓨터 상에 국부적으로 위치하고/위치하거나 둘 이상의 컴퓨터들 사이에 분산될 수 있다.
본 발명은 OLAP 큐브에 존재하는 데이타에 대한 데이타 마이닝 동작을 수행하기 위한 다차원 확장 및 데이타 마이닝 확장을 통합하기 위한 아키텍쳐를 제공한다. 현재, <source-data-query> 엘리먼트들은 관계형 데이타베이스에 대해 직접적으로 작용하는 관계형 쿼리, 또는 관계형 쿼리를 가져와 이들을 네스트형 로우세트로 만드는 SHAPE 구문에 제한되어 있다. 본 발명은 <source-data-query>가 단지 관계형 쿼리만이 될 수 있는 것이 아니라, 다차원 확장을 사용하여 형성되는 다차원 쿼리도 될 수 있는 것을 제공한다.
이것이 달성될 수 있는 한 가지 방법은 MDX와 DMX를 통한 것이다. MDX는 다차원 표현식(MultiDimensional eXpressions)의 약어로서, 그 전체가 참조로 포함되는, 마이크로소프트사의 OLAP 사양에 있어서 OLE DB에 의해 정의된 바와 같다. DMX는 데이타 마이닝 확장(Data Mining eXtensions)의 약어로서, 그 전체가 참조로 포함되는, 마이크로소프트사의 데이타 마이닝 사양에 있어서 OLE DB에 의해 정의된 바와 같다. 이를 설명하기 위해, 모델 형성, 모델 트레이닝 및 신규 데이타에 대 한 예측 동작들이 기술된다.
DMX에서, 이러한 동작들은 CREATE MINING MODEL, INSERT INTO 및 SELECT ... PREDICTION JOIN 구문을 사용하여 수행된다. 예를 들면 다음과 같다.
이제 도 1을 참조하면, 본 발명에 따른 다차원 표현식 및 데이타 마이닝 확장 통합을 용이하게 하는 시스템(100)이 도시된다. 데이타 마이닝이 수행되는 다차원 데이타 소스{예컨대, OLAP(On-Line Analytical Processing) 큐브}(102)가 제공된다. 데이타 마이닝 컴포넌트(104)는 함께 OLAP 큐브(102)의 데이타 마이닝을 용이하게 하는 다차원 표현식 컴포넌트(106)(예컨대, MDX)와 데이타 마이닝 확장 컴포넌트(108)를 포함한다. 데이타 마이닝 컴포넌트의 출력은 데이타 마이닝 모델 형성, 트레이닝 및 예측에 대한 입력으로 사용되는 데이타이다.
다른 구현예에서, 다차원 표현식 컴포넌트(106)와 데이타 마이닝 확장 컴포넌트(108)는 단일한 전체 데이타 마이닝 컴포넌트(104)에 존재할 필요가 없고, 데 이타 마이닝 컴포넌트(104)로부터 별도의 외부 엔티티가 될 수 있다는 것을 알아야 한다. 따라서, 이 컴포넌트(106 및 108)는 하나가 다른 하나를 유지하도록 독립적이 될 수 있다.
이제 도 2를 참조하면, 본 발명에 따른 다차원 데이타 마이닝의 한가지 방법의 흐름도가 도시되어 있다. 설명을 간단히 하기 위하여, 예를 들어, 흐름도의 형태로 본 명세서에 도시된 하나 이상의 방법이 일련의 동작으로 도시되고 기술되어 있지만, 본 발명에 따르면 일부 동작들은 여기 도시되고 기술된 것과 다른 순서로 및/또는 다른 동작과 동시에 발생할 수 있기 때문에, 본 발명은 이러한 동작들의 순서에 한정되지 않는다는 것을 이해하고 알아야 한다. 예를 들어, 본 기술분야의 숙련자라면 방법이 상태도에서와 같이, 일련의 상호관련된 상태 또는 이벤트로 달리 표현될 수 있다는 것을 이해하고 알 것이다. 또한, 도시된 동작들 모두가 본 발명에 따른 방법을 구현할 필요는 없다.
200에서, 다차원 데이타가 데이타 마이닝에 제공된다. 202에서, 다차원 확장과 데이타 마이닝 확장을 통합하고, 다차원 데이타에 대해 동작하는 언어 스키마가 제공된다. 204에서, 데이타 마이닝 모델이 다차원 데이타로부터 생성된다. 206에서, 데이타 마이닝 모델이 이 데이타에 대해 트레이닝된다. 208에서, 이제 데이타 마이닝 확장을 이용하여 신규 데이타에 대한 예측이 행해질 수 있다. 이 프로세스는 그 다음 중지 블럭에 도달한다.
이제 도 3을 참조하면, 본 발명에 따라 다차원 표현식을 데이타 마이닝 확장에 대한 입력으로 사용하는 예시적인 방법의 흐름도가 도시된다. 데이타 마이닝 확장 쿼리는 전통적으로 관계형 테이블을 그 데이타 소스로 기대한다. 이러한 쿼리는 플랫 테이블을 입력으로 수용하거나, SHAPE 지시를 이용하여 형성된 네스트형 테이블을 수용할 수 있다. INSERT INTO 구문에서와 같이 컬럼 순으로, 혹은 SELECT ... PREDICTION JOIN 구문에서와 같이 ON 절을 사용한 명시적 매핑에 의해 바인딩이 행해진다. 그 예는 다음과 같다.
개시된 본 발명은 다차원 확장 쿼리(예컨대, MDX)를 데이타 마이닝 확장 구문(예컨대, DMX)에 대한 입력으로 사용하는 다수의 방법들을 가능하게 한다. 예를 들어, 이하의 설명은 MDX와 DMX를 본 발명을 수행하는 한가지 방법으로서 사용하지만, 이에 한정되는 것은 아니다. 300에서, 첫번째 방법은 관계형 쿼리를 MDX 쿼리로 간단히 교체하는 것이다. 예를 들어, 쿼리
는 MDX 큐브에서 다음과 같이 표현될 수 있다.
다른 예로, 다음의 쿼리,
는 다음과 같이 표현될 수 있다.
따라서, 이 첫번째 형태에서, MDX 표현식이 관계형 쿼리들에 대해 대체될 수 있다.
302에서, 두번째 형태는 큐브의 고유의 다차원 구조를 활용하여 SHAPE 구조를 제거하는 것을 가능하게 한다. 그러면 상기 세이핑된 관계형 쿼리들을 MDX로 다음과 같이 쓸 수 있다.
추가의 네스트형 테이블들이 추가의 축 상에 배치될 수 있다.
304에서, 본 발명의 세번째 형태는 예컨대, SELECT, PREDICTION, 및 JOIN 등 이름만으로 바인딩하는 구문들을 포함한다. 이 형태에서 데이타 마이닝 확장 프로세서는 큐브 구조를 활용하여, MDX 쿼리에서 정보를 추출하기 위해 ON 절을 확장하면서, 보다 더 간단한 쿼리를 가능하게 한다. 예를 들면 다음과 같다.
모델 형성에 대하여, 본 발명은 모델 형성시, 소스 데이타 타입을 모르고 트레이닝 단계까지 설정되지 않는다고 한다. 종래의 시스템에서는, 모델의 "타입"은 형성시 암시되고, 이 타입은 관계형-소스 또는 OLAP-소스 모델이 된다.
마이닝 모델은 그의 관계형 성질이나 다차원 성질에 관계없이 임의의 데이타 소스로부터 트레이닝될 수 있다. 컬럼 바인딩은, 마이닝 모델과 OLAP 큐브 사이에서 이름 매칭을 통해 컬럼 바인딩이 수반되는 종래의 시스템과 달리, 다차원 소스와 관계형 소스 모두에서 명시적인 컬럼 순으로 일관되게 다루어진다.
마이닝 모델은 그의 관계형 성질이나 다차원 성질에 관계없이, 예측을 위한 데이타 소스로서 임의의 데이타 소스를 취할 수 있다. 전통적으로, OLAP 큐브 내의 데이타에 대한 예측은 MDX로만, 그리고 동일한 큐브 상에서 트레이닝된 마이닝 모델을 이용해서만 수행될 수 있다. 개시된 아키텍쳐는 DMX를 이용하여 예측이 발생하게 하고, OLAP 큐브가, 어떻게 형성되었고 트레이닝되었는지에 관계없이, 임의의 모델로부터 예측을 제공하게 한다.
이제 도 4를 참조하면, 개시된 아키텍쳐를 실행하도록 동작가능한 컴퓨터의 블럭도가 도시된다. 본 발명의 다양한 측면들에 대한 추가적 문맥을 제공하기 위해, 도 4와 이하의 논의는 본 발명의 다양한 측면들이 구현될 수 있는 적절한 컴퓨 팅 환경(400)에 대한 간략하고 일반적인 설명을 제공하려는 것이다. 이상, 본 발명이 하나 이상의 컴퓨터 상에서 실행할 수 있는 컴퓨터 실행가능한 명령어들의 일반적인 문맥에서 기술되었지만, 본 기술분야의 숙련자라면 본 발명이 기타의 프로그램 모듈들의 조합으로 및/또는 하드웨어와 소프트웨어의 조합으로 구현될 수도 있다는 것을 인식할 것이다.
일반적으로, 프로그램 모듈은 특정 작업을 수행하거나 추상 데이타 타입을 구현하는, 루틴, 프로그램, 컴포넌트, 데이타 구조 등을 포함한다. 또한, 본 기술분야의 숙련자라면 본 발명의 방법은 단일 프로세서 또는 멀티프로세서 컴퓨터 시스템, 미니컴퓨터, 메인프레임 컴퓨터 뿐만 아니라 개인용 컴퓨터, 핸드-헬드 컴퓨팅 장치, 마이크로프로세서 기반 또는 프로그램가능한 소비자 전자제품 등을 포함하는 다른 컴퓨터 시스템 구성으로 실시될 수 있으며, 이 각각은 하나 이상의 관련 장치들에 동작가능하게 연결될 수 있다는 것을 알 것이다.
본 발명의 예시적인 측면들은 또한, 특정 작업이 통신 네트워크를 통해 링크되어 있는 원격 프로세싱 장치에 의해 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치에 위치할 수 있다.
컴퓨터는 전형적으로 다양한 컴퓨터 판독가능한 매체를 포함한다. 컴퓨터 판독가능한 매체는 컴퓨터에 의해 액세스될 수 있고 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체 모두를 포함하는 임의의 이용가능한 매체가 될 수 있다. 예를 들어, 컴퓨터 판독가능한 매체는 컴퓨터 저장 매체 및 통신 매체를 포함할 수 있으나 이에 한정되는 것은 아니다. 컴퓨터 저장 매체는 컴퓨터 판독가능한 명령어, 데이타 구조, 프로그램 모듈 또는 기타의 데이타와 같은 정보를 저장하기 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체 모두를 포함한다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타의 메모리 기술, CD-ROM, DVD, 또는 기타의 광 디스크 저장장치, 자기 카세트, 자기 테이프, 자기 디스크 저장장치 또는 기타의 자기 저장 장치, 또는 원하는 정보를 저장하는 데 사용될 수 있고 컴퓨터에 의해 액세스가능한 임의의 다른 매체를 포함하지만, 이에 한정되는 것은 아니다.
통신 매체는 전형적으로 반송파나 기타의 전송 메카니즘과 같이 변조된 데이타 신호 내에 컴퓨터 판독가능한 명령어, 데이타 구조, 프로그램 모듈 또는 기타의 데이타를 갖고, 임의의 정보 전달 매체를 포함한다. "변조된 데이타 신호"라는 용어는 신호 내의 정보를 인코딩하는 방식으로 설정 또는 변경된 하나 이상의 특징을 갖는 신호를 의미한다. 예를 들어, 통신 매체는 유선 네트워크 또는 직접 유선 접속, 및 음파, RF, 적외선 및 기타 무선 매체와 같은 무선 매체를 포함하지만, 이에 한정되지 않는다. 이상의 것들 중 임의의 조합도 컴퓨터 판독가능한 매체의 범위 내에 포함되어야 한다.
다시 도 4를 참조하면, 컴퓨터(402)를 포함하는 본 발명의 다양한 측면을 구현하기 위한 예시적인 환경(400)이 도시되는데, 컴퓨터(402)는 프로세싱 유닛(404), 시스템 메모리(406) 및 시스템 버스(408)를 포함한다. 시스템 버스(408)는 시스템 메모리(406)를 포함한(이에 한정되지 않음) 시스템 컴포넌트들을 프로세싱 유닛(404)에 결합한다. 프로세싱 유닛(404)은 다양한 상용 프로세서 중 임의의 것이 될 수 있다. 듀얼 마이크로프로세서와 기타의 멀티프로세서 아키텍쳐들도 역시 프로세싱 유닛(404)으로서 이용될 수 있다.
시스템 버스(408)는 (메모리 콘트롤러가 있거나 없는) 메모리 버스, 주변 버스 및 임의의 다양한 상용 버스 아키텍쳐를 사용하는 로컬 버스도 상호접속될 수 있는 몇가지 형태의 버스 구조 중 임의의 것이 될 수 있다. 시스템 메모리(406)는 ROM(read only memory)(410) 및 RAM(random access memory)(412)을 포함한다. BIOS(basic input/output system)는 시동 동안 등에 컴퓨터(402) 내의 구성요소들 간에 정보를 전달하는 것을 돕는 기본적인 루틴을 포함하는 것으로, ROM, EPROM, EEPROM과 같은 비휘발성 메모리(410)에 저장된다. RAM(412)은 또한, 데이타를 캐시하기 위한 SRAM(static RAM)과 같은 고속 RAM을 포함할 수 있다.
컴퓨터(402)는 또한, 적절한 새시(도시되지 않음) 내에 포함되어 외장형으로도 구성될 수 있는 내장형 하드 디스크 드라이브(HDD)(414)(예컨대, EIDE, SATA), {예컨대, 분리형 디스켓(418)으로부터 판독하거나 그곳에 기록하기 위한} 자기 플로피 디스크 드라이브(FDD)(416), 및 {예컨대, CR-ROM 디스크(422)를 판독, 또는 DVD와 같은 다른 대용량 광매체로부터 판독하거나 그곳에 기록하기 위한} 광 디스크 드라이브(420)를 더 포함한다. 하드 디스크 드라이브(414), 자기 디스크 드라이브(416) 및 광 디스크 드라이브(420)는 하드 디스크 드라이브 인터페이스(424), 자기 디스크 드라이브 인터페이스(426) 및 광 드라이브 인터페이스(428) 각각에 의해 시스템 버스(408)에 접속될 수 있다. 외장형 드라이브 구현을 위한 인터페이스 (424)는 USB(Universal Serial Bus)와 IEEE 1394 인터페이스 기술 모두 또는 적어도 하나를 포함한다.
이 드라이브들 및 관련 컴퓨터 판독가능한 매체는 데이타, 데이타 구조, 컴퓨터 실행가능한 명령어 등의 비휘발성 저장을 제공한다. 컴퓨터(402)에 대해서, 이 드라이브들 및 매체는 적합한 디지탈 형식으로 임의의 데이타를 저장하도록 한다. 이상의 컴퓨터 판독가능한 매체의 기술이 HDD, 분리형 자기 디스켓, 및 CD나 DVD와 같은 제거가능한 광 매체를 말하는 것이지만, 본 기술분야의 숙련자라면 집 드라이브, 자기 카세트, 플래시 메모리 카드, 카트리지 등과 같이 컴퓨터에 의해 판독가능한 기타 형태의 매체도 예시적인 오퍼레이팅 환경에서 사용될 수 있으며, 또한 임의의 이러한 매체는 본 발명의 방법들을 실행하기 위한 컴퓨터 실행가능한 명령어들을 포함할 수 있다는 것을 알아야 한다.
운영 체계(430), 하나 이상의 애플리케이션 프로그램(432), 기타 프로그램 모듈(434) 및 프로그램 데이타(436)를 포함하는 다수의 프로그램 모듈이 드라이브와 RAM(412)에 저장될 수 있다. 운영 체계, 애플리케이션, 모듈, 및/또는 데이타 모두 또는 그 일부도 RAM(412) 내에 캐시될 수 있다.
본 발명은 다양한 상용 운영 체계 또는 운영 체계들의 조합으로 구현될 수 있다는 것을 알아야 한다.
사용자는 예컨대, 키보드(438), 및 마우스(440)와 같은 포인팅 장치 등의 하나 이상의 유선/무선 입력 장치를 통해 컴퓨터(402)에 명령 및 정보를 입력할 수 있다. 기타의 입력 장치(도시되지 않음)로는 마이크로폰, IR 리모콘, 조이스틱, 게임 패드, 스타일러스 펜, 터치 스크린 등이 있다. 이러한 입력 장치 및 기타의 입력 장치는 흔히 시스템 버스(408)에 연결되어 있는 입력 장치 인터페이스(442)를 통해 프로세싱 유닛(404)에 접속되지만, 병렬 포트, IEEE 1394 시리얼 포트, 게임 포트, USB 포트, IR 인터페이스 등과 같은 기타의 인터페이스를 통해 접속될 수 있다.
모니터(444) 또는 기타 형태의 디스플레이 장치도 역시 비디오 어댑터(446)와 같은 인터페이스를 통해 시스템 버스(408)에 접속된다. 모니터(444) 외에, 컴퓨터는 통상적으로 스피커, 프린터 등의 기타의 주변 출력 장치(도시되지 않음)를 포함한다.
컴퓨터(402)는 원격 컴퓨터(들)(448)와 같은 하나 이상의 원격 컴퓨터로의 유선 및/또는 무선 통신을 통한 논리적 접속을 사용하는 네트워크 환경에서 동작할 수 있다. 원격 컴퓨터(들)(448)는 워크스테이션, 서버 컴퓨터, 라우터, 개인용 컴퓨터, 휴대용 컴퓨터, 마이크로프로세서 기반 오락 설비, 피어 장치 또는 기타의 공통 네트워크 노드가 될 수 있으며, 간략히 메모리 저장 장치(450)만이 도시되어 있지만, 전형적으로 컴퓨터(402)에 대해 기술한 엘리먼트들의 다수 또는 모두를 포함한다. 도시된 논리적 접속은 LAN(local area network)(452) 및/또는 보다 큰 네트워크, 예컨대, WAN(wide area network)(454)에 대한 유선/무선 접속을 포함한다. 이러한 LAN 및 WAN 네트워크 환경은 사무실과 회사에서 흔히 찾아볼 수 있으며, 인트라넷과 같은 기업용 컴퓨터 네트워크를 용이하게 하는 것으로, 이들 모두는 글로벌 통신 네트워크, 예컨대, 인터넷에 접속될 수 있다.
LAN 네트워크 환경에서 사용될 때, 컴퓨터(420)는 유선 및/또는 무선 통신 네트워크 인터페이스 또는 어댑터(456)를 통해 로컬 네트워크(452)에 접속된다. 어댑터(456)는 LAN(452)에 대한 유선 또는 무선 통신을 용이하게 할 수 있는 것으로, 이는 또한 무선 어댑터(456)와 통신하기 위해 거기에 배치된 무선 액세스 포인트를 포함할 수 있다. WAN 네트워크 환경에서 사용될 때, 컴퓨터(420)는 모뎀(458)을 포함할 수 있거나, LAN 상의 통신 서버에 접속되거나, 인터넷 등에 의해 WAN(454) 상에서 통신을 설립하기 위한 기타의 수단들을 포함한다. 모뎀(458)은 내장형이거나 외장형, 유선 또는 무선 장치가 될 수 있는데, 시리얼 포트 인터페이스(442)를 통해 시스템 버스(408)에 접속된다. 네트워크 환경에서, 컴퓨터(402)에 대해 도시된 프로그램 모듈 또는 그 일부분은 원격 메모리/저장 장치(450)에 저장될 수 있다. 도시된 네트워크 접속들은 예시적인 것이며 컴퓨터들 간에 통신 링크를 설립하기 위한 기타 수단이 사용될 수 있다는 것을 알아야 할 것이다.
컴퓨터(402)는, 예컨대, 프린터, 스캐너, 데스크탑 및/또는 휴대용 컴퓨터, PDA, 통신 위성, 유선으로 검출가능한 태그에 관련된 임의의 설비나 위치(예컨대, 키오스크, 뉴스 스탠드, 화장실), 및 전화 등의 무선 통신 상에서 동작하도록 배치된 임의의 무선 장비 또는 엔티티와 통신하도록 동작가능하다. 이는 적어도 Wi-Fi 및 블루투스™ 무선 기술을 포함한다. 따라서, 통신은 종래의 네트워크와 같이 예측된 구조일 수도 있고 단순히 적어도 두 개의 장치 간의 임시(hoc) 통신이 될 수 있다.
Wi-Fi(Wireless Fidelity)는 집의 소파, 호텔방의 침대 또는 회사의 회의실 에서 무선으로 인터넷에 접속할 수 있도록 한다. Wi-Fi는 예컨대, 컴퓨터와 같은 장치가 기지국 범위 내라면 어느 곳이든 실내외에서 데이타를 송수신할 수 있도록 하는 셀폰과 같은 무선 기술이다. Wi-Fi 네트워크는 IEEE 802.11(a, b, g, 등)이라고 하는 무선 기술을 이용하여 안전하고, 신뢰성 있고, 빠른 무선 접속을 제공한다. Wi-Fi 네트워크는 컴퓨터들을 서로 접속시키고, 인터넷에 접속시키고(IEEE 802.3 또는 이더넷을 사용하는), 유선 네트워크에 접속시키는 데 사용될 수 있다. Wi-Fi 네트워크는 허가되지 않은 2.4 및 5GHz 무선 밴드에서 11Mbps(802.11b) 또는 54Mbps(802.11a) 데이타 속도로 또는 두 밴드(듀얼 밴드)를 포함하는 제품으로 동작하여, 네트워크가 다수의 사무실에서 사용되는 기본 10BaseT 유선 이더넷 네트워크와 유사한 실제 성능을 제공할 수 있도록 한다.
이제 도 5를 참조하면, 본 발명에 따른 예시적인 컴퓨팅 환경(500)의 도식적인 블럭도가 도시된다. 시스템(500)은 하나 이상의 클라이언트(들)(502)를 포함한다. 클라이언트(들)(502)는 하드웨어 및/또는 소프트웨어(예컨대, 스레드, 프로세스, 컴퓨팅 장치)가 될 수 있다. 클라이언트(들)(502)는, 예를 들어, 본 발명을 이용함으로써 쿠키(들) 및/또는 관련 문맥 정보를 포함할 수 있다. 시스템(500)은 또한, 하나 이상의 서버(들)(504)를 포함한다. 서버(들)(504)는 또한 하드웨어 및/또는 소프트웨어(예컨대, 스레드, 프로세스, 컴퓨팅 장치)가 될 수 있다. 서버(504)는 예를 들어, 본 발명을 이용함으로써 변환을 수행하기 위한 스레드를 포함할 수 있다. 클라이언트(502)와 서버(504) 간의 한가지 가능한 통신은 둘 이상의 컴퓨터 프로세스 사이에 전송되도록 적응된 데이타 패킷 형태가 될 수 있다. 데이 타 패킷은, 예를 들어, 쿠키 및/또는 관련 문맥 정보를 포함할 수 있다. 시스템(500)은 클라이언트(들)(502)와 서버(들)(504) 간의 통신을 용이하게 하는 데 이용될 수 있는 통신 프레임워크(506)(예컨대, 인터넷과 같은 글로벌 통신 네트워크)를 포함한다.
통신은 유선(광섬유 포함) 및/또는 무선 기술을 통해 용이하게 될 수 있다. 클라이언트(들)(502)는 클라이언트(들)(502)에 로컬인 정보{예컨대, 쿠키(들) 및/또는 관련 문낵 정보}를 저장하는 데 이용될 수 있는 하나 이상의 클라이언트 데이타 저장장치(들)(508)에 동작가능하게 접속된다. 유사하게, 서버(들)(504)는 서버(504)에 로컬인 정보를 저장하는 데 이용될 수 있는 하나 이상의 서버 데이타 저장장치(들)(510)에 동작가능하게 접속된다.
이상 기술된 것은 본 발명의 예를 포함하는 것이다. 물론, 본 발명을 기술하기 위해서 생각할 수 있는 모든 컴포넌트 또는 방법의 조합을 기술하는 것은 불가능하지만, 본 기술분야의 숙련자라면 본 발명의 보다 더 많은 조합과 변경이 가능하다는 것을 인식할 것이다. 따라서, 본 발명은 첨부된 청구항의 취지 및 범위에 속하는 이러한 모든 대체물, 변경물 및 변이물들을 포함하는 것이다. 또한, 발명의 상세한 설명 또는 청구항에서 사용된 "포함(includes)"이라는 용어의 한계에 대해서, 이 용어는 "포함(comprising)"이 청구항에서 전환어로서 사용될 때 해석되는 바와 같이, "포함(comprising)"이라는 용어와 유사한 방식의 총괄적인 개념이다.
OLAP 큐브를 통한 데이타 마이닝 동작들의 상호작용을 용이하게 할 수 있다.
Claims (40)
- 프로세서에서 실행될 때, 컴퓨터 시스템으로 하여금 다차원 데이타 큐브(multidimensional data cube) 상에서 데이타 마이닝(data mining)하기 위한 방법을 수행하게 하는 컴퓨터 실행가능 명령어들을 저장하고 있는 하나 이상의 컴퓨터 판독가능 기록 매체로서,상기 방법은,다차원 데이타에 액세스하는 단계;상기 다차원 데이타를 다차원 데이타 큐브로서 보는 방법을 정의하는 다차원 표현식(expression)들에 액세스하는 단계;상기 다차원 데이타 큐브 내에 상주하는 데이타에 대해 데이타 마이닝을 수행하기 위한 데이타 마이닝 확장(data mining extension)들에 액세스하는 단계;상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하는 단계;상기 입력으로부터 상기 다차원 데이타에 대해 트레이닝된 데이타 마이닝 모델을 생성하는 단계;상기 데이타 마이닝 모델을 저장하는 단계; 및상기 데이타 마이닝 모델에 따라 상기 다차원 데이타 큐브를 데이타 마이닝함으로써 상기 다차원 데이타 큐브 내에 포함된 데이타에 대해 데이타 예측들을 수행하는 단계를 포함하고,데이타 마이닝은 다차원 쿼리 엘리먼트에 따라 상기 다차원 데이타 큐브 내에 포함된 데이타의 부분들에 대해 데이타 마이닝 동작들을 수행하는 것을 포함하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제1항에 있어서,상기 다차원 데이타 큐브는 OLAP(on-line analytical processing) 큐브를 포함하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제1항에 있어서,상기 다차원 표현식들은 마이크로소프트 MDX(Multi-Dimensional Expression) 사양에 대응하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제1항에 있어서,상기 데이타 마이닝 확장들은 마이크로소프트 DMX(Data Mining Extension) 사양에 대응하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제1항에 있어서,실행 시, 상기 컴퓨터 시스템이 상기 데이타 마이닝 모델을 생성하게 하는 컴퓨터 실행가능 명령어들은,실행 시 상기 컴퓨터 시스템이, 알려져 있지 않고 나중에 트레이닝 단계 동안 관계형 소스 모델 또는 다차원 소스 모델 중 하나의 모델로 설정되는 소스 데이타 타입을 갖는 데이타 마이닝 모델을 생성하게 하는 컴퓨터 실행가능 명령어들을 포함하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제1항에 있어서,실행 시, 상기 컴퓨터 시스템이 상기 데이타 마이닝 모델을 생성하게 하는 컴퓨터 실행가능 명령어들은,실행 시, 상기 컴퓨터 시스템이 네스트형 테이블(nested table)을 추가의 축 상에 배치하게 하는 컴퓨터 실행가능 명령어들을 포함하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제1항에 있어서,실행 시, 상기 컴퓨터 시스템이 상기 데이타 마이닝 모델을 생성하게 하는 컴퓨터 실행가능 명령어들은,실행 시, 상기 컴퓨터 시스템이 임의의 데이타 소스로부터 상기 데이타 마이닝 모델을 트레이닝하게 하는 컴퓨터 실행가능 명령어들을 포함하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제1항에 있어서,실행 시, 상기 컴퓨터 시스템이 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 통합하기 위한 언어 스키마를 제공하게 하는 컴퓨터 실행가능 명령어들을 더 포함하고,실행 시, 상기 컴퓨터 시스템이 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하게 하는 컴퓨터 실행가능 명령어들은, 실행 시, 상기 컴퓨터 시스템이 상기 제공된 언어 스키마에 따라 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하게 하는 컴퓨터 실행가능 명령어들을 포함하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제8항에 있어서,실행 시, 상기 컴퓨터 시스템이 상기 제공된 언어 스키마에 따라 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하게 하는 컴퓨터 실행가능 명령어들은,실행 시, 상기 컴퓨터 시스템이 상기 다차원 데이타 큐브의 고유의 다차원 구조를 이용하여 관계형 쿼리를 다차원 표현식으로서 기록함으로써, 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 통합하게 하는 컴퓨터 실행가능 명령어들을 포함하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제8항에 있어서,실행 시, 상기 컴퓨터 시스템이 상기 제공된 언어 스키마에 따라 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하게 하는 컴퓨터 실행가능 명령어들은,실행 시, 상기 컴퓨터 시스템이 보다 더 간단한 쿼리를 가능하게 하는 큐브 구조를 이용하기 위해 이름만으로 바인딩하는 구문들을 정의함으로써, 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 통합하게 하는 컴퓨터 실행가능 명령어들을 포함하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 제8항에 있어서,실행 시, 상기 컴퓨터 시스템이 상기 제공된 언어 스키마에 따라 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하게 하는 컴퓨터 실행가능 명령어들은,실행 시, 상기 컴퓨터 시스템이 관계형 쿼리를 통합된 표현식으로 교체하는 다차원 확장을 수용함으로써, 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 통합하게 하는 컴퓨터 실행가능 명령어들을 포함하는 하나 이상의 컴퓨터 판독가능 기록 매체.
- 프로세서 및 시스템 메모리를 포함하는 컴퓨터 시스템에서, 다차원 데이타 큐브 상에서 데이타 마이닝하기 위한 컴퓨터 구현된 방법으로서,다차원 데이타에 액세스하는 단계;상기 다차원 데이타를 다차원 데이타 큐브로서 보는 방법을 정의하는 다차원 표현식들에 액세스하는 단계;상기 다차원 데이타 큐브 내에 상주하는 데이타에 대해 데이타 마이닝을 수행하기 위한 데이타 마이닝 확장들에 액세스하는 단계;상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하는 단계;상기 프로세서가 상기 입력으로부터 상기 다차원 데이타에 대해 트레이닝된 데이타 마이닝 모델을 생성하는 단계;상기 데이타 마이닝 모델을 저장하는 단계; 및상기 데이타 마이닝 모델에 따라 상기 다차원 데이타 큐브를 데이타 마이닝함으로써 상기 다차원 데이타 큐브 내에 포함된 데이타에 대해 데이타 예측들을 수행하는 단계를 포함하고,데이타 마이닝은 다차원 쿼리 엘리먼트에 따라 상기 다차원 데이타 큐브 내에 포함된 데이타의 부분들에 대해 데이타 마이닝 동작들을 수행하는 것을 포함하는 컴퓨터 구현된 방법.
- 제12항에 있어서,상기 다차원 데이타 큐브는 OLAP 큐브를 포함하는 컴퓨터 구현된 방법.
- 제12항에 있어서,상기 다차원 표현식들은 마이크로소프트 MDX 사양에 대응하는 컴퓨터 구현된 방법.
- 제12항에 있어서,상기 데이타 마이닝 확장들은 마이크로소프트 DMX 사양에 대응하는 컴퓨터 구현된 방법.
- 제12항에 있어서,상기 데이타 마이닝 모델을 생성하는 단계는, 추가의 네스트형 테이블을 추가의 축 상에 배치하는 단계를 포함하는 컴퓨터 구현된 방법.
- 제12항에 있어서,상기 데이타 마이닝 모델을 생성하는 단계는, 임의의 데이타 소스로부터 상기 데이타 마이닝 모델을 트레이닝하는 단계를 포함하는 컴퓨터 구현된 방법.
- 제12항에 있어서,상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 통합하기 위한 언어 스키마를 제공하는 단계를 더 포함하고,상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하는 단계는, 상기 제공된 언어 스키마에 따라 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하는 단계를 포함하는 컴퓨터 구현된 방법.
- 제18항에 있어서,상기 제공된 언어 스키마에 따라 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하는 단계는, 상기 다차원 데이타 큐브의 고유의 다차원 구조를 이용하여 관계형 쿼리를 다차원 표현식으로서 기록함으로써, 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 통합하는 단계를 포함하는 컴퓨터 구현된 방법.
- 제18항에 있어서,상기 제공된 언어 스키마에 따라 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하는 단계는, 보다 더 간단한 쿼리를 가능하게 하는 큐브 구조를 이용하기 위해 이름만으로 바인딩하는 구문들을 정의함으로써, 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 통합하는 단계를 포함하는 컴퓨터 구현된 방법.
- 제18항에 있어서,상기 제공된 언어 스키마에 따라 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 데이타 마이닝 모델 생성을 위한 입력으로 통합하는 단계는, 관계형 쿼리를 통합된 표현식으로 교체하는 다차원 확장을 수용함으로써, 상기 다차원 표현식들과 상기 데이타 마이닝 확장들을 통합하는 단계를 포함하는 컴퓨터 구현된 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/873,676 US7627555B2 (en) | 2004-06-22 | 2004-06-22 | Combining multidimensional expressions and data mining extensions to mine OLAP cubes |
US10/873,676 | 2004-06-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060047700A KR20060047700A (ko) | 2006-05-18 |
KR101034428B1 true KR101034428B1 (ko) | 2011-05-12 |
Family
ID=34981588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050037086A KR101034428B1 (ko) | 2004-06-22 | 2005-05-03 | 다차원 표현식과 데이타 마이닝 확장을 결합하여 olap큐브를 마이닝하는 방법 |
Country Status (10)
Country | Link |
---|---|
US (1) | US7627555B2 (ko) |
EP (1) | EP1610237A3 (ko) |
JP (1) | JP4716796B2 (ko) |
KR (1) | KR101034428B1 (ko) |
CN (1) | CN1713180B (ko) |
AU (1) | AU2005201996B2 (ko) |
BR (1) | BRPI0502063A (ko) |
CA (1) | CA2506135A1 (ko) |
MX (1) | MXPA05005536A (ko) |
RU (1) | RU2398273C2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102058124B1 (ko) * | 2019-01-25 | 2019-12-23 | (주)비아이매트릭스 | 피벗 테이블 구조의 olap 결과를 이용한 딥러닝 예측 데이터 반영 시스템 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7937401B2 (en) * | 2004-07-09 | 2011-05-03 | Microsoft Corporation | Multidimensional database query extension systems and methods |
US20060036939A1 (en) * | 2004-08-13 | 2006-02-16 | Microsoft Corporation | Support for user-specified spreadsheet functions |
US8095499B2 (en) * | 2004-10-19 | 2012-01-10 | Microsoft Corporation | Query consolidation for structured reports |
US7899776B2 (en) * | 2007-07-02 | 2011-03-01 | Microsoft Corporation | Explaining changes in measures thru data mining |
EP2148310B1 (en) * | 2008-07-21 | 2016-07-06 | IDT Electronic Products Limited | Data retrieval apparatus |
US8229923B2 (en) * | 2008-09-26 | 2012-07-24 | Microsoft Corporation | Multidimensional data space queries with expression evaluation |
CA2708911C (en) | 2009-07-09 | 2016-06-28 | Accenture Global Services Gmbh | Marketing model determination system |
WO2011009211A1 (en) * | 2009-07-22 | 2011-01-27 | Carolyn Patricia Mcgregor | System, method and computer program for multi-dimensional temporal data mining |
JP5175903B2 (ja) | 2009-08-31 | 2013-04-03 | アクセンチュア グローバル サービスィズ ゲーエムベーハー | 適応分析多次元処理システム |
KR101117649B1 (ko) * | 2010-10-13 | 2012-03-20 | 세종대학교산학협력단 | Olap 기반의 3차원 공간에서 데이터 분석 객체의 선택 방법 및 시스템 |
CN102306176B (zh) * | 2011-08-25 | 2013-09-25 | 浙江鸿程计算机系统有限公司 | 一种基于数据仓库内在特征的olap关键词查询方法 |
CN102789488B (zh) * | 2012-06-29 | 2016-05-04 | 用友网络科技股份有限公司 | 数据查询处理系统和数据查询处理方法 |
CN103164222A (zh) * | 2013-02-25 | 2013-06-19 | 用友软件股份有限公司 | 多维建模系统和多维建模方法 |
CN103235793A (zh) * | 2013-04-01 | 2013-08-07 | 华为技术有限公司 | 联机处理数据的方法、设备及系统 |
US10275484B2 (en) * | 2013-07-22 | 2019-04-30 | International Business Machines Corporation | Managing sparsity in a multidimensional data structure |
US9176801B2 (en) | 2013-09-06 | 2015-11-03 | Sap Se | Advanced data models containing declarative and programmatic constraints |
US9442977B2 (en) | 2013-09-06 | 2016-09-13 | Sap Se | Database language extended to accommodate entity-relationship models |
US9575819B2 (en) | 2013-09-06 | 2017-02-21 | Sap Se | Local buffers for event handlers |
US9361407B2 (en) | 2013-09-06 | 2016-06-07 | Sap Se | SQL extended with transient fields for calculation expressions in enhanced data models |
US9430523B2 (en) | 2013-09-06 | 2016-08-30 | Sap Se | Entity-relationship model extensions using annotations |
US9619552B2 (en) | 2013-09-06 | 2017-04-11 | Sap Se | Core data services extensibility for entity-relationship models |
US9639572B2 (en) | 2013-09-06 | 2017-05-02 | Sap Se | SQL enhancements simplifying database querying |
US9354948B2 (en) | 2013-09-06 | 2016-05-31 | Sap Se | Data models containing host language embedded constraints |
CN106528795B (zh) * | 2016-11-10 | 2023-10-13 | 中国农业银行股份有限公司 | 一种数据挖掘方法及装置 |
US11868329B2 (en) | 2022-05-20 | 2024-01-09 | International Business Machines Corporation | Multidimensional cube multivariate regression |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030145000A1 (en) | 2002-01-31 | 2003-07-31 | International Business Machines Corporation | System and method of using data mining prediction methodology |
US20030236784A1 (en) | 2002-06-21 | 2003-12-25 | Zhaohui Tang | Systems and methods for generating prediction queries |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6205447B1 (en) | 1997-06-30 | 2001-03-20 | International Business Machines Corporation | Relational database management of multi-dimensional data |
US6473764B1 (en) | 1999-10-15 | 2002-10-29 | Microsoft Corporation | Virtual dimensions in databases and method therefor |
US7822629B2 (en) * | 1999-12-15 | 2010-10-26 | Hewlett-Packard Development Company, L.P. | Customer profiling apparatus for conducting customer behavior pattern analysis, and method for comparing customer behavior patterns |
US7007020B1 (en) * | 2000-03-10 | 2006-02-28 | Hewlett-Packard Development Company, L.P. | Distributed OLAP-based association rule generation method and system |
US6917940B1 (en) * | 2000-03-10 | 2005-07-12 | Hewlett-Packard Development Company, L.P. | Olap-based customer behavior profiling method and system |
US6687693B2 (en) | 2000-12-18 | 2004-02-03 | Ncr Corporation | Architecture for distributed relational data mining systems |
US7472127B2 (en) | 2002-12-18 | 2008-12-30 | International Business Machines Corporation | Methods to identify related data in a multidimensional database |
CN100359495C (zh) * | 2003-09-04 | 2008-01-02 | 上海格尔软件股份有限公司 | 基于数据仓库的信息安全审计方法 |
WO2005038613A2 (en) * | 2003-10-17 | 2005-04-28 | Hydralift Amclyde, Inc. | Equipment component monitoring and replacement management system |
-
2004
- 2004-06-22 US US10/873,676 patent/US7627555B2/en not_active Expired - Fee Related
-
2005
- 2005-05-02 CA CA002506135A patent/CA2506135A1/en not_active Abandoned
- 2005-05-03 KR KR1020050037086A patent/KR101034428B1/ko active IP Right Grant
- 2005-05-10 AU AU2005201996A patent/AU2005201996B2/en not_active Ceased
- 2005-05-17 BR BR0502063-8A patent/BRPI0502063A/pt not_active IP Right Cessation
- 2005-05-23 CN CN200510074012XA patent/CN1713180B/zh not_active Expired - Fee Related
- 2005-05-24 MX MXPA05005536A patent/MXPA05005536A/es active IP Right Grant
- 2005-06-03 EP EP20050104834 patent/EP1610237A3/en not_active Ceased
- 2005-06-07 JP JP2005167100A patent/JP4716796B2/ja not_active Expired - Fee Related
- 2005-06-21 RU RU2005119376/09A patent/RU2398273C2/ru active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030145000A1 (en) | 2002-01-31 | 2003-07-31 | International Business Machines Corporation | System and method of using data mining prediction methodology |
US20030236784A1 (en) | 2002-06-21 | 2003-12-25 | Zhaohui Tang | Systems and methods for generating prediction queries |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102058124B1 (ko) * | 2019-01-25 | 2019-12-23 | (주)비아이매트릭스 | 피벗 테이블 구조의 olap 결과를 이용한 딥러닝 예측 데이터 반영 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP2006012143A (ja) | 2006-01-12 |
CN1713180A (zh) | 2005-12-28 |
RU2005119376A (ru) | 2006-12-27 |
CA2506135A1 (en) | 2005-12-22 |
US7627555B2 (en) | 2009-12-01 |
AU2005201996B2 (en) | 2010-07-08 |
RU2398273C2 (ru) | 2010-08-27 |
AU2005201996A1 (en) | 2006-01-12 |
EP1610237A3 (en) | 2006-12-13 |
MXPA05005536A (es) | 2006-01-11 |
BRPI0502063A (pt) | 2006-01-10 |
CN1713180B (zh) | 2013-05-08 |
JP4716796B2 (ja) | 2011-07-06 |
EP1610237A2 (en) | 2005-12-28 |
US20050283459A1 (en) | 2005-12-22 |
KR20060047700A (ko) | 2006-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101034428B1 (ko) | 다차원 표현식과 데이타 마이닝 확장을 결합하여 olap큐브를 마이닝하는 방법 | |
US20230376487A1 (en) | Processing database queries using format conversion | |
JP7273045B2 (ja) | Sqlクエリプランを最適化するための次元コンテキスト伝搬技術 | |
US12079245B2 (en) | System and method for supporting large queries in a multidimensional database environment | |
EP3435257B1 (en) | Metadata-based general request translator for distributed computer systems | |
US20230084389A1 (en) | System and method for providing bottom-up aggregation in a multidimensional database environment | |
US8229923B2 (en) | Multidimensional data space queries with expression evaluation | |
US8447721B2 (en) | Interest-driven business intelligence systems and methods of data analysis using interest-driven data pipelines | |
US20140122413A1 (en) | Bulk read and write between multi-dimensional data structures | |
Chavan et al. | Survey paper on big data | |
JP2014120153A (ja) | 列ベースのデータベースに対する列スマートな機構 | |
KR20200103543A (ko) | 지식-구동 연합 빅 데이터 쿼리 및 분석 플랫폼 | |
US20150081353A1 (en) | Systems and Methods for Interest-Driven Business Intelligence Systems Including Segment Data | |
KR20200103544A (ko) | 지식-구동 연합 빅 데이터 쿼리 및 분석 플랫폼 | |
US10776368B1 (en) | Deriving cardinality values from approximate quantile summaries | |
US20160379148A1 (en) | System and Methods for Interest-Driven Business Intelligence Systems with Enhanced Data Pipelines | |
CN111971666B (zh) | 优化sql查询计划的维度上下文传播技术 | |
Balamurugan et al. | A SYSTEMATIC STUDY OF DATABASES FOR AN ARCHAEOLOGICAL DATA MANAGEMENT | |
Rajadnye | Is Datawarehouse Relevant in the Era of Big Data? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140417 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160419 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170420 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20180417 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20190417 Year of fee payment: 9 |