TWI230344B - Method and system for online analytical processing (OLAP) - Google Patents

Method and system for online analytical processing (OLAP) Download PDF

Info

Publication number
TWI230344B
TWI230344B TW092128546A TW92128546A TWI230344B TW I230344 B TWI230344 B TW I230344B TW 092128546 A TW092128546 A TW 092128546A TW 92128546 A TW92128546 A TW 92128546A TW I230344 B TWI230344 B TW I230344B
Authority
TW
Taiwan
Prior art keywords
data
item
index
dimension
scope
Prior art date
Application number
TW092128546A
Other languages
English (en)
Other versions
TW200413969A (en
Inventor
Patrick Arras
Alfons Johann Steinhoff
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Publication of TW200413969A publication Critical patent/TW200413969A/zh
Application granted granted Critical
Publication of TWI230344B publication Critical patent/TWI230344B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/957Multidimensional
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

1230344 玖、發明說明: 【發明所屬之技術領域】 本發明通常係關於電腦所執行的資料庫管理系統,尤其 係關於對應的0LAP (線上分析處理)與資料倉儲應用。更具 體的說,本發明係關於一種用於産生資料記錄之使用者定 義的呈現(presentation)或檢視(view)之方法及系統,該等資 料記錄被包含在該資料庫管理系統中。更具體的說,本發 明係關於具有大量資料記錄的資料庫管理系統。 【先前技術】 貝料倉儲與線上分析處理⑴LAp)應用已突顯對快速儲存 及擷取多維資料的需求。資料倉儲係一企業的多種商務系 統所收集的資料的所有部分或重要部分之中心儲存庫 (repository)。有時術語,,資訊倉儲,,被使用來取代資料倉 儲。通常,資料倉儲被容納在企業主要伺服器上。在一資 料倉儲資料庫上有選擇地擷取且組織來自多種線上交易處 理(OLTP)應用及其他來源之資料,以供分析應用與使用者 查。旬使用。貝料倉儲作業強調自不同來源操取資料,以進 行有用的分析及存取,但是通常不是就—般使用者或可能 需要存取專業(有時爲區域)資料庫的知識卫作者的觀點出 發。後-種技術通常稱爲資料超市,資料採擷_ mining)、資訊網採操及㈣支㈣統⑽s)是可利用 儲之三種應用。 、” 0LAP係讓使用者能夠 並檢視貧料的電腦處理。 輕鬆且有選擇地自不同觀點擷取 舉例而言,使用者可請求:分析
O:\88\88301.DOC 1230344 負料,亚以試算表顧-τ* it ^ ^ λα-、 、开衣α不某豕電信公司在該年度 在某國家銷售之所有的行動電 寺疋月伤 止& 動以產品,比較該特定月份盥 先?份之相同産品的營收數字,接著觀看在相同期間裏 该國家中其他産品銷售的比較。 、 域以局於某個價格而出售之所古在口 丨貝〜售之所有産品」,並顯示該等維度。 多種屬性(例如時期)可細分爲子屬性。 類似於資料倉儲’ OLAP可被用於資料採擷或發現資料項 爲促進此類分析,會將0LAP資料儲存在一種多維資 中。儘管-關聯性資料庫可視爲兩維資料庫,但是一種多 維資料庫將每—資料屬性(通常稱爲"資料索引鍵",例如產 品、地理銷售區域和期間)視爲個別獨立的維度。OLA?軟 體可定位多個維度之交集,例如,「在某時期中,在東部區 之間先前未察覺到的關係。由於不是所有的異動資料都爲 趨勢分析所需要,所以〇LAP資料庫不需要像資料倉儲一樣 大。藉由開放式資料庫連接(0DBC),可自現有的關聯性資 料庫匯入資料,以建置一適用於〇LAp的多維資料庫。 如上所述,主要是按照支援一般使用者分析及導覽活動 之合併(consolidated)資料的動態多維分析來確定〇LAp功 能性,包括·· 整個維度(dimensions)、階層架構(hierarchies)及/或成員 所套用的計算及模型化; -跨越連續期間的趨勢分析; -爲在螢幕上進行檢視而分割(slice)子集; -鑽研至合併(consolidation)之較深層級;
O:\88\88301.DOC 1230344 -直接到達基礎詳細資料(detail data);及 -轉換成在檢視區域中之新的維度比較。 通常會在一多使用者用戶端/伺服器環境中建構〇LAp, 且不管貧料庫大小及複雜性,都試圖對資料庫存取提供穩 定快速的回應。貧料庫存取所傳送之資料通常會藉由如下 方式而主現、、’a般使用者·交又表(cross-table);樞紐分析 呈現(pivot presentations);或主要由已呈現之資料記錄單元 格排列疋義之基礎資料庫的部分甚至整體内容的檢視。在 使用-普通電腦螢幕的通常狀況下,該排列必須是兩維 的。樞紐分析呈現之另一實例係在一電腦記憶體、資料庫 或其類似物中提供的二維資料陣列。 該基礎資料庫之每-資料記錄由許多賴屬性或資料索 引鍵組成,如圖1所示,其中由資料索引鍵的數目來確定該 等資料記錄之大小,且因同樣地由資料索引鍵的數目來決 定此整個資料庫之大小。 一特定樞紐分析呈現通常取決於資料記錄(如顧客資 訊、賣給顧客之對應物品,及銷售每一物品的時間)内容之 特殊索引鍵排列的預指定使用者喜好狀(prefer⑽e)。因 此’經常需要在該樞紐分析呈現之單元格中,彙總不同資 料記錄的内容或給定的資料記錄的資料索引鍵元素。 存在許多用於在—多維諸料産生㈣記錄之樞紐分 析呈現的方法。第一種方法使用著名的簡單查詢語令 (观),來藉由資料庫查詢而獲得—現有的資料庫之使用者 疋義的樞心析檢視。但是因爲必須存取該資料庫中儲存
O:\88\88301.D0C 1230344 之所有資料記錄,以檢查其是否符合該等基礎查詢條件, 所以在-較大型資料庫中之樞紐分析檢視的計算要求相當 多的處理資源。 就:二種方法而言’其具有已知的〇心軟體工具,其中 因爲藉由超立方(hyper-cubic)資料結構在内部處理資料記 錄,所以需要大儲存容積以儲存中間產生的〇LAp資訊。 根據第三種方法,結合上述第—種與第二種方法,以提 供一對應的混合概念。但是,因爲效能顯著變化,並且高 度依賴實際的樞紐分析呈現,所以該第三種方法也是不: 的。 【發明内容】 因此本發明之-目標係提供—種電腦所建構之方法及系 統,該方法及系統用於產生一資料庫管理系統中包含之資 料記錄的使用者定義之n維矩陣呈現或檢視,該等呈現或檢 視更具效率,並因執行速度比相對應先前技術的方法更 陕且避免了上述先前技術方法的上述缺點。 另-目標係提供-種可運用在一具有合適回應時間之" 線上分析處理”(0LAP)環境中的相對應方法及系統。 還有一目#係提供一種僅需要最少量之處理資源來産生 該等矩陣呈現或檢視的相對應方法及系統。 以上目標可由獨立的申請專利範圍之特點獲得。有利的 貝施例爲。亥等子巾請專利範圍(灿山㈣的主題㈣咖以 matter) ° 本發明之基本觀點係多維資料庫之基礎資料記錄的序列
O:\88\88301.DOC 1230344 化,例如該等基礎資料記錄以一連續資料序列的形式排列 成- m維事實資料|。該序列因此由替代符號值 (Placeholder value)(較佳爲整數)組成,其中該等替代符號 中的每值都是藉由參考表或向量,而連結至基礎不變 的m維事貫資料表。然而,該矩陣呈現之維度n可等於該維 度m。 基礎機制特別包含以下步驟:將屬於一明確資料索引鍵 之所有資料值攔位的内容轉換成索引值(充當索引值的記 、彔數字除外),以及基於該等索引值,執行用於産生最終矩 車呈見之所有排序步驟,意即,整個排序機制或整個排序 引擎僅使用該等索引值。 μ提到在例示性的二維狀況下,該η維矩陣呈現之,,基 數"意指該二維矩陣之行與列的數目。在更多維度心 η>=2)之狀況下,該基數相應地定義必要的呈現資源。 在一較佳實施射,會將在—基礎料呈現之單個單元 格中所要呈現的資料記錄(例如2維圖像矩陣之一列)連續地 =列成包含各自替代符號值之子序列。因此利用對應之該 專子=列而產生榷紐分析呈現之該等單個單元格。因此, =早:秸之;^紐分析檢視而言,可使用資料記錄之整個 序列的資料子序列。传用去 ^ 一 斤払疋的樞紐分析呈現所需之 吞亥專卓元格中的每一個胜兄丨丨〜M > _ 特別疋義爲在該序列中的開始點, 以精由5亥開始點來存取样g „ 仔取待呈現之事實資料表所需的資料。 二終矩陣呈現藉由該資料序列而產生,藉此僅使用上述 纽來參考n維事實資料表。換言之,因此利用虛擬
O:\88\88301.DOC -11- 1230344 2維矩陣來獲得該矩陣呈現。 在該較佳實施例中,藉由_包含較佳由整數組成之上述 序列的線性向量而實現上述資料序列。由此,藉由該序列 向量而重新排列每一維度(群組)之資料記錄,例如被包括在 事實資料表中之資料記錄,以用於各自的使用者定義的植 紐分析組態。因爲進而利用資料記錄索引數來完成對使用 序列向量之真實資料記錄的存取,所以可即時(意即線上, 意即無任何延遲或僅有㈣短的延遲或使用者回應時間) 執行待被用於特殊枢紐分析呈現(意即待呈現於特殊搞紐 分析檢視中之行與列)之單元格的計算。 根據另一實施例’首先將該基礎事實資料表轉換成一參 考表’用以依據該參考表而産生該序列。在另一實施例中, 會利用-計數向量,以決定資料記錄之該等維度中的兩個 維度之間的轉換。 因此’根據本發明之機制不需要為了計算可能樞紐分析 呈現的目的,(例如)藉由需要相當多資料處理與資料储存資 源的所有資料記錄預彙總’來預處理資料庫之資料記錄。、 另外#因於中間序列化步驟,因而可擴大資料記錄之 總量及因此可擴大資料庫大小,同時不會影擊可能枢紐分
析呈現(檢視)’其中所需的處理時間單位隨基礎資料庫之大 小而按線性比例變化。因此,筮 祕危丄A 該等至少4 射㈣料記錄之 以至一維之至少第二維上。因此可互相映射資料庫之 貢料記錄的任意維度,因此使職藉由插人詩記錄之其 他維或甚至其全部等級階層架構’來擴展現有的資料庫。
O:\88\88301.DOC -12- 1230344 與以上討論之先前技術方法相比,根據本發明之機 ,要進行諸如大型資料集之較作㈣計算樞紐分析 主現。 另外’可在枢紐分析呈現之不同彙總階段中多次使用資 料庫之特殊資料記錄維度,同時無任何執行時期的問題。 因關對給定資料庫之其後的樞紐分析檢視使用向量 運算,所以用於提供-使㈣定義的枢紐分析檢視之資料 記錄的先前已産生的序㈣持有效,以用於其後的拖组分 析檢視,且因此其後的枢紐分析檢視總是由現有的樞紐分 析檢視推斷而來,因此不破壞現有的樞紐分析檢視。 在本發明之另一態樣中,所選擇的2維樞紐分析呈現通常 基於由行列數目確定的虛擬2維矩陣。提議的柩紐分析檢視 處理機制因此爲-給定的樞紐分析呈現提供行列數量,此 外,還按上述子序列順序來提供行與列的交集點。因此, 可僅藉由單元格之行與列索引來完成虛擬矩陣之該單元格 的呈現。 因爲藉由僅使用純參考和計數技術以及執行整數值之簡 單線性(一維)向量運算,來産生或計算樞紐分析呈現,所以 可利用貧料庫記錄迅速產生一任意的使用者定義的樞紐分 析呈現。 吾人強調根據本發明之樞紐分析呈現機制並不限於2 維’其也可被應用於η維樞紐分析呈現。但是,在該η維狀 況下,上述序列向量爲(η-1)維。 【實施方式】
O:\88\88301.DOC -13- 1230344 下文中展示,對在通常狀況下由二維真實事實資料表所 表示之給定的真實事實量而言,如何根據本發明來產生任 意的樞紐分析表(交叉表)檢視。吾人強調該基礎樞紐分析表 產生機制可用於爲n維資料集產生m維矩陣呈現。另外,可 用最少成本及消耗時間建構該機制,且僅需要最少計算資 源,且因此使得産生高效能。 此處假設,真實事實量包括資料索引鍵(每一資料索引鍵 定義一個索引鍵維度(key dimension))以及每一索引鍵維度 中包含之資料值。檢視藉由以下各項提供事實量之枢紐分 析··該等索引鍵維度之使用者所選擇的已排序排列、在該 樞紐分析檢視之已呈現的維度中之索引鍵維度的排列及一 可能的彙總層級,此在下文中更詳細地展示。 在圖1&與比中展示,在當前狀況下由一真實事實資料表 所表示之例示性事實量,及該真實事實資料表之例示性枢 紐分析檢視。在該實例中’該真實事實資料表包含排列成 索引鍵維度之銷售數字i 3 〇、「顧客(Cust〇mer)」i 〇〇、「物品 (Article)」11〇及「月份(M〇nth)」12〇。圖❶中展示之對應 例:性樞紐分析檢視,按如下順序呈現圖u所展示之真實 事實資料表的(事實)資料值14〇:「顧客」/「物品」/「月份」 150〜170 (圖中所不之左邊三行),及銷售之總計值(右邊行) 140。因此該等索引鍵維度,即「顧客」15〇與「物品」⑽ 在垂直方向呈現’其中索引鍵維度「月份」被囊總成曰曆 季度值Q1」〜Q4」17〇,且呈現於在該樞紐分析檢視之 水平方向。
O:\88\88301.DOC -14- 1230344 產生該樞紐分析檢視之基礎機制的概念基礎為:將使用 者所選擇之每一任意樞紐分析呈現歸納成為基礎事實量之 資料值的連續排序排列(例如一序列向量)。圖2a至圖2c展示 該機制之一較佳實施例。 在本實施例中,如圖2a所示,首先藉由一連續索引值2〇〇 (左邊行)來擴展基礎真實事實資料表,在本實例中,該索引 值提供事實的自「1」至「20」的連續編號。 在圖2b所展示之所得樞紐分析檢視中,在每一單元格2 i 〇 中,該等事實之索引呈現在對應的單元格中必須求和的銷 售值。 如上所述,基於一序列向量來產生圖21?所示之樞紐分析 檢視。圖2c中描繪圖2b中之柩紐分析檢視的基礎序列向 $,且由兩行260、270組成,左邊行260包含在本實例中再 -人自「1」至「20」的連續數字,而右邊行27〇包含圖仏所 描繚之上述索引值275’該等索引值係已排序的排列形式而 得以按順序地建立圖2b之樞紐分析檢視。 爲更好地理解序列向量,該序列向量之内容展示於相反 方向’意即’自圖2b所描緣之樞紐分析檢視開始。因此, 藉由在樞紐分析呈現之單元格21〇中對該等索引逐行且自 左向右地求和,如在該樞紐分析檢視之前兩行中由箭頭… 所展示,吾人將獲得圖2〇所描繪之序列向量。 如^所述’僅藉由向量運算來產生枢紐分析檢視,而基 礎向量僅包含整數值。因細下描述的處理步驟均不使用 實際的資料索引鍵值’如文字鍵值、本文或任何其他真實
O:\88\88301.DOC -15- 1230344 事只值,所以在此獲得相當完 考w丰_ 銳的效能收益。在所有竽黧 處理步騍中,僅使用上 有該4 奴老w 数(參考)值。僅當已完成該篝敕 數處理步驟時,包含在所得序列向量中之成=整 後所描述之指派或參考(杳 多 精稍 值。 (―力)表而轉換回對應的真實事實 勺㈣中,圖3a中所騎之真實事實資料表所示, :事實資料表中之具有不同的索引鍵維度的所有資 枓(如顧客姓名L,,與,也。·"),被在該索引鍵維度中之 2^考值鳩所取代,其中該等唯—參考值充當替代符號 值使用。圖2a所示之例示性真實事實資料表的事實量在轉 換爲上述參考數字後,被展示於圖h中。 在圖3b中展示用於轉換成參考數字之基礎_。轉換係 以數個指派(或參考)表350〜37〇為基礎,其中會使用已知的 查詢錢制,利用指派(或參考)表將具有不同的索引鍵維度 之真實事實指派給上述參考值。如圖3b所示之索引鍵維 度:"顧客"350、"物品,,360及"月份"37〇。如圖沘所展示之 另一索引鍵維度”季度(Quarter)"3 8〇係充當一彙總等級階層 架構使用,以使能夠進一步彙總索引鍵維度,,月份"3 9〇。 對圖2a中所描繪之真實事實資料表的每一個索引鍵維度 而言,第一整數向量410關於各個索引鍵維度與該等索引鍵 維度之元素(參考值)的項目(occurrence),來提供基礎事實 行之事實排序次序。第二整數向量400提供一第一區塊元素 (FBE),該區塊元素爲一個索引鍵維度元素(例如”^㈣心 之母一肇項目’指示在排序序列41 0中其對應區塊的第一元 O:\88\88301.DOC -16- 1230344 素。現在參考圖4a至圖4c,在圖式中展示此。因此,在圖 4a至圖4c中左邊所描述之資料表,在右邊呈現的排序向量 中提供母一索引鍵維度的第一輸入項之參考索引。因此, 例如圖4a所展示之索引鍵維度,,顧客”,索引鍵,,Br〇wn,,之所 有事實數字420排列於行!至7中,索引鍵"J〇nes,,之所有事實 數字430排列於行8至14中,索引鍵” Miller ”之所有事實數字 440自行15排列至資料表的末端。 在該描述之末尾處更詳細地描述,用於獲得包含該排序 次序之第一整數向量41〇與包含第一區塊元素索引之第二 整數向量400所必需的方法。 值得注意的是,很容易利用"月份"之向量衍生而得索引 鍵維度"季度"之對應表示,且因此在此處不再描述。 現在參考圖5及圖6a至圖6g,下文描述如何利用上述整數 向量計算技術來排序該真實事實資料,以獲得所要的摇紐 分析檢視。以提供—預排序步驟開始(該預排序步驟提供用 於最終排序之事實的第—逐區塊排朴逐步計算該排序、(竟 :,爲樞無分析呈現的每個索引鍵維度計算—次),以顯示 最終的排序次序。藉由該等處理㈣,每個待被排序之索 引鍵維度産生了新的群組,該等群組充當用於以下排序步 且用於在計算結束時提供樞紐分析呈現之單元格的内 容的基礎。 =例中,藉由排序索引鍵維度"顧客"來顯示該等預 …相關向量’按圖5所展示的方式,將該等圖 ^ 不之命名爲”映射(maPPing)表”與"排序位置指標
O:\88\88301.DOC -17- 1230344 (Son P〇sition pointer)"表初始化。應強調,圖5所示之資料 表僅爲一快照集(snapshot),該快照集描述按"顧客"對應" 物扣對應"季度"的整個排序過程中之„顧客"對應"物品"的 具體排序步驟。吾人將提到,遞迴地處理所有該等資料表, 其中在每-排序步驟結束時,在各自的後續排序步驟中, 在"映射"表與"排序位置指標”表中會重新使用包含在攔位 ’’Fact# NewGrp"中之”結果排列,,資料表的事實。然而,爲了 在第一排序步驟前初始化該等資料表,按以下方式初始化” 映射”表與”排序位置指標”表之行。 在”顧客”之當前狀況下,意即利用該"真實事實,,資料表之 上述唯一參考值300,將排序序列之第一維度填入該"映射" 表之"TmpGrp"行的每一欄位。另外,利用對應維度之上述 FBE資料表的,,Pos"行4〇〇來初始化該"排序位置指標"表之 "NextPos”行的每一攔位。 在所有排序步驟期間,會將對應維度(意即在該對應排序 序列步驟中之右邊維度)之"已排序序列料表的"事實 (Fact)"行4U)填入"已排序序列"資料表之"以㈣"行。因此, 在兩個上述初始化步驟之後清除"結果排列”内容,使得可 在下一排序步驟中重新填充該等攔位。該資料表中之行 (lme)的數目等於包含在真實事實資料表中之事實的數 目。以下進行的處理步驟由關於索引鍵維度"物品"之排序 次序決定,該索引鍵的排序次序在該等圖式中命名爲"已 排序序列”。 在圖6a至圖6g所示之圖片序列中,更詳細地展示該排序
O:\88\88301.DOC -18 - l23〇344 *彳本身°亥等圖片中的每一個圖片都展示單個排序步 =該序列所示之排序步驟之整個序列因此僅描述整個排 序之。卩刀。該整個程序係以展示之四個資料表的内 連結為基礎。 ^ 百先’按自"1"至,,20"之參數"pseq"的:欠序,來處理索引 鍵維度"顧客"之先前排序步驟而產生之索引鍵維度"物品" 的貪料表(名爲”已排序序列”)。具體地說,對包含在行 ”Fa^"中每—事實數字中而言,在該映射表中,確定—命 名爲’’TmpGrp”之對應索引。 在排序位置指標”表中使用圖6&所示之排序步驟中的所 件索引(具體爲所得的整數值”3”),以確定下一位置 "NextPos”的值,意即,可藉由在一結果排列資料表中之目 標索引來識別當前事實數字之值。另夕卜,包含在該映射表 之行”LDGrp”中的對應值與包含在,,已排序序列,,資料表中 之對應值’’DGrp”相比較。若該等兩個值不同,則該索引在,, 、、xr 果排列(Result Permutation)’’ 資料表之行,,開始(start)" 中標記爲,,真(TRUE)",因此定義一新的群組的開始。應提 到,在圖6a中’在該程序之已展示狀態中尚未加入參數 丨’NextPos’’。 圖6b至圖6f展示另外5個步驟’且省略了步驟7至步驟 19,圖6g展示命名爲”結果排列”之最終所獲得的排列資料 表(向量)。由此,在圖6g所示之”結果排列,,資料表之” 行中,儲存’’顧客’’對應’’物品’’之排序步驟的結果。 在圖7中,再次展示圖6 g所描繪之最終結果排列資料表。 O:\88\88301.DOC -19- 1230344 其代表成相關排序序列排列之目㈣紐分 iwGrp”中,藉由自第-列開始將該群組索引增加”"而: 母一列指派一個值。若在杆” P』私”击 隹仃開始中,各個行標記爲布林 值π真”’意即被標記爲一新的群組的開始點,則完成增量 之建立。該等群組係相關於由真實事實所提供之索引鍵: 度”顧客"及"物品,,之可能的不同組合。可在執行以上程序過 程中容易地確定並管理對應於該等索引鍵維度中之該等群 組的參考數字,而該等參考數字提供存取真實事實之最終 呈現所需之各自基礎索引鍵本文。 進一步參考圖8,其展示自先前排序步驟"顧客”對應”物 品’’之結果開始,初始化下一排序步驟,,顧客,,對應”物品” 對應π季度’’。吾人提到包括一額外彙總步驟,其中將維度” 月份”彙總成”季度’’。藉由一指示值項目的對應,,pseq,,數字 來初始化”排序位置指標”表之,,NextP〇s"行,該指示值在本 實施例中爲”結果排列"資料表之”開始”行中之布林值,,真,,。 自”結果排列”資料表之”Fact#”行開始,該行之每一攔位 充當一進入點(entry point)使用,該進入點用於將圖8中所 描繪之”映射"表之"TmpGrp"行中的,,一對應值填入"結果排 列"資料表之’’NewGrp’,位中。 在圖8至圖1 〇中,根據先前圖式來展示本實施例之最終排 序步驟,因此顯示該最終樞紐分析呈現。因此,基於在行 nFact#n中提供之事實數字與在行”NewGrp”中提供之群組 索引,來再次初始化(如上所述)另一對應之π映射”表及”排 序位置指標Μ,此使得產生索引鍵維度π季度”之下一排序序 O:\88\8830l.DOC -20- 1230344 列。在圖8中描述該初始化之結果資料表。在圖%至圖奵 中,展不最終排序序列之前5個步驟及最後排序步驟。該等 圖片對應於相似的圖6b至圖9g,因此此處不再更詳細地描 述。 、、整個排序序列,以計算圖10所描述之”樞紐分析序列”資 料表而結束。以此方式,整個程序爲已排序的索賴維度f, 顧客,,對應”物品”對應”季度”的當前樞紐分析呈現揭示一次 序序歹]向里。该次序序列向量儲存在,,結果排列f,資料表之 Fact#行中。於行”NewGrp”中提供之基礎群組索引係關於 基礎樞紐分析呈現或檢視的對應單元格。基於行”Fact#,,中 之各個輸入項可很容易地確定該等進一步對應事實參考。 上述給定實例僅由一個用於樞紐分析檢視之水平規格的 索引鍵維度組成。應提到,該排序程序不限於任何數量的 索引鍵維度,其中該等索引鍵維度用於樞紐分析規格(piv〇t specification) 〇 整個程序爲每一樞紐分析維度確定一單獨排序序列。藉 由將該排序程序應用至單獨産生之序列而産生整個序列, 其中所述作業自第一序列之結果開始,且將下一序列作爲 该上述之’’映射”表與"排序位置指標”表的輸入。 整個排序程序也適用於圖3a所示之真實事實”資料表的 子集。應提到,圖5所示之’’映射”表之列的數目對應於,,已 排序序列π資料表中之’’Fact#’’行的最大可能值,意即,該” 真貫事貫11資料表之事實列的數目。在僅有該等事實之一子 集應用於該排序過程的狀況下(例如歸因於篩選準則),可將 O:\88\88301.DOC -21 - 1230344 该映射"表之大小縮減爲已選擇之事實的大小。當"已排序 序列"資料表之"Fact#"行的每一上述初始化,均使用對應子 序列中之真實事實索引的相關索引時,可達成該項縮減。 該排序過程之結果儲存在"結果排列"資料表之I㈣"行 中’而該”結果排列"資料表需要被轉換回真實事實索引。 如上所述’ ”第一區塊元素"(FBE)整數向量400與"排序次 序整_數向1410係用於初始化每一排序步驟。計算關於圖 h所不之'’真實事實料表之索引鍵維度行31G的LBE索引 向量。在第-步驟中,計算該計數向量,其中該計數向量 之每-攔位包含該"真實事實# ”資料表中之對應索引鍵維 度之對應參考數字項目的數字。該計數向量中之每個值反 映對應參考數字的區塊長度。處理自第-攔位至最後攔位 求和該等值的計數向量,爲每—㈣提供—對應群組之開 始。該結果儲存在FBE索引向量4〇〇中。 利用該排序程序來計算”排序次序”整數向量41〇。在此狀 況下,將相同值(例如”1”)填入”已排序序列”資料表之 nDGrp.”行的每個欄位中。將”FSeq"行之對應值填入"hew,, 行之每個欄位。將圖3a所示之對應維度索引鍵的值填入”映 射表之"TmpGrp”行的每個欄位。將對應維度索引鍵之 nFBE”整數向量400填入該”排序位置指標,,表之,, 行。一初始化即執行該排序程序,在”結果排列,,資料表之 ’’Fact#”行中提供該”排序次序”整數向量41〇。 應提到,當在當前樞紐分析規袼内使用一階層層級 (hierarchy level)(例如”季度”)時會使用相同程序。當^二維 O:\88\88301.DOC -22- 1230344 度索引鍵(例如"月份”)之真實事實行轉換爲該階層層級之 麥考數字時,可計算,,FBE”與”排序次序”整數向量。 最後再次參考圖2b與圖7,其中更詳細地描述如何根據本 發明來計算該等進入點。該最終樞紐分析呈現之基數(例如 2維樞紐分析呈現中之行與列的數目)是排序程序之另一結 果。對框紐分析檢視之每個維度而言,對應樞紐分析檢視 維度之基數視樞紐分析規格及事實而定,該等事實作爲樞 紐分析檢視之輸入。在給定的實例中,在”顧客”對應”物品 的排序步驟後,可衍生出垂直維度之基數。”結果排列,,資 料表之"NewGrp.”行的最後欄位(參看圖6g)包含所得群組之 數目。該數目相當於所得樞紐分析檢視之垂直維度的基 數。因此,獨立地進行每一樞紐分析維度提供了對應樞紐 分析維度所需的基數。 【圖式簡單說明】 別文中藉由參考附圖來更詳細地展示本發明,附圖使本 發明之其他特點與優點變加明顯。 在以下圖式中·· 圖1 a及圖b描述在先前技術中已知的一例示性真實事實 資料表,及一對應樞紐分析檢視; 圖2a至圖2c展示用於藉由資料表而產生根據本發明之樞 紐分析檢視之機制的基本原理; 圖3a至圖3c展示用於產生根據本發明之樞紐分析檢視之 機制的其他細節; 圖4a至圖4c展示用於産生根據本發明之序列向量的典型
O:\88\88301.DOC •23· 1230344 向量運算; 圖5至圖6g展示多個總覽資料表圖解(〇verview table diagram),其用於展示如何儲存真實事實資料,以獲得根據 本發明之所要的樞紐分析檢視。 圖7描繪根據本發明之最終結果排列資料表;以及 圖8至圖1 〇描述根據本發明之最終排序步驟。 【圖式代表符號說明】 100顧客 110物品 120月份 13 〇銷售數字 140資料值 150顧客 160物品 170月份 200索引值 210單元格 250箭頭 260左邊行 270 右邊行 275索引值 300 唯一參考值 310索引鍵維度行 350顧客
O:\88\88301.DOC -24- 物品 月份 季度 月份 整數向量 整數向量 事實數字 事實數字 事實數字 -25-

Claims (1)

  1. 工23〇》齡28546號專利申請案 中文申請專利範圍替換本(93年11月) 拾、申請專利範圍: 一種電腦所建構的方法,其用於産生一 m維資料庫之至 少一部分的一任意n維矩陣呈現,該㈤維資料庫由具有 至少一索引鍵維度與至少一對應資料值攔位的多筆真 實資料記錄組成, 该方法包含以下步驟: 根據該η維矩陣呈現,來計算該等資料值攔位之多個 輸入項的一排序序列; 對該η維矩陣呈現之每一維度而言,將對應進入點資 訊計算成該排序序列; 基於該已計算的排序序列與該已計算的進入點資 吼,來計算該η維矩陣呈現之基數; 2. 基於該基數而産生該任意η維矩陣呈現,其中基於咳 排序序列與該進人點資鱗處理料資料值攔位。/ =專利範圍第1項之方法’其中將所有資料記錄之 ㈣索引鍵維度轉換爲索引值’該等索引值參考該等索 引鍵維度之對應鍵項目的屬性 , 蜀f生且其中將多個已 索引值重新轉換回該真實資料, 現。 産生該任意矩陣呈 3. 4. 如申凊專利範圍第2項之方法 個索引鍵維度之該等索引值。 如申請專利範圍第2項或第3項 示該等索引值。 >其中由一向量來表示一 之方法,其中由整數來表 5·如申請專利範圍第2項或第3垣— 貝之方法’包含以下特殊步 卿 i更 年 η % 驟: 爲該資料庫之每一維度,產生一專門由該等整數值組 成的參考表,其中該參考表包括每-資料記錄之多個記 錄識別項,由此保持該資料庫之維度結構,· 基,該參考表,藉由基於該任意矩陣呈現之維度結構 的、、、屯里向置運算(scaIar vector ορ咖―),來產生 列向量; β 土於。亥參考表産生_提供資料記錄之該至少一維产 中包含的資料記錄量的計凄 m ^ ^ 又 7寸數向里,因此定義資料之不同 的該至少一維度間的轉移; 6. 呈現“枓庫之該任意矩陣呈現,其中利用該等資料 =項,使用包含在該序列向量與該計數向量中之該真 =^來使多個身料記錄之該至少—維度形成群組。 整數。 、之方法’其中該序列向量僅包含 7.如申請專利範圍第2項或第3項 貝 <方法,其中會基於一 一區塊元素(FBE)索引及/或— 罘 最後區塊元素(LBE)帝引 來計算該進入點資訊之。 )家^ 8·如申請專利範圍第2項或第3 貝之方法,其中將真實資 記錄之該至少一維度的第一 4 、度,映射至真實資料絡 之該至少一維度的至少一第_ 、。、录 木一維度。 9·如申請專利範圍第2項或第3 方法,其中基於一直香 事實資料表而産生該參考表, 、一貫 I先會藉由提玄笑吉每 事實之一連續編號的連續专 ^ ^ Ά 、眾弓丨值來擴展該真實事實資 O:\88\88301-931109.DOC -2- WmM 料表。 ι〇·如申請專利範圍第2項或第 由兩行組成,左邊行包含該;之連 (27〇)包含已排序排列形式的=’且該右邊行 序建立該任意矩陣呈現。索引值’而得以按順 11 ·如申請專利範圍第2項或第3項之 整數之向量計算,以產生該任意㈣呈現中僅執行基於 12.如申請專利範圍第2項或第3項 ,二;序:=:= 該任意排料序。⑨步^㈣序,以揭示 專利範圍第2項或第3項之方法其中在—排序位 ^ 用由相序㈣所得之-索引值,以確 ::排列資料表中之一目標索引值,可藉由該目標 索引值來硪別一當前真實事實值的值。 1 4 .如申清專利範圍第1 3頁 一 祀固弟U項之方法,其中該結果排列資料表 表不一相關排序序列形式的目標矩陣序列。 15.似種儲存在_電腦可使用媒體上之電腦程式產品,該電 腦程式産品包含多個軟體程式碼構件,當在一電腦上執 行時該程式時,該等軟體程式碼構件促使該電腦執行如 申請專利範圍第1項至第丨4項中任一項之方法。 16· -種線上分析處理(〇LAp)系、统,其用於藉由—資料庫 之至少部分的多個任意n維矩陣呈現,來分析包含在該 O:\88\88301-931109.DOC 1230344 資料庫中之真實事實資料,其中該資料庫包含多個資料 記錄的至少一維度,每個資料記錄都包含至少一資料索 引鍵及一對應資料值欄位,該OLAP系統之特徵爲如申 請專利範圍第1項之該方法。 O:\88\88301-931109.DOC
TW092128546A 2002-10-18 2003-10-15 Method and system for online analytical processing (OLAP) TWI230344B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP02023362 2002-10-18

Publications (2)

Publication Number Publication Date
TW200413969A TW200413969A (en) 2004-08-01
TWI230344B true TWI230344B (en) 2005-04-01

Family

ID=32103886

Family Applications (1)

Application Number Title Priority Date Filing Date
TW092128546A TWI230344B (en) 2002-10-18 2003-10-15 Method and system for online analytical processing (OLAP)

Country Status (6)

Country Link
US (3) US7340476B2 (zh)
JP (1) JP4609995B2 (zh)
CN (1) CN1688998A (zh)
AU (1) AU2003286187A1 (zh)
TW (1) TWI230344B (zh)
WO (1) WO2004036456A2 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7263520B2 (en) * 2004-02-27 2007-08-28 Sap Ag Fast aggregation of compressed data using full table scans
US7774298B2 (en) * 2004-06-30 2010-08-10 Sap Ag Method and system for data extraction from a transaction system to an analytics system
CA2909815C (en) * 2005-01-12 2018-12-04 West Services, Inc. Systems, methods, and interfaces for aggregating and providing information regarding legal professionals
US8270612B2 (en) * 2006-12-18 2012-09-18 Sap Ag Mapping compound keys
US20090063458A1 (en) * 2007-08-31 2009-03-05 International Business Machines Corporation method and system for minimizing sorting
US8495007B2 (en) * 2008-08-28 2013-07-23 Red Hat, Inc. Systems and methods for hierarchical aggregation of multi-dimensional data sources
US20100076935A1 (en) * 2008-09-09 2010-03-25 Ahmir Hussain Method, system, and computer for analytical reporting and archiving of data
US8959050B2 (en) 2009-06-15 2015-02-17 Oracle International Corporation Mechanism for synchronizing OLAP system structure and OLTP system structure
US8549045B2 (en) * 2010-12-30 2013-10-01 International Business Machines Corporation Test data generation and scale up for database testing using unique common factor sequencing
US8751564B2 (en) * 2011-04-19 2014-06-10 Echostar Technologies L.L.C. Reducing latency for served applications by anticipatory preprocessing
CN103019951B (zh) * 2011-09-20 2016-12-07 阿里巴巴集团控股有限公司 有序数据的记录方法和装置、有序数据的访问方法和装置
US8635229B2 (en) 2011-10-18 2014-01-21 International Business Machines Corporation Sequenced query processing in data processing system
US8938416B1 (en) * 2012-01-13 2015-01-20 Amazon Technologies, Inc. Distributed storage of aggregated data
US8660985B2 (en) * 2012-04-11 2014-02-25 Renmin University Of China Multi-dimensional OLAP query processing method oriented to column store data warehouse
US9721321B1 (en) * 2012-04-12 2017-08-01 Farshad Nayeri Automated interactive dynamic audio/visual performance with integrated data assembly system and methods
CN103678420B (zh) * 2012-09-25 2017-02-01 北大方正集团有限公司 一种建立多维数据集的方法和多维数据集处理装置
US9646072B2 (en) * 2013-03-03 2017-05-09 Panorama Software Inc. Multidimensional dataset query processing
CN103235793A (zh) * 2013-04-01 2013-08-07 华为技术有限公司 联机处理数据的方法、设备及系统
US9965512B2 (en) 2013-06-25 2018-05-08 Sap Se Operators for constants in aggregated formulas
US10037355B2 (en) * 2015-07-07 2018-07-31 Futurewei Technologies, Inc. Mechanisms for merging index structures in MOLAP while preserving query consistency
CN106775742A (zh) * 2016-12-27 2017-05-31 中国建设银行股份有限公司 一种用户定制信息的扩展方法及系统
EP3678033A1 (en) 2019-01-07 2020-07-08 QlikTech International AB A computer implemented method for indexlet based aggregation
GB201916801D0 (en) 2019-11-19 2020-01-01 Ibm Identifying data relationships from a spreadsheet
GB201916804D0 (en) 2019-11-19 2020-01-01 Ibm Generating an OLAP model from a spreadsheet
GB201916803D0 (en) 2019-11-19 2020-01-01 Ibm Identifying content and structure of olap dimensions from a spreadsheet
GB201916800D0 (en) 2019-11-19 2020-01-01 Ibm Detecting errors in spreadsheets

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6850252B1 (en) * 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5875108A (en) * 1991-12-23 1999-02-23 Hoffberg; Steven M. Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US5727197A (en) * 1995-11-01 1998-03-10 Filetek, Inc. Method and apparatus for segmenting a database
US5787279A (en) * 1995-12-22 1998-07-28 International Business Machines Corporation System and method for conformationally-flexible molecular recognition
US5767854A (en) * 1996-09-27 1998-06-16 Anwar; Mohammed S. Multidimensional data display and manipulation system and methods for using same
US5978796A (en) * 1997-06-30 1999-11-02 International Business Machines Corporation Accessing multi-dimensional data by mapping dense data blocks to rows in a relational database
US6003036A (en) * 1998-02-12 1999-12-14 Martin; Michael W. Interval-partitioning method for multidimensional data
US6957341B2 (en) * 1998-05-14 2005-10-18 Purdue Research Foundation Method and system for secure computational outsourcing and disguise
US6334125B1 (en) * 1998-11-17 2001-12-25 At&T Corp. Method and apparatus for loading data into a cube forest data structure
US7272593B1 (en) * 1999-01-26 2007-09-18 International Business Machines Corporation Method and apparatus for similarity retrieval from iterative refinement
US6427123B1 (en) * 1999-02-18 2002-07-30 Oracle Corporation Hierarchical indexing for accessing hierarchically organized information in a relational system
US6560594B2 (en) * 1999-05-13 2003-05-06 International Business Machines Corporation Cube indices for relational database management systems
US20030171876A1 (en) * 2002-03-05 2003-09-11 Victor Markowitz System and method for managing gene expression data
EP1217540A1 (en) * 2000-11-29 2002-06-26 Lafayette Software Inc. Methods of organizing data and processing queries in a database system, and database system and software product for implementing such method
EP1211611A1 (en) * 2000-11-29 2002-06-05 Lafayette Software Inc. Methods of encoding and combining integer lists
EP1211610A1 (en) * 2000-11-29 2002-06-05 Lafayette Software Inc. Methods of organising data and processing queries in a database system
US20020138316A1 (en) * 2001-03-23 2002-09-26 Katz Steven Bruce Value chain intelligence system and methods
US20030033179A1 (en) * 2001-08-09 2003-02-13 Katz Steven Bruce Method for generating customized alerts related to the procurement, sourcing, strategic sourcing and/or sale of one or more items by an enterprise
US8090730B2 (en) * 2001-12-04 2012-01-03 University Of Southern California Methods for fast progressive evaluation of polynomial range-sum queries on real-time datacubes
US7076505B2 (en) * 2002-07-11 2006-07-11 Metrobot Llc Method, apparatus, and computer program product for providing a graphical user interface with a linear map component
WO2004029828A2 (en) * 2002-09-24 2004-04-08 Ismartsoft, Inc. Method and apparatus for data analysis

Also Published As

Publication number Publication date
CN1688998A (zh) 2005-10-26
US7856458B2 (en) 2010-12-21
JP2006503357A (ja) 2006-01-26
US7774302B2 (en) 2010-08-10
WO2004036456A2 (en) 2004-04-29
US20080183740A1 (en) 2008-07-31
US20060010147A1 (en) 2006-01-12
US7340476B2 (en) 2008-03-04
TW200413969A (en) 2004-08-01
AU2003286187A1 (en) 2004-05-04
WO2004036456A3 (en) 2004-09-30
US20080082563A1 (en) 2008-04-03
JP4609995B2 (ja) 2011-01-12

Similar Documents

Publication Publication Date Title
TWI230344B (en) Method and system for online analytical processing (OLAP)
US12032532B2 (en) System and method for automatic inference of a cube schema from a tabular data for use in a multidimensional database environment
Stolte et al. Multiscale visualization using data cubes
Gray et al. Data cube: A relational aggregation operator generalizing group-by, cross-tab, and sub-totals
US6442560B1 (en) Record for multidimensional databases
US8356029B2 (en) Method and system for reconstruction of object model data in a relational database
US8352495B2 (en) Distributed platform for network analysis
US10180992B2 (en) Atomic updating of graph database index structures
US5943668A (en) Relational emulation of a multi-dimensional database
US5926818A (en) Relational database implementation of a multi-dimensional database
JP2006503357A5 (zh)
US6446059B1 (en) Record for a multidimensional database with flexible paths
CN109952569A (zh) 用于基于字典的连接和聚合的技术
CN106547809A (zh) 将复合关系表示在图数据库中
US20040015486A1 (en) System and method for storing and retrieving data
US20170255708A1 (en) Index structures for graph databases
WO2008009018A2 (en) Spreadsheet-based relational database interface
WO2008066637A2 (en) Generation of a multidimensional dataset from an associative database
CN111611304A (zh) 知识驱动的联合大数据查询和分析平台
Weng et al. An approach for automatic data virtualization
US8504552B2 (en) Query based paging through a collection of values
Inoue An effective technique and practical utility for approximate query processing
Maghfiroh et al. Study of Search Algorithm Optimization from Multi-Version Data Warehouse using NoSQL Non-relational Database
Manjula et al. A methodology for data management in multidimensional warehouse
Libera et al. STRUCTURE CHARACTERISTICS OF DATA WAREHOUSE AND IMPLEMENTATION POSSIBILITIES FOR VARIOUS DIMENSION TYPES

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees