TWI230344B - Method and system for online analytical processing (OLAP) - Google Patents
Method and system for online analytical processing (OLAP) Download PDFInfo
- Publication number
- TWI230344B TWI230344B TW092128546A TW92128546A TWI230344B TW I230344 B TWI230344 B TW I230344B TW 092128546 A TW092128546 A TW 092128546A TW 92128546 A TW92128546 A TW 92128546A TW I230344 B TWI230344 B TW I230344B
- Authority
- TW
- Taiwan
- Prior art keywords
- data
- item
- index
- dimension
- scope
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/953—Organization of data
- Y10S707/957—Multidimensional
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
1230344 玖、發明說明: 【發明所屬之技術領域】 本發明通常係關於電腦所執行的資料庫管理系統,尤其 係關於對應的0LAP (線上分析處理)與資料倉儲應用。更具 體的說,本發明係關於一種用於産生資料記錄之使用者定 義的呈現(presentation)或檢視(view)之方法及系統,該等資 料記錄被包含在該資料庫管理系統中。更具體的說,本發 明係關於具有大量資料記錄的資料庫管理系統。 【先前技術】 貝料倉儲與線上分析處理⑴LAp)應用已突顯對快速儲存 及擷取多維資料的需求。資料倉儲係一企業的多種商務系 統所收集的資料的所有部分或重要部分之中心儲存庫 (repository)。有時術語,,資訊倉儲,,被使用來取代資料倉 儲。通常,資料倉儲被容納在企業主要伺服器上。在一資 料倉儲資料庫上有選擇地擷取且組織來自多種線上交易處 理(OLTP)應用及其他來源之資料,以供分析應用與使用者 查。旬使用。貝料倉儲作業強調自不同來源操取資料,以進 行有用的分析及存取,但是通常不是就—般使用者或可能 需要存取專業(有時爲區域)資料庫的知識卫作者的觀點出 發。後-種技術通常稱爲資料超市,資料採擷_ mining)、資訊網採操及㈣支㈣統⑽s)是可利用 儲之三種應用。 、” 0LAP係讓使用者能夠 並檢視貧料的電腦處理。 輕鬆且有選擇地自不同觀點擷取 舉例而言,使用者可請求:分析
O:\88\88301.DOC 1230344 負料,亚以試算表顧-τ* it ^ ^ λα-、 、开衣α不某豕電信公司在該年度 在某國家銷售之所有的行動電 寺疋月伤 止& 動以產品,比較該特定月份盥 先?份之相同産品的營收數字,接著觀看在相同期間裏 该國家中其他産品銷售的比較。 、 域以局於某個價格而出售之所古在口 丨貝〜售之所有産品」,並顯示該等維度。 多種屬性(例如時期)可細分爲子屬性。 類似於資料倉儲’ OLAP可被用於資料採擷或發現資料項 爲促進此類分析,會將0LAP資料儲存在一種多維資 中。儘管-關聯性資料庫可視爲兩維資料庫,但是一種多 維資料庫將每—資料屬性(通常稱爲"資料索引鍵",例如產 品、地理銷售區域和期間)視爲個別獨立的維度。OLA?軟 體可定位多個維度之交集,例如,「在某時期中,在東部區 之間先前未察覺到的關係。由於不是所有的異動資料都爲 趨勢分析所需要,所以〇LAP資料庫不需要像資料倉儲一樣 大。藉由開放式資料庫連接(0DBC),可自現有的關聯性資 料庫匯入資料,以建置一適用於〇LAp的多維資料庫。 如上所述,主要是按照支援一般使用者分析及導覽活動 之合併(consolidated)資料的動態多維分析來確定〇LAp功 能性,包括·· 整個維度(dimensions)、階層架構(hierarchies)及/或成員 所套用的計算及模型化; -跨越連續期間的趨勢分析; -爲在螢幕上進行檢視而分割(slice)子集; -鑽研至合併(consolidation)之較深層級;
O:\88\88301.DOC 1230344 -直接到達基礎詳細資料(detail data);及 -轉換成在檢視區域中之新的維度比較。 通常會在一多使用者用戶端/伺服器環境中建構〇LAp, 且不管貧料庫大小及複雜性,都試圖對資料庫存取提供穩 定快速的回應。貧料庫存取所傳送之資料通常會藉由如下 方式而主現、、’a般使用者·交又表(cross-table);樞紐分析 呈現(pivot presentations);或主要由已呈現之資料記錄單元 格排列疋義之基礎資料庫的部分甚至整體内容的檢視。在 使用-普通電腦螢幕的通常狀況下,該排列必須是兩維 的。樞紐分析呈現之另一實例係在一電腦記憶體、資料庫 或其類似物中提供的二維資料陣列。 該基礎資料庫之每-資料記錄由許多賴屬性或資料索 引鍵組成,如圖1所示,其中由資料索引鍵的數目來確定該 等資料記錄之大小,且因同樣地由資料索引鍵的數目來決 定此整個資料庫之大小。 一特定樞紐分析呈現通常取決於資料記錄(如顧客資 訊、賣給顧客之對應物品,及銷售每一物品的時間)内容之 特殊索引鍵排列的預指定使用者喜好狀(prefer⑽e)。因 此’經常需要在該樞紐分析呈現之單元格中,彙總不同資 料記錄的内容或給定的資料記錄的資料索引鍵元素。 存在許多用於在—多維諸料産生㈣記錄之樞紐分 析呈現的方法。第一種方法使用著名的簡單查詢語令 (观),來藉由資料庫查詢而獲得—現有的資料庫之使用者 疋義的樞心析檢視。但是因爲必須存取該資料庫中儲存
O:\88\88301.D0C 1230344 之所有資料記錄,以檢查其是否符合該等基礎查詢條件, 所以在-較大型資料庫中之樞紐分析檢視的計算要求相當 多的處理資源。 就:二種方法而言’其具有已知的〇心軟體工具,其中 因爲藉由超立方(hyper-cubic)資料結構在内部處理資料記 錄,所以需要大儲存容積以儲存中間產生的〇LAp資訊。 根據第三種方法,結合上述第—種與第二種方法,以提 供一對應的混合概念。但是,因爲效能顯著變化,並且高 度依賴實際的樞紐分析呈現,所以該第三種方法也是不: 的。 【發明内容】 因此本發明之-目標係提供—種電腦所建構之方法及系 統,該方法及系統用於產生一資料庫管理系統中包含之資 料記錄的使用者定義之n維矩陣呈現或檢視,該等呈現或檢 視更具效率,並因執行速度比相對應先前技術的方法更 陕且避免了上述先前技術方法的上述缺點。 另-目標係提供-種可運用在一具有合適回應時間之" 線上分析處理”(0LAP)環境中的相對應方法及系統。 還有一目#係提供一種僅需要最少量之處理資源來産生 該等矩陣呈現或檢視的相對應方法及系統。 以上目標可由獨立的申請專利範圍之特點獲得。有利的 貝施例爲。亥等子巾請專利範圍(灿山㈣的主題㈣咖以 matter) ° 本發明之基本觀點係多維資料庫之基礎資料記錄的序列
O:\88\88301.DOC 1230344 化,例如該等基礎資料記錄以一連續資料序列的形式排列 成- m維事實資料|。該序列因此由替代符號值 (Placeholder value)(較佳爲整數)組成,其中該等替代符號 中的每值都是藉由參考表或向量,而連結至基礎不變 的m維事貫資料表。然而,該矩陣呈現之維度n可等於該維 度m。 基礎機制特別包含以下步驟:將屬於一明確資料索引鍵 之所有資料值攔位的内容轉換成索引值(充當索引值的記 、彔數字除外),以及基於該等索引值,執行用於産生最終矩 車呈見之所有排序步驟,意即,整個排序機制或整個排序 引擎僅使用該等索引值。 μ提到在例示性的二維狀況下,該η維矩陣呈現之,,基 數"意指該二維矩陣之行與列的數目。在更多維度心 η>=2)之狀況下,該基數相應地定義必要的呈現資源。 在一較佳實施射,會將在—基礎料呈現之單個單元 格中所要呈現的資料記錄(例如2維圖像矩陣之一列)連續地 =列成包含各自替代符號值之子序列。因此利用對應之該 專子=列而產生榷紐分析呈現之該等單個單元格。因此, =早:秸之;^紐分析檢視而言,可使用資料記錄之整個 序列的資料子序列。传用去 ^ 一 斤払疋的樞紐分析呈現所需之 吞亥專卓元格中的每一個胜兄丨丨〜M > _ 特別疋義爲在該序列中的開始點, 以精由5亥開始點來存取样g „ 仔取待呈現之事實資料表所需的資料。 二終矩陣呈現藉由該資料序列而產生,藉此僅使用上述 纽來參考n維事實資料表。換言之,因此利用虛擬
O:\88\88301.DOC -11- 1230344 2維矩陣來獲得該矩陣呈現。 在該較佳實施例中,藉由_包含較佳由整數組成之上述 序列的線性向量而實現上述資料序列。由此,藉由該序列 向量而重新排列每一維度(群組)之資料記錄,例如被包括在 事實資料表中之資料記錄,以用於各自的使用者定義的植 紐分析組態。因爲進而利用資料記錄索引數來完成對使用 序列向量之真實資料記錄的存取,所以可即時(意即線上, 意即無任何延遲或僅有㈣短的延遲或使用者回應時間) 執行待被用於特殊枢紐分析呈現(意即待呈現於特殊搞紐 分析檢視中之行與列)之單元格的計算。 根據另一實施例’首先將該基礎事實資料表轉換成一參 考表’用以依據該參考表而産生該序列。在另一實施例中, 會利用-計數向量,以決定資料記錄之該等維度中的兩個 維度之間的轉換。 因此’根據本發明之機制不需要為了計算可能樞紐分析 呈現的目的,(例如)藉由需要相當多資料處理與資料储存資 源的所有資料記錄預彙總’來預處理資料庫之資料記錄。、 另外#因於中間序列化步驟,因而可擴大資料記錄之 總量及因此可擴大資料庫大小,同時不會影擊可能枢紐分
析呈現(檢視)’其中所需的處理時間單位隨基礎資料庫之大 小而按線性比例變化。因此,筮 祕危丄A 該等至少4 射㈣料記錄之 以至一維之至少第二維上。因此可互相映射資料庫之 貢料記錄的任意維度,因此使職藉由插人詩記錄之其 他維或甚至其全部等級階層架構’來擴展現有的資料庫。
O:\88\88301.DOC -12- 1230344 與以上討論之先前技術方法相比,根據本發明之機 ,要進行諸如大型資料集之較作㈣計算樞紐分析 主現。 另外’可在枢紐分析呈現之不同彙總階段中多次使用資 料庫之特殊資料記錄維度,同時無任何執行時期的問題。 因關對給定資料庫之其後的樞紐分析檢視使用向量 運算,所以用於提供-使㈣定義的枢紐分析檢視之資料 記錄的先前已産生的序㈣持有效,以用於其後的拖组分 析檢視,且因此其後的枢紐分析檢視總是由現有的樞紐分 析檢視推斷而來,因此不破壞現有的樞紐分析檢視。 在本發明之另一態樣中,所選擇的2維樞紐分析呈現通常 基於由行列數目確定的虛擬2維矩陣。提議的柩紐分析檢視 處理機制因此爲-給定的樞紐分析呈現提供行列數量,此 外,還按上述子序列順序來提供行與列的交集點。因此, 可僅藉由單元格之行與列索引來完成虛擬矩陣之該單元格 的呈現。 因爲藉由僅使用純參考和計數技術以及執行整數值之簡 單線性(一維)向量運算,來産生或計算樞紐分析呈現,所以 可利用貧料庫記錄迅速產生一任意的使用者定義的樞紐分 析呈現。 吾人強調根據本發明之樞紐分析呈現機制並不限於2 維’其也可被應用於η維樞紐分析呈現。但是,在該η維狀 況下,上述序列向量爲(η-1)維。 【實施方式】
O:\88\88301.DOC -13- 1230344 下文中展示,對在通常狀況下由二維真實事實資料表所 表示之給定的真實事實量而言,如何根據本發明來產生任 意的樞紐分析表(交叉表)檢視。吾人強調該基礎樞紐分析表 產生機制可用於爲n維資料集產生m維矩陣呈現。另外,可 用最少成本及消耗時間建構該機制,且僅需要最少計算資 源,且因此使得産生高效能。 此處假設,真實事實量包括資料索引鍵(每一資料索引鍵 定義一個索引鍵維度(key dimension))以及每一索引鍵維度 中包含之資料值。檢視藉由以下各項提供事實量之枢紐分 析··該等索引鍵維度之使用者所選擇的已排序排列、在該 樞紐分析檢視之已呈現的維度中之索引鍵維度的排列及一 可能的彙總層級,此在下文中更詳細地展示。 在圖1&與比中展示,在當前狀況下由一真實事實資料表 所表示之例示性事實量,及該真實事實資料表之例示性枢 紐分析檢視。在該實例中’該真實事實資料表包含排列成 索引鍵維度之銷售數字i 3 〇、「顧客(Cust〇mer)」i 〇〇、「物品 (Article)」11〇及「月份(M〇nth)」12〇。圖❶中展示之對應 例:性樞紐分析檢視,按如下順序呈現圖u所展示之真實 事實資料表的(事實)資料值14〇:「顧客」/「物品」/「月份」 150〜170 (圖中所不之左邊三行),及銷售之總計值(右邊行) 140。因此該等索引鍵維度,即「顧客」15〇與「物品」⑽ 在垂直方向呈現’其中索引鍵維度「月份」被囊總成曰曆 季度值Q1」〜Q4」17〇,且呈現於在該樞紐分析檢視之 水平方向。
O:\88\88301.DOC -14- 1230344 產生該樞紐分析檢視之基礎機制的概念基礎為:將使用 者所選擇之每一任意樞紐分析呈現歸納成為基礎事實量之 資料值的連續排序排列(例如一序列向量)。圖2a至圖2c展示 該機制之一較佳實施例。 在本實施例中,如圖2a所示,首先藉由一連續索引值2〇〇 (左邊行)來擴展基礎真實事實資料表,在本實例中,該索引 值提供事實的自「1」至「20」的連續編號。 在圖2b所展示之所得樞紐分析檢視中,在每一單元格2 i 〇 中,該等事實之索引呈現在對應的單元格中必須求和的銷 售值。 如上所述,基於一序列向量來產生圖21?所示之樞紐分析 檢視。圖2c中描繪圖2b中之柩紐分析檢視的基礎序列向 $,且由兩行260、270組成,左邊行260包含在本實例中再 -人自「1」至「20」的連續數字,而右邊行27〇包含圖仏所 描繚之上述索引值275’該等索引值係已排序的排列形式而 得以按順序地建立圖2b之樞紐分析檢視。 爲更好地理解序列向量,該序列向量之内容展示於相反 方向’意即’自圖2b所描緣之樞紐分析檢視開始。因此, 藉由在樞紐分析呈現之單元格21〇中對該等索引逐行且自 左向右地求和,如在該樞紐分析檢視之前兩行中由箭頭… 所展示,吾人將獲得圖2〇所描繪之序列向量。 如^所述’僅藉由向量運算來產生枢紐分析檢視,而基 礎向量僅包含整數值。因細下描述的處理步驟均不使用 實際的資料索引鍵值’如文字鍵值、本文或任何其他真實
O:\88\88301.DOC -15- 1230344 事只值,所以在此獲得相當完 考w丰_ 銳的效能收益。在所有竽黧 處理步騍中,僅使用上 有該4 奴老w 数(參考)值。僅當已完成該篝敕 數處理步驟時,包含在所得序列向量中之成=整 後所描述之指派或參考(杳 多 精稍 值。 (―力)表而轉換回對應的真實事實 勺㈣中,圖3a中所騎之真實事實資料表所示, :事實資料表中之具有不同的索引鍵維度的所有資 枓(如顧客姓名L,,與,也。·"),被在該索引鍵維度中之 2^考值鳩所取代,其中該等唯—參考值充當替代符號 值使用。圖2a所示之例示性真實事實資料表的事實量在轉 換爲上述參考數字後,被展示於圖h中。 在圖3b中展示用於轉換成參考數字之基礎_。轉換係 以數個指派(或參考)表350〜37〇為基礎,其中會使用已知的 查詢錢制,利用指派(或參考)表將具有不同的索引鍵維度 之真實事實指派給上述參考值。如圖3b所示之索引鍵維 度:"顧客"350、"物品,,360及"月份"37〇。如圖沘所展示之 另一索引鍵維度”季度(Quarter)"3 8〇係充當一彙總等級階層 架構使用,以使能夠進一步彙總索引鍵維度,,月份"3 9〇。 對圖2a中所描繪之真實事實資料表的每一個索引鍵維度 而言,第一整數向量410關於各個索引鍵維度與該等索引鍵 維度之元素(參考值)的項目(occurrence),來提供基礎事實 行之事實排序次序。第二整數向量400提供一第一區塊元素 (FBE),該區塊元素爲一個索引鍵維度元素(例如”^㈣心 之母一肇項目’指示在排序序列41 0中其對應區塊的第一元 O:\88\88301.DOC -16- 1230344 素。現在參考圖4a至圖4c,在圖式中展示此。因此,在圖 4a至圖4c中左邊所描述之資料表,在右邊呈現的排序向量 中提供母一索引鍵維度的第一輸入項之參考索引。因此, 例如圖4a所展示之索引鍵維度,,顧客”,索引鍵,,Br〇wn,,之所 有事實數字420排列於行!至7中,索引鍵"J〇nes,,之所有事實 數字430排列於行8至14中,索引鍵” Miller ”之所有事實數字 440自行15排列至資料表的末端。 在該描述之末尾處更詳細地描述,用於獲得包含該排序 次序之第一整數向量41〇與包含第一區塊元素索引之第二 整數向量400所必需的方法。 值得注意的是,很容易利用"月份"之向量衍生而得索引 鍵維度"季度"之對應表示,且因此在此處不再描述。 現在參考圖5及圖6a至圖6g,下文描述如何利用上述整數 向量計算技術來排序該真實事實資料,以獲得所要的摇紐 分析檢視。以提供—預排序步驟開始(該預排序步驟提供用 於最終排序之事實的第—逐區塊排朴逐步計算該排序、(竟 :,爲樞無分析呈現的每個索引鍵維度計算—次),以顯示 最終的排序次序。藉由該等處理㈣,每個待被排序之索 引鍵維度産生了新的群組,該等群組充當用於以下排序步 且用於在計算結束時提供樞紐分析呈現之單元格的内 容的基礎。 =例中,藉由排序索引鍵維度"顧客"來顯示該等預 …相關向量’按圖5所展示的方式,將該等圖 ^ 不之命名爲”映射(maPPing)表”與"排序位置指標
O:\88\88301.DOC -17- 1230344 (Son P〇sition pointer)"表初始化。應強調,圖5所示之資料 表僅爲一快照集(snapshot),該快照集描述按"顧客"對應" 物扣對應"季度"的整個排序過程中之„顧客"對應"物品"的 具體排序步驟。吾人將提到,遞迴地處理所有該等資料表, 其中在每-排序步驟結束時,在各自的後續排序步驟中, 在"映射"表與"排序位置指標”表中會重新使用包含在攔位 ’’Fact# NewGrp"中之”結果排列,,資料表的事實。然而,爲了 在第一排序步驟前初始化該等資料表,按以下方式初始化” 映射”表與”排序位置指標”表之行。 在”顧客”之當前狀況下,意即利用該"真實事實,,資料表之 上述唯一參考值300,將排序序列之第一維度填入該"映射" 表之"TmpGrp"行的每一欄位。另外,利用對應維度之上述 FBE資料表的,,Pos"行4〇〇來初始化該"排序位置指標"表之 "NextPos”行的每一攔位。 在所有排序步驟期間,會將對應維度(意即在該對應排序 序列步驟中之右邊維度)之"已排序序列料表的"事實 (Fact)"行4U)填入"已排序序列"資料表之"以㈣"行。因此, 在兩個上述初始化步驟之後清除"結果排列”内容,使得可 在下一排序步驟中重新填充該等攔位。該資料表中之行 (lme)的數目等於包含在真實事實資料表中之事實的數 目。以下進行的處理步驟由關於索引鍵維度"物品"之排序 次序決定,該索引鍵的排序次序在該等圖式中命名爲"已 排序序列”。 在圖6a至圖6g所示之圖片序列中,更詳細地展示該排序
O:\88\88301.DOC -18 - l23〇344 *彳本身°亥等圖片中的每一個圖片都展示單個排序步 =該序列所示之排序步驟之整個序列因此僅描述整個排 序之。卩刀。該整個程序係以展示之四個資料表的内 連結為基礎。 ^ 百先’按自"1"至,,20"之參數"pseq"的:欠序,來處理索引 鍵維度"顧客"之先前排序步驟而產生之索引鍵維度"物品" 的貪料表(名爲”已排序序列”)。具體地說,對包含在行 ”Fa^"中每—事實數字中而言,在該映射表中,確定—命 名爲’’TmpGrp”之對應索引。 在排序位置指標”表中使用圖6&所示之排序步驟中的所 件索引(具體爲所得的整數值”3”),以確定下一位置 "NextPos”的值,意即,可藉由在一結果排列資料表中之目 標索引來識別當前事實數字之值。另夕卜,包含在該映射表 之行”LDGrp”中的對應值與包含在,,已排序序列,,資料表中 之對應值’’DGrp”相比較。若該等兩個值不同,則該索引在,, 、、xr 果排列(Result Permutation)’’ 資料表之行,,開始(start)" 中標記爲,,真(TRUE)",因此定義一新的群組的開始。應提 到,在圖6a中’在該程序之已展示狀態中尚未加入參數 丨’NextPos’’。 圖6b至圖6f展示另外5個步驟’且省略了步驟7至步驟 19,圖6g展示命名爲”結果排列”之最終所獲得的排列資料 表(向量)。由此,在圖6g所示之”結果排列,,資料表之” 行中,儲存’’顧客’’對應’’物品’’之排序步驟的結果。 在圖7中,再次展示圖6 g所描繪之最終結果排列資料表。 O:\88\88301.DOC -19- 1230344 其代表成相關排序序列排列之目㈣紐分 iwGrp”中,藉由自第-列開始將該群組索引增加”"而: 母一列指派一個值。若在杆” P』私”击 隹仃開始中,各個行標記爲布林 值π真”’意即被標記爲一新的群組的開始點,則完成增量 之建立。該等群組係相關於由真實事實所提供之索引鍵: 度”顧客"及"物品,,之可能的不同組合。可在執行以上程序過 程中容易地確定並管理對應於該等索引鍵維度中之該等群 組的參考數字,而該等參考數字提供存取真實事實之最終 呈現所需之各自基礎索引鍵本文。 進一步參考圖8,其展示自先前排序步驟"顧客”對應”物 品’’之結果開始,初始化下一排序步驟,,顧客,,對應”物品” 對應π季度’’。吾人提到包括一額外彙總步驟,其中將維度” 月份”彙總成”季度’’。藉由一指示值項目的對應,,pseq,,數字 來初始化”排序位置指標”表之,,NextP〇s"行,該指示值在本 實施例中爲”結果排列"資料表之”開始”行中之布林值,,真,,。 自”結果排列”資料表之”Fact#”行開始,該行之每一攔位 充當一進入點(entry point)使用,該進入點用於將圖8中所 描繪之”映射"表之"TmpGrp"行中的,,一對應值填入"結果排 列"資料表之’’NewGrp’,位中。 在圖8至圖1 〇中,根據先前圖式來展示本實施例之最終排 序步驟,因此顯示該最終樞紐分析呈現。因此,基於在行 nFact#n中提供之事實數字與在行”NewGrp”中提供之群組 索引,來再次初始化(如上所述)另一對應之π映射”表及”排 序位置指標Μ,此使得產生索引鍵維度π季度”之下一排序序 O:\88\8830l.DOC -20- 1230344 列。在圖8中描述該初始化之結果資料表。在圖%至圖奵 中,展不最終排序序列之前5個步驟及最後排序步驟。該等 圖片對應於相似的圖6b至圖9g,因此此處不再更詳細地描 述。 、、整個排序序列,以計算圖10所描述之”樞紐分析序列”資 料表而結束。以此方式,整個程序爲已排序的索賴維度f, 顧客,,對應”物品”對應”季度”的當前樞紐分析呈現揭示一次 序序歹]向里。该次序序列向量儲存在,,結果排列f,資料表之 Fact#行中。於行”NewGrp”中提供之基礎群組索引係關於 基礎樞紐分析呈現或檢視的對應單元格。基於行”Fact#,,中 之各個輸入項可很容易地確定該等進一步對應事實參考。 上述給定實例僅由一個用於樞紐分析檢視之水平規格的 索引鍵維度組成。應提到,該排序程序不限於任何數量的 索引鍵維度,其中該等索引鍵維度用於樞紐分析規格(piv〇t specification) 〇 整個程序爲每一樞紐分析維度確定一單獨排序序列。藉 由將該排序程序應用至單獨産生之序列而産生整個序列, 其中所述作業自第一序列之結果開始,且將下一序列作爲 该上述之’’映射”表與"排序位置指標”表的輸入。 整個排序程序也適用於圖3a所示之真實事實”資料表的 子集。應提到,圖5所示之’’映射”表之列的數目對應於,,已 排序序列π資料表中之’’Fact#’’行的最大可能值,意即,該” 真貫事貫11資料表之事實列的數目。在僅有該等事實之一子 集應用於該排序過程的狀況下(例如歸因於篩選準則),可將 O:\88\88301.DOC -21 - 1230344 该映射"表之大小縮減爲已選擇之事實的大小。當"已排序 序列"資料表之"Fact#"行的每一上述初始化,均使用對應子 序列中之真實事實索引的相關索引時,可達成該項縮減。 該排序過程之結果儲存在"結果排列"資料表之I㈣"行 中’而該”結果排列"資料表需要被轉換回真實事實索引。 如上所述’ ”第一區塊元素"(FBE)整數向量400與"排序次 序整_數向1410係用於初始化每一排序步驟。計算關於圖 h所不之'’真實事實料表之索引鍵維度行31G的LBE索引 向量。在第-步驟中,計算該計數向量,其中該計數向量 之每-攔位包含該"真實事實# ”資料表中之對應索引鍵維 度之對應參考數字項目的數字。該計數向量中之每個值反 映對應參考數字的區塊長度。處理自第-攔位至最後攔位 求和該等值的計數向量,爲每—㈣提供—對應群組之開 始。該結果儲存在FBE索引向量4〇〇中。 利用該排序程序來計算”排序次序”整數向量41〇。在此狀 況下,將相同值(例如”1”)填入”已排序序列”資料表之 nDGrp.”行的每個欄位中。將”FSeq"行之對應值填入"hew,, 行之每個欄位。將圖3a所示之對應維度索引鍵的值填入”映 射表之"TmpGrp”行的每個欄位。將對應維度索引鍵之 nFBE”整數向量400填入該”排序位置指標,,表之,, 行。一初始化即執行該排序程序,在”結果排列,,資料表之 ’’Fact#”行中提供該”排序次序”整數向量41〇。 應提到,當在當前樞紐分析規袼内使用一階層層級 (hierarchy level)(例如”季度”)時會使用相同程序。當^二維 O:\88\88301.DOC -22- 1230344 度索引鍵(例如"月份”)之真實事實行轉換爲該階層層級之 麥考數字時,可計算,,FBE”與”排序次序”整數向量。 最後再次參考圖2b與圖7,其中更詳細地描述如何根據本 發明來計算該等進入點。該最終樞紐分析呈現之基數(例如 2維樞紐分析呈現中之行與列的數目)是排序程序之另一結 果。對框紐分析檢視之每個維度而言,對應樞紐分析檢視 維度之基數視樞紐分析規格及事實而定,該等事實作爲樞 紐分析檢視之輸入。在給定的實例中,在”顧客”對應”物品 的排序步驟後,可衍生出垂直維度之基數。”結果排列,,資 料表之"NewGrp.”行的最後欄位(參看圖6g)包含所得群組之 數目。該數目相當於所得樞紐分析檢視之垂直維度的基 數。因此,獨立地進行每一樞紐分析維度提供了對應樞紐 分析維度所需的基數。 【圖式簡單說明】 別文中藉由參考附圖來更詳細地展示本發明,附圖使本 發明之其他特點與優點變加明顯。 在以下圖式中·· 圖1 a及圖b描述在先前技術中已知的一例示性真實事實 資料表,及一對應樞紐分析檢視; 圖2a至圖2c展示用於藉由資料表而產生根據本發明之樞 紐分析檢視之機制的基本原理; 圖3a至圖3c展示用於產生根據本發明之樞紐分析檢視之 機制的其他細節; 圖4a至圖4c展示用於産生根據本發明之序列向量的典型
O:\88\88301.DOC •23· 1230344 向量運算; 圖5至圖6g展示多個總覽資料表圖解(〇verview table diagram),其用於展示如何儲存真實事實資料,以獲得根據 本發明之所要的樞紐分析檢視。 圖7描繪根據本發明之最終結果排列資料表;以及 圖8至圖1 〇描述根據本發明之最終排序步驟。 【圖式代表符號說明】 100顧客 110物品 120月份 13 〇銷售數字 140資料值 150顧客 160物品 170月份 200索引值 210單元格 250箭頭 260左邊行 270 右邊行 275索引值 300 唯一參考值 310索引鍵維度行 350顧客
O:\88\88301.DOC -24- 物品 月份 季度 月份 整數向量 整數向量 事實數字 事實數字 事實數字 -25-
Claims (1)
- 工23〇》齡28546號專利申請案 中文申請專利範圍替換本(93年11月) 拾、申請專利範圍: 一種電腦所建構的方法,其用於産生一 m維資料庫之至 少一部分的一任意n維矩陣呈現,該㈤維資料庫由具有 至少一索引鍵維度與至少一對應資料值攔位的多筆真 實資料記錄組成, 该方法包含以下步驟: 根據該η維矩陣呈現,來計算該等資料值攔位之多個 輸入項的一排序序列; 對該η維矩陣呈現之每一維度而言,將對應進入點資 訊計算成該排序序列; 基於該已計算的排序序列與該已計算的進入點資 吼,來計算該η維矩陣呈現之基數; 2. 基於該基數而産生該任意η維矩陣呈現,其中基於咳 排序序列與該進人點資鱗處理料資料值攔位。/ =專利範圍第1項之方法’其中將所有資料記錄之 ㈣索引鍵維度轉換爲索引值’該等索引值參考該等索 引鍵維度之對應鍵項目的屬性 , 蜀f生且其中將多個已 索引值重新轉換回該真實資料, 現。 産生該任意矩陣呈 3. 4. 如申凊專利範圍第2項之方法 個索引鍵維度之該等索引值。 如申請專利範圍第2項或第3項 示該等索引值。 >其中由一向量來表示一 之方法,其中由整數來表 5·如申請專利範圍第2項或第3垣— 貝之方法’包含以下特殊步 卿 i更 年 η % 驟: 爲該資料庫之每一維度,產生一專門由該等整數值組 成的參考表,其中該參考表包括每-資料記錄之多個記 錄識別項,由此保持該資料庫之維度結構,· 基,該參考表,藉由基於該任意矩陣呈現之維度結構 的、、、屯里向置運算(scaIar vector ορ咖―),來產生 列向量; β 土於。亥參考表産生_提供資料記錄之該至少一維产 中包含的資料記錄量的計凄 m ^ ^ 又 7寸數向里,因此定義資料之不同 的該至少一維度間的轉移; 6. 呈現“枓庫之該任意矩陣呈現,其中利用該等資料 =項,使用包含在該序列向量與該計數向量中之該真 =^來使多個身料記錄之該至少—維度形成群組。 整數。 、之方法’其中該序列向量僅包含 7.如申請專利範圍第2項或第3項 貝 <方法,其中會基於一 一區塊元素(FBE)索引及/或— 罘 最後區塊元素(LBE)帝引 來計算該進入點資訊之。 )家^ 8·如申請專利範圍第2項或第3 貝之方法,其中將真實資 記錄之該至少一維度的第一 4 、度,映射至真實資料絡 之該至少一維度的至少一第_ 、。、录 木一維度。 9·如申請專利範圍第2項或第3 方法,其中基於一直香 事實資料表而産生該參考表, 、一貫 I先會藉由提玄笑吉每 事實之一連續編號的連續专 ^ ^ Ά 、眾弓丨值來擴展該真實事實資 O:\88\88301-931109.DOC -2- WmM 料表。 ι〇·如申請專利範圍第2項或第 由兩行組成,左邊行包含該;之連 (27〇)包含已排序排列形式的=’且該右邊行 序建立該任意矩陣呈現。索引值’而得以按順 11 ·如申請專利範圍第2項或第3項之 整數之向量計算,以產生該任意㈣呈現中僅執行基於 12.如申請專利範圍第2項或第3項 ,二;序:=:= 該任意排料序。⑨步^㈣序,以揭示 專利範圍第2項或第3項之方法其中在—排序位 ^ 用由相序㈣所得之-索引值,以確 ::排列資料表中之一目標索引值,可藉由該目標 索引值來硪別一當前真實事實值的值。 1 4 .如申清專利範圍第1 3頁 一 祀固弟U項之方法,其中該結果排列資料表 表不一相關排序序列形式的目標矩陣序列。 15.似種儲存在_電腦可使用媒體上之電腦程式產品,該電 腦程式産品包含多個軟體程式碼構件,當在一電腦上執 行時該程式時,該等軟體程式碼構件促使該電腦執行如 申請專利範圍第1項至第丨4項中任一項之方法。 16· -種線上分析處理(〇LAp)系、统,其用於藉由—資料庫 之至少部分的多個任意n維矩陣呈現,來分析包含在該 O:\88\88301-931109.DOC 1230344 資料庫中之真實事實資料,其中該資料庫包含多個資料 記錄的至少一維度,每個資料記錄都包含至少一資料索 引鍵及一對應資料值欄位,該OLAP系統之特徵爲如申 請專利範圍第1項之該方法。 O:\88\88301-931109.DOC
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02023362 | 2002-10-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200413969A TW200413969A (en) | 2004-08-01 |
TWI230344B true TWI230344B (en) | 2005-04-01 |
Family
ID=32103886
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW092128546A TWI230344B (en) | 2002-10-18 | 2003-10-15 | Method and system for online analytical processing (OLAP) |
Country Status (6)
Country | Link |
---|---|
US (3) | US7340476B2 (zh) |
JP (1) | JP4609995B2 (zh) |
CN (1) | CN1688998A (zh) |
AU (1) | AU2003286187A1 (zh) |
TW (1) | TWI230344B (zh) |
WO (1) | WO2004036456A2 (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7263520B2 (en) * | 2004-02-27 | 2007-08-28 | Sap Ag | Fast aggregation of compressed data using full table scans |
US7774298B2 (en) * | 2004-06-30 | 2010-08-10 | Sap Ag | Method and system for data extraction from a transaction system to an analytics system |
CA2909815C (en) * | 2005-01-12 | 2018-12-04 | West Services, Inc. | Systems, methods, and interfaces for aggregating and providing information regarding legal professionals |
US8270612B2 (en) * | 2006-12-18 | 2012-09-18 | Sap Ag | Mapping compound keys |
US20090063458A1 (en) * | 2007-08-31 | 2009-03-05 | International Business Machines Corporation | method and system for minimizing sorting |
US8495007B2 (en) * | 2008-08-28 | 2013-07-23 | Red Hat, Inc. | Systems and methods for hierarchical aggregation of multi-dimensional data sources |
US20100076935A1 (en) * | 2008-09-09 | 2010-03-25 | Ahmir Hussain | Method, system, and computer for analytical reporting and archiving of data |
US8959050B2 (en) | 2009-06-15 | 2015-02-17 | Oracle International Corporation | Mechanism for synchronizing OLAP system structure and OLTP system structure |
US8549045B2 (en) * | 2010-12-30 | 2013-10-01 | International Business Machines Corporation | Test data generation and scale up for database testing using unique common factor sequencing |
US8751564B2 (en) * | 2011-04-19 | 2014-06-10 | Echostar Technologies L.L.C. | Reducing latency for served applications by anticipatory preprocessing |
CN103019951B (zh) * | 2011-09-20 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 有序数据的记录方法和装置、有序数据的访问方法和装置 |
US8635229B2 (en) | 2011-10-18 | 2014-01-21 | International Business Machines Corporation | Sequenced query processing in data processing system |
US8938416B1 (en) * | 2012-01-13 | 2015-01-20 | Amazon Technologies, Inc. | Distributed storage of aggregated data |
US8660985B2 (en) * | 2012-04-11 | 2014-02-25 | Renmin University Of China | Multi-dimensional OLAP query processing method oriented to column store data warehouse |
US9721321B1 (en) * | 2012-04-12 | 2017-08-01 | Farshad Nayeri | Automated interactive dynamic audio/visual performance with integrated data assembly system and methods |
CN103678420B (zh) * | 2012-09-25 | 2017-02-01 | 北大方正集团有限公司 | 一种建立多维数据集的方法和多维数据集处理装置 |
US9646072B2 (en) * | 2013-03-03 | 2017-05-09 | Panorama Software Inc. | Multidimensional dataset query processing |
CN103235793A (zh) * | 2013-04-01 | 2013-08-07 | 华为技术有限公司 | 联机处理数据的方法、设备及系统 |
US9965512B2 (en) | 2013-06-25 | 2018-05-08 | Sap Se | Operators for constants in aggregated formulas |
US10037355B2 (en) * | 2015-07-07 | 2018-07-31 | Futurewei Technologies, Inc. | Mechanisms for merging index structures in MOLAP while preserving query consistency |
CN106775742A (zh) * | 2016-12-27 | 2017-05-31 | 中国建设银行股份有限公司 | 一种用户定制信息的扩展方法及系统 |
EP3678033A1 (en) | 2019-01-07 | 2020-07-08 | QlikTech International AB | A computer implemented method for indexlet based aggregation |
GB201916801D0 (en) | 2019-11-19 | 2020-01-01 | Ibm | Identifying data relationships from a spreadsheet |
GB201916804D0 (en) | 2019-11-19 | 2020-01-01 | Ibm | Generating an OLAP model from a spreadsheet |
GB201916803D0 (en) | 2019-11-19 | 2020-01-01 | Ibm | Identifying content and structure of olap dimensions from a spreadsheet |
GB201916800D0 (en) | 2019-11-19 | 2020-01-01 | Ibm | Detecting errors in spreadsheets |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6850252B1 (en) * | 1999-10-05 | 2005-02-01 | Steven M. Hoffberg | Intelligent electronic appliance system and method |
US5875108A (en) * | 1991-12-23 | 1999-02-23 | Hoffberg; Steven M. | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US5727197A (en) * | 1995-11-01 | 1998-03-10 | Filetek, Inc. | Method and apparatus for segmenting a database |
US5787279A (en) * | 1995-12-22 | 1998-07-28 | International Business Machines Corporation | System and method for conformationally-flexible molecular recognition |
US5767854A (en) * | 1996-09-27 | 1998-06-16 | Anwar; Mohammed S. | Multidimensional data display and manipulation system and methods for using same |
US5978796A (en) * | 1997-06-30 | 1999-11-02 | International Business Machines Corporation | Accessing multi-dimensional data by mapping dense data blocks to rows in a relational database |
US6003036A (en) * | 1998-02-12 | 1999-12-14 | Martin; Michael W. | Interval-partitioning method for multidimensional data |
US6957341B2 (en) * | 1998-05-14 | 2005-10-18 | Purdue Research Foundation | Method and system for secure computational outsourcing and disguise |
US6334125B1 (en) * | 1998-11-17 | 2001-12-25 | At&T Corp. | Method and apparatus for loading data into a cube forest data structure |
US7272593B1 (en) * | 1999-01-26 | 2007-09-18 | International Business Machines Corporation | Method and apparatus for similarity retrieval from iterative refinement |
US6427123B1 (en) * | 1999-02-18 | 2002-07-30 | Oracle Corporation | Hierarchical indexing for accessing hierarchically organized information in a relational system |
US6560594B2 (en) * | 1999-05-13 | 2003-05-06 | International Business Machines Corporation | Cube indices for relational database management systems |
US20030171876A1 (en) * | 2002-03-05 | 2003-09-11 | Victor Markowitz | System and method for managing gene expression data |
EP1217540A1 (en) * | 2000-11-29 | 2002-06-26 | Lafayette Software Inc. | Methods of organizing data and processing queries in a database system, and database system and software product for implementing such method |
EP1211611A1 (en) * | 2000-11-29 | 2002-06-05 | Lafayette Software Inc. | Methods of encoding and combining integer lists |
EP1211610A1 (en) * | 2000-11-29 | 2002-06-05 | Lafayette Software Inc. | Methods of organising data and processing queries in a database system |
US20020138316A1 (en) * | 2001-03-23 | 2002-09-26 | Katz Steven Bruce | Value chain intelligence system and methods |
US20030033179A1 (en) * | 2001-08-09 | 2003-02-13 | Katz Steven Bruce | Method for generating customized alerts related to the procurement, sourcing, strategic sourcing and/or sale of one or more items by an enterprise |
US8090730B2 (en) * | 2001-12-04 | 2012-01-03 | University Of Southern California | Methods for fast progressive evaluation of polynomial range-sum queries on real-time datacubes |
US7076505B2 (en) * | 2002-07-11 | 2006-07-11 | Metrobot Llc | Method, apparatus, and computer program product for providing a graphical user interface with a linear map component |
WO2004029828A2 (en) * | 2002-09-24 | 2004-04-08 | Ismartsoft, Inc. | Method and apparatus for data analysis |
-
2003
- 2003-09-11 US US10/530,936 patent/US7340476B2/en not_active Expired - Fee Related
- 2003-09-11 CN CNA038242834A patent/CN1688998A/zh active Pending
- 2003-09-11 AU AU2003286187A patent/AU2003286187A1/en not_active Abandoned
- 2003-09-11 WO PCT/EP2003/050620 patent/WO2004036456A2/en active Application Filing
- 2003-09-11 JP JP2004544289A patent/JP4609995B2/ja not_active Expired - Fee Related
- 2003-10-15 TW TW092128546A patent/TWI230344B/zh not_active IP Right Cessation
-
2007
- 2007-11-30 US US11/948,033 patent/US7774302B2/en not_active Expired - Fee Related
-
2008
- 2008-01-17 US US12/015,551 patent/US7856458B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1688998A (zh) | 2005-10-26 |
US7856458B2 (en) | 2010-12-21 |
JP2006503357A (ja) | 2006-01-26 |
US7774302B2 (en) | 2010-08-10 |
WO2004036456A2 (en) | 2004-04-29 |
US20080183740A1 (en) | 2008-07-31 |
US20060010147A1 (en) | 2006-01-12 |
US7340476B2 (en) | 2008-03-04 |
TW200413969A (en) | 2004-08-01 |
AU2003286187A1 (en) | 2004-05-04 |
WO2004036456A3 (en) | 2004-09-30 |
US20080082563A1 (en) | 2008-04-03 |
JP4609995B2 (ja) | 2011-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI230344B (en) | Method and system for online analytical processing (OLAP) | |
US12032532B2 (en) | System and method for automatic inference of a cube schema from a tabular data for use in a multidimensional database environment | |
Stolte et al. | Multiscale visualization using data cubes | |
Gray et al. | Data cube: A relational aggregation operator generalizing group-by, cross-tab, and sub-totals | |
US6442560B1 (en) | Record for multidimensional databases | |
US8356029B2 (en) | Method and system for reconstruction of object model data in a relational database | |
US8352495B2 (en) | Distributed platform for network analysis | |
US10180992B2 (en) | Atomic updating of graph database index structures | |
US5943668A (en) | Relational emulation of a multi-dimensional database | |
US5926818A (en) | Relational database implementation of a multi-dimensional database | |
JP2006503357A5 (zh) | ||
US6446059B1 (en) | Record for a multidimensional database with flexible paths | |
CN109952569A (zh) | 用于基于字典的连接和聚合的技术 | |
CN106547809A (zh) | 将复合关系表示在图数据库中 | |
US20040015486A1 (en) | System and method for storing and retrieving data | |
US20170255708A1 (en) | Index structures for graph databases | |
WO2008009018A2 (en) | Spreadsheet-based relational database interface | |
WO2008066637A2 (en) | Generation of a multidimensional dataset from an associative database | |
CN111611304A (zh) | 知识驱动的联合大数据查询和分析平台 | |
Weng et al. | An approach for automatic data virtualization | |
US8504552B2 (en) | Query based paging through a collection of values | |
Inoue | An effective technique and practical utility for approximate query processing | |
Maghfiroh et al. | Study of Search Algorithm Optimization from Multi-Version Data Warehouse using NoSQL Non-relational Database | |
Manjula et al. | A methodology for data management in multidimensional warehouse | |
Libera et al. | STRUCTURE CHARACTERISTICS OF DATA WAREHOUSE AND IMPLEMENTATION POSSIBILITIES FOR VARIOUS DIMENSION TYPES |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |