TWI476608B - A distributed computing data merging method, system and device thereof - Google Patents

A distributed computing data merging method, system and device thereof Download PDF

Info

Publication number
TWI476608B
TWI476608B TW097100577A TW97100577A TWI476608B TW I476608 B TWI476608 B TW I476608B TW 097100577 A TW097100577 A TW 097100577A TW 97100577 A TW97100577 A TW 97100577A TW I476608 B TWI476608 B TW I476608B
Authority
TW
Taiwan
Prior art keywords
data
database table
merging
merge
configuration file
Prior art date
Application number
TW097100577A
Other languages
English (en)
Other versions
TW200931285A (en
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of TW200931285A publication Critical patent/TW200931285A/zh
Application granted granted Critical
Publication of TWI476608B publication Critical patent/TWI476608B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5017Task decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

一種分佈式計算數據合併方法、系統及其裝置
本發明涉及網路通信技術領域,特別是涉及一種分佈式計算數據合併方法、系統及其裝置。
隨著互聯網技術的飛速發展,對於互聯網上存在海量資訊的處理就成為了難題。如果要在單機上處理這些數據量非常龐大的資訊,就需要有很強的處理能力和埠能力,然而一方面這種高性能單機價格不菲,而且這種依靠單機的處理模式也是有限度的。因此人們提出了分佈式計算的概念,利用互聯網上有很多互連電腦的空閒資源來處理互聯網上的海量資訊。
分佈式計算把需要進行大量計算的工程數據分割成小塊,由多台電腦分別計算,在上傳運算結果後再統一合併得出數據結論。因此,分佈式計算的主要可以分為以下幾個部分:1、任務分割:根據每個應用的不同,採用不同的方法將任務進行分割,最終達到的目的是任務盡可能的平均分配,各個任務之間互不相關。2、計算任務:任務分割完成後就被分發給分佈式節點,有各個分佈式節點進行計算,得到各個子任務包的計算結果。3、結果合併:在一台服務機器上,對各個分佈式節點的處理結果進行合併,得到最終的處理結果。
現有的分佈式計算中,針對每個不同的應用處理的方 式都是不同的,每個應用都要用戶自己進行處理,對於分佈式計算中並發處理,容錯,負載均衡等等細節問題都要考慮,因此導致代碼非常複雜。比如說分析用戶訪問網站的訪問路徑,就需要編寫任務分割的代碼、編寫分析訪問路徑代碼、編寫結果合併代碼,並且在這些代碼中都要處理數據的同步、並發問題,容錯、負載問題。如果出現新的應用,則這些過程都要重新進行一遍,並且還要考慮任務分割、結果合併,數據的同步等等問題,增加了用戶的負擔。
本發明要解決的問題是提供一種分佈式計算數據合併方法、系統及其裝置,可以使分佈式計算數據合併只需幾個步驟就能完成,減輕用戶工作量。
為達到上述目的,本發明的實施例的技術方案提出一種分佈式計算數據合併方法,包括以下步驟:根據分佈式計算任務分割的情況設置配置文件;數據合併伺服器將該配置文件導入,並建立與該配置文件對應的數據庫表;各個分佈式節點完成分佈式計算任務後將計算結果資訊插入該數據庫表;該數據合併伺服器將數據庫表中的數據合併。
其中,在該數據合併伺服器將數據庫表中的數據合併之後,還包括以下步驟:將該數據合併結果導出成文件。
其中,該根據分佈式計算任務分割的情況設置配置文 件具體包括:需要合併數據表名、欄位名、數據插入方式和合併方式。
其中,該將數據庫表中的數據合併具體包括:根據該配置文件中的合併方式對數據庫中欄位進行處理。
其中,該根據分佈式計算任務分割的情況設置配置文件具體還包括:記錄最大數量、錯誤處理方式、最大錯誤記錄數和記錄保存方式。
其中,該各個分佈式節點將計算結果資訊插入該數據庫表,具體包括以下步驟:該分佈式節點根據該合併數據表名將計算結果插入該數據庫表。
其中,該計算結果資訊包括:分佈式任務ID,分佈式配置項名稱和計算結果。
其中,該計算結果資訊以ASCII碼分隔。
為達到上述目的,本發明的實施例的技術方案還提出一種分佈式計算數據合併系統,包括至少一個分佈式節點和數據合併伺服器,該數據合併伺服器,用於根據用戶設置的配置文件建立與該配置文件對應的數據庫表,並在各個分佈式節點將計算結果資訊上報後將數據庫表中的數據合併;該分佈式節點,用於在完成分佈式計算任務後將計算結果資訊插入該數據庫表。
其中,該數據合併伺服器包括數據庫表建立模組和數據合併模組,該數據庫表建立模組用於根據用戶設置的配置文件建立與該配置文件對應的數據庫表;該數據合併模組用於在各個分佈式節點將計算結果資訊上報後將數據庫 表中的數據合併。
其中,該數據合併伺服器還包括計算結果統計模組,用於判斷該各個分佈式節點是否全部將計算結果資訊上報。
其中,該數據合併伺服器還包括中間數據儲存模組,用於在數據合併之前儲存數據庫表。
本發明的實施例的技術方案還提出一種數據合併伺服器,包括數據庫表建立模組和數據合併模組,該數據庫表建立模組用於根據用戶設置的配置文件建立與該配置文件對應的數據庫表;該數據合併模組用於在各個分佈式節點將計算結果資訊上報後將數據庫表中的數據合併。
其中,該數據合併伺服器還包括計算結果統計模組,用於判斷該各個分佈式節點是否全部將計算結果資訊上報。
其中,該數據合併伺服器還包括中間數據儲存模組,用於在數據合併之前儲存數據庫表。
通過本發明實施例的技術方案用戶只需要根據介面標準編寫配置文件,系統就會自動進行數據合併,隱藏了分佈式計算中的數據合併細節,減輕了用戶的工作量。
本發明實施例利用數據庫做平台與本發明實施例相結合,封裝了分佈式計算的數據合併的具體細節。用戶只需要根據通過預先定義的標準編寫配置文件,本發明就會自 動進行數據合併,只需要簡單的幾個步驟就能完成以前需要幾百行代碼才能完成的工作。
下面結合附圖和實施例,對本發明的具體實施方式作進一步詳細描述:
如圖1所示,為本發明實施例分佈式計算數據合併系統結構圖。
該分佈式計算數據合併系統包括至少一個分佈式節點2和數據合併伺服器1,數據合併伺服器1用於根據用戶設置的配置文件建立與該配置文件對應的數據庫表,並在各個分佈式節點2將計算結果資訊上報後將數據庫表中的數據合併;分佈式節點2用於在完成分佈式計算任務後將計算結果資訊插入數據合併伺服器1中的數據庫表。
通過該分佈式計算數據合併系統將計算結果合併的過程如下:首先,根據數據合併過程需要用到的方式方法訂立數據合併介面的標準,該標準規範了不同的分佈式計算的應用,用戶使用這個標準就可以通過本發明處理不同的分佈式計算的應用,不需要在各個分佈式應用上重復編寫代碼。用戶根據此標準編寫相應的配置文件,該配置文件根據分佈式計算的任務分割和任務計算步驟的情況設置,包括根據分佈任務分割情況建立數據表名、欄位名、數據插入方式和合併方式;還包括記錄最大數量、錯誤處理方式、最大錯誤記錄數和記錄保存方式;並且可根據需要進行擴充。其中,數據插入方式是指插入數據庫的方式,可採用 直接插入或間接插入;記錄保存方式是指以數據庫方式保存,還是以遠端網路文件或本地磁片文件的方式保存。
數據合併伺服器1讀取設置的配置文件,根據預定的數據合併介面標準分析該配置文件,得到需要合併的數據表名、欄位名、數據插入方式和合併方式及記錄最大數量、錯誤處理方式、最大錯誤記錄數和記錄保存方式等用戶配置的資訊;利用數據合併伺服器1上的數據庫根據這些資訊建立數據庫表,以用戶配置的數據表名命名該數據庫表,並記錄用戶配置的數據合併方式。
各個分佈式節點2在完成分佈式計算任務之後,自動調用本發明提供的介面將計算結果資訊插入該數據庫表中,其中計算結果資訊包括分佈式任務ID,分佈式配置項名稱和計算結果,該計算結果資訊的各個部分採用ASCII碼分隔,例如用\5分隔。
數據合併伺服器1根據記錄的用戶配置的數據合併方式對上述數據庫表進行合併,該合併操作利用數據庫實現;在該合併操作完成後根據用戶的配置文件將最後合併結果導出,以數據庫表的方式、遠端網路文件或本地磁片文件的方式保存。對於數據合併的方式用戶可以選擇數據庫支援的所有合併操作,例如對數據表中的某個欄位分組,對某個欄位進行加合,對某個欄位求最大值等。
其中,數據合併伺服器1包括數據庫表建立模組11和數據合併模組12,數據庫表建立模組11用於根據用戶設置的配置文件建立與該配置文件對應的數據庫表;數據 合併模組12用於在各個分佈式節點2將計算結果資訊上報後將數據庫表中的數據合併。
其中,數據合併伺服器1還包括計算結果統計模組13和中間數據儲存模組14,計算結果統計模組13用於判斷各個分佈式節點2是否全部將計算結果資訊上報;中間數據儲存模組14用於在數據合併之前儲存數據庫表。
如圖2所示,為本發明實施例分佈式計算數據合併方法的流程圖,包括以下步驟:步驟201,根據分佈式計算任務分割的情況設置配置文件,該配置文件根據分佈式計算的任務分割和任務計算步驟的情況設置,包括根據分佈任務分割情況建立數據表名、欄位名、數據插入方式和合併方式;還包括記錄最大數量、錯誤處理方式、最大錯誤記錄數和記錄保存方式;並且該配置文件資訊可根據需要進行擴充。其中,數據插入方式是指插入數據庫的方式,可採用直接插入或間接插入;記錄保存方式是指以數據庫方式保存,還是以遠端網路文件或本地磁片文件的方式保存。
步驟202,數據合併伺服器將該配置文件導入,並建立與該配置文件對應的數據庫表。數據合併伺服器讀取設置的配置文件,根據預定的數據合併介面標準分析該配置文件,得到需要合併的數據表名、欄位名、數據插入方式和合併方式及記錄最大數量、錯誤處理方式、最大錯誤記錄數和記錄保存方式等用戶配置的資訊;利用數據合併伺服器上的數據庫根據這些資訊建立數據庫表,以用戶配置 的數據表名命名該數據庫表,並記錄用戶配置的數據合併方式。
步驟203,各個分佈式節點完成分佈式計算任務後將計算結果資訊插入該數據庫表。各個分佈式節點在完成分佈式計算任務之後,自動調用本發明提供的介面將計算結果資訊插入該數據庫表中,其中計算結果資訊包括分佈式任務ID,分佈式配置項名稱和計算結果,該計算結果資訊的各個部分採用ASCII碼分隔,例如用\5分隔。
步驟204,數據合併伺服器將數據庫表中的數據合併。數據合併伺服器根據記錄的用戶配置的數據合併方式對上述數據庫表進行合併,該合併操作利用數據庫實現;在該合併操作完成後根據用戶的配置文件將最後合併結果導出,以數據庫表的方式、遠端網路文件或本地磁片文件的方式保存。對於數據合併的方式用戶可以選擇數據庫支援的所有合併操作,例如對數據表中的某個欄位分組,對某個欄位進行加合,對某個欄位求最大值等。
如圖3所示,為本發明實施例另一種分佈式計算數據合併方法的流程圖,包括以下步驟:步驟301,根據數據合併過程需要用到的方式方法訂立數據合併介面的標準,該標準規範了不同的分佈式計算的應用,用戶使用這個標準就可以通過本發明處理不同的分佈式計算的應用,不需要在各個分佈式應用上重復編寫代碼。該標準對於本發明實施例的分佈式計算數據合併方法不是必須的,但是通過制定本標準可以使本發明實施例
可以針對所有分佈式計算的應用。
其中,field為欄位是根據分佈式計算數據合併之前的任務分割情況設定的;Limit是指記錄按照從大到小排列後的最大的數量;Maxerror是指插入數據庫中允許的最大錯誤記錄數;Directlad是指插入數據庫的方式,直接還是非直接方式;Globalfile/localfile:是指記錄保存的方式,是以數據庫的方式,還是Globalfile(遠端網路文件)的方式或者localfile(本地磁片文件)的方式。本發明實施例還可以根據用戶的需要,對上述數據合併介面的標準進行擴充。
步驟302,根據分佈式計算任務分割的情況設置配置文件。以下為本實施例中用戶根據自身要求設置的配置文件。
步驟303,數據合併伺服器將該配置文件導入,並建立與該配置文件對應的數據庫表。數據合併伺服器讀取設置的配置文件,根據預定的數據合併介面標準分析該配置文件,得到需要合併的數據表名、欄位名、數據插入方式和合併方式及記錄最大數量、錯誤處理方式、最大錯誤記錄數和記錄保存方式等用戶配置的資訊;利用數據合併伺服器上的數據庫根據這些資訊建立數據庫表,以用戶配置的數據表名命名該數據庫表,並記錄用戶配置的數據合併方式。
根據上述用戶根據自身要求設置的配置文件,我們可以得到以下資訊:上述配置文件中根據任務分割的情況,任務計算的結果應當有8個欄位,分別為profile_id、 report_time、pageview,visits、aver_visit_len、quiq_visitor、visit1_visitor和pageview1_visit;不限制結果數;直接的方式進行數據導入;允許的最大錯誤是1;ANALOG_RES_SUMMARY_DAILY為其數據表名;導出方式為本地磁片文件。根據上述用戶設置的配置文件,Field1_class指出了合併方式,在本例中是以profile_id和report_time的field_class是key,其他欄位的field_class為order,就是指以profile_id和report_time為關鍵字,求這些欄位page_view,visits,aver_visit_len,uniq_visitor,visit1_vistor,pageview1_visit的和。
根據以上資訊,數據合併伺服器調用數據庫,在數據庫上創建包含以上資訊的數據庫表,並將上述合併方式保存。
步驟304,各個分佈式節點完成分佈式計算任務後將計算結果資訊插入該數據庫表。各個分佈式節點在完成分佈式計算任務之後,自動調用本發明提供的介面將計算結果資訊插入該數據庫表中,其中計算結果資訊包括需要插入的數據表名和計算結果等用戶配置資訊,該計算結果資訊的各個部分採用ASCII碼分隔。例如上例中上報的資訊有數據表名ANALOG_RES_SUMMARY_DAILY,以及插入的數據“2\520070214\5100\550\523\524\512\548”,該插入的數據以ASCII碼5分隔,就是指插入的數據為profile_id=2、report_time=20070214、pageview=100、visits=50、aver_visit_len=23、quiq_visitor=24、 visit1_visitor=12、pageview1_visit=48。
步驟305,數據合併伺服器將數據庫表中的數據合併。如用戶設定的合併方式為在profile_id和report_time相同的情況下合併pageview、visits、aver_visit_len、quiq_visitor、visit1_visitor、pageview1_visit這六個欄位,數據合併伺服器調用數據庫根據上述合併方式將數據合併,並將合併結果導出成文件在本地磁片文件上保存。
本發明實施例通過數據合併伺服器和分佈式節點對合併數據的自動處理,隱藏了分佈式計算中數據合併的細節,減輕了用戶的工作量。因此用戶不需要去瞭解分佈式計算中數據合併的細節,也不需要針對各個不同的應用方式編寫代碼。通過本發明實施例只需要簡單的幾個步驟就能完成以前需要幾百行代碼才能完成的工作。
以上所述僅是本發明的較佳實施方式,應當指出,對於本技術領域的普通技術人員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發明的保護範圍。
1‧‧‧數據合併伺服器
2‧‧‧分佈式節點
11‧‧‧數據庫表建立模組
12‧‧‧數據合併模組
13‧‧‧計算結果統計模組
14‧‧‧中間數據儲存模組
圖1為本發明實施例分佈式計算數據合併系統結構圖;圖2為本發明實施例分佈式計算數據合併方法的流程圖;圖3為本發明實施例另一種分佈式計算數據合併方法 的流程圖。
1‧‧‧數據合併伺服器
2‧‧‧分佈式節點
11‧‧‧數據庫表建立模組
12‧‧‧數據合併模組
13‧‧‧計算結果統計模組
14‧‧‧中間數據儲存模組

Claims (14)

  1. 一種分佈式計算數據合併方法,其特徵在於,該方法包括以下步驟:根據分佈式計算任務分割的情況設置配置文件,該配置文件包括:需要合併數據表名、欄位名、數據插入方式和合併方式;數據合併伺服器藉由讀取該設置的配置文件將該配置文件導入,根據預定的數據合併介面標準分析該配置文件,得到用戶配置的資訊並根據該用戶配置的資訊,該標準規範了不同的分佈式計算的應用;該數據合併伺服器根據該用戶配置的資訊建立與該配置文件對應的數據庫表;各個分佈式節點完成分佈式計算任務後根據該數據插入方式將計算結果資訊插入該數據庫表;該數據合併伺服器根據該合併方式將數據庫表中的數據合併,其中,該合併方式包括以下至少其中一者:對數據庫表中的欄位分組;對數據庫表中的欄位進行加合;以及對數據庫表中的欄位求最大值。
  2. 如申請專利範圍第1項所述之分佈式計算數據合併方法,其中,在該數據合併伺服器將數據庫表中的數據合併之後,還包括以下步驟:將該數據合併結果導出成文件。
  3. 如申請專利範圍第2項所述之分佈式計算數據合併方法,其中,該將數據庫表中的數據合併具體包括:根據該配置文件中的合併方式對數據庫中欄位進行處理。
  4. 如申請專利範圍第2項所述之分佈式計算數據合併方法,其中,該根據分佈式計算任務分割的情況設置配置文件具體還包括:記錄最大數量、錯誤處理方式、最大錯誤記錄數和記錄保存方式。
  5. 如申請專利範圍第2項所述之分佈式計算數據合併方法,其中,該各個分佈式節點將計算結果資訊插入該數據庫表,具體包括以下步驟:該分佈式節點根據該合併數據表名將計算結果插入該數據庫表。
  6. 如申請專利範圍第1項所述之分佈式計算數據合併方法,其中,該計算結果資訊包括:分佈式任務ID,分佈式配置項名稱和計算結果。
  7. 如申請專利範圍第6項所述之分佈式計算數據合併方法,其中,該計算結果資訊以ASCII碼分隔。
  8. 一種分佈式計算數據合併系統,其特徵在於,包括至少一個分佈式節點和數據合併伺服器,該數據合併伺服器,用於:藉由讀取設置的配置文件將該配置文件導入,根據預定的數據合併介面標準分析該配置文件,得到用戶的配置資訊,該標準規範了不同的分佈式計算的應用,該配置文件包括:需要合併數據表名、欄位名、 數據插入方式和合併方式;根據該用戶配置的資訊建立與該配置文件對應的數據庫表;以及在各個分佈式節點將計算結果資訊上報後,根據該合併方式將數據庫表中的數據合併;以及該分佈式節點,用於在完成分佈式計算任務後根據該數據插入方式將計算結果資訊插入該數據庫表,其中,該合併方式包括以下至少其中一者:對數據庫表中的欄位分組;對數據庫表中的欄位進行加合;以及對數據庫表中的欄位求最大值。
  9. 如申請專利範圍第8項所述之分佈式計算數據合併系統,其中,該數據合併伺服器包括數據庫表建立模組和數據合併模組,該數據庫表建立模組用於根據用戶設置的配置文件建立與該配置文件對應的數據庫表;該數據合併模組用於在各個分佈式節點將計算結果資訊上報後將數據庫表中的數據合併。
  10. 如申請專利範圍第9項所述之分佈式計算數據合併系統,其中,該數據合併伺服器還包括計算結果統計模組,用於判斷該各個分佈式節點是否全部將計算結果資訊上報。
  11. 如申請專利範圍第9項所述之分佈式計算數據合併系統,其中,該數據合併伺服器還包括中間數據儲存模 組,用於在數據合併之前儲存數據庫表。
  12. 一種數據合併伺服器,其特徵在於,包括數據庫表建立模組和數據合併模組,該數據庫表建立模組用於根據用戶設置的配置文件建立與該配置文件對應的數據庫表,該配置文件包括:需要合併數據表名、欄位名、數據插入方式和合併方式;該數據合併模組用於在各個分佈式節點將計算結果資訊上報後將數據庫表中的數據合併,其中,該合併方式包括以下至少其中一者:對數據庫表中的欄位分組;對數據庫表中的欄位進行加合;以及對數據庫表中的欄位求最大值。
  13. 如申請專利範圍第12項所述之數據合併伺服器,其中,還包括計算結果統計模組,用於判斷該各個分佈式節點是否全部將計算結果資訊上報。
  14. 如申請專利範圍第12項所述之數據合併伺服器,其中,還包括中間數據儲存模組,用於在數據合併之前儲存數據庫表。
TW097100577A 2007-03-30 2008-01-07 A distributed computing data merging method, system and device thereof TWI476608B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710090995.5A CN101276364B (zh) 2007-03-30 2007-03-30 一种分布式计算数据合并方法、系统及其装置

Publications (2)

Publication Number Publication Date
TW200931285A TW200931285A (en) 2009-07-16
TWI476608B true TWI476608B (zh) 2015-03-11

Family

ID=39808688

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097100577A TWI476608B (zh) 2007-03-30 2008-01-07 A distributed computing data merging method, system and device thereof

Country Status (7)

Country Link
US (1) US8463822B2 (zh)
EP (1) EP2132625A4 (zh)
JP (1) JP5298117B2 (zh)
CN (1) CN101276364B (zh)
HK (1) HK1120891A1 (zh)
TW (1) TWI476608B (zh)
WO (1) WO2008121862A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9996572B2 (en) 2008-10-24 2018-06-12 Microsoft Technology Licensing, Llc Partition management in a partitioned, scalable, and available structured storage
CN102096685B (zh) * 2009-12-11 2013-04-17 阿里巴巴集团控股有限公司 分布式数据同步到数据仓库的方法及装置
CN101908075A (zh) * 2010-08-17 2010-12-08 上海云数信息科技有限公司 基于sql的并行计算系统及方法
CN101916281B (zh) * 2010-08-17 2012-12-19 上海云数信息科技有限公司 并行计算系统及去重计数方法
CN102385507B (zh) * 2010-08-27 2014-12-24 卡斯柯信号有限公司 用于自动生成布尔代数的多机信息处理方法及装置
US8805784B2 (en) 2010-10-28 2014-08-12 Microsoft Corporation Partitioning online databases
CN102214236B (zh) * 2011-06-30 2013-10-23 北京新媒传信科技有限公司 一种海量数据处理方法和系统
US8533804B2 (en) 2011-09-23 2013-09-10 Loyal3 Holdings, Inc. User login with redirect to home network
US8468129B2 (en) 2011-09-23 2013-06-18 Loyal3 Holdings, Inc. Asynchronous replication of databases of peer networks
US20140304713A1 (en) * 2011-11-23 2014-10-09 Telefonaktiebolaget L M Ericsson (pulb) Method and apparatus for distributed processing tasks
US8898542B2 (en) * 2011-12-12 2014-11-25 Cleversafe, Inc. Executing partial tasks in a distributed storage and task network
US9430286B2 (en) * 2011-12-12 2016-08-30 International Business Machines Corporation Authorizing distributed task processing in a distributed storage network
CN102917009B (zh) * 2012-09-06 2015-08-19 中南民族大学 一种基于云计算技术的股票数据采集和存储方法和系统
US9294482B2 (en) * 2013-07-25 2016-03-22 Oracle International Corporation External platform extensions in a multi-tenant environment
CN103500408A (zh) * 2013-10-17 2014-01-08 浪潮(北京)电子信息产业有限公司 一种处理电子商务数据的方法和云计算系统
US10462158B2 (en) * 2014-03-19 2019-10-29 Nippon Telegraph And Telephone Corporation URL selection method, URL selection system, URL selection device, and URL selection program
CN106161487A (zh) * 2015-03-23 2016-11-23 多媒体影像解决方案有限公司 服务器的信息处理方法
CN106708873A (zh) * 2015-11-16 2017-05-24 北京国双科技有限公司 数据整合方法和装置
CN106066881B (zh) * 2016-05-31 2019-10-22 深圳市永兴元科技股份有限公司 数据处理方法及装置
US10552079B2 (en) 2017-01-18 2020-02-04 International Business Machines Corporation Planning of data segment merge for distributed storage system
US10380191B2 (en) * 2017-01-26 2019-08-13 Sap Se Adaptable application variants
CN108038239B (zh) * 2017-12-27 2020-06-23 中科鼎富(北京)科技发展有限公司 一种异构数据源规范化处理方法、装置及服务器
CN108415894B (zh) * 2018-03-15 2021-01-05 平安科技(深圳)有限公司 报表数据初始化方法、装置、计算机设备及存储介质
US11132681B2 (en) 2018-07-06 2021-09-28 At&T Intellectual Property I, L.P. Services for entity trust conveyances
US10802872B2 (en) * 2018-09-12 2020-10-13 At&T Intellectual Property I, L.P. Task delegation and cooperation for automated assistants
US11481186B2 (en) 2018-10-25 2022-10-25 At&T Intellectual Property I, L.P. Automated assistant context and protocol
CN110113387A (zh) * 2019-04-17 2019-08-09 深圳前海微众银行股份有限公司 一种基于分布式批量处理系统的处理方法、装置及系统
CN111726390B (zh) * 2020-05-06 2022-11-25 上海融客软件科技有限公司 基于Teamcenter的接口数据交互方法、装置、设备及存储介质
CN111625586A (zh) * 2020-05-27 2020-09-04 北京思特奇信息技术股份有限公司 一种通用业务数据的导入方法和系统
CN112231293B (zh) * 2020-09-14 2024-07-19 杭州数梦工场科技有限公司 文件读取方法、装置、电子设备和存储介质
CN113220703A (zh) * 2021-05-31 2021-08-06 普瑞纯证医疗科技(广州)有限公司 一种基于大数据平台更新医疗数据的方法、服务器和系统
CN114143320A (zh) * 2021-09-01 2022-03-04 浪潮云信息技术股份公司 一种基于分布式数据库的数据网关方法及系统
CN114510490B (zh) * 2022-04-18 2022-08-02 北京宝兰德软件股份有限公司 提升数据库数据插入性能的方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010014888A1 (en) * 1993-01-20 2001-08-16 Hitachi, Ltd. Database management system and method for query process for the same
US20020040639A1 (en) * 2000-10-05 2002-04-11 William Duddleson Analytical database system that models data to speed up and simplify data analysis
US20030191743A1 (en) * 1998-03-03 2003-10-09 Siebel Systems, Inc. Method, apparatus, system, and program product for attaching files and other objects to a partially replicated database
US20050102311A1 (en) * 2003-11-12 2005-05-12 International Business Machines Corporation Method and system for direct linkage of a relational database table for data preparation
TW200611171A (en) * 2004-09-30 2006-04-01 Rockwell Automation Tech Inc Directory structure in distributed data driven architecture environment
US20060195420A1 (en) * 2005-02-25 2006-08-31 International Business Machines Corporation System and method of joining data obtained from horizontally and vertically partitioned heterogeneous data stores using string-based location transparent search expressions

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742759A (en) 1995-08-18 1998-04-21 Sun Microsystems, Inc. Method and system for facilitating access control to system resources in a distributed computer system
US5909542A (en) * 1996-11-20 1999-06-01 Cfi Proservices, Inc. Distributed computing system for executing intercommunicating applications programs
US5996012A (en) * 1996-12-10 1999-11-30 International Business Machines Corporation Application development process for use in a distributed computer enterprise environment
GB2327783A (en) * 1997-07-26 1999-02-03 Ibm Remotely assessing which of the software modules installed in a server are active
US6092213A (en) * 1997-09-30 2000-07-18 Tandem Computers Incorporated Fault tolerant method of maintaining and distributing configuration information in a distributed processing system
EP1107108A1 (en) * 1999-12-09 2001-06-13 Hewlett-Packard Company, A Delaware Corporation System and method for managing the configuration of hierarchically networked data processing devices
CN1232914C (zh) 2000-04-26 2005-12-21 计算机合作者思维公司 在分布计算机系统中保持数据完整性的方法与设备
US20010037332A1 (en) * 2000-04-27 2001-11-01 Todd Miller Method and system for retrieving search results from multiple disparate databases
CN1462403A (zh) * 2001-03-06 2003-12-17 松下电器产业株式会社 广告分发系统
US6947986B1 (en) * 2001-05-08 2005-09-20 Networks Associates Technology, Inc. System and method for providing web-based remote security application client administration in a distributed computing environment
US6917929B2 (en) * 2001-07-16 2005-07-12 Sun Microsystems, Inc. Configuration for a storage network
GB2377775A (en) * 2001-07-18 2003-01-22 Ibm Distributing programs to processing units in a network using information on the capabilities of the units
US8249885B2 (en) * 2001-08-08 2012-08-21 Gary Charles Berkowitz Knowledge-based e-catalog procurement system and method
US6728704B2 (en) * 2001-08-27 2004-04-27 Verity, Inc. Method and apparatus for merging result lists from multiple search engines
US7171672B2 (en) * 2002-04-24 2007-01-30 Telefonaktie Bolaget Lm Ericsson (Publ) Distributed application proxy generator
US7076508B2 (en) * 2002-08-12 2006-07-11 International Business Machines Corporation Method, system, and program for merging log entries from multiple recovery log files
US7240059B2 (en) * 2002-11-14 2007-07-03 Seisint, Inc. System and method for configuring a parallel-processing database system
WO2004084095A1 (ja) * 2003-03-18 2004-09-30 Fujitsu Limited 情報検索システム
WO2004097677A1 (en) * 2003-04-28 2004-11-11 International Business Machines Corporation Automatic data consolidation
US7412494B2 (en) * 2004-02-27 2008-08-12 Sap Ag Merging partial query results into a single result
US7624163B2 (en) * 2004-10-21 2009-11-24 Apple Inc. Automatic configuration information generation for distributed computing environment
JP2006236123A (ja) * 2005-02-25 2006-09-07 Fujitsu Ltd ジョブ分散プログラム、ジョブ分散方法およびジョブ分散装置
US8386469B2 (en) * 2006-02-16 2013-02-26 Mobile Content Networks, Inc. Method and system for determining relevant sources, querying and merging results from multiple content sources

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010014888A1 (en) * 1993-01-20 2001-08-16 Hitachi, Ltd. Database management system and method for query process for the same
US20030191743A1 (en) * 1998-03-03 2003-10-09 Siebel Systems, Inc. Method, apparatus, system, and program product for attaching files and other objects to a partially replicated database
US20020040639A1 (en) * 2000-10-05 2002-04-11 William Duddleson Analytical database system that models data to speed up and simplify data analysis
US20050102311A1 (en) * 2003-11-12 2005-05-12 International Business Machines Corporation Method and system for direct linkage of a relational database table for data preparation
TW200611171A (en) * 2004-09-30 2006-04-01 Rockwell Automation Tech Inc Directory structure in distributed data driven architecture environment
US20060195420A1 (en) * 2005-02-25 2006-08-31 International Business Machines Corporation System and method of joining data obtained from horizontally and vertically partitioned heterogeneous data stores using string-based location transparent search expressions

Also Published As

Publication number Publication date
WO2008121862A1 (en) 2008-10-09
US8463822B2 (en) 2013-06-11
CN101276364B (zh) 2010-12-22
HK1120891A1 (en) 2009-04-09
CN101276364A (zh) 2008-10-01
JP2010524060A (ja) 2010-07-15
EP2132625A4 (en) 2012-08-08
JP5298117B2 (ja) 2013-09-25
TW200931285A (en) 2009-07-16
EP2132625A1 (en) 2009-12-16
US20100223297A1 (en) 2010-09-02

Similar Documents

Publication Publication Date Title
TWI476608B (zh) A distributed computing data merging method, system and device thereof
CN102682059B (zh) 用于将用户分配到集群的方法和系统
US20080222634A1 (en) Parallel processing for etl processes
CN107229619B (zh) 互联网业务链路调用情况的统计、展示方法及装置
US8024305B2 (en) Updating a data warehouse schema based on changes in an observation model
US10733202B2 (en) Advanced database systems and methods for use in a multi-tenant system
CN102270225A (zh) 数据变更日志监控方法和数据变更日志监控装置
CN106126601A (zh) 一种社保大数据分布式预处理方法及系统
CN107015853A (zh) 多阶段任务的实现方法和装置
CN108255838B (zh) 一种建立用于大数据分析的中间数据仓库的方法及系统
CN104572895A (zh) MPP数据库与Hadoop集群数据互通方法、工具及实现方法
CN106970929A (zh) 数据导入方法及装置
CN106557307B (zh) 业务数据的处理方法及处理系统
CN109299074B (zh) 一种基于模板化数据库视图的数据校验方法及系统
CN112328631A (zh) 一种生产故障分析方法、装置、电子设备及存储介质
CN107103035A (zh) 本地表数据更新方法及装置
CN111367953A (zh) 一种资讯数据的流式处理方法及装置
CN107153702A (zh) 一种数据处理方法及装置
CN110134646B (zh) 知识平台服务数据存储与集成方法及系统
CN101894317B (zh) 数据变化驱动业务逻辑的方法和系统
CN109165217A (zh) 一种时序数据的高效存储方法
CN111680478B (zh) 基于组态软件的报表生成方法、装置、设备和存储介质
CN117591086A (zh) 数据处理方法、数据处理装置以及计算机存储介质
CN106469086B (zh) 事件处理方法和装置
CN114860851A (zh) 数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees