TWI229265B - Multi-processor system, data processing system, data processing method, and computer readable recording media - Google Patents
Multi-processor system, data processing system, data processing method, and computer readable recording media Download PDFInfo
- Publication number
- TWI229265B TWI229265B TW090123900A TW90123900A TWI229265B TW I229265 B TWI229265 B TW I229265B TW 090123900 A TW090123900 A TW 090123900A TW 90123900 A TW90123900 A TW 90123900A TW I229265 B TWI229265 B TW I229265B
- Authority
- TW
- Taiwan
- Prior art keywords
- data
- data processing
- processors
- processor
- processing
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Multi Processors (AREA)
- Image Processing (AREA)
- Hardware Redundancy (AREA)
Description
1229265
AT B7 發明説明 相關應用交互參考 本專利申請根據並提出於2000年9月27日Φ社士" . T叫又可份曰本 專利申請案號2000-29473 2及於2001年9月21日申^青之 專利中請案號2001-289588的優點,這兩份專利申二二== 以提及方式整個併入本文中。 ' 發明背景 發明領域 本發明與一種藉由複數個資料處理裝置來執行資料處理 的資料處理系統(例如,多處理器系統)及一種資料處理方 相關技藝説明 隨著高度發展的資訊導向社會的進步,資料處理量(例 如,電腦等等資料處理纟置執行的資料處理)的成長有增 加的趨勢。另夕卜,資料處理的内容已變得更複雜且高度^ 進。一傳統上,如CPU(Central Processing Unit;中央處理單 謂等之類處理器的性能已高度增強,或是將複數個處 理器轉換成多處理器,以便改良整個資料處 能力。 一疋^'年來,為要貪料處理能力増強的速度已到達超 過高度改良處理器性能的速度。由於開發高性能處理器需 要更多的時間’所以短時間内無法實現處理器高性能改 良。 另万面’例如’依據使用的處理器數量及處理方法, 以決定多處理器的處理能力,並且對個別處理器的高性能 -4- 1229265 A7 B7 五、發明説明(2 ) 的依賴較低。基於此原因,這是改良資料處理裝置處理能 力的其中一種有用的手段。 當一個處理器執行資料處理時,如果依據資料需求範圍 來分割’則使用多處理器之資料處理方法的解釋如下。 (1) 執行資料處理的處理器只使用鄰接之處理器處理的 資料。 此類的控制適用於單元自動裝置(cell autamat〇n)、影像 滤波器、像運動一樣的cloth-wave計算、從彎曲表面的多 邊形產生計算等等。 (2) 執行資料處理的處理器^用所有處理器處理的資 料。 k ^ 此類的控制適用於聯合儲存裝置、四色問題的最佳化、 旅行推銷員問題等等 '無線電(radi〇sity)、群集 (clustering)、多工連結模擬、敎學等等。 (3) 執行資料處理的處理器只使用複數個處理器之一部 份處理器處理的資料。 此類的控制適用於自行组合計算、依據使用視覺感官判 斷的群組演算法、多對多碰撞決策、資料庫搜尋/產生/ 變形連續寶曲表面的計算、產生(b〇rn)動畫、&向運動學 在前面案例(1)中,可利用傳統平行處理器高效率實施 料處理。但是,在前面案例⑺和⑺中,整個系統的: 速度受限於平行處理器之間的通信速度,以至每個處理 的處理速度無法滿意地發揮。例如,會建立所有處理。。 -5- j紙張尺度適用中國國家標規格(21〇 X 297公[ 本發明的目的是提供各 系統、一種資料處理方法 置0 1229265 A7 ----— —____ B7 五、發明説明η~一- 間f又連接’以能夠執行案例⑺和(3)的高速資料處理。 〜疋在此f “兄下’需要許多的硬體,並且實際上並不可 發明概要 種多處理器系統、一種資料處理 、一種電腦程式及一種半導體裝 爲了解決前面提及的問題,本發明提供如下文所述的各 種多處理器系統、一種資料處理系統、一種資料處理方 去、一種電腦程式及一種半導體裝置。 弟"'多處理器系統,其包括複數個處理器,用以執行 資料處理’-控制器’用以將包含在資料處理中使用之資 料的廣播資料廣播至該等複數個處理器,其中該等複數個 處理器的每個處理ϋ均從該控制器廣播的廣播資料中挑選 母個處理器執行資料處理所需的資料,以執行資料處理。 在此4夕處理《系統’由於該等複數個處理器的每個處 理器均從該廣播資料中只挑選每個處理器所需的資料並且 執行資料處理,所以可實施高速處理,而不會發生資料衝 在每個處理器可使用或參考來自於其他處理器之處理 果的情況下,該控制器從該等複數個處理器的每個處理 獲取處理結果,並且將獲取的處理結果當作廣播資料廣 至所有的處理器。 ρ亥寺複數個處理器的毐》個虛搜哭β 7母1U尾理态取好均已被指派識別
裝 訂
V
1229265 A7 ____B7 説明 7 4 )----- 料,用以識別對應的處理器,該控制器產生廣播資料,其 中會將當作結果獲取來源的處理器識別資料加入至處理結 果中,並廣播該資料。因此,每個處理器均很容易挑選執 行資料處理所需的處理結果,使每個處理器可在下一時序 依據★玄識別貝料執行資料處理。另外,每個處理器均很容 易識別已從哪一個處理器傳送該廣播的處理結果。 當已完成資料處理的複數個處理器可能會發生衝突時, 則提供的多處理器系統進一步包括一排序機件,用以從該 等複數個處理器之中已完成資料處理的處理器獲取識別資 料,以便以給定的序列將獲取的識別資料傳送至該控制 器。然後,該控制器被建構,以依據自該排序機件接收的 識別資料來獲得處理結果。在此情況下,進一步提供產生 優先順序資料的裝置,以訂定該控制器所要執行的處理結 果讀取序列。已完成資料處理的處理器被建構,以傳送該 處理器的排序機件識別資料及關於處理的優先順序資料, 該排序機件被建構,以依據該優先順序資料來決定傳送該 識別資料的序列。 例如,在以整體多處理器系統來決定處理序列的情況 下,提供該排序機件可允許該控制器以必要的序列來獲取 該處理結果,並且視爲整個系統以高效率地執行複雜的處 理。 該排序機件包括數量和處理器一樣的暫存器;記綠裝 置,用以將該識別資料及從各自處理器傳送的識別資料記 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公董) 1229265
發明説明 =與對應處理器有關的暫存器中;—比較器,用以執行 1先順序資料之間的比較,以決定記錄在各自暫存器中 資料的序列。該排序機件被建構,以依據該比較器 V决策結果來決定傳送該識別資料的序列。 =多處S器系統中的該控制器包括(例如)記憶體,用以 储存資料;儲存控制裝置,用以從由自該排序機件接收到 的孩識別資料指定的處理器獲取處理結果,以將獲取的結 果儲存至該記憶體中;以及資料產生裝置,用以讀取儲存 在忑迟u的處理結果’以產生包含該處理結果及該接 收識別資料的廣播資料,以此方式允許實施多處理器系 另外,該等複數個處理器的每個處理器更明確具有一資 料處理機件,以決定是H將每個處㈣執行之資料處理 所而的資料納入茲廣播資料,用以當所需資料被納入該廣 播資料中時只挑選出該資料,並且執行資料處理;傳送裝 置,用以依據該控制器的要求,將該資料處理機件執行的 資料處理結果及每個處理器的識別傳送至該控制器;以及 傳送裝置,用以當結束資料處理時,I包含每個處理器識 別資料的處理程序結束通知資料傳送至該排序機件,以此 方式允許實施多處理器系統 第一多處理器系統,其包括複數個處理器,每個處理 器均保存要與輸入資料比較的範本資料;一控制器,用以 將該輸入資料廣播至該等複數個處理器;以及一比較機 件,用以比較該等複數個處理器的各自輸出。該等複數個 -8 - 1229265
處理器保存的範本資料不同於其他處理器分別保存的範本 資料。該等複數個處理器的每個處理器計算該控制器廣播 之輸入資料的圖樣(feature)與每個處理器保存之範本資料 的圖樣(feature)之間的差値,並且將包含計算而得之差值 及識別每個處理器之識別資料的一對資料傳送至該比^ 件。孩比較機件依據從各自處理器接收到的差値來選取任 差値,並將與所選差値配對的識別資料傳送至該控制 器。該控制器依據從該比較機件接收的識別資料來從該等 複數個處理器中指定一個處理器。 如面建構的多處理器系統可高速執行資料相似判斷。 一第二多處理器系統,其包括複數個處理器,用以執行 資料處理;一控制器,用以將資料處理中使用的資料廣播 至該等複數個處理器;以及一加總電路,用以計算該等複 數個處理器執行之資料處理結果的總和。該等複數個處理 器的每個處理器均從該控制器廣播的資料中只挑選處理所 需的資料並且執行資料處理,並且將處理結果傳送至該加 總電路。該加總電路計算從各自處理器傳送之處理結果的 總和,並且將計算結果傳送至該控制器。該控制器將從該 加總電路接收的處理結果之總和廣播至該等複數個處理 器。 ’ 通常需要資料處理結果的總和,才能將與如神經系統電 腦中使用之最佳化計算有關的計算標準化。可將計算而得 的總和廣播至每個處理器。前面建構的多處理器系統可高 速執行這些處理。 -9 - 本紙張尺度適用中國國家標準(CNS) Α4規格(210 χ 297公釐) 1229265 A7 -------一 -_5!__一 五、發明説明(7 ) ~--- 另外,在前面多處理器系統的每種多處理器系統中,該 等複數個處理器的至少部分處理器係經由通用記憶體以環 狀形式相互連接,並且被建構,以經由該通用記憶體來執 仃介於以環狀形式相互連接之處理器之間的資料傳輸/接 收0 本發明提供的資料處理方法《一種利用設備或系統執行 的方法,該設備或系統具有用來執行資料處理的複數個資 料處理裝置,以及用來控制該等複數個資料處理裝置之每 個資料處理裝置之作業的控制裝置,該方法包括下列步 驟:以給足的順序來獲取資料處理結果,其中該資料處理 是由複數個處理器的每個處理器執行,以產生廣播資料, 該包含所獲取的處理結果以及用來識別當作處理結果獲取 來源之資料處理裝置的識別資料,並且將該廣播資料廣播 至該等複數個資料處理裝置,其中該步碟係由該控制裝置 執行;以及依據該控制裝置所接收之該廣播資料中的識別 資料,只選取某些指定的處理結果,以進行資料處理並且 將該處理結果及指示每個資料處理裝置的識別資料傳送給 該控制裝置,其中該步驟係由該等複數個資料處理裝置的 至少一個資料處理裝置執行。 本發明提供的第-資,料處理系、统包括:複數個資料處理 裝置,用以執行資料處理;以及控制裝置,用以廣播廣播 資料,該廣播資料包括從某些或所有該等複數個資料處理 裝置接收的資料冑理結*,以及該等複數個資料處理裝置 之至少一個資料處理裝置執行之資料處理中使用的資料, -10- 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐] ------ 1229265 五、發明説明(8 其中該等複數個資科處理裝 控制裝置廣播的廣播資'^固資枓處理裝置均從該 資料處理所需的資料===每個資料處理裝置執行 送至該控制裝置。 w枓處理’並且將處理結果傳 第::料處理系統是一種在 處理裝置之間執行誓南捅片、* 心復数彳U亦村 ^ ^ ^ ^ ^ 5々資料處理系統,該資料處理 +惠嫵资拉今良 扎疋土少一資料處理裝置以產 ϋ π棱,* ¥、、a 竹匕栝扣疋足資料處理裝置的識別 ^ ❹料處理裝^資料處理資料,·獲取裝 置,用以從某些或所有該等複數個資料處理裝置獲取對; 之資料處理裝置執行的資料處理結果;以及收納裝置,二 :將接收的處理結果納入至該廣播資料,以將該廣播資料 廣播至該等複數個資料處理裝置的每個資料處理裝置。 本發明提供的電腦程式是用來使-設備構成下列功能⑴ ㈣備具有—用以執行介於執行資料處理之複 數個資料處理裝置間雙向通信的電腦;並且本發明提供的 +導體裝置是-種併入一設備中的半導體裝置,其中該設 備具有一用以執行介於執行資料處理之複數個資料處理裝 置間雙向通信的電腦,冑此使該電腦構成下列功能⑴至 (3) 〇 即,有下列的功能: (1)指定至少一資料處理裝置以產生廣播資料,該廣播 資料包括指定之資料處理裝置的識別資訊及傳送至該資料 處理裝置的資料處理資料; -11 -本紙ft尺度適用中a S家料(CNS) A4規格(21GX 297公~. 1229265 A7 B7 五、發明説明(9 (2) 從某些或所有該等複數個資料處理裝置獲取對應之 貝料處理裝置執行的資料處理結果;以及 (3) 將接收的處理結果納入至該廣播資料,以將該廣播 貝料廣播至該等複數個資料處理裝置的每個資料處理裝 置° 圖式簡單説明 一要詳頃下文中詳細說明並參考隨附的圖式,將可明白 本發明的這些目的和其他目的,以及本發明的優點,其 中: 圖1顯不應用本發明之多處理器系統組態實例的圖式; 圖2顯示根據本發明之BCMC組態實例的圖式; 圖3顯:根據本發明之單元處理器組態實例的圖式; 圖4顯tf根據本發明之WTA/加總電路組態實例的圖式; 、、云圖。顯丁根據本發明《多處理器系統執行之處理流程的 程圖; ^ 6八顯:使用根據本發明之鄰接處理器之資料處理結果 的概念圖; 圖7顯示使用根據本發明之某些處理 的概念圖; 貝打她垤…禾 圖8顯示根據本發明群組格點資料之案例的圖式· 圖 ^員雜示根據本發明將物件分割成群集之案例的圖式;及 ,’…據本發明之碰撞決策演算法處理流程的流程 較佳具體實施例詳細說明 1229265 A7 B7 五、發明説明(10 ) 現在將參考附圖來詳細説明本發明的具體實施例。 下文中將解説將本發明應用在多處理器系統當作資料處 理系統實例的具體實施例。 <整個組態> 圖1顯示多處理器系統組態實例的圖式。多處理器系統1 包括廣播記憶體控制器10(下文中稱之爲BCMC),這個用 來控制資料處理及資料記錄和讀取的控制裝置·,複數個單 元處理器2 0,用以當作卞個資料處理裝置的實例;複數個 WTA(Winner Take All)/加總電路30,用以構成資料處理所 需的各種功能。 BCMC及所有的處理器20均是經由廣播通道(可將資訊同 時敷播給數位收件人的通信通道)連接。 多處理器系統1使用BCMC 10來管理狀態變數値(這個狀 態變數値是每個單元處理器20獲取的資料處理結果),並 且透過廣播從BCMC 10傳送所有單元處理器20的狀態變數 値,當作參考數値的一個實例。以此方式使每個單元處理 器20能夠參考其他單元處理器20高速產生的狀態變數値。 廣播通道是介於BCMC 10與複數個單元處理器20之間的 傳輪路徑,並且包括用來傳送位址的位址匯流排及用來傳 送如狀態變數値之類資料的資料匯流排。位址包括用來指 定每個單元處理器20的單元位址,及所有單元處理器20的 廣播位址。 單元位址對應於記憶體上的位址(實體位址或邏輯位 址),並且從單元處理器.20傳送的狀態變數値被設計放置 -13- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A 7 B7 五、發明説明(11 ) 在記憶體中對應於每個單元處理器20之單元位址指示的位 址。每個單元處理器20均配備I D (識別),用以當作識別每 個單元處理器的識別資訊。單元位址也對應於I D。使用 單元位址使得能夠指定要從哪一個單元處理器20輸出狀態 變數値。 圖1中顯示連接WTA/加總電路30的方式。即,WTA/加總 電路30係以金字塔形狀連接,其中單元處理器20端係設定 爲第一階。兩個單元處理器20係連接至第一階之各自 WTA/加總t路30的輸入端子,並且其輸出端子係連接至 第二階WTA/加總電路30的輸入端子。 在第二階及更低階中,較低階之WTA/加總電路30的輸入 端子係連接至各自的輸入端子,並且較高階之WTA/加總 電路30的輸入端子係連接至較低階的輸出端子。較低階之 WTA/加總電路30的輸出端子係連接至最高階之WTA/加總 電路30的輸入端子,並且最高階之WTA/加總電路30妁輸 出端子係難接至BCMC 10。 除了前面説明的連接形式之外,本發明還可以串聯WTA/ 加總電路30 ό々方式實施。在此情況下,兩個單元處理器20 係連接至第一階之WTA/加總電路30的輸入端子,並且其 輸出端子係連接至較高階的輸入端子。較低階之WTA/加 總電路30的輸出端子及單元處理器係連接至第二階及更低 階之WTA/加7總電路30的輸入端子。第二階及更低階之 WTA/加總電路3 0的輸出端子係連接至較高階的輸入端 子。最高階之WTA/加總電路30的輸入端子係連接至較低 -14- 本紙張尺度適用中國國家標準(CNS) Α4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明(12 ) 階之WTA/加總電路30的輸出端子及單元處理器20,並且 最高階之WTA/加總電路30的輸出端子係連接至BCMC 10 ° 下文中將更詳細解説BCMC 10、單元處理器20及WTA/加 總電路3 0。 <BCMC> BCMC 10透過廣播通道將資料廣播至所有的單元處理器 20,以及從各自單元處理器20擷取狀態變數値並且保存狀 態變數値。圖2顯示BCMC 10的組態實例。 BCMC 10包括CPU核心101,用以控制多處理器系統1的 整個作業;主記憶體102,這是可重寫的SRAM(靜態隨機 存取記憶體);以及 DMAC(Direct Memory Access Controller ;直接記憶體存取控制器)103,這些裝置均是經 由匯流排B 1互相連接。CPU核心101是一種包含電腦的半 導體裝置,該電腦具有執行本發明特有資料處理的功能, 其方式是配合主記憶體102來讀取給定電腦程式以執行程 式。主記憶體102係當作整個系統共用的記憶體。 最高障之WTA/加總電路30的輸出端子及外部記憶體(如 硬碟機、可傳輸媒體等等)均是連接至匯流排B 1。 在起始時間,CPU核心10 1從外部記憶體讀取啓動程式, 並且執行啓動程式以運作作業系統。它也從外部記憶體讀 取資料處理所需的各種資料,並且展開至主記憶體102。 如每個單元處理器20狀態變數値之類的資料被設計儲存至 主記憶體102中。狀態變數値被放置在對應於已計算對應 -15- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明(13 ) 狀態變數値之單元處理器20之單元位址的主記憶體位址 中0 CPU核心101依據從主記憶體102讀取的資料,以產生要 廣播至每個單元處理器20的廣播資料。廣播資料是一對資 料,其具有狀態變數値,以及用來指示已計算對應狀態變 數値之單元處理器20的單元位址。在此情況下,會產生一 對或複數對資料。 DMAC 103是一種在主記憶體102與每個單元處理器20之 間執行直接記憶體存取傳送控制的半導體裝置。例如, DMAC 103經由廣播通道將廣播資料廣播至每個單元處理 器20。它也分別獲取各自單元處理器20的資料處理結果, 並將資料處理結果寫入至主記憶體102。 <單元處理器> 每個單元處理器20從廣播資料挑選所所需的資料並且執 行資料處理,並且在資料處理結束時將結果傳送至WTA/ 加總電路30。每個單元處理器20依據來自於BCMC 10的指 令,將狀態變數値(這是資料處理結果)傳送至BCMC 10。 各自單元處理器20係經由通用的記憶體(圖中未顯示)以環 狀形式互相連接。每個單元處理器20可在同步時脈期間執 行資料處理。再者,每個單元處理器20可在不同時脈期間 執行資料處理。圖3顯示單元處理器20的組態實例。 單元處理器20係由單元CPU 201、輸入緩衝器202、輸出 緩衝器203、WTA緩衝器204、程式控制器205、指令記憶 體206及資料記憶體207所組成。 -16- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明(14 ) 單元CPU 20 1是具有可程式規劃浮點計算機的處理器, 並且控制每個單元處理器20的運作以執行資料處理。單元 CPU 201經由輸入緩銜器202獲得須從BCMC 10廣播的廣播 資料。然後,單元CPU 201使用單元位址資料對來決定所 獲取的廣播資料是否是單元CPU 201應執行處理所需的資 料。如果必要的話,單元CPU 20 1將狀態變數値寫入至資 料記憶體207中對應的位址。另外,單元CPU 20 1從資料記 憶體207讀取狀態變數値,並且執行資料處理。然後,單 元CPU 201將資料處理結果寫入至輸出緩衝器203,並且將 指示資料處理結束的資料傳送至WTA/加總電路30。 輸入緩衝器202是用來保存須從BCMC 10廣播的廣播資 料。被保存的廣播資料被傳送至單元CPU 201,以響應來 自於單元CPU 201的請求。 輸出緩衝器203是用來保存單元CPU 201的狀態變數値。 被保存的狀態變數値被傳送至單元BCMC 10,以響應來自 於BCMC 10的請求。除了前面所述以外,輸入緩衝器202 及輸出緩衝器203還可執行傳輸及接收控制資料。 在單元CPU 20 1執行的資料處理結束時,W T A緩衝器 204接收來自於單元CPU 201的資料,這個資料指示資料處 理結束。然後,WTA緩衝器204將接收到的資料傳輸至 WTA/加總電路30,以向其報告資料處理結束。指示資料 處理結束的資料包括(例如)單元處理器20的ID及決定優先 順序的優先順序資料,當要將輸出緩衝器203中儲存的狀 態變數値讀入至BCMC 10時需要這個優先順序資料。 -17- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明(15 ) 程式控制器205從BCMC 10擷取用來定義單元處理器20作 業的程式。定義單元處理器20作業的程式包括供單元處理 器20執行資料處理使用的程式,以及用來決定每個單元處 理器20執行處理所需之資料的資料選擇程式。程式還包括 用來決定優先順序的優先順序決定程式,這是當將處理結 果讀入至BCMC 10所需的程式。 指令記憶體206儲存程式控制器205擷取的程式。依需 求,將儲存的程式讀入至單元CPU 201。 資料記憶體207係用來儲存單元處理器20處理的資料。 按照單元CPU 201需求所決定廣播資料被寫入至單元CPU 201中。廣播資料係儲存在資料記憶體207中對應於單元位 址的位址。 另外,根據本具體實施例,資料記憶體207的一部份係 經由通用記憶體連接至互相鄰接的單元處理器20,促使能 夠在每個循環期間,在鄰接的單元處理器之間傳輸/接收 資料。 < WTA/加總電路〉 複數個WTA/加總電路30依據每個單元處理器20傳送之用 來指示資料處理結束的資料,以決定BCMC 10從單元處理 器20擷取狀態變數値的順序,並向BCMC 10報告。 圖4顯示WTA/加總電路30的組態實例。 每個WTA/加總電路30均是由兩個輸入暫存器A和B (下文 中稱之爲第一輸入暫存器301和第二輸入暫存器3 02)、選 擇器開關303、比較器304、加法器305及輸出暫存器306所 -18- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 發明説明(16 組成。 第一輸入暫存器301和第二輸入暫存器3〇2均具有一個整 數暫存器及-個浮點暫存器。例如,在每個單元處理器 傳送之用來指示資料處理結束的資料之中,會將ID資料 寫入至整數暫存器,以及將優先順序資料寫人至浮點暫存 器。 選擇器開關303將能量供,给比較器3〇4或加妹器3〇5。且 體=言’選擇器開關3G3促使能夠根據作業模式來使用比 較器或加法器的其中-個。作業模式係由來自於BCMC 1〇 的指令所決定。下文中將會説明作業模式。 比較器304執行浮點値的比較,這是第一輸入暫存器3〇1 和口第二輸入暫存器302的浮點暫存器所保存的浮點健。比 較器304將較大(或較小)値及其隨附的整數寫入 器 306。 加法器305计算〉手點値(這是第一輸入暫存器和第二輸 入暫存咨302的;于點暫存器所保存的浮點値)的總和,並將 計算結果寫入至輸出暫存器3〇6。 。輸出暫存器306的建構方式實質上相同於第—輸入暫存 器301和第二輸入暫存器3〇2。即,輸出暫存器3〇6包括整 數暫存②及4點暫存器。ID資料被窝人至整數暫存器, 而優先順序資料被寫入至浮點暫存器。 ,加總電路30具有下文中提出的三種作業模式。 最大値(WT A )模式: 比較器304係由選擇器開關3〇3供給能量。比較器州執 -19 -
1229265 A7 ----------B7 五、發明説明(17 ) ---- 行浮點値A與B (這是裳 ^ λ ^ -a- ” 疋弟輸入暫存器301和第二輸入暫存 的㈣暫存器所料的浮點幻的比較。比較哭304 2大(或較小)値及其隨附的整數寫入至輸出暫存器306。 二窝?輸出暫存器3〇6結束時’會清除第一輸入暫存器 和丄弟二輸入暫存器302。輸出暫存器306的内容被寫入 :較尚階之WTA/加總電路3〇的輸入暫存器。此時,如果 當作寫入目的地的輸入暫存器未被清除,則會停止寫入, 並且在這個循環期間不執行寫入。基於此原因,輸出 器3〇6的内容被設計在下一循環期間寫入。 加法模式: 一加法器305係由選擇器開關3〇3供給能量。加法器3〇5計 异洋點値(這是第一輸入暫存器3〇1和第二輸入暫存 = 302的浮點暫存器所保存的浮點値)的總和1後,加法 = 305—將計算結果寫入至輸出暫存輸出暫存器遍 二内谷被窝入至較高階之WTA/加總電路3。的輸入暫存 近似排序模式: ,比較器304係由選擇器開關3〇3供給能量。比較器则執 订洋點値八與8(這是第一輸入暫存器3〇1和第二輸入 器302的浮點暫存器所保存的浮點値)的比較。比較器⑽ 將較大(或較小)値及其隨附的整數寫入至輸出暫存哭Μ 6。 之後,只會清轉人暫存器,其料“至輸 3〇6的値。輸出暫存器的内容被寫入至較高階之π: 加總電路30的輸入暫存器。如果當作寫入目的地的輸入暫 -20-
1229265 A7 B7 五、發明説明(18 ) 存器未被清除,則會停止寫入,並且在這個循環期間不執 行寫入。在加法運算中,會執行較低階之WTA/加總電路 30之輸出暫存器306的寫入作業。 藉由近似排序模式,BCMC 10從最高階之WTA/加總電路 3 0接收到的資料被儲存,以適當地遞增或遞減浮點値。 另外,會進入每種模式之前,均會先清除所有WTA/加總 電路30的第一輸入暫存器301、第二輸入暫存器302及輸出 暫存器306。 每種模式的變更實施當作排序機件的功能(排序機件)及/ 或與整個複數個WTA/加總電路有關的加總電路。換言 之,近似排序模式中的作業實現排序機件,以及加法模式 中的作業實現加總電路。 以最大値模式及近似排序模式運作的WTA/加總電路30可 以下列方式實現: 即,WTA/加總電路30係由與單元處理器20數量相同的輸 入暫存器、選擇器開關、比較器304、加法器305及輸出暫 存器所組成。 準備的輸入暫存器數量與單元處理器20的數量相同,並 且每個輸入暫存器均包括一個整數暫存器及一個浮點暫存 器,類似於第一輸入暫存器301和第二輸、入暫存器302。比 較器執行浮點値的比較,這是所有輸入暫存器的浮點暫存 器所保存的浮點値。加法器計算浮點値的總和,這是所有 浮點暫存器所保存的浮點値。 輸出暫存器與圖4所示之WTA/加總電路30的輸出暫存器 -21 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明(19 ) 相同。 比較器比較各自輸入暫存器之浮點暫存器所保存的優先 順序資料,並且以遞減的優先順序將隨附的I D連續寫入 至輸出暫存器。以此方式促使能夠以遞減的優先順序將 ID傳送至BCMC 10。 加法器將浮點暫存器所保存的資料相加,以獲得總和。 此類的WTA/加總電路係當作本發明的排序機件及加總電 路,而不是採用如圖1所示的連接。 <資料處理方法〉 本具體實施例的多處理器系統1執行'下列的作業,以執 行必要的資料處理。圖5顯示多處理器系統1執行之處理流 程的流程圖。 在BCMC 10的主記憶體102中,預先儲存所有單元處理 器20之狀態變數値的起始値。 BCMC 10產生廣播資料,這是包括每個單元處理器20之 狀態變數値及每個單元處理器20之單元位址的一對資料 (步驟S101)。然後,BCMC 10將產生的廣播資料廣播至所 有的單元處理器20(步驟S102)。 每個單元處理器20將廣播資料擷取至輸入緩衝器202。 單元處理器20依據指令記憶體206中儲存的資料選擇程 式,以檢查單元CPU 201輸入緩衝器202保存之廣播資料的 單元位址,並且確認是否有每個單元處理器20執行資料處 理所需的狀態變數値(步驟S 103)。在沒有每個單元處理器 20執行資料處理所需之狀態變數値的情況下,單元處理器 -22- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明(2〇 ) 20結束處理作業(步驟S 103 :否)。在有每個單元處理器20 執行資料處理所需之狀態變數値的情況下(步驟S 103 : 是),單元處理器20執行將對應的狀態變數値覆寫至資料 記憶體207上對應於與這個狀態變數値配對之單元位址的 位址上(步驟S104)。 在此方式中,結束將資料從BCMC 10廣播至每個單元處 理器20。 當廣播結束時,每個單元處理器20將資料處理提供給資 料記憶體207上記錄的狀態變數値,以依據指令記憶體206 中儲存的資料處理程式來產生新的狀態變數値。新的狀態 變數値被寫入至資料記憶體207,並且也會被寫入至輸出 緩衝器203(步驟S105)。然後,每個單元處理器20將新的狀 態變數値覆寫至資料記憶體207上對應於其單元位址的位 址上。 當資料處理結束時,單元CPU 201經由WTA緩衝器204 將結束資料(包含I D及優先順序資料)傳輸至第一階之 WTA/加總電路30的輸入暫存器,並且報告資料處理結束 (步驟S 106)。資料處理前後,會依據給定的優先順序決定 程式來產生優先順序資料。 關於每個單元處理器20傳送的結束資料,WTA/加總電路 30分別使用輸入暫存器的整數暫存器來保存I D,以及使用 浮點暫存器來保存優先順序資料。此處,WTA/加總電路 30係以近似排序模式運作。基於此原因,選擇器開關303 供給能量給比較器304。 -23- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明(21 ) WTA/加總電路30之第一輸入暫存器301和第二輸入暫存 器3 02的整數暫存器保存從不同處理器傳送的I D。每個浮 點暫存器保存的I D隨附的優先順序資料。比較器304從第 一輸入暫存器301和第二輸入暫存器3 02的浮點暫存器讀取 優先順序資料,並且比較優先順序資料。由於比較結果, 比較器304將較高優先順序資料及隨附的I D寫入至輸出暫 存器306的浮點暫存器及整數暫存器。關於寫入至輸出暫 存器306之輸入暫存器的内容,會將這内容清除。關於寫 入至輸出暫存器306之I D及優先順序資料,則是被寫入至 較高階之WTA/加總電路30的輸入暫存器。 前面提及的處理係在各階的WTA/加總電路上執行。最高 階之WTA/加總電路30將寫入至輸出暫存器3 06之整數暫存 器的ID傳送至BCMC 10。 整個WTA/加總電路30利用前面提供的處理,以遞減的優 先順序將ID傳送至BCMC 10(步驟S107)。 BCMC 10從對應於WTA/加總電路30傳送之ID之單元處 理器20的輸出緩衝器203獲取須經資料處理的狀態變數 値。執行將所獲取的狀態變數値覆寫至對應於指示已執行 處理之單元處理器20之單元位址的位址中(步驟S 108)。 以此方式,結束處理狀態變數値的一個循環作業。 BCMC 10從每個單元處理器20獲取資料處理結果,以此 方式產生廣播資料。 每個單元處理器20從廣播資料中只挑選每個單元處理器 20所需的資料,以執行資料處理。使用此類廣播資料的資 -24- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 ------— —_B7 五、發明説明一~) " T處理促使能夠使用所有其他單元處理器2()處理過的資料 二執行處理。另外’ BCMC 1()使用—對資料(其具有每個 ^處理器2G傳送之資料處理結果及用來指示已產生資料 處理結果之單元處理器2〇的單元位址)來產生廣播資料。 k促使能夠只使用特定單元處理器2〇傳送的資料處理結果 :執I處里另外,由於鄰接的單元處理器20係經由通用 記憶體互相連接,所以能夠在鄰接的單元處理器20之間執 行處理’類似於先前技藝。 每個單元處理器20從廣播資料挑選所需的資料,而不需 要將每個單元處理幾20所需的資料直接擷取至主記憶= 102,並且處理其中保存的資料,允許高速處理,而不= 發生資料衝突。 3 [第一項具體實施例] 下文中將具體解説前面解説之多處理器系統丨的第一具 體實施例。 這個具體實施例參考圖6來解説只使用特定單元處理器 20及其鄰接之其他單元處理器2〇處理過之資料的實例。 在圖6中,‘‘ Ο ’’標示單元處理器,而較暗的‘‘ 〇,,標示執行 資料處理的單元處理器,而“ φ,,標示保存必要資料的單元 處理器。 假設下列的過遽計算係相對於關於η X η點陣0是-气_ 以上的自然數)之每個點陣點之資料(點陣點資料)連續執 行。
Xi,j =(Xi-l,j + Xi十 l,j + Xi,j-Xi,j + l)/4 -25- 本紙張尺度適用中國國家標準(CNS) A4規格(210 x 297公釐) 1229265
其中1 -點陣點的列數,j '點陣點的行數。 次BCMC 1()將點陣點資料(當作廣播資料之以列 資料)廣播至n單元處理器2〇。 一 ''' 圖8群組之點陣資料的圖式。 料得伽一,,, _ τ以〇榛不的點陣點資 一考 、、且群組。一個群組中的點陣點資料係由一個單 疋處理器20處理。 早 單:處理器20將來自於廣播資料之群組的必要點陣點資 =存至資料記憶體2G7中。’然後,它從資料記憶體207連 續項取點陣點資料,並且執行資料處理。經由通用記憶體 連接〈單元處理器20間的資料傳送係使用通用記憶體執 :。如果將資料寫入至通用記憶體的寫入作業是一個循 環’則在單元處理器则的傳送群組資料可能以2n循環執 行0 各自單元處理器20係同步運作以執行寫入至通用記憶 體,並且當作在官線處理中同時計時,促使能夠在單元處 理器之間同時執行通信及計算。 每當群組點陣資料之資料處理結束時,BCMC 1〇廣播下 一個廣播資料。單元處理器2〇依據廣播的資料丨和』來判斷 是否應執行資料處理。 廣播資料被群組,以便能夠以列方向或行方向來處理資 料,並且經由通用資料來執行資料傳送,允許以列方向或 行方向來處理資料。 [第二項具體實施例] 這個具體實施例;^考圖7來解説只使用某些或所有單元 -26- 本紙張尺度適用中國國家標準(CNS) A4规格(210 X 297公釐) 1229265 A7 B7 五、發明説明(24 ) 處理器20處理過之資料的實例。在圖7中,“ 0 ”標示單元 處理器,而較暗的“ Ο ”標示執行資料處理的單元處理器, 而“· ”標示保存必要資料的單元處理器。此類多處理器系 統可用來實現跳躍欄位組合儲存(hop field associative storage) 〇 假設每個單元處理器20均保存一個狀態變數値(這個資料 處理結果),以及權値因數(用以指示狀態變數値的重要 性)。另外,會將號碼加入至每個單元處理器20,並且 BCMC 10以號碼順序從所有的單元處理器20擷取狀態變數 値。 BCMC 10廣播從每個單元處理器20擷取的狀態變數値, 當作廣播資料。每個單元處理器20從廣播資料中只選取所 需的狀態變數値,並且執行關於權値因數的乘積加總作 業,並且更新狀態變數値。在所需的狀態變數値指示所有 的狀態變數値均包含於廣播資料中的情況下,這相當於是 使用所有處理器處理過的資料進行處理。 [第三項具體實施例] 下文中將解説圖樣比對計算處理的實例。 此處,執行用來指示保存資料之單元處理器20的處理, 其類似於輸入資料功能。這個處理執行方式如下: 每個單元處理器20均事先保存要比較的範本資料。 BCMC 10將輸入資料廣播至所有的單元處理器20。每個 單元處理器20計算每個處理器保存之範本資料的圖樣 (feature)與輸入資料的圖樣(feature)之間的差値。差値會與 -27- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 ____B7 五、發明説明(25 ) I D —起傳送至WTA/加總電路3〇。 WTA/加總電路30係以最大値模式運作。輸入暫存器的整 數暫存器保存id,而浮點暫存器則保存差値。比較器3〇4 比較各自單元處理器2〇計算的差値,並且將較小差値及其 隨附的I D傳送至輸出暫存器3 〇6。彡個處理係透過加 總電路30執行,以獲取最小差値及其隨附的⑺。獲取的 ID及差値一起被傳送至BCMC 10。 BCMC 10依據ID來指定單元處理器2〇。這促使能夠偵測 最類似於輸入資料之圖樣(feature)的範本資料,並且偵測 範本資料與輸入資料的差値。 [第四項具體實施例] 下文中將解説影像處理中使用之運動中物件碰撞決策演 算法處理的實例。「碰撞決策演算法」決定存在於特定空 間中的η個物件是否有發生碰撞,以及當發生碰撞時產生 的強度。 η個物件的空間分佈有些變化,並且物件被分成m個群 集。例如,此處假設決定是否有一個物件與任何其他 物件發生碰撞最強烈。 圖9顯示此類空間中的物件,並且使用矩形來隔離以“〇,, 標示的物件,以形成一個群集。在圖9中,物件被分成五 個群集。物件的資料指示係從BCMC 1〇廣播,並且以群集 爲基礎被擷取至單元處理器20。單元處理器2〇執行盥包本 於-個群集中之料物件有關之空間位置與移動的相㈣ •28- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7
在圖5的貫例中 之物件的處理。 單元處理器…執行被分成五個群集 下文中將參考圖10來說明 程0 有關碰撞決策演算法的處理流 料=1 產:廣播資料(其包括具有物件位置和速度之資 、牛貝科,以及指示對應物件所屬之群集的群集資 料),並且將廣播資料廣播至所有的單元處理器20(步驟 S2(H)。母個單元處理器聰據群集資料從廣播資料挑出 物件資料,並擷取之。 已擷取物#資料的單元處玉里器20從物件的現行位址資料 及速度資料來計算時間單元後的新位址資料。單元處理器 20從新位址資料獲取新邊框的値(步驟S2〇2)。邊框表示圍 住物件的矩形,例如,如圖9所示。邊框値是邊框頂點的 座標。 BCMC 10從每個單元處理器2〇擷取新的物件位置資料, 並且更新位置資料(步驟S2〇3)。 接著’ BCMC 10將包含獲取之新位置資料的物件資料逐 一廣播至所有的單元處理器2〇(步驟S204)。即,BCMC 10 將位置資料(其指示一個物件的位置,當作須經碰撞決策 的目標’下文中稱之爲「決定物件」)傳送所有的單元處 理器20。 每個單元處理器20先使用於步驟S202計算的邊框來決定 是否會發生決定物件碰撞(步驟S205)。具體而言,單元處 理备2 0決定該決定物件的位置是否是位於邊框上。 -29- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明(27 ) 在可能會發生決定物件碰撞的情況下,即,決定物件位 於邊框上(步驟S205 :是),單元處理器20連續計算位於邊 框上要處理之各自物件間的距離(步驟S206)以決定是否發' 生碰撞(步骤S 2 0 7)。在決定物件與位於邊框上之任一物件 碰撞的情沉下(步驟S207 :是),單元處理器20產生包括碰 撞強度資料的碰撞資料,其以數量方式來指示碰撞所造成 的影響強度,並且產生碰撞對決定物件造成的影響的資料 (步驟S208)。另外,單元處理器20將產生之碰撞資料中的 碰撞強度資料與其ID —起傳送至WTA/加總電路30(步驟 S209) 〇 如果決定物件出現在邊框範圍外(步驟S205 :否),或決 定物件由於計算距離的結果而未與任一物件碰撞(步驟 S207 :否),則每個單元處理器20將(例如)「-1,0」當作碰 撞強度資料傳送至WTA/加總電路30(步驟S210)。 WTA/加總電路30係以最大値模式運作。WTA/加總電路 30執行從單元處理器20傳送之碰撞強度資料間的比較,並 且偵測碰撞強度資料(其指示碰撞所造成的最大影響)(步驟 S211)。然後,WTA/加總電路30指定已產生所偵測之碰撞 強度資料的單元處理器20。之後,WTA/加總電路30將 ID(用以指示指定的單元處理器20)傳送至BCMC 10。 BCMC 10從單元處理器20(從最高階之WTA/加總電路30 所指出的單元處理器之ID)獲得碰撞資料(步驟S2 12)。於 步驟204之後,藉由處理所有物件,執行空間中所有物件 之間的碰撞決策。 -30- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明(28 ) [第五項具體實施例] 下文中將解説使用WTA/加總電路30之加法器305的實 例0 每個單元處理器20將資料處理結果輸入至WTA/加總電路 30。在WTA/加總電路30中,加法器305將資料處理結果相 加,結果獲取與所有單元處理器20有關之資料處理結果的 總和。在此方式中,WTA/加總電路30能夠高速獲取資料 處理結果的總和。 資料處理結果的總和被傳送至BCMC 10,接著將總和高 速傳輸至所有的單元處理器20。資料處理結果的總和係用 來與如神經系統電腦中使用之最佳化計算有關的計算標準 化。 在前面的解説明,雖然BCMC 10及WTA/加總電路30係以 互相獨立的方式構成,但是可將WTA/加總電路30併入 BCMC 10中,以當作一個組塊來建構控制器。 另外,前文中已解説資料處理裝置是單元處理器20及控 制裝置是控制器(BCMC 10)的實例。但是,本發明的組態 組件不限定於前面的實例。 例如,可能提供如下的組態。 即,兩個或兩個以上資料處理終端機係經由廣域網路以 雙向通信的形式連接。在這些資料處理終端機之中,一個 或複數個資料處理終端機被當作控制裝置,而其他的資料 處理終端機係當作資料處理裝置。控制裝置具備廣播廣播 資料的功能,該廣播資料包括從某些或所有複數個資料處 -31 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 Γ~-—--~_ Β7 五、發明説明(29 ) ------ 接收到的資料處理結果及至少一資料處理裝置執行 理使用的資料_。複數個資料處理裝置的每 ,置均具備從控制裝置廣播之廣播資料只挑選每個資料 處理裝置執行資料處理所需的資料,以執行資料處理,並 且處理結果傳輸至控制裝置。 另外’還可能提供如下的組態。 、即,複數個-般用途的資料處理終端機(其能夠指定預先 決定的識別資訊,例如,前文提及的識別資料)係當作複 數個資料處理裝置使用。然後,可只用一個伺服器(並能 與執行與這些一般用途資料處理終端機之間的雙向通信) 來建構資料處理系統,或是使用配備包含cpu及記憶體之 半導體裝置的設備來建構資料處理系統。 〜且 關於此類的伺服器及設備,其内建的cpu讀取並執行給 定的電腦程式。以此方式爲词服器主體或設備提供下列的 功能。即,指定至少一資料處理終端機當作資料處理裝置 的功能,以產生廣播資料,該廣播資料包括指定之資料處 理終端機的識別資訊及傳送至該資料處理終端機的資料處 理資料。另一項功能是從某些或所有該等複數個資料處理 終端機獲取對應之資料處理終端機執行的資料處理結果。 還有一項功能是將接收的處理結果納入至該廣播資料,以 將該對應的廣播資料廣播至該等複數個資料處理終端機的 每個資料處理終端機。 ' 前文提及的本發明能夠在使用複數個資料處理裝置的情 況下,在資料處理裝置之間高效率執行資料處理。 用 32- 1229265 A7 B7 五、發明説明(3〇 ) 各種具體實施例及變更均可實施,而不會脱離本發明廣 大的精神及範疇。前面説明的具體實施例係用來解説本發 明,而不是限制本發明的範疇。本發明的範疇係由隨附的 申請專利範圍指出,而不是由具體實施例指出。在本發明 申請專利範圍同等意義範圍内及申請專利範圍内的各種修 改均視爲屬於本發明的範疇。 -33- 本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公釐)
Claims (1)
- 122^^給239〇0號專利申請案 中文申請專利範圍替換本(92年10月) 六、申請專利ϋ 1 · 一種多處理器系統,包括: 複數個處理器,用以執行資料處理;以及 -控制器,用以將包含在資料處理中使用之資 播資料廣播至該等複數個處理器,其中該等複數個處二 器的每個處ί里器均從該控制器廣#的廣播資料中 個處理器執行資料處理所需的資料,以執行資料處理。 2·如申請專利範圍第丨項之多處理器系統,其中該控制器 從已執行資料處理之每個處理器獲取處理結果,並且將 獲取的處理結果當作該廣播資料廣播至所有的處理器。’ 3·如申請專利範圍第1項之多處理器系統,其中該等複數 個處理器的每個處理器已被指派識別資料,用以識別每 個處理器,該控制器產生廣播資料,其中會將當作結果 獲取來源的處理器識別資料加入至該處理結果中並廣播 該資料,並且該等複數個處理器挑選執行資料處理所需 的該處理結果,使每個處理器可在下一時序依據該包含 於該接收之廣播資料識別資料執行資料處理。 4·如申請專利範圍第3項之多處理器系統,該多處理器系 統進一步包括一排序機件,用以從該等複數個處理器之 中已完成資料處理的處理器獲取識別資料,以便以給定 的序列將獲取的識別資料傳送至該控制器,其中該控制 器被建構,以依據自該排序機件接收的識別資料來獲得 該處理結果。 5.如申請專利範圍第4項之多處理器系統,該多處理器系 統進一步包括產生優先順序資料的裝置,以訂定該控制 本紙張尺度適用中國國家標準(CNS) Α4規格(210X297公董) A8 B8 C8 D8 122參替換1| 六、申請專利範園 器所要執行的該處理結果讀取序列,其中已完成資料處 理的處理器被建構,以傳送該處理器的排序機件識別資 料及關於處理的該優先順序資料,該排序機件被建構, 以依據該優先順序資料來決定傳送該識別資料的序列。 6.如申請專利範圍第5項之多處理器系統,其中該排序機 件包括數量和該等處理器一樣的暫存器;記錄裝置,用 以將該識別資料及從各自處理器傳送的識別資料記錄至 與對應處理器有關的該暫存器中;一比較器,用以執行 該優先順序資料之間的比較,以決定記錄在各自暫存器 中之識別資料的序列,並且該排序機件依據該比較器的 決策結果來決定傳送該識別資料的序列。 7·如申請專利範圍第4項之多處理器系統,其中該控制器 包括:記憶體,用以儲存資料;儲存控制裝置,用以從 由自該排序機件接收到的該識別資料指定的處理器獲取 孩處理結果,以將獲取的結果儲存至該記憶體中;以及 資料產生裝置,用以讀取儲存在該記憶體中的該處理处 果:以產生包含該處理結果及該接收識別資料的該廣: 8·如申請專利範圍第4項之多處理器系統,其中該等複數 個處理器的每個處理器均包括:一資料處理機件 定是否要將每個處理器執行之資料處理所需的資料納k 孩廣播資料’用以當所需資料被納人該廣播資料中時只 挑選出該資料,並且執行資料處理;傳送裝 據該控制器的要求,將該資料處理機件執行的資= -2 -=果及每:處理器的識別傳送至該控制器, ·以及傳送裝 料的虛理葙&社太 ?知包3母個處理器識別資 Q科:,序結束通知資料傳送至該排序機件。 9· 一種多處理器系統,包括·· 複數個處理器,每個處 的範本資料; 。“保存要與輸入資料比較 器’用以將該輸人資料廣播至該等複數個處理 為,以及 出比車乂機件’用以比較該等複數個處理器的各自輸 其/該等複數個處理器保存的範本資料不同於其他處 里器刀別保存的範本資料;該等複數個處理器的每個處 理器計算該控制器廣播之輸人資料的圖樣加㈣與每 個處理器保存之範本資料的圖樣(⑽㈣)之間的差值, 並且將包含該計算而得之差值及識別每個處理器之識別 資料的一對資料傳送至該比較機件;該比較機件依據從 各自處理器接收到的差值來選取任一差值,並將與所選 差值配對的識別資料傳送至該控制器;該控制器依據從 汶比軚機件接收的識別資料來從該等複數個處理器中指 定一個處理器。 10· 一種多處理器系統,包括: 複數個處理器,用以執行資料處理; 担制器,用以將資料處理中使用的資料廣播至該等 複數個處理器;以及 1229_豕: Q ^ 申請專利範圍 口總私路’用以計算該等複數個處理器執 處理結果的總和, < 貝科 其中財複數個處理器的每個處理器均從該控制哭 :的資料中只挑選處理所需的資料並且執行資料處= :二將處理結果傳送至該加總電路;並且該加總 异從各自處理器傳送之處理結果的總和,並且將 杜 ::达至該控制器;並且該控制器將從該加總電路:‘ 的處理結果之總和廣播至該等複數個處理器。 11.,申請專利範圍^項之多處理器系統,其中該 個處理器的至少部分處理器係經由通用記憶體以環狀: :相互連接,並且被建構,以經由該通用記憶體來執‘ a於以每狀形式相互連接之處理器之間的資料傳輸/接 收0 泛如申請專利範圍第9項之多處理器系統,其中該等複數 個處理器的至少部分處理器係經由通用記憶體以環狀形 式相互連接’並且被建構,以經由該通用記憶體來執^ 介於以環狀形式相互連接之處理器之間的資料傳輸/ 收。 13.如申請專利範圍第1〇項之多處理器系統,其中該等複數 個處理器的至少部分處理器係經由通用記憶體:環狀形 式相互連接’並且被建構’以經由該通用記憶體來執行 介於以環狀形式相互連接之處理器之間的資料傳輸/接 收。 Η. -種資料處理方法,該方法執行於一設備或系統,其具 -4-1229265 吣、0 Λ.有用來執行資料處理的複數個資料處理裝置,以及用來 控制該等複數個資料處理裝置之每個資料處理裝置之作 業的控制裝置,該方法包括下列步驟: 以給定的順序來獲取資料處理結果,其中該資料處理 是由複數個處理器的每個處理器執行,以產生廣播資 料為包3所獲取的處理結果以及用來識別當作處理杜 果獲取來源之資料處理裝置的識別資料,並且將該廣播 資料廣播至該等複數個資料處理裝置,其中該步驟係由 該控制裝置執行;以及 依據該控制裝置所接收之該廣播資料中的識別資料, 只選取某些指定的處理結果,以執行資料處理,並且將 該處理結果及指示每個資料處理裝置的識別資料傳送給 該控制裝置,其中該步騾係由該等複數個資料處理裝置 的至少一個資料處理裝置執行。 15· —種資料處理系統,包括: 複數個資料處理裝置,用以執行資料處理;以及 控制裝置,用以廣播廣播資料,該廣播資料包括從某 些或所有該等複數個資料處理裝置接收的資料處理結 果’以及該資料處理裝置之至少一個資料處理裝置執行 資料處理中使用的資料, 其中該等複數個資料處理裝置的每個資料處理裝置均 從該控制裝置廣播的廣播資料中只挑選每個資料處理裝 置執行資料處理所需的資料以執行資料處理,並且將處 理結果傳送至該控制裝置。 -5- 本紙張尺度適用中國國家標準(CNS) Α4規格(210X297公釐)裝 訂鲁 I福9涵換頁(1)指定至少一該資料處理裝置以產生廣播資料之裝 置二該廣播資料包括減之資料處理裝置的識別資訊及 傳送至该貝料處理裝置的資料處理資料; 、(2)從某些或所有該等複數個資料處理裳置獲取對應 之資料處理裝置執行的資料處理結果之裝置;以及 (3)將接收的處理結果納入至該廣播資料,以 ==至該等複數個資料處理裝置的每個資料;: 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000294732 | 2000-09-27 | ||
JP2001289588A JP3426223B2 (ja) | 2000-09-27 | 2001-09-21 | マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
TWI229265B true TWI229265B (en) | 2005-03-11 |
Family
ID=26600866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW090123900A TWI229265B (en) | 2000-09-27 | 2001-09-27 | Multi-processor system, data processing system, data processing method, and computer readable recording media |
Country Status (10)
Country | Link |
---|---|
US (1) | US7017158B2 (zh) |
EP (1) | EP1324209B1 (zh) |
JP (1) | JP3426223B2 (zh) |
KR (1) | KR100866730B1 (zh) |
CN (1) | CN1258154C (zh) |
AT (1) | ATE500556T1 (zh) |
AU (1) | AU2001292269A1 (zh) |
DE (1) | DE60144155D1 (zh) |
TW (1) | TWI229265B (zh) |
WO (1) | WO2002027513A1 (zh) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6989843B2 (en) * | 2000-06-29 | 2006-01-24 | Sun Microsystems, Inc. | Graphics system with an improved filtering adder tree |
US8478811B2 (en) | 2002-10-08 | 2013-07-02 | Netlogic Microsystems, Inc. | Advanced processor with credit based scheme for optimal packet flow in a multi-processor system on a chip |
US7334086B2 (en) * | 2002-10-08 | 2008-02-19 | Rmi Corporation | Advanced processor with system on a chip interconnect technology |
US9088474B2 (en) | 2002-10-08 | 2015-07-21 | Broadcom Corporation | Advanced processor with interfacing messaging network to a CPU |
US8015567B2 (en) | 2002-10-08 | 2011-09-06 | Netlogic Microsystems, Inc. | Advanced processor with mechanism for packet distribution at high line rate |
US8176298B2 (en) | 2002-10-08 | 2012-05-08 | Netlogic Microsystems, Inc. | Multi-core multi-threaded processing systems with instruction reordering in an in-order pipeline |
US7346757B2 (en) | 2002-10-08 | 2008-03-18 | Rmi Corporation | Advanced processor translation lookaside buffer management in a multithreaded system |
US8037224B2 (en) | 2002-10-08 | 2011-10-11 | Netlogic Microsystems, Inc. | Delegating network processor operations to star topology serial bus interfaces |
US20050120185A1 (en) * | 2003-12-01 | 2005-06-02 | Sony Computer Entertainment Inc. | Methods and apparatus for efficient multi-tasking |
JP4794194B2 (ja) * | 2005-04-01 | 2011-10-19 | 株式会社日立製作所 | ストレージシステム及び記憶制御方法 |
JP4555145B2 (ja) * | 2005-04-28 | 2010-09-29 | 富士通株式会社 | バッチスケジューリングプログラム、バッチスケジューリング方法およびバッチスケジューリング装置 |
US7444525B2 (en) * | 2005-05-25 | 2008-10-28 | Sony Computer Entertainment Inc. | Methods and apparatus for reducing leakage current in a disabled SOI circuit |
US7970956B2 (en) * | 2006-03-27 | 2011-06-28 | Ati Technologies, Inc. | Graphics-processing system and method of broadcasting write requests to multiple graphics devices |
US9596324B2 (en) | 2008-02-08 | 2017-03-14 | Broadcom Corporation | System and method for parsing and allocating a plurality of packets to processor core threads |
JP5039950B2 (ja) | 2008-03-21 | 2012-10-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | オブジェクト移動制御システム、オブジェクト移動制御方法、サーバ及びコンピュータプログラム |
US7958341B1 (en) | 2008-07-07 | 2011-06-07 | Ovics | Processing stream instruction in IC of mesh connected matrix of processors containing pipeline coupled switch transferring messages over consecutive cycles from one link to another link or memory |
US8145880B1 (en) | 2008-07-07 | 2012-03-27 | Ovics | Matrix processor data switch routing systems and methods |
US8327114B1 (en) | 2008-07-07 | 2012-12-04 | Ovics | Matrix processor proxy systems and methods |
US8131975B1 (en) | 2008-07-07 | 2012-03-06 | Ovics | Matrix processor initialization systems and methods |
US7870365B1 (en) | 2008-07-07 | 2011-01-11 | Ovics | Matrix of processors with data stream instruction execution pipeline coupled to data switch linking to neighbor units by non-contentious command channel / data channel |
CN101478785B (zh) * | 2009-01-21 | 2010-08-04 | 华为技术有限公司 | 资源池管理系统及信号处理方法 |
JP4539889B2 (ja) * | 2009-02-18 | 2010-09-08 | 日本電気株式会社 | プロセッサ及びデータ収集方法 |
KR101651871B1 (ko) * | 2009-12-28 | 2016-09-09 | 삼성전자주식회사 | 멀티코어 시스템 상에서 단위 작업을 할당하는 방법 및 그 장치 |
US8850262B2 (en) * | 2010-10-12 | 2014-09-30 | International Business Machines Corporation | Inter-processor failure detection and recovery |
CN102306371B (zh) * | 2011-07-14 | 2013-09-18 | 华中科技大学 | 一种分层并行的模块化序列图像实时处理装置 |
KR101863605B1 (ko) | 2011-09-19 | 2018-07-06 | 삼성전자주식회사 | 스트림 데이터를 고속으로 처리하는 프로세서 |
US20130081021A1 (en) * | 2011-09-23 | 2013-03-28 | Elwha LLC, a limited liability company of the State of Delaware | Acquiring and transmitting tasks and subtasks to interface devices, and obtaining results of executed subtasks |
US9710768B2 (en) | 2011-09-23 | 2017-07-18 | Elwha Llc | Acquiring and transmitting event related tasks and subtasks to interface devices |
CN106936994B (zh) | 2017-03-10 | 2019-10-01 | Oppo广东移动通信有限公司 | 一种广播接收者的控制方法、装置及移动终端 |
JP7038608B2 (ja) * | 2018-06-15 | 2022-03-18 | ルネサスエレクトロニクス株式会社 | 半導体装置 |
JP7004083B2 (ja) * | 2018-10-23 | 2022-01-21 | 富士通株式会社 | 演算処理装置及び演算処理装置の制御方法 |
CN111290697B (zh) * | 2018-12-07 | 2022-01-28 | 上海寒武纪信息科技有限公司 | 数据压缩方法、编码电路和运算装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61283976A (ja) | 1985-06-11 | 1986-12-13 | Sanyo Electric Co Ltd | パタ−ン認識装置 |
US4739476A (en) * | 1985-08-01 | 1988-04-19 | General Electric Company | Local interconnection scheme for parallel processing architectures |
JPH0247757A (ja) | 1988-08-09 | 1990-02-16 | Sanyo Electric Co Ltd | 情報処理装置 |
EP0360527B1 (en) | 1988-09-19 | 1995-01-04 | Fujitsu Limited | Parallel computer system using a SIMD method |
JPH0814816B2 (ja) | 1988-09-19 | 1996-02-14 | 富士通株式会社 | 並列計算機 |
DE69033434T2 (de) | 1989-07-31 | 2000-08-03 | Hitachi, Ltd. | Datenverarbeitungssystem und Datenübertragungs- und -verarbeitungsverfahren |
JP2850387B2 (ja) | 1989-07-31 | 1999-01-27 | 株式会社日立製作所 | データ伝送方式 |
JP2642039B2 (ja) * | 1992-05-22 | 1997-08-20 | インターナショナル・ビジネス・マシーンズ・コーポレイション | アレイ・プロセッサ |
US5511212A (en) * | 1993-06-10 | 1996-04-23 | Rockoff; Todd E. | Multi-clock SIMD computer and instruction-cache-enhancement thereof |
JPH0784966A (ja) | 1993-08-06 | 1995-03-31 | Toshiba Corp | データ処理装置 |
US6516403B1 (en) * | 1999-04-28 | 2003-02-04 | Nec Corporation | System for synchronizing use of critical sections by multiple processors using the corresponding flag bits in the communication registers and access control register |
-
2001
- 2001-09-21 JP JP2001289588A patent/JP3426223B2/ja not_active Expired - Fee Related
- 2001-09-26 US US09/964,247 patent/US7017158B2/en not_active Expired - Lifetime
- 2001-09-27 AT AT01972530T patent/ATE500556T1/de not_active IP Right Cessation
- 2001-09-27 CN CNB018029167A patent/CN1258154C/zh not_active Expired - Fee Related
- 2001-09-27 KR KR1020027006766A patent/KR100866730B1/ko active IP Right Grant
- 2001-09-27 AU AU2001292269A patent/AU2001292269A1/en not_active Abandoned
- 2001-09-27 TW TW090123900A patent/TWI229265B/zh not_active IP Right Cessation
- 2001-09-27 EP EP01972530A patent/EP1324209B1/en not_active Expired - Lifetime
- 2001-09-27 WO PCT/JP2001/008434 patent/WO2002027513A1/ja active Application Filing
- 2001-09-27 DE DE60144155T patent/DE60144155D1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
ATE500556T1 (de) | 2011-03-15 |
US7017158B2 (en) | 2006-03-21 |
KR20020059430A (ko) | 2002-07-12 |
WO2002027513A1 (fr) | 2002-04-04 |
AU2001292269A1 (en) | 2002-04-08 |
JP2002175288A (ja) | 2002-06-21 |
JP3426223B2 (ja) | 2003-07-14 |
DE60144155D1 (de) | 2011-04-14 |
US20020059509A1 (en) | 2002-05-16 |
EP1324209B1 (en) | 2011-03-02 |
CN1392985A (zh) | 2003-01-22 |
EP1324209A4 (en) | 2008-12-17 |
EP1324209A1 (en) | 2003-07-02 |
KR100866730B1 (ko) | 2008-11-03 |
CN1258154C (zh) | 2006-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI229265B (en) | Multi-processor system, data processing system, data processing method, and computer readable recording media | |
JP2019522850A (ja) | ディープニューラルネットワーク用のアクセラレータ | |
Leung et al. | Processor allocation on Cplant: achieving general processor locality using one-dimensional allocation strategies | |
CN110750351B (zh) | 多核任务调度器、多核任务调度方法、装置及相关产品 | |
US11651226B2 (en) | System having multiple processing unit sets for training neural networks | |
JPH02501599A (ja) | 多重プロセッサ・アレイにおける仮想処理手法および仮想プロセッサ | |
CN101639769A (zh) | 在多处理器系统上对数据集进行划分及排序的方法和装置 | |
US20190279038A1 (en) | Data flow graph node parallel update for machine learning | |
US20190057060A1 (en) | Reconfigurable fabric data routing | |
CN109361625A (zh) | 核查转发表项的方法、装置和控制器 | |
CN110968532A (zh) | 数据传输方法及相关产品 | |
JP2021108104A (ja) | 部分的読み取り/書き込みが可能な再構成可能なシストリックアレイのシステム及び方法 | |
CN111985631B (zh) | 信息处理设备、信息处理方法及计算机可读记录介质 | |
CN111026518B (zh) | 任务调度方法 | |
CN109978129B (zh) | 调度方法及相关装置 | |
CN103197917A (zh) | 计算线程阵列粒度执行抢占 | |
US12045182B1 (en) | Enhanced low-priority arbitration | |
CN105718990B (zh) | 细胞阵列计算系统以及其中细胞之间的通信方法 | |
CN111209230B (zh) | 数据处理装置、方法及相关产品 | |
JP3872034B2 (ja) | マルチプロセッサシステム、データ処理方法、データ処理システム、コンピュータプログラム、半導体デバイス | |
JPH06505588A (ja) | 並列ソフトウェア処理用ネットワーク構造 | |
Strandén et al. | Efficient single-step BLUP computations with MiX99 software | |
CN117290741B (zh) | 车辆聚类方法、装置、计算机设备和存储介质 | |
JP4562463B2 (ja) | 分散電磁界解析装置および分割電磁界解析方法 | |
CN111209245B (zh) | 数据处理装置、方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |