TWI229265B

TWI229265B - Multi-processor system, data processing system, data processing method, and computer readable recording media

Info

Publication number: TWI229265B
Application number: TW090123900A
Authority: TW
Inventors: Nobuo Sasaki
Original assignee: Sony Computer Entertainment Inc
Priority date: 2000-09-27
Filing date: 2001-09-27
Publication date: 2005-03-11
Also published as: ATE500556T1; US7017158B2; KR20020059430A; WO2002027513A1; AU2001292269A1; JP2002175288A; JP3426223B2; DE60144155D1; US20020059509A1; EP1324209B1; CN1392985A; EP1324209A4; EP1324209A1; KR100866730B1; CN1258154C

Description

1229265

AT B7 發明説明相關應用交互參考本專利申請根據並提出於2000年9月27日Φ社士" . T叫又可份曰本專利申請案號2000-29473 2及於2001年9月21日申^青之專利中請案號2001-289588的優點，這兩份專利申二二== 以提及方式整個併入本文中。 ' 發明背景發明領域本發明與一種藉由複數個資料處理裝置來執行資料處理的資料處理系統（例如，多處理器系統）及一種資料處理方相關技藝説明隨著高度發展的資訊導向社會的進步，資料處理量(例如，電腦等等資料處理纟置執行的資料處理）的成長有增加的趨勢。另夕卜，資料處理的内容已變得更複雜且高度^ 進。一傳統上，如CPU(Central Processing Unit;中央處理單謂等之類處理器的性能已高度增強，或是將複數個處理器轉換成多處理器，以便改良整個資料處能力。一疋^'年來，為要貪料處理能力増強的速度已到達超過高度改良處理器性能的速度。由於開發高性能處理器需要更多的時間’所以短時間内無法實現處理器高性能改良。另万面’例如’依據使用的處理器數量及處理方法，以決定多處理器的處理能力，並且對個別處理器的高性能 -4- 1229265 A7 B7 五、發明説明（2 ) 的依賴較低。基於此原因，這是改良資料處理裝置處理能力的其中一種有用的手段。當一個處理器執行資料處理時，如果依據資料需求範圍來分割’則使用多處理器之資料處理方法的解釋如下。 (1) 執行資料處理的處理器只使用鄰接之處理器處理的資料。此類的控制適用於單元自動裝置（cell autamat〇n)、影像滤波器、像運動一樣的cloth-wave計算、從彎曲表面的多邊形產生計算等等。 (2) 執行資料處理的處理器^用所有處理器處理的資料。 k ^ 此類的控制適用於聯合儲存裝置、四色問題的最佳化、旅行推銷員問題等等 '無線電（radi〇sity)、群集 (clustering)、多工連結模擬、敎學等等。 (3) 執行資料處理的處理器只使用複數個處理器之一部份處理器處理的資料。此類的控制適用於自行组合計算、依據使用視覺感官判斷的群組演算法、多對多碰撞決策、資料庫搜尋/產生/ 變形連續寶曲表面的計算、產生(b〇rn)動畫、&向運動學在前面案例（1)中，可利用傳統平行處理器高效率實施料處理。但是，在前面案例⑺和⑺中，整個系統的：速度受限於平行處理器之間的通信速度，以至每個處理的處理速度無法滿意地發揮。例如，會建立所有處理。。 -5- j紙張尺度適用中國國家標規格(21〇 X 297公[ 本發明的目的是提供各系統、一種資料處理方法置0 1229265 A7 ----— —____ B7 五、發明説明η~一- 間f又連接’以能夠執行案例⑺和（3)的高速資料處理。〜疋在此f “兄下’需要許多的硬體，並且實際上並不可發明概要種多處理器系統、一種資料處理、一種電腦程式及一種半導體裝爲了解決前面提及的問題，本發明提供如下文所述的各種多處理器系統、一種資料處理系統、一種資料處理方去、一種電腦程式及一種半導體裝置。弟"'多處理器系統，其包括複數個處理器，用以執行資料處理’-控制器’用以將包含在資料處理中使用之資料的廣播資料廣播至該等複數個處理器，其中該等複數個處理器的每個處理ϋ均從該控制器廣播的廣播資料中挑選母個處理器執行資料處理所需的資料，以執行資料處理。在此4夕處理《系統’由於該等複數個處理器的每個處理器均從該廣播資料中只挑選每個處理器所需的資料並且執行資料處理，所以可實施高速處理，而不會發生資料衝在每個處理器可使用或參考來自於其他處理器之處理果的情況下，該控制器從該等複數個處理器的每個處理獲取處理結果，並且將獲取的處理結果當作廣播資料廣至所有的處理器。 ρ亥寺複數個處理器的毐》個虛搜哭β 7母1U尾理态取好均已被指派識別

裝訂

V

1229265 A7 ____B7 説明 7 4 )----- 料，用以識別對應的處理器，該控制器產生廣播資料，其中會將當作結果獲取來源的處理器識別資料加入至處理結果中，並廣播該資料。因此，每個處理器均很容易挑選執行資料處理所需的處理結果，使每個處理器可在下一時序依據★玄識別貝料執行資料處理。另外，每個處理器均很容易識別已從哪一個處理器傳送該廣播的處理結果。當已完成資料處理的複數個處理器可能會發生衝突時，則提供的多處理器系統進一步包括一排序機件，用以從該等複數個處理器之中已完成資料處理的處理器獲取識別資料，以便以給定的序列將獲取的識別資料傳送至該控制器。然後，該控制器被建構，以依據自該排序機件接收的識別資料來獲得處理結果。在此情況下，進一步提供產生優先順序資料的裝置，以訂定該控制器所要執行的處理結果讀取序列。已完成資料處理的處理器被建構，以傳送該處理器的排序機件識別資料及關於處理的優先順序資料，該排序機件被建構，以依據該優先順序資料來決定傳送該識別資料的序列。例如，在以整體多處理器系統來決定處理序列的情況下，提供該排序機件可允許該控制器以必要的序列來獲取該處理結果，並且視爲整個系統以高效率地執行複雜的處理。該排序機件包括數量和處理器一樣的暫存器；記綠裝置，用以將該識別資料及從各自處理器傳送的識別資料記本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公董) 1229265

發明説明 =與對應處理器有關的暫存器中；—比較器，用以執行 1先順序資料之間的比較，以決定記錄在各自暫存器中資料的序列。該排序機件被建構，以依據該比較器 V决策結果來決定傳送該識別資料的序列。 =多處S器系統中的該控制器包括（例如）記憶體，用以储存資料；儲存控制裝置，用以從由自該排序機件接收到的孩識別資料指定的處理器獲取處理結果，以將獲取的結果儲存至該記憶體中；以及資料產生裝置，用以讀取儲存在忑迟u的處理結果’以產生包含該處理結果及該接收識別資料的廣播資料，以此方式允許實施多處理器系另外，該等複數個處理器的每個處理器更明確具有一資料處理機件，以決定是H將每個處㈣執行之資料處理所而的資料納入茲廣播資料，用以當所需資料被納入該廣播資料中時只挑選出該資料，並且執行資料處理；傳送裝置，用以依據該控制器的要求，將該資料處理機件執行的資料處理結果及每個處理器的識別傳送至該控制器；以及傳送裝置，用以當結束資料處理時，I包含每個處理器識別資料的處理程序結束通知資料傳送至該排序機件，以此方式允許實施多處理器系統第一多處理器系統，其包括複數個處理器，每個處理器均保存要與輸入資料比較的範本資料；一控制器，用以將該輸入資料廣播至該等複數個處理器；以及一比較機件，用以比較該等複數個處理器的各自輸出。該等複數個 -8 - 1229265

處理器保存的範本資料不同於其他處理器分別保存的範本資料。該等複數個處理器的每個處理器計算該控制器廣播之輸入資料的圖樣（feature)與每個處理器保存之範本資料的圖樣（feature)之間的差値，並且將包含計算而得之差值及識別每個處理器之識別資料的一對資料傳送至該比^ 件。孩比較機件依據從各自處理器接收到的差値來選取任差値，並將與所選差値配對的識別資料傳送至該控制器。該控制器依據從該比較機件接收的識別資料來從該等複數個處理器中指定一個處理器。如面建構的多處理器系統可高速執行資料相似判斷。一第二多處理器系統，其包括複數個處理器，用以執行資料處理；一控制器，用以將資料處理中使用的資料廣播至該等複數個處理器；以及一加總電路，用以計算該等複數個處理器執行之資料處理結果的總和。該等複數個處理器的每個處理器均從該控制器廣播的資料中只挑選處理所需的資料並且執行資料處理，並且將處理結果傳送至該加總電路。該加總電路計算從各自處理器傳送之處理結果的總和，並且將計算結果傳送至該控制器。該控制器將從該加總電路接收的處理結果之總和廣播至該等複數個處理器。 ’ 通常需要資料處理結果的總和，才能將與如神經系統電腦中使用之最佳化計算有關的計算標準化。可將計算而得的總和廣播至每個處理器。前面建構的多處理器系統可高速執行這些處理。 -9 - 本紙張尺度適用中國國家標準(CNS) Α4規格(210 χ 297公釐） 1229265 A7 -------一 -_5!__一五、發明説明（7 ) ~--- 另外，在前面多處理器系統的每種多處理器系統中，該等複數個處理器的至少部分處理器係經由通用記憶體以環狀形式相互連接，並且被建構，以經由該通用記憶體來執仃介於以環狀形式相互連接之處理器之間的資料傳輸/接收0 本發明提供的資料處理方法《一種利用設備或系統執行的方法，該設備或系統具有用來執行資料處理的複數個資料處理裝置，以及用來控制該等複數個資料處理裝置之每個資料處理裝置之作業的控制裝置，該方法包括下列步驟：以給足的順序來獲取資料處理結果，其中該資料處理是由複數個處理器的每個處理器執行，以產生廣播資料，該包含所獲取的處理結果以及用來識別當作處理結果獲取來源之資料處理裝置的識別資料，並且將該廣播資料廣播至該等複數個資料處理裝置，其中該步碟係由該控制裝置執行；以及依據該控制裝置所接收之該廣播資料中的識別資料，只選取某些指定的處理結果，以進行資料處理並且將該處理結果及指示每個資料處理裝置的識別資料傳送給該控制裝置，其中該步驟係由該等複數個資料處理裝置的至少一個資料處理裝置執行。本發明提供的第-資，料處理系、统包括：複數個資料處理裝置，用以執行資料處理；以及控制裝置，用以廣播廣播資料，該廣播資料包括從某些或所有該等複數個資料處理裝置接收的資料冑理結*，以及該等複數個資料處理裝置之至少一個資料處理裝置執行之資料處理中使用的資料， -10- 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐] ------ 1229265 五、發明説明（8 其中該等複數個資科處理裝控制裝置廣播的廣播資'^固資枓處理裝置均從該資料處理所需的資料===每個資料處理裝置執行送至該控制裝置。 w枓處理’並且將處理結果傳第：：料處理系統是一種在處理裝置之間執行誓南捅片、* 心復数彳U亦村 ^ ^ ^ ^ ^ 5々資料處理系統，該資料處理 +惠嫵资拉今良扎疋土少一資料處理裝置以產 ϋ π棱，* ¥、、a 竹匕栝扣疋足資料處理裝置的識別 ^ ❹料處理裝^資料處理資料，·獲取裝置，用以從某些或所有該等複數個資料處理裝置獲取對；之資料處理裝置執行的資料處理結果；以及收納裝置，二 :將接收的處理結果納入至該廣播資料，以將該廣播資料廣播至該等複數個資料處理裝置的每個資料處理裝置。本發明提供的電腦程式是用來使-設備構成下列功能⑴ ㈣備具有—用以執行介於執行資料處理之複數個資料處理裝置間雙向通信的電腦；並且本發明提供的 +導體裝置是-種併入一設備中的半導體裝置，其中該設備具有一用以執行介於執行資料處理之複數個資料處理裝置間雙向通信的電腦，冑此使該電腦構成下列功能⑴至 (3) 〇即，有下列的功能： (1)指定至少一資料處理裝置以產生廣播資料，該廣播資料包括指定之資料處理裝置的識別資訊及傳送至該資料處理裝置的資料處理資料； -11 -本紙ft尺度適用中a S家料(CNS) A4規格(21GX 297公~. 1229265 A7 B7 五、發明説明（9 (2) 從某些或所有該等複數個資料處理裝置獲取對應之貝料處理裝置執行的資料處理結果；以及 (3) 將接收的處理結果納入至該廣播資料，以將該廣播貝料廣播至該等複數個資料處理裝置的每個資料處理裝置° 圖式簡單説明一要詳頃下文中詳細說明並參考隨附的圖式，將可明白本發明的這些目的和其他目的，以及本發明的優點，其中：圖1顯不應用本發明之多處理器系統組態實例的圖式；圖2顯示根據本發明之BCMC組態實例的圖式；圖3顯:根據本發明之單元處理器組態實例的圖式；圖4顯tf根據本發明之WTA/加總電路組態實例的圖式；、、云圖。顯丁根據本發明《多處理器系統執行之處理流程的程圖； ^ 6八顯：使用根據本發明之鄰接處理器之資料處理結果的概念圖；圖7顯示使用根據本發明之某些處理的概念圖；貝打她垤…禾圖8顯示根據本發明群組格點資料之案例的圖式· 圖 ^員雜示根據本發明將物件分割成群集之案例的圖式；及，’…據本發明之碰撞決策演算法處理流程的流程較佳具體實施例詳細說明 1229265 A7 B7 五、發明説明（10 ) 現在將參考附圖來詳細説明本發明的具體實施例。下文中將解説將本發明應用在多處理器系統當作資料處理系統實例的具體實施例。 <整個組態> 圖1顯示多處理器系統組態實例的圖式。多處理器系統1 包括廣播記憶體控制器10(下文中稱之爲BCMC)，這個用來控制資料處理及資料記錄和讀取的控制裝置·，複數個單元處理器2 0，用以當作卞個資料處理裝置的實例；複數個 WTA(Winner Take All)/加總電路30，用以構成資料處理所需的各種功能。 BCMC及所有的處理器20均是經由廣播通道（可將資訊同時敷播給數位收件人的通信通道）連接。多處理器系統1使用BCMC 10來管理狀態變數値（這個狀態變數値是每個單元處理器20獲取的資料處理結果），並且透過廣播從BCMC 10傳送所有單元處理器20的狀態變數値，當作參考數値的一個實例。以此方式使每個單元處理器20能夠參考其他單元處理器20高速產生的狀態變數値。廣播通道是介於BCMC 10與複數個單元處理器20之間的傳輪路徑，並且包括用來傳送位址的位址匯流排及用來傳送如狀態變數値之類資料的資料匯流排。位址包括用來指定每個單元處理器20的單元位址，及所有單元處理器20的廣播位址。單元位址對應於記憶體上的位址（實體位址或邏輯位址），並且從單元處理器.20傳送的狀態變數値被設計放置 -13- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐） 1229265 A 7 B7 五、發明説明（11 ) 在記憶體中對應於每個單元處理器20之單元位址指示的位址。每個單元處理器20均配備I D (識別），用以當作識別每個單元處理器的識別資訊。單元位址也對應於I D。使用單元位址使得能夠指定要從哪一個單元處理器20輸出狀態變數値。圖1中顯示連接WTA/加總電路30的方式。即，WTA/加總電路30係以金字塔形狀連接，其中單元處理器20端係設定爲第一階。兩個單元處理器20係連接至第一階之各自 WTA/加總t路30的輸入端子，並且其輸出端子係連接至第二階WTA/加總電路30的輸入端子。在第二階及更低階中，較低階之WTA/加總電路30的輸入端子係連接至各自的輸入端子，並且較高階之WTA/加總電路30的輸入端子係連接至較低階的輸出端子。較低階之 WTA/加總電路30的輸出端子係連接至最高階之WTA/加總電路30的輸入端子，並且最高階之WTA/加總電路30妁輸出端子係難接至BCMC 10。除了前面説明的連接形式之外，本發明還可以串聯WTA/ 加總電路30 ό々方式實施。在此情況下，兩個單元處理器20 係連接至第一階之WTA/加總電路30的輸入端子，並且其輸出端子係連接至較高階的輸入端子。較低階之WTA/加總電路30的輸出端子及單元處理器係連接至第二階及更低階之WTA/加7總電路30的輸入端子。第二階及更低階之 WTA/加總電路3 0的輸出端子係連接至較高階的輸入端子。最高階之WTA/加總電路30的輸入端子係連接至較低 -14- 本紙張尺度適用中國國家標準(CNS) Α4規格（210 X 297公釐） 1229265 A7 B7 五、發明説明（12 ) 階之WTA/加總電路30的輸出端子及單元處理器20，並且最高階之WTA/加總電路30的輸出端子係連接至BCMC 10 ° 下文中將更詳細解説BCMC 10、單元處理器20及WTA/加總電路3 0。 <BCMC> BCMC 10透過廣播通道將資料廣播至所有的單元處理器 20，以及從各自單元處理器20擷取狀態變數値並且保存狀態變數値。圖2顯示BCMC 10的組態實例。 BCMC 10包括CPU核心101，用以控制多處理器系統1的整個作業；主記憶體102，這是可重寫的SRAM(靜態隨機存取記憶體）；以及 DMAC(Direct Memory Access Controller ;直接記憶體存取控制器）103，這些裝置均是經由匯流排B 1互相連接。CPU核心101是一種包含電腦的半導體裝置，該電腦具有執行本發明特有資料處理的功能，其方式是配合主記憶體102來讀取給定電腦程式以執行程式。主記憶體102係當作整個系統共用的記憶體。最高障之WTA/加總電路30的輸出端子及外部記憶體（如硬碟機、可傳輸媒體等等）均是連接至匯流排B 1。在起始時間，CPU核心10 1從外部記憶體讀取啓動程式，並且執行啓動程式以運作作業系統。它也從外部記憶體讀取資料處理所需的各種資料，並且展開至主記憶體102。如每個單元處理器20狀態變數値之類的資料被設計儲存至主記憶體102中。狀態變數値被放置在對應於已計算對應 -15- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明（13 ) 狀態變數値之單元處理器20之單元位址的主記憶體位址中0 CPU核心101依據從主記憶體102讀取的資料，以產生要廣播至每個單元處理器20的廣播資料。廣播資料是一對資料，其具有狀態變數値，以及用來指示已計算對應狀態變數値之單元處理器20的單元位址。在此情況下，會產生一對或複數對資料。 DMAC 103是一種在主記憶體102與每個單元處理器20之間執行直接記憶體存取傳送控制的半導體裝置。例如， DMAC 103經由廣播通道將廣播資料廣播至每個單元處理器20。它也分別獲取各自單元處理器20的資料處理結果，並將資料處理結果寫入至主記憶體102。 <單元處理器> 每個單元處理器20從廣播資料挑選所所需的資料並且執行資料處理，並且在資料處理結束時將結果傳送至WTA/ 加總電路30。每個單元處理器20依據來自於BCMC 10的指令，將狀態變數値（這是資料處理結果）傳送至BCMC 10。各自單元處理器20係經由通用的記憶體（圖中未顯示）以環狀形式互相連接。每個單元處理器20可在同步時脈期間執行資料處理。再者，每個單元處理器20可在不同時脈期間執行資料處理。圖3顯示單元處理器20的組態實例。單元處理器20係由單元CPU 201、輸入緩衝器202、輸出緩衝器203、WTA緩衝器204、程式控制器205、指令記憶體206及資料記憶體207所組成。 -16- 本紙張尺度適用中國國家標準(CNS) A4規格（210 X 297公釐） 1229265 A7 B7 五、發明説明（14 ) 單元CPU 20 1是具有可程式規劃浮點計算機的處理器，並且控制每個單元處理器20的運作以執行資料處理。單元 CPU 201經由輸入緩銜器202獲得須從BCMC 10廣播的廣播資料。然後，單元CPU 201使用單元位址資料對來決定所獲取的廣播資料是否是單元CPU 201應執行處理所需的資料。如果必要的話，單元CPU 20 1將狀態變數値寫入至資料記憶體207中對應的位址。另外，單元CPU 20 1從資料記憶體207讀取狀態變數値，並且執行資料處理。然後，單元CPU 201將資料處理結果寫入至輸出緩衝器203，並且將指示資料處理結束的資料傳送至WTA/加總電路30。輸入緩衝器202是用來保存須從BCMC 10廣播的廣播資料。被保存的廣播資料被傳送至單元CPU 201，以響應來自於單元CPU 201的請求。輸出緩衝器203是用來保存單元CPU 201的狀態變數値。被保存的狀態變數値被傳送至單元BCMC 10，以響應來自於BCMC 10的請求。除了前面所述以外，輸入緩衝器202 及輸出緩衝器203還可執行傳輸及接收控制資料。在單元CPU 20 1執行的資料處理結束時，W T A緩衝器 204接收來自於單元CPU 201的資料，這個資料指示資料處理結束。然後，WTA緩衝器204將接收到的資料傳輸至 WTA/加總電路30，以向其報告資料處理結束。指示資料處理結束的資料包括（例如）單元處理器20的ID及決定優先順序的優先順序資料，當要將輸出緩衝器203中儲存的狀態變數値讀入至BCMC 10時需要這個優先順序資料。 -17- 本紙張尺度適用中國國家標準(CNS) A4規格（210 X 297公釐） 1229265 A7 B7 五、發明説明（15 ) 程式控制器205從BCMC 10擷取用來定義單元處理器20作業的程式。定義單元處理器20作業的程式包括供單元處理器20執行資料處理使用的程式，以及用來決定每個單元處理器20執行處理所需之資料的資料選擇程式。程式還包括用來決定優先順序的優先順序決定程式，這是當將處理結果讀入至BCMC 10所需的程式。指令記憶體206儲存程式控制器205擷取的程式。依需求，將儲存的程式讀入至單元CPU 201。資料記憶體207係用來儲存單元處理器20處理的資料。按照單元CPU 201需求所決定廣播資料被寫入至單元CPU 201中。廣播資料係儲存在資料記憶體207中對應於單元位址的位址。另外，根據本具體實施例，資料記憶體207的一部份係經由通用記憶體連接至互相鄰接的單元處理器20，促使能夠在每個循環期間，在鄰接的單元處理器之間傳輸/接收資料。 < WTA/加總電路〉複數個WTA/加總電路30依據每個單元處理器20傳送之用來指示資料處理結束的資料，以決定BCMC 10從單元處理器20擷取狀態變數値的順序，並向BCMC 10報告。圖4顯示WTA/加總電路30的組態實例。每個WTA/加總電路30均是由兩個輸入暫存器A和B (下文中稱之爲第一輸入暫存器301和第二輸入暫存器3 02)、選擇器開關303、比較器304、加法器305及輸出暫存器306所 -18- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐） 1229265 A7 B7 發明説明（16 組成。第一輸入暫存器301和第二輸入暫存器3〇2均具有一個整數暫存器及-個浮點暫存器。例如，在每個單元處理器傳送之用來指示資料處理結束的資料之中，會將ID資料寫入至整數暫存器，以及將優先順序資料寫人至浮點暫存器。選擇器開關303將能量供，给比較器3〇4或加妹器3〇5。且體=言’選擇器開關3G3促使能夠根據作業模式來使用比較器或加法器的其中-個。作業模式係由來自於BCMC 1〇的指令所決定。下文中將會説明作業模式。比較器304執行浮點値的比較，這是第一輸入暫存器3〇1 和口第二輸入暫存器302的浮點暫存器所保存的浮點健。比較器304將較大（或較小）値及其隨附的整數寫入器 306。加法器305计算〉手點値（這是第一輸入暫存器和第二輸入暫存咨302的；于點暫存器所保存的浮點値）的總和，並將計算結果寫入至輸出暫存器3〇6。。輸出暫存器306的建構方式實質上相同於第—輸入暫存器301和第二輸入暫存器3〇2。即，輸出暫存器3〇6包括整數暫存②及4點暫存器。ID資料被窝人至整數暫存器，而優先順序資料被寫入至浮點暫存器。，加總電路30具有下文中提出的三種作業模式。最大値（WT A )模式：比較器304係由選擇器開關3〇3供給能量。比較器州執 -19 -

1229265 A7 ----------B7 五、發明説明（17 ) ---- 行浮點値A與B (這是裳 ^ λ ^ -a- ” 疋弟輸入暫存器301和第二輸入暫存的㈣暫存器所料的浮點幻的比較。比較哭304 2大(或較小)値及其隨附的整數寫入至輸出暫存器306。二窝？輸出暫存器3〇6結束時’會清除第一輸入暫存器和丄弟二輸入暫存器302。輸出暫存器306的内容被寫入 :較尚階之WTA/加總電路3〇的輸入暫存器。此時，如果當作寫入目的地的輸入暫存器未被清除，則會停止寫入，並且在這個循環期間不執行寫入。基於此原因，輸出器3〇6的内容被設計在下一循環期間寫入。加法模式：一加法器305係由選擇器開關3〇3供給能量。加法器3〇5計异洋點値(這是第一輸入暫存器3〇1和第二輸入暫存 = 302的浮點暫存器所保存的浮點値）的總和1後，加法 = 305—將計算結果寫入至輸出暫存輸出暫存器遍二内谷被窝入至較高階之WTA/加總電路3。的輸入暫存近似排序模式： ,比較器304係由選擇器開關3〇3供給能量。比較器则執订洋點値八與8(這是第一輸入暫存器3〇1和第二輸入器302的浮點暫存器所保存的浮點値）的比較。比較器⑽ 將較大（或較小）値及其隨附的整數寫入至輸出暫存哭Μ 6。之後，只會清轉人暫存器，其料“至輸 3〇6的値。輸出暫存器的内容被寫入至較高階之π: 加總電路30的輸入暫存器。如果當作寫入目的地的輸入暫 -20-

1229265 A7 B7 五、發明説明（18 ) 存器未被清除，則會停止寫入，並且在這個循環期間不執行寫入。在加法運算中，會執行較低階之WTA/加總電路 30之輸出暫存器306的寫入作業。藉由近似排序模式，BCMC 10從最高階之WTA/加總電路 3 0接收到的資料被儲存，以適當地遞增或遞減浮點値。另外，會進入每種模式之前，均會先清除所有WTA/加總電路30的第一輸入暫存器301、第二輸入暫存器302及輸出暫存器306。每種模式的變更實施當作排序機件的功能（排序機件）及/ 或與整個複數個WTA/加總電路有關的加總電路。換言之，近似排序模式中的作業實現排序機件，以及加法模式中的作業實現加總電路。以最大値模式及近似排序模式運作的WTA/加總電路30可以下列方式實現：即，WTA/加總電路30係由與單元處理器20數量相同的輸入暫存器、選擇器開關、比較器304、加法器305及輸出暫存器所組成。準備的輸入暫存器數量與單元處理器20的數量相同，並且每個輸入暫存器均包括一個整數暫存器及一個浮點暫存器，類似於第一輸入暫存器301和第二輸、入暫存器302。比較器執行浮點値的比較，這是所有輸入暫存器的浮點暫存器所保存的浮點値。加法器計算浮點値的總和，這是所有浮點暫存器所保存的浮點値。輸出暫存器與圖4所示之WTA/加總電路30的輸出暫存器 -21 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明（19 ) 相同。比較器比較各自輸入暫存器之浮點暫存器所保存的優先順序資料，並且以遞減的優先順序將隨附的I D連續寫入至輸出暫存器。以此方式促使能夠以遞減的優先順序將 ID傳送至BCMC 10。加法器將浮點暫存器所保存的資料相加，以獲得總和。此類的WTA/加總電路係當作本發明的排序機件及加總電路，而不是採用如圖1所示的連接。 <資料處理方法〉本具體實施例的多處理器系統1執行'下列的作業，以執行必要的資料處理。圖5顯示多處理器系統1執行之處理流程的流程圖。在BCMC 10的主記憶體102中，預先儲存所有單元處理器20之狀態變數値的起始値。 BCMC 10產生廣播資料，這是包括每個單元處理器20之狀態變數値及每個單元處理器20之單元位址的一對資料 (步驟S101)。然後，BCMC 10將產生的廣播資料廣播至所有的單元處理器20(步驟S102)。每個單元處理器20將廣播資料擷取至輸入緩衝器202。單元處理器20依據指令記憶體206中儲存的資料選擇程式，以檢查單元CPU 201輸入緩衝器202保存之廣播資料的單元位址，並且確認是否有每個單元處理器20執行資料處理所需的狀態變數値（步驟S 103)。在沒有每個單元處理器 20執行資料處理所需之狀態變數値的情況下，單元處理器 -22- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐） 1229265 A7 B7 五、發明説明（2〇 ) 20結束處理作業（步驟S 103 :否）。在有每個單元處理器20 執行資料處理所需之狀態變數値的情況下（步驟S 103 : 是），單元處理器20執行將對應的狀態變數値覆寫至資料記憶體207上對應於與這個狀態變數値配對之單元位址的位址上（步驟S104)。在此方式中，結束將資料從BCMC 10廣播至每個單元處理器20。當廣播結束時，每個單元處理器20將資料處理提供給資料記憶體207上記錄的狀態變數値，以依據指令記憶體206 中儲存的資料處理程式來產生新的狀態變數値。新的狀態變數値被寫入至資料記憶體207，並且也會被寫入至輸出緩衝器203(步驟S105)。然後，每個單元處理器20將新的狀態變數値覆寫至資料記憶體207上對應於其單元位址的位址上。當資料處理結束時，單元CPU 201經由WTA緩衝器204 將結束資料（包含I D及優先順序資料）傳輸至第一階之 WTA/加總電路30的輸入暫存器，並且報告資料處理結束 (步驟S 106)。資料處理前後，會依據給定的優先順序決定程式來產生優先順序資料。關於每個單元處理器20傳送的結束資料，WTA/加總電路 30分別使用輸入暫存器的整數暫存器來保存I D，以及使用浮點暫存器來保存優先順序資料。此處，WTA/加總電路 30係以近似排序模式運作。基於此原因，選擇器開關303 供給能量給比較器304。 -23- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明（21 ) WTA/加總電路30之第一輸入暫存器301和第二輸入暫存器3 02的整數暫存器保存從不同處理器傳送的I D。每個浮點暫存器保存的I D隨附的優先順序資料。比較器304從第一輸入暫存器301和第二輸入暫存器3 02的浮點暫存器讀取優先順序資料，並且比較優先順序資料。由於比較結果，比較器304將較高優先順序資料及隨附的I D寫入至輸出暫存器306的浮點暫存器及整數暫存器。關於寫入至輸出暫存器306之輸入暫存器的内容，會將這内容清除。關於寫入至輸出暫存器306之I D及優先順序資料，則是被寫入至較高階之WTA/加總電路30的輸入暫存器。前面提及的處理係在各階的WTA/加總電路上執行。最高階之WTA/加總電路30將寫入至輸出暫存器3 06之整數暫存器的ID傳送至BCMC 10。整個WTA/加總電路30利用前面提供的處理，以遞減的優先順序將ID傳送至BCMC 10(步驟S107)。 BCMC 10從對應於WTA/加總電路30傳送之ID之單元處理器20的輸出緩衝器203獲取須經資料處理的狀態變數値。執行將所獲取的狀態變數値覆寫至對應於指示已執行處理之單元處理器20之單元位址的位址中（步驟S 108)。以此方式，結束處理狀態變數値的一個循環作業。 BCMC 10從每個單元處理器20獲取資料處理結果，以此方式產生廣播資料。每個單元處理器20從廣播資料中只挑選每個單元處理器 20所需的資料，以執行資料處理。使用此類廣播資料的資 -24- 本紙張尺度適用中國國家標準(CNS) A4規格（210 X 297公釐） 1229265 A7 ------— —_B7 五、發明説明一~) " T處理促使能夠使用所有其他單元處理器2()處理過的資料二執行處理。另外’ BCMC 1()使用—對資料（其具有每個 ^處理器2G傳送之資料處理結果及用來指示已產生資料處理結果之單元處理器2〇的單元位址）來產生廣播資料。 k促使能夠只使用特定單元處理器2〇傳送的資料處理結果 :執I處里另外，由於鄰接的單元處理器20係經由通用記憶體互相連接，所以能夠在鄰接的單元處理器20之間執行處理’類似於先前技藝。每個單元處理器20從廣播資料挑選所需的資料，而不需要將每個單元處理幾20所需的資料直接擷取至主記憶= 102,並且處理其中保存的資料，允許高速處理，而不= 發生資料衝突。 3 [第一項具體實施例] 下文中將具體解説前面解説之多處理器系統丨的第一具體實施例。這個具體實施例參考圖6來解説只使用特定單元處理器 20及其鄰接之其他單元處理器2〇處理過之資料的實例。在圖6中，‘‘ Ο ’’標示單元處理器，而較暗的‘‘ 〇，，標示執行資料處理的單元處理器，而“ φ，，標示保存必要資料的單元處理器。假設下列的過遽計算係相對於關於η X η點陣0是-气_ 以上的自然數）之每個點陣點之資料（點陣點資料）連續執行。

Xi，j =(Xi-l，j + Xi十 l，j + Xi，j-Xi，j + l)/4 -25- 本紙張尺度適用中國國家標準(CNS) A4規格(210 x 297公釐) 1229265

其中1 -點陣點的列數，j '點陣點的行數。次BCMC 1()將點陣點資料（當作廣播資料之以列資料）廣播至n單元處理器2〇。一 ''' 圖8群組之點陣資料的圖式。料得伽一，，， _ τ以〇榛不的點陣點資一考、、且群組。一個群組中的點陣點資料係由一個單疋處理器20處理。早單:處理器20將來自於廣播資料之群組的必要點陣點資 =存至資料記憶體2G7中。’然後，它從資料記憶體207連續項取點陣點資料，並且執行資料處理。經由通用記憶體連接〈單元處理器20間的資料傳送係使用通用記憶體執 :。如果將資料寫入至通用記憶體的寫入作業是一個循環’則在單元處理器则的傳送群組資料可能以2n循環執行0 各自單元處理器20係同步運作以執行寫入至通用記憶體，並且當作在官線處理中同時計時，促使能夠在單元處理器之間同時執行通信及計算。每當群組點陣資料之資料處理結束時，BCMC 1〇廣播下一個廣播資料。單元處理器2〇依據廣播的資料丨和』來判斷是否應執行資料處理。廣播資料被群組，以便能夠以列方向或行方向來處理資料，並且經由通用資料來執行資料傳送，允許以列方向或行方向來處理資料。 [第二項具體實施例] 這個具體實施例；^考圖7來解説只使用某些或所有單元 -26- 本紙張尺度適用中國國家標準(CNS) A4规格(210 X 297公釐） 1229265 A7 B7 五、發明説明（24 ) 處理器20處理過之資料的實例。在圖7中，“ 0 ”標示單元處理器，而較暗的“ Ο ”標示執行資料處理的單元處理器，而“· ”標示保存必要資料的單元處理器。此類多處理器系統可用來實現跳躍欄位組合儲存（hop field associative storage) 〇假設每個單元處理器20均保存一個狀態變數値（這個資料處理結果），以及權値因數（用以指示狀態變數値的重要性）。另外，會將號碼加入至每個單元處理器20，並且 BCMC 10以號碼順序從所有的單元處理器20擷取狀態變數値。 BCMC 10廣播從每個單元處理器20擷取的狀態變數値，當作廣播資料。每個單元處理器20從廣播資料中只選取所需的狀態變數値，並且執行關於權値因數的乘積加總作業，並且更新狀態變數値。在所需的狀態變數値指示所有的狀態變數値均包含於廣播資料中的情況下，這相當於是使用所有處理器處理過的資料進行處理。 [第三項具體實施例] 下文中將解説圖樣比對計算處理的實例。此處，執行用來指示保存資料之單元處理器20的處理，其類似於輸入資料功能。這個處理執行方式如下：每個單元處理器20均事先保存要比較的範本資料。 BCMC 10將輸入資料廣播至所有的單元處理器20。每個單元處理器20計算每個處理器保存之範本資料的圖樣 (feature)與輸入資料的圖樣（feature)之間的差値。差値會與 -27- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐） 1229265 A7 ____B7 五、發明説明（25 ) I D —起傳送至WTA/加總電路3〇。 WTA/加總電路30係以最大値模式運作。輸入暫存器的整數暫存器保存id，而浮點暫存器則保存差値。比較器3〇4 比較各自單元處理器2〇計算的差値，並且將較小差値及其隨附的I D傳送至輸出暫存器3 〇6。彡個處理係透過加總電路30執行，以獲取最小差値及其隨附的⑺。獲取的 ID及差値一起被傳送至BCMC 10。 BCMC 10依據ID來指定單元處理器2〇。這促使能夠偵測最類似於輸入資料之圖樣（feature)的範本資料，並且偵測範本資料與輸入資料的差値。 [第四項具體實施例] 下文中將解説影像處理中使用之運動中物件碰撞決策演算法處理的實例。「碰撞決策演算法」決定存在於特定空間中的η個物件是否有發生碰撞，以及當發生碰撞時產生的強度。 η個物件的空間分佈有些變化，並且物件被分成m個群集。例如，此處假設決定是否有一個物件與任何其他物件發生碰撞最強烈。圖9顯示此類空間中的物件，並且使用矩形來隔離以“〇,，標示的物件，以形成一個群集。在圖9中，物件被分成五個群集。物件的資料指示係從BCMC 1〇廣播，並且以群集爲基礎被擷取至單元處理器20。單元處理器2〇執行盥包本於-個群集中之料物件有關之空間位置與移動的相㈣ •28- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7

在圖5的貫例中之物件的處理。單元處理器…執行被分成五個群集下文中將參考圖10來說明程0 有關碰撞決策演算法的處理流料=1 產：廣播資料(其包括具有物件位置和速度之資、牛貝科，以及指示對應物件所屬之群集的群集資料），並且將廣播資料廣播至所有的單元處理器20(步驟 S2(H)。母個單元處理器聰據群集資料從廣播資料挑出物件資料，並擷取之。已擷取物#資料的單元處玉里器20從物件的現行位址資料及速度資料來計算時間單元後的新位址資料。單元處理器 20從新位址資料獲取新邊框的値（步驟S2〇2)。邊框表示圍住物件的矩形，例如，如圖9所示。邊框値是邊框頂點的座標。 BCMC 10從每個單元處理器2〇擷取新的物件位置資料，並且更新位置資料（步驟S2〇3)。接著’ BCMC 10將包含獲取之新位置資料的物件資料逐一廣播至所有的單元處理器2〇(步驟S204)。即，BCMC 10 將位置資料（其指示一個物件的位置，當作須經碰撞決策的目標’下文中稱之爲「決定物件」）傳送所有的單元處理器20。每個單元處理器20先使用於步驟S202計算的邊框來決定是否會發生決定物件碰撞（步驟S205)。具體而言，單元處理备2 0決定該決定物件的位置是否是位於邊框上。 -29- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 1229265 A7 B7 五、發明説明（27 ) 在可能會發生決定物件碰撞的情況下，即，決定物件位於邊框上（步驟S205 :是），單元處理器20連續計算位於邊框上要處理之各自物件間的距離（步驟S206)以決定是否發' 生碰撞（步骤S 2 0 7)。在決定物件與位於邊框上之任一物件碰撞的情沉下（步驟S207 :是），單元處理器20產生包括碰撞強度資料的碰撞資料，其以數量方式來指示碰撞所造成的影響強度，並且產生碰撞對決定物件造成的影響的資料 (步驟S208)。另外，單元處理器20將產生之碰撞資料中的碰撞強度資料與其ID —起傳送至WTA/加總電路30(步驟 S209) 〇如果決定物件出現在邊框範圍外（步驟S205 :否），或決定物件由於計算距離的結果而未與任一物件碰撞（步驟 S207 :否），則每個單元處理器20將（例如）「-1，0」當作碰撞強度資料傳送至WTA/加總電路30(步驟S210)。 WTA/加總電路30係以最大値模式運作。WTA/加總電路 30執行從單元處理器20傳送之碰撞強度資料間的比較，並且偵測碰撞強度資料（其指示碰撞所造成的最大影響）（步驟 S211)。然後，WTA/加總電路30指定已產生所偵測之碰撞強度資料的單元處理器20。之後，WTA/加總電路30將 ID(用以指示指定的單元處理器20)傳送至BCMC 10。 BCMC 10從單元處理器20(從最高階之WTA/加總電路30 所指出的單元處理器之ID)獲得碰撞資料（步驟S2 12)。於步驟204之後，藉由處理所有物件，執行空間中所有物件之間的碰撞決策。 -30- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐） 1229265 A7 B7 五、發明説明（28 ) [第五項具體實施例] 下文中將解説使用WTA/加總電路30之加法器305的實例0 每個單元處理器20將資料處理結果輸入至WTA/加總電路 30。在WTA/加總電路30中，加法器305將資料處理結果相加，結果獲取與所有單元處理器20有關之資料處理結果的總和。在此方式中，WTA/加總電路30能夠高速獲取資料處理結果的總和。資料處理結果的總和被傳送至BCMC 10，接著將總和高速傳輸至所有的單元處理器20。資料處理結果的總和係用來與如神經系統電腦中使用之最佳化計算有關的計算標準化。在前面的解説明，雖然BCMC 10及WTA/加總電路30係以互相獨立的方式構成，但是可將WTA/加總電路30併入 BCMC 10中，以當作一個組塊來建構控制器。另外，前文中已解説資料處理裝置是單元處理器20及控制裝置是控制器（BCMC 10)的實例。但是，本發明的組態組件不限定於前面的實例。例如，可能提供如下的組態。即，兩個或兩個以上資料處理終端機係經由廣域網路以雙向通信的形式連接。在這些資料處理終端機之中，一個或複數個資料處理終端機被當作控制裝置，而其他的資料處理終端機係當作資料處理裝置。控制裝置具備廣播廣播資料的功能，該廣播資料包括從某些或所有複數個資料處 -31 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐） 1229265 Γ~-—--~_ Β7 五、發明説明（29 ) ------ 接收到的資料處理結果及至少一資料處理裝置執行理使用的資料_。複數個資料處理裝置的每，置均具備從控制裝置廣播之廣播資料只挑選每個資料處理裝置執行資料處理所需的資料，以執行資料處理，並且處理結果傳輸至控制裝置。另外’還可能提供如下的組態。、即，複數個-般用途的資料處理終端機（其能夠指定預先決定的識別資訊，例如，前文提及的識別資料）係當作複數個資料處理裝置使用。然後，可只用一個伺服器(並能與執行與這些一般用途資料處理終端機之間的雙向通信）來建構資料處理系統，或是使用配備包含cpu及記憶體之半導體裝置的設備來建構資料處理系統。〜且關於此類的伺服器及設備，其内建的cpu讀取並執行給定的電腦程式。以此方式爲词服器主體或設備提供下列的功能。即，指定至少一資料處理終端機當作資料處理裝置的功能，以產生廣播資料，該廣播資料包括指定之資料處理終端機的識別資訊及傳送至該資料處理終端機的資料處理資料。另一項功能是從某些或所有該等複數個資料處理終端機獲取對應之資料處理終端機執行的資料處理結果。還有一項功能是將接收的處理結果納入至該廣播資料，以將該對應的廣播資料廣播至該等複數個資料處理終端機的每個資料處理終端機。 ' 前文提及的本發明能夠在使用複數個資料處理裝置的情況下，在資料處理裝置之間高效率執行資料處理。用 32- 1229265 A7 B7 五、發明説明（3〇 ) 各種具體實施例及變更均可實施，而不會脱離本發明廣大的精神及範疇。前面説明的具體實施例係用來解説本發明，而不是限制本發明的範疇。本發明的範疇係由隨附的申請專利範圍指出，而不是由具體實施例指出。在本發明申請專利範圍同等意義範圍内及申請專利範圍内的各種修改均視爲屬於本發明的範疇。 -33- 本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公釐）

Claims

122^^給239〇0號專利申請案中文申請專利範圍替換本(92年10月）六、申請專利ϋ 1 · 一種多處理器系統，包括：複數個處理器，用以執行資料處理；以及 -控制器，用以將包含在資料處理中使用之資播資料廣播至該等複數個處理器，其中該等複數個處二器的每個處ί里器均從該控制器廣#的廣播資料中個處理器執行資料處理所需的資料，以執行資料處理。 2·如申請專利範圍第丨項之多處理器系統，其中該控制器從已執行資料處理之每個處理器獲取處理結果，並且將獲取的處理結果當作該廣播資料廣播至所有的處理器。’ 3·如申請專利範圍第1項之多處理器系統，其中該等複數個處理器的每個處理器已被指派識別資料，用以識別每個處理器，該控制器產生廣播資料，其中會將當作結果獲取來源的處理器識別資料加入至該處理結果中並廣播該資料，並且該等複數個處理器挑選執行資料處理所需的該處理結果，使每個處理器可在下一時序依據該包含於該接收之廣播資料識別資料執行資料處理。 4·如申請專利範圍第3項之多處理器系統，該多處理器系統進一步包括一排序機件，用以從該等複數個處理器之中已完成資料處理的處理器獲取識別資料，以便以給定的序列將獲取的識別資料傳送至該控制器，其中該控制器被建構，以依據自該排序機件接收的識別資料來獲得該處理結果。 5.如申請專利範圍第4項之多處理器系統，該多處理器系統進一步包括產生優先順序資料的裝置，以訂定該控制本紙張尺度適用中國國家標準(CNS) Α4規格(210X297公董) A8 B8 C8 D8 122參替換1| 六、申請專利範園器所要執行的該處理結果讀取序列，其中已完成資料處理的處理器被建構，以傳送該處理器的排序機件識別資料及關於處理的該優先順序資料，該排序機件被建構，以依據該優先順序資料來決定傳送該識別資料的序列。 6.如申請專利範圍第5項之多處理器系統，其中該排序機件包括數量和該等處理器一樣的暫存器；記錄裝置，用以將該識別資料及從各自處理器傳送的識別資料記錄至與對應處理器有關的該暫存器中；一比較器，用以執行該優先順序資料之間的比較，以決定記錄在各自暫存器中之識別資料的序列，並且該排序機件依據該比較器的決策結果來決定傳送該識別資料的序列。 7·如申請專利範圍第4項之多處理器系統，其中該控制器包括：記憶體，用以儲存資料；儲存控制裝置，用以從由自該排序機件接收到的該識別資料指定的處理器獲取孩處理結果，以將獲取的結果儲存至該記憶體中；以及資料產生裝置，用以讀取儲存在該記憶體中的該處理处果：以產生包含該處理結果及該接收識別資料的該廣： 8·如申請專利範圍第4項之多處理器系統，其中該等複數個處理器的每個處理器均包括：一資料處理機件定是否要將每個處理器執行之資料處理所需的資料納k 孩廣播資料’用以當所需資料被納人該廣播資料中時只挑選出該資料，並且執行資料處理；傳送裝據該控制器的要求，將該資料處理機件執行的資= -2 -

=果及每:處理器的識別傳送至該控制器， ·以及傳送裝料的虛理葙&社太 ?知包3母個處理器識別資 Q科：，序結束通知資料傳送至該排序機件。 9· 一種多處理器系統，包括·· 複數個處理器，每個處的範本資料；。“保存要與輸入資料比較器’用以將該輸人資料廣播至該等複數個處理為，以及出比車乂機件’用以比較該等複數個處理器的各自輸其/該等複數個處理器保存的範本資料不同於其他處里器刀別保存的範本資料；該等複數個處理器的每個處理器計算該控制器廣播之輸人資料的圖樣加㈣與每個處理器保存之範本資料的圖樣（⑽㈣）之間的差值，並且將包含該計算而得之差值及識別每個處理器之識別資料的一對資料傳送至該比較機件；該比較機件依據從各自處理器接收到的差值來選取任一差值，並將與所選差值配對的識別資料傳送至該控制器；該控制器依據從汶比軚機件接收的識別資料來從該等複數個處理器中指定一個處理器。 10· 一種多處理器系統，包括：複數個處理器，用以執行資料處理；担制器，用以將資料處理中使用的資料廣播至該等複數個處理器；以及 1229_豕: Q ^ 申請專利範圍口總私路’用以計算該等複數個處理器執處理結果的總和， < 貝科其中財複數個處理器的每個處理器均從該控制哭 :的資料中只挑選處理所需的資料並且執行資料處= :二將處理結果傳送至該加總電路；並且該加總异從各自處理器傳送之處理結果的總和，並且將杜 ::达至該控制器；並且該控制器將從該加總電路：‘ 的處理結果之總和廣播至該等複數個處理器。 11.，申請專利範圍^項之多處理器系統，其中該個處理器的至少部分處理器係經由通用記憶體以環狀： :相互連接，並且被建構，以經由該通用記憶體來執‘ a於以每狀形式相互連接之處理器之間的資料傳輸/接收0 泛如申請專利範圍第9項之多處理器系統，其中該等複數個處理器的至少部分處理器係經由通用記憶體以環狀形式相互連接’並且被建構，以經由該通用記憶體來執^ 介於以環狀形式相互連接之處理器之間的資料傳輸/ 收。 13.如申請專利範圍第1〇項之多處理器系統，其中該等複數個處理器的至少部分處理器係經由通用記憶體：環狀形式相互連接’並且被建構’以經由該通用記憶體來執行介於以環狀形式相互連接之處理器之間的資料傳輸/接收。 Η. -種資料處理方法，該方法執行於一設備或系統，其具 -4-

1229265 吣、0 Λ.

有用來執行資料處理的複數個資料處理裝置，以及用來控制該等複數個資料處理裝置之每個資料處理裝置之作業的控制裝置，該方法包括下列步驟：以給定的順序來獲取資料處理結果，其中該資料處理是由複數個處理器的每個處理器執行，以產生廣播資料為包3所獲取的處理結果以及用來識別當作處理杜果獲取來源之資料處理裝置的識別資料，並且將該廣播資料廣播至該等複數個資料處理裝置，其中該步驟係由該控制裝置執行；以及依據該控制裝置所接收之該廣播資料中的識別資料，只選取某些指定的處理結果，以執行資料處理，並且將該處理結果及指示每個資料處理裝置的識別資料傳送給該控制裝置，其中該步騾係由該等複數個資料處理裝置的至少一個資料處理裝置執行。 15· —種資料處理系統，包括：複數個資料處理裝置，用以執行資料處理；以及控制裝置，用以廣播廣播資料，該廣播資料包括從某些或所有該等複數個資料處理裝置接收的資料處理結果’以及該資料處理裝置之至少一個資料處理裝置執行資料處理中使用的資料，其中該等複數個資料處理裝置的每個資料處理裝置均從該控制裝置廣播的廣播資料中只挑選每個資料處理裝置執行資料處理所需的資料以執行資料處理，並且將處理結果傳送至該控制裝置。 -5- 本紙張尺度適用中國國家標準(CNS) Α4規格(210X297公釐)

裝訂

鲁 I福9涵換頁

(1)指定至少一該資料處理裝置以產生廣播資料之裝置二該廣播資料包括減之資料處理裝置的識別資訊及傳送至该貝料處理裝置的資料處理資料；、（2)從某些或所有該等複數個資料處理裳置獲取對應之資料處理裝置執行的資料處理結果之裝置；以及 (3)將接收的處理結果納入至該廣播資料，以 ==至該等複數個資料處理裝置的每個資料；: 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐)