TWI266204B

TWI266204B - Apparatus and method for performing data processing operation in response to data processing instruction

Info

Publication number: TWI266204B
Application number: TW093102966A
Authority: TW
Inventors: Daniel Kershaw
Original assignee: Advanced Risc Mach Ltd
Priority date: 2003-06-16
Filing date: 2004-02-09
Publication date: 2006-11-11
Also published as: JP4402654B2; US7668897B2; EP1634163B1; JP2006527868A; CN1791857A; KR20060040597A; IL169374A0; MY135903A; IL169374A; TW200500879A; US20040255100A1; EP1634163A1; CN100378651C; WO2004114127A1; KR101042647B1; AU2003290285A1; RU2005139390A

Description

1266204 九、發明說明：【發明所屬之技術領域】本發明與資料處理系統之領域有關。尤其是，本發明與在單一指令多重資料（SIMD)資料處理系統内含有多重結果資料值之結果分割有關。【先前技術】

為資訊處理系統提供SIMD能力係眾所周知者。在此類系統中，一暫存器通常含有可操縱的多重獨立資料值。舉一示例，一個3 2位元的暫存器可以含有二個獨立的1 6 位元資料值，其欲以例如與兩個在另一個3 2位元的暫存器之内存儲的其他 1 6位元資料值之多重或其他結合分別增加。此類SIMD操作常見於數位信號處理的領域，以及具有包括增加處理速度和減少代碼密度的優點。

已知SIMD技術之一示例是由英特爾公司產生的英特爾處理器MMX指令。在MMX指令包括了使兩個每一含有四個1 6位元資料值之暫存器相乘的指令。當用另一 1 6位元的資料值與一 1 6位元的資料值相乘時，則結果是一個 32位元的資料值。因此，當使在MMXSIMD指令中指明的四對1 6位元的資料值相乘時，結果是四個3 2位元的結果資料值。在許多情況中當執行此類操作時，其希望保持 SIMD格式和資料大小。為了此一目地，MMX指令包括一種指令型態，其中在上述情況裡產生的結果係以四個 16 位元的結果資料值型式存在，其係各自3 2位元結果的1 6 5 1266204 個最重要位元，且此1 6位元值係被結合在一單一 6 4位元暫存器中，即，產生一 SIMD類型的結果。另一種選擇是，亦可使用能產生相乘結果之四個最不重要的16位元的各別指令，作為其輸出可並結合在一 64位元暫存器上。【發明内容】本發明之一態樣所提供之設備，用以執行一資料處理操作以回應一資料處理指令，該設備包含：

處理邏輯，用以回應該資料處理指令，自儲存在一或多數輸入儲存中之多數獨立資料值，產生各自的多數結果資料值；及一結果分割器，用以回應該資料處理指令，以在一高次結果儲存中，儲存每一結果資料值之一高次位元部分，及在一低次結果儲存中，儲存每一結果資料值之一低次位元部分。

本發明體認到在許多情況下可能會希望獲得SIMD類型結果，但在許多情況中更重要的是維持結果的完全精準，以避免因諸如不精確的捨入錯誤等等而產生的不利後果。因此，本發明技術提供一系統，其係可回應一單一資訊處理指令，據以獲得一高程式碼密度，當多重獨立資料值及多重結果資料值儲存在一 SIMD型式時，以高次部分儲存在一儲存而低次部分儲存在另一儲存，執行一 SIMD 類型操作。因此，如果需要可立即獲得該SIMD類型的結果，而無需進一步處理，並可保持完全的精確度且可繼續 6 1266204 運作’因為藉度，並且可自人們將了重獨立輸入資同型式。進入容，其具有儲據一些計算技等。然而，在分別取得的對之第一獨立資由兩個儲存的其中進行調控解，藉由處理料值產生結果處理邏輯的輸存於其中之獨術，對一特定結合而保持了所有結果的精確邏輯執資料值入亦有立資料精確度本發明的較佳實施例一起相乘，其中一對料值，及一對獨立資料值。如果要保持完全精確度 SIMD類型操作是普通的，結果的資料寬度。本發明技術特別適用的作’因為藉由本發明之技術避免可能在累加類型操作中響。亦應了解高次位元部分關係’當它們是所涉及結果較有效且係較佳的選擇。 k Λ處理指令能夠設定如整數乘法或者正負分數值之情況是，所設定的乘法是係取自且直接且增加狀況是所保持發生的和低次資料值許多不乘法。正負分行資訊處理操的操作類型可可能是一單一值之平方的結之該些值的平中，可操作處係取自一第一一弟二輸入儲產生SIMD類需要利用本發 ’與相乘關聯之額外精確度多重捨入錯誤位元部分能有之非重疊相連同類型的乘法然而，本發明數值乘法，以作以自多有多種不儲存的内果，或依方根，等理邏輯將輸入儲存存之第二型，此類明技術之之累加操，有助於之累加影許多不同部分時，操作，例特別適用及可操作 7 1266204 其中處理邏輯使每一結果資料值加倍，以將存在於每一輪入資料值之一正負位元考慮在内。只需很少的額外費用即可將該加倍操作有效地包含在其他操作中。獨立SIMD資料值的資料寬度能夠變化，並且在較佳實施例中該資訊處理指令可指明涉及的資料寬度。

乘法器能夠依據需要的特定情況採取幾種類梨，但疋’一特別的較佳類型是整數乘法器，因為它相對地簡單和快速’並且能以適當架構產生各種不同類型操作。一不例類型的處理操作可以由資訊處理指令指明，該處理是選擇性的，例如執行飽和計算。結果分割器用於在不同儲存中分割結果資料值，並且 ^較佳實施例中用複數個多工轉換器來進行。能夠把本發月之技術應用於許多不同類型之資訊處理系統，例如 s P S，但特別適用於一種處理器核心。例中是記憶體合的情體或緩供欲褲們將了解，和系統之内一暫存庫暫先出緩衝器的一部分之況，其中不衝器而非暫縱的一系列相容的专加所計算結方法，較佳該些輸的儲存存器、、或一一或多同的儲存器作資料值果範圍實施例入儲存，高次結果儲存，低次結能有各種不同類型，但較佳實施一專屬暫存器、一緩衝記憶體、 (例如，快取、主要，大量等等）種。該些不同類型儲存可用於混存具有不同的型式。在使用記憶為儲存的情況下，可以方便地提的串流。的方式之-係使用肖I發明技術亦產生一或多種高次保護位元，

8 1266204 例如可用於飽和計算的情況條件。這些保護位元可與其自身的儲存一起被提供，使結果分割將這些保護位元儲存於該些保護位元的自身儲存中。本發明之另一態樣所提供之方法，用以執行一資料處理操作以回應一資料處理指令，該方法包含下列步驟·· 回應該資料處理指令，自儲存在一或多數輸入儲存中之多數獨立資料值，產生各自的多數結果資料值；及

回應該資料處理指令，藉由在一高次結果儲存中，儲存每一結果資料值之一高次位元部分，及在一低次結果儲存中，儲存每一結果資料值之一低次位元部分，分割該結果資料值。上述内容及本發明的其它項目、特徵和優點可自下文中以附圖詳述之實施例了解。【實施方式】

第1圖說明處理器核心2，例如英國劍橋之ARM有限公司所製造者。處理器核心2包括構成資料處理資料路徑之部分的一暫存庫4、一乘法器6、一轉換器8、和一加法器1 0。從解譯資料處理指令之指令解譯器1 4接收它們，進入一指令管道12，以產生在處理器2内控制其他迴路元件之操作的控制信號。人們將了解，處理器2通常包括許多進一步的迴路元件，但未求精簡本文而未介紹。在第1 圖的示例中，在暫存庫4之内的暫存器讀取輸入資料值，及獲得寫回暫存庫 4的暫存器之資料值。在其它實施例 9 1266204 中，輸入值和結果值可以讀取自及寫入不同中，例如專屬暫存器、緩衝記憶體、先入先出般目的之記憶體。該些裝置是選擇性的，且可合的結合。該些不同的選擇性裝置未圖示於第第2圖說明各種不同的SIMD資料格式。明的資料路徑之資料寬度也許是修改以支援此的 ARM處理器版本之 64位元。該資料路徑 SIMD的模式中操縱一完全長度之64位元文字中，不同的SIMD模式控制二個34位元資料1 位元資料值或八個8位元資料值之一者。在該中，資料值彼此互相獨立，並且在第1圖中處資料路徑之架構，係依據分別處理處理該些資資料值的大小，例如，在適當的點透過斷裂承用以執行SIMD類型操作之資料路徑的選用本不在這裡進一步描述。第3圖圖示依據本發明之技術，說明在不料寬度模式中，輸入資料值和結果資料值之間示例（i)中，輸入資料值包括二個 3 2位元輸入儲存在一第一 64位元暫存器，以及二個 32 Β Ο、B 1儲存在一第二暫存器^在該示例中，指明的資料處理操作是SIMD相乘，及因此用 BO與32位元值AO相乘，以及用32位元值元值A1相乘。上述相乘兩者都產生64位元結 AO BO及A1 B1。上述兩結果的最重要的32 類型之儲存緩衝器和一使用各種混 1圖中。在第1圖說類資料寬度可以在一非 1 6。在該例皇、四個 16 SIMD模式理器2中的料之 SIMD 載鏈等等。身已知，將同SIMD資的關係。在值 AO、A1 位元輸入值由處理指令 3 2位元值 B1與32位果，分別是位元寫入一 10 1266204 高次結果暫存器17。上述兩結果最不重要的32位一低次結果暫存器18。寫入不同暫存器17、18之是非重疊且相連的。示例（II)及（III)是類似的且分別關聯於16位元及8位元輸入值，屬於一 SIMD乘法指令之乘法，同的暫存器中分別產生結果資料值，在全部結果的或全部結果的低次半。如果希望繼續進一步的處理，把由相乘產生的於相同的資料寬度的進一步的SIMD類型操作，則果暫存器 17可以直接讀取及用作此類進一步操入。不需要轉換或或重新安排，就能改善程式碼密度、能量消耗等等。一特別的較佳環境是高次結果 1 7及低次結果暫存器1 8係用作一累加操作之終點使連續的相乘可以被累加至該些暫存器，以及保留結果暫存器1 8之低次結果值可以結續地更新，以產確的結果及避免捨入錯誤。因此，本發明之技術允一單一指令，直接存取正確資料，及因為保留結果資料寬度而保持了精確度。第 4圖以較詳細之方式圖示第1圖的一部份徑。將取自暫存庫4之各別暫存器之二個64位元輸供給一 SIMD整數乘法器20。該些輸入值可以表示 64位元乘以64位元的非SIMD操作，或先前討論 SIMD類型之一種。SIMD乘法器20包含適當切斷等等，以適當分割獨立輸入值及結果輸出值。來自

元寫入兩部分輸入值及在不兩次半結果用高次結作之輸度、速暫存器，據以在低次生較精許使用的完整資料路入值提一單一之三種承載鏈 SIMD 11 1266204

乘法器20的輸出係一承載存檔格式。當系統在一正負分數模式中操作時，向多工轉換器22、24提供一分數模式指示信號，用以轉換承載存槽輸出之一位元位置，其相等於在最重要的位置，以補償額外的正負位元的方式所加倍之值。一加法器26用於以來自儲存及承載暫存器28、30之循環部分累加值，或以多工轉換器3 2、3 4所選擇之來自暫存庫4之暫存器D、C之128位元值，自SIMD乘法器20 增加承載存檔輸出。多工轉換器3 2、3 4係由一累加控制信號所控制，其圖示於第4圖底部。能夠安排該系統從一來源暫存器樓案累加，無需累加之相乘，或先前部分計算結果之累加，例如在一向量類型操作期間，當來源為累加值時，繞過暫存庫。

當對於一給定的處理操作之乘法及加法操作完成時，則來自暫存器2 8、3 0之最後的1 2 8位元存檔及承載值被傳送至一加法器3 6，其中將它們加在一起，以形成一傳統1 2 8 位元結果表示。乘法和加法也許是管道的操作。人們將了解，相較於來自暫存器 A、B之64位元輸入值，加法器 3 6之輸出已使位元寬度加倍。因此，該S IMD結果值具有兩倍寬度之獨立SIMD輸入值。提供加法器36之輸出給一結果分割器，如第5圖所示，其在例示性實施例中具有各種多工轉換器之類型。

在第5圖，高次結果暫存器3 8接收每一結果值之選擇性部分，其為其中之高次部分。低次結果暫存器4 0接收結果值的相應低次部分。控制信號 B、Η、W及L表示SIMD 12 1266204 資料寬度（位元組、半文字、文字或長文字）在使用中。依據給定之鄰接每一多工轉換器之邏輯表示，該些寬度設定信號控制第5圖所示之多工轉換器，以在涉及的多工轉換器之各種輸入間進行選擇。由它們的控制信號所控制之第 5圖之多工轉換器的全部行動，用以自加法器3 6所輸出的 1 2 8位元中選擇/分割，以形成高次結果暫存器3 8和低次結果暫存器4 0的内容，如第3圖之不同示例所示。向第1圖之解譯器14提供程式指令，以一種方法其所具有之語法包含指明使用之資料寬度的參數，是否其為一非SIMD的完全資料寬度或各種SIMD資料寬度之一，控制第4圖及第5圖之迴路。程式指令也指明是否執行一累加，以及是否其係使用外部暫存器值或「内部」部分結果來完成。除了第5圖之兩個結果暫存器38、40之外，亦可以提供一保護暫存器。從累加的結果之延伸版本計算的保護位元被提供至保護裡暫存器。舉一示例，如果1 6位元的S IMD 資料值用於一相乘累加操作，依據是否提供二或四個保護位元，該些累加器可能大於3 2位元，例如，3 4或3 6位元，以使來自累加值之溢位能累加於保護位元之中。在此類實施例中，該些保護位元可能被分割至一各別的保護位元暫存器，並且以該種型式，能夠把保護位元暫存器視為在結果之最重要結束提供保護位元，以低次結果暫存器在結果值的較低結束提供保護位元，及高次結果暫存器提供SIMD 寬度通常需要的保存資料值。 13 1266204 第6圖圖示具有多重資料格式之一多重累加操作，給定一堆疊的暫存器結果。暫存器A及B是64位元SIMD暫存器，在這種情況下，4個16位元的量（A0-A3及B0-B3)。將該些暫存器相乘在一起的結果是 4個結果的向量，其每一可能達到3 2 位元寬。

亦可能將4個3 2位元乘法結果累加在另兩個暫存器（C 及D)保存之四個32位元值，該些暫存器之每一保存2個 3 2位元量。則能以堆疊的格式在暫存器 RL及RH中儲存增加的結果。雖然已在本文中參照附圖詳述本發明之實施例，應了解本發明並不侷限於該些實施例，而亦可能由熟知本項技藝者以不背離在下文中之申請專利範圍所定義之本發明之精神及範圍，進行各種修改及變化。

【圖式簡單說明】第1圖圖示一處理器核心，其具有可實施本發明技術之類型；第2圖圖示不同的SIMD資料格式；第3圖圖示依據本發明之各種資料寬度，輸入資料值及輸出資料值間的關係；第4圖圖示在第1圖之處理器核心中之部分資料處理路徑； 14 1266204 第5圖圖示一多工轉換器，用以依據本發明之技術分割結果資料值；及第6圖圖示依據本發明之技術之另一種型式之乘法累加操作。【元件代表符號簡單說明】 2 處理器核心 4 暫存庫 6 乘法器 8 轉換器 10 加法器 12 指令管道 14 指令解譯器 16 64 位 .元 >文字 17 高次結果暫存器 18 低次結果暫存器 20 整數乘法器 22 多工轉換器 24 多工轉換器 26 加法器 28 承載暫存器 30 承載暫存器 32 多工轉換器 34 多工轉換器 36 加法器 38 高次結果暫存器 40 低次結果暫存器

15 1266204 D 暫存器 C 暫存器

16

Claims

1266204 十、申請專利範圍： 1. 一種用以執行一資料處理操作以回應一資料處理指令之設備，該設備包含：一處理邏輯，用以回應該資料處理指令，以自儲存在一或多數輸入儲存中之多數獨立資料值，產生各自的多數結果資料值；及

一結果分割器，用以回應該資料處理指令，以在一高次結果儲存中，儲存每一結果資料值之一高次位元部分，及在一低次結果儲存中，儲存每一結果資料值之一低次位元部分。 2. 如申請專利範圍第1項所返之設備，其中該處理邏輯可操作以使各別對之獨立資料值相乘，一對係取自一第一輸入儲存之一第一獨立資料值，及一對係取自一第二輸入儲存之一第二獨立資料值。

3. 如申請專利範圍第2項所述之設備，其中處理邏輯可操作以累加已儲存在該高次結果儲存及該低次結果儲存内之值，以從該各別對獨立貧料值產生之值中產生該多數結果資料值。 4. 如申請專利範圍第1項所述之設備，其中每一結果資料值之該高次位元部分及該低次位元部分係該結果資 17 1266204 料值之非重豐相連部分。 5. 如申請專利範圍第2項所述之設備，其中當該資料處理指令指示該獨立資料值係正負分數值時，該處理邏輯可操作以加倍每一藉由令一第一獨立資料值與一第二獨立資料值相乘所獲得之值。

6. 如申請專利範圍第1項所述之設備，其中每一輸入儲存可儲存Μ個獨立N位元資料值。 7. 如申請專利範圍第6項所述之設備，其中該資料處理指令可指明該獨立資料值的一資料寬度。

8. 如申請專利範圍第2項所述之設備，其中該處理邏輯包括一整數乘法器，其係可操作以使該各別對獨立資料值相乘。 9. 如申請專利範圍第1項所述之設備，其中該處理邏輯係可操作以對該獨立資料值執行飽和資料處理操作。 10.如申請專利範圍第1項所述之設備，其中該結果分割器包括依據該資料處理指令控制之複數多工轉換器。 18 1266204 11.如申請專利範圍第1項所述之設備，其中該設備是一處理器核心。 12.如申請專利範圍第1項所述之設備，其中該一或多種輸入儲存係下列之一或多種：一暫存庫暫存器；一專屬暫存器；

一緩衝記憶體；一先進先出緩衝器；及一記憶體。 13 .如申請專利範圍第1項所述之設備，其中該高次結果儲存是下列之一種：一暫存庫暫存器；一專屬暫存器；

一緩衝記憶體；一先進先出緩衝器；及一記憶體。 14.如申請專利範圍第1項所述之設備，其中該低次結果儲存是下列之一種：一暫存庫暫存器；一專屬暫存器； 19 1266204 一緩衝記憶體；一先進先出緩衝器；及一記憶體。

1 5.如申請專利範圍第1項所述之設備，其中該處理邏輯可操作以對每一結果資料值產生一或多種高次保護位元，以及該結果分割器可操作以在一保護位元儲存内儲存該保護位元。 1 6 .如申請專利範圍第1 5項所述之設備，其中該保護位元儲存是下列之一種：一暫存庫暫存器；一專屬暫存器；一緩衝記憶體；

一先進先出緩衝器；及一記億體。 1 7. —種用以執行一資料處理操作以回應一資料處理指令之方法，該方法包含下列步驟：自儲存在一或多數輸入儲存中之多數獨立資料值，產生各自的多數結果資料值，以回應該資料處理指令；及藉由在一高次結果儲存中，儲存每一結果資料值 20 1266204 之一高次位元部分，及在一低次結果儲存中，儲存每一結果資料值之一低次位元部分，分割該結果資料值，以回應該資料處理指令。 1 8 .如申請專利範圍第1 7項所述之方法，其中使各別對之獨立資料值相乘的步驟中，一對係取自一第一輸入儲存之一第一獨立資料值，及一對係取自一第二輸入儲存之一第二獨立實料值。 1 9.如申請專利範圍第1 8項所述之方法，其中累加已儲存在該高次結果儲存及該低次結果儲存内之值的步驟，係使用從該各別對獨立資料值產生之值，以產生該複數結果資料值。 2 0.如申請專利範圍第1 7項所述之方法，其中每一結果資料值之該高次位元部分及該低次位元部分係該結果資料值之非重疊相連部分。 2 1 .如申請專利範圍第1 8項所述之方法，其中當該資料處理指令指明該獨立資料值係正負分數值時，每一藉由令一第一獨立資料值與一第二獨立資料值相乘所獲得之值係被加倍。 21 1266204 22. 如申請專利範圍第17項所述之方法，其中每一輸入儲存可儲存Μ個獨立N位元資料值。 23 . 如申請專利範圍第22項所述之方法，其中該資料處理指令指明該獨立資料值的一資料寬度。 24. 如申請專利範圍第18項所述之方法，其中一整數乘法器可操作以使該各別對獨立資料值相乘。

25. 如申請專利範圍第1 7項所述之方法，其中對該獨立資料值執行飽和資料處理操作。 26. 如申請專利範圍第1 7項所述之方法，其中至少一部分的分割步驟係藉由依據該資料處理指令控制之複數多工轉換器來執行。

27. 如申請專利範圍第1 7項所述之方法，其中該方法在一處理器核心中執行。如申請專利範圍第1 7項所述之方法，其中該一或多種輸入儲存係下列之一或多種：一暫存庫暫存器；一專屬暫存器； 22 28. 1266204 一緩衝記憶體；一先進先出緩衝器；及一記憶體。 29.如申請專利範圍第1 7項所述之方法，其中該高次結果儲存是下列之一種：一暫存庫暫存器；

一專屬暫存器；一緩衝記憶體；一先進先出緩衝器；及一記憶體。 3 0.如申請專利範圍第1 7項所述之方法，其中該低次結果儲存是下列之一種：一暫存庫暫存器；

一專屬暫存器；一緩衝記憶體；一先進先出緩衝器；及一記憶體。 3 1 .如申請專利範圍第1 7項所述之方法，其中上述產生步驟對每一結果資料值產生一或多種高次保護位元，以及上述分割步驟在一保護位元儲存内儲存該保護位 23 1266204 元0 3 2.如申請專利範圍第3 1項所述之方法，其中該保護位元儲存是下列之一種：一暫存庫暫存器；一專屬暫存器；一緩衝記憶體；

一先進先出緩衝器；及一記憶體。

24 1266204 七、指定代表圖·· (一）、本案指定代表圖為：第3圖。 (二）、本代表圖之元件代表符號簡單說明： 1 7 高次結果暫存器 1 8 低次結果暫存器八、本案若有化學式時，請揭示最能顯示發明特徵的化學式：無