TW571202B

TW571202B - Parallel arithmetic apparatus, entertainment apparatus, processing method, computer-readable recording medium and semiconductor device

Info

Publication number: TW571202B
Application number: TW090127301A
Authority: TW
Inventors: Hidetaka Magoshi
Original assignee: Sony Computer Entertainment Inc
Priority date: 2000-11-02
Filing date: 2001-11-02
Publication date: 2004-01-11
Also published as: KR100882113B1; KR20020069217A; CN1394314A; US20020143838A1; EP1335299A4; WO2002037317A1; CN1320479C; AU2002212702A1; JP3338043B2; JP2002202964A; EP1335299A1

Description

571202 五、發明説明（1 ) 本應用依據與主張 No.2000-335787 申請發 Ν〇·2000-318590 申請發 2000 年 u η , m 2日提出之日t 明’以及年10月16曰提出：明等所有合併參考之效益。^ 發明背景 =明為有關使用許多平行算術單元而用以平之技術，例如用以執行例如高速電腦繪圖之幾何處理、异行算術處理技術。成彳了處理< 由同標主題之一為顯示三度空間電腦繪圖，這些電 -連串的基本繪圖(多邊形)而模型化。多邊形之頂等之四度空間座標（x、y、z、w)所表示，根據所視座標點多邊形尤頂點座標變成座標轉換，而根據距離，多邊形頂點座標變成透明度轉換。也就是說，多邊形之頂點座

以較遠物ft顯示較小之方式轉換。這一連串的處理稱: 「幾何處理」。 A 幾何處理有許多種類。例如使用4x4轉換矩陣之矩陣運算等是在多邊形旋轉、擴張、收縮、透明度投射上執行與轉換，或是執行内部乘運算以決定光亮接收度之表面上2 明亮度等等。矩陣運算與内部乘運算需要重複乘數運算。在三度芝間電腦繪圖中，傳統上用於高階系統而使用浮點之處理方法目前也使用於娛樂裝置範疇中，以產生例如視訊遊戲影像之娛樂用影像，以及使用於有嚴格成本限制 -4 - 571202 A7 _B7___ 五、發明説明（2 ) 之範疇中，例如可攜式資訊終端機。這是因為使用浮點之處理方法擴大資料動態範圍與促進程式化，並因此使其得以適合複雜的處理。為了在使用於浮點處理之浮點數上執行矩陣運算，合併許多浮點乘數運算器（FMAC:浮點多工累加器）以及有效率地執行矩陣運算之平行算術裝置是有效的。使用許多 FMAC平行地執行運算之平行算術裝置之能力增加處理速度。有許多執行三度空間影像處理之裝置，例如娛樂裝置與個人電腦，經由使用這種平行算術裝置而執行上述幾何處理可在高速下獲得細微與真實的三度空間影像。假如平行算術裝置具有四個平行的FMAC，平行算術裝置可輕易地使用4x4轉換矩陣執行矩陣運算，如數學運算式1所示。然而，在向量A(Ax、Ay、Az、Aw)與向量B(Bx、 By、Bz、Bw)間執行内部乘運算是困難的，如數學運算式 2所示。這是由於處理用之座標X、Y、Z與W獨立地在符合四個FMAC之一對一關係中運作。這將會再特別地解釋一番。在數學運算式1中當矩陣運算執行時，符合轉換矩陣中之一列之元素值以及即將轉換之座標值將饋送至每個 FMAC之中。轉換矩陣之元素值與進入之座標值屬於將執行矩陣運算之乘數運算，例如轉換矩陣第一列上之元素值 (Mil、M12、M13、M14)以及座標值（Vx、Vy、Vz、Vw)屬 -5 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 571202 A7 _B7^__ 五、發明説明（3 ) 於將計算「Mll.Vx+M12.Vy+M13.Vz+M14.Vw」之乘數運算。由於每個FMAC執行相似的乘數運算，矩陣運算有效率地完成。在此式中，「·」表示一乘法符號。當數學運算式2中之内部乘運算執行時，每個FMAC都帶有元素值X、Y、Z、W。因此，Αχ與Bx、Ay與By、Az 與Bz以及Aw與Bw分別輸入至每個FMAC之中，計算 Αχ·Βχ、Ay.By、Αζ·Βζ以及Aw.Bw以分另U當作他們之輸出。如此一來，數學運算式2需要一加法器以便將四個FMAC 輸出加起來以分別提供，而這將增加電路大小。因此，傳統平行算術裝置可有效地進行矩陣運算，但是單獨平行提供的FMAC無法執行向量内部乘運算，且在此方式下傳統平行算術裝置可能需要額外的加法器。 (數學運算式1)

Mil Ml2 M13 Ml4 Vx M11 e V*+Ml2 · Vy + Ml3 · Vk+Mi4 · Vw Mti Ms2 Mea Vy Mtl · Vx+M22 Vy + M23 V*+M24 * Vw M31 Maa Ma4 M31 · Vx+M32 * Vy + M33 * V*+M34 * Vw M41 M42 M43 M44 Vw M41 · Vx+M42 · \/y + M43 · V* 十 M44 · Vw (數學運算式2) (Ax, Ay，Az，Aw)· (Bx，By，Bz，Bw) =Ax#Bx+AyBy+Az*Bz+AwBw 發明摘要本發明之主題為當如同傳統平行算術裝置有效地執行矩陣運算時，提供可輕易地執行向量内部乘運算之平行算術裝置。 -6 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 571202

多dti:題，根據本發明之平行算術裝置包括許據記錄：將運算之算術元素之記錄裝置，以及根算裝f :己錄裝置中之算術元素，用以執行乘數運算之運記錄在所t中選擇出該記錄裝置成對中之一個，而用以將、求名·戶斤選擇的記錄算裝置之㈣世輸入至成對之運算裝蓄、、擇乃是插入於記錄裝置與任何成對之運异装置足間。、、擇裝置選擇成對的記錄裝置時，#中選#裝置它自 —插=·本發明之平行算術裝置使用在每成對中之互相獨二：二：：執行運算。也就是說，有可能執行與傳統技云相似的矩陣運算。另万面’當在來自另—個記錄裝置之後選擇裝置以循衣I選擇出一記錄裝置時’使用記錄在每對記錄裝置中 (异命疋素以執行運算是可能的。也就是說，本發明之平 3術裝置可輕易地執行内部乘運算，而無須使用像加法為般的其他電路。平行算術裝置也能插人暫時記錄裝置，以便暫時記錄已讀在成對記錄裝置巾之算術元素，其巾選擇裝置並未插入於記錄裝置與成對運算裝置之間。在此例中，當選擇出成對之記錄裝置時，其中選擇裝置未插人，選擇裝置以這種將記錄於暫時記錄裝置中之算術元素輸人至運算裝置的方式建構起來。當算術元素從記錄裝置取出時，插人暫時記錄裝置排除佔用1己錄裝置輸出埠之需求。這將允許記錄裝置以及暫時本紙張又歧+ S國家標準(CNS) A4規格(21GX29_7公釐) 571202 A7

記3置士經插入之成對運算裝置執行其他處理。 ’’仃讀裝置之中，在矩陣運算期間 =記錄第-算術元素使其屬於矩陣運算，=錄二運算:期間’第二算術元素屬於向量内部乘運算】= 以^種將來自於自有成對之記錄裝置之第術輸入至自有成對之運算裝置的方式建構起來。在㈣= 异期間，以循環方法一個接一個地選擇所有成對之記錄置的万式’以及將來自選擇的記錄裝置之第二算術元素入至自有成對之運算裝置中。 ’、’ 每個運m使用記錄於成對《記錄$置中之運算元素，以獨立指定給成對之内容而執行運#,而當平行算術裝置使用於三度空間電腦繪圖時，這樣的運空間座標中之元素。度斤本發明之另一個具體實施例為，有選擇性地執行矩陣運算以及向量内部乘運算之平行算術裝置，其中包括在矩陣運算期間用以記錄屬於矩陣運算之第一算術元素；以及在内部乘運算期間記錄屬於内部乘運算之第二算術元素之记錄裝置。運算裝置形成一對一符合下列記錄裝置關係之裝置·在矩陣運算期間經由每個運算裝置輸入記錄於相關記錄裝置中之第一算術元素以執行乘數運算；以及在内部乘運算期間經由已決定的運算裝置輸入記錄於所有記錄裝置中之第二算術元素以執行乘數運算。而選擇裝置在矩陣運算期間選擇符合已決定的運算裝置之記錄裝置，並將記錄於記錄裝置中之第一算術元素輸入至已決定的運算 -8 -本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 571202 五、發明説明（6 媒選擇裝置在内部乘運算期間以循環方法-個接- :地=錄裝置，並將記錄於選擇的記錄裝置中之第二鼻術疋素輸入至已決定的運算裝置中。例算：裝置中，運算裝置執行浮點之乘數運算， U如田弁術7C素以浮點數表示時。 :據：發明之娛樂裝置為經由執行物體之相關位置與 „麵陣運算，以及執行用於表示物體影像相關 m運算之娛樂裝置。娛樂裝置包括許多暫存 :,、存器在矩陣運算期間記錄屬於矩陣運算之第一 :術元素，以及在内部乘運算期間記錄屬於内部乘運算之 =算:元素’乘數運算器形成_對_符合下列暫存器之關暫广器r運算期間經由每個乘數運算器輸入記錄於相關暫存器中之第-算術元素以執行乘數運算之暫存器.以運算期間經由已決定的乘數運算器輸入記錄相有暫存ϋ中之第二算術元素以執行乘數運算之暫存益。而選擇器在矩陣運算期間選擇符合已決定的 !之暫存器，並將記錄在此暫存器中之第-算術元辛輸： =決定的乘數運算器；選擇器在内部乘運算期間以循環神個接一個地選擇暫存器，並將記錄於選擇的暫〈第一算術疋素輸入至已決定的乘數運算器中。本發明另一具體實施例為經由進行在矩陣之料運算，以執行娱樂影像上之影像處理，以便 -物體形狀與位置之座標轉換，以及經由執行在丁垂直万向之垂直向量與光源平行向量間之内部乘運以 -9 本纸張人奴辭關雜準_) Α4—^·χ297公⑹ 期=物Γ表面《顯示模式。具體實施例包括在矩陣運算 =期Π:矩陣列之座標值與元素值，以及在内3 符合平行向量元素之垂直向量與元素值之運::運算器形成-對-符合下列暫存器之關之暫存器·…内部乘哭由、i士夬疋的：數運具器輸入記錄於所有暫存暫存：。而選向擇量與平行向量之元素值以執行乘數運算之運算器之暫陣運算期間選擇符合已決定的乘數矩陣収元H於並將記錄在此暫存器中之座標值與符合部乘運算期門上至已決足的乘數運算器;選擇器在内法一個接-個地選擇暫存器，並將 Ζ錄於選擇的暫存器中之垂直向量* 輸入至已決定的乘數運算器中。〃 κπ素值算明之處理方法為-可以選擇性地執行矩陣運行。處理方法包括在矩陣運算裝置執 …至運算裝置以依據指定二= 其，以便輸入屬於矩陣運算之算術元素之步驟部乘運算期間，將屬於内部乘運算之算術; 二運算裝置，…許運算裝置執行依據== 算=量本::::;:^ 鼻成4可…腦程式，並且使電腦成五、發明説明（8 ) 為具有許多運算裝置，可在矩陣運算術元素指定至運算裝置，以依據指定二依：特徵將數運算’而能執行輸入屬於麵陣運算之算：：：::行乘以及在内部乘運算期間將屬於内部乘運算之算种步：，人至已決定的運算裝置中，以便允許運算裝置：：：素輸素執行乘數運算等步驟之電腦程式。據异銜疋依據本發明之半導體裝置為一運算與向量内部乘運算成為可能之 =订麵陣在合併提供許多運算裝置之電腦之裝置；，：中，建立陣運算期間’經由依據特徵將算術元運ΐ裝置，以依據指定的算術元素允許每個運 :乘數運算，而能執行輸入屬於矩陣運算之算術元驟，以及在内部乘運算期間將屬於： =已決定的運算裝置中，以便允許運疋素執行乘數運算之步驟。圖表簡要描述 ,當讀取完下列詳細描述與附圖時，這些主題與其他以及本發明之優點將變得更為清楚。其中·· 圖1為娱樂裝置之方塊圖；圖2為平行算術裝置之方塊圖；圖3為FMAC浮點多工運算器之内部方塊圖；圖4為表示内部乘運算處理流程之流程圖，·及圖5為平行算術裝置之方塊圖。較佳具體實施例之詳細描述 571202 A7

本發明之一具體實施例將參考下圖1圖示出娛樂裝置之架構範例之平行算術裝置。列圖式具體說明。 ,其中包括根據本發明娛樂裝置1具有兩個匯流排，主匯流排B1與子歷流排 B2,並連接至每個具有特殊功能之半導體裝置。經由匯流排介面INT,匯流排扪與B2互相連接或不連接。、主匯流排B1與主要半導體裝置之主cpui〇、ram組成 <王記憶體11、主DMAC(直接記憶體存取控制器）12、 mpeg(動態圖像專家群組）解碼器（MDEC)13,以及具有作為繪圖記憶體之内建圖框記憶體15之繪圖處理單元（在此為 GPU )連接。GPU 14與產生影像輸出信號之crtc(CRT控制器16)連接，因此在圖框記憶體15中所繪製之資料可在顯示裝置上顯示（未圖示出來）。經由匯流排介面INT，CPU 10在娛樂裝置！之起始處從子匯流排B2上之ROM 23載入一啟動程式，並執行此啟動程式與操作該運算系統。CPU 10也控制媒體驅動裝置27、讀取來自設置在媒體驅動裝置27之媒體28之應用程式或資料，以及將其儲存於主記憶體11之中。CPU 1 〇進一步將上述幾何處理應用至從媒體28讀取之資料，例如許多基本繪圖（多邊形）組成之三度空間物體資料（多邊形之垂直（傳統點）座標值等等），並產生包含幾何處理多邊形定義資訊（所使用之多邊形形狀，所緣製之位置、種類、顏色或材質等等多邊形元素之規格）之顯示表單。平行算術裝置1〇〇包含於主CPU 10之中，並當幾何處理等執行時使用。平行算術裝置100詳細情形將於梢後描 -12 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 571202 A7 B7 五、發明説明（1(5 ) 述0 GPU 14為具有儲存繪製内容（包括多邊形元素之繪圖資料）、經由讀取根據來自主CPU 10通知之顯示表單之繪製内容以及圖框記憶體15中之繪圖多邊形，以便執行填像處理（繪圖處理）等功能之半導體裝置。圖框記憶體15也能當作材質記憶體使用，因此圖框記憶體中之畫素影像可當作材質般地貼至即將繪製之多邊形上。主DMAC 12為在連接至主匯流排B1之電路上執行DMA 轉換控制，以及根據匯流排介面INT情況，在連接至子匯流排B2之電路上執行DMA轉換控制之半導體裝置。MDEC 13為與CPU 10 —起平行運算，並具有在MPEG(動態圖像專家群組）或JPEG(聯合照片專家群組）系統中已壓縮之延伸資料等功能之半導體裝置。子匯流排B2連接至由微處理器等組成之子CPU 20、由 RAM組成之子記憶體21、子DMAC 22、記錄例如運算系統之控制程式之ROM 23、讀取儲存於聲音記憶體25中之聲音資料以及音訊輸出之聲音處理半導體裝置（SPU :聲音處理單元）24、經由網路（未圖示出來）傳送/接收資訊至/來自外部裝置之通訊控制區段（ATM)26、用以設定例如 CD-ROM與DVD-ROM等媒體28之媒體驅動裝置27以及輸入裝置3 1。子CPU 20根據儲存於ROM 23中之控制程式執行不同的運算。子DMAC 22只在當匯流排介面INT將主匯流排B1 與子匯流排B2分離時，於連接至子匯流排B2之電路上執 -13 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 571202 A7 B7 五、發明説明（11 ) 行例如DMA轉換之控制。輸入裝置3 1上提供連接終端機 32，來自運算裝置33之輸入訊號經由此處而輸入。如此結構之娱樂裝置1可執行矩陣運算以及内部乘運算’這是在幾何處理期間透過包含在主CPU 10中之平# 算術裝置100以高速執行，而這些將在以下描述。平行算術裝置100在當多邊形垂直座標轉換時所執行之轉換矩陣以及垂直座標值之間以高速執行矩陣運算，並在當決定顯示情況例如物體表面之亮度時所執行之表面之垂直向里以及光源之平行向里之間以南速執行内部乘運算。 <具體實施例1> 圖2表示包含在主CPU 10中之平行算術裝置100之架構範例® 平行算術裝置100a獲得多邊形垂直座標值與例如經由主匯流排B1來自主記憶體U使用於矩陣運算之轉換運算之幾何處理所需之資料（算術元素），並執行運算。平行算術裝置l〇〇a由包括控制電路11〇、暫存器12〇a 到120d、選擇器130a與13〇b、算術單元之fMAC 14〇a到 HOd，以及内部儲存裝置ι5〇等所組成，暫存器12〇&到i2〇d 與内部儲存裝置150經由内部匯流排b連接。暫存器120a到120d以及FMAC 140a到140d每個都成配對’也就是說，暫存器設計成與FMAC有一對一的關係。為了瞭解使用4x4轉換矩陣之矩陣運算與四度空間向量之内部乘運算’本具體實施例使用四組暫存器與FMAC ,但 -14 - 本紙張尺度適用中國國家標準(CNS) A4規格(21〇χ297公釐)

裝訂

線 571202 A7 B7 五發明説明（12 ) 可根據適當的處理内容決定使用組數。在暫存器120a與FMAC 14〇a之間提供選擇器13如與 13〇b 〇丑本具m實施例表達使用於矩陣運算與使用浮點數之内 :f運算之算術元素’卻未說明定點數也能替代來使用。 $算術元素以定點數表達時，用於定點數之乘數運算器也能以FMAC 140a到140d替代使用。控制電路no控制平行算術裝置1〇〇a之全部的運赏。例如控制電路110控制記錄暫存器12〇&到12〇d中之算術元素’以及選擇器13〇&與1301)之運算。 "" 暫存器120a到120d從例如轉換矩陣元素值之算術元素之間接收與記錄指定給各自的暫存器之算術元素，而轉換矩陣使用於例如矩陣運算或内部乘運算之運算，暫存器 12〇a到I20d接收與記錄即將轉換之座標值，以及來自於在控制電路11〇控制下之内部儲存裝置15〇之向量元素值。當四度空間向量之内部乘運算執行時，暫存$ i2〇a到 12〇d從四度空間向量之元素值之間接收與記錄指定給各自的暫存器以當作算術元素之元素值。例如兩組四度空間向量（Ax、Ay、Az、Aw)以及（Βχ、By、&、Bw)，暫存器 i施冗錄兀素值Ax與Bx，暫存器12〇b記錄元素值々與^，暫存器120c記錄元素值Az與Bz，暫存器i2〇d記錄元素值Aw與Bw。當使用4x4轉換矩p車執行㈣運算時，暫存$ 12如到接收與記錄即將轉換之四度空間座標值以及指定給 -15 -

571202 五、發明説明（13 ::ΤΓΐ自的暫存器之列元素值，以當作算術元素。轉換 =1 :間座標值外，暫存器咖到_並記錄二足兀二值，暫存器120a記錄轉換矩陣第一列之存器120 VI: 12〇b "己錄轉換矩陣第二列之元素值，暫換矩陣第三列之元素值，暫存器剛記暫臭=乐四列之元素值，以當作其各自的算術元素。 ΐ存洛120" 120(1每個都記錄轉換矩陣每一列之第一行 :純’以及即將轉換之四度空間座標值之第一行元素二弟一仃兀素值與第二元素值配對成組，第三行元值與第三元素值配對成組，第 ·、成組，在同-時間只讀取'組仃元;:直值與…— 此外，暫存器120a到120d却铉立 , —之一…。選擇器⑽與130b從暫存器12如到丨細之個：以便接收即將記錄於所選擇的暫存器中之算術元素，並才疋供算術元素給FMAC 140a。去埶;ώ、+ 、擇器咖與⑽以循環方法從暫田存執器仃二邵乘運算時，選攸唯孖态12〇a到12〇d之中選一個，以便接收即將記錄於所選擇的暫存器中之素’並提供算術元素給FMAC 140a。去拙一 " 選擇器130a與l30b總是選擇暫存 f 仃矩陣運算時，於暫存器咖中之算術元素= 收記錄

14()a。卫焚供异術兀素給FMAC 選擇器鳩選擇由控制電路ιι〇“ 執行之運算内容，以及運算進行之情況等等而指定的暫存 -16 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公& 571202 A7 _B7__ 五、發明説明（14 ) 器。 FMAC 140a到140d接收記錄於暫存器120a到120d中之兩個算術元素，並將此兩個算術元素加倍相乘。圖3為FMAC 140a之内部方塊圖，雖然其他FMAC 140b 到140d也具有相同的架構，在此只解釋FMAC 140a之架構而省略其他FMAC 140b到140d。為了加倍相乘接收進來的算術元素，FMAC 140a具有浮點數乘法器（FMUL :浮點乘法器）141與浮點數相加器 (FADD :浮點相加器）142 〇所接收進來的兩個算術元素首先由FMUL 141相乘，相乘之結果傳送至FADD 142，FADD 142將從FMUL 141傳送而來之相乘結果一個接一個地相加0 例如，當逐次接收a0到an與b0到bn以當作算術元素時，FMAC 140a獲得以下計算結果： a0.b0+al.bl + a2.b2H— +a(n- l).b(n-l)+an.bn FMAC 140a到140d輸出計算結果至分別形成其配對之暫存器。經由使用選擇器130a與130b，在内部乘運算與矩陣運算期間FMAC 140a到140d執行下列運算。當執行内部乘運算時，FMAC 140a將經由選擇器130a 與130b而來自於暫存器120a到120d所提供之兩個向量元素值相乘’並將相乘結果一個接一個地相加。此外，計算這些相乘的數目與額外執行也是可能的，而使得内部乘運算所進行之情況變成可視的，以及阻止下一個指令啟動直 -17 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 571202

到完成内部乘運算。當執行矩陣運算時，FMAC 140a到140d將經由成對之四度空間座標值而來自於相關之暫存器120a到12〇d所接收 <轉換矩陣元素值予以相乘，並將相乘結果一個接一個地相加。内部儲存裝置150接收多邊形垂直座標值、使用於矩陣運算之轉換矩陣元素值、來自於主記憶體u等向量元素值之幾何處理所需之資料，並在控制電路11〇控制下記錄廷些值。此外，内部儲存裝置15〇接收並記錄來自於暫存器120a到120d之計算結果，計算結果經由内部儲存裝置 150傳送至主記憶體丨丨。在内邵儲存裝置150與主記憶體U之間執行直接記憶體存取轉換，這動作允許高速資料傳送/接收，並且對於影像處理等需要大量資料處理而言是很方便的。當平行算術裝置l〇〇a以數學運算式2執行内部乘運算時，也就是介於向量A(Ax、Ay、Az、Aw)與向量Β(Βχ、Β”

Bz、Bw)間之内部乘運算，將解釋了處理程序，圖*便為這種處理程序之流程圖。平仃算術裝置100a經由直接記憶體存取轉換接收儲存於主記憶體11中向量A(Ax、Ay、Az、Aw)與向量Β(Βχ、

By、ΒΖ、Bw)之元素值，並記錄内部儲存裝置15〇中之元素值（步驟S101)。暫存為120a到120d從儲存於内部儲存裝置15〇中之向量a(Ax、Ay、Az、Aw)與向量Β(βχ、办、&、㈣之向量 -18 -

571202 A7 B7 五、發明説明（16 ) 元素值之間接收指定給各自的暫存器之元素值。也就是說，暫存器120a接收Αχ與Bx，暫存器120b接收Ay與 By，暫存器120c接收Az與Bz，暫存器120d接收Aw與 Bw(步驟 S102)。選擇器130a與130b從暫存器120a到120d之中選擇一個，接收即將記錄於所選擇的暫存器中之向量A與向量B 之元素值，並提供元素值給FMAC 140a。控制電路110根據内部乘運算進行之情形以決定從暫存器120a到120d之中該選擇何者。在控制電路110控制下，選擇器130a與 130b從暫存器120a到120d之中選擇一個。在此，選擇器 130a與130b選擇暫存器120a，接收Αχ與Bx並優先將Αχ 與 Bx 提供至 FMAC 140a(步驟 S103)。FMAC 140a 使用 FMUL 141與FADD 142(步驟S104)執行在Αχ與Bx間之乘數運算，在執行第一次FADD 142之前，FMAC 140a之内部狀態已經清除。在内部乘數運算進行之後，FMAC 140a決定内部乘運算是否已經完成（步驟S105)，内部乘運算是否已經完成可經由了解屬於内部乘運算之向量元素值數目而決定^計算已經執行的乘數運算之相乘數目，並在當計算數等於向量元素值時輸入，而這些都是在内部乘運算已經完成時決定，這使得從計算數去了解應該從哪一個暫存器取出下一個元素值變得可能。内部乘運算是否已經完成之決定結果傳送至在控制電路11 〇。在此案例中，内部乘運算尚未完成（步驟S105 :否），因 -19 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐） 571202 A7 B7 五、發明説明（17 ) 此控制電路110允許選擇器130a與130b選擇暫存器120b。在控制電路110控制下，選擇器13〇a與130b選擇暫存器 120b，接收Ay與By並將Ay與By提供至FMAC 140a。當 FMAC 140a 接收 Ay 與 By 時，FMUL 141 與 FADD 142 執行乘數運算以獲得Ax.Bx+Ay.By。同樣地，重複步驟1〇3至步驟1 05直到完成内部乘運算以便獲得Ax·Bx+Ay·By+ Az.Bz+Aw.Bw ο 一旦確定内部乘運算已經完成（步驟S105 :是），FMAC 140a將汁鼻結果輸出至暫存器12〇a(步驟S106)。在輸出之後，FMAC 140a清除内部狀態（步驟S107)，輸出的計算結果從暫存器120a輸入至内部儲存裝置15〇中並傳送至主記憶體11。如此便完成了内部乘運算。由於提供了選擇器130a與13〇b，使得用以執行内部乘運算之不同元素值間之計算變得更為簡單。在暫存器12〇a 與FMAC 140a之間提供選擇器i30a與130b，但是此具體實施例並不止於此，選擇器13〇a與130b也能在暫存器120b 與 FMAC 140b、暫存器 120c 與 FMAC 140c、暫存器 120d 與FMAC 140d之間提供。當執行矩陣運算時，選擇器130a與130b總是選擇暫存器120a ’僅將記錄於暫存器i2〇a中之算術元素提供至 FMAC 140a’而不將記錄於其他暫存器120b至120d中之算術元素提供至FMAC 140a，記錄於其他暫存器120b到120d 之算術元素將取送至與其各別成組配對之FMAC 140b到 -20 - 本纸張尺度適用中國國家榇準(CNS) A4規格(210 X 297公釐）裝訂

571202 A7 B7 五、發明説明（18 ) 140d。例如當數學運算式1中之矩陣運算執行時，暫存器120a 記錄轉換矩陣第一列之元素值（Mil、M12、M13、M14)以及四度空間座標之座標值（Vx、Vy、Vz、Vw)。暫存器120b 記錄轉換矩陣第二列之元素值（M21、M22、M23、M24)以及四度空間座標之座標值（Vx、Vy、Vz、Vw)。暫存器120c 記錄轉換矩陣第三列之元素值（M31、M32、M33、M34)以及四度空間座標之座標值（Vx、Vy、Vz、Vw)。暫存器120d 記錄轉換矩陣第四列之元素值（M41、M42、M43、M44)以及四度空間座標之座標值（Vx、Vy、Vz、Vw)。 FMAC 140a到140d連續地接收元素值，以及記錄於與 FMAC 140b到140d其各別成組配對之暫存器120a到120d 之座標值，並執行運算。假定以FMAC 140a為例，FMAC HOa經由選擇器130a與130b從暫存器120a接收Mil與 Vx，並使用FMUL141計算Mll.Vx，FMAC 140a將此傳送至FADD 142。隨後FMAC 140a接收M12與Vy，計算 M12.Vy，將此傳送至 FADD 142，並計算 Mll.Vx+M12.Vy。隨後FMAC 140a對M13與Vz、M14與Vw執行相同計算，並計算 Mll.Vx+M12.Vy+M13.Vz+M14.Vw，其他 FMAC 140b 到140d執行相同的運算。因此，FMAC 140a到140d便能如同傳統技藝般以同樣的速度平行地執行4x4矩陣運算。如上所述，平行算術裝置l〇〇a為選擇性地執行矩陣運算與向量内部乘運算之裝置。平行算術裝置l〇〇a至少具有暫存器120a到120d，可於矩陣運算期間記錄轉換矩陣 -21 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 571202 A7 _B7___ 五、發明説明（19 ) 之元素值以當作算術元素，並在内部乘運算期間記錄向量元素以當作算術元素。FMAC 140a到140d接收記錄於暫存器120a到120d之算術元素，並執行乘數運算。選擇器130a 與130b從暫存器120a到120d選擇一個暫存器，並提供暫存於所選擇的暫存器中之算術元素至FMAC 140a。暫存器 120b到120d與FMAC 140b到140d形成一對一的關係，選擇器130a與130b於矩陣運算期間將記錄於暫存器120a中之轉換矩陣元素值提供至FMAC 140a，並以循環方式一個接一個地選擇暫存器120a到120d，並在内部乘運算期間將記錄於所選擇的暫存器中之向量元素值提供至FMAC 140a，以此方式所提供之選擇器130a與130b使得選擇性地執行矩陣運算與内部乘運算變得可能。 <具體實施例2> 圖5為根據另一個具體實施例平行算術裝置l〇〇b之方塊圖。對比於圖2中所示之平行算術裝置l〇〇a，平行算術裝置 100b只在暫存器120b到120d之輸出端上所提供之暫時暫存器160b到160d有所不同。平行算術裝置l〇〇b架構以暫存器120a到120d，暫存器 120a到120d記錄算術元素FMAC 140a到140d，算術元素 FMAC 140a到140d依據記錄於這些暫存器120a到120d中之算術元素執行乘數運算，選擇器130a與130b插入於暫存器120a與FMAC 140a之間，暫時暫存器160b到160d插 -22 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐） 571202 A7 __ B7 五、發明説明（20 ) 入於暫存器120b到120d與FMAC 140b到140d之間。選擇器130a與130b從暫存器120a與暫時暫存器160b到160d 之間選擇出一個，並將記錄於所選擇的暫存器120a或暫時暫存器160b到160d中之算術元素輸入至FMAC 140a，這些元素的運作是由控制電路110所控制。暫時暫存器160b到160d與暫存器120b到120d有一對一的關係，暫時暫存器160b到160d暫時地儲存記錄於其各自暫存器120b到120d中之算術元素，當這些送往FMAC 140b到140d或選擇器130a與130b時。由於暫時暫存器160b到160d暫時地記錄來自於暫存器 120b到120d之算術元素，即使並未從暫存器i2〇b到120d 取走算術元素以便在同一段時間進入FMAC 140a，如同是在内部乘運算情況中。暫存器120b到120d之讀取埠並未於内部乘運算時為算術元素所佔據，因此當FMAC 140a執行矩陣運算時，其他FMAC 140b到140d從暫存器120b到 120d接收下一個算術元素，以便允許乘數運算。上述具體實施例已經描述使用平行算術裝置1〇〇作為範例之娱樂裝置，但本發明並未受限於此，且本發明之平行算術裝置可使用任何執行平行算術處理以及至少執行矩陣運算與向量内部乘運算之資訊處理器。此外，暫存器與乘數運算器（FMAC)之成對數並未受限於四個，但是成對數可根據經由相關裝置所執行之處理而決定。此外，平行算術裝置100也可經由促使電腦執行本發明之電腦程式而實施。經由介於記錄於電腦可存取記錄媒體 -23 - 本紙張尺度適用中國國家襟準(CNS) A4規格(210 X 297公釐) 571202 A7 B7 五、發明説明（21 ) 之電腦程式，例如磁碟裝置或半導體記憶裝置，以及合併於電腦中之控制程式（作業系統等）間之共同運算，此具體實施例形成一功能性方塊，以符合在電腦上之具有許多 FMAC之選擇器130a與130b。如上所述，當如同傳統技藝般有效地執行矩陣運算時，本發明可輕易地執行向量内部乘運算。在不達背本發明主要的精神與範圍下，允許不同的具體實施例與修改。上述具體實施例打算圖解本發明，而不受限於本發明之範圍。本發明之範圍經由專利申請範圍而非具體實施例所表示，在本發明專利申請範圍之相等意義内與專利申請範圍内所產生的·許多修改是在本發明範圍之内0 -24 - 本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公釐)

Claims

571202 f 090127301號專利令請案含8 請專利範圍替換本(92年5月)C8 六 --1 • 一種包括複數組用以記錄即將運算之算術元素之記錄裝置以及依據記錄於該記錄裝置中之算術元素用以仃乘數運算之運算裝置之平行算術裝置，其中從所有成，之記錄裝置中選擇出—個，選擇裝置用以將記錄於所選擇的ϋ中之算術元素輸入至插人於記錄裝u & 何一組成對之運算裝置間之該成對之運算裝置。/、 2·如申4專利範圍第i項之平行算術裝置，其中用以暫地將記錄於成對之記錄裝置中之算術元素，以記錄起來义暫時記錄裝置，係插入於記錄裝置與該成對之運算裝置之間，其中該選擇裝置並未插入；以及當選擇出成對之記錄裝置時，其中該選擇裝置並未插入，選擇裝置以此方式架構起來，以便將記錄於該暫時記錄裝置中之算術元素輸入至運算裝置。、 3·如申4專利㈣第丨項之平行算術裝置，其中所有成對又C錄裝置於矩陣運算期間記錄屬於該矩陣運算之第一异術兀素，以及於向量内部乘運算期間記錄屬於該内部乘運算之第二算術元素，於矩陣運算期間，選擇裝置以此方式架構起來，以便將來^該自有之記錄裝置之第一算術元素輸入至自有义運异裝置；同樣方式於内部乘運算期間以循環方式一個接一個地選擇所有成對之記錄裝置，並將來自所選擇的记錄裝置之第二算術元素輸入至自有之運算裝置。 4.如申凊專利範圍第丨項之平行算術裝置，其中每個運算裝置以一獨互於指定於使用記錄於該組記錄裝置中之丨X 297公釐） 571202

算術元素之内容執行運算。 5. 如申請專利範圍第4項之平行算術裝置，其中該運算是與四度空間座標元素其中之一聯合的。 6. —種選擇性地執行矩p車運算與向*内部乘運算之平行算術裝置，包括：於矩陣運异期間用以記錄屬於該矩陣運算之第一算術兀素，以及於内部乘運算期間用以記錄屬於該内部乘運异之第一异術元素之記錄裝置；與上述记錄裝置形成一對一關係之運算裝置，以便於矩陣運算，間經由每個運算裝置輸人記錄於相關記錄裝置中之第-算術元素以執行乘數運算，以及於内部乘運算期間經由已決定㈣算裝置輸人記錄於所有記錄裝置中之第二算術元素以執行乘數運算；以及、於該矩陣運算期間用以選擇符合已決定的運算裝置之記錄裝置’並將記錄於此記錄裝置中之第—算術元素輸入至已f定的運算裝置中，以及於該内部乘運算期馬以循環万式-個接—個地選擇記錄裝置，並將記錄於所選擇的記錄裝置中之第二算術元素輸人至已決定的運算裝置中之選擇裝置。 7. 其中算術元素執行浮點數之如申請專利範圍第6項之平行算術裝置，是以浮點數表示，架構以該運算裝置以便乘數運算。由執行關於用 8· —種在娱樂影像上經之矩陣運算以及執行關於物體形狀和位置座標未表示物體影像向量之内 -2 -

571202 部乘運算而執行像處理之娛樂裝置，包括：万；矩睁運算期十、^ Ί忑綠屬於該矩陣運算之第一算術元素以及於内部乘水建异期間記錄屬於該内部乘運算之第二异術元素之暫存器；不與上述暫存哭开彡、♦ # 叩7成一對一關係之乘數運算器，於矩陣運异期間细山益〔丨干 ^ 、: 母個乘數運算器輸入記錄於相關暫存器 βπ 自、-1L·- — j. 斤Η兀素以執行乘數運算，以及於内部乘運笪期間經由已決佘# + 异、々疋的乘數運算器輸入記錄於所有暫存器中（第二算術元素以執行乘數運算；以& 〇万、:矩陣運算期間選擇符合已決定的乘數運算器之暫存:’並將記錄於此暫存器中之第一算術元素輸入至已^走的乘數運异器中，以及於該内部乘運算期間，以循％方式一個接一個地選擇暫存器，並將記錄於所選擇的％存时中之第二算術元素輸入至已決定的乘數運器中之選擇器。 9. 一種在娛樂影像上經由執行介於矩陣與座標值間之矩陣運算以便執行物體位置和形狀之座標轉換以及執行介於物體表面垂直向量與光表面之平行向量間之内部乘運算以便決定物體表面之顯示模式而執行影像處理之娛樂裝置，包括：於矩陣運算期間記錄座標值與符合該矩陣任何一列之元素值，以及於内部乘運算期間記錄垂直向量與符合該平行向量任何一個·元素之元素值之暫存器；與上述暫存态形成一對一關係之乘數運算器，於矩陣 -3 - 本紙張尺度適用中國國家標準(CNS) Α4規格(210 X 297公釐) ~ ---- —

裝

六、申請專利範園 :异现經由每個乘數運算器輸入記錄於相關暫“ =厘標值以執行乘數運算，以^内部乘運算期間二 :已決定的乘數運算器輸入記錄於所有暫存器中之：直向量與平行向量之元素值以執行乘數運算；於該矩陣運算期間選擇符合已決定的乘數運算器之暫存器，並將記錄於此暫存器中之座標值輸入至已決= 的乘數運算器中，以及於該内部乘運算期間，以循環= 式一個接一個地選擇暫存器，並將記錄於所選擇的暫存裔中之垂直向量與平行向量之元素值輸入至已決定乘數運算器中之選擇器。 10.—種允許矩陣運算與向量内部乘運算選擇性地執行並經由具有許多運算裝置之裝置而執行之處理方法，包之步驟為：於矩陣運算期間經由依據特徵指定算術元素至運算裝置，輸入屬於該矩陣運算之算術元素，以便依據指定的弄術元素執行乘數運算；以及於内邵乘運算期間，輸入屬於已決定的運算裝置中之内邵乘運算之算術元素，以允許運算裝置依據算術元素執行乘數運算。 “ 11 · 一種電腦可讀取記錄媒體，其記錄一可選擇性地執行矩障運算與向量内部乘運算並使得電腦具有運算裝置之電腦程式，以便執行：於矩陣運算期間經由依據特徵指定算術元素至運算裝置，輸入屬於該矩陣運算之算術元素，以便依據指定 -4 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 571202 申請專利範圍的算術元素執行乘數運算之步驟；以及於内部乘運算期間，輸入屬於已決定的運算裝置中之内邵乘運算之算術元素，以允許運算裝置依據算術元素執行乘數運算之步驟。 12. -種可選擇性地執行矩陣運算與向量内部乘運算並建構在口併具有弁多運算裝置之電腦内之半導便執行：於矩陣運算期間經由依據特徵指定算術元素至運算裝^，輸人屬於該矩陣運算之算術元素，以便允許每個以運算裝置依據指定的算術元素執行乘數運算之及於内部乘運算期間，輸入屬於已決定的運算裝置中内部乘運算之算術元素，以允許運算裝置依據算術元執行乘數運算之步驟。