TW201319932A - 單一指令多重資料處理器系統中在單一記憶體與具有不均勻分布資料量的記憶體陣列之間的指標引導資料傳送 - Google Patents

單一指令多重資料處理器系統中在單一記憶體與具有不均勻分布資料量的記憶體陣列之間的指標引導資料傳送 Download PDF

Info

Publication number
TW201319932A
TW201319932A TW101122857A TW101122857A TW201319932A TW 201319932 A TW201319932 A TW 201319932A TW 101122857 A TW101122857 A TW 101122857A TW 101122857 A TW101122857 A TW 101122857A TW 201319932 A TW201319932 A TW 201319932A
Authority
TW
Taiwan
Prior art keywords
data
processing unit
memory
array
unit
Prior art date
Application number
TW101122857A
Other languages
English (en)
Other versions
TWI512614B (zh
Inventor
Hanno Lieske
Original Assignee
Renesas Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Electronics Corp filed Critical Renesas Electronics Corp
Publication of TW201319932A publication Critical patent/TW201319932A/zh
Application granted granted Critical
Publication of TWI512614B publication Critical patent/TWI512614B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4204Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus
    • G06F13/4234Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus being a memory bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
    • G06F15/8015One dimensional arrays, e.g. rings, linear arrays, buses

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Multi Processors (AREA)
  • Image Processing (AREA)

Abstract

一結束指標設定單元在儲存於記憶體單元內部的一資料流的結尾設定一結束指標。當於匯流排系統上從一處理單元陣列傳送資料至單一記憶體時,在特定處理單元的結束指標被偵測到的情況下,一寫入方向指標評估單元刪除從該處理單元所傳送的後續列中的資料。當從單一記憶體傳送資料至處理單元陣列時,在特定處理單元的結束指標被偵測到的情況下,一讀取方向指標評估單元在後續列中為該處理單元插入資料。

Description

單一指令多重資料處理器系統中在單一記憶體與具有不均勻分布資料量的記憶體陣列之間的指標引導資料傳送
本發明關於在單一指令多重資料(SIMD)處理器系統中,單一記憶體與記憶體陣列之間的資料傳送。特別關於一種因應在記憶體陣列中各個記憶體的資料量分布不均勻的快速資料傳送,其建置成本低且資料傳送量增加少。
當一單一指令多重資料處理器的處理單元(processing unit,PE)處理例如一壓縮演算法時,處理單元陣列中各處理單元的記憶體中之壓縮資料量可能會不同。
例如,此情況可能會在後述的案例中發生。由電荷耦合元件鏡頭或互補金氧半導體感應器拍攝的影像資料係由多個處理單元平行處理。作為一個影像處理的例子,影像壓縮是由處理單元執行。由於影像資料各個部份的影像壓縮比可能不同,壓縮於處理單元陣列的各處理單元之記憶體中的資料量可能不同。
當藉著陣列中的各記憶體只能平行存取的匯流排系統來傳送不均勻分布資料量至一單一記憶體時,欲傳送至單一記憶體的資料量取決於儲存在記憶體陣列中任何一個記憶體的最大資料量,此係由於最大資料量決定了在記憶體陣列與單一記憶體之間傳送所有必要資料的資料傳送數量。
在記憶體陣列中的資料分布不均勻的情況中,存在一個時間點,某些記憶體已經傳送了所有的壓縮資料,而其它記憶體仍需要傳送進一步的資料。
然而,由於單一指令多重資料的資料傳送方式,是所有的記憶體係同時被存取,例如,讀取相同的資料量,然後經由匯流排系統傳送至單一記憶體,使得大量的資料負載被傳送,在壓縮的例子中,這降低了可達到的壓縮因素。
在記憶體陣列中的資料分布均勻的情況中,如非專利文獻1(S.Kyo等,「嵌入式系統的低成本混合模式平行處理器架構」,第21 屆國際超級運算年會期刊,2007年6月)所敘述的,存在一個在內部記憶體陣列與單一外部記憶體之間於環狀匯流排傳送資料的解決方案。
圖18顯示用於解釋非專利文獻1所呈現的,在記憶體陣列中的資料分布均勻的情況中,在內部記憶體陣列與單一外部記憶體之間傳送資料的架構之結構。
此架構由具有記憶體之處理單元的陣列14所構成。陣列包括處理單元11與記憶體單元12,其群組成為四個「具有記憶體單元之處理單元」13之群組。資料在內部記憶體陣列與單一外部記憶體18之間於匯流排系統15傳送,匯流排系統15為一管線化環狀匯流排。
暫存器16於環狀匯流排上安排的方式,為在兩個暫存器之間,不是處理單元群組就是控制單元17連接至匯流排15。
在非專利文獻1中,為了從內部到外部記憶體的寫入傳送,內部記憶體陣列的記憶體單元中的均勻分布資料係同時存取。
從各記憶體單元讀取的資料接著被存入環狀匯流排上的暫存器,從暫存器它們接續地傳送到外部記憶體。
關於讀取方向,資料被接續地依單元從外部記憶體讀取,並儲存在環狀匯流排的暫存器中,暫存器資料最後被同時儲存在內部記憶體陣列的記憶體單元中。
雖然上述的內部記憶體陣列與外部單一記憶體之間的資料傳送對於均勻分布資料係可運作,且在外部記憶體中沒有資料儲存負載,但不均勻分布資料的傳送則會需要資料儲存負載。
這是由於內部記憶體陣列只能被依線(line wise)存取,而非依單元(element wise),且一線由“記憶體陣列中的數個記憶體單元”單元所構成,因此使用非專利文獻1中所述的線資料傳送,會需要依線儲存資料至外部記憶體,直到來自所有內部記憶體單元之所需資料已傳送為止。
此處,專利文獻1(日本專利公開公報第H06-75929號)揭露了一種平行處理裝置,其中一處理單元傳送其負載到另一處理單元,藉以在處理單元之間分散負載。專利文獻2(日本專利公開公報第H05-94425號)揭露了一種工作管理方法,以降低負載分配所需要的時間。此外,專利文獻3(國際專利合作條約公開公報第WO2009/131007號)揭露了一種單一指令多重資料平行電腦系統,其於處理單元間平均處理負載。然而,即使採用了上述專利文獻中所揭露的技術,上述的問題仍然沒有解決。
本發明係基於上述的問題而提出,且本發明的一目的,在於相較於儲存於記憶體陣列的記憶體單元內的不均勻分布資料的狀況,提供降低必須儲存至單一記憶體中的資料量的可能性。
依本發明的一個態樣,一種資料傳送裝置被提出,包括:一處理單元陣列,包括以單一指令多重資料方式控制的多個處理單元;記憶體單元,提供於各處理單元內部,所有該些處理單元的記憶體單元的資料存取係平行地完成;一控制單元,以該單一指令多重資料方式控制該處理單元陣列;一匯流排系統,連接所有該些處理單元與該控制單元;一單一記憶體,與該處理單元陣列之該些記憶體單元交換資料;一結束指標設定單元,其負責在儲存於該些記憶體單元內的一資料流的結尾設定一結束指標;一寫入方向指標評估單元;以及一讀取方向指標評估單元,其中通過該匯流排系統從該處理單元陣列傳送資料至該單一記憶體時,在特定處理單元的該結束指標被偵測到的情況下,該寫入方向指標評估單元之工作為刪除從該特定處理單元所傳送的後續列中的資料,且當通過該匯流排系統從單一記憶體傳送資料至該處理單元陣 列時,在特定處理單元的該結束指標被偵測到的情況下,該讀取方向指標評估單元之工作為針對該特定處理單元將資料插入後續列中。
依本發明,由於結束指標被預先設定,且當特定處理單元的結束指標被偵測到,從該處理單元的後續列傳送的資料都自動被忽略,處理單元陣列的記憶體單元中的不均勻分布資料可在低硬體建置成本與低資料傳送量增加的情況下,被快速且有效率地傳送至單一記憶體。
以下參考附隨的圖式,描述本發明的例示性實施例。
【第一實施例】
作為第一實施例,以下描述不均勻分布資料從記憶體陣列到單一外部記憶體的傳送。
圖1顯示單一指令多重資料處理器100的架構。圖1中的單一指令多重資料處理器100的架構具有一處理單元220的陣列200。在陣列200中,四個處理單元220組成一個處理單元220的群組210。除了記憶體230之外,各處理單元220具有一結束指標設定單元240。
圖2顯示結束指標設定單元240。結束指標設定單元240於各處理單元220中在資料流的結尾加入一結束指標,該資料流係應從處理單元220的記憶體230傳送到一單一記憶體500。結束指標的設定可為一未對齊位置(圖4B)或一對齊位置(圖4C)設定。
圖3顯示一結束指標600已經被加入到儲存於各記憶體230的資料231中的例子。此處,我們以記憶體已經被分割成4位元組的節段,且9位元組的資料儲存在記憶體內部為例,如圖4A所示。在此狀況中,圖4B顯示結束指標設定在資料流結尾的未對齊位置,且圖4C顯示結束指標設定在資料流結尾的對齊位置。
在結束指標設定單元240中,將結束指標或是輸入資料傳送到資料輸出的選擇,係使用資料輸出選擇器241來完成。來自記憶體230的資料係循序輸入到結束指標設定單元240。
結束指標設定單元240決定來自記憶體230的輸入資料是結束資料(最後的資料)或不是。
當輸入資料是結束資料時,資料輸出選擇器241將結束指標600加至結束資料。當輸入資料不是結束資料,資料輸出選擇器241允許輸入資料通過而無任何改變。
資料在處理單元陣列200與單一外部記憶體500之間於一匯流排系統300上傳送,匯流排系統300在本實施例中為一管線化環狀匯流排。
部份暫存器(移位暫存器)310安排於環狀匯流排300的方式,為在兩個暫存器310之間,不是一處理單元的群組210,就是控制單元400連接到環狀匯流排300。
在本實施例中,環狀匯流排300具有128位元傳輸能力,各個連接各處理單元220與環狀匯流排300的線250則具有32位元的傳輸能力。
一控制單元400提供於環狀匯流排300與外部記憶體500之間。控制單元400具有一指標評估裝置410,其具有一寫入方向指標評估單元420,以及一讀取方向指標評估單元430。在指標評估裝置410中,資料傳輸不是通過寫入方向指標評估單元420,就是讀取方向指標評估單元430。
圖5顯示指標評估裝置410的寫入方向指標評估單元420。從記憶體230經由環狀匯流排300而傳送的資料係送至控制單元400。被送至控制單元400的資料被輸入到寫入方向指標評估單元420。寫入方向指標評估單元420中提供有一比較器421。此處,比較器421在輸出端具有一反向器。除了輸入資料之外,一結束指標碼也被輸入至比較器421。
輸入的資料在比較器421中被與結束指標碼比較。結果係儲存在位於比較器421後階的旗標暫存器422。旗標暫存器422的輸 出控制一開關423,其工作為僅在處理單元的結束指標沒有被偵測到時,讓輸入資料通過到輸出緩衝器424。如果處理單元的結束指標被偵測到,沒有資料會被允許通過。
圖6A與6B顯示旗標暫存器422內部的旗標值的轉換。旗標暫存器422儲存各處理單元220的旗標狀態,旗標狀態表現出某個處理單元220的結束指標是否已經通過。如圖6A所示,一開始所有的旗標值都是「1」。
此處,例如,若所有處理單元6中的儲存資料已經被送出,且處理單元6的結束指標到達了比較器421,比較器會輸出一低位準訊號。結果,處理單元6的旗標值會如圖6B所示改為「0」。當處理單元6的旗標為「0」,開關423斷開且不會讓來自處理單元6的資料通過。
來自開關的資料係暫時地儲存於一輸出緩衝器424中。此處,例如,輸出緩衝器424的容量為128位元組。
進一步地,輸出緩衝器424的狀態係於一比較器425中檢查是否已滿。當輸出緩衝器424已滿,資料藉由切換一開關426而送至單一記憶體500,且緩衝器424藉由切換一開關427而清空。
接著描述單一指令多重資料處理器100的運作。如圖7所示,資料係儲存於處理單元陣列200中,且這些資料應被送到單一外部記憶體500。在各處理單元220中,如圖8所示,結束指標設定單元240將結束指標加至儲存在各處理單元220自己的記憶體中的資料。結束指標被設定為對齊或未對齊,如圖4B與4C所示。
各處理單元220將儲存在其自己的記憶體中的資料循序輸出至環狀匯流排300。從各處理單元220輸出的資料係傳送到控制單元400,且控制單元400接收資料(ST100)。每次控制單元400接收資料,圖9與圖10的流程係在寫入方向指標評估單元420中被執行。
接收的資料(ST100)由比較器421與結束指標碼比較(ST110)。結果輸出到旗標暫存器422以更新資料單元所屬的處理 單元220的旗標。
旗標值指出此資料單元的結束指標是否已被傳送。當輸入資料為結束指標碼時(ST110:是),旗標值被改變為「0」(ST120)。當輸入資料與結束指標碼不相同時(ST110:否),旗標值保持在「1」,然後接收下一筆資料(ST100)。
旗標值的資訊自旗標暫存器422被讀出(ST200),且資料依旗標值傳送到輸出緩衝器424。此選擇係由開關423進行。
在旗標值為「1」時(ST210:否),資料被傳送至輸出緩衝器424(ST230)。
在旗標值為「0」時(ST210:是),資料不會傳送(ST220)。換言之,在特定處理單元220的結束指標被偵測到時,從這個處理單元的後續列傳送的資料會自動被忽略。
例如,圖11顯示資料傳送完畢後,單一記憶體500中的資料1001。
各處理單元220的第一筆資料從左側開始被傳送到單一外部記憶體500。然後,下一列被傳送。處理單元6的結束指標在第二列被偵測到,因此處理單元6的資料在第三線被忽略。相似地,處理單元3的結束指標在第三列被偵測到,因此處理單元3的資料在第四線被忽略。
此處,如圖4A中已描述的,當資料單元是例如由4個位元組(32位元)的資料組成,若可忽略一個資料單元的處理,可減少大量的處理步驟。此外,當結束指標被偵測到,來自此結束指標已被偵測到的處理單元的後續列的資料都可被忽略。
所以資料傳送量可大量地被減少。
輸出緩衝器424會被檢查是否所有的地方都被單元填滿(ST250)。在輸出緩衝器424已滿的情況(ST250:是),儲存於輸出緩衝器424的資料會被送至單一外部記憶體500,且輸出緩衝器424的內容會被清空。
在本實施例中,由於結束指標被預先設定,且當特定處理單元220的結束指標被偵測到,從該處理單元的後續列傳送的資料 都自動被忽略,因此處理單元陣列200的記憶體單元中的不均勻分布資料可在低硬體建置成本與低資料傳送量增加的情況下,被快速且有效率地傳送至單一記憶體。
【第二實施例】
作為一第二實施例,以下敘述從單一外部記憶體傳送不均勻分布資料至處理單元陣列。
圖12顯示指標評估裝置410的讀取方向指標評估單元430。資料從外部記憶體500傳送至控制單元400。
此處,外部單一記憶體500的資料1001已經被處理過,使得資料從處理單元以第一實施例所述的方式傳送之後,結束指標係被加入於適當的位置。
控制單元400接收的資料被輸入至讀取方向指標評估單元430。比較器431、旗標暫存器432、輸出緩衝器434、比較器435、開關436以及開關437與第一實施例的寫入方向指標評估單元420的對應部件基本上相同。
一選擇開關433係提供於讀取方向指標評估單元430之中。旗標暫存器432的輸出控制選擇開關433。選擇開關433的工作為,如果之前處理單元的結束指標未被偵測到,則讓輸入資料通過至輸出緩衝器434。如果結束指標被偵測到,則為該處理單元通過零資料至輸出緩衝器434。
接著,描述此單一指令多重資料處理器的運作。
旗標暫存器432的運作與寫入方向指標評估單元420的旗標暫存器422的運作基本上相同。圖9與其說明可應用於旗標暫存器432。
圖13顯示選擇開關433的運作。
首先,旗標暫存器432的資訊從旗標暫存器被讀出(ST300),且從外部記憶體500輸入的資料依據旗標值被傳送到輸出緩衛器。此選擇係在選擇開關433中進行。在旗標值是「1」的情況中(ST310:否),資料被傳送到輸出緩衝器434(ST330)。在旗標值是 「0」的情況中(ST310:是),代替的零資料被傳送到輸出緩衝器434(ST320)。
圖14顯示外部記憶體500儲存的資料1101與輸出至處理單元陣列200的輸出資料1102。從左側開始,資料單元被循序傳送至處理單元陣列200的各記憶體。
然後,後續的列被傳送。當結束指標被偵測到,此結束指標是從外部記憶體500為此處理單元傳送到處理單元陣列200的最後一筆資料。
之後,只有填滿的零會被傳送到此處理單元。
如圖14所示,處理單元6的結束指標在第二線被偵測到,所以「零資料」在第三列中為了處理單元6被選擇。資料線1102輸出至環狀匯流排300,且各處理單元接收自己的資料。結果,處理單元陣列可接收如圖15所示的資料,其中「零」清楚地寫入,以幫助讀者了解本發明的運作。
在本實施例中,來自外部記憶體500的資料可在低硬體建置成本的情況下,有效地以不均勻分布的形式儲存在處理單元陣列200的記憶體單元中。
【修改實施例】
本發明並不僅限於上述的實施例。
圖16顯示一可能的系統設計,其中具有例示性架構的單一指令多重資料處理器1202可以運作。系統中的其它單元可為一中央處理單元1201與一單一記憶體單元1203,其均於連線1205上連接至匯流排系統1204。
此外,作為圖1所示的實施方式的變化,圖17顯示結束指標設定單元從各處理單元被移出,且一個結束指標設定單元(總指標設定單元)1302被放入控制單元1300中指標評估裝置410的旁邊的狀況。總指標設定單元1302負責應處理單元的請求,設定記憶體陣列的所有單一記憶體單元中的結束指標。
第一、第二與修改實施例可由熟習該項技術者依需求而結合。
本發明可被應用於一影像處理的裝置與方法,且影像資料可從攝影機、雷射讀取頭或網際網路取得。
本發明雖然以數個實施例來說明,熟習該項技藝者可認知到本發明可以在後附的申請專利範圍的精神與範圍內,以數種修改來實施,且本發明不受上述例子的限制。
此外,申請專利範圍不受上述實施例的限制。
再者,申請人意欲包括申請專利範圍所有元件的均等物,即使其之後在申請過程中被修改。
11‧‧‧處理單元
12‧‧‧記憶體單元
13‧‧‧具有記憶體單元之處理單元
14‧‧‧陣列
15‧‧‧匯流排系統
16‧‧‧暫存器
17‧‧‧控制單元
18‧‧‧單一外部記憶體
100‧‧‧單一指令多重資料處理器
200‧‧‧陣列
210‧‧‧群組
220‧‧‧處理單元
230‧‧‧記憶體
231‧‧‧資料
240‧‧‧結束指標設定單元
241‧‧‧資料輸出選擇器
250‧‧‧線
300‧‧‧匯流排系統
310‧‧‧暫存器
400‧‧‧控制單元
410‧‧‧指標評估裝置
420‧‧‧寫入方向指標評估單元
421‧‧‧比較器
422‧‧‧旗標暫存器
423‧‧‧開關
424‧‧‧輸出緩衝器
425‧‧‧比較器
426‧‧‧開關
427‧‧‧開關
430‧‧‧讀取方向指標評估單元
431‧‧‧比較器
432‧‧‧旗標暫存器
433‧‧‧選擇開關
434‧‧‧輸出緩衝器
435‧‧‧比較器
436‧‧‧開關
437‧‧‧開關
500‧‧‧單一記憶體
600‧‧‧結束指標
1001‧‧‧資料
1101‧‧‧資料
1102‧‧‧資料
1201‧‧‧中央處理單元
1202‧‧‧單一指令多重資料處理器
1203‧‧‧單一記憶體單元
1204‧‧‧匯流排系統
1205‧‧‧連線
1300‧‧‧控制單元
1302‧‧‧結束指標設定單元
本發明的態樣、優點與特徵藉由實施例的描述配合隨附的圖式將更明顯,其中:圖1顯示單一指令多重資料處理器的架構;圖2顯示一結束指標設定單元;圖3顯示一個例子,其中結束指標被加到儲存於各記憶體中的資料;圖4A顯示一個狀況,其中記憶體被分割為4位元組的節段,且9位元組的資料被儲存在記憶體中;圖4B顯示結束指標在資料流結尾被設定在一未對齊位置;圖4C顯示結束指標在資料流結尾被設定在一對齊位置;圖5顯示指標評估裝置的寫入方向指標評估單元;圖6A顯示旗標暫存器中旗標值的轉變;圖6B顯示旗標暫存器中旗標值的轉變;圖7顯示儲存在處理單元陣列中的資料;圖8顯示在各記憶體中結束指標已經被設定的資料;圖9顯示一流程圖,其由寫入方向指標評估單元420執行;圖10顯示一流程圖,其由寫入方向指標評估單元420執行;圖11顯示在傳送完成後,外部單一記憶體中的資料1001;圖12顯示指標評估裝置的讀取方向指標評估單元;圖13顯示選擇開關的運作; 圖14顯示外部記憶體中儲存的資料,以及輸出至處理單元陣列的資料1102;圖15顯示從單一外部記憶體傳送至處理單元陣列的資料;圖16顯示一可能的系統設計,其中具有例示性架構的單一指令多重資料處理器可以運作,圖17顯示一結束指標設定單元1302位於被放入控制單元1300中指標評估裝置410的旁邊的狀況;圖18顯示一個架構的結構,用以解釋非專利文獻1所呈現的,在記憶體陣列中資料分布均勻的情況下,內部記憶體陣列與單一外部記憶體之間的資料傳送。
100‧‧‧單一指令多重資料處理器
200‧‧‧陣列
210‧‧‧群組
220‧‧‧處理單元
230‧‧‧記憶體
231‧‧‧資料
240‧‧‧結束指標設定單元
241‧‧‧資料輸出選擇器
300‧‧‧匯流排系統
310‧‧‧暫存器
400‧‧‧控制單元
410‧‧‧指標評估裝置
420‧‧‧寫入方向指標評估單元
430‧‧‧讀取方向指標評估單元
500‧‧‧單一記憶體

Claims (7)

  1. 一種資料傳送裝置,包含:一處理單元陣列,包括以單一指令多重資料方式控制的多個處理單元;記憶體單元,提供於各處理單元內部,所有該些處理單元的記憶體單元的資料存取係平行地完成;一控制單元,以該單一指令多重資料方式控制該處理單元陣列;一匯流排系統,連接所有該些處理單元與該控制單元;一單一記憶體,與該處理單元陣列之該些記憶體單元交換資料;一結束指標設定單元,其負責在儲存於該些記憶體單元內的一資料流的結尾設定一結束指標;一寫入方向指標評估單元;以及一讀取方向指標評估單元,其中通過該匯流排系統從該處理單元陣列傳送資料至該單一記憶體時,在關於特定處理單元的該結束指標被偵測到的情況下,該寫入方向指標評估單元之工作為刪除從該特定處理單元所傳送的後續列中的資料,且當通過該匯流排系統從單一記憶體傳送資料至該處理單元陣列時,在關於特定處理單元的該結束指標被偵測到的情況下,該讀取方向指標評估單元之工作為針對該特定處理單元將資料插入後續列中。
  2. 如申請專利範圍第1項之資料傳送裝置,其中該結束指標設定單元係提供於各該處理單元內。
  3. 如申請專利範圍第1項之資料傳送裝置,其中該結束指標設定單元係提供於該控制單元內。
  4. 如申請專利範圍第1、2或3項之資料傳送裝置,其中該結束指標設定單元於一對齊位置或一未對齊位置加入該結束指標。
  5. 如申請專利範圍第1項之資料傳送裝置,其中該匯流排系統為一環狀匯流排。
  6. 如申請專利範圍第1項之資料傳送裝置,其中該單一記憶體為一外部記憶體。
  7. 一種資料傳送方法,其於一處理單元陣列與一單一記憶體之間平行處理地傳送資料,該處理單元陣列包含多個本身具有記憶體單元之處理單元,該資料傳送方法包含:通過一匯流排系統自該處理單元陣列傳送資料至該單一記憶體;以及通過一匯流排系統自該單一記憶體傳送資料至該處理單元陣列,其中通過該匯流排系統從該處理單元陣列傳送資料至該單一記憶體的狀況中;在儲存於該些記憶體單元內的一資料流的結尾設定一結束指標;通過該匯流排系統自該處理單元陣列傳送資料至該單一記憶體;偵測特定處理單元的該結束指標;當該特定處理單元的該結束指標被偵測到時,刪除從該特定處理單元所傳送的後續列中的資料,以及在通過該匯流排系統從該單一記憶體傳送資料至該處理單元陣列的狀況中;通過該匯流排系統自該單一記憶體傳送資料至該處理單元陣列;偵測特定處理單元的該結束指標;以及 當該特定處理單元的該結束指標被偵測到時,針對該特定處理單元將資料插入後續列中。
TW101122857A 2011-07-01 2012-06-26 單一指令多重資料處理器系統中在單一記憶體與具有不均勻分布資料量的記憶體陣列之間的指標引導資料傳送 TWI512614B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/065739 WO2013005343A1 (en) 2011-07-01 2011-07-01 Apparatus and method for a marker guided data transfer between a single memory and an array of memories with unevenly distributed data amount in an simd processor system

Publications (2)

Publication Number Publication Date
TW201319932A true TW201319932A (zh) 2013-05-16
TWI512614B TWI512614B (zh) 2015-12-11

Family

ID=44628820

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101122857A TWI512614B (zh) 2011-07-01 2012-06-26 單一指令多重資料處理器系統中在單一記憶體與具有不均勻分布資料量的記憶體陣列之間的指標引導資料傳送

Country Status (2)

Country Link
TW (1) TWI512614B (zh)
WO (1) WO2013005343A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675929B2 (ja) 1990-02-22 1994-09-28 オーツタイヤ株式会社 生タイヤの取扱装置
JPH0594425A (ja) 1991-10-01 1993-04-16 Nippon Telegr & Teleph Corp <Ntt> 多重リストを用いたタスク管理法
US6415366B1 (en) * 1999-06-02 2002-07-02 Alcatel Canada Inc. Method and apparatus for load distribution across memory banks with constrained access
WO2009013100A2 (en) 2007-07-20 2009-01-29 Basf Se Method of combating pollen beetles
WO2009131007A1 (ja) 2008-04-22 2009-10-29 日本電気株式会社 Simd型並列計算機システム、simd型並列計算方法及び制御プログラム
US20100123717A1 (en) * 2008-11-20 2010-05-20 Via Technologies, Inc. Dynamic Scheduling in a Graphics Processor
JP5221332B2 (ja) * 2008-12-27 2013-06-26 株式会社東芝 メモリシステム

Also Published As

Publication number Publication date
TWI512614B (zh) 2015-12-11
WO2013005343A1 (en) 2013-01-10

Similar Documents

Publication Publication Date Title
CN111159075B (zh) 数据传输方法和数据传输装置
US8631189B2 (en) Storage apparatus and storage system
US8554962B2 (en) Data transfer control device and data transfer control method
US20150261444A1 (en) Memory system and information processing device
JP2015529363A5 (zh)
US8046503B2 (en) DMA controller, system on chip comprising such a DMA controller, method of interchanging data via such a DMA controller
JP2001084229A (ja) Simd型プロセッサ
US7769965B2 (en) Data processing with data transfer between memories
CN101814011B (zh) Usb主机控制器以及用于usb主机控制器的控制方法
TWI512614B (zh) 單一指令多重資料處理器系統中在單一記憶體與具有不均勻分布資料量的記憶體陣列之間的指標引導資料傳送
JP2007052717A (ja) データ転送装置およびデータ転送方法
US7650440B2 (en) Peripheral supplied addressing in a simple DMA module
EP2183663B1 (en) Mass storage system with improved usage of buffer capacity
CN101520760B (zh) 通道装置、信息处理系统以及数据传送方法
US20110320677A1 (en) Data processing apparatus, data processing method, and storage medium
US20160070489A1 (en) Memory system
US20100005271A1 (en) Memory controller
KR101706201B1 (ko) 다이렉트 메모리 액세스 컨트롤러 및 그것의 동작 방법
JP5196946B2 (ja) 並列処理装置
US8937844B2 (en) Apparatus for generating write data and readout data
CN102469290A (zh) 摄像机图像传输装置
JP4451433B2 (ja) 並列プロセッサ
US20060112207A1 (en) Data transfer apparatus
US7987408B2 (en) Data buffering method
JP5093986B2 (ja) プロセッサ間通信方法及びプロセッサ間通信装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees