JP2023509818A

JP2023509818A - チップ、データ移行方法及び電子機器

Info

Publication number: JP2023509818A
Application number: JP2022527673A
Authority: JP
Inventors: 祥▲綸▼ 冷; 俊周; 文▲強▼ 王
Original assignee: 上海陣量智能科技有限公司
Priority date: 2020-12-10
Filing date: 2021-06-22
Publication date: 2023-03-10
Also published as: CN112506437A; WO2022121278A1

Abstract

本発明は、チップ、データ移行方法及び電子機器を提出する。上記チップは、少なくとも１つの処理コアと少なくとも１つのメモリパーティションとを含んでもよい。各メモリパーティションは、キャッシュシステム、内部メモリシステム及び直接メモリアクセス（ＤＭＡ）コントローラを含む。上記ＤＭＡコントローラは、上記キャッシュシステム及び上記内部メモリシステムにそれぞれ接続され、上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行う。【選択図】図２

Description

本発明は、コンピュータ技術に関し、具体的にチップ、データ移行方法及び電子機器に関する。
＜関連出願の相互引用＞
本願は、２０２０年１２月１０日に中国専利局へ提出された、出願番号が２０２０１１４５８６７６．７である中国特許出願の優先権を要求し、当該中国特許出願の全ての内容が引用によって本願に組み込まれる。

コンピュータ技術の迅速な発展につれ、各種のチップの演算能力は、徐々に高くなってきている。その一方、チップ演算能力の向上には、高いデータ移行効率が要求されている。

関連技術では、チップ内部のメモリパーティションにおいて第１記憶空間と第２記憶空間との間のデータ移行を行う必要があるときに、処理コアは、まず、データを第１記憶空間から読み出して当該処理コア内に記憶する必要がある。次に、当該処理コアは、記憶された当該データを読み出して第２記憶空間に書き込む。

これにより、関連技術において、メモリパーティション内部の異なる記憶空間の間でデータ移行を行うために、処理コアを使用せざるを得ないので、データ移行効率が低いことが分かる。

これに鑑みて、本発明は、チップを開示する。

上記チップは、少なくとも１つの処理コアと、少なくとも１つのメモリパーティションとを含み、メモリパーティションごとに、上記メモリパーティションは、キャッシュシステム、内部メモリシステム及び直接メモリアクセス（ＤＭＡ）コントローラを含み、上記ＤＭＡコントローラは、上記キャッシュシステム及び上記内部メモリシステムにそれぞれ接続され、上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行う。示された一実施例において、上記少なくとも１つの処理コアのうちの第１処理コアは、少なくとも１つの第１ＤＭＡコントローラへデータ移行指令を送信する。上記少なくとも１つの第１ＤＭＡコントローラは、少なくとも１つの第１メモリパーティションに含まれる。上記少なくとも１つの第１ＤＭＡコントローラは、上記データ移行指令に基づいて、上記少なくとも１つの第１メモリパーティション内部の異なる記憶空間の間のデータ移行を行う。

示された一実施例において、上記キャッシュシステムは、複数レベルのキャッシュを含み、上記ＤＭＡコントローラが上記キャッシュシステムの記憶空間と上記内部メモリシステム内の記憶空間との間のデータ移行を行うことは、上記ＤＭＡコントローラが上記最終レベルのキャッシュの記憶空間と上記内部メモリシステム内の記憶空間との間のデータ移行を行うことを含む。

示された一実施例において、上記最終レベルのキャッシュは、第１動作モードと第２動作モードと第３動作モードとの３種の動作モードをサポートし、第１動作モードでは、上記最終レベルのキャッシュの全部の記憶空間がキャッシュメモリとして配置され、第２動作モードでは、上記最終レベルのキャッシュの全部の記憶空間がスクラッチパッドメモリ（ＳＰＭ）として配置され、第３動作モードでは、上記最終レベルのキャッシュの一部の記憶空間がキャッシュメモリとして配置され、他の一部の記憶空間がＳＰＭとして配置される。

示された一実施例において、上記メモリパーティションは、モード配置器を更に含み、上記モード配置器は、ユーザ配置情報に基づいて、上記最終レベルのキャッシュの動作モードを配置する。

示された一実施例において、上記少なくとも１つの処理コアと上記ＤＭＡコントローラとは、メインネットワークオンチップを介して互いにアクセスし、又は、上記ＤＭＡコントローラ、上記キャッシュシステム及び上記内部メモリシステムは、サブネットワークオンチップを介して互いにアクセスする。

示された一実施例において、上記ＤＭＡコントローラが上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うことは、上記キャッシュシステムの異なる記憶空間の間のデータ移行と、上記内部メモリシステム内の異なる記憶空間の間のデータ移行と、上記キャッシュシステムの記憶空間と上記内部メモリシステム内の記憶空間との間のデータ移行とのうちの少なくとも１つを含む。

示された一実施例において、上記メモリパーティション中の異なる記憶空間の全部又は一部は、統合メモリアーキテクチャ（ＵＭＡ）を採用する。

示された一実施例において、上記第１処理コアが上記少なくとも１つの第１ＤＭＡコントローラへデータ移行指令を送信することは、上記第１処理コアが少なくとも１つの第２ＤＭＡコントローラへデータ移行指令をブロードキャストすることを含み、上記第２ＤＭＡコントローラは、上記異なる記憶空間の全部がＵＭＡを採用する第１メモリパーティションに含まれる。

示された一実施例において、上記データ移行指令は、データ移行タイプ、データ長、ソース記憶アドレス及び宛先記憶アドレスを含む。

示された一実施例において、上記データ移行指令は、第１フィールド、第２フィールド、第３フィールド及び第４フィールドを含み、上記第１フィールドは、上記データ移行タイプ及び上記データ長を示すために用いられ、上記第２フィールドは、上記ソース記憶アドレスの下位アドレスを示すために用いられ、上記第３フィールドは、上記ソース記憶アドレスの上位アドレス及び上記宛先記憶アドレスの上位アドレスを示すために用いられ、上記第４フィールドは、上記宛先記憶アドレスの下位アドレスを示すために用いられる。

示された一実施例において、上記ＤＭＡコントローラが上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うことは、上記メモリパーティション内の第１記憶空間からデータを読み取り、読み取られたデータを上記メモリパーティション内の第２記憶空間に書き込むことを含む。

示された一実施例において、上記内部メモリシステムは、高帯域幅メモリ（ＨＢＭ）である。

本発明は、チップに用いられるデータ移行方法を更に提出する。上記チップは、少なくとも１つの処理コアと、少なくとも１つのメモリパーティションとを含み、各メモリパーティションは、キャッシュシステム、内部メモリシステム、及び直接メモリアクセスＤＭＡコントローラを含み、上記方法は、メモリパーティションごとに、上記ＤＭＡコントローラを介して上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うステップを含む。

示された一実施例において、上記ＤＭＡコントローラを介して上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うステップは、上記少なくとも１つの処理コアのうちの第１処理コアを介して、少なくとも１つの第１メモリパーティションに含まれる少なくとも１つの第１ＤＭＡコントローラへデータ移行指令を送信することと、上記少なくとも１つの第１ＤＭＡコントローラが、上記データ移行指令に基づいて、上記少なくとも１つの第１メモリパーティション内部の異なる記憶空間の間のデータ移行を行うことと、を含む。

示された一実施例において、上記キャッシュシステムは、複数レベルのキャッシュを含み、上記ＤＭＡコントローラを介して上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うステップは、上記ＤＭＡコントローラを介して最終レベルのキャッシュの記憶空間と上記内部メモリシステム内の記憶空間との間のデータ移行を行うことを含む。

示された一実施例において、上記最終レベルのキャッシュは、第１動作モードと第２動作モードと第３動作モードとの３種の動作モードをサポートし、第１動作モードでは、上記最終レベルのキャッシュの全部の記憶空間がキャッシュメモリとして配置され、第２動作モードでは、上記最終レベルのキャッシュの全部の記憶空間がＳＰＭとして配置され、第３動作モードでは、上記最終レベルのキャッシュの一部の記憶空間がキャッシュメモリとして配置され、他の一部の記憶空間がＳＰＭとして配置される。

示された一実施例において、上記メモリパーティションは、モード配置器を更に含み、上記方法は、ユーザ配置情報に基づいて、上記モード配置器を介して、上記最終レベルのキャッシュの動作モードを配置するステップを更に含む。

示された一実施例において、上記少なくとも１つの処理コアと上記ＤＭＡコントローラとは、メインネットワークオンチップを介して互いにアクセスし、及び／又は、上記ＤＭＡコントローラ、上記キャッシュシステム及び上記内部メモリシステムは、サブネットワークオンチップを介して互いにアクセスする。

示された一実施例において、上記メモリパーティション内部の異なる記憶空間の間のデータ移行は、上記キャッシュシステムの異なる記憶空間の間のデータ移行と、上記内部メモリシステム内の異なる記憶空間の間のデータ移行と、上記キャッシュシステムの記憶空間と上記内部メモリシステム内の記憶空間との間のデータ移行とのうちの少なくとも１つを含む。

示された一実施例において、上記第１処理コアを介して上記少なくとも１つの第１ＤＭＡコントローラへ上記データ移行指令を送信することは、上記第１処理コアを介して少なくとも１つの第２ＤＭＡコントローラへデータ移行指令をブロードキャストすることを含み、上記第２ＤＭＡコントローラは、上記異なる記憶空間の全部が統合メモリアーキテクチャ（ＵＭＡ）を採用する第１メモリパーティションに含まれる。

示された一実施例において、上記ＤＭＡコントローラを介して上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うステップは、上記ＤＭＡコントローラを介して上記メモリパーティション内の第１記憶空間からデータを読み取り、読み取られたデータを上記メモリパーティション内の第２記憶空間に書き込むことを含む。

本発明は、電子機器を更に提出する。当該電子機器は、上記何れかの実施例に示すチップを備える。

上記技術案から分かるように、上記ＤＭＡコントローラが上記キャッシュシステム及び上記内部メモリシステムにそれぞれ接続され、且つ上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うため、上記チップのメモリアクセス帯域幅を占用せずに、上記データを制御して上記メモリパーティション内部の移行を完了させることができる。これにより、上記データ移行中において、当該チップ内部のメモリアクセス帯域幅が解放され、データ移行効率が高められ、チップ性能が向上する。

更に、上記処理コアが上記ＤＭＡコントローラへデータ移行指令を送信し、上記ＤＭＡが上記データ移行指令に応答して上記メモリパーティション中の異なる記憶空間の間のデータ移行を制御可能であるため、移行すべきデータについて上記メモリパーティション内部で移行を完了させることができる。これにより、当該チップ内部のメモリアクセス帯域幅が解放され、データ移行効率が高められ、チップ性能が向上する。

更に、上記チップがメモリパーティションデータ移行効率を向上可能であり、より高い性能を有するため、当該チップを使用することにより、計算タスクの処理効率の向上を支援することができ、電子機器の性能を向上させる。

上述した一般的な記述と後文の詳細記述が単に例示的なものと解釈的なものであり、本発明を制限するためのものではないことは、理解されるべきである。

本発明の１つ若しくは複数の実施例又は関連技術における技術案がより明瞭に説明されるように、以下では、実施例又は関連技術の記述に使用必要な図面を簡単に紹介する。明らかに、以下の記述に係る図面が単に本発明の１つ又は複数の実施例に記載の幾つかの実施例に過ぎず、当業者であれば、進歩性に値する労力を掛けずにこれらの図面から他の図面を取得可能である。
ＡＩチップの内部構造図である。本発明に示すチップの内部構造である。本発明に示すチップ構造図である。本発明に示すチップ構造図である。本発明に示すデータ移行指令の模式図である。本発明に示すデータ移行指令の模式図である。本発明に示すデータ移行方法の方法フローチャートである。

ここで、例示的な実施例を詳細に説明する。その例示は、図面に示される。以下の記述は、図面に係る際、別途示さない限り、異なる図面における同じ符号が同じ又は類似する要素を示す。以下の例示的な実施例に記述される実施形態が本発明と一致する全ての実施形態を代表するわけではない。逆に、それらは、単に添付する特許請求の範囲に詳細に記述されるような、本発明の幾つかの態様に一致する装置及び方法の例である。

本発明で使用される用語は、単に特定の実施例を記述する目的であり、本発明を制限するためのものではない。本発明及び添付する特許請求の範囲で使用される単数形式の「１種」、「上記」及び「当該」も、文脈から他の意味を明瞭で分かる場合でなければ、複数の形式を含むことを意図する。理解すべきことは、本文で使用される用語「及び／又は」が、１つ又は複数の関連する列挙項目を含む如何なる或いは全ての可能な組み合わせを指す。更に、本文で使用される言葉「場合」は、コンテキストに依存し、「…とき」や「…ときに」あるいは「特定の状況に応じて」として解釈されてもよい。

図１を参照すると、図１は、ＡＩチップの内部構造図である。

図１に示すように、ＡＩチップの処理コアは、メモリパーティションに接続され、上記メモリパーティションは、少なくとも内部メモリシステム及びキャッシュシステムを含む。

図１に示すＡＩチップにおいて、キャッシュシステムへ移行する必要がある一部のデータが内部メモリシステムにある場合に、まず、処理コアは、リードコマンドにより当該部分のデータを内部メモリシステムから読み出して当該処理コア内に記憶し、次に、当該処理コアは、ライトコマンドにより当該部分のデータを上記キャッシュシステムに書き込む。

このように、上記キャッシュシステムと上記内部メモリシステムとの間でデータ移行を行うには、少なくとも２回メモリアクセス帯域幅を占用する必要がある。これは、データ移行遅延を大きくするだけでなく、メモリアクセス帯域幅をプリエンプションし、チップ性能を大幅に低下させる。当業者であれば理解できるように、上記キャッシュシステムの内部及び当該内部メモリシステムの内部のデータ移行は、同様に上記問題が存在し、ここで詳しく説明しない。

これに鑑みて、本発明は、チップを提供する。当該チップは、メモリパーティションに、キャッシュシステム及び内部メモリシステムにそれぞれ接続されるＤＭＡ（ＤｉｒｅｃｔＭｅｍｏｒｙＡｃｃｅｓｓ、直接メモリアクセス）コントローラを追加することにより、上記ＤＭＡが上記メモリパーティション内部の異なる記憶空間の間のデータ移行指令を実行できるようにする。これにより、当該チップ内部のメモリアクセス帯域幅を解放し、データ移行効率を向上させ、チップ性能を向上させる。

以下では、このチップの内部構造について説明する。

図２を参照すると、図２は、本発明に示すチップの内部構造である。図２に示すように、上記チップは、以下を含む。

少なくとも１つの処理コア２１と少なくとも１つのメモリパーティション２２を含む。

各メモリパーティション２２は、キャッシュシステム２２１、内部メモリシステム２２２及びＤＭＡコントローラ２２３を含む。

上記ＤＭＡコントローラ２２３は、上記キャッシュシステム２２１及び上記内部メモリシステム２２２にそれぞれ接続され、上記メモリパーティション２２内部の異なる記憶空間の間のデータ移行を行う。

説明すべきことは、上記キャッシュシステム２２１と上記内部メモリシステム２２２との間のデータ移行を制御する場合に、上記キャッシュシステム２２１に含まれる最終レベルのキャッシュは、上記ＤＭＡコントローラ２２３に接続されてもよい。上記キャッシュシステム２２１の内部のデータ移行を制御する場合に、上記ＤＭＡコントローラ２２３は、対応するレベルのキャッシュに接続することができる。ここでは、特に限定されない。

実際の応用において、上記ＤＭＡコントローラは、上記メモリパーティション内の第１記憶空間からデータを読み取り、読み取られたデータを上記メモリパーティション内の第２記憶空間に書き込んでもよい。

例えば、上記第１記憶空間は、内部メモリシステムであり、上記第２記憶空間は、Ｌ２キャッシュである。上記ＤＭＡコントローラは、上記処理コアから送信されたデータ移行指令に応答し、上記内部メモリシステムと上記Ｌ２キャッシュとの間のデータ移行を制御してもよい。

説明すべきことは、１つのメモリパーティションは、１つ又は複数のＤＭＡコントローラを含んでもよい。例えば、メモリパーティションは、１つのＤＭＡコントローラを含み、当該メモリパーティション内の全ての記憶空間の間のデータ移行を担う。更に例えば、メモリパーティションは、複数のＤＭＡコントローラを含み、当該複数のＤＭＡコントローラのうちの各ＤＭＡコントローラは、メモリパーティションにおける一対又は複数対の記憶空間の間のデータ移行を担うことができる。複数のメモリパーティションが存在するときに、本発明は、これらのＤＭＡコントローラの具体的な位置を限定しない。例えば、ＤＭＡコントローラは、各メモリパーティションに分散して位置してもよく、そのうちの１つのメモリパーティションに集中して位置してもよい。

上記チップは、具体的に、任意の高いメモリアクセス帯域幅を必要とするチップであってもよい。実際の応用において、上記チップは、マルチチャネルのＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ダイナミックランダムアクセスメモリ）を搭載したチップであってもよい。

例えば、上記チップは、ＣＰＵ、ＤＳＰ、ＭＣＵなどであってもよい。一実施例において、上記チップは、人工知能アルゴリズムを実行してもよい。例えば、上記チップは、ＡＩニューラルネットワークチップ（例えば、ＦＰＧＡ、ＴＰＵ等）又はＧＰＵグラフィック処理チップであってもよい。

上記処理コアは、一般的にチップ内の計算コアであり、コード演算を実行し、１つ又は複数の処理ユニットを含んでもよい。例えば、上記処理コアは、一般的に開発者によって作成されたプログラムコードに基づいて、上記メモリパーティションでデータ移行を行ってもよい。

実際の応用において、上記メモリパーティション内部の記憶空間の間のデータ移行は、一般的に、上記メモリパーティション内のキャッシュシステムの内部データの移行、上記メモリパーティション内の内部メモリシステムの内部データの移行、及び上記メモリパーティションにおける最終レベルのキャッシュと内部メモリシステムとの間のデータ移行を含んでもよい。

上記メモリパーティションは、一般的にデータを記憶するために用いられる。

実際の応用において、一般的に、チップは、記憶階層を有するメモリパーティションを採用する。ここで、上記メモリパーティションは、１レベル又は複数レベルのキャッシュを有するキャッシュシステム及び内部メモリシステムを含んでもよい。

例えば、引き続き図２を参照すると、上記キャッシュシステム２２１は、少なくともＬ１、Ｌ２及びＬ３キャッシュを含んでもよい。その際、処理コア２１は、データを取得する必要があるとき、一般的にまずＬ１キャッシュにアクセスする。当該Ｌ１キャッシュに上記処理コア２１に必要なデータが記憶されている場合に、上記処理コア２１は、今回のデータ取得を完了する。当該Ｌ１キャッシュに上記処理コア２１に必要なデータが記憶されていない場合に、上記処理コア２１は、上記Ｌ２キャッシュにアクセスし続けて必要なデータを取得する。これによって類推する。上記最終レベルのキャッシュ即ちＬ３キャッシュにも処理コア２１に必要なデータがないときに、上記処理コア２１は、引き続き上記内部メモリシステム２２２からデータを取得する。

上記例から分かりやすいように、チップ性能は、キャッシュヒット率（ＣＨＣＨＥＨＩＴ）に大きく依存する。キャッシュヒット率を向上させるために、現在、チップにおいて開発者によって直接に管理され得る大容量キャッシュを提供し、それによりキャッシュヒット率を向上させる。

通常、上記キャッシュシステムが複数レベルのキャッシュを含む場合、最終レベルのキャッシュは、上記大容量キャッシュとしてもよく、上記ＤＭＡコントローラは、上記最終レベルのキャッシュの記憶空間と上記内部メモリシステム内の記憶空間との間のデータ移行を行う。

キャッシュシステムの少なくとも一部の記憶空間は、スクラッチパッドメモリ（ＳｃｒａｔｃｈｐａｄＭｅｍｏｒｙ、ＳＰＭ）として配置されたとき、この部分の記憶空間のデータ移行効率へ影響を与える。一実施例において、データ移行効率を向上させるために、最終レベルのキャッシュの少なくとも一部の記憶空間は、ＳＰＭとして配置される。

その際、データ移行を行うときに、上記ＤＭＡコントローラは、上記最終レベルのキャッシュ中のＳＰＭとして配置される記憶空間と上記内部メモリシステムとの間のデータ移行を行う。ＤＭＡコントローラを介して上記最終レベルのキャッシュ中のＳＰＭとして配置される記憶空間と上記内部メモリシステムとの間のデータ移行を行うことにより、移行されたデータが処理コアを通過することを回避することができるため、それにより帯域幅を解放し、データ移行経路を短縮し、データ移行効率を向上させる。

一実施例において、様々な業務シーンに柔軟に適用するために、上記キャッシュシステムの最終レベルのキャッシュが３種類の動作モードをサポートする。第１動作モードでは、上記最終レベルのキャッシュの全ての記憶空間がキャッシュメモリとして配置され、第２動作モードでは、上記最終レベルのキャッシュの全ての記憶空間がＳＰＭとして配置され、第３動作モードでは、上記最終レベルのキャッシュの一部の記憶空間がキャッシュメモリとして配置され、他の一部の記憶空間がＳＰＭとして配置される。

このような方式により、開発者は、需要に応じて上記最終レベルのキャッシュを柔軟に配置することができ、それにより上記チップの適用性を向上させる。

説明すべきことは、最終レベルのキャッシュを動的に設定することを実現するために、実施例において、上記メモリパーティションは、更にモード配置器を含んでもよい。

上記モード配置器は、ユーザ配置情報に基づいて、上記キャッシュシステムにおける最終レベルのキャッシュの動作モードを設定する。

実際の応用において、開発者は、ユーザ配置情報に基づいて、上記モード配置器により、上記最終レベルのキャッシュの動作モードを設定してもよい。

例えば、マルチチップカスケード分散型トレーニングシステムのシーンにおいて、チップ間の通信が高容量、低遅延を必要とするため、上記最終レベルのキャッシュの全ての内部メモリ空間をＳＰＭとして配置してもよい。

更に例えば、性能に対する要求が高くないアルゴリズム開発のシーンにおいて、開発者の間で最終レベルのキャッシュを管理する必要がないため、上記最終レベルのキャッシュの全ての記憶空間をキャッシュメモリとして配置してもよい。

更に例えば、データ伝送効率を必要とするだけでなく、データの再利用率も重視するシーンにおいて、ＡＩ演算パラメータを記憶するために、上記最終レベルのキャッシュの一部の記憶空間をキャッシュメモリとして配置し、他の一部の記憶空間をＳＰＭとして配置してもいい。

上記内部メモリシステムは、グローバル内部メモリシステムであってもよい。例えば、ＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ダイナミックランダムアクセスメモリ）、ＳＤＲＡＭ（ｓｙｎｃｈｒｏｎｏｕｓｄｙｎａｍｉｃｒａｎｄｏｍ－ａｃｃｅｓｓｍｅｍｏｒｙ）等であってもよい。

一実施例において、メモリアクセス帯域幅を向上させるために、上記グローバル内部メモリシステムは、高帯域メモリ（ＨｉｇｈＢａｎｄｗｉｄｔｈＭｅｍｏｒｙ、ＨＢＭ）であってもよい。

説明すべきことは、上記チップ内部は、バス又はＮＯＣ（ｎｅｔｗｏｒｋ－ｏｎ－ｃｈｉｐ、ネットワークオンチップ）アーキテクチャを採用可能であり、実際の需要に応じて設定されてもよい。関連技術において、図３を参照すると、図３は、本発明に示すチップ構造図である。図３に示すように、上記ＤＭＡコントローラ、少なくとも１つの処理コア及び少なくとも１つのメモリパーティションは、バスを介して互いに接続される。

その際、メモリパーティション内部の内部メモリシステムがＬ２キャッシュへデータを移行する必要があると仮定する場合、処理コアは、上記ＤＭＡコントローラへデータ移行指令を送信することにより、ＤＭＡコントローラにデータ移行を完了させる。

しかし、上記チップ構造において、ＤＭＡコントローラを介してチップの処理コアの動作負担を解放したとしても、上記データは、移行過程において、まず内部メモリシステムから処理コアへ流れ、次にＬ２キャッシュへ流れる必要がある。このように、上記チップ構造を採用すると、データ移行がメモリアクセス帯域幅をプリエンプションしてデータ移行効率が低いという問題が依然として存在する。

上記問題を解決するために、図２に示すように、本発明において上記ＤＭＡコントローラが上記メモリパーティション内に内蔵されることにより、ＤＭＡコントローラが上記データを制御することができるようにする。これにより、上記チップのメモリアクセス帯域幅をプリエンプションすることなく、上記メモリパーティション内部に移行を完了することができる。

上記技術案から分かるように、上記ＤＭＡコントローラは、上記キャッシュシステム及び上記内部メモリシステムにそれぞれ接続され、且つ上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うため、上記データを制御することができ、それにより、上記チップのメモリアクセス帯域幅をプリエンプションせず、上記メモリパーティション内部に移行を完了することができ、更に上記データ移行過程において、当該チップ内部のメモリアクセス帯域幅を解放し、データ移行効率を高め、チップ性能を向上させる。

一実施例において、上記少なくとも１つの処理コアのうちの第１処理コアは、少なくとも１つの第１ＤＭＡコントローラに接続され、少なくとも１つの第１ＤＭＡコントローラは、少なくとも１つの第１メモリパーティションに含まれ、上記第１メモリパーティションは、上記メモリパーティションの全部又は一部であってもよい。

上記第１処理コアは、上記少なくとも１つの第１ＤＭＡコントローラへデータ移行指令を送信する。

上記少なくとも１つのＤＭＡコントローラは、上記データ移行指令に基づいて、上記少なくとも１つの第１メモリパーティション内部の異なる記憶空間の間のデータ移行を行う。

引き続き図２を参照すると、上記ＤＭＡコントローラは、上記第１処理コアに接続される。上記接続方式は、バス方式の接続であってもよい。

一実施例において、チップ性能を更に向上させるために、上記ＤＭＡコントローラ及び上記処理コアは、メインネットワークオンチップ（ＮＯＣ、ｎｅｔｗｏｒｋ－ｏｎ－ｃｈｉｐ）を介して互いにアクセスしてもよい。

上記メインネットワークオンチップは、上記チップ内のメインネットワークであってもよい。上記チップが複数の処理コア及び複数のメモリパーティションを含むときに、上記複数の処理コアと上記複数のメモリパーティション内のＤＭＡコントローラとは、上記メインネットワークオンチップを介して互いにアクセスしてもよい。

引き続き図２を参照すると、上記ＤＭＡコントローラは、上記キャッシュシステム及び上記内部メモリシステムにそれぞれ接続される。上記接続方式は、バス方式の接続であってもよい。

一実施例において、チップ性能を更に向上させるために、上記ＤＭＡコントローラ、上記キャッシュシステム及び上記内部メモリシステムは、サブネットワークオンチップを介して互いにアクセスする。

上記サブネットワークオンチップは、上記メモリパーティション内のサブネットワークであってもよい。上記チップが複数のメモリパーティションを含むときに、上記複数のメモリパーティションは、何れも上記サブネットワークオンチップを採用してもよい。これにより、各メモリパーティション内のＤＭＡコントローラ、キャッシュシステム及び内部メモリシステムは、上記サブネットワークオンチップ（ＮＯＣ、ｎｅｔｗｏｒｋ－ｏｎ－ｃｈｉｐ）を介して互いにアクセスすることができる。

単一メモリパーティション（キャッシュシステム及び内部メモリシステムを含む）の帯域幅及び容量が限られているため、メモリアクセス帯域幅及びチップ容量を向上させるために、一実施例において、上記チップは、一般的に複数のメモリパーティションを含んでもよい。これらのメモリパーティションは、並列に処理コアに接続されてもよい。

図４を参照すると、図４は、本発明に示すチップ構造図である。図４に示すように、上記チップは、複数の処理コア及び複数のメモリパーティションを含む。説明すべきことは、メモリパーティションには、キャッシュシステムにおける最終レベルのキャッシュのみが示され、他のレベルのキャッシュが図４に示されていない。

上記チップ内の複数の処理コアと複数のメモリパーティションとは、上記メインネットワークオンチップを介して互いにアクセスしてもよい。

上記方式を採用すると、マルチメモリパーティションの並列接続を実現する。これにより、メモリアクセス帯域幅及びチップ容量を拡張する。

上記状況、即ち上記チップは複数のメモリパーティションを含む場合、開発者によるプログラミングを容易にするために、上記複数のメモリパーティションは、何れも統合メモリアーキテクチャ（ＵＭＡ、ＵｎｉｆｉｅｄＭｅｍｏｒｙＡｒｃｈｉｔｅｃｔｕｒｅ）を採用する。

実際の応用において、上記複数のメモリパーティションにおける最終レベルのキャッシュは、ＵＭＡを採用してもよい。上記複数のメモリパーティションにおける内部メモリシステムは、ＵＭＡを採用してもよい。

このような方式により、開発者にとって、異なる最終レベルのキャッシュの間の有効なアドレス（ｅｆｆｅｃｔｉｖｅａｄｄｒｅｓｓ）が同じであり、異なる内部メモリシステムの間の有効なアドレスも同じである。したがって、各最終レベルのキャッシュ、又は、各内部メモリシステムにデータを書き込むときに、１つのアドレスを入力すればよく、複数の最終レベルのキャッシュ又は複数の内部メモリシステムに対してそれぞれデータを書き込む必要がなく、開発者のプログラミング効率を向上させ、データの記憶効率も向上させる。

各処理コアは、１つ又は複数のＤＭＡコントローラへそれぞれデータ移行指令を送信してもよく、幾つかの実施例において、ＤＭＡコントローラに対する呼び出しオーバーヘッドを低減するために、上記処理コアは、上記少なくとも１つのメモリパーティション中の少なくとも１つのＤＭＡコントローラへデータ移行指令をブロードキャストしてもよい。

実際の応用において、メモリパーティション内でデータ移行を行う必要があるときに、処理コアは、上記複数のメモリパーティション内のＤＭＡコントローラへデータ移行指令をブロードキャストして送信してもよい。

例えば、チップは、８つのメモリパーティションを含んでもよいと仮定する。上記８つのメモリパーティションのうち、４つのメモリパーティションの最終レベルのキャッシュ（最終レベルのキャッシュがＬ２キャッシュであると仮定する）と、上記複数のメモリパーティション内の内部メモリシステムは、何れもＵＭＡを採用してもよい。

上記状況において、内部メモリシステムから８ＭのデータをＬ２キャッシュに移行する必要があるときに、実際には、各メモリパーティション内で１メガのデータの移行を完了する必要がある。その際、処理コアは、上記ＵＭＡを採用している４つのメモリパーティション内のＤＭＡコントローラへデータ移行指令をブロードキャストして送信してもよい。一方では、ＵＭＡを採用していない４つのメモリパーティション内のＤＭＡコントローラへデータ移行指令をそれぞれ送信してもよい。

上記各ＤＭＡコントローラは、データ移行指令を受信した後、内部メモリシステムの上記データ移行指令で示された記憶位置から１メガのデータを抽出し、上記１メガのデータをＬ２キャッシュの上記データ移行指令で示された記憶位置に移行することにより、データ移行を完了してもよい。

処理コアは、ＵＭＡを採用した複数のメモリパーティション内のＤＭＡコントローラへデータ移行指令をブロードキャストして送信することにより、各メモリパーティション内部のデータ移行を完了してもよい。したがって、処理コアのＤＭＡコントローラへの呼び出し回数を減少させ、それによりＤＭＡコントローラに対する呼び出しオーバーヘッドを低減する。

一実施例において、上記チップに含まれる複数の上記ＤＭＡコントローラは、同じメモリパーティションに集中して位置し、且つそれぞれ各メモリパーティションに含まれる内部メモリシステム及びキャッシュシステムと一対一に対応してもよい。

その際、当該複数のＤＭＡコントローラを介してデータ移行を行う必要があるときに、上記メモリパーティション内の複数のＤＭＡコントローラへデータ移行指令をブロードキャストして送信することにより、各メモリパーティション内の異なる記憶空間の間のデータ移行を完了してもよい。

以下では、本発明のデータ移行指令に対する改良を紹介する。本発明において、ＤＭＡコントローラに対する呼び出しオーバーヘッドを更に低減するために、全く新たなフォーマットのＤＭＡコントローラに対するデータ移行指令を提出する。当該データ移行指令は、データ移行指令フィールドの数を減少させ、且つ各フィールドで示される意味を合理的に設定することにより、データ移行指令の長さを減少させ、ＤＭＡコントローラに対する呼び出しオーバーヘッドを低減する。

関連技術において、ＤＭＡコントローラに対するデータ移行指令は、６つのフィールドを含み、それぞれデータ移行タイプフィールド、データ長フィールド、最終レベルのキャッシュの下位アドレスフィールド、最終レベルのキャッシュの上位アドレスフィールド、内部メモリシステム下位アドレスフィールド及び内部メモリシステム上位アドレスフィールドである。

このように、関連技術におけるデータ移行指令は、比較的に冗長であり、ＤＭＡコントローラを呼び出すときに、ＤＭＡコントローラへ長いデータ移行指令を送信する必要がある。これにより、ＤＭＡコントローラに対する呼び出しオーバーヘッドを増加させる。

この問題を解決するために、一実施例において、上記データ移行指令は、少なくともデータ移行タイプ、データ長、ソース記憶アドレス及び宛先記憶アドレスを含んでもよい。

上記データ移行タイプは、具体的に、データ移行方向を示す。一実施例において、上記データ移行タイプは、メモリパーティション内のデータ流れ方向を示してもよい。具体的に、上記データ流れ方向（データ移行タイプ）は、以下の４種類のうちのいずれか１種類を含んでもよい。

即ち、上記メモリパーティション内のキャッシュシステムの内部データの移行、上記メモリパーティションにおける内部メモリシステムの内部データの移行、上記メモリパーティションにおける最終レベルのキャッシュから内部メモリシステムへのデータ移行、及び上記メモリパーティションにおける内部メモリシステムから最終レベルのキャッシュへのデータ移行である。

実際の応用において、上記４種類のデータ流れ方向を４種類の識別子に対応付け、且つ実際にＤＭＡコントローラを呼び出すときに、上記４種類の識別子を上記データ移行タイプに書き込んでもよい。これにより、ＤＭＡコントローラは、今回のデータ移行のデータ流れ方向を識別することができる。

上記データ長は、具体的に、伝送する必要があるデータ量の大きさを示す。理解できるように、データ量の大きさが記憶空間と対応関係を有するため、当該データの記憶空間における開始位置を知ると、当該データのデータ長に基づいて、当該データの記憶空間における終了位置を取得することができる。

上記ソース記憶アドレスは、具体的に、移行すべきデータの現在記憶位置の開始アドレスを指す。例えば、データが内部メモリシステムから最終レベルのキャッシュに移行された場合に、上記ソース記憶アドレスは、データの上記内部メモリシステムにおける開始位置となる。

上記宛先記憶アドレスは、具体的に、移行すべきデータが移行された後の記憶位置の開始アドレスを指す。例えば、データが内部メモリシステムから最終レベルのキャッシュに移行された場合に、上記宛先記憶アドレスは、データが上記最終レベルのキャッシュへ移行された開始位置となる。

理解できるように、ＤＭＡコントローラは、データ移行指令を受信した後、上記データ移行指令におけるソース記憶アドレスフィールド及びデータ長に基づいてソース記憶空間を特定してもよく、上記データ移行指令における宛先記憶アドレスフィールド及びデータ長に基づいて宛先記憶空間を特定してもよく、更に、上記データ移行指令におけるデータ移行タイプに基づいてソース記憶空間のデータを宛先記憶空間に移行してもよい。

図５を参照すると、図５は、本発明に示すデータ移行指令の模式図である。図５に示すように、上記データ移行指令は、第１フィールド、第２フィールド、第３フィールド及び第４フィールドを含む。

上記第１フィールドは、データ移行タイプ及びデータ長を示すフィールドである。

上記第２フィールドは、ソース記憶アドレスの下位アドレスを示すフィールドである。

上記第３フィールドは、ソース記憶アドレスの上位アドレスと宛先記憶アドレスの上位アドレスと示すフィールドである。

上記第４フィールドは、宛先記憶アドレスの下位アドレスを示すフィールドである。

ここで、説明すべきことは、上記データ移行指令中の各フィールドの順番、及び各フィールド中の異なる意味を示すデータビットの位置は、実際の状況に応じて調整されてもよく、ここで限定されない。

００００（バイナリ）が、データがキャッシュシステムの内部で移行されることを指示し、０００１（バイナリ）が、データが内部メモリシステムの内部で移行されることを指示し、００１０（バイナリ）が、データが内部メモリシステムから最終レベルのキャッシュに移行されることを指示し、００１１（バイナリ）が、データが最終レベルのキャッシュから内部メモリシステムに移行されることを指示すると仮定する。

上記状況において、内部メモリシステムの下位アドレス０ｘ３ＥＡＢ＿００００（１６進数）、上位アドレス０ｘＡＢ＿００（１６進数）から、２メガのデータを最終レベルのキャッシュの下位アドレス０ｘ３Ｅ５Ｂ＿００００（１６進数）、上位アドレス０ｘＣＤ＿００（１６進数）に移行すると仮定する。

その際、チップの処理コアは、ＤＭＡコントローラへのデータ移行指令を作成するときに、００１０を第１フィールドの前４ビットに書き込み、２メガをバイナリに変換して上記第１フィールドの後２８ビットに書き込んでもよい。その後、上記処理コアは、上記内部メモリシステムの下位アドレス０ｘ３ＥＡＢ＿００００をバイナリに変換して上記第２フィールドに書き込み、且つ上記内部メモリシステムの上位アドレス０ｘＡＢ＿００をバイナリに変換して上記第３フィールドの後１６ビットに書き込んでもよい。最後に、上記処理コアは、上記最終レベルのキャッシュの上位アドレス０ｘＣＤ＿００を上記第３フィールドの前１６ビットに書き込み、且つ上記最終レベルのキャッシュの下位アドレス０ｘ３Ｅ５Ｂ＿００００をバイナリに変換して上記第４フィールドに書き込んでもよい。

上記処理コアは、上記データ移行指令の構造を完了した後、当該データ移行指令ブロードキャストを各ＤＭＡコントローラに送信してもよい。これにより、各ＤＭＡコントローラは、上記データ移行指令に応答し、上記内部メモリシステムの下位アドレス０ｘ３ＥＡＢ＿００００、上位アドレス０ｘＡＢ＿００から、２メガのデータを上記最終レベルのキャッシュの下位アドレス０ｘ３Ｅ５Ｂ＿００００、上位アドレス０ｘＣＤ＿００に移行する。

以上から分かるように、上記データ移行指令が少なくともデータ移行タイプ及びデータ長フィールド、ソース記憶アドレスフィールド及び宛先記憶アドレスフィールドを含んでもよいため、ＤＭＡコントローラを呼び出すときに、ＤＭＡコントローラに対する呼び出しオーバーヘッドを低減することができる。

実施例において、関連技術に示されたデータ移行指令における６つのフィールドの合併を採用することにより、データ移行指令に含まれるフィールド数を減少させてもよい。

実際の応用において、データ移行タイプに必要なビット数が少なく、１つのフィールド（３２ビット）を占用すると浪費になってしまうため、データ移行タイプとデータ長を１つのフィールドに統合することができる。最終レベルのキャッシュは、一般的に総容量が小さい（例えば、数メガ）ため、最終レベルのキャッシュの下位アドレスフィールドと上位アドレスフィールドを１つのフィールドに統合してもよい。

図６を参照すると、図６は、本発明に示すデータ移行指令の模式図である。図６に示すように、上記データ移行指令は、少なくとも第１フィールド、第２フィールド、第３フィールド及び第４フィールドを含む。

ここで、上記第１フィールドは、データ移行タイプ及びデータ長を示すフィールドである。

上記第２フィールドは、最終レベルのキャッシュの記憶アドレスを示すフィールドである。

上記第３フィールドは、内部メモリシステムを示す下位アドレスフィールドである。

上記第４フィールドは、内部メモリシステムを示す上位アドレスフィールドである。

説明すべきことは、上記データ移行指令における各フィールドの順番、及び各フィールドにおける異なる意味を示すデータビットの位置は、実際の状況に応じて調整されてもよく、ここで限定しない。

上記第１フィールドで示される意味は、上記実施例を参照すればよく、ここで詳しく説明しない。

上記第２フィールドは、最終レベルのキャッシュの記憶空間の開始アドレスを示す。データが最終レベルのキャッシュから内部メモリシステムに移行されると、第１フィールドが示すときに、上記第２フィールドで示された記憶アドレスは、データの現在記憶位置の開始位置となる。データが内部メモリシステムから最終レベルのキャッシュに移行されると、第１フィールドが示すときに、上記第２フィールドで示された記憶アドレスは、データが移行された後の記憶位置の開始位置となる。

上記第３フィールド及び上記第４フィールドで示される意味は、上記実施例を参照すればよく、ここで詳しく説明しない。

以上から分かるように、上記データ移行指令が４つのみのフィールドを含むため、ＤＭＡコントローラを呼び出すときに、ＤＭＡコントローラに対する呼び出しオーバーヘッドを低減することができる。

それ相応に、本発明は、チップに用いられるデータ移行方法を更に提出する。当該方法では、メモリパーティションに内蔵されたＤＭＡコントローラへデータ移行指令を処理コアを介して配信することにより、上記ＤＭＡコントローラが、上記処理コアから発されたデータ移行指令に応答し、移行する必要のあるデータが上記メモリパーティション内部で移行を完了することができるようにする。これにより、当該チップ内部のメモリアクセス帯域幅を解放し、データ移行効率を高め、チップ性能を向上させる。

図７を参照すると、図７は、本発明に示す、チップに用いられるデータ移行方法の方法フローチャートである。図７に示すように、上記方法は、以下のステップを含んでもよい。

Ｓ７０２では、上記処理コアは、上記ＤＭＡコントローラへデータ移行指令を送信する。

Ｓ７０４では、上記ＤＭＡコントローラは、上記データ移行指令に基づいて、上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行う。

上記チップは、上記いずれかの実施例に示すチップ構造を有するチップであってもよい。一実施例において、上記チップは、図２に示すチップ構造を採用してもよい。図２に示すように、上記チップは、少なくとも１つの処理コアと、少なくとも１つのメモリパーティションとを含む。上記メモリパーティションは、キャッシュシステム、内部メモリシステム及びＤＭＡコントローラを含む。上記ＤＭＡコントローラは、上記キャッシュシステム及び内部メモリシステムにそれぞれ接続される。

説明すべきことは、実際の応用において、上記メモリパーティションが、１レベル又は複数レベルのキャッシュを有するキャッシュシステム、少なくとも１つの内部メモリシステム、及び１つ又は複数のＤＭＡコントローラを含んでもよく、ここで特に限定されない。

一実施例において、上記チップは、人工知能アルゴリズムを実行してもよい。例えば、上記チップは、ＡＩニューラルネットワークチップ又はＧＰＵグラフィック処理チップであってもよい。

上記処理コアは、一般的にチップ内の計算コアであり、コード演算を実行する。例えば、上記処理コアは、一般的に、開発者によって作成されたプログラムコードに基づいて、上記メモリパーティションでデータ移行を行ってもよい。

実際の応用において、上記メモリパーティション内部の記憶空間の間のデータ移行は、通常、上記メモリパーティション内のキャッシュシステムの内部データの移行、上記メモリパーティション内の内部メモリシステムの内部データの移行、及び、上記メモリパーティションにおける最終レベルのキャッシュと内部メモリシステムとの間のデータ移行を含んでもよい。

実際の応用において、一般的にチップは、記憶階層を有するメモリパーティションを採用する。上記メモリパーティションは、１レベル又は複数レベルのキャッシュを有するキャッシュシステム及び内部メモリシステムを含んでもよい。

例えば、図２を参照すると、上記キャッシュシステムは、少なくともＬ１、Ｌ２及びＬ３キャッシュを含んでもよい。その際、処理コアがデータを取得する必要があるときに、一般的にまずＬ１キャッシュにアクセスする。当該Ｌ１キャッシュに上記処理コアに必要なデータが記憶されている場合に、上記処理コアは、今回のデータ取得を完了する。当該Ｌ１キャッシュに上記処理コアに必要なデータが記憶されていない場合に、上記処理コアは、上記Ｌ２キャッシュにアクセスし続けて必要なデータを取得する。これによって類推する。上記最終レベルのキャッシュ即ちＬ３キャッシュにも処理コアに必要なデータに係らない場合に、上記処理コアは、引き続き上記内部メモリシステムからデータを取得する。

上記例から分かりやすいように、チップ性能は、キャッシュヒット率（ＣＨＣＨＥＨＩＴ）に大きく依存する。一方で、キャッシュヒット率を向上させるために、現在、チップにおいて開発者によって直接に管理され得る大容量キャッシュを提供し、それによりキャッシュヒット率を向上させる。

一般的に、上記キャッシュシステムが複数レベルのキャッシュを含むときに、最終レベルのキャッシュは、上記大容量キャッシュとすることができ、上記ＤＭＡコントローラは、上記最終レベルのキャッシュの記憶空間と上記内部メモリシステム内の記憶空間との間のデータ移行を行う。

キャッシュシステムの少なくとも一部の記憶空間がＳＰＭとして配置されたときに、この部分の記憶空間のデータ移行効率に影響を与える。一実施例において、データ移行効率を向上させるために、最終レベルのキャッシュの少なくとも一部の記憶空間は、ＳＰＭとして配置される。

その際、データ移行を行うときに、上記ＤＭＡコントローラは、上記最終レベルのキャッシュにおけるＳＰＭとして配置される記憶空間と上記内部メモリシステムとの間のデータ移行を行う。ＤＭＡコントローラを介して上記最終レベルのキャッシュにおけるＳＰＭとして配置される記憶空間と上記内部メモリシステムとの間のデータ移行を行うように配置されるため、移行されたデータが処理コアを通過することを回避することができ、それにより帯域幅を解放し、データ移行経路を短縮し、データ移行効率を向上させる。

一実施例において、複数種の業務シーンに柔軟に適用するために、上記キャッシュシステムの最終レベルのキャッシュが３種の動作モードをサポートする。第１動作モードでは、上記最終レベルのキャッシュの全部の記憶空間がキャッシュメモリとして配置され、第２動作モードでは、上記最終レベルのキャッシュの全部の記憶空間がＳＰＭとして配置され、第３動作モードでは、上記最終レベルのキャッシュの一部の記憶空間がキャッシュメモリとして配置され、他の一部の記憶空間がＳＰＭとして配置される。

説明すべきことは、最終レベルのキャッシュを動的に設定することを実現するために、一実施例において、上記メモリパーティションは、更にモード配置器を含んでもよい。

上記モード配置器は、ユーザ配置情報に基づいて、上記キャッシュシステムにおける最終レベルのキャッシュの動作モードを配置する。

実際の応用において、開発者は、ユーザ配置情報に基づいて、上記モード配置器により、上記最終レベルのキャッシュの動作モードを配置してもよい。

例えば、マルチチップカスケード分散型トレーニングシステムのシーンにおいて、チップ間の通信が高容量、低遅延を必要とするため、上記最終レベルのキャッシュの全ての記憶空間をＳＰＭとして配置してもよい。

更に例えば、データ伝送効率を必要とするだけでなく、データの再利用率も重視するシーンにおいて、ＡＩ演算パラメータを記憶するために、上記最終レベルのキャッシュの一部の記憶空間をキャッシュメモリとして配置し、且つ一部の記憶空間をＳＰＭとして配置してもいい。

上記内部メモリシステムは、グローバル内部メモリシステムであってもよい。例えば、ＤＲＡＭ、ＳＤＲＡＭ等であってもよい。

一実施例において、メモリアクセス帯域幅を向上させるために、上記グローバル内部メモリシステムは、ＨＢＭであってもよい。

上記ＤＭＡコントローラは、上記メモリパーティション内部の異なる記憶空間の間のデータ移行を行う。

上記データ移行指令は、具体的に、上記メモリパーティション内部の記憶空間の間のデータ移行をトリガするために用いられる。

本発明において、上記データ移行指令は、チップの処理コアにより構成され且つＤＭＡコントローラへ送信されることにより、ＤＭＡコントローラがデータ移行を完了するように制御することができる。

上記メモリパーティション内部の記憶空間の間でデータ移行を行う必要があるときに、上記処理コアは、上記ＤＭＡコントローラへデータ移行指令を送信する。

上記ＤＭＡコントローラは、上記データ移行指令を受信した後、上記データ移行指令に応答し、上記メモリパーティション内部の記憶空間の間のデータ移行を制御してもよい。

上記技術案から分かるように、上記処理コアが上記ＤＭＡコントローラへデータ移行指令を送信し、上記ＤＭＡコントローラが上記データ移行指令に応答し、上記メモリパーティション内の異なる記憶空間の間のデータ移行を制御可能であるため、移行する必要があるデータを上記メモリパーティション内部で移行可能であり、それにより当該チップ内部のメモリアクセス帯域幅を解放し、データ移行効率を高め、チップ性能を向上させる。

一実施例において、上記チップは、複数のメモリパーティションを含む可能性があり、各メモリパーティション内でデータ移行を完了するために、上記処理コアは、上記複数のメモリパーティション内のＤＭＡコントローラへそれぞれデータ移行指令を送信してもよい。これにより、各ＤＭＡコントローラは、自身が位置するメモリパーティション内部のデータ移行を制御することができる。

例えば、チップは、４つのメモリパーティションを含むと仮定する。データが内部メモリシステムから最終レベルのキャッシュに移行する必要があると仮定し、チップに４つのメモリパーティションが存在するため、上記処理コアは、上記４つのメモリパーティション内のＤＭＡコントローラへそれぞれデータ移行指令を送信してもよい。上記４つのメモリパーティション内のＤＭＡコントローラは、データ移行指令を受信した後、自身の位置するメモリパーティション内部のデータ移行を制御してもよい。

一実施例において、上記チップが複数のメモリパーティションを含むときに、開発者によるプログラミングを容易にするために、上記複数のメモリパーティションは、何れもＵＭＡを採用する。

開発者によるプログラミングを容易にするために、上記複数のメモリパーティションのうちの最終レベルのキャッシュ、及び上記複数のメモリパーティション内の内部メモリシステムは、何れもＵＭＡを採用してもよい。

実際の応用において、上記複数のメモリパーティションにおける最終レベルのキャッシュは、ＵＭＡを採用してもよい。上記複数のメモリパーティションにおける内部メモリシステムもＵＭＡを採用してもよい。

このような方式により、開発者にとって、異なる最終レベルのキャッシュの間の有効なアドレスが同じであり、異なる内部メモリシステムの間の有効なアドレスも同じである。したがって、各最終レベルのキャッシュ、又は、各内部メモリシステムへデータを書き込むときに、１つのみのアドレスを入力すればよく、複数の最終レベルのキャッシュ又は複数の内部メモリシステムに対してそれぞれデータを書き込む必要がなく、開発者のプログラミング効率を向上させ、データ記憶効率も向上させる。

ＤＭＡコントローラに対する呼び出しオーバーヘッドを低減するために、上記処理コアは、上記少なくとも１つのメモリパーティション中の少なくとも１つのＤＭＡコントローラへデータ移行指令をブロードキャストする。

例えば、チップが４つのメモリパーティションを含み、且つ上記４つのメモリパーティションにおける最終レベルのキャッシュ（最終レベルのキャッシュがＬ２キャッシュであると仮定する）と、上記複数のメモリパーティション内の内部メモリシステムとが何れもＵＭＡを採用可能であると仮定する。

上記状況において、内部メモリシステムから８ＭのデータをＬ２キャッシュに移行する必要があるときに、実際には、各メモリパーティション内で２メガのデータの移行を完了する必要がある。その際、処理コアは、上記複数のメモリパーティション内のＤＭＡコントローラへデータ移行指令をブロードキャストして送信してもよい。

上記４つのメモリパーティション内のＤＭＡコントローラは、データ移行指令を受信した後、内部メモリシステムの上記データ移行指令で示された記憶位置から２メガのデータを抽出し、上記２メガのデータをＬ２キャッシュの上記データ移行指令で示された記憶位置に移行し、それによりデータ移行を完了してもよい。

処理コアは、上記４つのメモリパーティション内のＤＭＡコントローラへデータ移行指令をブロードキャストして送信することで各メモリパーティション内部のデータ移行を完了可能であるため、処理コアのＤＭＡコントローラへの呼び出し回数を減少させ、それによりＤＭＡコントローラに対する呼び出しオーバーヘッドを低減する。

関連技術において、ＤＭＡコントローラへのデータ移行指令は、６つのフィールドを含み、それぞれデータ移行タイプフィールド、データ長フィールド、最終レベルのキャッシュの下位アドレスフィールド、最終レベルのキャッシュの上位アドレスフィールド、内部メモリシステム下位アドレスフィールド及び内部メモリシステム上位アドレスフィールドである。

このように、関連技術におけるデータ移行指令は、比較的に冗長であり、ＤＭＡコントローラを呼び出すときに、ＤＭＡコントローラへ長いデータ移行指令を送信する必要があり、それによりＤＭＡコントローラに対する呼び出しオーバーヘッドを増加させる。

上記データ移行タイプは、具体的にデータ移行方向を示す。一実施例において、上記データ移行タイプは、メモリパーティション内のデータ流れ方向を示してもよい。具体的に、上記データ流れ方向（データ移行タイプ）は、以下の４種類のうちのいずれかを含んでもよい。

実際の応用において、上記４種類のデータ流れ方向を４種類の識別子に対応付け、且つ実際にＤＭＡコントローラを呼び出すときに、上記４種類の識別子を上記データ移行タイプに書き込んでもよい。これにより、ＤＭＡコントローラは、今回のデータ移行のデータ流れ方向を識別してもよい。

上記データ長は、具体的に伝送する必要があるデータ量の大きさを示す。理解できるように、データ量の大きさが記憶空間と対応関係を有するため、当該データの記憶空間における開始位置を知ると、当該データのデータ長に基づいて、当該データの記憶空間における終了位置を取得することができる。

上記ソース記憶アドレスは、具体的に移行すべきデータの現在記憶位置の開始アドレスを示す。例えば、データが内部メモリシステムから最終レベルのキャッシュに移行された場合に、上記ソース記憶アドレスは、データの上記内部メモリシステムにおける開始位置となる。

上記宛先記憶アドレスは、具体的に移行すべきデータが移行された後の記憶位置の開始アドレスを指す。例えば、データが内部メモリシステムから最終レベルのキャッシュに移行された場合に、上記宛先記憶アドレスは、データが上記最終レベルのキャッシュに移行された開始位置となる。

理解できるように、ＤＭＡコントローラは、データ移行指令を受信した後、上記データ移行指令におけるソース記憶アドレスフィールド及びデータ長に基づいてソース記憶空間を特定してもよく、上記データ移行指令における宛先記憶アドレスフィールド及びデータ長に基づいて宛先記憶空間を特定してもよく、更に、上記データ移行指令におけるデータ移行タイプに基づいて、ソース記憶空間のデータを宛先記憶空間に移行してもよい。

上記第３フィールドは、ソース記憶アドレスの上位アドレスと宛先記憶アドレスの上位アドレスとを示すフィールドである。

前記第４フィールドは、宛先記憶アドレスの下位アドレスを示すフィールドである。

説明すべきことは、上記データ移行指令における各フィールドの順番、及び各フィールドにおける異なる意味を指示するデータビットの位置は、実際の状況に応じて調整されてもよく、ここで限定しない。

００００（バイナリ）は、データがキャッシュシステムの内部で移行されることを指示し、０００１（バイナリ）は、データが内部メモリシステムの内部で移行されることを指示し、００１０（バイナリ）は、データが内部メモリシステムから最終レベルのキャッシュに移行されることを指示し、００１１（バイナリ）は、データが最終レベルのキャッシュから内部メモリシステムに移行されることを指示する。

上記処理コアは、上記データ移行指令の構造を完了した後、当該データ移行指令を各ＤＭＡコントローラへブロードキャストして送信してもよい。これにより、各ＤＭＡコントローラは、上記データ移行指令に応答し、上記内部メモリシステムの下位アドレス０ｘ３ＥＡＢ＿００００、上位アドレス０ｘＡＢ＿００から、２兆のデータを上記最終レベルのキャッシュシステムの下位アドレス０ｘ３Ｅ５Ｂ＿００００、上位アドレス０ｘＣＤ＿００に移行する。

以上から分かるように、上記データ移行指令が少なくともデータ移行タイプ及びデータ長フィールド、ソース記憶アドレスフィールド並びに宛先記憶アドレスフィールドを含んでもよいため、ＤＭＡコントローラを呼び出すときに、ＤＭＡコントローラに対する呼び出しオーバーヘッドを低減することができる。

一実施例において、関連技術に示されたデータ移行指令における６つのフィールドの合併を採用することにより、データ移行指令に含まれるフィールド数を減少させてもよい。

図６を参照すると、図６は、本発明に示すデータ移行指令模式図である。図６に示すように、上記データ移行指令は、少なくとも第１フィールド、第２フィールド、第３フィールド及び第４フィールドを含む。

上記第３フィールドは、内部メモリシステムの下位アドレスを示すフィールドである。

上記第４フィールドは、内部メモリシステムの上位アドレスを示すフィールドである。

説明すべきことは、上記データ移行指令における各フィールドの順番、及び各フィールドにおける異なる意味を示すデータビットの位置が実際の状況に応じて調整されてもよく、ここで限定されない。

上記第１フィールドで示される意味は、上記実施例を参照してもよく、ここで詳しく説明しない。

上記第２フィールドは、最終レベルのキャッシュの記憶空間の開始アドレスを示す。第１フィールドがデータに対して最終レベルのキャッシュから内部メモリシステムへ移行するよう指示するときに、上記第２フィールドで示される記憶アドレスは、データ現在記憶位置の開始位置となる。第１フィールドがデータに対して内部メモリシステムから最終レベルのキャッシュへ移行するよう指示するときに、上記第２フィールドで示される記憶アドレスは、データが移行された後の記憶位置の開始位置となる。

上記第３フィールド及び上記第４フィールドで示される意味は、上記実施例を参照してもよく、ここで詳しく説明しない。

以上のように、上記データ移行指令が４つのみのフィールドを含むため、ＤＭＡコントローラを呼び出すときに、ＤＭＡコントローラに対する呼び出しオーバーヘッドを低減することができる。

例えば、当該電子機器は、携帯電話等のスマート端末、又は、カメラヘッドを有して画像処理を行うことができる他の機器であってもよい。例示として、当該電子機器は、収集された画像を取得したときに、画像を処理してもよい。処理過程は、本発明の実施例のチップを用いて計算タスクを実行してもよい。

上記チップがメモリパーティションのデータ移行効率を向上させることができ、より高い性能を有するため、当該チップを用いると、計算タスクの処理効率の向上を支援することができ、電子機器性能を向上させる。

当業者であれば理解できるように、本発明の１つ又は複数の実施例は、方法、システム又はコンピュータプログラム製品として提供され得る。したがって、本発明の１つ又は複数の実施例は、１００％ハードウェアの実施例、１００％ソフトウェアの実施例、又はソフトウェアとハードウェアとを組み合わせた態様の実施例の形式を採用してもよい。また、本発明の１つ又は複数の実施例は、１つ又は複数の、コンピュータ利用可能なプログラムコードを含むコンピュータ利用可能な記憶媒体（磁気ディスクメモリ、光学メモリ等を含むが、それらに限定されない）で実施されるコンピュータプログラム製品の形式を採用してもよい。

本発明に記載の「及び／又は」は、両者のうちの１つを少なくとも含むことを表す。例えば、「Ａ及び／又はＢ」は、Ａ、Ｂ、及び「ＡとＢ」という３つの形態を含む。

本発明における各実施例は、何れも漸進の方式で記述され、各実施例は、他の実施例との相違点を重点的に説明し、各実施例同士の同じ又は類似する部分が互いに参照すればよい。特にデータ処理機器の実施例は、方法実施例に基本的に類似するため、記述が相対的に簡単であり、関連箇所が方法実施例の部分の説明を参照すればよい。

以上は、本発明の特定の実施例について記述した。他の実施例は、添付する特許請求の範囲のスコープ内に含まれる。幾つかの場合において、特許請求の範囲に記載の挙動又はステップは、実施例における順番と異なる順番で実行可能であり、且つ依然として所望の結果を得ることができる。また、図面に描かれた手順は、示された特定の順番又は連続順番でないと所望の結果を得られないことを要求するとは限らない。幾つかの実施形態において、マルチタスク処理及び並行処理も、実行可能であり、又は有利なものである。

本発明に記述されたテーマ及び機能操作の実施例は、デジタル電子回路、有形的に体現されたコンピュータソフトウェア若しくはファームウェア、本発明に開示された構造及びその構造の均等物を含むコンピュータハードウェア、又はそれらのうちの１つ又は複数の組み合わせにおいて実現され得る。本発明に記述されたテーマの実施例は、１つ又は複数のコンピュータプログラム、即ち、有形の非一時的なプログラムキャリア上にコーディングされることでデータ処理装置によって実行され又はデータ処理装置の操作を制御されるコンピュータプログラム指令における１つ又は複数のモジュールとして実現され得る。代替的に又は追加的に、プログラム指令は、人工で生成された伝送信号、例えば機器で生成された電気、光又は電磁的信号にコーディングされてもよい。当該信号は、生成されることで情報を符号化して適切な受信機装置へ伝送されてデータ処理装置に実行させる。コンピュータ記憶媒体は、機器読み取り可能な記憶機器、機器読み取り可能な記憶基板、ランダム若しくはシリアルアクセスメモリ機器、又はそれらのうちの１つ又は複数の組み合わせであってもよい。

本発明に記述された処理及び論理フローは、１つ又は複数のコンピュータプログラムを実行する１つ又は複数のプログラマブルコンピュータによって実施されて、入力データに応じて操作を行って出力を生成して対応する機能を実行させてもよい。前記処理及び論理フローは、専用論理回路、例えばＦＰＧＡ（フィールドプログラマブルゲートアレイ）又はＡＳＩＣ（特定用途向け集積回路）によって実行されてもよく、装置も専用論理回路として実現されてもよい。

コンピュータプログラムの実行に適するコンピュータは、例えば、汎用及び／又は専用マイクロプロセッサ、又は如何なる他のタイプの中央処理装置を含む。通常、中央処理装置は、読み出し専用メモリ及び／又はランダムアクセスメモリから指令及びデータを受信する。コンピュータの基本ユニットは、指令を実施や実行するための中央処理装置と、指令及びデータを記憶するための１つ又は複数のメモリ機器とを備える。通常、コンピュータは、更に、データを記憶するための１つ又は複数の大容量記憶機器、例えば、磁気ディスク、光磁気ディスク又は光ディスク等を含み、又は、コンピュータは、この大容量記憶機器に操作可能にカップリングされてそれからデータを受信したりそれへデータを伝送したりし、又は、２種の状況を兼ね備える。しかし、コンピュータは、このような機器を必ず有するとは限らない。また、コンピュータは、別の機器、例えば、携帯電話、パーソナルデジタルアシスタント（ＰＤＡ）、モバイルオーディオ又はビデオプレーヤ、ゲームコンソール、全地球測位システム（ＧＰＳ）受信機、又は、例えばユニバーサルシリアルバス（ＵＳＢ）フラッシュメモリドライバの携帯型記憶機器に組み込まれてもよい。以上は、単に幾つかの例である。

コンピュータプログラム指令及びデータを記憶するのに適するコンピュータ可読媒体は、あらゆる形態の不揮発性メモリ、メディアとメモリ機器を含み、例えば、半導体メモリ機器（例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭとフラッシュメモリ機器）、磁気ディスク（例えば、内部ハードディスク又はリムーバブルディスク）、光磁気ディスク及び０ｘＣＤ＿００ＲＯＭとＤＶＤ－ＲＯＭディスクを含む。プロセッサとメモリは、専用論理回路によって補充され又は専用論理回路に統合されてもよい。

本発明が大量の具体的な実施詳細を含むが、これらの詳細は、如何なる開示範囲又は保護請求される範囲を制限するとは解釈されるべきではなく、主に特定の開示された具体的な実施例の特徴を記述するために用いられる。本発明の内在の複数の実施例に記述された幾つかの特徴は、単一の実施例において組み合わせて実施されてもよい。その一方、単一の実施例に記述された各種の特徴は、複数の実施例に分けて実施され、又は、如何なる適切なサブ組み合わせとして実施されてもよい。また、特徴が上記のように幾つかの組み合わせにおいて役割を果たし、ひいてはこのように保護するように要求されてもよいが、保護請求される組み合わせからの１つ又は複数の特徴は、幾つかの場合において当該組み合わせから除去されてもよく、更に、保護請求される組み合わせは、サブ組み合わせ又はサブ組み合わせの変形を指してもよい。

類似的に、図面に特定の順番で操作が描かれたが、これらの操作が示された特定の順番で実行され又は順に実行され又は全ての例示の操作が実行されて所望の結果を得ることを要求するとして理解されるべきではない。幾つかの場合に、マルチタスク及び並行処理は、有利である可能性がある。また、上記実施例における各種のシステムモジュールとユニットの分離は、全ての実施例においてこのような分離を必要とすると理解されるべきではない。更に、理解できるように、記述されるプログラムユニット及びシステムは、通常、単一のソフトウェア製品に統合されてもよく、又は複数のソフトウェア製品としてカプセル化されてもよい。

このように、テーマの特定実施例が記述された。他の実施例は、添付する特許請求の範囲のスコープ内に含まれる。幾つかの場合において、特許請求の範囲に記載の動作は、異なる順番で実行可能であり、且つ依然として所望の結果を得ることができる。また、図面に描かれた処理が必ずしも示された特定の順番又は連続順番で所望の結果を得るとは限らない。幾つかの実施形態において、マルチタスク処理及び並行処理は、有利である可能性がある。

上述したのは、本発明の１つ又は複数の実施例の好適な実施例に過ぎず、本発明の１つ又は複数の実施例を制限するためのものではない。本発明の１つ又は複数の実施例の精神及び原則内でなされた如何なる変更、均等物による置換、改良等も、本発明の１つ又は複数の実施例の保護範囲内に含まれるべきである。

Claims

チップであって、
少なくとも１つの処理コアと、少なくとも１つのメモリパーティションとを含み、
メモリパーティションごとに、
前記メモリパーティションは、キャッシュシステム、内部メモリシステム及び直接メモリアクセス（ＤＭＡ）コントローラを含み、
前記ＤＭＡコントローラは、前記キャッシュシステム及び前記内部メモリシステムにそれぞれ接続され、前記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うことを特徴とするチップ。
前記ＤＭＡコントローラが前記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うことは、
前記キャッシュシステムの異なる記憶空間の間のデータ移行と、
前記内部メモリシステム内の異なる記憶空間の間のデータ移行と、
前記キャッシュシステムの記憶空間と前記内部メモリシステム内の記憶空間との間のデータ移行とのうちの少なくとも１つを含むことを特徴とする請求項１に記載のチップ。
前記キャッシュシステムは、複数レベルのキャッシュを含み、
前記ＤＭＡコントローラが前記キャッシュシステムの記憶空間と前記内部メモリシステム内の記憶空間との間のデータ移行を行うことは、前記ＤＭＡコントローラが最終レベルのキャッシュの記憶空間と前記内部メモリシステム内の記憶空間との間のデータ移行を行うことを含むことを特徴とする請求項２に記載のチップ。
前記最終レベルのキャッシュは、第１動作モードと第２動作モードと第３動作モードとの３種の動作モードをサポートし、
第１動作モードでは、前記最終レベルのキャッシュの全部の記憶空間がキャッシュメモリとして配置され、
第２動作モードでは、前記最終レベルのキャッシュの全部の記憶空間がスクラッチパッドメモリ（ＳＰＭ）として配置され、
第３動作モードでは、前記最終レベルのキャッシュの一部の記憶空間がキャッシュメモリとして配置され、他の一部の記憶空間がＳＰＭとして配置されることを特徴とする請求項３に記載のチップ。
前記メモリパーティションは、ユーザ配置情報に基づいて前記最終レベルのキャッシュの動作モードを配置するためのモード配置器を更に含むことを特徴とする請求項４に記載のチップ。
前記少なくとも１つの処理コアと前記ＤＭＡコントローラとは、メインネットワークオンチップを介して互いにアクセスし、又は、
前記ＤＭＡコントローラ、前記キャッシュシステム及び前記内部メモリシステムは、サブネットワークオンチップを介して互いにアクセスすることを特徴とする請求項１～５の何れか一項に記載のチップ。
前記メモリパーティション中の異なる記憶空間の全部又は一部は、統合メモリアーキテクチャ（ＵＭＡ）を採用することを特徴とする請求項１～６の何れか一項に記載のチップ。
前記少なくとも１つの処理コアのうちの第１処理コアは、少なくとも１つの第１メモリパーティションに含まれる少なくとも１つの第１ＤＭＡコントローラへデータ移行指令を送信し、
前記少なくとも１つの第１ＤＭＡコントローラは、前記データ移行指令に基づいて、前記少なくとも１つの第１メモリパーティション内部の異なる記憶空間の間のデータ移行を行うことを特徴とする請求項１～７の何れか一項に記載のチップ。
前記第１処理コアが前記少なくとも１つの第１ＤＭＡコントローラへデータ移行指令を送信することは、前記第１処理コアが少なくとも１つの第２ＤＭＡコントローラへデータ移行指令をブロードキャストすることを含み、前記第２ＤＭＡコントローラは、前記異なる記憶空間の全部がＵＭＡを採用する第１メモリパーティションに含まれることを特徴とする請求項８に記載のチップ。
前記データ移行指令は、データ移行タイプ、データ長、ソース記憶アドレス及び宛先記憶アドレスを含むことを特徴とする請求項８又は９に記載のチップ。
前記データ移行指令は、第１フィールド、第２フィールド、第３フィールド及び第４フィールドを含み、
前記第１フィールドは、前記データ移行タイプ及び前記データ長を示すために用いられ、
前記第２フィールドは、前記ソース記憶アドレスの下位アドレスを示すために用いられ、
前記第３フィールドは、前記ソース記憶アドレスの上位アドレス及び前記宛先記憶アドレスの上位アドレスを示すために用いられ、
前記第４フィールドは、前記宛先記憶アドレスの下位アドレスを示すために用いられることを特徴とする請求項１０に記載のチップ。
前記ＤＭＡコントローラが前記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うことは、
前記メモリパーティション内の第１記憶空間からデータを読み取り、読み取られたデータを前記メモリパーティション内の第２記憶空間に書き込むことを含むことを特徴とする請求項１～１１の何れか一項に記載のチップ。
前記内部メモリシステムは、高帯域幅メモリ（ＨＢＭ）であることを特徴とする請求項１～１２の何れか一項に記載のチップ。
チップに用いられるデータ移行方法であって、
前記チップは、少なくとも１つの処理コアと、少なくとも１つのメモリパーティションとを含み、各メモリパーティションは、キャッシュシステム、内部メモリシステム及び直接メモリアクセス（ＤＭＡ）コントローラを含み、
前記データ移行方法は、メモリパーティションごとに、前記ＤＭＡコントローラを介して前記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うステップを含むことを特徴とするデータ移行方法。
前記キャッシュシステムは、複数レベルのキャッシュを含み、
前記ＤＭＡコントローラを介して前記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うステップは、
前記ＤＭＡコントローラを介して最終レベルのキャッシュの記憶空間と前記内部メモリシステム内の記憶空間との間のデータ移行を行うことを含むことを特徴とする請求項１４に記載のデータ移行方法。
ユーザ配置情報に基づいて前記最終レベルのキャッシュの動作モードを配置するステップを更に含むことを特徴とする請求項１５に記載のデータ移行方法。
前記ＤＭＡコントローラを介して前記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うステップは、
前記少なくとも１つの処理コアのうちの第１処理コアを介して、少なくとも１つの第１メモリパーティションに含まれる少なくとも１つの第１ＤＭＡコントローラへデータ移行指令を送信することと、
前記少なくとも１つの第１ＤＭＡコントローラが、前記データ移行指令に基づいて、前記少なくとも１つの第１メモリパーティション内部の異なる記憶空間の間のデータ移行を行うことと、を含むことを特徴とする請求項１４～１６の何れか一項に記載のデータ移行方法。
前記第１処理コアを介して前記少なくとも１つの第１ＤＭＡコントローラへ前記データ移行指令を送信することは、前記第１処理コアを介して少なくとも１つの第２ＤＭＡコントローラへデータ移行指令をブロードキャストすることを含み、
前記第２ＤＭＡコントローラは、前記異なる記憶空間の全部が統合メモリアーキテクチャ（ＵＭＡ）を採用する第１メモリパーティションに含まれることを特徴とする請求項１７に記載のデータ移行方法。
前記ＤＭＡコントローラを介して前記メモリパーティション内部の異なる記憶空間の間のデータ移行を行うステップは、
前記ＤＭＡコントローラを介して前記メモリパーティション内の第１記憶空間からデータを読み取り、読み取られたデータを前記メモリパーティション内の第２記憶空間に書き込むことを含むことを特徴とする請求項１４～１８の何れか一項に記載のデータ移行方法。
請求項１から１３の何れか一項に記載のチップを備えることを特徴とする電子機器。