JP6177418B2 - ステートマシンエンジンによって受信されるデータを提供するための方法及び装置 - Google Patents

ステートマシンエンジンによって受信されるデータを提供するための方法及び装置 Download PDF

Info

Publication number
JP6177418B2
JP6177418B2 JP2016501291A JP2016501291A JP6177418B2 JP 6177418 B2 JP6177418 B2 JP 6177418B2 JP 2016501291 A JP2016501291 A JP 2016501291A JP 2016501291 A JP2016501291 A JP 2016501291A JP 6177418 B2 JP6177418 B2 JP 6177418B2
Authority
JP
Japan
Prior art keywords
data
state machine
machine engine
data stream
data lines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016501291A
Other languages
English (en)
Other versions
JP2016515266A (ja
JP2016515266A5 (ja
Inventor
アール. ブラウン,デイビッド
アール. ブラウン,デイビッド
ビー. ノイズ,ハロルド
ビー. ノイズ,ハロルド
エス. ベインズ,インダージット
エス. ベインズ,インダージット
Original Assignee
マイクロン テクノロジー, インク.
マイクロン テクノロジー, インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マイクロン テクノロジー, インク., マイクロン テクノロジー, インク. filed Critical マイクロン テクノロジー, インク.
Publication of JP2016515266A publication Critical patent/JP2016515266A/ja
Publication of JP2016515266A5 publication Critical patent/JP2016515266A5/ja
Application granted granted Critical
Publication of JP6177418B2 publication Critical patent/JP6177418B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4027Coupling between buses using bus bridges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7867Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/448Execution paradigms, e.g. implementations of programming paradigms
    • G06F9/4498Finite state machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Logic Circuits (AREA)
  • Multi Processors (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Information Transfer Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Debugging And Monitoring (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)

Description

[関連出願の参照]
本願は、2013年3月15日に出願された米国特許出願第61/788,364号の非仮出願である。
[技術分野]
本発明の実施形態は、概して電子デバイスに関し、より詳細には、ある実施形態においては、データ解析のための並列デバイスを有する電子デバイスに関する。
複雑なデータ解析(例えば、パターン認識)は、従来のフォンノイマンベースコンピュータ上で実施するために非効率的である場合がある。しかしながら、生物学的脳、特に人の脳は、複雑なデータ解析の実施に熟練している。最新の研究では、人の脳が新皮質においてヒエラルキー的に組織化された一連のニューロン層を利用してデータ解析を実施することが示唆されている。ヒエラルキーのより下層にあるニューロンが、例えば、感覚器官からの「生信号」を解析し、一方で、より上層にあるニューロンが、より低いレベルのニューロンからの信号出力を解析する。新皮質におけるこのヒエラルキーシステムは、ことによると脳の他の区域と組み合わさって、空間推論、意識的思考及び複雑な言語などの高レベル機能を人が実施することを可能にする複雑なデータ解析を達成する。
コンピューティングの分野においては、例えば、パターン認識タスクはますます困難なものになっている。コンピュータ間でますます大量のデータが伝送され、ユーザが検出を望むパターン数は増加している。例えば、スパムまたはマルウェアはしばしば、データストリーム内でパターン、例えば、特定の句またはコードの一部を検索することによって検出される。新規パターンが新規変形を検索するために実装され得るにつれて、パターン数は、スパム及びマルウェアの多様性とともに増加する。これらのパターンの各々に対してデータストリームを検索することは、コンピューティングボトルネックを形成する場合がある。しばしば、データストリームが受信されると、それは一度に1つずつ各パターンに対して検索される。システムがデータストリームの次の部分を検索するために準備するまでの遅延は、パターン数とともに増大する。したがって、パターン認識は、データの受領を遅延させる場合がある。
ハードウェアは、パターン用のデータストリームを検索するために設計されてきたが、このハードウェアは、しばしば、任意の期間において十分なデータ量を処理することができない。データストリームを検索するように構成された幾つかのデバイスは、複数の回路間でデータストリームを分配することによって、十分なデータ量を処理する。回路は、データストリームがパターンの一部にマッチするか否かを各々判定する。しばしば、多数の回路がパラレルに動作して、各々がほぼ同時にデータストリームを検索する。しかしながら、生物学的脳以上に効率的に複雑なデータ解析を実施することが可能なシステムは存在しなかった。そのようなシステムの開発が望ましい。
本発明の種々の実施形態に従う、ステートマシンエンジンを有するシステムの一実施例を図示する。 本発明の種々の実施形態に従う、図1のステートマシンエンジンの有限ステートマシン(FSM)ラチスの一実施例を図示する。 本発明の種々の実施形態に従う、図2のFSMラチスのブロックの一実施例を図示する。 本発明の種々の実施形態に従う、図3のブロックの行の一実施例を図示する。 本発明の種々の実施形態に従う、図4の行のうちの2のグループの一実施例を図示する。 本発明の種々の実施形態に従う、有限ステートマシングラフの一実施例を図示する。 本発明の種々の実施形態に従う、FSMラチスで実現された2レベルヒエラルキーの一実施例を図示する。 本発明の種々の実施形態に従う、コンパイラが図2のFSMラチスのプログラミング用のバイナリファイルへとソースコードを変換するための方法の一実施例を図示する。 本発明の種々の実施形態に従う、ステートマシンエンジンを図示する。 本発明の種々の実施形態に従う、デバイスがランクにおいて配列された複数の物理的なステートマシンエンジンの一実施例を図示する。 本発明の種々の実施形態に従う、ステートマシンエンジンに提供されるデータブロックにグループ化されたデータセグメントの一実施例を図示する。 本発明の種々の実施形態に従う、図11のデータブロックのデータセグメント間に挿入されるデータパディングの一実施例を図示する。 本発明の種々の実施形態に従う、図12のデータブロックのデータセグメントの後ろに挿入されるデータパディングの一実施例を図示する。 本発明の種々の実施形態に従う、ステートマシンエンジンのデータバッファシステムに伝送するように組織化された図13のデータブロックの一実施例を図示する。 本発明の種々の実施形態に従う、デバイスがランクにおいて配列されており、インターランク(IR)バス及びプロセスバッファインターフェイスによってともに結合された複数の物理的なステートマシンエンジンの一実施例を図示する。 本発明の種々の実施形態に従う、複数の物理的なステートマシンエンジンに結合されたIRバス及びプロセスバッファインターフェイスにおける信号の一実施例を図示する。 本発明の種々の実施形態に従う、IRバス及びプロセスバッファインターフェイスにおける信号のタイミング図の一実施例を図示する 本発明の種々の実施形態に従う、複数の論理グループに組織化された複数の物理的なステートマシンエンジンのデータバッファに格納されたデータの一実施例を図示する。 本発明の種々の実施形態に従う、複数の論理グループに組織化された複数の物理的なステートマシンエンジンのプロセスバッファに格納されたデータの一実施例を図示する。 本発明の種々の実施形態に従う、1つの論理グループに組織化された複数の物理的なステートマシンエンジンのデータバッファに格納されたデータの一実施例を図示する。 本発明の種々の実施形態に従う、1つの論理グループに組織化された複数の物理的なステートマシンエンジンのプロセスバッファに格納されたデータの一実施例を図示する。
ここで図面を参照する。図1は、参照数字10で概して示されるプロセッサベースシステムの実施形態を図示する。システム10(例えば、データ解析システム)は、例えば、デスクトップコンピュータ、ラップトップコンピュータ、ページャ、携帯電話、パーソナルオーガナイザ、ポータブル音声プレイヤ、制御回路、カメラなどの様々なタイプのうちの任意のものであってもよい。システム10は、さらに、ルータ、サーバまたは(例えば、前述のタイプのコンピュータのいずれかの)クライアントなどのネットワークノードであってもよい。システム10は、コピー機、スキャナ、プリンタ、ゲーム機、テレビ、セットトップビデオ配信もしくは録画システム、ケーブルボックス、パーソナルデジタルメディアプレイヤ、工場オートメーションシステム、乗用車コンピュータシステム、または医療デバイスなどの、幾つかの他の種類の電子デバイスであってもよい。(本明細書中に使用される多くの他の用語と同様に、これらの種々のシステムの実施例を記述するために使用される用語は、幾つかの指示物を共有し、それゆえ、記載された他の品目があるからという理由で狭義に解釈されるべきではない。)
システム10などの典型的なプロセッサベースデバイスにおいては、マイクロプロセッサなどのプロセッサ12が、システム10におけるシステム機能及び要求の処理を制御する。さらに、プロセッサ12は、システム制御を共有する複数のプロセッサを備えてもよい。プロセッサ12がシステム10内部または外部に格納され得る命令を実行することによってシステム10を制御するように、プロセッサ12は、システム10内の各々の構成要素に直接的に結合されてもよいし、間接的に結合されてもよい。
本明細書に記述する実施形態に従い、システム10は、ステートマシンエンジン14を含み、ステートマシンエンジン14はプロセッサ12の制御下で動作してもよい。本明細書中に使用されるようなステートマシンエンジン14は、単一デバイス(例えば、単一チップ)を指す。ステートマシンエンジン14は、任意のオートマトン理論を利用することができる。例えば、ステートマシンエンジン14は、これらに限定されないが、Mealyアーキテクチャ、Mooreアーキテクチャ、有限ステートマシン(FSM)、決定論的FSM(DFSM)、ビット・パラレルステートマシン(BPSM)などを含む多くのステートマシンアーキテクチャのうちの1つを利用することができる。様々なアーキテクチャを使用できるが、論述する目的のため、本願ではFSMに言及する。しかしながら、様々なステートマシンアーキテクチャのうちの任意の1つを使用しても記述した技術を利用できることが当業者には認識されるであろう。
さらに下記するように、ステートマシンエンジン14は、多数(例えば、1つ以上)の有限ステートマシン(FSM)ラチス(例えば、ステートマシンエンジン14のコア)を含んでもよい。この適用目的のため、「ラチス」という用語は、素子(例えば、ブールセル、カウンタセル、ステートマシン素子、状態遷移素子)の組織化されたフレームワーク(例えば、ルーティングマトリクス、ルーティングネットワーク、フレーム)を指す。さらにまた、「ラチス」は、任意の適切な形状、構造またはヒエラルキー的組織(例えば、グリッド、立方形、球状、カスケーディング接続)を有してもよい。各FSMラチスは、各々が同一のデータをパラレルに受信して解析する複数のFSMを実現してもよい。さらに、FSMラチスのクラスタが同一の入力データをパラレルに解析できるように、FSMラチスは、グループ(例えば、クラスタ)で配列されてもよい。さらに、ステートマシンエンジン14のFSMラチスのクラスタをヒエラルキー構造に配列することによって、ヒエラルキー構造のより低レベルにおけるステートマシンラチスからの出力を、より高レベルにおけるステートマシンラチスに対する入力として使用してもよい。ヒエラルキー構造を通して直列にステートマシンエンジン14のパラレルFSMラチスのクラスタをカスケード接続することによって、より多くの複雑なパターンを解析(例えば、評価、検索など)できる。
さらに、ステートマシンエンジン14のヒエラルキーパラレル構造に基づいて、ステートマシンエンジン14は、高い処理速度を利用するシステムにおいて複雑なデータ解析(例えば、パターン認識)に使用することができる。例えば、本明細書に記述する実施形態は、1Gバイト/秒の処理速度を持つシステムに組み込むことができる。したがって、ステートマシンエンジン14を利用することによって、高速メモリデバイスもしくは他の外部デバイスからのデータを迅速に解析することができる。ステートマシンエンジン14は、幾つかの基準(例えば、検索語)に従ってデータストリームを、ほぼ同時に、例えば、単一のデバイスサイクル期間に解析することができる。ステートマシンエンジン14のレベル上のFSMのクラスタ内の各FSMは、ほぼ同時にデータストリームから同一の検索語を各々受信して、各パラレルFSMラチスが、当該用語が処理基準における次の状態へとステートマシンエンジン14を進めるか否かを判定してもよい。ステートマシンエンジン14は、比較的多数の基準、例えば、100超、1000超または10000超の基準に従い用語を解析してもよい。これらはパラレルに動作するため、データストリームを遅くすることなく、比較的高いバンド幅を有するデータストリーム、例えば、1Gバイト/秒と同等以上のデータストリームに対して基準を適用してもよい。
一実施形態においては、ステートマシンエンジン14は、データストリームにおける多数のパターンを認識(例えば、検出)するように構成されてもよい。例えば、ステートマシンエンジン14は、ユーザまたは他のエンティティが解析を望み得る様々なタイプのデータストリームのうちの1つ以上におけるパターンを検出するのに利用することができる。例えば、ステートマシンエンジン14は、インターネット上で受信されたパケット、または携帯電話ネットワーク上で受信された音声もしくはデータなどの、ネットワーク上で受信されたデータストリームを解析するように構成できる。一実施例においては、ステートマシンエンジン14は、スパムまたはマルウェア用のデータストリームを解析するように構成できる。データストリームは、シリアルデータストリームとして受信されてもよく、データが、時間的、単語的または意味的に重要な順序などの、意味のある順序で受信される。あるいは、データストリームは、パラレルまたは順序に関係なく受信され、その後、例えば、インターネット上で受信されたパケットを再配列することによってシリアルデータストリームに変換されてもよい。幾つかの実施形態においては、データストリームはシリアルに用語を提示することができるが、各用語を表すビットはパラレルに受信されてもよい。データストリームはシステム10へと外部ソースから受信されてもよいし、メモリ16などのメモリデバイスに問い合わせ、メモリ16内に格納されたデータからデータストリームを形成することによって形成されてもよい。他の実施例においては、ステートマシンエンジン14は、あるワードを綴る文字シーケンス、遺伝子を特定する遺伝的塩基対のシーケンス、画像の一部を形成する画像もしくはビデオファイルにおけるビットのシーケンス、プログラムの一部を形成する実行可能なファイルにおけるビットのシーケンス、または歌もしくは発話フレーズの一部を形成する音声ファイルにおけるビットのシーケンスを認識するように構成できる。解析されるべきデータストリームは、例えば、ベーステン、ASCIIなどのバイナリフォーマットまたは他のフォーマットにおける複数のビットのデータを含んでもよい。ストリームは、例えば、幾つかのバイナリデジットなどの単一デジットまたは複数デジットを有するデータをエンコードしてもよい。
認識されるように、システム10はメモリ16を含むことができる。メモリ16は、例えば、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、同期式DRAM(SDRAM)、ダブルデータレートDRAM(DDR SDRAM)、DDR2 SDRAM、DDR3 SDRAMなどの揮発性メモリを含むことができる。メモリ16は、揮発性メモリと組み合わせて使用するための、リードオンリーメモリ(ROM)、PC−RAM、シリコン・酸化物・窒化物・酸化物・シリコン(SONOS)メモリ、金属・酸化物・窒化物・酸化物・シリコン(MONOS)メモリ、ポリシリコン浮遊ゲートベースメモリ、及び/または種々のアーキテクチャの他のタイプのフラッシュメモリ(例えば、NANDメモリ、NORメモリなど)などの不揮発性メモリも含むことができる。メモリ16は、ステートマシンエンジン14によって解析されるデータを提供できる、DRAMデバイスなどの1つ以上のメモリデバイスを含むことができる。本明細書中に使用されるような「提供」という用語は、総称的に、導き、入力、挿入、送信、転送、伝送、生成、付与、出力、配置、書き込みなどを指す。当該デバイスは、ソリッドステートドライブ(SSD)、マルチメディアメディアカード(MMC)、セキュアデジタル(SD)カード、コンパクトフラッシュ(CF)カード、または任意の他の適切なデバイスと称されるか、またはそれらを含んでもよい。さらに、当該デバイスはユニバーサルシリアルバス(USB)、ペリフェラルコンポーネントインターコネクト(PCI)、PCIエクスプレス(PCI−E)、スモールコンピュータシステムインターフェイス(SCSI)、IEEE1394(ファイアワイヤ)、または任意の他の適切なインターフェイスなどの任意の適切なインターフェイスを通してシステム10に結合できることが認識されるはずである。フラッシュメモリデバイスなどのメモリ16の動作を容易にするために、システム10は、メモリコントローラ(図示せず)を含むことができる。認識されるように、メモリコントローラは、独立したデバイスであってもよいし、プロセッサ12と一体であってもよい。さらに、システム10は、磁気記憶デバイスなどの外部ストレージ18を含むことができる。外部ストレージは、ステートマシンエンジン14に入力データを提供することもできる。
システム10は、多数のさらなる構成要素を含んでもよい。例えば、コンパイラ20を、図8に関してより詳細に記述するように、ステートマシンエンジン14を構成(例えば、プログラム)するのに使用してもよい。ユーザがデータをシステム10に入力できる入力デバイス22も、プロセッサ12に結合することができる。例えば、入力デバイス22を使用して、ステートマシンエンジン14によるその後の解析のためにメモリ16にデータを入力することができる。入力デバイス22は、例えば、ボタン、スイッチング素子、キーボード、ライトペン、スタイラス、マウス及び/または音声認識システムを含むことができる。ディスプレイなどの出力デバイス24も、プロセッサ12に結合することができる。ディスプレイ24は、例えば、LCD、CRT、LED及び/または音声ディスプレイを含むことができる。システムは、インターネットなどのネットワークとインターフェイスを介して接続するために、ネットワークインターフェイスカード(NIC)などのネットワークインターフェイスデバイス26も含むことができる。認識されるように、システム10は、システム10の用途に応じて、多数の他のコンポーネントを含むことができる。
図2〜図5は、FSMラチス30の一実施例を図示する。一実施例においては、FSMラチス30は、ブロック32のアレイを備える。記述するように、各ブロック32は、FSMにおける複数の状態に対応する複数の選択的に結合可能なハードウェア素子(例えば、コンフィギュラブル素子及び/または専用素子)を含むことができる。FSMにおける状態に類似して、ハードウェア素子は、入力ストリームを解析して、入力ストリームに基づいて下流ハードウェア素子をアクティブ化することができる。
コンフィギュラブル素子は、多くの異なる機能を実施するように構成(例えば、プログラム)することができる。例えば、コンフィギュラブル素子は、(図3及び図4に示すような)行38及び(図2及び図3に示すような)ブロック32にヒエラルキー的に組織化された(図5に示す)ステートマシン素子(SME)34、36を含むことができる。SMEも、状態遷移素子(STE)とみなすことができる。ヒエラルキー的に組織化されたSME34、36の間で信号をルーティングするために、ブロック間スイッチング素子40(図2及び図3に示す)、ブロック内スイッチング素子42(図3及び図4に示す)、及び行内スイッチング素子44(図4に示す)を含むプログラマブルスイッチング素子のヒエラルキーを使用することができる。
下記するように、スイッチング素子は、ルーティング構造及びバッファを含むことができる。SME34、36は、FSMラチス30によって実現されるFSMの状態に対応することができる。SME34、36は、下記するようなプログラマブルスイッチング素子を使用することによってともに結合することができる。したがって、状態の機能に対応するようにSME34、36を構成し、かつFSMにおける状態間の遷移に対応するようにSME34、36をともに選択的に結合することによって、FSMをFSMラチス30において実現することができる。
図2は、FSMラチス30の一実施例の全体図を図示する。FSMラチス30は、プログラマブルブロック間スイッチング素子40とともに選択的に結合することができる複数のブロック32を含む。ブロック間スイッチング素子40は、導体46(例えば、ワイヤ、トレースなど)並びにバッファ48及び50を含むことができる。一実施例においては、バッファ48及び50は、ブロック間スイッチング素子40とやり取りする信号の接続及びタイミングを制御するために含まれる。さらに下記するように、バッファ48は、ブロック32間で送信されるデータをバッファするために提供され、一方で、バッファ50は、ブロック間スイッチング素子40間で送信されるデータをバッファするために提供することができる。さらに、ブロック32は、信号(例えば、データ)を受信し、ブロック32にデータを提供するための入力ブロック52(例えば、データ入力ポート)に選択的に結合することができる。ブロック32は、ブロック32からの信号を外部デバイス(例えば、別のFSMラチス30)に提供するための出力ブロック54(例えば、出力ポート)にも選択的に結合することができる。FSMラチス30は、FSMラチス30を構成(例えば、画像を通じたプログラム)するためのプログラミングインターフェイス56も含むことができる。画像は、SME34、36の状態を構成(例えば、設定)することができる。すなわち、画像は、入力ブロック52において与えられた入力に、ある方法で反応するようにSME34、36を構成することができる。例えば、SME34、36は、文字「a」が入力ブロック52で受信されたときに、ハイ信号を出力するように設定できる。
一実施例においては、入力ブロック52、出力ブロック54及び/またはプログラミングインターフェイス56は、レジスタとして実現することができ、レジスタへの書き込みまたはレジスタからの読み出しによってそれぞれの素子にまたはそれらからデータを提供する。したがって、プログラミングインターフェイス56に対応するレジスタに格納された画像からのビットは、SME34、36上でロードすることができる。図2は、ブロック32、入力ブロック52、出力ブロック54及びブロック間スイッチング素子40間にある数の導体(例えば、ワイヤ、トレース)を図示しているが、他の実施例においては、より少ないまたは多い数の導体を使用できることが理解されるはずである。
図3は、ブロック32の一実施例を図示する。ブロック32は、プログラマブルブロック内スイッチング素子42にともに選択的に結合することができる複数の行38を含むことができる。さらに、行38は、ブロック間スイッチング素子40によって、別のブロック32内の別の行38に選択的に結合することができる。行38は、2のグループ(GOT)60として本明細書に参照される素子の対に組織化された複数のSME34、36を含む。一実施例においては、ブロック32は、16個(16)の行38を含む。
図4は、行38の一実施例を図示する。GOT60は、プログラマブル行内スイッチング素子44によって、行38内の他のGOT60及び任意の他の素子(例えば、専用素子58)に選択的に結合することができる。GOT60は、ブロック内スイッチング素子42によって他の行38における他のGOT60、またはブロック間スイッチング素子40によって他のブロック32における他のGOT60にも結合することができる。一実施例においては、GOT60は、第一の入力62、第二の入力64及び出力66を有する。図5を参照してさらに図示するように、第一の入力62は、GOT60の第一のSME34に結合され、第二の入力64は、GOT60の第二のSME36に結合される。
一実施例においては、行38は、第一及び第二の複数の行相互接続導体68、70を含む。一実施例においては、GOT60の入力62、64は、1つ以上の行相互接続導体68、70に結合し、出力66も、1つ以上の行相互接続導体68、70に結合することができる。一実施例においては、第一の複数の行相互接続導体68は、行38内の各GOT60の各SME34、36に結合することができる。第二の複数の行相互接続導体70は、行38内の各GOT60のうちの唯一つのSME34、36に結合することができるが、GOT60の他のSME34、36には結合することができない。一実施例においては、図5によりよく図示するように、第二の複数の行相互接続導体70のうちの第一の半分が、行38内のSME34、36のうちの第一の半分(各GOT60からの一方のSME34)に結合することができ、第二の複数の行相互接続導体70のうちの第二の半分が、行38内のSME34、36のうちの第二の半分(各GOT60からの他方のSME34、36)に結合することができる。第二の複数の行相互接続導体70とSME34、36との間の限定された接続は、本明細書においては、「パリティ」と称される。一実施例においては、行38は、カウンタ、プログラマブルブール型論理素子、ルックアップテーブル、RAM、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、プログラマブルプロセッサ(例えば、マイクロプロセッサ)、または専用機能を実施するための他の素子などの専用素子58も含むことができる。
一実施例においては、専用素子58は、(本明細書においては、カウンタ58とも称される)カウンタを含む。一実施例においては、カウンタ58は12ビットプログラマブルダウンカウンタを含む。12ビットプログラマブルカウンタ58は、カウンティング入力、リセット入力及びゼロカウント出力を有する。カウンティング入力は、アサートされると、1ずつカウンタ58の値をデクリメントする。リセット入力は、アサートされると、関連するレジスタからの初期値をカウンタ58にロードさせる。12ビットカウンタ58に対して、12ビットの数までを初期値としてロードすることができる。カウンタ58の値がゼロ(0)までデクリメントされると、ゼロカウント出力がアサートされる。カウンタ58は、また、少なくとも2つのモードであるパルス及びホールドも有する。カウンタ58がパルスモードに設定されると、カウンタ58がゼロ及びクロックサイクルに達したときにゼロカウント出力がアサートされる。カウンタ58の次のクロックサイクル中に、ゼロカウント出力がアサートされる。その結果、カウンタ58は、時間内にクロックサイクルからオフセットされる。次のクロックサイクルにおいて、ゼロカウント出力はもはやアサートされない。カウンタ58がホールドモードに設定されると、カウンタ58がゼロにデクリメントするとき、クロックサイクル中にゼロカウント出力がアサートされ、アサートされたリセット入力によってカウンタ58がリセットされるまでアサートされたままである。
別の実施例においては、専用素子58は、ブール論理を含む。例えば、このブール論理は、AND、OR、NAND、NOR、積和(SoP)、積和の否定出力(NSoP)、和積の否定出力(NPoS)、及び和積(PoS)関数などの論理関数を実行するのに使用してもよい。このブール論理を使用して、FSMラチス30における(本明細書中に後に論じるような、FSMの端末ノードに対応する)端末状態SMEからのデータを抽出できる。抽出されたデータを使用して、状態データを他のFSMラチス30に提供する、及び/またはFSMラチス30の再構成もしくは別のFSMラチス30の再構成に使用される構成データを提供することができる。
図5は、GOT60の一実施例を図示する。GOT60は、入力62、64並びにORゲート76及び3:1マルチプレクサ78に結合されたそれらの出力72、74を有する第一のSME34及び第二のSME36を含む。3:1マルチプレクサ78は、第一のSME34、第二のSME36、またはORゲート76のいずれかにGOT60の出力66を結合するように設定することができる。ORゲート76を使用して、GOT60の共通出力66を形成するために双方の出力72、74をともに結合することができる。一実施例においては、第一及び第二のSME34、36が前述のようにパリティを示し、第一のSME34の入力62は行相互接続導体68の幾つかに結合することができ、第二のSME36の入力64が他の行相互接続導体70に結合できるによって、パリティ問題を克服できる共通出力66を生成することができる。一実施例においては、GOT60内の2つのSME34、36は、カスケード接続されるか、かつ/またはスイッチング素子79のいずれかもしくは双方を設定することによってそれ自身にループバックさせることができる。SME34、36の出力72、74を他のSME34、36の入力62、64に結合することによって、SME34、36をカスケード接続することができる。出力72、74をそれら自身の入力62、64に結合することによって、SME34、36をそれ自身にループバックさせることができる。したがって、第一のSME34の出力72は、第一のSME34の入力62及び第二のSME36の入力64のいずれにも結合しないか、またはいずれかもしくは双方に結合させることができる。
一実施例においては、ステートマシン素子34、36は、検出ライン82にパラレルに結合された、ダイナミックランダムアクセスメモリ(DRAM)でしばしば使用されるような複数のメモリセル80を備える。当該メモリセル80のうちの1つは、ハイまたはロウの値(例えば、1または0)のいずれかに対応するようなデータ状態に設定することができるメモリセルを含む。メモリセル80の出力は、検出ライン82に結合し、メモリセル80の入力は、データストリームライン84上のデータに基づいて信号を受信する。一実施例においては、入力ブロック52における入力は、メモリセル80のうちの1つ以上を選択するようにデコードされる。選択されたメモリセル80は、検出ライン82上の出力としてその格納されたデータ状態を提供する。例えば、入力ブロック52で受信されたデータは、デコーダ(図示せず)に提供でき、デコーダは、データストリームライン84のうちの1つ以上を選択できる。一実施例においては、デコーダは、256本のデータストリームライン84のうちの対応する1本へと、8ビットACSII文字を変換することができる。
メモリセル80は、したがって、メモリセル80がハイ値に設定されると検出ライン82にハイ信号を出力し、そしてデータストリームライン84上のデータがメモリセル80を選択する。データストリームライン84上のデータがメモリセル80を選択し、メモリセル80がロウ値へと設定されるとき、メモリセル80は、検出ライン82にロウ信号を出力する。検出ライン82上のメモリセル80からの出力は、検出セル86によって検知される。
一実施例においては、入力ライン62、64上の信号は、アクティブまたは非アクティブ状態のいずれかにそれぞれの検出セル86を設定する。非アクティブ状態に設定されると、検出セル86は、それぞれの検出ライン82上の信号にかかわらず、それぞれの出力72、74にロウ信号を出力する。アクティブ状態に設定されると、検出セル86は、ハイ信号がそれぞれのSME34、36のメモリセル82のうちの1つから検出されたときに、それぞれの出力ライン72、74にハイ信号を出力する。アクティブ状態においては、それぞれのSME34、36のメモリセル82の全てからの信号がロウであるとき、検出セル86は、それぞれの出力ライン72、74上にロウ信号を出力する。
一実施例においては、SME34、36は、256個のメモリセル80を含み、各メモリセル80は、異なるデータストリームライン84に結合される。したがって、SME34、36は、データストリームライン84の選択された1つ以上がその上にハイ信号を有するときにハイ信号を出力するようにプログラムすることができる。例えば、SME34は、一番目のメモリセル80(例えば、ビット0)をハイに設定し、全ての他のメモリセル80(例えば、ビット1〜255)をロウに設定することができる。それぞれの検出セル86がアクティブ状態にあるとき、ビット0に対応するデータストリームライン84がその上にハイ信号を有すると、SME34は、出力72上にハイ信号を出力する。他の実施例においては、複数のデータストリームライン84のうちの1つが、適切なメモリセル80をハイ値に設定することによってその上にハイ信号を有すると、SME34は、ハイ信号を出力するように設定することができる。
一実施例においては、メモリセル80は、関連するレジスタからのビットを読み出すことによって、ハイ値またはロウ値に設定することができる。したがって、SME34は、コンパイラ20によって生成された画像をレジスタに格納して、レジスタ内のビットを関連するメモリセル80にロードすることによって構成することができる。一実施例においては、コンパイラ20によって生成された画像は、ハイ及びロウ(例えば、1及び0)ビットのバイナリ画像を含む。画像は、SME34、36をカスケード接続することによって、FSMとして動作させるようにFSMラチス30を構成することができる。例えば、検出セル86をアクティブ状態に設定することによって、第一のSME34をアクティブ状態に設定することができる。第一のSME34は、ビット0に対応するデータストリームライン84がその上にハイ信号を有するとき、ハイ信号を出力するように設定することができる。第二のSME36は、最初に非アクティブ状態に設定することができるが、アクティブ状態時に、ビット1に対応するデータストリームライン84がその上にハイ信号を有するときにハイ信号を出力するように設定することができる。第一のSME34及び第二のSME36は、第一のSME34の出力72を第二のSME36の入力64に結合するように設定することによって、カスケード接続することができる。したがって、ビット0に対応するデータストリームライン84上にハイ信号が検知されると、第一のSME34は、出力72上にハイ信号を出力して、第二のSME36の検出セル86をアクティブ状態に設定する。ビット1に対応するデータストリームライン84上にハイ信号が検知されると、第二のSME36は、別のSME36をアクティブ化するために、またはFSMラチス30からの出力用に、出力74上にハイ信号を出力する。
一実施例においては、単一のFSMラチス30は、単一の物理デバイス上に実現されるが、他の実施例においては、2つ以上のFSMラチス30を単一の物理デバイス(例えば、物理チップ)上に実現してもよい。一実施例においては、各FSMラチス30は、別個のデータ入力ブロック52、別個の出力ブロック54、別個のプログラミングインターフェイス56、及び別個のコンフィギュラブル素子の組を含むことができる。さらに、コンフィギュラブル素子の各組は、それらの対応するデータ入力ブロック52におけるデータに対して反応(例えば、ハイまたはロウ信号を出力)することができる。例えば、第一のFSMラチス30に対応する第一の組のコンフィギュラブル素子は、第一のFSMラチス30に対応する第一のデータ入力ブロック52におけるデータに対して反応することができる。第二のFSMラチス30に対応する第二の組のコンフィギュラブル素子は、第二のFSMラチス30に対応する第二のデータ入力ブロック52に対して反応することができる。したがって、各FSMラチス30は、一組のコンフィギュラブル素子を含み、異なる組のコンフィギュラブル素子は、異なる入力データに対して反応することができる。同様に、各FSMラチス30及び各対応する組のコンフィギュラブル素子は、個別出力を提供することができる。幾つかの実施例においては、第一のFSMラチス30からの出力ブロック54は、第二のFSMラチス30の入力ブロック52に結合することができ、この構成により第二のFSMラチス30用の入力データが、一連のFSMラチス30のヒエラルキー配列における第一のFSMラチス30からの出力データを含むことができる。
一実施例においては、FSMラチス30上にロードするための画像は、FSMラチス30におけるコンフィギュラブル素子、プログラマブルスイッチング素子及び専用素子の構成用の複数ビットのデータを含む。一実施例においては、画像は、ある入力に基づいて所望の出力を提供するFSMラチス30を構成するように、FSMラチス30上にロードすることができる。出力ブロック54は、データ入力ブロック52におけるデータに対して、コンフィギュラブル素子の反応に基づいて、FSMラチス30からの出力を提供することができる。出力ブロック54からの出力は、任意のパターンとのマッチを示す単一ビット、複数のパターンとのマッチ及び不一致を示す複数ビットを含む語、並びに任意の瞬間における全てまたはあるコンフィギュラブル素子の状態に対応する状態ベクトルを含むことができる。記述するように、パターン認識(例えば、音声認識、画像認識など)、信号処理、画像処理、コンピュータビジョン、クリプトグラフィーなどのデータ解析を実施するために、多数のFSMラチス30をステートマシンエンジン14などのステートマシンエンジン内に含ませてもよい。
図6は、FSMラチス30によって実現できる有限ステートマシン(FSM)の一実施例のモデルを図示する。FSMラチス30は、FSMの物理的実装として構成(例えば、プログラム)することができる。FSMは、1つ以上のルートノード92を含有する図形90(例えば、有向グラフ、無向グラフ、擬グラフ)として表すことができる。ルートノード92に加えて、FSMは、幾つかの標準ノード94と、1つ以上の辺98を通してルートノード92及び他の標準ノード94に接続される端末ノード96からなることができる。ノード92、94、96は、FSMにおける状態に対応する。辺98は、状態間の遷移に対応する。
各ノード92、94、96は、アクティブ状態であってもよいし、非アクティブ状態であってもよい。非アクティブ状態にあるとき、ノード92、94、96は入力データに対して反応(例えば、応答)しない。アクティブ状態にあるとき、ノード92、94、96は入力データに対して反応することができる。上流ノード92、94は、上流ノード92、94と下流ノード94、96との間の辺98によって特定される基準に入力データがマッチするときに、そのノードから下流にあるノード94、96をアクティブ化することによって入力データに対して反応することができる。例えば、第一のノード94がアクティブであり、かつ文字「b」が入力データとして受信されるとき、文字「b」を特定する第一のノード94は、辺98によって第一のノード94に接続された第二のノード94をアクティブ化する。本明細書中に使用される「上流」は、1つ以上のノード間の関係を指し、他の1つ以上のノードの上流(または、ループもしくはフィードバック構成の場合には、それ自身の上流)である第一のノードとは、その第一のノードが他の1つ以上のノードをアクティブ化できる(または、ループの場合にはそれ自身をアクティブ化できる)状況を指す。同様に、「下流」とは、他の1つ以上のノードの下流(または、ループの場合にはそれ自身の下流)にある第一のノードが他の1つ以上のノードによってアクティブ化できる(または、ループの場合にはそれ自身によってアクティブ化できる)関係を指す。したがって、「上流」及び「下流」という用語は、本明細書中においては、1つ以上のノード間の関係を指すために使用されるが、これらの用語は、ループまたはノード間の他の非線形経路の使用を排除することはない。
図形90においては、ルートノード92は、最初にアクティブ化することができ、入力データがルートノード92からの辺98とマッチするとき、下流ノード94をアクティブ化することができる。ノード94は、ノード94からの辺98に入力データがマッチするとき、ノード96をアクティブ化することができる。図形90中のノード94、96は、入力データが受信されると、この方法でアクティブ化することができる。端末ノード96は、入力データ内の興味あるシーケンスのマッチに対応する。したがって、端末ノード96のアクティブ化は、入力データとして、興味あるシーケンスが受信されたことを示す。パターン認識機能を実現するFSMラチス30の状況においては、端末ノード96への到着が、興味ある特定のパターンが入力データにおいて検出されたことを示すことができる。
一実施例においては、各ルートノード92、標準ノード94及び端末ノード96は、FSMラチス30におけるコンフィギュラブル素子に対応することができる。各辺98は、コンフィギュラブル素子間の接続に対応することができる。したがって、別の標準ノード94または端末ノード96に遷移する(例えば、それらに接続する辺98を有する)標準ノード94は、別のコンフィギュラブル素子に遷移する(例えば、それに出力を提供する)コンフィギュラブル素子に対応する。幾つかの実施例においては、ルートノード92は、対応するコンフィギュラブル素子を有さない。
認識されるように、ノード92をルートノードとして記述し、ノード96を端末ノードとして記述したが、必ずしも特定の「開始」またはルートノードが存在しなくてもよく、必ずしも特定の「終了」または出力ノードが存在しなくてもよい。換言すると、任意のノードを開始点にし、任意のノードが出力を提供してもよい。
FSMラチス30がプログラムされると、各コンフィギュラブル素子は、アクティブ状態であってもよいし、非アクティブ状態であってもよい。任意のコンフィギュラブル素子は、非アクティブなとき、対応するデータ入力ブロック52において入力データに対して反応しない。アクティブなコンフィギュラブル素子は、データ入力ブロック52において入力データに対して反応することができ、入力データがコンフィギュラブル素子の設定にマッチするとき、下流コンフィギュラブル素子をアクティブ化することができる。コンフィギュラブル素子が端末ノード96に対応するとき、コンフィギュラブル素子は、外部デバイスにマッチの指示を提供するために、出力ブロック54に結合することができる。
プログラミングインターフェイス56を介してFSMラチス30上にロードされた画像は、コンフィギュラブル素子と専用素子との間の接続と同様、コンフィギュラブル素子及び専用素子を構成することができ、データ入力ブロック52におけるデータに対する反応に基づいて、連続的なノードのアクティブ化を通して所望のFSMが実現される。一実施例においては、コンフィギュラブル素子は、単一のデータサイクル(例えば、単一の文字、一組の文字、単一のクロックサイクル)中にアクティブなままであり、その後、上流コンフィギュラブル素子によって再アクティブ化されるまでは非アクティブとなる。
端末ノード96は、過去のイベントの圧縮されたヒストリを格納すると考慮できる。例えば、端末ノード96に到達することを必要とされる1つ以上のパターンの入力データを、その端末ノード96のアクティブ化によって表すことができる。一実施例においては、端末ノード96によって提供される出力はバイナリであって、つまり、その出力は、興味あるパターンがマッチしたか否かを示す。図形90における標準ノード94に対する端末ノード96の割合は、非常に小さくてもよい。換言すると、FSMには高い複雑性が存在することがあるが、FSMの出力は、比較的に小さく成り得る。
一実施例においては、FSMラチス30の出力は、状態ベクトルを含むことができる。状態ベクトルは、FSMラチス30のコンフィギュラブル素子の状態(例えば、アクティブ化されているか否か)を含む。別の実施例においては、コンフィギュラブル素子が端末ノード96に対応するか否かにかかわらず、状態ベクトルは、コンフィギュラブル素子の全てまたはサブセットの状態を含むことができる。一実施例においては、状態ベクトルは、端末ノード96に対応するコンフィギュラブル素子の状態を含む。したがって、出力は、図形90の全端末ノード96によって提供される指示の集合を含むことができる。状態ベクトルは、単語として表すことができ、各端末ノード96によって提供されるバイナリ指示は一ビットの単語を含む。端末ノード96のこのエンコードは、FSMラチス30に対する検出状態の有効な指示(例えば、興味あるシーケンスが検出されたか否か、検出された興味あるシーケンスは何か)を提供することができる。
前述のように、FSMラチス30は、パターン認識機能を実現するようにプログラムすることができる。例えば、FSMラチス30は入力データにおける1つ以上のデータシーケンス(例えば、署名、パターン)を認識するように構成できる。興味あるデータシーケンスがFSMラチス30によって認識されると、当該認識の指示を出力ブロック54において提供することができる。一実施例においては、パターン認識は、シンボルのストリング(例えば、ASCII文字)を、例えば、ネットワークデータにおけるマルウェアまたは他のデータを識別するために認識することができる。
図7は、ヒエラルキー構造100の一実施例を図示し、ここでは、FSMラチス30の二レベルが直列に結合され、データを解析するために使用される。つまり、図示する実施形態においては、ヒエラルキー構造100は、直列に配列された第一のFSMラチス30A及び第二のFSMラチス30Bを含む。各FSMラチス30は、データ入力を受信するためのそれぞれのデータ入力ブロック52、構成信号を受信するためのプログラミングインターフェイスブロック56、及び出力ブロック54を含む。
第一のFSMラチス30Aは、データ入力ブロックにおいて、生データなどの入力データを受信するように構成される。第一のFSMラチス30Aは、前述のように入力データに対して反応して、出力ブロックにおいて出力を提供する。第一のFSMラチス30Aからの出力は、第二のFSMラチス30Bのデータ入力ブロックに送信される。第二のFSMラチス30Bは、その後、第一のFSMラチス30Aによって提供された出力に基づいて反応して、ヒエラルキー構造100の対応する出力信号102を提供することができる。直列の2つのFSMラチス30A及び30Bのこのヒエラルキー結合は、第一のFSMラチス30Aから第二のFSMラチス30Bに圧縮された単語における過去のイベントに関するデータを提供するための手段を提供する。提供されたデータは、事実上、第一のFSMラチス30Aによって記録された複雑なイベント(例えば、興味あるシーケンス)の要約であり得る。
図7に示すFSMラチス30A、30Bの2レベルヒエラルキー100は、2つの独立したプログラムを同一のデータストリームに基づいて動作させることができる。二段階ヒエラルキーは、異なる領域としてモデル化された生物学的脳における視認と同様であり得る。このモデルの下で、領域は、有効に異なるパターン認識エンジンであり、各々が類似する計算機能(パターンマッチング)を実施するが、異なるプログラム(署名)を利用する。複数のFSMラチス30A、30Bをともに接続することによって、データストリーム入力についてのより多い知識が得られることがある。
(第一のFSMラチス30Aによって実現される)ヒエラルキーの第一のレベルは、例えば、生データストリームにおいて直接的に処理を実施することができる。すなわち、生データストリームを第一のFSMラチス30Aの入力ブロック52で受信することができ、第一のFSMラチス30Aのコンフィギュラブル素子が、生データストリームに反応することができる。(第二のFSMラチス30Bによって実現される)ヒエラルキーの第二のレベルは、第一のレベルからの出力を処理することができる。すなわち、第二のFSMラチス30Bは、第一のFSMラチス30Aの出力ブロック54からの出力を、第二のFSMラチス30Bの入力ブロック52で受信し、第二のFSMラチス30Bのコンフィギュラブル素子が、第一のFSMラチス30Aの出力に対して反応することができる。したがって、この実施例においては、第二のFSMラチス30Bは、入力として生データストリームは受信しないが、その代りに、第一のFSMラチス30Aによって判定された、生データストリームとマッチする興味あるパターンの指示を受信する。第二のFSMラチス30Bは、第一のFSMラチス30Aからの出力データストリームにおけるパターンを認識するFSMを実現することができる。第二のFSMラチス30Bが、FSMラチス30Aからの出力を受信することに加えて、複数の他のFSMラチスからの入力も受信できることが認識されるはずである。同じように、第二のFSMラチス30Bは、他のデバイスからの入力を受信できる。第二のFSMラチス30Bは、これらの複数の入力を組み合わせて出力を生成することができる。
図8は、コンパイラがFSMを実現するためのラチス30などのFSMラチスを構成するために使用される画像にソースコードを変換するための方法110の一実施例を図示する。方法110は、ソースコードをシンタックスツリーに解析すること(ブロック112)と、シンタックスツリーをオートマトンに変換すること(ブロック114)と、オートマトンを最適化すること(ブロック116)と、オートマトンをネットリストに変換すること(ブロック118)と、ハードウェア上にネットリストを配置すること(ブロック120)と、ネットリストをルーティングすること(ブロック122)と、結果生じた画像を発行すること(ブロック124)と、を含む。
一実施例においては、コンパイラ20は、FSMラチス30上のFSMを実現するための、ソフトウェア開発者が画像を生成することを可能にするアプリケーションプログラミングインターフェス(API)を含む。コンパイラ20は、FSMラチス30を構成するように構成された画像にソースコードにおける正規表現の入力セットを変換するための方法を提供する。コンパイラ20は、フォンノイマンアーキテクチャを有するコンピュータ用の命令によって実現することができる。これらの命令は、コンパイラ20の機能をコンピュータ上のプロセッサ12に実現させることができる。例えば、命令は、プロセッサ12によって実行されると、プロセッサ12に対してアクセス可能なソースコード上のブロック112、114、116、118、120、122及び124に記述された動作をプロセッサ12に実施させることができる。
一実施例においては、ソースコードは、シンボルのグループ内のシンボルのパターンを識別するための検索ストリングを記述する。検索ストリングを記述するために、ソースコードは複数の正規表現(regex)を含むことができる。Regexは、シンボル検索パターンを記述するためのストリングであってもよい。Regexは、プログラミング言語、テキストエディタ、ネットワークセキュリティなど、種々のコンピュータドメインで広く使用されている。一実施例においては、コンパイラによってサポートされる正規表現は、非構造化データの解析用の基準を含む。非構造化データは、フリーフォームであるデータを含むことができ、データ内の単語に対して適用される索引付けを有さない。単語は、データ内の印刷可能及び印字不能な任意の組み合わせのバイトを含むことができる。一実施例においては、コンパイラは、Perl(例えば、Perl互換正規表現(PCRE))、PHP、Java、及びNET言語を含むregexを実現するための複数の異なるソースコード言語をサポートすることができる。
ブロック112において、コンパイラ20は、相関的に接続されたオペレータの配列を形成するためにソースコードを解析することができ、異なるタイプのオペレータはソースコードによって実現される異なる機能(例えば、ソースコード内のregexによって実現される異なる機能)に対応する。ソースコードの解析によって、ソースコードのジェネリック表現を生成できる。一実施例においては、ジェネリック表現は、シンタックスツリーとして知られるツリーグラフの形式のソースコードにおけるregexのエンコードされた表現を含む。本明細書に記述する実施例は、(「抽象シンタックスツリー」としても知られる)シンタックスツリーとしての配列を参照する。しかしながら、他の実施例においては、具象シンタックスツリーまたは他の配列を使用することができる。
前述のように、コンパイラ20は複数のソースコード言語をサポートできるため、言語にかかわらず、解析によって、非言語の特定の表現、例えば、シンタックスツリーへとソースコードを変換する。したがって、コンパイラ20によるさらなる処理(ブロック114、116、118、120)は、ソースコードの言語にかかわらず、共通の入力構造から動作することができる。
前述のように、シンタックスツリーは、相関的に接続された複数のオペレータを含む。シンタックスツリーは、複数の異なるタイプのオペレータを含むことができる。すなわち、異なるオペレータが、ソースコードにおけるregexによって実現される異なる機能に対応することができる。
ブロック114において、シンタックスツリーはオートマトンに変換される。オートマトンは、FSMのソフトウェアモデルを含み、したがって、決定論的または非決定論的として分類することができる。決定論的オートマトンは、所定の時間における単一の実行経路を有し、一方で、非決定論的オートマトンは、複数の同時実行経路を有する。オートマトンは複数の状態を含む。シンタックスツリーをオートマトンに変換するために、シンタックスツリーにおけるオペレータ及びオペレータ間の関係は、状態間の遷移を伴う状態に変換される。一実施例においては、オートマトンは、FSMラチス30のハードウェアに部分的に基づいて変換することができる。
一実施例においては、オートマトン用の入力シンボルは、アルファベット、0〜9の数字及び他の印刷可能な文字のシンボルを含む。一実施例においては、入力シンボルは、0〜255(その数値も含む)バイト値によって表される。一実施例においては、オートマトンは、グラフのノードが状態の組に対応する有向グラフとして表すことができる。一実施例においては、入力シンボルα上の状態pから状態qへの遷移、すなわち、δ(p、α)は、ノードpからノードqへの有向接続によって示される。一実施例においては、オートマトンの反転によって、幾つかのシンボルαにおける各遷移p→qが、同一シンボルにおいてq→pに反転される新規オートマトンが生成される。反転においては、開始状態が最終状態になり、そして最終状態が開始状態になる。一実施例においては、オートマトンによって認識される(例えば、マッチする)言語は、オートマトンに順次入力されるとき最終状態に到達する全ての可能性のある文字ストリングの組である。オートマトンによって認識される言語における各ストリングは、開始状態から1つ以上の最終状態への経路を追跡する。
ブロック116においては、オートマトンが構成された後、オートマトンは、とりわけ、その複雑性及びサイズを減少させるために最適化される。オートマトンは、余分な状態を組み合わせることによって最適化することができる。
ブロック118においては、最適化されたオートマトンがネットリストに変換される。オートマトンのネットリストへの変換においては、FSMラチス30上のハードウェア素子(例えば、SME34、36、他の素子)へのオートマトンの各状態をマップして、ハードウェア素子間の接続を判定する。
ブロック120においては、ネットリストが、ネットリストの各ノードに対応するターゲットデバイス(例えば、SME34、36、専用素子58)の特定のハードウェア素子を選択するために配置される。一実施例においては、この配置によって、FSMラチス30の一般的入力及び出力制約に基づいて、各特定のハードウェア素子が選択される。
ブロック122においては、配置されたネットリストが、ネットリストによる接続の記述を達成するように選択されたハードウェア素子をともに結合するために、プログラマブルスイッチング素子(例えば、ブロック間スイッチング素子40、ブロック内スイッチング素子42及び行内スイッチング素子44)用の設定を判定するためにルーティングされる。一実施例においては、プログラマブルスイッチング素子の設定は、選択されたハードウェア素子を接続するのに使用されるFSMラチス30の特定の導体、及びプログラマブルスイッチング素子用の設定を判定することによって判定される。ルーティングにおいては、ブロック120において配置されたハードウェア素子間の接続のより特定な制限を考慮することができる。したがって、ルーティングにおいては、FSMラチス30上の導体の実際の制限がある場合でも適切な接続をするために、グローバル配置によって判定されたように、ハードウェア素子の幾つかの位置を調整してもよい。
一旦ネットリストが配置されルーティングされると、配置されてルーティングされたネットリストを、FSMラチス30の構成用の複数ビットに変換することができる。複数ビットは、本明細書においては画像(例えば、バイナリ画像)とも称される。
ブロック124においては、画像がコンパイラ20によって発行される。画像は、FSMラチス30の特定のハードウェア素子の構成用の複数ビットを含む。プログラムされたFSMラチス30がソースコードによって記述された機能を有するFSMを実現するように、ビットは、FSMラチス30上にロードし、SME34、36、専用素子58、及びプログラマブルスイッチング素子の状態を構成することができる。配置(ブロック120)及びルーティング(ブロック122)では、オートマトンにおける特定の状態へとFSMラチス30における特定の位置の特定のハードウェア素子をマップすることができる。したがって、画像におけるビットは、所望の機能(複数可)を実現するために、特定のハードウェア素子を構成することができる。一実施例においては、画像は、コンピュータ可読媒体にマシンコードを保存することによって発行することができる。別の実施例においては、画像は、ディスプレイデバイス上に画像を表示することによって発行することができる。さらに別の実施例においては、画像は、FSMラチス30上に画像をロードするための構成デバイスなどの別のデバイスに画像を送信することによって発行することができる。さらに別の実施例においては、画像はFSMラチス(例えば、FSMラチス30)上に画像をロードすることによって発行することができる。
一実施例においては、画像は、SME34、36及び他のハードウェア素子に画像からのビット値を直接ロードするか、または1つ以上のレジスタに画像をロードして、その後、SME34、36及び他のハードウェア素子にレジスタからのビット値を書き込むことのいずれかによって、FSMラチス30上にロードすることができる。一実施例においては、構成デバイス及び/またはコンピュータが1つ以上のメモリアドレスに画像を書き込むことによって、FSMラチス30上に画像をロードできるように、FSMラチス30のハードウェア素子(例えば、SME34、36、専用素子58、プログラマブルスイッチング素子40、42、44)は、マップされたメモリである。
本明細書に記述する方法の実施例は、少なくとも部分的にマシンまたはコンピュータで実現することができる。幾つかの実施例は、前述の実施例に記述したような方法を実施するように電子デバイスを構成するように動作可能な命令がエンコードされたコンピュータ可読媒体またはマシン可読媒体を含むことができる。当該方法の実現では、マイクロコード、アセンブリ言語コード、より高いレベルの言語コードなどのコードを含むことができる。当該コードは、種々の方法を実施するためのコンピュータ可読命令を含むことができる。コードは、コンピュータプログラム製品の一部を形成してもよい。さらに、コードは、実行中または他の時間中に、1つ以上の揮発性または不揮発性コンピュータ可読媒体に具体的に格納されてもよい。これらのコンピュータ可読媒体は、これらに限定されないが、ハードディスク、リムーバブル磁気ディスク、リムーバブル光ディスク(例えば、コンパクトディスク及びデジタルビデオディスク)、磁気カセット、メモリカードまたはスティック、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)などを含むことができる。
ここで図9を参照し、ステートマシンエンジン14(例えば、単一チップ上の単一デバイス)の実施形態を図示する。前述のように、ステートマシンエンジン14は、データバスを介して、メモリ16などのソースからデータを受信するように構成される。図示する実施形態においては、データを、ダブルデータレートスリー(DDR3)バスインターフェイス130などのバスインターフェイスを通して、ステートマシンエンジン14に送信できる。DDR3バスインターフェイス130は、1Gバイト/秒以上の速度でデータを交換(例えば、提供及び受信)可能であってもよい。そのようなデータ交換速度は、ステートマシンエンジン14によってデータが解析される速度よりも大きくてもよい。認識されるように、解析されるべきデータのソースに応じて、バスインターフェイス130は、NANDフラッシュインターフェイス、ペリフェラルコンポーネントインターコネクト(PCI)インターフェイス、ギガビットメディア独立型インターフェイス(GMII)などの、ステートマシンエンジン14とデータソースとでデータをやり取りするための任意の適切なバスインターフェイスであってもよい。前述のように、ステートマシンエンジン14は、データを解析するように構成された1つ以上のFSMラチス30を含む。各FSMラチス30は、2つのハーフラチスに分割されてもよい。図示する実施形態においては、ラチス30が48K SMEを含むように、各ハーフラチスは、24K SME(例えば、SME34、36)を含んでもよい。ラチス30は、図2〜図5に関して前述したように配列された任意の所望の数のSMEを含んでもよい。さらに、唯一のFSMラチス30を図示したが、前述のように、ステートマシンエンジン14は複数のFSMラチス30を含んでもよい。
解析されるべきデータは、バスインターフェイス130で受信され、多数のバッファ及びバッファインターフェイスを通してFSMラチス30へと提供することができる。図示する実施形態においては、データ経路は、データバッファ132、命令バッファ133、プロセスバッファ134、並びにインターランク(IR)バス及びプロセスバッファインターフェイス136を含む。データバッファ132は、解析されるべきデータを受信して一時的に格納するように構成される。一実施形態においては、2つのデータバッファ132(データバッファA及びデータバッファB)が存在する。データは、2つのデータバッファ132のうちのいずれかに格納することができ、一方で、FSMラチス30による解析のために、他方のデータバッファ132からデータは除かれている。バスインターフェイス130は、データバッファ132が満たされるまで、解析されるべきデータをデータバッファ132に提供するように構成できる。バスインターフェイス130は、データバッファ132が満たされた後、他の目的(例えば、データバッファ132が解析されるべきさらなるデータの受信に利用可能になるまで、データストリームから他のデータを提供するため)に自由に使用できるように構成することができる。図示する実施形態においては、データバッファ132は、それぞれ、32Kバイトであってもよいが、他の実施形態においては、データバッファ132は、任意の適切なサイズ(例えば、4Kバイト、8Kバイト、16Kバイト、64Kバイトなど)であってもよい。命令バッファ133は、バスインターフェイス130を通じてプロセッサ12からの命令、例えば、解析されるべきデータに対応する命令、及びステートマシンエンジン14の構成に対応する命令を受信するように構成される。IRバス及びプロセスバッファインターフェイス136は、プロセスバッファ134へのデータ提供を容易にすることができる。IRバス及びプロセスバッファインターフェイス136を使用することによって、データがFSMラチス30によって順番に処理されることを保証できる。IRバス及びプロセスバッファインターフェイス136は、データが正確な順序で受信されて解析されるように、データの交換、タイミングデータ、パッキング命令などを調整することができる。概して、IRバス及びプロセスバッファインターフェイス136は、複数のデバイスをランクにおけるデバイスとして使用することができる。ランクにおけるデバイスである複数のデバイスは、複数のデバイスの全てが全ての共有データを正しい順序で受信するようにデータを共有する。例えば、複数の物理デバイス(例えば、ステートマシンエンジン14、チップ、個々のデバイス)は、ランクに配列され、IRバス及びプロセスバッファインターフェイス136を通じて互いにデータを提供することができる。この用途のための「ランク」という用語は、同一のチップセレクトに接続されたステートマシンエンジン14の組を指す。図示する実施形態においては、IRバス及びプロセスバッファインターフェイス136は、8ビットデータバスを含むことができる。
図示する実施形態においては、ステートマシンエンジン14は、ステートマシンエンジン14を通したデータの提供を援助するためのデコンプレッサ138及びコンプレッサ140も含む。認識できるように、コンプレッサ140及びデコンプレッサ138は、ソフトウェア及び/またはハードウェア設計を単純化するための同一の圧縮アルゴリズムを使用することができる。しかしながら、コンプレッサ140及びデコンプレッサ138は、異なるアルゴリズムを使用することもできる。データを圧縮することによって、バスインターフェイス130(例えば、DDR3バスインターフェイス)の利用時間を最小限化することができる。本実施形態においては、コンプレッサ140を使用して、状態ベクトルデータ、コンフィギュレーションデータ(例えば、プログラミングデータ)、及びFSMラチス30による解析後に得られるマッチ結果データを圧縮できる。一実施形態においては、コンプレッサ140及びデコンプレッサ138へとかつ/またはそこから移動するデータが(例えば、圧縮でも解凍でも)変更されないように、コンプレッサ140及びデコンプレッサ138を無効にする(例えば、停止させる)ことができる。
コンプレッサ140及びデコンプレッサ138は、複数の組のデータであって、各組のデータの長さが変化し得る、複数組のデータを処理するようにも構成することができる。圧縮データを「パディング」し、各々の圧縮領域が終了する時に関するインジケータを含ませることによって、コンプレッサ140は、ステートマシンエンジン14を通じた全体的な処理速度を改善することができる。
ステートマシンエンジン14は状態ベクトルシステム141を含み、これは、状態ベクトルキャッシュメモリ142、状態ベクトルメモリバッファ144、状態ベクトル中間入力バッファ146、及び状態ベクトル中間出力バッファ148を有する。状態ベクトルシステム141を使用して、FSMラチス30の複数の状態ベクトルを格納し、状態ベクトルをステートマシンエンジン14にまたはそこから離すように移動し、そして状態ベクトルをFSMラチス30に提供して、提供された状態ベクトルに対応する状態にFSMラチス30を復元することができる。例えば、各状態ベクトルは、状態ベクトルキャッシュメモリ142に一時的に格納することができる。すなわち、状態を復元して後にさらなる解析に使用することができるように、各SME34、36の状態を格納し、その一方で、新規のデータセット(例えば、検索語)の解析のために、SME34、36を使用されていない状態にすることができる。典型的なキャッシュメモリと同様に、状態ベクトルキャッシュメモリ142は、例えば、ここではFSMラチス30によって迅速検索及び使用されるように状態ベクトルを格納することができる。図示する実施形態においては、状態ベクトルキャッシュメモリ142は、最大512個の状態ベクトルを格納することができる。各状態ベクトルは、FSMラチス30のSME34、36の状態(例えば、アクティブ化されているか否か)、及びカウンタ58の動的(例えば、最新の)カウントを含む。
認識されるように、状態ベクトルデータは、ランク内の異なるステートマシンエンジン14(例えば、チップ)間でやり取りすることができる。状態ベクトルデータは、種々の目的のために異なるステートマシンエンジン14間でやり取りすることができる。この目的は、例えば、FSMラチス30のSME34、36の状態とカウンタ58の動的カウントとの同期、複数のステートマシンエンジン14にわたる同一の機能の実行、複数のステートマシンエンジン14にわたる結果の再生成、複数のステートマシンエンジン14にわたる結果のカスケード接続、SME34、36の状態のヒストリ及び複数のステートマシンエンジン14を通じてカスケードされたデータを解析するために使用されるカウンタ58の動的カウントの格納などを含む。さらにまた、ステートマシンエンジン14内において状態ベクトルデータを使用して状態ベクトルを迅速に復元できることが留意されるべきである。例えば、状態ベクトルデータを使用して、SME34、36の状態及びカウンタ58の動的カウントを、(例えば、新規の検索語を検索するための)初期化状態に復元し、SME34、36の状態及びカウンタ58の動的カウントを、(例えば、以前に検索した検索語を検索するために)以前の状態に復元し、かつSME34、36の状態及びカウンタ58の動的カウントを、(例えば、カスケード検索において検索語を検索するための)カスケード構成を構成するように変化させることができる。ある実施形態においては、(例えば、状態ベクトルデータの解析、状態ベクトルデータを修正するための再構成、状態ベクトルデータの効率を改善するための再構成などのために)状態ベクトルデータをプロセッサ12に提供することができるように、状態ベクトルデータをバスインターフェイス130に提供することができる。
例えば、ある実施形態においては、ステートマシンエンジン14は、FSMラチス30から外部デバイスにキャッシュされた状態ベクトルデータ(例えば、状態ベクトルシステム141によって格納されたデータ)を提供することができる。外部デバイスは、状態ベクトルデータを受信し、状態ベクトルデータを修正し、修正した状態ベクトルデータを、FSMラチス30を復元(例えば、リセッティング、初期化)するためにステートマシンエンジン14に提供することができる。したがって、外部デバイスは、所望のようにステートマシンエンジン14が状態をスキップ(例えば、ジャンプ)できるように、状態ベクトルデータを修正できる。
状態ベクトルキャッシュメモリ142は、任意の適切なデバイスから状態ベクトルデータを受信できる。例えば、状態ベクトルキャッシュメモリ142は、FSMラチス30、(例えば、IRバス及びプロセスバッファインターフェイス136を通じて)別のFSMラチス30、デコンプレッサ138などから状態ベクトルを受信することができる。図示する実施形態においては、状態ベクトルキャッシュメモリ142は、状態ベクトルメモリバッファ144を通じて他のデバイスから状態ベクトルを受信できる。さらにまた、状態ベクトルキャッシュメモリ142は、状態ベクトルデータを任意の適切なデバイスに提供することができる。例えば、状態ベクトルキャッシュメモリ142は、状態ベクトルデータを、状態ベクトルメモリバッファ144、状態ベクトル中間入力バッファ146、及び状態ベクトル中間出力バッファ148に提供することができる。
状態ベクトルメモリバッファ144、状態ベクトル中間入力バッファ146、及び状態ベクトル中間出力バッファ148などのさらなるバッファを、高速検索及び状態ベクトルの格納に適応させ、その一方で、ステートマシンエンジン14を通じてインターリーブされたパケットを有する個々のデータセットを処理するように、状態ベクトルキャッシュメモリ142と併せて使用することができる。図示する実施形態においては、状態ベクトルメモリバッファ144、状態ベクトル中間入力バッファ146、及び状態ベクトル中間出力バッファ148の各々は、1つの状態ベクトルを一時的に格納するように構成されてもよい。状態ベクトルメモリバッファ144を使用して、任意の適切なデバイスから状態ベクトルデータを受信し、状態ベクトルデータを任意の適切なデバイスに提供することができる。例えば、状態ベクトルメモリバッファ144を使用して、FSMラチス30、(例えば、IRバス及びプロセスバッファインターフェイス136を通じて)別のFSMラチス30、デコンプレッサ138、及び状態ベクトルキャッシュメモリ142から状態ベクトルを受信することができる。別の実施例として、状態ベクトルメモリバッファ144を使用して、状態ベクトルデータを、(例えば、他のFSMラチス30に向けて)IRバス及びプロセスバッファインターフェイス136、コンプレッサ140、及び状態ベクトルキャッシュメモリ142に提供することができる。
同じように、状態ベクトル中間入力バッファ146を使用して、任意の適切なデバイスから状態ベクトルデータを受信し、状態ベクトルデータを任意の適切なデバイスに提供することができる。例えば、状態ベクトル中間入力バッファ146を使用して、(例えば、IRバス及びプロセスバッファインターフェイス136を通じて)FSMラチス30、デコンプレッサ138、及び状態ベクトルキャッシュメモリ142から状態ベクトルを受信することができる。別の実施例として、状態ベクトル中間入力バッファ146を使用して、状態ベクトルをFSMラチス30に提供することができる。さらにまた、状態ベクトル中間出力バッファ148を使用して、任意の適切なデバイスから状態ベクトルを受信し、状態ベクトルを任意の適切なデバイスに提供することができる。例えば、状態ベクトル中間出力バッファ148を使用して、FSMラチス30、及び状態ベクトルキャッシュメモリ142から状態ベクトルを受信することができる。別の実施例として、状態ベクトル中間出力バッファ148を使用して、状態ベクトルを、(例えば、IRバス及びプロセスバッファインターフェイス136を通じて)FSMラチス30、及びコンプレッサ140に提供することができる。
一旦興味ある結果がFSMラチス30によって生成されると、マッチ結果をマッチ結果メモリ150に格納することができる。例えば、マッチ(例えば、興味あるパターンの検出)を示す「マッチベクトル」を、マッチ結果メモリ150に格納することができる。マッチ結果を、その後、例えば、バスインターフェイス130を通じてプロセッサ12に伝送するためにマッチバッファ152に送信することができる。前述のように、マッチ結果は圧縮されてもよい。
さらなるレジスタ及びバッファを、同様にステートマシンエンジン14に提供してもよい。例えば、ステートマシンエンジン14は、制御及びステータスレジスタ154を含んでもよい。さらに、復元及びプログラムバッファ156を、最初にFSMラチス30のSME34、36を構成し、または解析中にFSMラチス30におけるSME34、36の状態を復元するのに使用するために提供してもよい。同様に、保存及び修復マップバッファ158も、セットアップ及び使用のために保存及び修復マップを格納するために提供してもよい。
図10は、デバイスがランクにおいて配列された複数の物理的なステートマシンエンジン14の一実施例を図示する。認識できるように、ステートマシンエンジン14とプロセッサ12との間のインターフェイス(例えば、DDR3バスインターフェイス130)によって、ステートマシンエンジン14は、プロセッサ12からの全てのデータ線を使用してプロセッサ12からデータを受信できる。例えば、プロセッサ12が64本のデータ線を有し、各ステートマシンエンジン14が8本のデータ線を有する場合には、プロセッサ12の全てのデータ線からデータを受信するように、8つのステートマシンエンジン14を64本のデータ線に結合することができる。したがって、プロセッサ12は、迅速にかつ標準インターフェイスを使用して、ステートマシンエンジン14にデータを提供することができる。さらに、ステートマシンエンジン14は、ステートマシンエンジン14によって集合的に受信される全てのデータが全てのステートマシンエンジン14に正しい手順で提供されるように、ともに調整するように構成できる。
前述のように、解析されるべきデータは、バスインターフェイス130で受信される。バスインターフェイス130は、データバッファ132及び命令バッファ133を含む、各ステートマシンエンジン14(例えば、F0、F1、F2、F3、F4、F5、F6、F7)のデータバッファシステム159にデータを導く。データバッファ132は、解析されるべきデータを受信して一時的に格納するように構成される。図示する実施形態においては、各ステートマシンエンジン14に2つのデータバッファ132(例えば、データバッファA及びデータバッファB)が存在する。データは、2つのデータバッファ132のうちのいずれかに格納することができ、一方で、FSMラチス30による解析のために、他方のデータバッファ132からデータは除かれている。前述のように、命令バッファ133は、バスインターフェイス130を通じてプロセッサ12からの命令、例えば、解析されるべきデータに対応する命令を受信するように構成される。解析されるべきデータ及びデータに対応する命令が、データバッファシステム159からIRバス及びプロセスバッファインターフェイス136を通じて、FSMラチス30の1つ以上に提供される。本実施形態においては、物理的なFSMラチス30は、論理グループにおいて配列される。つまり、ステートマシンエンジン14F0及びF1のFSMラチス30は、論理グループA162に配列され、ステートマシンエンジン14F2及びF3のFSMラチス30は、論理グループB164に配列され、ステートマシンエンジン14F4及びF5のFSMラチス30は、論理グループC166に配列され、そしてステートマシンエンジン14F6及びF7のFSMラチス30は、論理グループD168に配列される。他の実施形態においては、物理的なFSMラチス30は、任意の適切な数(例えば、1、2、3、4、5、6、7、8)の論理グループに配列されてもよい。さらにまた、認識されるように、IRバス及びプロセスバッファインターフェイス136を通じてステートマシンエンジン14間でデータをやり取りすることができる。例えば、IRバス及びプロセスバッファインターフェイス136を使用して、任意のステートマシンエンジン14(例えば、F0、F1、F2、F3、F4、F5、F6、F7)間でデータをやり取りすることができる。8つのステートマシンエンジン14を図示したが、ランクにおけるデバイスは、任意の適切な数のステートマシンエンジン14(例えば、1、2、4、8など)を有することができる。認識されるように、各ステートマシンエンジン14のIRバス及びプロセスバッファインターフェイス136は、(例えば、それ自身のデータバッファシステム159、及び他のステートマシンエンジン14のIRバス及びプロセスバッファインターフェイス136からの)データを受信するための入力を含むことができる。同じように、各ステートマシンエンジン14のIRバス及びプロセスバッファインターフェイス136は、(例えば、FSMラチス30、及び他のステートマシンエンジン14のIRバス及びプロセスバッファインターフェイス136に)データを送信するための出力を含むことができる。
バスインターフェイス130は、データを効率的に使用するように調整されたフォーマットにおいて解析されるべきデータを受信することができる。具体的には、図11〜図14は、バスインターフェイス130を通じてステートマシンエンジン14に提供されたデータブロックに、プロセッサ12によってデータを割り当てる(例えば、グループ化する)ことができる方法の実施例を図示する。
ここで図11を参照し、ステートマシンエンジン14に提供されるデータブロックに、プロセッサ12によって割り当てられたデータセグメント(例えば、データセット、検索語)の一実施例を図示する。本実施形態においては、複数のデータセグメントが単一のデータブロックに割り当てられる。各データブロックは、FSMラチス30の単一の論理グループ(例えば、162、164、166、168)(例えば、ランクにおけるステートマシンエンジン14のうちの1つ以上のステートマシンエンジン14)によって解析されるように割り当てられる。例えば、データストリーム170(例えば、プロセッサ12によってステートマシンエンジン14に送信される大量のデータ)は、プロセッサ12によって、論理グループA162用に意図されたデータに対応する第一のデータブロック172、論理グループB164用に意図されたデータに対応する第二のデータブロック174、論理グループC166用に意図されたデータに対応する第三のデータブロック176、及び論理グループD168用に意図されたデータに対応する第四のデータブロック178に割り当てられる。つまり、データストリーム170は、プロセッサ12によって、データセグメント180、182、184、186、188、190、192、194、196、198及び200から組み立てられる。認識されるように、データセグメント180、182、184、186、188、190、192、194、196、198及び200の各々は、FSMラチス30によって解析されるデータセットを表し得る。認識されるように、プロセッサ12は、データセグメント180、182、184、186、188、190、192、194、196、198及び200を、任意の適切な根拠に従いデータブロック172、174、176及び178に割り当てることができる。例えば、プロセッサ12は、データセグメントを、各データセットの長さ及び/またはデータセットを効率的に処理するための、解析されるデータセットの順序に基づいて、特定のデータブロックに割り当てることができる。
データセグメント180、182、184、186、188、190、192、194、196、198及び200は、任意の適切な様式でデータブロック172、174、176及び178に割り当てることができる。例えば、データセグメント180、182、184、186、188、190、192、194、196、198及び200は、データブロック172、174、176及び178におけるバイト数を最小限化するように、データブロック172、174、176及び178に割り当てることができる。別の実施例として、データセグメント180、182、184、186、188、190、192、194、196、198及び200は、特定のデータセグメントがともにグループ化されるように、データブロック172、174、176及び178に割り当てることができる。
図示するように、第一のデータブロック172は、データセグメントA180、データセグメントF190、及びデータセグメントI196を含む。第二のデータブロック174は、データセグメントB182及びデータセグメントK200を含む。さらにまた、第三のデータブロック176は、データセグメントC184、データセグメントE188、及びデータセグメントG192を含む。第四のデータブロック178は、データセグメントD186、データセグメントH194、及びデータセグメントJ198を含む。
認識されるように、データブロックを効率的に処理するように全てのデータブロックが等しい量のデータを有してもよい。さらにまた、データブロック内のデータセグメントは、データセグメントが開始及び終了する時を処理デバイスが判定できるように、データブロック内において所定の間隔(例えば、バイト、単語)で開始及び/または終了してもよい。しかしながら、データセグメントは、所定の間隔で開始及び/または終了するための正確な量のデータを有さないことがある。したがって、データが所定の間隔でデータブロック内において開始及び/または終了するように、データパディングを特定のデータセグメント間に挿入してもよい。さらに、全てのデータブロックが等しい量のデータを有するように、データブロックの終端にデータパディングを追加してもよい。
ここで図12を参照し、図11のデータブロック172、174、176及び178のデータセグメント間に挿入されるデータパディングの一実施例を図示する。例えば、第一のデータブロック172では、データパディング202を、データセグメントA180とデータセグメントF190との間に挿入できる。さらに、データパディング204を、データセグメントF190とデータセグメントI196との間に挿入できる。別の実施例として、第二のデータブロック174では、データパディング206を、データセグメントB182とデータセグメントK200との間に挿入できる。第三のデータブロック176では、データパディング208を、データセグメントC184とデータセグメントE188との間に挿入できる。同じように、データパディング210を、データセグメントE188とデータセグメントG192との間に挿入できる。別の実施例として、第四のデータブロック178では、データパディング212を、データセグメントD186とデータセグメントH194との間に挿入できる。さらに、データパディング214を、データセグメントH194とデータセグメントJ198との間に挿入できる。
データパディング202、204、206、208、210、212及び214は、解析されない任意の適切なバイト数のデータ(例えば、無効データ、ジャンクデータ、フィラーデータ、ガベージデータなど)を含んでもよい。一実施形態においては、データパディングとして使用されるバイト数は、先のデータセグメントのバイト数に加えられた場合に完全なワード境界に達するバイト数であってもよい(すなわち、先のデータセグメントのバイト数とデータパディングとして使用されるバイト数との和は、完全なワード境界によって割り切れる。例えば、データパディング202のバイト数は、データパディング202とデータセグメントA180(すなわち、先のデータセグメント)とのバイトの合計数が、完全なワード境界によって割り切れる(例えば、余りがない)数にできる。図示する実施形態においては、完全なワード境界は、8バイトであってもよい。他の実施形態においては、完全なワード境界は、任意の適切な数のバイトまたはビットであってもよい。それゆえ、図示する実施形態においては、仮にデータセグメントA180が63バイトのデータを含む場合には、データパディング202は、1バイトのデータを含むであろう(例えば、データセグメントA180とデータパディング202とのデータの合計バイトを64にすると、この64は、8バイトで割り切れる)。別の実施例として、データセグメントA180が(例えば、8によって割り切れない)60バイトのデータを含む場合には、データパディング202は、4バイトのデータを含むであろう。さらなる実施例として、データセグメントA180が64バイトのデータを含む場合には、データパディング202は、ゼロバイトのデータを含むであろう。換言すると、データセグメントA180とデータセグメントF190との間にデータパディング202を必要としないであろう。認識されるように、各データパディング202、204、206、208、210、212及び214も、同様の様式で作用することができる。
ここで図13を参照し、図12のデータブロック172、174、176及び178のデータセグメントの後に挿入されるデータパディングの一実施例を図示する。具体的には、各データブロック172、174、176及び178におけるバイト数を等しくするために、必要に応じて、各データブロック172、174、176及び178の終端にデータパディングを挿入してもよい。さらにまた、各データブロック172、174、176及び178の終端に位置するデータパディングを使用できることによって、各データブロック172、174、176及び178は前述のような完全なワード境界に達する。図示する実施形態においては、データセグメントI196の後ろにデータパディング216が挿入され、データセグメントG192の後ろにデータパディング218が挿入され、そしてデータセグメントJ198の後ろにデータパディング220が挿入される。したがって、データブロック172、174、176及び178の各々が、等しいバイト数を含み、かつ完全なワード境界に達する。
FSMラチス30にとって、データパディングを有効データと区別することが困難である場合がある。したがって、有効データの解析中にFSMラチス30がデータパディングを識別して無視できるように、命令をデータブロック172、174、176及び178に付随させることができる。そのような命令は、プロセッサ12によってバスインターフェイス130を通じてステートマシンエンジン14に送信され、そしてステートマシンエンジン14の命令バッファ160によって受信、格納及び提供することができる。命令を生成するために、プロセッサ12は、データストリーム170を、領域222、224、226、228、230、232、234及び236に論理的に分けることができる。領域222、224、226、228、230、232、234及び236の端部境界は、各領域が任意のデータパディング端部を終端とするように形成できる。例えば、第一の領域222は、データパディング208端部を終端とする。別の実施例として、第五の領域230は、データパディング204端部を終端とする。
データブロック172、174、176及び178に付随する命令は、各領域222、224、226、228、230、232、234及び236のバイトの合計数、並びに各領域内の各データブロック172、174、176及び178における有効バイト数(例えば、パディングのバイトを除くバイト数)を含むことができる。例えば、命令は、第一の領域222に対応するバイト数238、第一の領域222内の第一のデータブロック172における有効バイトに対応するバイト数240、第一の領域222内の第二のデータブロック174における有効バイトに対応するバイト数242、第一の領域222内の第三のデータブロック176における有効バイトに対応するバイト数244、及び第一の領域222内の第四のデータブロック178における有効バイトに対応するバイト数246を含むことができる。この実施例においては、データセグメントA1、B1及びD1に続くパディングが存在しないため、238、240、242及び246に示すバイト数が等しいことに留意されたい。
同じように、命令は、第二の領域224に対応するバイト数248、250、252、254及び256、第三の領域226に対応するバイト数258、260、262、264及び266、第四の領域228に対応するバイト数268、270、272、274及び276、第五の領域230に対応するバイト数278、280、282、284及び286、第六の領域232に対応するバイト数288、290、292、294及び296、第七の領域234に対応するバイト数298、300、302、304及び306、並びに、第八の領域236に対応するバイト数308、310、312、314及び316を含むことができる。命令が各領域222、224、226、228、230、232、234、236内の各データセグメントにおける有効バイト数を含むことができることが留意されるべきである。したがって、第七の領域234では、論理グループA162は、有効バイト数300がゼロであってもよい。さらにまた、第八の領域236では、論理グループA162は、有効バイト数310がゼロであってもよい。したがって、FSMラチス30は、命令を使用して、データセグメントに挿入されるデータパディングを識別することができる。1つの特定のタイプの命令を本明細書に提示したが、データブロック172、174、176及び178のグループに含まれる命令が、FSMラチス30がデータパディング(すなわち、無効データ)から有効データを区別できる任意の適切なグループの命令であってもよいことが留意されるべきである。
ここで図14を参照し、ステートマシンエンジン14のデータバッファシステム159に伝送するために、プロセッサ12によって組織化された図13のデータブロック172、174、176及び178の一実施例を図示する。データブロック172、174、176及び178の各々は、全体のワード長と等しいバイト数318を有するデータの行で配列される。図示する実施形態においては、全体のワード長は、各ステートマシンエンジン14(例えば、F0、F1、F2、F3、F4、F5、F6及びF7)が1バイトを示すため、8バイトである。データセグメントの各々からの第一のバイトは各データブロック172、174、176及び178の右側から始まり、データセグメントA180における第一のバイトが列F0に位置し、データセグメントA180における第八のバイトが列F7に位置するように、各データブロックの左側に向かうほど増大する。認識されるように、列F0は、F0ステートマシンエンジン14のデータバッファ132に最初に格納されるデータを表し、列F1は、F1ステートマシンエンジン14のデータバッファ132に最初に格納されるデータを表し、それ以降も同様である。さらにまた、データセグメントは、行内において上部から底部まで配置される。図示するように、データセグメントとデータパディングとの各々の組み合わせは、列F7を終端とする(すなわち、それらの各々が全体のワード長に広がる)。さらにまた、各データブロック172、174、176及び178のサイズは等しい。認識されるように、動作中、データブロック172、174、176及び178は、プロセッサ12からステートマシンエンジン14に連続的に提供することができる。
任意のブロック(172、174、176及び178)のデータは、対応する論理グループ(162、164、166または168のそれぞれ)用に意図されたデータが、ランクにおけるステートマシンエンジン14のデータバッファシステム159の全体にわたって散布されるように、ランクにおけるデバイス内の全てのステートマシンエンジン14のデータバッファシステム159にわたって提供され、格納される。データは、バスインターフェイス130を通じてデータバッファシステム159に迅速に提供できるような方法で受信及び格納することができる。ある実施形態においては、データバッファシステム159のデータバッファ132は、バスインターフェイス130からのデータを(例えば、所定の間隔で)ラッチするように構成できる。他の実施形態においては、データバッファシステム159のデータバッファ132は、データバッファ132とバスインターフェイス130との間の接続に基づいて、データの限られた部分だけを受信することができる。以下に詳細に説明するように、データバッファシステム159に格納されたデータは、データがデータバッファシステム159からIRバス及びプロセスバッファインターフェイス136を通じてプロセスバッファ134に提供されるときに選別される。
図15は、デバイスがランクにおいて配列されており、IRバス及びプロセスバッファインターフェイス136によってともに結合された複数の物理的なステートマシンエンジン14の一実施例を図示する。具体的には、図示する実施形態においては、8つのステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)が、単一プリント基板に配列されて、モジュール340を形成する。ある実施形態においては、モジュール340は、デュアルインラインメモリモジュール(DIMM)と同様に配列されてもよい。例えば、単一チップは、ステートマシンエンジン14を1つだけ含んでもよい。さらにまた、1つのステートマシンエンジン14を各々が有する複数のチップを、モジュール340のプリント基板に結合(例えば、電気的に、光学的に、別なように動作可能に結合)してもよい。例えば、プリント基板は、1つのステートマシンエンジン14を各々が含む1個、2個、4個、8個、16個またはそれ以上のチップを含んでもよい。さらに、ある実施形態においては、モジュール340は、モジュール340とコンピュータ、ワークステーションまたはサーバなどのシステムとを結合するための、72個、100個、144個、168個、184個、200個、240個またはより少ないもしくは多いピンまたは接続素子を含むことができる。例えば、モジュール340は、240個のピンを含み、サーバにおけるスロット内に挿入されるように構成することができる。
モジュール340のピンは、DDR3バスインターフェイス130に結合し、プロセッサ12とモジュール340との間のデータ転送を容易にする。さらに、モジュール340のピンは、プリント基板のルーティングラインを使用して、ステートマシンエンジン14(例えば、F0、F1、F2、F3、F4、F5、F6及びF7)を有するチップのピンに結合される。DDR3バスインターフェイス130は、プロセッサ12に、各ステートマシンエンジン14のデータバッファシステム159のメモリアドレスを選択させることができるDDR3アドレスバス342を含む。図示するように、DDR3アドレスバス342は、16個のアドレス線を含む。しかしながら、他の実施形態においては、DDR3アドレスバス342は、16個よりも少ないまたは多いアドレス線を含んでもよい。DDR3アドレスバス342の各アドレス線は、各ステートマシンエンジン14のデータバッファシステム159に結合される。したがって、プロセッサ12は、各ステートマシンエンジン14のデータバッファシステム159のアドレスをともに選択することができる。
認識できるように、ステートマシンエンジン14とプロセッサ12との間のDDR3バスインターフェイス130によって、ステートマシンエンジン14が、プロセッサ12からの全てのデータ線を使用して、プロセッサ12からデータを受信することができてもよい。例えば、プロセッサ12が64本のデータ線を有し、各ステートマシンエンジン14が8本のデータ線を有する場合には、プロセッサ12の全てのデータ線からデータを受信するように、8つのステートマシンエンジン14が64本のデータ線に結合することができる。したがって、プロセッサ12は、迅速にかつ標準インターフェイスを使用して、ステートマシンエンジン14にデータを提供することができる。さらに、ステートマシンエンジン14は、ステートマシンエンジン14によって集合的に受信される全てのデータが全てのステートマシンエンジン14に正しい手順で提供されるように、ともに調整するように構成できる。図示する実施形態においては、DDR3バスインターフェイス130は、各ステートマシンエンジン14に結合されたデータ線344、346、348、350、352、354、356及び358の組を有するデータバス343を含む。図示するように、個々のデータ線が各ステートマシンエンジン14に結合される。例えば、ある実施形態においては、データバス343は、64本のデータ線を含み、モジュール340は、8つのステートマシンエンジン14を含む。そのような実施形態においては、8本のデータ線が、8つのステートマシンエンジン14の各々に結合され、かつ/またはそれぞれに専用であってもよい。したがって、データバス343及びDDR3アドレスバス342を使用して、それぞれのデータバイトを、各ステートマシンエンジン14のデータバッファシステム159の選択されたアドレスに同期して提供することができる。ある実施形態においては、8本よりも少ないまたは多いデータ線が、ステートマシンエンジン14とデータバス343とを結合してもよい。さらにまた、DDR3バスインターフェイス130は、64本よりも少ないまたは多いデータ線を含んでもよい。以下の表、表1は、規定の数のデータ線を有するDDR3バスインターフェイス130の構成、及びステートマシンエンジン14に結合されたDDR3バスインターフェイス130におけるデータ線の数の種々の実施例を図示する。
表1に図示するように、データバス343が8本のデータ線を含む場合には、その8本のデータ線が、8本の線の入力データバス幅を有する1つのステートマシンエンジン14に結合することができる。別の実施例として、データバス343が16本のデータ線を含む場合には、その16本のデータ線が、8本の線の入力データバス幅を有する2つのステートマシンエンジン14、または16本の線の入力データバス幅を有する1つのステートマシンエンジン14に結合することができる。さらなる実施例として、データバス343が32本のデータ線を含む場合には、その32本のデータ線が、8本の線の入力データバス幅を有する4つのステートマシンエンジン14、または16本の線の入力データバス幅を有する2つのステートマシンエンジン14に結合することができる。さらに、データバス343が64本のデータ線を含む場合には、その64本のデータ線が、8本の線の入力データバス幅を有する8つのステートマシンエンジン14、または16本の線の入力データバス幅を有する4つのステートマシンエンジン14に結合することができる。
DDR3バスインターフェイス130は、プロセッサ12とモジュール340との間のデータ転送を容易にするための他の制御線360、362、364、366、368、370、372及び374を含む。他の制御線360、362、364、366、368、370、372及び374によって、プロセッサ12と選択されたステートマシンエンジン14との間の個別の通信、及び/またはプロセッサ12と集合的なステートマシンエンジン14との間の通信が可能になる。
動作中、プロセッサ12は、DDR3バスインターフェイス130にデータを提供できる。例えば、プロセッサ12は、64本のデータ線を有するデータバスを使用して、一度に64ビットのデータを提供することができる。さらにまた、ステートマシンエンジン14は、その各々が、各ステートマシンエンジン14に結合された8本のデータ線から8ビットのデータを受信することができる。したがって、プロセッサ12は、一度に64ビットのデータをモジュール340に提供することができる。前述のように、ステートマシンエンジン14は、他の異なるステートマシンエンジン14によって解析されるべきデータを受信するように構成できる。それゆえ、プロセッサ12は、モジュール340のステートマシンエンジン14の1つ以上によって処理されるように各データブロックが意図されたデータブロックにおいて、モジュール340にデータを提供することができる。換言すると、プロセッサ12は、それが提供するデータブロックをソート及び/またはパックしなくてもよい。例えば、プロセッサ12は、連続的なバイト数のデータの一部がステートマシンエンジン14の各々(F0、F1、F2、F3、F4、F5、F6及びF7)によって受信及び格納される場合でさえも、ステートマシンエンジン14F0によって解析されるように意図された連続的なバイト数のデータを提供することができる。したがって、プロセッサ12は、単純かつ効率的な様式でデータをモジュール340に提供し、ステートマシンエンジン14に、選択されたステートマシンエンジン14によって処理されるデータをソートさせることができる。
プロセッサ12は、ステートマシンエンジン14に、プロセッサ12から提供される各データブロックを解析するようステートマシンエンジン14に命令するための命令、ステートマシンエンジン14に、一定期間(例えば、所定の期間)中データを解析させるための命令、及びステートマシンエンジン14に、プロセッサ12から提供される各データブロックの長さに関する命令も提供することができる。ある実施形態においては、データバッファシステム159は、プロセッサ12から受信した命令を格納するための特定のメモリロケーションを含むことができる。したがって、プロセッサ12は、DDR3アドレスバス342を使用して、命令の受信に専用のデータバッファシステム159の所定のアドレスを選択することができる。次に、プロセッサ12は、データバス343及びDDR3アドレスバス342を使用して、ステートマシンエンジン14の各々に命令を提供することができる。
IRバス及びプロセスバッファインターフェイス136は、モジュール340の一部であり、ステートマシンエンジン14を相互接続する接続(例えば、電気的、光学的または別の動作可能な接続)を含む。図示するように、IRバス及びプロセスバッファインターフェイス136は、インストラクションバスの一部であってもよいIRデータバス376及び他の制御線378を含む。図示する実施形態においては、IRデータバス376は、ステートマシンエンジン14の各々を互いに結合する8本のデータ線を含む。具体的には、IRデータバス376は、各ステートマシンエンジン14のデータバッファシステム159と、各ステートマシンエンジン14のプロセスバッファ134とを結合する。さらに、IRデータバス376を使用して、プロセッサ12から受信したデータをデータの解析のための他のステートマシンエンジン14に提供することができる。他の制御線378を使用して、ステートマシンエンジン14間のデータ転送を同期及び/または制御することができる。
ステートマシンエンジン14を有する各チップは、プロセッサ12から受信したデータを処理するために論理グループにグループ化してもよい。認識できるように、モジュール340のステートマシンエンジン14は、1つ以上の論理グループを含むことができる。モジュール340では、全てのステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)を含む1つの論理グループが存在してもよい。さらにまた、2つ、3つ、4つ、5つ、6つ、7つまたは8つの論理グループが存在してもよい。論理グループは、任意の数のステートマシンエンジン14を有することができ、同一サイズでなくてもよい。例えば、一実施形態においては、第一の論理グループは、ステートマシンエンジン14F0及びF1を含んでもよく、第二の論理グループは、ステートマシンエンジン14F2、F3、F4、F5、F6及びF7を含んでもよい。2つ以上のステートマシンエンジン14を含むことができる論理グループを使用することによって、単一のステートマシンエンジン14にプログラムするには大き過ぎる単一のオートマトンプロセッサブロックを、論理グループによって解析することができる。さらにまた、論理グループは、複数のデータブロックを、別個の論理グループによって同時に解析できるようにする。さらに、論理グループは、例えば、同一サイズを有する論理グループを使用して、かつ/またはパラレルプロセッシングによって、ハイスループット速度においてデータを解析できるようにする。したがって、モジュール340のアーキテクチャは、フレキシビリティをもたらし、モジュール340の単一のステートマシンエンジン14に、最大1.0Gbps以上のレートでデータを処理させることができる。さらにまた、モジュール340のアーキテクチャは、モジュール340に、例えば8つのステートマシンエンジン14を使用したパラレルの8つの論理グループにおいてデータを処理させることができる。それによって、単一のステートマシンエンジン14の最大8倍のレート(例えば、8.0Gbps以上)のデータ処理レートを達成することができる。
各ステートマシンエンジン14が論理グループの一部である場合でさえも、ステートマシンエンジン14は、それらが特定の論理グループの一部であることの何らかの指示、及び/またはその論理グループの一部であるステートマシンエンジン14の数についての何らかの指示を受信しなくてもよい。しかしながら、特定の情報を、命令として及び/または他の制御線360、362、364、366、368、370、372及び374を使用して、ステートマシンエンジン14に提供してもよい。例えば、ステートマシンエンジン14は、DDR3バスインターフェイス130の合計のバス幅、DDR3バスインターフェイス130に結合されたデータ線の数、IRデータバス376のデータ線の数、DDR3バスインターフェイス130におけるデバイス位置、IRデータバス376におけるデバイス位置、ステートマシンエンジン14がマスタデバイスであるか否か、ステートマシンエンジン14がスレーブデバイスであるか否か、実行されるIRデータバス376サイクルの数、受信されるバイト数、及び/または解析される(例えば、有効データの)バイト数についての指示を受信及び/または格納することができる。
例えば、モジュール340の初期化中、プロセッサ12は、各ステートマシンエンジン14(例えば、0、1、2、3、4、5、6、7)に数を割り当てるように、各ステートマシンエンジン14にデータを提供することができる。ある実施形態においては、「0」を受信するステートマシンエンジン14が、ステートマシンエンジン14F0かつ「マスタ」デバイスであってもよく、全ての他のデバイスが「スレーブ」デバイスであってもよい。他の実施形態においては、「マスタ」デバイスに、任意の適切な値を割り当てることができる。ある実施形態においては、「マスタ」デバイスは、ステートマシンエンジン14の同期を調整するように構成できる。プロセッサ12は、モジュール340の一部であるステートマシンエンジン14の総数、ステートマシンエンジン14が属する論理グループ、及び/またはモジュール340の一部である論理グループの数を表すデータも各ステートマシンエンジン14に提供することができる。
論理グループが1つである一実施形態においては、IRバス及びプロセスバッファインターフェイス136によって、ランクにおける各ステートマシンエンジン14(例えば、F0、F1、F2、F3、F4、F5、F6及びF7)が、プロセッサ12によって提供された全てのデータバイトを解析できる。したがって、そのような実施形態においては、全データストリームを、ステートマシンエンジン14の各々において処理することができる。複数の論理グループを有する別の実施形態においては、IRバス及びプロセスバッファインターフェイス136によって、ランクにおける各ステートマシンエンジン14が、データスライシングのスキームを実施することによって、データストリームのうちの割り当てられた一部をタイムリーに受信することができる。例えば、プロセッサ12は各論理グループ用に意図されたデータを連続的に提供することができるが、ステートマシンエンジン14は、意図されたステートマシンエンジン14にデータを効率的に提供するようIRデータバス376にデータを提供できるように、オフセット様式において、データを各ステートマシンエンジン14のデータバッファシステム159に格納することができる。
図16は、複数の物理的なステートマシンエンジン14に結合されたIRバス及びプロセスバッファインターフェイス136の一実施例を図示する。具体的には、図示する実施形態は、2つの論理グループ(すなわち、論理グループ0及び論理グループ1)に分けられた4つのステートマシンエンジン14を含む。さらにまた、4つのステートマシンエンジン14は、32本のデータ線を有するDDR3バスインターフェイス130に結合することができる。前述のように、IRデータバス376がステートマシンエンジン14の各々に結合される。さらにまた、他の制御線378は、ステートマシンエンジン14の各々に結合されたランク同期化線(RSYNC)380、IRバスデータ有効線(IRDV)382、第一のIRバスデータストローブ線(IRDQS)384、及び第二のIRバスデータストローブ線(IRDQS#)386を含む。ステートマシンエンジン14の各々は、RSYNC380からの入力を受信し、かつ/またはRSYNC380の信号を制御するように構成される。例えば、一実施形態においては、「スレーブ」デバイス及び/または「マスタ」デバイスは、RSYNC380を論理0に引き込むことによって、RSYNC380の信号を論理1から論理0に制御するように構成できる。一方で、「マスタ」デバイスは、RSYNC380から受信した入力に基づいて、IRDV382の信号を制御するように構成できる。図示する実施形態においては、ステートマシンエンジン14F0が「マスタ」デバイスとして構成され、一方で、ステートマシンエンジン14F1、F2及びF3が「スレーブ」デバイスとして構成されている。さらにまた、ステートマシンエンジン14F1、F2及びF3は、RSYNC380の信号を制御するように構成され、一方で、ステートマシンエンジン14F0は、RSYNC380から受信した入力に基づいて、IRDV382の信号を制御するように構成される。ステートマシンエンジン14F0は、ステートマシンエンジン14F1、F2及びF3の全てがデータの受信に利用可能であることを示す第一の指示(例えば、論理ハイ)を受信するように構成できる。さらに、ステートマシンエンジン14F0は、ステートマシンエンジン14F1、F2及びF3の少なくとも1つがデータの受信に利用できないことを示す第二の指示(例えば、論理ロウ)を受信するように構成できる。例えば、ステートマシンエンジン14F1、F2及びF3の任意の1つは、ステートマシンエンジン14F1、F2及びF3の少なくとも1つがデータの受信に利用できないことを、ステートマシンエンジン14F0に通知するために、RSYNC380の信号を論理ロウに制御(例えば、論理ロウを出力)することができる。
さらに、ステートマシンエンジン14の各々は、IRDV382からの入力を受信し、かつ/またはIRDV382の信号を制御するように構成される。例えば、一実施形態においては、「マスタ」デバイスは、IRDV382の信号を制御するように構成でき、一方で、「スレーブ」デバイスは、IRDV382からの入力を受信するように構成できる。図示する実施形態においては、ステートマシンエンジン14F0は、IRDV382の信号を制御するように構成され、一方で、ステートマシンエンジン14F1、F2及びF3は、IRDV382からの入力を受信するように構成される。ステートマシンエンジン14F0は、ステートマシンエンジン14F1、F2及びF3に提供されるデータが有効であることを示す第一の指示(例えば、論理ハイ)に信号を制御するように構成できる。さらに、ステートマシンエンジン14F0は、ステートマシンエンジン14F1、F2及びF3に提供されるデータが無効であることを示す第二の指示(例えば、論理ロウ)に信号を制御するように構成できる。ステートマシンエンジン14の各々は、IRDQS384及びIRDQS#386からの入力を受信し、かつそれらに出力を提供するように構成される。さらに、ステートマシンエンジン14の各々は、IRDQS384及び/またはIRDQS#386にデータを出力し、その一方で、IRデータバス376にもデータを提供するように構成される。
図17は、IRバス及びプロセスバッファインターフェイス136の信号のタイミング図の一実施例を図示する。特定の構成では、RSYNC380を使用して、ステートマシンエンジン14を同期することができる。例えば、ステートマシンエンジン14の各々は、ステートマシンエンジン14がRSYNC380の信号を論理ロウに駆動する(例えば、RSYNC380を論理ロウに「引き込む」)デフォルト状態を含むことができる。プロセッサ12は、ステートマシンエンジン14の同期を起動するための種々の命令をステートマシンエンジン14に提供することができる。例えば、同期を起動するための命令は、M_BAR、I_DA.PROCESS、I_DA.PROCESS_EoP、I_DA.PROCESS_EoD、I_DB.PROCESS、I_DB.PROCESS_EoP、及びI_DB.PROCESS_EoDを含んでもよい。ステートマシンエンジン14は、これらの命令のうちの1つに遭遇すると、RSYNC380の信号の論理ロウへの駆動を停止し(例えば、RSYNC380を「手放し」)、動作を中断する(例えば、命令の実行を継続しない)。ステートマシンエンジン14は、RSYNC380が論理ハイに遷移する(これは、全てのステートマシンエンジン14がRSYNC380の信号の論理ロウへの駆動を停止した後、またはRSYNC380の「手放し」の後に起こる)、かつ/またはIRDV382が論理ハイに遷移するまで、動作を中断する。ステートマシンエンジン14は、RSYNC380及び/またはIRDV382が論理ハイであることを検出すると、同期を起動するための命令の動作を再開する。同期を起動するための命令の終了時に、ステートマシンエンジンは、ステートマシンエンジン14がRSYNC380の信号を論理ロウに駆動する(例えば、RSYNC380を論理ロウに「引き込む」)そのデフォルト状態に戻ることができる。
そのような動作中に交換される信号の一実施形態を図17に図示する。例えば、時点388に、RSYNC380は、論理ロウから論理ハイに遷移する。そのような遷移は、全てのステートマシンエンジン14F0、F1、F2及びF3がステートマシンエンジン14の同期を起動するための命令を(例えば、プロセッサ12から)受信し、全てのステートマシンエンジン14F0、F1、F2及びF3が動作を中断し、そして全てのステートマシンエンジン14F0、F1、F2及びF3がRSYNC380の信号の論理ロウへの駆動を停止したことを示す。この実施例においては、ステートマシンエンジン14F0、F1、F2及びF3は、データバッファ処理命令(例えば、I_DA.PROCESS、I_DA.PROCESS_EoP、I_DA.PROCESS_EoD、I_DB.PROCESS、I_DB.PROCESS_EoP、及びI_DB.PROCESS_EoD)に遭遇した。時点390に、RSYNC380は、論理ハイから論理ロウに遷移する。そのような遷移は、ステートマシンエンジン14F0、F1、F2及びF3の少なくとも1つがデータバッファ処理命令を完了し、ステートマシンエンジン14F0、F1、F2及びF3の少なくとも1つがRSYNC380を論理ロウに引き込んだことを示す。
時点392に、IRDV382は、論理ロウから論理ハイに遷移する。そのような遷移は、「マスタ」ステートマシンエンジン14F0から全てのステートマシンエンジン14F0、F1、F2及びF3への有効データが、IRデータバス376に提供され始め、その提供が「マスタ」デバイスから始まり、ランクにおける各ステートマシンエンジン14を通して順番に(例えば、F0、F1、F2、F3)継続していることを示すものである。時点394に、IRDV382は、論理ハイから論理ロウに遷移する。そのような遷移は、「マスタ」ステートマシンエンジン14F0から全てのステートマシンエンジン14F0、F1、F2及びF3への有効データがもはやIRデータバス376に提供されていないことを示すものである。
時点396に、「マスタ」ステートマシンエンジン14F0が、データ(例えば、論理グループ0用に意図された第一のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。その後、時点397に、「マスタ」ステートマシンエンジン14F0は、データ(例えば、論理グループ1用に意図された第二のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。さらに、時点398に、ステートマシンエンジン14F1が、データ(例えば、論理グループ0用に意図された第一のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。その後、時点399に、ステートマシンエンジン14F1は、データ(例えば、論理グループ1用に意図された第二のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。
さらにまた、時点400に、ステートマシンエンジン14F2が、データ(例えば、論理グループ0用に意図された第一のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。その後、時点401に、ステートマシンエンジン14F2は、データ(例えば、論理グループ1用に意図された第二のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。さらに、時点402に、ステートマシンエンジン14F3が、データ(例えば、論理グループ0用に意図された第一のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。その後、時点403に、ステートマシンエンジン14F3は、データ(例えば、論理グループ1用に意図された第二のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。
したがって、ステートマシンエンジン14の各々は、2バイトのデータの「バースト長」を有するデータを提供する(例えば、各ステートマシンエンジン14は、ランクにおける次のステートマシンエンジン14がデータを提供する前に2バイトのデータを出力する)。図示する実施形態においては、第一のデータバイトは、第一の論理グループ(論理グループ0)用に意図されたデータであり、第二のデータバイトは、第二の論理グループ(論理グループ1)用に意図されたデータである。認識できるように、「バースト長」は、他の実施形態においては異なってもよい。例えば、「バースト長」は、論理グループの数に基づいてもよいし、論理グループの数と等しくてもよいし、その他であってもよい。データがIRデータバス376に提供されたときに、ステートマシンエンジン14は、データを受信し、ステートマシンエンジン14用に意図されたデータを格納する。例えば、ステートマシンエンジン14F0及びF1は、論理グループ0の一部であるため、ステートマシンエンジン14のF0及びF1各々によって提供されたあらゆる第一のバイトを格納する。さらにまた、ステートマシンエンジン14F2及びF3は、論理グループ1の一部であるため、ステートマシンエンジン14のF2及びF3各々によって提供されたあらゆる第二のバイトを格納する。ある実施形態においては、ステートマシンエンジン14の各々は、IRDQS384及び/またはIRDQS#386の立ち下がりエッジに基づいてデータを格納するように構成される。
図示する実施形態においては、ステートマシンエンジン14の各々は、唯一つのデータバーストを提供した。しかしながら、認識できるように、時点390にRSYNC380が論理ハイから論理ロウに遷移する前に、データバーストを提供する各ステートマシンエンジン14の回転サイクルを任意の回数繰り返してもよい。ある実施形態においては、データバーストを提供する各ステートマシンエンジン14のサイクルは、プロセッサ12からステートマシンエンジン14に提供される命令に基づいて繰り返すことができる。例えば、プロセッサ12は、それぞれのステートマシンエンジン14がIRデータバス376から格納可能なバイト数(CNTC)を示す指示を、ステートマシンエンジン14の各々に提供できる。したがって、データバーストを提供する各ステートマシンエンジン14のサイクルを、CNTC数と等しい回数繰り返すことができる。ある実施形態においては、CNTC数は、論理グループに提供される最長データグループの全長と等しくてもよい。その結果、その意図されたデータを受信するための十分なサイクルを各論理グループに与えることができる。さらに、プロセッサ12は、それぞれのステートマシンエンジン14が解析可能なバイト数(CNTV)を示す指示を、ステートマシンエンジン14の各々に提供できる。ある実施形態においては、CNTC数がCNTV数よりも大きい場合には、ステートマシンエンジン14は、CNTV数を超えてCNTC数に至るまでの受信したバイトを、無効データ(例えば、ジャンクデータ、ガベージデータなど)とみなすことができる。
時点404に、RSYNC380は、論理ロウから論理ハイに遷移する。そのような遷移は、全てのステートマシンエンジン14F0、F1、F2及びF3がステートマシンエンジン14の同期を起動するための命令を(例えば、プロセッサ12から)受信し、全てのステートマシンエンジン14F0、F1、F2及びF3が動作を中断し、そして全てのステートマシンエンジン14F0、F1、F2及びF3がRSYNC380の信号の論理ロウへの駆動を停止したことを示す。この実施例においては、ステートマシンエンジン14F0、F1、F2及びF3は、M_BAR命令に遭遇した。M_BAR命令は、さらなる命令がステートマシンエンジン14によって実行される前に、ステートマシンエンジン14を同期するのに使用される。時点405に、RSYNC380は、論理ハイから論理ロウに遷移する。そのような遷移は、ステートマシンエンジン14F0、F1、F2及びF3の少なくとも1つがRSYNC380を論理ロウに引き込み、ステートマシンエンジン14が、同期され、さらなる命令の実行に進むことができることを示す。
時点406に、RSYNC380は、論理ロウから論理ハイに遷移する。この実施例においては、ステートマシンエンジン14F0、F1、F2及びF3は、別のデータバッファ処理命令(例えば、I_DA.PROCESS、I_DA.PROCESS_EoP、I_DA.PROCESS_EoD、I_DB.PROCESS、I_DB.PROCESS_EoP、及びI_DB.PROCESS_EoD)に遭遇した。したがって、時点407に、IRDV382は、論理ロウから論理ハイに遷移する。そのような遷移は、「マスタ」ステートマシンエンジン14F0から全てのステートマシンエンジン14F0、F1、F2及びF3への有効データが、IRデータバス376に提供され始め、その提供が「マスタ」デバイスから始まり、ランクにおける各ステートマシンエンジン14を通して順番に(例えば、F0、F1、F2、F3)継続していることを示すものである。時点408に、「マスタ」ステートマシンエンジン14F0は、データ(例えば、論理グループ0用に意図された第一のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。その後、時点409に、「マスタ」ステートマシンエンジン14F0は、データ(例えば、論理グループ1用に意図された第二のデータバイト)をIRデータバス376に提供し、論理ハイをIRDQS384及び/またはIRDQS#386に出力する。他のステートマシンエンジン14は、その後、時点388〜時点394に関して前述したようにIRデータバス376にデータを提供することができる。
ステートマシンエンジン14の動作中、RSYNC380及びIRDV382を使用して全てのステートマシンエンジン14がともに同期された同期様式で、データをIRデータバス376に提供してもよい。さらに、ステートマシンエンジン14の各々は、モジュール340を構成するランクにおけるデバイス内のそれ自身の位置を示す命令を格納する。それゆえ、ステートマシンエンジン14の各々は、データ格納及びデータ出力のタイミングをとって、IRデータバス376を使用する順序の正しいデータ転送を容易にすることができることによって、データを適切な時に提供及び格納する。認識できるように、データ転送処理中にはエラーが発生することがある。したがって、「マスタ」ステートマシンエンジン14F0は、任意の時にIRDV382を論理ロウに遷移することによって、エラーが解決するまで、IRデータバス376へのデータ転送を停止(例えば、ブロック、ストール、遅延など)してもよい。さらにまた、ステートマシンエンジン14F1、F2及びF3の任意の1つは、RSYNC380を論理ロウに導くことによって、IRデータバス376へのデータ転送を停止すべきであるという指示を、「マスタ」ステートマシンエンジン14F0に提供することができる。
図18は、複数の論理グループに組織化された複数の物理的なステートマシンエンジン14のデータバッファ132に格納されたデータの一実施例を図示する。具体的には、図18は、8つの論理グループに組織化された8つのステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)を有するモジュール340におけるDDR3インターフェイスビューの表410を図示する。8つの論理グループを持つそのような構成は、8つのステートマシンエンジン14を有するモジュール340において最大データスループットを提供することができる。図示する実施形態においては、ステートマシンエンジン14は、64本のデータ線を有するDDR3バスインターフェイス130に結合される。したがって、8本のデータ線が各ステートマシンエンジン14に結合される。しかしながら、本明細書に記述するのと同じ概念を、各ステートマシンエンジン14に結合された任意の適切な数のデータ線を持つ任意の適切なDDR3バスインターフェイス130に適用することができる。さらにまた、本明細書に記述するのと同じ概念を、任意の適切な数のステートマシンエンジン14を有するモジュール340に適用することができる。表410は、モジュール340がプロセッサ12から受信し、ステートマシンエンジン14の間でオフセット様式において格納するデータを図示する。モジュール340にデータを格納するのに、プロセッサ12を使用してデータを再配列するのではなく、オフセット様式においてモジュール340を使用することによって、プロセッサ12を他の機能の実行に自由に使用することができる。
表410は、プロセッサ12から64本のデータ線に書き込む数を示す書き込みカウント列412、及びプロセッサ12からバイトを受信した時に基づく、番号順における個々のバイト数を示すバイト数列414を含む。バイト数列414は、それぞれのステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)のデータバッファシステム159に格納された具体的なバイトを示す列F0、F1、F2、F3、F4、F5、F6及びF7を含む。表410は、バイト数列414に示されるバイトが格納される、データバッファシステム159のデータバッファA及びB132の各々内のアドレスを示すデータバッファアドレス列416、及びステートマシンエンジン14の特定の論理グループによって処理されるデータを示すターゲット列418も含む。例えば、プロセッサ12から64本のデータ線への第一の書き込み期間(例えば、書き込みカウント列412における0)に、プロセッサ12は、DDR3アドレスバス342に、データバッファシステム159の第一のアドレスのアドレス選択(例えば、プロセッサ書き込みアドレス0)、及び対応する8バイトのデータを提供する。この結果、第一のデータバイト(例えば、0)を、第一のステートマシンエンジン14(例えば、F0)の第一のデータバッファアドレス416(例えば、0)において第一のステートマシンエンジン14(例えば、F0)に格納し、第二のデータバイト(例えば、1)を、第二のステートマシンエンジン14(例えば、F1)の同一の第一のデータバッファアドレス416(例えば、0)において第二のステートマシンエンジン14(例えば、F1)に格納し、第三のデータバイト(例えば、2)を、第三のステートマシンエンジン14(例えば、F2)の同一の第一のデータバッファアドレス416(例えば、0)において第三のステートマシンエンジン14(例えば、F2)に格納し、第四のデータバイト(例えば、3)を、第四のステートマシンエンジン14(例えば、F3)の同一の第一のデータバッファアドレス416(例えば、0)において第四のステートマシンエンジン14(例えば、F3)に格納し、第五のデータバイト(例えば、4)を、第五のステートマシンエンジン14(例えば、F4)の同一の第一のデータバッファアドレス416(例えば、0)において第五のステートマシンエンジン14(例えば、F4)に格納し、第六のデータバイト(例えば、5)を、第六のステートマシンエンジン14(例えば、F5)の同一の第一のデータバッファアドレス416(例えば、0)において第六のステートマシンエンジン14(例えば、F5)に格納し、第七のデータバイト(例えば、6)を、第七のステートマシンエンジン14(例えば、F6)の同一の第一のデータバッファアドレス416(例えば、0)において第七のステートマシンエンジン14(例えば、F6)に格納し、そして第八のデータバイト(例えば、7)を、第八のステートマシンエンジン14(例えば、F7)の同一の第一のデータバッファアドレス416(例えば、0)において第八のステートマシンエンジン14(例えば、F7)に格納することができる。
別の実施例として、プロセッサ12から64本のデータ線への第二の書き込み期間(例えば、書き込みカウント列412における1)に、プロセッサ12は、DDR3アドレスバス342に、データバッファシステム159の第二のアドレスのアドレス選択(例えば、プロセッサ書き込みアドレス1)、及び対応する8バイトのデータを提供する。この結果、第一のデータバイト(例えば、8)を、第一のステートマシンエンジン14(例えば、F0)の第二のデータバッファアドレス416(例えば、8)において第一のステートマシンエンジン14(例えば、F0)に格納し、第二のデータバイト(例えば、9)を、第二のステートマシンエンジン14F1の同一の第二のデータバッファアドレス416(例えば、8)において第二のステートマシンエンジン14(例えば、F1)に格納し、第三のデータバイト(例えば、10)を、第三のステートマシンエンジン14(例えば、F2)の同一の第二のデータバッファアドレス416(例えば、8)において第三のステートマシンエンジン14(例えば、F2)に格納し、第四のデータバイト(例えば、11)を、第四のステートマシンエンジン14(例えば、F3)の同一の第二のデータバッファアドレス416(例えば、8)において第四のステートマシンエンジン14(例えば、F3)に格納し、第五のデータバイト(例えば、12)を、第五のステートマシンエンジン14(例えば、F4)の同一の第二のデータバッファアドレス416(例えば、8)において第五のステートマシンエンジン14(例えば、F4)に格納し、第六のデータバイト(例えば、13)を、第六のステートマシンエンジン14(例えば、F5)の同一の第二のデータバッファアドレス416(例えば、8)において第六のステートマシンエンジン14(例えば、F5)に格納し、第七のデータバイト(例えば、14)を、第七のステートマシンエンジン14(例えば、F6)の同一の第二のデータバッファアドレス416(例えば、8)において第七のステートマシンエンジン14(例えば、F6)に格納し、そして第八のデータバイト(例えば、15)を、第八のステートマシンエンジン14(例えば、F7)の同一の第二のデータバッファアドレス416(例えば、8)において第八のステートマシンエンジン14(例えば、F7)に格納することができる。2つの実施例に図示するように、データバッファアドレス416は、プロセッサ12からの第一の書き込みとプロセッサ12からの第二の書き込みとの間で、8(例えば、モジュール340のランクにおける論理グループの数と等しい数)だけ変化した。プロセッサ12は、一連のプロセッサ12がデータバッファシステム159に書き込むものとして、線形アドレスブロックへの書き込みを継続するが、データバッファアドレス416は、第一の論理グループ(論理グループ0)用に意図された全てのデータがモジュール340に提供されるまで、8ずつ自動的に増加するように継続する。図示するように、データは、同様の様式で他の論理グループにも提供される。
例えば、プロセッサ12から64本のデータ線への513番目の書き込み期間(例えば、書き込みカウント列412における512)に、プロセッサ12は、DDR3アドレスバス342に、データバッファシステム159の第三のアドレスのアドレス選択(例えば、プロセッサ書き込みアドレス512)、及び対応する8バイトのデータを提供する。この結果、第一のデータバイト(例えば、4096)を、第一のステートマシンエンジン14(例えば、F0)の第三のデータバッファアドレス416(例えば、1)において第一のステートマシンエンジン14(例えば、F0)に格納し、第二のデータバイト(例えば、4097)を、第二のステートマシンエンジン14(例えば、F1)の同一の第三のデータバッファアドレス416(例えば、1)において第二のステートマシンエンジン14(例えば、F1)に格納し、第三のデータバイト(例えば、4098)を、第三のステートマシンエンジン14(例えば、F2)の同一の第三のデータバッファアドレス416(例えば、1)において第三のステートマシンエンジン14(例えば、F2)に格納し、第四のデータバイト(例えば、4099)を、第四のステートマシンエンジン14(例えば、F3)の同一の第三のデータバッファアドレス416(例えば、1)において第四のステートマシンエンジン14(例えば、F3)に格納し、第五のデータバイト(例えば、4100)を、第五のステートマシンエンジン14(例えば、F4)の同一の第三のデータバッファアドレス416(例えば、1)において第五のステートマシンエンジン14(例えば、F4)に格納し、第六のデータバイト(例えば、4101)を、第六のステートマシンエンジン14(例えば、F5)の同一の第三のデータバッファアドレス416(例えば、1)において第六のステートマシンエンジン14(例えば、F5)に格納し、第七のデータバイト(例えば、4102)を、第七のステートマシンエンジン14(例えば、F6)の同一の第三のデータバッファアドレス416(例えば、1)において第七のステートマシンエンジン14(例えば、F6)に格納し、そして第八のデータバイト(例えば、4103)を、第八のステートマシンエンジン14(例えば、F7)の同一の第三のデータバッファアドレス416(例えば、1)において第八のステートマシンエンジン14(例えば、F7)に格納することができる。
表410が、書き込みカウント列412からの書き込み0〜511の全てが第一のステートマシンエンジン14(例えば、F0)を含む論理グループ0用に意図されたデータを含むことを示すことが留意されるべきである。さらにまた、表410が、書き込みカウント列412からの書き込み512〜1023の全てが第二のステートマシンエンジン14(例えば、F1)を含む論理グループ1用に意図されたデータを含み、それ以降も同様であることを示すことが留意されるべきである。
図19は、複数の論理グループに組織化された複数の物理的なステートマシンエンジン14のプロセスバッファ134に格納されたデータの一実施例を図示する。具体的には、図19は、8つの論理グループに組織化された8つのステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)を有するモジュール340におけるIRデータバス376ビューの表421を図示する。表421は、プロセッサ12から受信した個々のバイト数を示すバイト数列414を含む。バイト数列414は、それぞれのステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)のデータバッファシステム159に格納された具体的なバイトを示す列F0、F1、F2、F3、F4、F5、F6及びF7を含む。表421は、バイト数列414に示されるバイトが格納される、データバッファシステム159のデータバッファA及びB132のいずれか内のアドレスを示すデータバッファアドレス列416も含む。さらにまた、表421は、プロセスバッファ134に格納された個々のバイト数を示すバイト数列426を含む。バイト数列426は、それぞれのステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)のプロセスバッファ134に格納された具体的なバイトを示す列F0、F1、F2、F3、F4、F5、F6及びF7を含む。例えば、プロセスバッファA行428は、ステートマシンエンジン14の第一のプロセスバッファに格納された具体的なバイトを示し、プロセスバッファB行430は、ステートマシンエンジン14の第二のプロセスバッファに格納された具体的なバイトを示す。
したがって、表421は、データが、オフセット様式でデータバッファシステム159に格納され、連続した様式でプロセスバッファ134に提供されることを示している。例えば、IRデータバス376における第一のデータバースト期間に、ステートマシンエンジン14F0は、プロセッサ12から受信したバイト0、4096、8192、12288、16384、20480、24576及び28672(例えば、論理グループの各々における第一のバイト)を提供することができる。IRデータバス376における第二のバースト期間に、ステートマシンエンジン14F1は、プロセッサ12から受信したバイト1、4097、8193、12289、16385、20481、24577及び28673(例えば、論理グループの各々における第二のバイト)を提供することができ、それ以降も同様である。ステートマシンエンジン14の各々は、そのステートマシンエンジンの論理グループに対応するデータバーストからのバイトを格納するように構成される。例えば、ステートマシンエンジン14F0は、IRデータバス376に提供される各データバーストの第一のバイトを格納するように構成され、ステートマシンエンジン14F1は、IRデータバス376に提供される各データバーストの第二のバイトを格納するように構成され、それ以降も同様である。したがって、データバッファシステム159に格納されるときにオフセット様式で格納されたデータは、各ステートマシンエンジン14がその意図されたデータを解析のための正しい順序で受信できるように、IRデータバス376を通じてステートマシンエンジン14に提供される。
図20は、1つの論理グループに組織化された複数の物理的なステートマシンエンジン14のデータバッファ132に格納されたデータの一実施例を図示する。具体的には、図20は、1つの論理グループに組織化された8つのステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)を有するモジュール340におけるDDR3インターフェイスビューの表432を図示する。図示するように、データは、プロセッサ12によって提供され、ステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)に格納される。全てのステートマシンエンジン14は、単一の論理グループ(例えば、論理グループ0)の一部である。図示する実施形態においては、モジュール340によって受信されたデータは、データバッファシステム159に連続して格納される。
図21は、1つの論理グループに組織化された複数の物理的なステートマシンエンジン14のプロセスバッファ134に格納されたデータの一実施例を図示する。具体的には、図21は、1つの論理グループに組織化された8つのステートマシンエンジン14(F0、F1、F2、F3、F4、F5、F6及びF7)を有するモジュール340におけるIRデータバス376ビューの表434を図示する。IRデータバス376における第一のデータバースト期間において、データバースト期間に8バイトが提供されるように、ステートマシンエンジン14F0は、プロセッサ12から受信したバイト0(例えば、論理グループにおける第一のバイト)を提供でき、ステートマシンエンジン14F1は、プロセッサ12から受信したバイト1(例えば、論理グループにおける第二のバイト)を提供でき、それ以降も同様である。ステートマシンエンジン14の各々は、そのステートマシンエンジンの論理グループに対応するデータバーストからのバイトを格納するように構成される。例えば、全てのステートマシンエンジン14F0、F1、F2、F3、F4、F5、F6及びF7が、IRデータバス376に提供される各データバーストの全てのバイトを格納するように構成される。したがって、各ステートマシンエンジン14がパラレル解析用の全てのデータを受信できるように、データバッファシステム159に格納される全てのデータが、IRデータバス376を通じてステートマシンエンジン14に提供される。認識できるように、図18〜図21は、4Kバイトを有するバッファを図示するが、他の実施形態では、任意の適切なサイズ(例えば、8Kバイト、16Kバイト、32Kバイト、64Kバイトなど)を有するバッファを含んでもよい。
本明細書中に使用されるような、装置という用語は、単一モジュールであってもよいし、1つ以上のモジュールを含むシステムであってもよい。本発明は、種々の変更及び代替形態を受け入れることができるが、特定の実施形態を、図面に例証として示し、本明細書に詳細に記述した。しかしながら、本発明が、開示した特定の形態に限定されないことを意図することが理解されるはずである。むしろ、本発明は、以下の添付の特許請求の範囲によって定義されるような本発明の精神及び範囲内に収まる全ての変更、均等物及び代替手段を包含することができる。

Claims (22)

  1. 第一の複数のデータ線及び第二の複数のデータ線を備えており、前記第一の複数のデータ線が、前記第二の複数のデータ線とパラレルにデータを提供するように構成され、前記第一の複数のデータ線は、前記第二の複数のデータ線と異なる、データバスと、
    前記第一の複数のデータ線に結合された第一のステートマシンエンジンと、
    前記第二の複数のデータ線に結合された第二のステートマシンエンジンと、を備えており、前記第一のステートマシンエンジンは、前記第二のステートマシンエンジンと異なり、前記第二のステートマシンエンジンが前記第二の複数のデータ線からデータストリームの第二の部分を受信するのとパラレルに、前記第一のステートマシンエンジンが前記第一の複数のデータ線から前記データストリームの第一の部分を受信するように構成されており、前記データストリームの前記第一の部分は、前記データストリームの前記第二の部分と異なり、
    前記第二のステートマシンエンジンが、前記データストリームの前記第二の部分を前記第一のステートマシンエンジンに提供するように構成されており、前記第一のステートマシンエンジンが、前記データストリームの前記第一の部分及び前記データストリームの前記第二の部分を解析するように構成された、装置。
  2. 前記第一及び第二のステートマシンエンジンの各々が、複数のコンフィギュラブル素子を有するそれぞれのステートマシンラチスを備えており、前記複数のコンフィギュラブル素子の各々が、前記データストリームの少なくとも一部を解析し、前記解析の結果を出力するように構成された複数のセルを備えた、請求項1の装置。
  3. 前記第一のステートマシンエンジン及び前記第二のステートマシンエンジンに結合されたアドレスバスを備えた、請求項1の装置。
  4. 前記第一及び第二のステートマシンエンジンが、前記アドレスバスから信号をパラレルに受信するように構成された、請求項3の装置。
  5. 前記第一のステートマシンエンジンに結合された第一の制御線、及び前記第二のステートマシンエンジンに結合された第二の制御線を備えており、前記第二のステートマシンエンジンが前記第二の制御線から第二の組の信号を受信するのとパラレルに、前記第一のステートマシンエンジンが、前記第一の制御線から第一の組の信号を受信するように構成された、請求項1の装置。
  6. 前記データバスが、第三の複数のデータ線、第四の複数のデータ線、第五の複数のデータ線、第六の複数のデータ線、第七の複数のデータ線、及び第八の複数のデータ線を備えており、前記第一の複数のデータ線が、前記第二の複数のデータ線、前記第三の複数のデータ線、前記第四の複数のデータ線、前記第五の複数のデータ線、前記第六の複数のデータ線、前記第七の複数のデータ線、及び前記第八の複数のデータ線とパラレルにデータを提供するように構成された、請求項1の装置。
  7. 前記第三の複数のデータ線に結合された第三のステートマシンエンジンと、
    前記第四の複数のデータ線に結合された第四のステートマシンエンジンと、
    前記第五の複数のデータ線に結合された第五のステートマシンエンジンと、
    前記第六の複数のデータ線に結合された第六のステートマシンエンジンと、
    前記第七の複数のデータ線に結合された第七のステートマシンエンジンと、
    前記第八の複数のデータ線に結合された第八のステートマシンエンジンと、を備えた、請求項6の装置。
  8. 前記第二のステートマシンエンジンが前記第二の複数のデータ線から前記データストリームの前記第二の部分を受信し、前記第三のステートマシンエンジンが前記第三の複数のデータ線から前記データストリームの第三の部分を受信し、前記第四のステートマシンエンジンが前記第四の複数のデータ線から前記データストリームの第四の部分を受信し、前記第五のステートマシンエンジンが前記第五の複数のデータ線から前記データストリームの第五の部分を受信し、前記第六のステートマシンエンジンが前記第六の複数のデータ線から前記データストリームの第六の部分を受信し、前記第七のステートマシンエンジンが前記第七の複数のデータ線から前記データストリームの第七の部分を受信し、かつ前記第八のステートマシンエンジンが前記第八の複数のデータ線から前記データストリームの第八の部分を受信するのとパラレルに、前記第一のステートマシンエンジンが前記第一の複数のデータ線から前記データストリームの前記第一の部分を受信するように構成された、請求項7の装置。
  9. 前記第三のステートマシンエンジンが、前記データストリームの前記第三の部分を前記第一のステートマシンエンジンに提供するように構成されており、前記第四のステートマシンエンジンが、前記データストリームの前記第四の部分を前記第一のステートマシンエンジンに提供するように構成されており、前記第五のステートマシンエンジンが、前記データストリームの前記第五の部分を前記第一のステートマシンエンジンに提供するように構成されており、前記第六のステートマシンエンジンが、前記データストリームの前記第六の部分を前記第一のステートマシンエンジンに提供するように構成されており、前記第七のステートマシンエンジンが、前記データストリームの前記第七の部分を前記第一のステートマシンエンジンに提供するように構成されており、前記第八のステートマシンエンジンが、前記データストリームの前記第八の部分を前記第一のステートマシンエンジンに提供するように構成されており、そして前記第一のステートマシンエンジンが、前記データストリームの前記第三の部分、前記データストリームの前記第四の部分、前記データストリームの前記第五の部分、前記データストリームの前記第六の部分、前記データストリームの前記第七の部分、及び前記データストリームの前記第八の部分を解析するように構成された、請求項8の装置。
  10. 前記第一のステートマシンエンジンが、前記データストリームの前記第一の部分を格納するように構成された第一のバッファを備えており、前記第二のステートマシンエンジンが、前記データストリームの前記第二の部分を格納するように構成された第二のバッファを備えた、請求項1の装置。
  11. 前記第一のステートマシンエンジンが、前記データストリームの前記第一の部分及び前記データストリームの前記第二の部分を格納するように構成された第三のバッファを備えた、請求項10の装置。
  12. 前記第二のステートマシンエンジンから前記データストリームの前記第二の部分を受信し、前記データストリームの前記第二の部分を前記第一のステートマシンエンジンに提供するように構成されたバッファインターフェイスを備えた、請求項1の装置。
  13. 前記バッファインターフェイスが、前記第一のステートマシンエンジン及び前記第二のステートマシンエンジンの少なくとも一方に命令を提供するように構成された、請求項12の装置。
  14. 前記第一のステートマシンエンジンが、前記バッファインターフェイスに提供された第一の組のデータをラッチするように構成された第一のバッファを備えており、前記第二のステートマシンエンジンが、前記バッファインターフェイスに提供された第二の組のデータをラッチするように構成された第二のバッファを備えた、請求項12の装置。
  15. 前記第一のバッファが、第一の所定間隔において前記第一の組のデータをラッチするように構成されており、前記第二のバッファが、第二の所定間隔において前記第二の組のデータをラッチするように構成された、請求項14の装置。
  16. 第一のチップ及び第二のチップを有し、前記第一のステートマシンエンジンは前記第一のチップに備えられ、前記第二のステートマシンエンジンは前記第二のチップに備えられた、請求項1の装置。
  17. 第一のステートマシンエンジンにおいて、データバスのうちの第一の複数のデータ線からデータストリームの第一の部分を受信することと、
    第二のステートマシンエンジンにおいて、前記データバスのうちの第二の複数のデータ線から前記データストリームの第二の部分を受信することであって、前記第一のステートマシンエンジンは前記第二のステートマシンエンジンと異なり、前記データストリームの前記第一の部分は、前記データストリームの前記第二の部分と異なり、前記第一の複数のデータ線は、前記第二の複数のデータ線と異なり、前記第一のステートマシンエンジンが前記データストリームの前記第一の部分を受信するのとパラレルに、前記データストリームの前記第二の部分が前記第二のステートマシンエンジンにおいて受信される、ことと、
    前記第二のステートマシンエンジンから前記データストリームの前記第二の部分を前記第一のステートマシンエンジンに提供することと、を含む、データ解析方法。
  18. 前記第一のステートマシンエンジンを使用して、前記データストリームの前記第一の部分及び前記データストリームの前記第二の部分を解析することを含む、請求項17の方法。
  19. 前記第一のステートマシンエンジンの第一のメモリアドレス、及び前記第二のステートマシンエンジンの第二のメモリアドレスをパラレルに選択するためのアドレス信号を、前記第一及び第二のステートマシンエンジンにおいて受信することを含む、請求項17の方法。
  20. 前記第一のメモリアドレスが前記第二のメモリアドレスと等しい、請求項19の方法。
  21. 前記データストリームの前記第一の部分と前記データストリームの前記第二の部分は、データの等しくない量を含み、前記データストリームの前記第一の部分、前記データストリームの前記第二の部分、又は、その両方は、前記データストリームの前記第一の部分と前記データストリームの前記第二の部分が等しいデータ量を含むまで、データパディングを用いて調整される、請求項1に記載の装置。
  22. 前記データパディングは、データが、所定の間隔で、データブロック内から始まる、及び/又は、データブロック内で止まるように、前記データストリームの前記第一の部分、前記データストリームの前記第二の部分、又は、その両方の、あるデータセグメントの間に追加される、請求項21に記載の装置。
JP2016501291A 2013-03-15 2014-03-11 ステートマシンエンジンによって受信されるデータを提供するための方法及び装置 Active JP6177418B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361788364P 2013-03-15 2013-03-15
US61/788,364 2013-03-15
US14/065,168 US9448965B2 (en) 2013-03-15 2013-10-28 Receiving data streams in parallel and providing a first portion of data to a first state machine engine and a second portion to a second state machine
US14/065,168 2013-10-28
PCT/US2014/023589 WO2014150554A1 (en) 2013-03-15 2014-03-11 Methods and apparatuses for providing data received by a state machine engine

Publications (3)

Publication Number Publication Date
JP2016515266A JP2016515266A (ja) 2016-05-26
JP2016515266A5 JP2016515266A5 (ja) 2017-02-16
JP6177418B2 true JP6177418B2 (ja) 2017-08-09

Family

ID=51532880

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016501291A Active JP6177418B2 (ja) 2013-03-15 2014-03-11 ステートマシンエンジンによって受信されるデータを提供するための方法及び装置

Country Status (7)

Country Link
US (5) US9448965B2 (ja)
EP (1) EP2972920B1 (ja)
JP (1) JP6177418B2 (ja)
KR (1) KR102168930B1 (ja)
CN (2) CN105051711B (ja)
TW (1) TWI625631B (ja)
WO (1) WO2014150554A1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100138575A1 (en) 2008-12-01 2010-06-03 Micron Technology, Inc. Devices, systems, and methods to synchronize simultaneous dma parallel processing of a single data stream by multiple devices
US20100174887A1 (en) 2009-01-07 2010-07-08 Micron Technology Inc. Buses for Pattern-Recognition Processors
US8489534B2 (en) * 2009-12-15 2013-07-16 Paul D. Dlugosch Adaptive content inspection
US9323994B2 (en) 2009-12-15 2016-04-26 Micron Technology, Inc. Multi-level hierarchical routing matrices for pattern-recognition processors
US9524248B2 (en) 2012-07-18 2016-12-20 Micron Technology, Inc. Memory management for a hierarchical memory system
US9063532B2 (en) * 2012-08-31 2015-06-23 Micron Technology, Inc. Instruction insertion in state machine engines
US9448965B2 (en) 2013-03-15 2016-09-20 Micron Technology, Inc. Receiving data streams in parallel and providing a first portion of data to a first state machine engine and a second portion to a second state machine
US9703574B2 (en) 2013-03-15 2017-07-11 Micron Technology, Inc. Overflow detection and correction in state machine engines
US12028333B2 (en) 2013-05-14 2024-07-02 Kara Partners Llc Systems and methods for variable-length encoding and decoding for enhancing computer systems
US10594687B2 (en) 2013-05-14 2020-03-17 Kara Partners Llc Technologies for enhancing computer security
US10057250B2 (en) 2013-05-14 2018-08-21 Kara Partners Llc Technologies for enhancing computer security
WO2016109570A1 (en) 2014-12-30 2016-07-07 Micron Technology, Inc Systems and devices for accessing a state machine
US11366675B2 (en) 2014-12-30 2022-06-21 Micron Technology, Inc. Systems and devices for accessing a state machine
WO2016109571A1 (en) 2014-12-30 2016-07-07 Micron Technology, Inc Devices for time division multiplexing of state machine engine signals
US9977652B2 (en) * 2015-04-14 2018-05-22 University Of Virginia Patent Foundation System, method, and computer-readable medium for high throughput pseudo-random number generation
US11580472B2 (en) * 2015-05-14 2023-02-14 Palantir Technologies Inc. Systems and methods for state machine management
US10691964B2 (en) 2015-10-06 2020-06-23 Micron Technology, Inc. Methods and systems for event reporting
US10977309B2 (en) 2015-10-06 2021-04-13 Micron Technology, Inc. Methods and systems for creating networks
US10846103B2 (en) 2015-10-06 2020-11-24 Micron Technology, Inc. Methods and systems for representing processing resources
CN105573949A (zh) * 2015-12-09 2016-05-11 熊猫电子集团有限公司 Vpx架构具有jesd204b接口的采集处理电路
KR102416176B1 (ko) 2016-05-10 2022-07-01 엘에스일렉트릭(주) 슬레이브 디바이스 제어 방법
US10268602B2 (en) 2016-09-29 2019-04-23 Micron Technology, Inc. System and method for individual addressing
US10019311B2 (en) 2016-09-29 2018-07-10 Micron Technology, Inc. Validation of a symbol response memory
US10592450B2 (en) 2016-10-20 2020-03-17 Micron Technology, Inc. Custom compute cores in integrated circuit devices
US10929764B2 (en) 2016-10-20 2021-02-23 Micron Technology, Inc. Boolean satisfiability
US10564877B1 (en) * 2017-05-24 2020-02-18 Syncsort Incorporated Methods and apparatus to store and enable a transfer protocol for new file formats for distributed processing and preserve data integrity through distributed storage blocks
US9996328B1 (en) * 2017-06-22 2018-06-12 Archeo Futurus, Inc. Compiling and optimizing a computer code by minimizing a number of states in a finite machine corresponding to the computer code
US10481881B2 (en) 2017-06-22 2019-11-19 Archeo Futurus, Inc. Mapping a computer code to wires and gates
US12099344B2 (en) 2017-11-03 2024-09-24 R4N63R Capital Llc Workspace actor selection systems and methods
CN109683897B (zh) * 2018-12-29 2022-05-10 广州华多网络科技有限公司 程序处理方法、装置及设备
US11296720B2 (en) * 2020-08-24 2022-04-05 Innogrit Technologies Co., Ltd. Data compression using reduced numbers of occurrences
CN113379047B (zh) * 2021-05-25 2024-04-05 北京微芯智通科技合伙企业(有限合伙) 一种实现卷积神经网络处理的系统及方法

Family Cites Families (180)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL38603A (en) 1972-01-21 1975-10-15 Bar Lev H Automatic pattern recognition method and apparatus particularly for optically recognizing alphanumeric characters
JPS4891935A (ja) 1972-03-08 1973-11-29
US4011547A (en) 1972-07-17 1977-03-08 International Business Machines Corporation Data processor for pattern recognition and the like
GB1518093A (en) 1974-10-04 1978-07-19 Mullard Ltd Mark detection apparatus
JPS51112236A (en) 1975-03-28 1976-10-04 Hitachi Ltd Shape position recognizer unit
JPS5313840A (en) 1976-07-23 1978-02-07 Hitachi Ltd Analogy calculator
US4204193A (en) 1978-11-03 1980-05-20 International Business Machines Corporation Adaptive alignment for pattern recognition system
US4414685A (en) 1979-09-10 1983-11-08 Sternberg Stanley R Method and apparatus for pattern recognition and detection
US4748674A (en) 1986-10-07 1988-05-31 The Regents Of The University Of Calif. Pattern learning and recognition device
US5014327A (en) 1987-06-15 1991-05-07 Digital Equipment Corporation Parallel associative memory having improved selection and decision mechanisms for recognizing and sorting relevant patterns
US5216748A (en) 1988-11-30 1993-06-01 Bull, S.A. Integrated dynamic programming circuit
US5617574A (en) 1989-05-04 1997-04-01 Texas Instruments Incorporated Devices, systems and methods for conditional instructions
JP2833062B2 (ja) 1989-10-30 1998-12-09 株式会社日立製作所 キャッシュメモリ制御方法とこのキャッシュメモリ制御方法を用いたプロセッサおよび情報処理装置
US5028821A (en) 1990-03-01 1991-07-02 Plus Logic, Inc. Programmable logic device with programmable inverters at input/output pads
US5377129A (en) 1990-07-12 1994-12-27 Massachusetts Institute Of Technology Particle interaction processing system
DE69029390T2 (de) 1990-09-15 1997-06-12 Ibm Programmierbare Schaltung für eine neurale Logik
US5287523A (en) 1990-10-09 1994-02-15 Motorola, Inc. Method for servicing a peripheral interrupt request in a microcontroller
AU8966391A (en) 1990-12-24 1992-06-25 Ball Corporation System for analysis of embedded computer systems
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US5300830A (en) 1992-05-15 1994-04-05 Micron Semiconductor, Inc. Programmable logic device macrocell with an exclusive feedback and exclusive external input lines for registered and combinatorial modes using a dedicated product term for control
US5331227A (en) 1992-05-15 1994-07-19 Micron Semiconductor, Inc. Programmable logic device macrocell with an exclusive feedback line and an exclusive external input line
US5291482A (en) 1992-07-24 1994-03-01 At&T Bell Laboratories High bandwidth packet switch
US5357512A (en) 1992-12-30 1994-10-18 Intel Corporation Conditional carry scheduler for round robin scheduling
US5825921A (en) 1993-03-19 1998-10-20 Intel Corporation Memory transfer apparatus and method useful within a pattern recognition system
US5459798A (en) 1993-03-19 1995-10-17 Intel Corporation System and method of pattern recognition employing a multiprocessing pipelined apparatus with private pattern memory
US5586266A (en) * 1993-10-15 1996-12-17 International Business Machines Corporation System and method for adaptive, active monitoring of a serial data stream having a characteristic pattern
CA2145361C (en) 1994-03-24 1999-09-07 Martin William Sotheran Buffer manager
US20050251638A1 (en) 1994-08-19 2005-11-10 Frederic Boutaud Devices, systems and methods for conditional instructions
JP3345515B2 (ja) 1994-08-31 2002-11-18 アイワ株式会社 ピークシフト補正回路およびそれを使用した磁気記録媒体再生装置
US5615237A (en) 1994-09-16 1997-03-25 Transwitch Corp. Telecommunications framer utilizing state machine
JPH0887462A (ja) 1994-09-20 1996-04-02 Fujitsu Ltd ステートマシン及び通信制御方式
US5790531A (en) 1994-12-23 1998-08-04 Applied Digital Access, Inc. Method and apparatus for determining the origin of a remote alarm indication signal
US6279128B1 (en) 1994-12-29 2001-08-21 International Business Machines Corporation Autonomous system for recognition of patterns formed by stored data during computer memory scrubbing
US5794062A (en) 1995-04-17 1998-08-11 Ricoh Company Ltd. System and method for dynamically reconfigurable computing using a processing unit having changeable internal hardware organization
US5659551A (en) 1995-05-31 1997-08-19 International Business Machines Corporation Programmable computer system element with built-in self test method and apparatus for repair during power-on
US5723984A (en) 1996-06-07 1998-03-03 Advanced Micro Devices, Inc. Field programmable gate array (FPGA) with interconnect encoding
US5680640A (en) 1995-09-01 1997-10-21 Emc Corporation System for migrating data by selecting a first or second transfer means based on the status of a data element map initialized to a predetermined state
US5754878A (en) 1996-03-18 1998-05-19 Advanced Micro Devices, Inc. CPU with DSP function preprocessor having pattern recognition detector that uses table for translating instruction sequences intended to perform DSP function into DSP macros
JPH10111862A (ja) 1996-08-13 1998-04-28 Fujitsu Ltd 再帰型ニューラルネットワークに基づく時系列解析装置および方法
JPH1069459A (ja) 1996-08-29 1998-03-10 Hitachi Ltd シリアルインタフェース制御装置およびその制御方法
US6034963A (en) 1996-10-31 2000-03-07 Iready Corporation Multiple network protocol encoder/decoder and data processor
JP2940496B2 (ja) 1996-11-05 1999-08-25 日本電気株式会社 パタンマッチング符号化装置及び方法
US6317427B1 (en) 1997-04-24 2001-11-13 Cabletron Systems, Inc. Method and apparatus for adaptive port buffering
US6011407A (en) 1997-06-13 2000-01-04 Xilinx, Inc. Field programmable gate array with dedicated computer bus interface and method for configuring both
US6195150B1 (en) 1997-07-15 2001-02-27 Silverbrook Research Pty Ltd Pseudo-3D stereoscopic images and output device
US6097212A (en) 1997-10-09 2000-08-01 Lattice Semiconductor Corporation Variable grain architecture for FPGA integrated circuits
US6041405A (en) 1997-12-18 2000-03-21 Advanced Micro Devices, Inc. Instruction length prediction using an instruction length pattern detector
DE19861088A1 (de) 1997-12-22 2000-02-10 Pact Inf Tech Gmbh Verfahren zur Reparatur von integrierten Schaltkreisen
US6219776B1 (en) 1998-03-10 2001-04-17 Billions Of Operations Per Second Merged array controller and processing element
EP0943995A3 (en) 1998-03-20 2000-12-06 Texas Instruments Incorporated Processor having real-time external instruction insertion for debug functions without a debug monitor
US6151644A (en) 1998-04-17 2000-11-21 I-Cube, Inc. Dynamically configurable buffer for a computer network
US6052766A (en) 1998-07-07 2000-04-18 Lucent Technologies Inc. Pointer register indirectly addressing a second register in the processor core of a digital processor
US9195784B2 (en) 1998-08-31 2015-11-24 Cadence Design Systems, Inc. Common shared memory in a verification system
US7430171B2 (en) 1998-11-19 2008-09-30 Broadcom Corporation Fibre channel arbitrated loop bufferless switch circuitry to increase bandwidth without significant increase in cost
US7899052B1 (en) 1999-01-27 2011-03-01 Broadcom Corporation Memory structure for resolving addresses in a packet-based network switch
US6412057B1 (en) 1999-02-08 2002-06-25 Kabushiki Kaisha Toshiba Microprocessor with virtual-to-physical address translation using flags
US6636483B1 (en) 1999-02-25 2003-10-21 Fairchild Semiconductor Corporation Network switch with zero latency flow control
US6317849B1 (en) 1999-04-28 2001-11-13 Intel Corporation Method and apparatus for controlling available capabilities of a device
JP2000347708A (ja) 1999-06-02 2000-12-15 Nippon Telegr & Teleph Corp <Ntt> ニューラルネットよる動的システムの制御方法及び装置及びニューラルネットよる動的システムの制御プログラムを格納した記憶媒体
US6880087B1 (en) 1999-10-08 2005-04-12 Cisco Technology, Inc. Binary state machine system and method for REGEX processing of a data stream in an intrusion detection system
WO2001038978A1 (en) 1999-11-24 2001-05-31 Z-Force Corporation Configurable state machine driver and methods of use
US6640262B1 (en) 1999-12-20 2003-10-28 3Com Corporation Method and apparatus for automatically configuring a configurable integrated circuit
US6625740B1 (en) 2000-01-13 2003-09-23 Cirrus Logic, Inc. Dynamically activating and deactivating selected circuit blocks of a data processing integrated circuit during execution of instructions according to power code bits appended to selected instructions
US6614703B2 (en) 2000-01-13 2003-09-02 Texas Instruments Incorporated Method and system for configuring integrated systems on a chip
US7080359B2 (en) 2002-01-16 2006-07-18 International Business Machines Corporation Stack unique signatures for program procedures and methods
US6240003B1 (en) 2000-05-01 2001-05-29 Micron Technology, Inc. DRAM content addressable memory using part of the content as an address
US6977897B1 (en) 2000-05-08 2005-12-20 Crossroads Systems, Inc. System and method for jitter compensation in data transfers
US6476636B1 (en) 2000-09-02 2002-11-05 Actel Corporation Tileable field-programmable gate array architecture
US6625704B2 (en) 2001-08-08 2003-09-23 Sangate Systems, Inc. Data backup method and system using snapshot and virtual tape
WO2003039001A1 (en) 2001-10-29 2003-05-08 Leopard Logic, Inc. Programmable interface for field programmable gate array cores
US7333580B2 (en) 2002-01-28 2008-02-19 Broadcom Corporation Pipelined parallel processing of feedback loops in a digital circuit
US6925510B2 (en) 2002-02-22 2005-08-02 Winbond Electronics, Corp. Peripheral or memory device having a combined ISA bus and LPC bus
US7093023B2 (en) * 2002-05-21 2006-08-15 Washington University Methods, systems, and devices using reprogrammable hardware for high-speed processing of streaming data to find a redefinable pattern and respond thereto
GB0224023D0 (en) * 2002-10-16 2002-11-27 Roysmith Graeme Reconfigurable integrated circuit
US7146643B2 (en) 2002-10-29 2006-12-05 Lockheed Martin Corporation Intrusion detection accelerator
US7349416B2 (en) 2002-11-26 2008-03-25 Cisco Technology, Inc. Apparatus and method for distributing buffer status information in a switching fabric
US7292572B2 (en) 2002-12-11 2007-11-06 Lsi Corporation Multi-level register bank based configurable ethernet frame parser
US7089352B2 (en) 2002-12-23 2006-08-08 Micron Technology, Inc. CAM modified to be used for statistic calculation in network switches and routers
US6944710B2 (en) 2002-12-30 2005-09-13 Micron Technology, Inc. Multiple category CAM
US6880146B2 (en) 2003-01-31 2005-04-12 Hewlett-Packard Development Company, L.P. Molecular-wire-based restorative multiplexer, and method for constructing a multiplexer based on a configurable, molecular-junction-nanowire crossbar
US7305047B1 (en) 2003-03-12 2007-12-04 Lattice Semiconductor Corporation Automatic lane assignment for a receiver
US7366352B2 (en) 2003-03-20 2008-04-29 International Business Machines Corporation Method and apparatus for performing fast closest match in pattern recognition
US7093062B2 (en) * 2003-04-10 2006-08-15 Micron Technology, Inc. Flash memory data bus for synchronous burst read page
US7366854B2 (en) * 2003-05-08 2008-04-29 Hewlett-Packard Development Company, L.P. Systems and methods for scheduling memory requests utilizing multi-level arbitration
CA2526467C (en) 2003-05-20 2015-03-03 Kagutech Ltd. Digital backplane recursive feedback control
US7010639B2 (en) 2003-06-12 2006-03-07 Hewlett-Packard Development Company, L.P. Inter integrated circuit bus router for preventing communication to an unauthorized port
US6906938B2 (en) 2003-08-15 2005-06-14 Micron Technology, Inc. CAM memory architecture and a method of forming and operating a device according to a CAM memory architecture
DE102004045527B4 (de) 2003-10-08 2009-12-03 Siemens Ag Konfigurierbare Logikschaltungsanordnung
US7860915B2 (en) 2003-12-29 2010-12-28 Xilinx, Inc. Digital signal processing circuit having a pattern circuit for determining termination conditions
US7849119B2 (en) 2003-12-29 2010-12-07 Xilinx, Inc. Digital signal processing circuit having a pattern detector circuit
US7487542B2 (en) 2004-01-14 2009-02-03 International Business Machines Corporation Intrusion detection using a network processor and a parallel pattern detection engine
US7243165B2 (en) 2004-01-14 2007-07-10 International Business Machines Corporation Parallel pattern detection engine
GB0415850D0 (en) 2004-07-15 2004-08-18 Imagination Tech Ltd Memory management system
US7716455B2 (en) 2004-12-03 2010-05-11 Stmicroelectronics, Inc. Processor with automatic scheduling of operations
US7176717B2 (en) 2005-01-14 2007-02-13 Velogix, Inc. Programmable logic and routing blocks with dedicated lines
US7358761B1 (en) 2005-01-21 2008-04-15 Csitch Corporation Versatile multiplexer-structures in programmable logic using serial chaining and novel selection schemes
US7392229B2 (en) 2005-02-12 2008-06-24 Curtis L. Harris General purpose set theoretic processor
US7499464B2 (en) 2005-04-06 2009-03-03 Robert Ayrapetian Buffered crossbar switch with a linear buffer to port relationship that supports cells and packets of variable size
JP2008539498A (ja) * 2005-04-29 2008-11-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 単一のi2cデータストリームからの並列i2cスレーブデバイスのプログラミング
US7562172B2 (en) 2005-04-29 2009-07-14 Nxp B.V. I2C Slave/master interface enhancement using state machines
US7672529B2 (en) 2005-05-10 2010-03-02 Intel Corporation Techniques to detect Gaussian noise
US7276934B1 (en) 2005-06-14 2007-10-02 Xilinx, Inc. Integrated circuit with programmable routing structure including diagonal interconnect lines
US7804719B1 (en) 2005-06-14 2010-09-28 Xilinx, Inc. Programmable logic block having reduced output delay during RAM write processes when programmed to function in RAM mode
US20080126690A1 (en) 2006-02-09 2008-05-29 Rajan Suresh N Memory module with memory stack
US7376782B2 (en) 2005-06-29 2008-05-20 Intel Corporation Index/data register pair for indirect register access
JP4410162B2 (ja) * 2005-07-05 2010-02-03 富士通株式会社 リコンフィギュアブルlsi
US7358872B2 (en) 2005-09-01 2008-04-15 Micron Technology, Inc. Method and apparatus for converting parallel data to serial data in high speed applications
FR2891075B1 (fr) 2005-09-21 2008-04-04 St Microelectronics Sa Circuit de memoire pour automate de reconnaissance de caracteres de type aho-corasick et procede de memorisation de donnees dans un tel circuit
US7750675B2 (en) 2005-12-23 2010-07-06 International Business Machines Corporation Method for running state machines
US7360063B2 (en) 2006-03-02 2008-04-15 International Business Machines Corporation Method for SIMD-oriented management of register maps for map-based indirect register-file access
US7512634B2 (en) 2006-06-05 2009-03-31 Tarari, Inc. Systems and methods for processing regular expressions
US7447107B2 (en) 2006-06-15 2008-11-04 Qimonda North America Corp. Random access memory including multiple state machines
US7725510B2 (en) 2006-08-01 2010-05-25 Alcatel-Lucent Usa Inc. Method and system for multi-character multi-pattern pattern matching
US8074022B2 (en) * 2006-09-28 2011-12-06 Virident Systems, Inc. Programmable heterogeneous memory controllers for main memory with different memory modules
US8065249B1 (en) 2006-10-13 2011-11-22 Harris Curtis L GPSTP with enhanced aggregation functionality
US7774286B1 (en) 2006-10-24 2010-08-10 Harris Curtis L GPSTP with multiple thread functionality
US7890923B2 (en) 2006-12-01 2011-02-15 International Business Machines Corporation Configurable pattern detection method and apparatus
US7899978B2 (en) 2006-12-08 2011-03-01 Pandya Ashish A Dynamic programmable intelligent search memory
KR100866604B1 (ko) 2007-01-23 2008-11-03 삼성전자주식회사 전원제어 장치 및 전원제어 방법
US7797521B2 (en) 2007-04-12 2010-09-14 International Business Machines Corporation Method, system, and computer program product for path-correlated indirect address predictions
KR20080097573A (ko) 2007-05-02 2008-11-06 삼성전자주식회사 가상 메모리 접근 방법
US20080320053A1 (en) 2007-06-21 2008-12-25 Michio Iijima Data management method for accessing data storage area based on characteristic of stored data
US8397014B2 (en) 2008-02-04 2013-03-12 Apple Inc. Memory mapping restore and garbage collection operations
US7886089B2 (en) 2008-02-13 2011-02-08 International Business Machines Corporation Method, system and computer program product for enhanced shared store buffer management scheme for differing buffer sizes with limited resources for optimized performance
JPWO2009104324A1 (ja) 2008-02-22 2011-06-16 日本電気株式会社 能動計量学習装置、能動計量学習方法およびプログラム
US7735045B1 (en) 2008-03-12 2010-06-08 Xilinx, Inc. Method and apparatus for mapping flip-flop logic onto shift register logic
US8015530B1 (en) 2008-08-05 2011-09-06 Xilinx, Inc. Method of enabling the generation of reset signals in an integrated circuit
US8209521B2 (en) 2008-10-18 2012-06-26 Micron Technology, Inc. Methods of indirect register access including automatic modification of a directly accessible address register
US8938590B2 (en) 2008-10-18 2015-01-20 Micron Technology, Inc. Indirect register access method and system
US9639493B2 (en) 2008-11-05 2017-05-02 Micron Technology, Inc. Pattern-recognition processor with results buffer
US7970964B2 (en) 2008-11-05 2011-06-28 Micron Technology, Inc. Methods and systems to accomplish variable width data input
US7917684B2 (en) * 2008-11-05 2011-03-29 Micron Technology, Inc. Bus translator
US8402188B2 (en) 2008-11-10 2013-03-19 Micron Technology, Inc. Methods and systems for devices with a self-selecting bus decoder
US20100118425A1 (en) 2008-11-11 2010-05-13 Menachem Rafaelof Disturbance rejection in a servo control loop using pressure-based disc mode sensor
US9164945B2 (en) 2008-12-01 2015-10-20 Micron Technology, Inc. Devices, systems, and methods to synchronize parallel processing of a single data stream
US10007486B2 (en) 2008-12-01 2018-06-26 Micron Technology, Inc. Systems and methods to enable identification of different data sets
US9348784B2 (en) 2008-12-01 2016-05-24 Micron Technology, Inc. Systems and methods for managing endian mode of a device
US20100138575A1 (en) 2008-12-01 2010-06-03 Micron Technology, Inc. Devices, systems, and methods to synchronize simultaneous dma parallel processing of a single data stream by multiple devices
DE102008060719B4 (de) 2008-12-05 2018-09-20 Siemens Healthcare Gmbh Verfahren zur Steuerung des Aufnahmebetriebs einer Magnetresonanzeinrichtung bei der Aufnahme von Magnetresonanzdaten eines Patienten sowie zugehörige Magnetresonanzeinrichtung
US8140780B2 (en) 2008-12-31 2012-03-20 Micron Technology, Inc. Systems, methods, and devices for configuring a device
US8214672B2 (en) 2009-01-07 2012-07-03 Micron Technology, Inc. Method and systems for power consumption management of a pattern-recognition processor
US8281395B2 (en) 2009-01-07 2012-10-02 Micron Technology, Inc. Pattern-recognition processor with matching-data reporting module
US20100174887A1 (en) 2009-01-07 2010-07-08 Micron Technology Inc. Buses for Pattern-Recognition Processors
US8843523B2 (en) 2009-01-12 2014-09-23 Micron Technology, Inc. Devices, systems, and methods for communicating pattern matching results of a parallel pattern search engine
US8146040B1 (en) 2009-06-11 2012-03-27 Xilinx, Inc. Method of evaluating an architecture for an integrated circuit device
US20100325352A1 (en) 2009-06-19 2010-12-23 Ocz Technology Group, Inc. Hierarchically structured mass storage device and method
US9836555B2 (en) 2009-06-26 2017-12-05 Micron Technology, Inc. Methods and devices for saving and/or restoring a state of a pattern-recognition processor
US8159900B2 (en) 2009-08-06 2012-04-17 Unisyn Medical Technologies, Inc. Acoustic system quality assurance and testing
US9323994B2 (en) * 2009-12-15 2016-04-26 Micron Technology, Inc. Multi-level hierarchical routing matrices for pattern-recognition processors
US9501705B2 (en) 2009-12-15 2016-11-22 Micron Technology, Inc. Methods and apparatuses for reducing power consumption in a pattern recognition processor
US8489534B2 (en) 2009-12-15 2013-07-16 Paul D. Dlugosch Adaptive content inspection
US20110161620A1 (en) 2009-12-29 2011-06-30 Advanced Micro Devices, Inc. Systems and methods implementing shared page tables for sharing memory resources managed by a main operating system with accelerator devices
US8615629B2 (en) 2010-01-18 2013-12-24 Marvell International Ltd. Access scheduler
US20110208900A1 (en) 2010-02-23 2011-08-25 Ocz Technology Group, Inc. Methods and systems utilizing nonvolatile memory in a computer system main memory
JP5477810B2 (ja) * 2010-03-12 2014-04-23 沖電気工業株式会社 信号処理装置及びプログラム
GB2478727B (en) 2010-03-15 2013-07-17 Advanced Risc Mach Ltd Translation table control
KR101702374B1 (ko) * 2010-05-19 2017-02-06 삼성전자주식회사 멀티 프로세서 장치 및 그것의 인터 프로세스 통신 방법
US8601013B2 (en) 2010-06-10 2013-12-03 Micron Technology, Inc. Analyzing data using a hierarchical structure
US8766666B2 (en) * 2010-06-10 2014-07-01 Micron Technology, Inc. Programmable device, hierarchical parallel machines, and methods for providing state information
US9195623B2 (en) 2010-06-23 2015-11-24 International Business Machines Corporation Multiple address spaces per adapter with address translation
US8294490B1 (en) 2010-10-01 2012-10-23 Xilinx, Inc. Integrated circuit and method of asynchronously routing data in an integrated circuit
US8726253B2 (en) 2011-01-25 2014-05-13 Micron Technology, Inc. Method and apparatus for compiling regular expressions
EP2668577B1 (en) 2011-01-25 2019-08-14 Micron Technology, INC. Unrolling quantifications to control in-degree and/or out degree of automaton
JP5763784B2 (ja) 2011-01-25 2015-08-12 マイクロン テクノロジー, インク. 要素利用のための状態のグループ化
US8843911B2 (en) 2011-01-25 2014-09-23 Micron Technology, Inc. Utilizing special purpose elements to implement a FSM
US8648621B2 (en) * 2011-12-15 2014-02-11 Micron Technology, Inc. Counter operation in a state machine lattice
US9443156B2 (en) * 2011-12-15 2016-09-13 Micron Technology, Inc. Methods and systems for data analysis in a state machine
US8680888B2 (en) 2011-12-15 2014-03-25 Micron Technologies, Inc. Methods and systems for routing in a state machine
US8593175B2 (en) * 2011-12-15 2013-11-26 Micron Technology, Inc. Boolean logic in a state machine lattice
US8782624B2 (en) * 2011-12-15 2014-07-15 Micron Technology, Inc. Methods and systems for detection in a state machine
US20130275709A1 (en) 2012-04-12 2013-10-17 Micron Technology, Inc. Methods for reading data from a storage buffer including delaying activation of a column select
US8536896B1 (en) 2012-05-31 2013-09-17 Xilinx, Inc. Programmable interconnect element and method of implementing a programmable interconnect element
US9304968B2 (en) 2012-07-18 2016-04-05 Micron Technology, Inc. Methods and devices for programming a state machine engine
US9389841B2 (en) 2012-07-18 2016-07-12 Micron Technology, Inc. Methods and systems for using state vector data in a state machine engine
US9524248B2 (en) 2012-07-18 2016-12-20 Micron Technology, Inc. Memory management for a hierarchical memory system
US9235798B2 (en) 2012-07-18 2016-01-12 Micron Technology, Inc. Methods and systems for handling data received by a state machine engine
US9063532B2 (en) 2012-08-31 2015-06-23 Micron Technology, Inc. Instruction insertion in state machine engines
US9075428B2 (en) 2012-08-31 2015-07-07 Micron Technology, Inc. Results generation for state machine engines
US9501131B2 (en) 2012-08-31 2016-11-22 Micron Technology, Inc. Methods and systems for power management in a pattern recognition processing system
US9448965B2 (en) 2013-03-15 2016-09-20 Micron Technology, Inc. Receiving data streams in parallel and providing a first portion of data to a first state machine engine and a second portion to a second state machine

Also Published As

Publication number Publication date
CN110825464A (zh) 2020-02-21
KR102168930B1 (ko) 2020-10-23
KR20150132226A (ko) 2015-11-25
TWI625631B (zh) 2018-06-01
EP2972920A1 (en) 2016-01-20
US10372653B2 (en) 2019-08-06
US10067901B2 (en) 2018-09-04
US9448965B2 (en) 2016-09-20
CN110825464B (zh) 2024-07-02
US20190347233A1 (en) 2019-11-14
WO2014150554A1 (en) 2014-09-25
US10606787B2 (en) 2020-03-31
US9747242B2 (en) 2017-08-29
TW201506632A (zh) 2015-02-16
EP2972920A4 (en) 2016-11-23
US20170351631A1 (en) 2017-12-07
CN105051711B (zh) 2019-11-15
JP2016515266A (ja) 2016-05-26
US20160371215A1 (en) 2016-12-22
US20140279776A1 (en) 2014-09-18
US20180341612A1 (en) 2018-11-29
EP2972920B1 (en) 2022-07-20
CN105051711A (zh) 2015-11-11

Similar Documents

Publication Publication Date Title
JP6177418B2 (ja) ステートマシンエンジンによって受信されるデータを提供するための方法及び装置
US10915450B2 (en) Methods and systems for padding data received by a state machine engine
JP6082753B2 (ja) ステートマシンにおけるデータ解析用の方法およびシステム
JP6126127B2 (ja) ステートマシンにおけるルーティング用の方法およびシステム
CN107256156B (zh) 用于状态机中的检测的方法及系统
TWI569206B (zh) 用於狀態機引擎之結果產生
US20170193351A1 (en) Methods and systems for vector length management
US11580055B2 (en) Devices for time division multiplexing of state machine engine signals
CN118860936A (zh) 用于提供由状态机引擎接收的数据的方法及设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170113

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170113

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170321

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170711

R150 Certificate of patent or registration of utility model

Ref document number: 6177418

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250