JPH11242856A

JPH11242856A - データソースから受け取ったデータを並べる方法

Info

Publication number: JPH11242856A
Application number: JP10308160A
Authority: JP
Inventors: Richard Arthur Bickers; リチャード・アーサー・ビッカーズ
Original assignee: Hewlett Packard Co
Current assignee: HP Inc
Priority date: 1997-10-31
Filing date: 1998-10-29
Publication date: 1999-09-07
Anticipated expiration: 2018-10-29
Also published as: EP0913761A1; JP4124887B2; US6268973B1

Abstract

(57)【要約】【課題】インデックス情報に頼ることなくコード化デー
タストリームにおける特定のレコードまたはファイルマ
ークの開始位置を見いだす。【解決手段】テープドライブ８００において、ホストイ
ンターフェイス８１０がホストコンピュータからデータ
を受け取る。データ構造とは独立にデータにおける追加
可能ポイントについて判断し、データソースからのデー
タを圧縮されたコード化データストリームにコード化
し、追加可能ポイントにフラッシュ・コードワードを挿
入する。フラッシュ・コードワードに続くコードワード
はフラッシュ・コードワードに対する相対位置で見つけ
ることができるから、圧縮データストリームにおいて追
加ポイントはフラッシュ・コードワードによって見つけ
ることができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明はデータの格納方法
に関係し、特に、しかし排他的でなく、例えばテープな
どの磁気媒体に格納するためにデータをコード化または
フォーマットするための方法および装置に関する。

【０００２】

【従来の技術】テープへのデータ格納を例にとると、ホ
ストコンピュータシステムは典型的には、テープドライ
ブのような記憶装置装置にレコードごとにデータを書
く。さらに、ホストコンピュータは、ファイル・マーク
(FILE MARKs)やセット・マーク(SET MARKs)などのレコ
ード分離文字を使用してレコード自体を分離してもよ
い。

【０００３】典型的には、レコードはユーザデータを
含み、例えばワードプロセッサのドキュメント、コンピ
ュータグラフィック画像またはデータベースを構成する
データを含む。対照的に、ファイル・マークなどのレコ
ード分離文字は、ワードプロセッサのドキュメントの終
わりおよび次の始まりを示すためにホストコンピュータ
によって使用される。言い換えれば、レコード分離文
字は典型的には関連するレコードのグループを分離す
る。

【０００４】一般にホストコンピュータはレコード長さ
およびレコードとレコード・セパレータが受け取られて
いる順番について判断し、記憶装置装置はこれを管理し
ない。

【０００５】例として、図1(A)は、既存の型のホストコ
ンピュータがテープ記憶装置に書くことがあるユーザデ
ータおよび分離文字の論理的なシーケンスを図示する。
具体的には、ホストコンピュータは、R1からR5の5つの
固定長レコードを供給し、レコードR1、 R2およびR5の
後に3つのファイル・マーク(FM)を置く。

【０００６】テープドライブのような記憶装置がホスト
コンピュータ・データを受け取り、データ・レコードを
レコード構造とは独立に固定サイズのグループに整理
し、それぞれのグループのインデックス形成部分におい
てレコード構造をレコードおよびファイルマーク位置に
よって表すことが知られている。そのような手法は、IS
O/IEC標準10777:1991 Eに定義されるテープドライブの
ためのDDS(デジタルデータ記憶装置)データフォーマッ
ト標準の基礎を形成する。ヨーロッパ特許出願EP0 324
542号明細書は、このような手法を実現するDDSテープド
ライブの1つの例を記述する。データのグループが形成
されると、テープドライブは、典型的には何らかの形態
の誤り検出/修正コーディングを適用した後に、グルー
プをテープに格納する。

【０００７】図1(Ｂ)は、図1(Ａ)で示されるホストコン
ピュータ・データをDDSグループへの組織化について図
示する。典型的に、ホストコンピュータ・データ・レコ
ードは、各グループにおいてコード化されまたは圧縮さ
れて連続的なコード化されたデータストリームを形成す
る。ファイルマークはテープドライブによって受け取ら
れ（インターセプトされ）、ファイルマークのコード化
データストリームにおける出現および位置を記述する情
報がテープドライブによって生成され、それぞれのグル
ープのインデックスに格納される。この例でレコードR
1、 R2およびレコードR3の一部分がコード化データスト
リームに圧縮され最初のグループに格納され、レコード
および第１および第２のファイルマークのコード化デー
タストリームにおける存在と位置を示す情報が第１グル
ープのインデックスに格納される。次に、レコード３の
残り、およびレコード４および５が連続的なコード化デ
ータストリームに圧縮され、第２のグループに格納さ
れ、レコードおよび第３ファイルマークのコード化デー
タストリームにおける存在と位置を示す情報が第２グル
ープのインデックスに格納される。

【０００８】図2は、図１（Ｂ）に示される両方のグル
ープについて非常に一般にインデックスの形を図示す
る。各インデックスは、2つのメイン・データ構造、す
なわちブロックアクセス・テーブル(BAT)とグループ情
報テーブル(GIT)を含む。BATのエントリの数はGITのBAT
エントリ・フィールドに格納される。また、GITは、現
グループに含まれるものを含み記録(BOR)マークの始ま
り以来書かれたFMの数であるファイルマーク・カウント
(FMC)のような様々なカウントを含んでおり、現グルー
プに含まれるものを含み記録(BOR)マークの始まり以来
書かれたレコードの数であるレコードカウント(RC)も含
まれる。この簡単な例でのエントリのための値がかっこ
内に示される。GITは、現在のグループだけに生じるフ
ァイルマークおよびレコードのそれぞれの数その他の情
報を含んでもよい。

【０００９】一連ののエントリを通してBATは、グルー
プに保持されたレコード・データおよび各セパレータ・
マークの位置の論理的な区分化によってグループの‘構
造'を記述する。BATでのアクセス・エントリがグループ
の内容の順番で続き、BAT自体がグループの終わりから
内側に成長しレコード・データのコード化データストリ
ームに出会う。

【００１０】

【発明が解決しようとする課題】そのような手法では、
ホストコンピュータからのデータ読み取りまたは書き込
みのコマンドに基づいて格納されているデータを読み取
るテープドライブは、コード化データストリームにおけ
る特定のレコードまたはファイルマークの開始位置を見
いだすためにインデックスの情報に頼らなければならな
い。

【００１１】

【課題を解決するための手段】第1の面によると、この
発明はデータソースから受け取られるデータを調整する
方法を提供し、データソースによって決定されるデータ
構造を有するデータをデータソースから受け取るステッ
プ、データ構造とは独立にデータにおける追加可能ポイ
ントについて判断するステップ、データソースからのデ
ータをコード化データストリームにコード化し、追加可
能ポイントを表すデータをコード化データストリームへ
挿入するステップ、および記憶装置または媒体にデータ
ストリームを書き込むステップを含む。

【００１２】この発明は、データソースから受け取られ
たデータを、任意の所望のポイント、「追加可能」ポイ
ントが、結果として得られるコード化または圧縮された
データストリームで、そのポイントがレコードの境界ま
たはファイルマークと一致するかどうかとは無関係に見
つけられる態様でコード化する手段を提供する。

【００１３】本願出願人の特許出願（ヨーロッパ特許出
願番号97308756.2）は、レコード境界およびファイルマ
ークのようなレコードセパレータを表す特別な保留され
たコードワードをコード化データストリームに埋め込む
ことによってBATのための条件が取り除かれることを記
述している。そこでは、レコード境界およびファイル・
マークは、それぞれの埋め込まれたコードワードによっ
て見つけることができる。ここで問題とする課題は、特
にコード化データが圧縮されているとき、任意の必要な
位置をコード化データの中で見つけることができるよう
なデータコード化に関する。この発明は、出願人の継続
中の特許出願と組み合わせて使用されるとき特に有利で
あると信じられる。

【００１４】この発明の好ましい実施例では、データソ
ースからのデータはバーストかパケットで受け取られ、
それぞれのバーストまたはパケットの始めまたは終わり
が追加可能ポイントと判断される。これは下に説明する
ようにバースト処理目的のために特に有利である。

【００１５】この発明の第２の面によると、この発明は
データソースから受け取られたデータを整えるための装
置を提供し、データソースによって決定されるデータ構
造を有するデータをデータソースから受け取るため、そ
してデータの追加可能ポイントをデータ構造とは独立に
判断するためのインターフェイス手段と、データソース
からのデータをコード化データストリームにコード化
し、追加可能ポイントを表すデータをコード化データス
トリームに挿入し、そのデータストリームを記憶装置ま
たは媒体に書き込むコード化手段と、を備える。

【００１６】この発明はテープ記憶装置のフィールドで
特定用途を見つけるが、この方法は等しく他の記憶装置
および記憶媒体に適用することができる。1つの代替記
憶媒体は光ディスクであろう。また、データがホストコ
ンピュータ以外のソース、例えば記憶装置の間でデータ
を動かすデータ移動システムから受け取られてもよい。

【００１７】この発明の他の面と実施例は以下の説明と
請求項から明らかになるであろう。

【００１８】

【発明の実施の形態】この実施例は、テープドライブに
よって受け取られるデータをテープへのその後の格納の
ために整理するための新データ・フォーマットに基づ
く。そのフォーマットを次に詳述する。

【００１９】フォーマット概要図4に描かれているように、ホストコンピュータによっ
てテープドライブに書かれる、フォーマットに規定され
るデータの最も小さい集まりがレコード400である。レ
コード400はホストコンピュータによってテープドライ
ブによる処理のために供給されることができ、テープド
ライブによって再処理されホストコンピュータに提供さ
れる。レコードがホストコンピュータによって「書かれ
る」データの最小の集まりであるという概念は、データ
が実際にホストコンピュータとテープドライブの間で
「転送される」または「トランスポートされる」メカニ
ズムと混同されてはならない。そのようなメカニズム
は、典型的には基本的なプロトコル、例えば、 SCSI(ス
モールコンピュータシステムインタフェース)を利用す
る。このプロトコルは、ホスト・データの性質または構
造と関係なく比較的小さいパケットかバーストの点で明
確に規定された(すなわち、交渉済みの)の方法でデータ
を転送する。SCSIなどのプロトコルは、後続のパケット
またはバーストを受け付ける前にそれぞれのパケットか
バーストを有効にする。

【００２０】このフォーマットは、ファイル・マーク書
き込みコマンドの形でホストコンピュータによってテー
プドライブに書き込まれることができるファイル・マー
ク410をサポートする。

【００２１】また、このフォーマットは、それぞれのレ
コード400におけるデータが可能な場合はデータ圧縮(D
C)アルゴリズムによって連続的な(圧縮された)シリーズ
のデータ・コードワード(CW)にコード化されることを指
定する。このデータ・コードワードは図４においてラベ
ル420で示される。

【００２２】このフォーマットと既存のフォーマットの
間の主要な違いは、レコード境界とファイル・マークの
両方がシンボルまたは確保された（reserved：残してあ
る、予備の）コードワードとしてコード化され、連続的
な(圧縮された)コード化されたデータストリームに埋め
込まれることである。例えばDDSのような他のフォーマ
ットと比べて、これは、コード化された、または、圧縮
されたデータストリームが、別々に記録されるか転送さ
れたテーブルまたはインデックスを参照することなく、
レコードおよびファイル・マーク書き込みコマンドの直
列の流れに復号されるのを許容する。図4では、確保さ
れたレコード終り(EOR)コードワードは430で示され、確
保されたファイル・マーク・コードワード(FMC)は440で
示される。

【００２３】このフォーマットによると、この発明の本
質的な部分ではないが、コード化されたデータストリー
ム(データおよび確保されたコードワードを含む)は、下
に述べるようにさらにデータセット形に整理される。次
に、データはテープに書かれ、その過程において周知の
誤り検知・訂正コーディング、例えば、リード-ソロモ
ンのコーディングの形で冗長性を加えることができる。

【００２４】データセットコードワードは、図5のダイヤグラムで示されるように4
0万4352バイトのデータから成るデータセットに整理さ
れる。各データセット500は、固定長コードワード領域5
10および固定長データセット情報テーブル(DSIT)領域52
0を含む。各データセットはゼロから始まり連続的に割
り当てられる連続番号によって同定される。それぞれの
データセットの中で、バイトは0〜40万4351まで連続番
号によって同定され、コードワードはバイト0から左か
ら右にデータセット内で配列される。DSITはDDSフォー
マットのGITと性質的に似ており、１つの相違点は、こ
のフォーマットにはBAT(または、同等物)がないので、D
SITにおいてBATへの参照がないことである。。

【００２５】プロセスされたデータ・コードワード既に述べたように、可能な場合には、データはDCアルゴ
リズムを使用してプロセスされる。この実施例による
と、アルゴリズムはALDC-2として知られているLZ-1スラ
イディング辞書圧縮アルゴリズムに基づく。ALDC-2アル
ゴリズムは、1024バイトの履歴バッファを使用してバイ
ト幅のデータをコード化し、バイト(リテラル)または履
歴バッファの中のバイトの文字列への参照を表すデータ
・コードワードのシーケンスを出力する。ALDC-2は周知
のECMA(ECMA-222)およびQIC(QIC-154)標準であり、ここ
では詳細を述べない。LZ-1方法は考案者であるA. Lempe
lとJ. Zivにちなんで名付けられたものであり、 James
A. Storerによる本"DataCompression: methods and the
ory"（1988年にコンピュータサイエンスプレスによって
発行された）に詳細が記述されている。LZ-2として知ら
れている他の同様の方法、すなわちこの本に記載されて
いるコードワード辞書技法も代わりに使用することがで
きる。

【００２６】この実施例によると、ここに詳細を記述す
るように、コード化手法はALDC-2 DCアルゴリズムの変
更されたバージョンを利用し、2つのコード化手法、す
なわちデータを圧縮するためのもの(手法1)とデータを
圧縮しないで通すもの（手法２）とを切り換える能力、
並びに後続の復号化関数を制御するためまたはファイル
マークなどのホストコンピュータ・データ分離情報を識
別するために、コード化されたデータストリームに含め
ることができるたくさんの確保されたコードワードをサ
ポートする。

【００２７】多重データコード化手法データをコード化するアルゴリズムは2つの異なったコ
ード化手法から成り、そのどちらも処理中のデータの特
性に従って選択することができる。第1の手法(手法1)
は、履歴バッファのデータへの逆方向参照の使用でデー
タの冗長度を減少させ、 2番目の手法(手法2)は、修正
することなくデータを全般的にコピーする。手法2は、
ほとんどまたは全く冗長性を持たない、手法１において
拡張を実際に生じさせるデータを守るために提供され
る。そのような圧縮不可能なデータはグラフィカルなデ
ータか、既に圧縮されているデータでありうる。

【００２８】どちらの手法が動作中であろうと、すべて
のデータが履歴バッファを通り抜ける。したがって、手
法2から手法1への変化の後に、手法２を使って受け取ら
れ処理された履歴バッファ中のデータに手法１の逆方向
参照を使用することが可能である。それは、あたかも手
法2におけるデータ出力が手法１におけるリテラルとし
て出力されていたかのようである。

【００２９】手法を変えるときに、アクセスポイント
(以下で説明される)でとか、さらにデータを追加すると
きとかのように、そうすべき別の理由がないかぎり履歴
バッファはリセットされる必要がない。リセットは、意
味のある逆方向参照を提供するために履歴バッファが再
充填を必要とするので、典型的には圧縮比の潜在的な短
期間の減少を引き起こすだろう。

【００３０】手法1のデータ・コードワードこの実施例によると、手法1がデータを圧縮するのに使
用され次のような３つのタイプのデータ・コードワード
を出力する。 1)リテラル： ‘0'にコード化中の８ビットのバイト
（またはそのコピー）が続く 9ビットのコードワード。 2)逆方向参照: ’１’に、マッチ長をバイトで表現す
る可変長２ないし12ビットのマッチカウント／フィール
ドが続き、これに履歴バッファにおける逆方向参照の始
まりの位置を示す10ビットの変位フィールドが続く可変
長コードワード。このように、逆方向参照コードワー
ドは13ビットから23ビットの範囲の長さでありうる。 3)手法１の確保されたコードワード: いつもルート・
コードワード1.1111.1111₂で始まり、4ビットのフィー
ルドで終わり、図６に示すように確保されたコードワー
ドを同定する13ビット長のコードワード。16の可能な確
保されたコードワードは（図12に示されるように）有効
な逆方向参照でなく、逆方向参照と混同されることはな
い。

【００３１】手法2のデータ・コードワードこの実施例によると、手法2は3つのタイプのデータ・コ
ードワードを出力する。非コード化リテラル − 0x00
から0xFEの範囲の8ビットのデータ値について、8ビット
入力のコピーである8ビットのデータ・コードワードが
出力される。コード化されたリテラル − 8ビット・
データ値0xFFについて9ビットのコードワード1111.111
1.0₂が出力される。手法２の確保されたコードワード
− いつもルート・コードワード1111.1111.1₂で始まり
図6で示されるように確保されたコードワードを同定す
る4ビットのフィールドで終る13ビット長のコードワー
ド。

【００３２】手法１の逆方向参照レコード・データが受信されるにつれて、各バイトは一
致するバイトを求めて履歴バッファのすべてのバイトと
比較される。任意の一致は潜在的逆方向参照として扱わ
れる。一致が現れるならば、次の受け取られたバイトは
それぞれの潜在的逆方向参照に続くバイトと比較され
る。一致があるならば、2バイトについて逆方向参照が
発見されたことになる。一致が生じなくなるかまたは不
一致が起こるまで、これは続く。ミスマッチ前のバイト
の最も長いマッチングしている文字列がマッチカウント
および変位フィールドで規定された逆方向参照として使
用され、圧縮されコード化されたデータストリームに出
力される。図12のテーブルに示されるように、一致カウ
ント・フィールドは、より短い一致フィールドがより長
い一致フィールドの始まりとして誤って解釈されるのを
防ぐために、2、 4、6、 8または12ビットのフィールド
としてコード化される。

【００３３】確保されたコードワード説明したように、手法1および手法2の両方ともたくさん
の13ビットの確保されたコードワードを出力し、最初の
9ビットが１で、後続の4ビットは後に規定する確保され
たコードワードの1つを表す値である。こうしなければ
ならない理由はないが、便宜上、同じ13ビットの確保さ
れたコードワードが両方の手法に使用される。

【００３４】確保されたコードワードは、データをコー
ド化するプロセス中にテープドライブによって、コード
化されたデータストリームに挿入され、復号化プロセス
の操作を制御し、ファイルマークのようなデータ分離情
報をコード化する。

【００３５】しかしながら、確保されたコードワード
はコード化または復号化中に、履歴バッファにパスされ
ない。

【００３６】DDSフォーマットとは異なり、どこでレコ
ードまたはファイル・マークが始まり終わるかを示す別
のインデックス（例えばBAT）がないので、この実施例
によるフォーマットは、コード化されたデータストリー
ム内でのデータ追加または動作の場所を見つけることを
イネーブルするための代替のメカニズムを提供する。

【００３７】このメカニズムは、追加ポイントと呼ばれ
る予定位置で生じるコード化データストリームの特定の
規定された部分をあてにする。これを容易にするため
に、コード化されたデータストリームは、ホストコンピ
ュータからのデータ転送の始まりから32ビットのワード
に論理的に仕切られ、追加ポイントは常に32ビットのワ
ード境界と整列するかこれに詰められている。ワードの
32のビット長は、２のべき乗であり便利な数であるが、
ワードが他の長さとして規定されてはならない理由はな
い。

【００３８】さらに、履歴バッファ不一致が追加ポイン
トで強制されるので、追加ポイントが逆方向参照に埋め
込まれるようにならない。追加ポイント前に見つけられ
たバイトの最も長いマッチング文字列が、マッチング文
字列が追加ポイントを超えて拡張してもよいかどうかと
は無関係に出力される。

【００３９】追加ポイントの存在は、図６に示されるよ
うに「詰め」条件をもつ任意の確保されたコードワー
ド、すなわちファイルマーク、EOR、フラッシュ（詰
め）およびエンドマーカのコードワードの１つによって
決定される。ワード境界との整列を行うために、コード
化されたデータストリームにおけるこれらの確保された
コードワード（エンドマーカとは別に）の任意のものと
その次のワード境界との間のスペースは、もしあれば、
０でビット詰めされている。エンドマーカとその次の境
界との間のスペースは、もしあれば、１でビット詰めさ
れている。

【００４０】実際上、コード化されたデータストリーム
におけるコードワードは、手法1と手法2の両方に必要と
されるようにそれぞれのデータセットのコードワード領
域510に格納するために３２ビットのワードにビット詰
めされており、最も有意なビットが出力されるか復号中
に遭遇されるようにビット順が逆にされている。次にそ
れぞれの確保されたコードワードのより詳細な説明を行
う。

【００４１】リセット1 リセット1コードワードに遭遇するときはいつも履歴バ
ッファがリセットされ（すなわち、後続のデータがバッ
ファの始めに置かれ）、続くすべてのデータ・コードワ
ードは、手法１のデータコードワードである。リセット
2か手法2コードワードのどちらかに遭遇するまで、これ
が適用される。

【００４２】手法1または手法2を適用するかどうかを決
定する基礎が、達成した（または達成可能な）圧縮率に
完全に依存し、入ってくるデータの構造とは独立なの
で、リセット1コードワードはレコードの中か外のどち
らで生じてもよい。それがレコード外で生じる場合、コ
ードワードは詰め条件を持たないが、EORコードワード
のあとに続いて32ビット境界でいつも始まり、そのすぐ
後にフラッシュ（詰め）コードワードがいつも続く。こ
うしてその次のレコードまたはファイルマークはワード
境界で始まる。

【００４３】リセット1コードワードはレコードの最初
のコードワードとして生じてもよく、この場合レコード
内にあるとされ、フラッシュ・コードワードがこれに続
く必要はない。

【００４４】リセット1コードワードは、前のデータの
知識なしに伸長がそのポイントで確実に始まることがで
きるように、アクセスポイントに書かれている。アクセ
スポイントは、伸長が始まることができるデータデータ
セットのポイントであり、アクセスポイント後の逆方向
参照は、そのアクセスポイント後に受け取られた履歴バ
ッファ内のデータを参照することができるだけである。
伸長は、DSITを参照する必要性なしにアクセスポイント
を交差してシームレスに続くことができる。

【００４５】リセット1は、履歴バッファが再成長する
必要があるので、圧縮率の潜在的な短期間の低減を引き
起こすだろう。

【００４６】リセット2 リセット2コードワードに遭遇するときはいつも、履歴
バッファがリセットされ（すなわち、後続のデータがバ
ッファの始めに置かれる）、あとに続くすべてのデータ
・コードワードは手法2のデータ・コードワードであ
る。リセット1か手法1コードワードのどちらかに遭遇す
るまで、これが適用される。

【００４７】他のすべてにおいて、リセット2コードワ
ードはリセット1コードワードに同じに扱われる。

【００４８】手法1 手法1コードワードは、あとに続くすべてのデータ・コ
ードワードが手法1データ・コードワードであることを
示し、リセット2または手法2コードワードのどちらかに
遭遇するまで、これが適用される。手法1コードワード
はレコードの中と外の両方に生じることができる。

【００４９】コードワードには詰め条件がないが、それ
がレコードの外で生じるとき、EORコードワードに続い
てそれはいつも32ビット境界で始まり、そのすぐ後に常
にフラッシュ（詰め）コードワードが続くので、次のレ
コードまたはファイル・マークはワード境界で始まる。

【００５０】手法1コードワードはレコードの最初のコ
ードワードとして出力されてもよく、この場合レコード
内にあるのと考えられ、詰めコードワードがあとに続く
必要はない。

【００５１】手法2 手法2コードワードは、あとに続くすべてのデータ・コ
ードワードが手法2データ・コードワードであることを
示し、これは、リセット1か手法1コードワードのどちら
かに遭遇するまで適用される。他のすべてにおいて、そ
れは手法1コードワードと同じ効用を与える。

【００５２】ファイル・マークファイル・マーク・コードワードはファイル・マーク書
き込み(Write FILE MARK)コマンドを表し、従ってレコ
ード内には生じない。ファイル・マーク・コードワード
は、32ビット境界でいつも始まる。なぜなら、それはい
つも、データ転送の始め、レコードの後、または、別の
ファイル・マークの後のいずれかに位置するからであ
る。ファイル・マーク・コードワードには、それぞれ
の詰め条件があるので、デフォルトとして、32ビットの
定数（1.1111.1111.0100 + 000.0000.0000.0000.0000₂
= FF980000_h）として扱うことができる。

【００５３】EOR EORコードワードはレコードの最後のコードワードであ
り、したがって、レコードの外では決して生じることが
できない。このコードワードに続くのは、次の32ビット
のワード境界まで埋め込むためのゼロから３１の０であ
る。

【００５４】フラッシュ（詰め）詰めコードワードによって、次のコードワードは次の32
ビット境界を始めることになり、EORコードワードと同
様に、次の32ビットのワード境界まで埋め込むためのゼ
ロから３１の０が続く。詰めコードワードはレコードの
中または外のどちらで使用されてもよく、レコード中間
のコードワードを32ビット境界で整列させるために中に
置かれ、手法XおよびリセットXのコードワードの直後に
続くように外側に置かれる。こうして、任意の後続のレ
コード(または部分レコード)、ファイル・マークおよび
エンドマーカーのコードワードが確実に32ビット境界で
始まる。

【００５５】既に示したように、詰めコードワードはリ
セットXおよび手法Xのコードワードをサポートするため
にレコードの外で使用することができる。このような訳
で、これらのコードワードも次の表に示すように32ビッ
トの定数として扱うことができる。

【００５６】

【表１】'Reset 1 → Flush' = 1.1111.1111.0000 + 1.
1111.1111.0110 + 000000₂ = FFAFFC00_h 'Reset 2 → Flush' = 1.1111.1111.0001 + 1.1111.111
1.0110 + 000000₂ = FFB7FC00_h 'Scheme 1 → Flush' = 1.1111.1111.0010 + 1.1111.11
11.0110 + 000000₂ = FF8FFC00_h 'Scheme 2 → Flush' = 1.1111.1111.0011 + 1.1111.11
11.0110 + 000000₂ = FF97FC00_h

【００５７】これらの場合に、詰めコードワードは常に
32ビットのワードの14番目のビットで始まる。

【００５８】これまで、例えばDDSフォーマットにおい
て、レコードかファイル・マークの後、またはデータの
終りに追加する能力を提供することが知られている。こ
のフォーマットの詰めコードワードは、レコードの内部
に追加ポイントおよび任意の位置を生成する一層の能力
を提供する。この機能が非常に役に立つ場合の例を以下
に示す。

【００５９】エンドマーカーエンド・マーカー・コードワードは、データセットの中
でそれに続くデータは意味を持たず（それが任意の誤り
検知・訂正冗長性によってカバーされているかもしれな
いが）、それが遭遇されるデータセットの残りについて
の伸長を止めるために使用される。

【００６０】エンド・マーカー・コードワードが32ビッ
ト境界で始まり次の３２ビット境界まで（１で）埋めら
れているので、それは、32ビットの定数'1.1111.1111.1
111+111.1111.1111.1111.1111₂' = FFFFFFFF_h.として扱
うことができる。

【００６１】アクセスポイントアクセス・ポイントは、履歴バッファがリセットされる
位置およびデータセットのデータの伸長を始めることが
できる位置を示すのに使用される。この実施例によると
データセットあたり多くても1つのアクセスポイントが
あり、その位置がDSITに登録されている。コード化され
たデータにおける任意のレコードまたはファイル・マー
クをアクセスするために、復号化は、レコードまたはフ
ァイル・マークの前のストリームにおけるアクセスポイ
ントから始まらなければならず、ターゲットに到達する
まで継続する。

【００６２】具体的には、アクセスポイントは、デー
タ転送における最初のデータセットの始めにあるものと
して規定され、その後は後続のデータセットの始めにあ
るものとして、または前のデータセットからデータセッ
トにスパンする任意のレコードの終わりのすぐあとに続
くものとして規定される。データセットにスパンするレ
コードが長く次のデータセットにもスパンするならば、
有効なアクセスポイントはなく、DSITにファイルされた
アクセスポイントの内容がこのことを示すためにFFFFFF
FF_hにセットされる。

【００６３】アクセスポイントで履歴バッファがリセッ
トされ、コードワードの1つ(リセット1かリセット2)が
任意のレコード・データに先行すし、任意のデータが書
かれるかまたはこれに遭遇する前にコード化手法が確実
に規定される。これにより、コード化手法が規定される
前にファイル・マーク・コードワードがアクセス・ポイ
ントに書かれることが可能になる。どの処理手法がその
ポイントから必要であるかに依存して適切なリセット・
コードワードが使用される。

【００６４】アクセスポイントでは次の１つがなければ
ならない：フラッシュが後に続くリセットX;レコード・
データが後に続くリセットX；エンドマーカー(End Mark
er);または、上記のいずれかが続くファイル・マーク。

【００６５】アクセスポイントでの履歴バッファ「リセ
ット」は、アクセスポイントの前にデータ入力を参照す
る逆方向参照が出力されるのを防止する。こうして、圧
縮と伸長は常にアクセスポイントで始まらなければなら
ない。

【００６６】データセット充填データセットの一部分だけがコードワードで満たされて
おり、テープにそのデータセットを書くことが必要であ
るならば、一層の処理ステップが生じる前にデータセッ
トが「完成される」。そのような場合、レコードが完全
でないならばそれはEORコードワードで終えられる。最
後の有効なコードワードは、その位置がDSITと符合（こ
の場合はいずれにしても部分的データセットではない）
しない限り、エンド・マーカー・コードワードである。
オプションで、エンド・マーカー・コードワードでデ
ータセットの残りを満たすことができる。

【００６７】データセット情報テーブル DSITの内容は図7のテーブルの中に示されており、ここ
で説明する。テーブルにおいて、最も有意のバイトは最
も低い番号のバイト位置であり、最も低有意のバイトは
最も大きい番号のバイト位置である。

【００６８】データセットの番号この4バイトのフィールドは、ゼロで始まるテープの始
まり(BOT)からのデータセットの順序数である。

【００６９】有効なデータ長この4バイトのフィールドが、データセットの中に存在
するかもしれないエンド・マーカーまで（エンド・マー
カーを含まず）のプロセスされたコードワードに使用さ
れるデータセットの完全なバイトの数を示す。

【００７０】アクセスポイント・オフセットこの4バイトのフィールドはアクセスポイントのデータ
セット内でのバイトオフセットである。カウントはバ
イト0で始まりDSITの始めからである。したがって、ア
クセスポイントがデータセットの最初のバイトであれ
ば、アクセスポイント・オフセットはゼロであろう。デ
ータセット中にアクセスポイントがないならば、このフ
ィールドはすべて１に設定される(すなわち、 FFFFFFFF
_h)。

【００７１】「現在のアクセスポイント」は、ここでこ
のデータセットに存在するアクセスポイントとして定義
され、データセットにアクセスポイントがないならば、
前の最も近いアクセスポイントとして定義される。

【００７２】「次のアクセスポイント」は、ここで次か
後続のデータセットに生じる最初のアクセスポイントと
して定義される。

【００７３】合計レコードこの6バイトのフィールドは、BOTから現在のアクセスポ
イントまでのすべてのデータセットにおける完全にプロ
セスされたすべてのレコードのカウントを指定する。

【００７４】合計のファイル・マークこの6バイトのフィールドは、BOTから現在のアクセスポ
イントまでのすべてのデータセットにおいてプロセスさ
れたすべてのファイル・マークのカウントを指定する。

【００７５】レコードカウントこの4バイトのフィールドは、現在のアクセスポイント
と次のアクセスポイントの間に存在するレコードの数を
指定する。したがって、レコードが前のデータセットで
始まり、いまのデータセットで終わるならば、そのレコ
ードは数えられない。現在のデータセットにアクセスポ
イントがないならば、このデータセットの中で始まった
り終わったりするレコードはなく、レコード・カウント
は前のデータセットのDSITでのレコード・カウントと同
じである。レコードがこのデータセットで始まるが後の
データセットまで完成しないならば、それはカウントさ
れる。したがって、データセットの中にアクセスポイン
トを持ったりゼロのレコードカウントを持つことはでき
ない。この実施例によるとまた、ファイル・マークはレ
コードとしてカウントされない。

【００７６】ファイル・マーク・カウントこの4バイトのフィールドは現在のアクセスポイントと
次のアクセスポイントの間に書かれたファイル・マーク
の数を示す。

【００７７】部分的レコードの長さこの4バイトのフィールドは、レコードがデータセット
で終わらないならば、どれくらい多くのデータ・バイト
が現在のデータセットの最後のレコードにあるかを示
す。さもなければ、値はゼロである。

【００７８】バイト36から468からの残りのDSITフィー
ルドは、ベンダ特定の情報またはテープ用法情報のた
めのものであり、この発明とは関係しない。残りのDSIT
フィールドは、したがってここでは詳細に記述しない。

【００７９】テープドライブ・アーキテクチャこの発明にしたがってテープとの間でデータの格納およ
び回復を行うためのテープドライブのための模範的なア
ーキテクチャが図８に示されている。図8を参照する
と、テープドライブ800がSCSIバス806を介してホストコ
ンピュータ(図示されない)に接続される。ホストコンピ
ュータは、適切な‘アプリケーション'および‘ドライ
バー'のソフトウェアをロードしており、テープドライ
ブ800と適切な方法で通信することができる。

【００８０】「書き込み」操作においてテープドライブ
800は、テープ876にバックアップすべきデータをホスト
コンピュータから受け取り、「読み取り」操作において
テープドライブ800は、テープ876から検索されたデータ
をホストコンピュータに送り返す。ここで記述される実
施例では、SCSIバス806がホストコンピュータにテープ
ドライブ800を接続する。しかしながら、たくさんの他
の一般的なインタフェース・タイプの任意のものを使用
してもよい。

【００８１】ここで記述されるテープドライブ800は、
上で記述されたフォーマットによりデータを格納し検索
する。図8でテープドライブ800はテープ・メカニズム87
0を含み、その他のすべてのコンポーネントで「コント
ローラ」805が形成される。

【００８２】コントローラ805は、それぞれが特定のデ
ータ処理操作を実行するように設けられた一連のASIC
(適用業務に特化された集積回路)を含む。ASICは、SCSI
バス806を介してホストコンピュータとテープドライブ8
00の間でのデータの転送を管理するためのホストインタ
フェース810、第1のデータバス815によってホストイン
タフェース810に接続されるフォーマッタ820、およびは
第2のデータバス835によってフォーマッタ820に接続さ
れた読取り書込み回路840である。また、含まれている
のは、データセット形のデータを格納するめの主バッフ
ァ830であり、メモリバス825によってフォーマッタ820
に接続されている。メインバッファ830は、少なくとも1
つのデータセットを格納するに十分なサイズである1ブ
ロックのDRAM(ダイナミックRAM)を含む。

【００８３】フォーマッタ820の主な構成要素は図9のダ
イヤグラムに詳細に図示される。示されるように、フォ
ーマッタ820は、受け取られるホストコンピュータ・デ
ータ・バイトを手法Xコードワードとしてコード化する
ためのエンコーダ900を含み、このエンコーダは手法1ま
たは手法2のコードワードをホストコンピュータのデー
タに適用すべきであるかどうか決定するために履歴バッ
ファ903および比較器907を組み込んでいる。フォーマッ
タ820は、32ビットのワード境界の観点からコードワー
ドをコード化されたデータストリームに設えるためのパ
ッカー910を含み、このパッカーは、どのコードワード
が確保されたコードワードであるか、およびどの確保さ
れたコードワードがそれぞれの詰め（フラッシュ）条件
を持つかを解釈するために使われる参照用テーブル915
を組み込んでいる。

【００８４】コントローラ805は、さらに例えばモトロ
ーラ68000シリーズ・マイクロプロセッサのようなマイ
クロプロセッサ850、およびメインメモリ860を含む。こ
のメインメモリは、マイクロプロセッサ850によってア
クセス可能なROM(固定メモリ)またはEEPROM(電気的に消
去可能なプログラマブルROM)であってもよい。マイクロ
プロセッサ850は、メインメモリ860に格納されたファー
ムウェア命令によって制御され、後述するようにドライ
ブ805のすべての構成要素を制御する。マイクロプロセ
ッサ850はシステムバス852を通してテープドライブの他
の構成要素に接続され、テープドライブ800のそれぞれ
の構成要素の総合的な操作を制御する。

【００８５】ホストインタフェース810とフォーマッタ8
20との間でデータを転送するための第１データバス815
は、16ビットのデータチャネルと2ビットの制御チャネ
ルを備える。それぞれ835および845とラベルされる第２
および第３のデータバスは16ビットのデータチャネルを
含む。データチャネルの実際の幅は重要でないが、より
多くのビットを並列に運ぶことができる広いチャンネル
は、より速い処理パイプラインを提供することができ
る。

【００８６】テープ・メカニズム870は、第3のデータバ
ス845によって読取り書込み回路840に接続された読み出
し/書き込みヘッド874、およびヘッド874の動きを制御
するためのヘッド・アクチュエータ833を備える。図3
(A)と3(B)はデータをテープに書き込むことができる2つ
の一般的な方法を図示する。

【００８７】図3(A)において、データは、一端から他端
まで一連の斜めのトラック300としてテープの長さに沿
って書き込まれている。一般に、このタイプのデータの
格納方法はヘリカルスキャン方式として知られており、
典型的には4つのヘッド（読み取り書き込みにそれぞれ
２つ）を持つ回転ドラムを有するテープドライブ依存し
ている。そのようなテープドライブはよく知られてお
り、上述のDDSデータ記憶装置標準の基礎を形成する。

【００８８】図3(B)はテープ330の長さに沿った一連の
並列チャンネル320として書き込まれたデータを図示す
る。この技法は線データ記録として一般的に知られてい
る。この図で、集合的にトラック340として知られる4つ
(あるいはそれ以上)の並列チャンネルのグループは、テ
ープの一端Aから他端Bまで静止形の多重チャネルヘッド
で書かれている。ヘッドがテープの端Bにデータを書き
込むとき、それはxだけ位置ずれし、テープは巻き戻さ
れるのでデータはテープの他端Aに向けて逆方向に書き
込むことができる。テープの全体の幅が使用されるま
で、データが受け取られる限り、このプロセスを続ける
ことができる。

【００８９】上記の技法のどちらでもテープにこの実施
例によってコード化されたデータを書き込むのに使用す
ることができる。この実施例は特定の技法に限られるも
のではない。このデータフォーマットは、しかしなが
ら、線形テープ記録技法に向けられると特に有利である
と期待される。

【００９０】テープドライブ操作テープドライブ800において、ホストインタフェース810
は、基本的なSCSIプロトコルに従ってSCSIバス806を通
してホストコンピュータからデータを受け取る。データ
が制御データ(例えば、ロード、アンロードまたはスペ
ース）であるならば、ホストインタフェース810がマイ
クロプロセッサ850にデータをパスし、マイクロプロセ
ッサ制御がテープドライブ800を制御ししかるべく動作
させる。

【００９１】書き込みデータ操作のためにデータがテー
プに格納されるべきレコード・データならばホストイン
タフェース810は、データをフォーマッタ820に送り、デ
ータはコード化され可能な場合はコード化されたデータ
ストリームに圧縮される。エンコーダ900は、レコード
・データのバイトをコード化し、圧縮する目的のために
履歴バッファの903および比較器907と対話する。パッカ
ー910は、それぞれの詰め条件に従って必要に応じてス
トリームのコードワードをビット詰めする。参照用（ル
ックアップ）テーブル915は確保されたコードワードに
関連する情報を含んでおり、このコードワードによって
パッカー910はデータストリームにおいてエンコーダに
よって提供された確保されたコードワードを認識するこ
とができ、それらを適切にパックすることができる。コ
ード化されパックされたデータはメインバッファ830に
転送される。

【００９２】また、フォーマッタ820は、データを読取
り書込み回路840に送る前にエラー訂正/検出コーディン
グを適用してもよい。その詳細はこの明細書の範囲外で
あり、説明を省略する。適切な場合、フォーマッタ820
はバッファの主な830からのデータを検索し、それを読
取り書込み回路840に送る。

【００９３】読取り書込み回路840はコード化されたデ
ータを受け取り、データを読み出し/書き込みヘッド(s)
874を駆動するのに適当な信号に変える。データを書き
込む目的のために、ヘッド・アクチュエータ872はテー
プ876に関しヘッド874を動かし、テープ・メカニズム87
0はヘッド874に関しテープ876を動かす。既に述べたよ
うに、この実施例に従う操作に適したメカニズムを含む
テープデッキは、一般にテープ記憶装置の技術で知られ
ているので、ここでの説明は省略する。

【００９４】データを書き込むことに関し上述したコン
ポーネントは、読取り操作のために、テープからデータ
を読み取り、適切であるならば誤り検出/修正コーディ
ングを取り除き、テープ876から回復されたデータを解
凍復号し、データをホストコンピュータ810にパスする
ために、逆に動作する。

【００９５】コントローラのいくつかの構成要素の動作
をここで説明する。

【００９６】ホストインタフェース書き込み操作のために、ホストコンピュータは、レコ
ードかファイル・マークを書き込むために書き込み（ラ
イト）コマンドをホストインタフェース810に送る。テ
ープドライブが要求に応じるかどうかが、次に説明する
ようにフォーマッタ820がホストコンピュータからデー
タを受け取る準備ができているかどうかによって決定さ
れる。総合的な書き込みプロセスはマイクロプロセッサ
850によって制御される。

【００９７】ホストコンピュータからの書き込み要求を
受け取り次第、データ・レコードを書くために、ホスト
インタフェース810はリクエスト信号をマイクロプロセ
ッサ850に送ることによって、レコードに値するデータ
をフォーマッタ820に送る許可を要求する。マイクロプ
ロセッサ850は続いてフォーマッタ820の状態部をテスト
する。フォーマッタ820の状態部が許容するならば、デ
ータ・レコード全体を受け取るスペースがメインバッフ
ァ830にあり、以前に受け取られたデータの処理が完了
しているので、マイクロプロセッサ850はホストインタ
フェース810にフォーマッタ820へのデータ転送を始める
信号を送る。一方、フォーマッタ820の状態が、メイン
バッファが充満していること、または既存のデータがま
だプロセス中であることを示すならば、要求は拒絶さ
れ、または「保留（オフにする）」にされる。準備がで
きている場合、ホストインタフェース810は、レコード
に値するデータを一度に16ビット第１のデータバスを介
してフォーマッタ820に転送する。ファイル・マークを
書くためのプロトコルは、ホストコンピュータ・インタ
フェース810がマイクロプロセッサ850へファイル・マー
ク書き込み命令が受け取られたことを知らせる信号を送
ることである。これに応答して、マイクロプロセッサ85
0は、ファイル・マーク・コードワードをコード化され
たデータストリームに、前のレコード（またはファイル
・マーク）の終わりの後に挿入するようフォーマッタ82
0に信号を送る。

【００９８】このフォーマットは、テープドライブ800
との間で書き込むことができるデータの最も小さいチャ
ンクとしてレコードを扱うが、ホストインタフェースお
よびテープドライブ・ホストインタフェース810によっ
てサポートされる基本的なSCSIプロトコルは、実際に、
「バースト」として知られるSCSI定義されたチャンクに
おけるデータ転送を管理する。バーストは典型的にはレ
コードよりも小さい。このように、事実上それぞれのレ
コード内で、ホストコンピュータとテープドライブ800
がバーストによってデータを転送する。SCSIはこの機能
をサポートし、同時に多重デバイスをサービスすること
を可能にする。バースト長さは、典型的にはホストコン
ピュータとテープドライブ800(一般にはSCSIプロトコル
の下で作動する任意のデバイス)によってデータ転送の
前に交渉される値であり、一般的に、32キロバイトか64
キロバイトに設定される。

【００９９】ホストコンピュータによってホストインタ
フェース810にパスされるデータのバーストのそれぞれ
は、典型的にはSCSIバスの送信端(例えば、書き込み操
作中のホストコンピュータのホスト・バス・アダプタ
ー)によって加算され、SCSIバスの受信端(例えば、書
き込み操作中のテープドライブ800のホストインタフェ
ース810)によってチェックされる、２ビットのパリティ
情報を含む。パリティ情報は受信端でバーストデータの
完全性の簡単なチェックとして使用され、ホストコンピ
ュータ・インタフェース810を超えてはパスされない。

【０１００】ホストインタフェース810は、バーストカ
ウンタ811とレコード・カウンタ812の2つのバイト・カ
ウンタを組み込んでおり、レコードおよびバーストの転
送中にホストインタフェース810からフォーマッタ820ま
でのバイト・パスとしてカウンタにサービスを提供す
る。カウンタ(811と812)は、それぞれのバーストまたは
レコードについてバーストまたはレコード内のバイトの
数をプレロードされている。各バイトがホストインタフ
ェース810から去るに従ってカウンタ(811と812)はディ
クレメントする。この方法によって、カウントの1つが
ゼロであるときにホストインタフェース810がバースト
かレコードの終わりが生じたと判断し、フォーマッタ82
0のためにそれぞれのシグナルまたは「フラグ」を生成
する。

【０１０１】この実施例に従ってバーストとEORシグナ
ルの終わりはフォーマッタ820に、第１のデータバス815
の2ビットの制御チャネル上の2ビットの制御信号として
伝えられる。実際上、これらの信号は、バーストまた
はレコードの最後のバイトと同時にパスするようにタイ
ミングを合わせられている。これに応答して、フォーマ
ッタ820は、信号を受信し、コード化されたデータスト
リームにおける前のコードワードの最後のバイトの後
に、詰めコードワード(バーストの終わりについて)かEO
Rコードワード(EORのための)を挿入するよう構成されて
いる。バーストの終わりとEORが一致する場合、EORが優
先順位を取り、フォーマッタ820は、EORコードワードを
加算するだけになっている。

【０１０２】このように、ホストインタフェース810
は、適切な信号によって、ファイル・マーク、EORおよ
び詰めコードワードのコード化されたデータストリーム
への加算を制御するためにフォーマッタ820によって必
要とされるすべての情報を提供する。

【０１０３】読取り操作のために、プロセスは、ホスト
インタフェース810がタイミングを制御することを除い
て、概して書き込みプロセスの逆である。すなわち、フ
ォーマッタ820は、復号されたデータ、レコードまたは
ファイル・マークを、ホストインタフェース810とホス
トコンピュータがデータを受け取る準備ができているか
どうかに基づいて、ホストインタフェース810に送るた
めの許可を一度に要求しなければならない。

【０１０４】コード化されたデータストリームに詰めコ
ードワードを加算する能力の1つの利点を次に説明す
る。

【０１０５】これまで、この発明者にとって知られてい
るテープドライブはホストインタフェースを構成する、
データの1つまたは複数の全体のバーストを受けること
ができるくらい大きいバッファを使った。バッファにお
けるデータの各バーストは前処理され、バーストのバイ
トがデータ圧縮のようなデータ処理に進められる前にパ
リティ情報を参照してその完全性を検査された。パリテ
ィ情報によって、バーストが‘悪い'ことが決定される
ならば、ホストインタフェース(または同等なホスト・
バス・アダプター)はバーストの再転送を要求する。

【０１０６】この前処理検査の主な理由は、データがデ
ータ処理ステージに入り、コード化され、特に圧縮され
ると、典型的にレコードの中にある「バースト境界」が
結果の圧縮データストリームで「失われる」ことにあ
る。この場合、例えば、1回のバーストにおける最後の
バイトおよび次のバーストの最初のバイトが単一の逆方
向参照によってコード化されたデータストリームに表さ
れるときに、バースト境界が「失われる」ことがある。
このように、再びバーストを送りコード化されたデータ
ストリーム内の正しい位置に置くことは、極度に難し
く、処理面からは扱いにくい。

【０１０７】一般に、前処理はデータ処理のボトルネッ
クとして認識され、バッファメモリとして高価で速いSR
AMを使うことによってこれまである程度低減されてきて
いる。

【０１０８】この発明者はボトルネック問題を異なる態
様で記述し、前処理のためのホストインタフェースのバ
ッファの必要性を大きく取り除いた。

【０１０９】述べられた問題を克服するためのメカニズ
ムは、コード化されたデータストリームのバーストの終
わりを識別するのに詰めコードワードを使用することに
よって可能になる。既に記述したように、詰めコードワ
ードは、ホストコンピュータ・データストリームでの任
意の点をコード化されたデータストリームにおけるワー
ド境界と整列させるために使用することができる。この
場合、詰めコードワードは、それぞれのバーストの終わ
りで次のバーストの始まりをコード化されたデータスト
リームにおける次の32ビットのワード境界と整列させる
のに使用される。このように、バースト境界は、圧縮デ
ータ・ストリームにおいてでも任意の詰めコードワード
のあとに続く32ビットの境界として明確に識別できる。

【０１１０】このように、再試行され、コード化された
バーストは、データが圧縮されているときであっても、
それぞれのデータセットの「悪い」コード化されたデー
タの上に書き込むことができる。

【０１１１】データセットの正しい位置へのバーストの
書き直しは、フォーマッタ820によって制御され、この
フォーマッタは、第1のポインタと2番目のポインタの２
つのポインタを有する。第１のポインタはメインバッフ
ァ830における次のデータ・バイトが書き込まれべき記
憶位置を示し、この記憶位置は、1バイトがメイン・バ
ッファに書き込まれるたびにインクリメントされる。第
２のポインタは、データの最新のバーストに先行する、
詰めコードワードによって生成された、32ビット・ワー
ドの境界の記憶位置を示す。それぞれの新しい詰めコー
ドワードがメインバッファ830に書き込まれるにつれ
て、第２のポインタの値が更新される。ホストインタフ
ェース810がバースト・リトライを要求するとき、マイ
クロプロセッサ850を通してフォーマッタ820は第１のポ
インタを最新のアクセスポイントの位置にリセットし、
このアクセスポイントから第２のポインタによって指し
示される記憶位置へと読み出す。その後、悪いバース
トは再送されたバーストによって上書きされる。このバ
ーストが首尾よくバッファのメイン820に書き込まれる
まで、このプロセスは繰り返される。

【０１１２】また、バースト・リトライが要求されると
き、ホストインタフェース810のカウンタ(811と812)
は、再び通り抜ける同じバイトを収容するため、バース
トにおけるバイトの数だけインクリメントされる。

【０１１３】このバースト・リトライ手法の別の利点
は、履歴バッファ903がデフォルトで、再送処理された
バーストを書き込むため元々送られたバージョンのバー
ストを書くためのものと同じ状態にリセットされること
である。

【０１１４】このように、ホストインタフェース810に
よってバーストにおけるバイトは、受け取られるにつれ
て圧縮のためにフォーマッタ820にパスされることがで
きる。言い換えれば、バイトをフォーマッタ820に送る
前にバースト全体を受け取るのを待つ必要がないので、
ボトルネックが取り除かれる。さらに、前処理のために
データの1つまたは複数の全体バーストを保持する、ホ
ストインタフェース810におけるバッファの必要性もな
い。

【０１１５】パリティ検査は、バーストが‘悪い'かど
うか判断するために必要である。しかしながら、パリテ
ィチェックは、そのバイトがホストインタフェース810
を通り抜けるときホストインタフェース810によって計
算され、結果のパリティチェック数値は、ホストコンピ
ュータから受信されたバーストについてパリティ情報と
比較される。バーストの任意のデータが「悪い」場合、
ホストインタフェース810はホストコンピュータに、標
準のSCSIコマンドであるバースト・リトライを要求す
る。

【０１１６】この原理は、再ボジショニングのためにメ
インバッファ830における任意の位置に拡張することが
できる。例えば、ホストコンピュータは任意の時にSCS
Iコマンド「セーブ・ポインタ」を発行することができ
る。このコマンドは、ホストインタフェース810によっ
て詰めコードワードをコード化されたデータストリーム
に挿入する要求として解釈されることができる。ホスト
コンピュータがデータの各バーストの前に「セーブ・ポ
インタ」コマンドを発行するならば、ホストインタフェ
ース810はこれを詰めコードワードを付加する要求とし
て解釈してもよく、これによりバースト・カウンタ811
が不要になる。

【０１１７】フォーマッタフォーマッタ820の操作を図10のフローチャートを参照
して書き込み操作に関してより詳細に説明する。

【０１１８】フローチャートにおいて書き込みプロセス
は、テープドライブ800がホストコンピュータから書き
込みコマンドを受け取り、マイクロプロセッサ850が書
き込み操作のためにテープドライブを初期化した後にス
テップ1000で始まる。ステップ1010で書き込みコマンド
が「ファイル・マーク書き込み」であり、フォーマッタ
820の準備ができているならば、ホストインタフェース8
10がファイル・マーク信号をマイクロプロセッサ850に
送り、マイクロプロセッサ850がステップ1020でファイ
ル・マークコードワードを出力するためフォーマッタ82
0に信号を送る。

【０１１９】書き込みコマンドがレコードを書くための
ものであり、フォーマッタ820の準備ができているなら
ば、フォーマッタ820がホストインタフェース810からレ
コード・データを受け取り、エンコーダ900は、ステッ
プ1030においてバイトごとに手法Xコード化を適用す
る。Xは、以下に説明するある基準に依存して１または
２であることができる。

【０１２０】どの手法が使われるかに関係なく、すべて
のバイトデータが履歴バッファ903を通る。このよう
に、手法1の場合、エンコーダ900は、可能であれば履歴
バッファ903に存在するコードワードを参照してコード
ワード・データを出力する。手法2の場合、エンコーダ9
00にはパススルーモードがあり、エンコーダ900によっ
て受け取られるバイト値は、単にエンコーダを通りエン
コーダの外にパスされる。データがなんの処理も受ける
ことなくパススルーする場合であっても、各バイトはま
だコード化されたデータストリームにおけるコードワー
ドと呼ばれる。

【０１２１】既に述べたように、バースト処理は、フォ
ーマッタ820がホストインタフェース810から詰めポイン
ト信号を受信するとき、コード化されたデータストリー
ムのバーストの最後のバイトの後に詰めコードワードを
挿入することによって達成される。また、ホストインタ
フェース810からのEOR信号に対応して、コード化された
データストリームのレコードの最後のコードワードの後
にEORコードワードが付加される。

【０１２２】それぞれのレコードかファイル・マークに
ついてコードワードが書き込まれた後、次のステップ10
40は、アクセスポイントが必要かどうかを判断するため
のものである。新しいデータセットの始まりの後できる
だけ早くアクセスポイントが必要とされる。これは実際
上、データセットの始め、またはデータセットにおける
第1の部分レコードの終わり(レコードが前のデータセッ
トで始まったならば)の後であるだろう。アクセスポイ
ントが必要とされるとき、ステップ1050でフォーマッタ
820は、それぞれのEORコードワードを出力した後、パッ
カー910における残りのデータがメインバッファ830にパ
スするまで、ホストインタフェース810からのさらなる
データを「ホールドオフ」する。そして、メインバッフ
ァ830に保持された現在のデータセットについて、フォ
ーマッタ820はアクセスポイントの位置(現在のデータセ
ットの始まりからのバイト・オフセット)をDSITに登録
する。その後、フォーマッタ820は適切なリセットXコー
ドワードを出力し、ホストコンピュータ・インタフェー
ス810からのデータ・バイトを受け取り続ける。

【０１２３】最後にステップ1060において、プロセスは
ステップ1010に返りレコードまたはファイル・マークを
さらに処理するか、またはプロセスはステップ1070で終
了する。

【０１２４】データセットのためのDSIT値は、ホストイ
ンタフェース810から受け取られる信号、特にEORおよび
ファイル・マーク信号、に基づいてフォーマッタ820に
よって生成される。

【０１２５】メインバッファ830から読取り書込み回路
までのデータをパスすることは、データセットごとにマ
イクロプロセッサ850によって制御される。言い換えれ
ば、マイクロプロセッサは、少なくとも1つのデータセ
ットが完全になるまでメインバッファ830からテープへ
のデータ転送に着手しない。逆に、テープからデータを
読取るとき、1つのデータセット全体のために十分な空
間がメインバッファ830にあるようになるまで、マイク
ロプロセッサ850はテープドライブ800がデータを読み取
るのを許可しない。

【０１２６】任意の時間にどのコード化手法が動作中で
あるかに関し、フォーマッタ820は、手法１を使ってコ
ード化されたデータの圧縮比をモニタするために比較器
907の形でモニタ機能を含む。比較器907は、2つのカウ
ンタ、すなわち1バイトがエンコーダにパスされるたび
にインクリメントする第１カウンタ904、およびエンコ
ーダ900から出力される（手法１において）かまたは出
力されるであろう（すなわち、手法２における逆方向参
照）圧縮されたビットの数に沿ってインクリメントする
第２のカウンタ905を含む。また、比較器は分割回路906
を含み、この分割回路は、所与の時間における第１のカ
ウンタ906の値にわたって第2のカウンタ905の値の比率
を計算する。明らかに、分割の前に、同等の数のビット
入力を与えて正しい比率を提供するために、バイト入力
の数に８を掛けることが必要である。この比率は所与の
期間にわたる圧縮率の平均(真または潜在的な)を表して
いる。この所与の期間はエンコーダ900へのバイト入力
の数によって測定することができる。例えば、比率は、
それぞれのワードに値するデータ（すなわち３２ビッ
ト）、それぞれのバーストに値する（例えば３２ｋバイ
ト）のデータ、またはその他任意の期間（例えば１つの
バイトの後ごと）にわたって計算されてもよい。比率が
計算されるたびに、比較器はどの手法が動作中であるか
を示すフラグを生成し、カウンタは、次の比率計算を始
めるためにリセットされる。明らかに、圧縮比の計算法
には他の多くの方法がある。

【０１２７】好ましい実施例において、比率が第1のし
きい値の下より小さいならば、比較器907は手法1から手
法2へのスワップをフラグする。手法2にあるとき、すべ
ての入力データが履歴バッファ903をパススルーするの
で、事実上、手法1コード化はまだイネーブルされてお
り、潜在的な圧縮比測定が続けられる。比率が第2のし
きい値を超えて上昇するならば、手法1へのスワップが
比較器907によって合図される。期間としきい値は構成
可能であり、手法1から手法2へのスワップのための第１
のしきい値は、手法2から手法1へのスワップのための第
２のしきい値と同じであっても異なってもよい。最も良
い総合的な圧縮性能を提供するための期間としきい値の
値は、発見的に決定することができる。代わりに、値は
受け取り中のデータの性質に基づいて適応的に決定して
もよい。もちろん、適応型のオプションは余分な機能性
がテープドライブ800に組み込まれることを必要とする
だろうが、これについての説明は省略する。

【０１２８】このように、手法1が動作中であるとき
（最初のデータセットの最初のレコードに対するデフォ
ルトであり、リセット１コードワードによって判断され
る）、圧縮比が例えば１：１より低下するならば、フォ
ーマッタ820が手法2コードワードをコード化されたデー
タストリームに挿入する。その後、フォーマッタ820に
よって受け取られるレコード・バイトは、コード化され
ないで、エンコーダ900をパススルーする。

【０１２９】圧縮比のモニタは手法2の動作中続く。圧
縮比が例えば1.5：１より上に上昇するならば（すなわ
ち、手法1と2のスイッチングレベルの間には、ヒステリ
シスの要素がある）、エンコーダ900は手法1コードワー
ドを挿入し、後続のレコード・データ・バイトは、手法
1コード化を使用して出力される。

【０１３０】コード化中に、手法Xコードワードの加算
は、履歴バッファ903に影響せず、履歴バッファはリセ
ットされない。このことは、手法2から手法1へのスイッ
チの後に完全な履歴バッファの内容が潜在的逆方向参照
として利用可能であることを意味する。

【０１３１】読取り動作のためにフォーマッタ820の動
作は、書き込み動作の正反対であり、既知の態様で圧縮
の代わりにデータ伸長がエンコーダ900（デコーダとし
て機能する）によって、コード化されたデータに適用さ
れる。実施例によっては、エンコーダ900とは別のデコ
ーダを備えるのが好ましいことがあり、これはデザイン
選択の問題である。

【０１３２】この実施例において、圧縮比のモニタは必
要とされないので、伸長は圧縮よりも直接的である。伸
長は単に、フォーマッタ820が受け取る手法Xおよびリセ
ットXのコードワードのあとに続いている。確保された
コードワードは別として、データ・コードワードは、既
知のそれぞれの伸長アルゴリズムを適用することによっ
て単に復号される。

【０１３３】復号化中に、確保されたコードワードが検
出され、データストリームから取り除かれ、必要な場合
はエンコーダ900（デコーダとして動作している）によ
って処理される。エンコーダ900によって検出されたフ
ァイル・マーク・コードワードは、マイクロプロセッサ
850を通してフォーマッタ820が、ファイル・マークがホ
ストコンピュータに送り返されるべきであることを示す
信号をホストインタフェース810に送るようにさせる。
その他の確保されたコードワードは、どれもホストコン
ピュータに関する限り意味をもたないので、それらはデ
ータストリームから単に取り除かれる。しかしながら、
手法XおよびリセットXのコードワードは、それぞれフォ
ーマッタ820にコード化されたデータを復号させ、履歴
バッファをリセットさせる。

【０１３４】パッカー910の動作を図11のフローチャー
トを参照してより詳細に説明する。

【０１３５】パッカー910はエンコーダ900から得られる
コードワード・データに作用する。ステップ1100におい
てデータは一度に１つのコードワードでパッカー910に
渡される。それぞれのコードワードが受け取られるにつ
れて、パッカー920は参照用テーブル915を参照して、コ
ードワードがワード境界条件に関連するフラッシュ（詰
め）を持つ確保されたコードワードであるかどうかを判
断する。参照用テーブル915は、確保された各コードワ
ードについてエントリを含んでおり、このエントリは、
詰め条件があるかどうかおよびコードワードの埋め込み
に１を使うのか０を使うのかを示す。また、参照用テ
ーブル915におけるエントリは、どのコードワードが確
保されたコードワードであるかおよび確保されたコード
ワードはどうプロセスされるべきであるかを判断するた
めに、復号化中に使用される。

【０１３６】ステップ1105において、受け取られたコー
ドワード・データはパッカー910の「バーレル・シフ
タ」関数912にわたされる。これは、動作的にはFIFOレ
ジスタと似ており、データビットのストリームをその概
念的な「トップエンド（最先端）」に受ける作用を行
い、そのビット（複数）をその概念的な「ボトムエンド
（下端）」にパススルーし、その概念的な「側」から３
２ビット幅のデータワードを並列に出力する。この実施
例によると、データバスの幅は１６ビットなので、ビッ
トは必然的に「側」から１６ビットの２ブロックとして
出力される。

【０１３７】バーレル・シフタ関数912は以下のように
動作する。ステップ1110でコードワード・データの付加
が既にバーレル・シフタ（もし必要であればその中に任
意のビットが既に入っている）にあるビットの数を３２
ビット以上に増加させるならば、ステップ1115でシフタ
は最も末尾の３２ビットをメインバッファ830の現在の
データセットにシフトさせる。次いでステップ1120で
は、バーレル・シフタの残りのビット(残りのビットが
あるならば) は、バーレル・シフタの末尾にシフト(32
ビットだけ)される。プロセスは、次いでステップ1110
に返り、シフタにおけるビットの数がさらにチェックさ
れる。

【０１３８】シフタにあるビットが32ビットよりも少な
いならば、ステップ1125でパッカがシフタに残りのビッ
トがあるかどうかチェックする。残りのビットがないな
らば、パッカープロセスはステップ1145で終わる。残り
のビットがあるならば、ステップ1130において、パッカ
910が参照用テーブル915を参照して詰め条件を持つ確保
されたコードワードの存在を検出したかどうかに基づい
て、ワード境界へのフラッシュ（詰め）条件がアクセス
される。詰め条件があるならば、ステップ1135におい
て、バーレル・シフタは、詰め条件に依存して最後に受
け取られたコードワードの後から３２ビットしきい値ま
でゼロまたは１によって満たされまたは「埋められ
る」。次に、ステップ1140でシフタはその32ビットをメ
インバッファ830のデータセットにシフトアウトする。
最後に、ステップ1145において、プロセスは、受け取ら
れたコードワード・データについて終了する。

【０１３９】この方法でパッカー826は、デフォルトと
して３２ビットのワード単位で、コード化データの転送
を制御し、同時に詰めコードワードについて必要とされ
る、各データセットの３２ビット境界へのビット埋め込
みを制御する。

【０１４０】読取り動作のために、パッカーはテープか
ら読まれたデータを「解凍する」作用も行う。この動作
は、パッカー920が32ビットのワードを受け取り、コー
ドワード・バイトをエンコーダ900（いまデコーダとし
て動作している）に返す点で、「パッキング」の逆であ
る。そうする際に、パッカー920(「アンパッカー」とし
て機能している)は、参照用テーブル915を参照し、以前
に「パック」された確保されたコードワードを検出し、
パッキング・プロセスで付加された埋め込みを取り除
く。さらに、いくつかの実施例では、パッカー910は、
詰めコードワードおよびEORコードワードをコード化さ
れたデータストリームから取り除くようになっていても
よい。フォーマッタ820が復号化プロセス中にこれらの
コードワードの受けとりを必要としないからである。

【０１４１】以上にこの発明の1つの特定の実施例を説
明した。この発明は、実施例に限られるものではなく、
他の多くのデータ記憶装置において使用することができ
る。いくつかの例は、ハードディスク・システム、並び
にDVD-RAM(ディジタルビデオ・ディスクRAM)を含む光書
き込みまたは読み取り可能なディスクシステムである。

【０１４２】この発明は、例として次の実施態様を含
む。

【０１４３】(1) データソースからデータソースによっ
て決定されるデータ構造を有するデータを受け取るステ
ップと、データ構造とは独立に判断される、データにお
ける追加可能ポイントを判断するステップと、データソ
ースからのデータをコード化データストリームにコード
化し、コード化データストリームへ追加可能ポイントを
表すデータを挿入するステップと、記憶装置または媒体
にデータストリームを書き込むステップと、を含むデ
ータソースから受け取られるデータを調整する方法。

【０１４４】(2) 上記(1)による方法であって、ホスト
・データおよびコード化データストリームにおける追加
可能ポイントを表すデータが一連の固定長データ部に整
えられるデータ調整方法。

【０１４５】(3) 上記(2)による方法であって、残りの
ホストデータまたは決定された追加可能ポイントの後に
受け取られる後続のホストデータがコード化データスト
リームの追加可能ポイントに追加され、この追加可能ポ
イントが上記一連の固定長のデータ部における固定長の
最初の利用可能なデータ部の始めおよび実際の追加可能
ポイントを表すデータの後にあるデータ調整方法。

【０１４６】(4) 上記(3)による方法であって、追加可
能ポイントを表すデータが固定長の識別子部分および可
変長パディング部分を含み、この可変長パディング部分
は、固定長の識別子部分と追加可能ポイントとの間にス
ペースがあればこれを満たすに十分なビットを有するデ
ータ調整方法。

【０１４７】(5) 上記(1)から(4)の任意の1つによる方
法であって、データソースからのデータがバーストかパ
ケットで受け取られ、各バーストまたはパケットの始
めか終わりが追加ポイントと判断されるデータ調整方
法。

【０１４８】(6) 上記(1)から(5)の任意の1つによる方
法であって、データソースからのデータをデータ・コー
ドワードの流れにコード化するステップをさらに含み、
実際の追加可能ポイントを表すデータが制御コードワー
ドを含むデータ調整方法。

【０１４９】(7) 上記(6)による方法であって、書き込
まれたデータを固定長データセットに調整するステップ
をさらに含み、データセットが、データ・コードワード
および制御コードワードのためのデータ領域およびデー
タセットに関連する情報を含む情報を格納するためのデ
ータセット情報領域を含むデータ調整方法。

【０１５０】(8) データソースからデータ転送で受け取
られるデータのバーストを処理する方法であって、 a)データソースからデータの新しいバーストを受け取る
ステップと、 b)データのバーストの完全性について判断するステップ
と、 c)データのバーストをコード化データストリームにコー
ド化するステップと、 d)記憶装置または媒体において定義された追加可能ポイ
ントから記憶装置または媒体に該コード化データストリ
ームを書き込むステップと、 e)新しい追加可能ポイントを表すデータをコード化デー
タストリームに追加するステップと、 f)バーストが悪いと判断される場合、 i)悪いバーストの再転送を要求し、 ii)データソースからデータの再送されたバーストを受
け取り、 iii)ステップb)からf)を繰り返し、バーストが良いと判断される場合、データ転送が完全に
なるまでステップa)からf)を反復するデータバーストの
処理方法。

【０１５１】(9) データソースから受け取られるデータ
を調整するための装置であって、データソースからデー
タソースによって決定されるデータ構造を有するデータ
を受け取り、データ構造とは独立に判断されるデータに
おける追加可能ポイントを判断するインターフェイス手
段と、データソースからのデータをコード化データスト
リームへコード化し、追加可能ポイントを表すデータを
コード化データストリームに挿入し、記憶装置または媒
体にこのデータストリームを書き込むコード化手段と、
を備える調整装置。

【０１５２】(10) 上記(9)による装置であって、エンコ
ーダ手段はコード化データストリームを一連のの固定長
のデータ部に調整するよう構成されている調整装置。

【０１５３】(11) 上記(10)による装置であって、前記
エンコーダ方法は、残りのホストデータまたは決定さあ
れた追加可能ポイントの後に受け取られる後続のホスト
データをコード化データストリームの追加可能ポイント
に追加するよう構成され、この追加ポイントは前記一連
の固定長のデータ部における固定長の最初の利用可能な
データ部の始めおよび実際の追加可能ポイントを表すデ
ータの後にある調整装置。

【０１５４】(12) 上記(9)〜(11)の任意の1つによる装
置であって、インタフェース手段はデータソースからデ
ータをバーストまたはパケットで受け取り、それぞれの
バーストまたはパケットの終わりが追加可能ポイントで
あると判断するようになっている前記調整装置。

【０１５５】(13) 上記(9)〜(12)の任意の1つによる装
置であって、エンコーダ手段はデータソースからのデー
タをデータ・コードワードの流れコード化し、実際の追
加可能ポイントを表すデータを制御コードワードにコー
ド化する前記調整装置。

【０１５６】(14)データソースからデータ転送で受け取
られるデータのバーストを処理するための装置であっ
て、データソースからデータの新しいバーストを受け取
り、るためのインターフェイス手段と、データのバース
トの完全性について判断し、それが悪いと判断される場
合データのバーストの再転送を要求するインターフェイ
ス手段と、データのバーストをコード化データストリー
ムにコード化し、このコード化データストリームを記憶
装置または媒体における定義された追加可能ポイントか
ら書き込み、新しい追加可能ポイントを表すデータをコ
ード化データストリームに追加するコード化手段と、を
備え、前記コード化手段は、任意の再送処理されたバー
スト・データを定義された追加可能ポイントから書き、
任意の後続の、新しいバースト・データを新しい追加
可能ポイントから書くようになっている処理装置。 (15) 上記(1)〜(8)の任意の1つの方法に従って動作する
よう構成されたデータ記憶装置。 (16) 上記(1)〜(7)の任意の1つに従うデータをデコード
するための装置。。 (17) 上記(1)〜(7)の任意の1つに従ってデータを調整す
るよう構成されたASIC。 (18) 上記(1)〜(7)の任意の1つに従ってデータをデコー
ドするよう調整されたASIC。 (19) 埋め込まれたフラッシュ・コードワードを含むユ
ーザデータを表すコードワードの流れを含むコード化デ
ータ。 (20) 磁気テープデータ記憶装置を有する上記(9)〜(16)
の任意の1つによる装置。 (21) ホスト・データをフォーマットする方法であっ
て、ホスト・データを受け取り、該ホスト・データをコ
ードワードとともにコード化し、コード化データストリ
ームを形成するステップと、コード化中の特定のポイン
トで追加可能ポイントを表すために詰めコードワードを
コード化データストリームへ挿入するステップと、メモ
リにコード化データストリームを書き込むステップと、
を含むフォーマット方法。

【０１５７】

【発明の効果】この発明によると、インデックスの情報
に頼ることなくコード化データストリームにおいて追加
可能ポイントを見いだすことができる。

【図面の簡単な説明】

【図１】（Ａ）はホストコンピュータからのホストコン
ピュータ・データの一般的な形を示す図、（Ｂ）は、ホ
ストコンピュータ・データをホストコンピュータ・デー
タをフォーマットする従来技術に従って分類する図。

【図２】図１（Ｂ）のデータグループのインデックスに
格納されるタイプのデータをより詳細な態様で示す図。

【図３】（Ａ）および（Ｂ）は、データをテープに書く
ことができる2つの共通のフォーマットを示す図。

【図４】この発明の実施例に従ってコード化されたデー
タの一般的な形を示す図。

【図５】この発明の実施例に従って規定されるデータセ
ットの一般的な形を示す図。

【図６】この発明の実施例に従って規定される確保され
たコードワードのテーブルを示す図。

【図７】この発明の実施例に従って規定されるデータセ
ット情報テーブルのエントリのテーブルを示す図。

【図８】この発明の実施例に従ってデータをフォーマッ
トするためのテープドライブのアーキテクチャを示すブ
ロック図。

【図９】この発明の実施例に従ってデータをフォーマッ
トするフォーマッタの主要部のブロック図。

【図１０】この発明の実施例に従ってデータをコード化
する際のステップを図示するフローチャート。

【図１１】この発明の実施例に従ってコード化されたデ
ータをパックする際のステップを図示するフローチャー
ト。

【図１２】特定の実施例で使用されるデータ圧縮手法に
おけるマッチフィールド・データに使用されるコード化
手法のテーブルを示す図。

【符号の説明】

８００テープドライブ８１０ホストインターフェイス８２０データフォーマッタ

Claims

【特許請求の範囲】

【請求項１】データソースからデータソースによって決
定されるデータ構造を有するデータを受け取るステップ
と、データ構造とは独立に判断される、データにおける追加
可能ポイントを判断するステップと、データソースからのデータをコード化データストリーム
にコード化し、コード化データストリームへ追加可能ポ
イントを表すデータを挿入するステップと、記憶装置または媒体にデータストリームを書き込むステ
ップと、を含むデータソースから受け取られるデータ
を調整する方法。