JPH11242856A - データソースから受け取ったデータを並べる方法 - Google Patents

データソースから受け取ったデータを並べる方法

Info

Publication number
JPH11242856A
JPH11242856A JP10308160A JP30816098A JPH11242856A JP H11242856 A JPH11242856 A JP H11242856A JP 10308160 A JP10308160 A JP 10308160A JP 30816098 A JP30816098 A JP 30816098A JP H11242856 A JPH11242856 A JP H11242856A
Authority
JP
Japan
Prior art keywords
data
codeword
record
burst
tape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10308160A
Other languages
English (en)
Other versions
JP4124887B2 (ja
Inventor
Richard Arthur Bickers
リチャード・アーサー・ビッカーズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JPH11242856A publication Critical patent/JPH11242856A/ja
Application granted granted Critical
Publication of JP4124887B2 publication Critical patent/JP4124887B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0682Tape device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/215Recordable discs
    • G11B2220/216Rewritable discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • G11B2220/2575DVD-RAMs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • G11B2220/91Helical scan format, wherein tracks are slightly tilted with respect to tape direction, e.g. VHS, DAT, DVC, AIT or exabyte
    • G11B2220/913Digital audio tape [DAT] format

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】インデックス情報に頼ることなくコード化デー
タストリームにおける特定のレコードまたはファイルマ
ークの開始位置を見いだす。 【解決手段】テープドライブ800において、ホストイ
ンターフェイス810がホストコンピュータからデータ
を受け取る。データ構造とは独立にデータにおける追加
可能ポイントについて判断し、データソースからのデー
タを圧縮されたコード化データストリームにコード化
し、追加可能ポイントにフラッシュ・コードワードを挿
入する。フラッシュ・コードワードに続くコードワード
はフラッシュ・コードワードに対する相対位置で見つけ
ることができるから、圧縮データストリームにおいて追
加ポイントはフラッシュ・コードワードによって見つけ
ることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明はデータの格納方法
に関係し、特に、しかし排他的でなく、例えばテープな
どの磁気媒体に格納するためにデータをコード化または
フォーマットするための方法および装置に関する。
【0002】
【従来の技術】テープへのデータ格納を例にとると、ホ
ストコンピュータシステムは典型的には、テープドライ
ブのような記憶装置装置にレコードごとにデータを書
く。さらに、ホストコンピュータは、ファイル・マーク
(FILE MARKs)やセット・マーク(SET MARKs)などのレコ
ード分離文字を使用してレコード自体を分離してもよ
い。
【0003】典型的には、 レコードはユーザデータを
含み、例えばワードプロセッサのドキュメント、コンピ
ュータグラフィック画像またはデータベースを構成する
データを含む。対照的に、ファイル・マークなどのレコ
ード分離文字は、ワードプロセッサのドキュメントの終
わりおよび次の始まりを示すためにホストコンピュータ
によって使用される。言い換えれば、 レコード分離文
字は典型的には関連するレコードのグループを分離す
る。
【0004】一般にホストコンピュータはレコード長さ
およびレコードとレコード・セパレータが受け取られて
いる順番について判断し、記憶装置装置はこれを管理し
ない。
【0005】例として、図1(A)は、既存の型のホストコ
ンピュータがテープ記憶装置に書くことがあるユーザデ
ータおよび分離文字の論理的なシーケンスを図示する。
具体的には、 ホストコンピュータは、R1からR5の5つの
固定長レコードを供給し、レコードR1、 R2およびR5の
後に3つのファイル・マーク(FM)を置く。
【0006】テープドライブのような記憶装置がホスト
コンピュータ・データを受け取り、データ・レコードを
レコード構造とは独立に固定サイズのグループに整理
し、それぞれのグループのインデックス形成部分におい
てレコード構造をレコードおよびファイルマーク位置に
よって表すことが知られている。そのような手法は、IS
O/IEC標準10777:1991 Eに定義されるテープドライブの
ためのDDS(デジタルデータ記憶装置)データフォーマッ
ト標準の基礎を形成する。ヨーロッパ特許出願EP0 324
542号明細書は、このような手法を実現するDDSテープド
ライブの1つの例を記述する。データのグループが形成
されると、テープドライブは、典型的には何らかの形態
の誤り検出/修正コーディングを適用した後に、グルー
プをテープに格納する。
【0007】図1(B)は、図1(A)で示されるホストコン
ピュータ・データをDDSグループへの組織化について図
示する。典型的に、ホストコンピュータ・データ・レコ
ードは、各グループにおいてコード化されまたは圧縮さ
れて連続的なコード化されたデータストリームを形成す
る。ファイルマークはテープドライブによって受け取ら
れ(インターセプトされ)、ファイルマークのコード化
データストリームにおける出現および位置を記述する情
報がテープドライブによって生成され、それぞれのグル
ープのインデックスに格納される。この例でレコードR
1、 R2およびレコードR3の一部分がコード化データスト
リームに圧縮され最初のグループに格納され、レコード
および第1および第2のファイルマークのコード化デー
タストリームにおける存在と位置を示す情報が第1グル
ープのインデックスに格納される。次に、レコード3の
残り、およびレコード4および5が連続的なコード化デ
ータストリームに圧縮され、第2のグループに格納さ
れ、レコードおよび第3ファイルマークのコード化デー
タストリームにおける存在と位置を示す情報が第2グル
ープのインデックスに格納される。
【0008】図2は、図1(B)に示される両方のグル
ープについて非常に一般にインデックスの形を図示す
る。各インデックスは、2つのメイン・データ構造、す
なわちブロックアクセス・テーブル(BAT)とグループ情
報テーブル(GIT)を含む。BATのエントリの数はGITのBAT
エントリ・フィールドに格納される。また、GITは、現
グループに含まれるものを含み記録(BOR)マークの始ま
り以来書かれたFMの数であるファイルマーク・カウント
(FMC)のような様々なカウントを含んでおり、現グルー
プに含まれるものを含み記録(BOR)マークの始まり以来
書かれたレコードの数であるレコードカウント(RC)も含
まれる。この簡単な例でのエントリのための値がかっこ
内に示される。GITは、現在のグループだけに生じるフ
ァイルマークおよびレコードのそれぞれの数その他の情
報を含んでもよい。
【0009】一連ののエントリを通してBATは、グルー
プに保持されたレコード・データおよび各セパレータ・
マークの位置の論理的な区分化によってグループの‘構
造'を記述する。BATでのアクセス・エントリがグループ
の内容の順番で続き、BAT自体がグループの終わりから
内側に成長しレコード・データのコード化データストリ
ームに出会う。
【0010】
【発明が解決しようとする課題】そのような手法では、
ホストコンピュータからのデータ読み取りまたは書き込
みのコマンドに基づいて格納されているデータを読み取
るテープドライブは、コード化データストリームにおけ
る特定のレコードまたはファイルマークの開始位置を見
いだすためにインデックスの情報に頼らなければならな
い。
【0011】
【課題を解決するための手段】第1の面によると、この
発明はデータソースから受け取られるデータを調整する
方法を提供し、データソースによって決定されるデータ
構造を有するデータをデータソースから受け取るステッ
プ、データ構造とは独立にデータにおける追加可能ポイ
ントについて判断するステップ、データソースからのデ
ータをコード化データストリームにコード化し、追加可
能ポイントを表すデータをコード化データストリームへ
挿入するステップ、および記憶装置または媒体にデータ
ストリームを書き込むステップを含む。
【0012】この発明は、データソースから受け取られ
たデータを、任意の所望のポイント、「追加可能」ポイ
ントが、結果として得られるコード化または圧縮された
データストリームで、そのポイントがレコードの境界ま
たはファイルマークと一致するかどうかとは無関係に見
つけられる態様でコード化する手段を提供する。
【0013】本願出願人の特許出願(ヨーロッパ特許出
願番号97308756.2)は、レコード境界およびファイルマ
ークのようなレコードセパレータを表す特別な保留され
たコードワードをコード化データストリームに埋め込む
ことによってBATのための条件が取り除かれることを記
述している。そこでは、レコード境界およびファイル・
マークは、それぞれの埋め込まれたコードワードによっ
て見つけることができる。ここで問題とする課題は、特
にコード化データが圧縮されているとき、任意の必要な
位置をコード化データの中で見つけることができるよう
なデータコード化に関する。この発明は、出願人の継続
中の特許出願と組み合わせて使用されるとき特に有利で
あると信じられる。
【0014】この発明の好ましい実施例では、データソ
ースからのデータはバーストかパケットで受け取られ、
それぞれのバーストまたはパケットの始めまたは終わり
が追加可能ポイントと判断される。これは下に説明する
ようにバースト処理目的のために特に有利である。
【0015】この発明の第2の面によると、この発明は
データソースから受け取られたデータを整えるための装
置を提供し、データソースによって決定されるデータ構
造を有するデータをデータソースから受け取るため、そ
してデータの追加可能ポイントをデータ構造とは独立に
判断するためのインターフェイス手段と、データソース
からのデータをコード化データストリームにコード化
し、追加可能ポイントを表すデータをコード化データス
トリームに挿入し、そのデータストリームを記憶装置ま
たは媒体に書き込むコード化手段と、を備える。
【0016】この発明はテープ記憶装置のフィールドで
特定用途を見つけるが、この方法は等しく他の記憶装置
および記憶媒体に適用することができる。1つの代替記
憶媒体は光ディスクであろう。また、データがホストコ
ンピュータ以外のソース、例えば記憶装置の間でデータ
を動かすデータ移動システムから受け取られてもよい。
【0017】この発明の他の面と実施例は以下の説明と
請求項から明らかになるであろう。
【0018】
【発明の実施の形態】この実施例は、テープドライブに
よって受け取られるデータをテープへのその後の格納の
ために整理するための新データ・フォーマットに基づ
く。そのフォーマットを次に詳述する。
【0019】フォーマット概要 図4に描かれているように、ホストコンピュータによっ
てテープドライブに書かれる、フォーマットに規定され
るデータの最も小さい集まりがレコード400である。レ
コード400はホストコンピュータによってテープドライ
ブによる処理のために供給されることができ、テープド
ライブによって再処理されホストコンピュータに提供さ
れる。レコードがホストコンピュータによって「書かれ
る」データの最小の集まりであるという概念は、データ
が実際にホストコンピュータとテープドライブの間で
「転送される」または「トランスポートされる」メカニ
ズムと混同されてはならない。そのようなメカニズム
は、典型的には基本的なプロトコル、例えば、 SCSI(ス
モールコンピュータシステムインタフェース)を利用す
る。このプロトコルは、ホスト・データの性質または構
造と関係なく比較的小さいパケットかバーストの点で明
確に規定された(すなわち、交渉済みの)の方法でデータ
を転送する。SCSIなどのプロトコルは、後続のパケット
またはバーストを受け付ける前にそれぞれのパケットか
バーストを有効にする。
【0020】このフォーマットは、ファイル・マーク書
き込みコマンドの形でホストコンピュータによってテー
プドライブに書き込まれることができるファイル・マー
ク410をサポートする。
【0021】また、このフォーマットは、それぞれのレ
コード400におけるデータが可能な場合はデータ圧縮(D
C)アルゴリズムによって連続的な(圧縮された)シリーズ
のデータ・コードワード(CW)にコード化されることを指
定する。このデータ・コードワードは図4においてラベ
ル420で示される。
【0022】このフォーマットと既存のフォーマットの
間の主要な違いは、レコード境界とファイル・マークの
両方がシンボルまたは確保された(reserved:残してあ
る、予備の)コードワードとしてコード化され、連続的
な(圧縮された)コード化されたデータストリームに埋め
込まれることである。例えばDDSのような他のフォーマ
ットと比べて、これは、コード化された、または、圧縮
されたデータストリームが、別々に記録されるか転送さ
れたテーブルまたはインデックスを参照することなく、
レコードおよびファイル・マーク書き込みコマンドの直
列の流れに復号されるのを許容する。図4では、確保さ
れたレコード終り(EOR)コードワードは430で示され、確
保されたファイル・マーク・コードワード(FMC)は440で
示される。
【0023】このフォーマットによると、この発明の本
質的な部分ではないが、コード化されたデータストリー
ム(データおよび確保されたコードワードを含む)は、下
に述べるようにさらにデータセット形に整理される。次
に、データはテープに書かれ、その過程において周知の
誤り検知・訂正コーディング、例えば、 リード-ソロモ
ンのコーディングの形で冗長性を加えることができる。
【0024】データセット コードワードは、図5のダイヤグラムで示されるように4
0万4352バイトのデータから成るデータセットに整理さ
れる。各データセット500は、固定長コードワード領域5
10および固定長データセット情報テーブル(DSIT)領域52
0を含む。各データセットはゼロから始まり連続的に割
り当てられる連続番号によって同定される。それぞれの
データセットの中で、バイトは0〜40万4351まで連続番
号によって同定され、コードワードはバイト0から左か
ら右にデータセット内で配列される。DSITはDDSフォー
マットのGITと性質的に似ており、1つの相違点は、こ
のフォーマットにはBAT(または、同等物)がないので、D
SITにおいてBATへの参照がないことである。。
【0025】プロセスされたデータ・コードワード 既に述べたように、可能な場合には、データはDCアルゴ
リズムを使用してプロセスされる。この実施例による
と、アルゴリズムはALDC-2として知られているLZ-1スラ
イディング辞書圧縮アルゴリズムに基づく。ALDC-2アル
ゴリズムは、1024バイトの履歴バッファを使用してバイ
ト幅のデータをコード化し、バイト(リテラル)または履
歴バッファの中のバイトの文字列への参照を表すデータ
・コードワードのシーケンスを出力する。ALDC-2は周知
のECMA(ECMA-222)およびQIC(QIC-154)標準であり、ここ
では詳細を述べない。LZ-1方法は考案者であるA. Lempe
lとJ. Zivにちなんで名付けられたものであり、 James
A. Storerによる本"DataCompression: methods and the
ory"(1988年にコンピュータサイエンスプレスによって
発行された)に詳細が記述されている。LZ-2として知ら
れている他の同様の方法、すなわちこの本に記載されて
いるコードワード辞書技法も代わりに使用することがで
きる。
【0026】この実施例によると、ここに詳細を記述す
るように、コード化手法はALDC-2 DCアルゴリズムの変
更されたバージョンを利用し、2つのコード化手法、す
なわちデータを圧縮するためのもの(手法1)とデータを
圧縮しないで通すもの(手法2)とを切り換える能力、
並びに後続の復号化関数を制御するためまたはファイル
マークなどのホストコンピュータ・データ分離情報を識
別するために、コード化されたデータストリームに含め
ることができるたくさんの確保されたコードワードをサ
ポートする。
【0027】多重データコード化手法 データをコード化するアルゴリズムは2つの異なったコ
ード化手法から成り、そのどちらも処理中のデータの特
性に従って選択することができる。第1の手法(手法1)
は、履歴バッファのデータへの逆方向参照の使用でデー
タの冗長度を減少させ、 2番目の手法(手法2)は、修正
することなくデータを全般的にコピーする。手法2は、
ほとんどまたは全く冗長性を持たない、手法1において
拡張を実際に生じさせるデータを守るために提供され
る。そのような圧縮不可能なデータはグラフィカルなデ
ータか、既に圧縮されているデータでありうる。
【0028】どちらの手法が動作中であろうと、すべて
のデータが履歴バッファを通り抜ける。したがって、手
法2から手法1への変化の後に、手法2を使って受け取ら
れ処理された履歴バッファ中のデータに手法1の逆方向
参照を使用することが可能である。それは、あたかも手
法2におけるデータ出力が手法1におけるリテラルとし
て出力されていたかのようである。
【0029】手法を変えるときに、アクセスポイント
(以下で説明される)でとか、さらにデータを追加すると
きとかのように、そうすべき別の理由がないかぎり履歴
バッファはリセットされる必要がない。リセットは、意
味のある逆方向参照を提供するために履歴バッファが再
充填を必要とするので、典型的には圧縮比の潜在的な短
期間の減少を引き起こすだろう。
【0030】手法1のデータ・コードワード この実施例によると、手法1がデータを圧縮するのに使
用され次のような3つのタイプのデータ・コードワード
を出力する。 1)リテラル: ‘0'にコード化中の8ビットのバイト
(またはそのコピー)が続く 9ビットのコードワード。 2)逆方向参照: ’1’に、マッチ長をバイトで表現す
る可変長2ないし12ビットのマッチカウント/フィール
ドが続き、これに履歴バッファにおける逆方向参照の始
まりの位置を示す10ビットの変位フィールドが続く可変
長コードワード。このように、 逆方向参照コードワー
ドは13ビットから23ビットの範囲の長さでありうる。 3)手法1の確保されたコードワード: いつもルート・
コードワード1.1111.11112で始まり、4ビットのフィー
ルドで終わり、図6に示すように確保されたコードワー
ドを同定する13ビット長のコードワード。16の可能な確
保されたコードワードは(図12に示されるように)有効
な逆方向参照でなく、逆方向参照と混同されることはな
い。
【0031】手法2のデータ・コードワード この実施例によると、手法2は3つのタイプのデータ・コ
ードワードを出力する。非コード化リテラル − 0x00
から0xFEの範囲の8ビットのデータ値について、8ビット
入力のコピーである8ビットのデータ・コードワードが
出力される。コード化されたリテラル − 8ビット・
データ値0xFFについて9ビットのコードワード1111.111
1.02が出力される。手法2の確保されたコードワード
− いつもルート・コードワード1111.1111.12で始まり
図6で示されるように確保されたコードワードを同定す
る4ビットのフィールドで終る13ビット長のコードワー
ド。
【0032】手法1の逆方向参照 レコード・データが受信されるにつれて、各バイトは一
致するバイトを求めて履歴バッファのすべてのバイトと
比較される。任意の一致は潜在的逆方向参照として扱わ
れる。一致が現れるならば、次の受け取られたバイトは
それぞれの潜在的逆方向参照に続くバイトと比較され
る。一致があるならば、2バイトについて逆方向参照が
発見されたことになる。一致が生じなくなるかまたは不
一致が起こるまで、これは続く。ミスマッチ前のバイト
の最も長いマッチングしている文字列がマッチカウント
および変位フィールドで規定された逆方向参照として使
用され、圧縮されコード化されたデータストリームに出
力される。図12のテーブルに示されるように、一致カウ
ント・フィールドは、より短い一致フィールドがより長
い一致フィールドの始まりとして誤って解釈されるのを
防ぐために、2、 4、6、 8または12ビットのフィールド
としてコード化される。
【0033】確保されたコードワード 説明したように、手法1および手法2の両方ともたくさん
の13ビットの確保されたコードワードを出力し、最初の
9ビットが1で、後続の4ビットは後に規定する確保され
たコードワードの1つを表す値である。こうしなければ
ならない理由はないが、便宜上、同じ13ビットの確保さ
れたコードワードが両方の手法に使用される。
【0034】確保されたコードワードは、データをコー
ド化するプロセス中にテープドライブによって、コード
化されたデータストリームに挿入され、復号化プロセス
の操作を制御し、ファイルマークのようなデータ分離情
報をコード化する。
【0035】しかしながら、 確保されたコードワード
はコード化または復号化中に、履歴バッファにパスされ
ない。
【0036】DDSフォーマットとは異なり、どこでレコ
ードまたはファイル・マークが始まり終わるかを示す別
のインデックス(例えばBAT)がないので、この実施例
によるフォーマットは、コード化されたデータストリー
ム内でのデータ追加または動作の場所を見つけることを
イネーブルするための代替のメカニズムを提供する。
【0037】このメカニズムは、追加ポイントと呼ばれ
る予定位置で生じるコード化データストリームの特定の
規定された部分をあてにする。これを容易にするため
に、コード化されたデータストリームは、ホストコンピ
ュータからのデータ転送の始まりから32ビットのワード
に論理的に仕切られ、追加ポイントは常に32ビットのワ
ード境界と整列するかこれに詰められている。ワードの
32のビット長は、2のべき乗であり便利な数であるが、
ワードが他の長さとして規定されてはならない理由はな
い。
【0038】さらに、履歴バッファ不一致が追加ポイン
トで強制されるので、追加ポイントが逆方向参照に埋め
込まれるようにならない。追加ポイント前に見つけられ
たバイトの最も長いマッチング文字列が、マッチング文
字列が追加ポイントを超えて拡張してもよいかどうかと
は無関係に出力される。
【0039】追加ポイントの存在は、図6に示されるよ
うに「詰め」条件をもつ任意の確保されたコードワー
ド、すなわちファイルマーク、EOR、フラッシュ(詰
め)およびエンドマーカのコードワードの1つによって
決定される。ワード境界との整列を行うために、コード
化されたデータストリームにおけるこれらの確保された
コードワード(エンドマーカとは別に)の任意のものと
その次のワード境界との間のスペースは、もしあれば、
0でビット詰めされている。エンドマーカとその次の境
界との間のスペースは、もしあれば、1でビット詰めさ
れている。
【0040】実際上、コード化されたデータストリーム
におけるコードワードは、手法1と手法2の両方に必要と
されるようにそれぞれのデータセットのコードワード領
域510に格納するために32ビットのワードにビット詰
めされており、最も有意なビットが出力されるか復号中
に遭遇されるようにビット順が逆にされている。次にそ
れぞれの確保されたコードワードのより詳細な説明を行
う。
【0041】リセット1 リセット1コードワードに遭遇するときはいつも履歴バ
ッファがリセットされ(すなわち、後続のデータがバッ
ファの始めに置かれ)、続くすべてのデータ・コードワ
ードは、手法1のデータコードワードである。リセット
2か手法2コードワードのどちらかに遭遇するまで、これ
が適用される。
【0042】手法1または手法2を適用するかどうかを決
定する基礎が、達成した(または達成可能な)圧縮率に
完全に依存し、入ってくるデータの構造とは独立なの
で、リセット1コードワードはレコードの中か外のどち
らで生じてもよい。それがレコード外で生じる場合、コ
ードワードは詰め条件を持たないが、EORコードワード
のあとに続いて32ビット境界でいつも始まり、そのすぐ
後にフラッシュ(詰め)コードワードがいつも続く。こ
うしてその次のレコードまたはファイルマークはワード
境界で始まる。
【0043】リセット1コードワードはレコードの最初
のコードワードとして生じてもよく、この場合レコード
内にあるとされ、フラッシュ・コードワードがこれに続
く必要はない。
【0044】リセット1コードワードは、前のデータの
知識なしに伸長がそのポイントで確実に始まることがで
きるように、アクセスポイントに書かれている。アクセ
スポイントは、伸長が始まることができるデータデータ
セットのポイントであり、アクセスポイント後の逆方向
参照は、そのアクセスポイント後に受け取られた履歴バ
ッファ内のデータを参照することができるだけである。
伸長は、DSITを参照する必要性なしにアクセスポイント
を交差してシームレスに続くことができる。
【0045】リセット1は、履歴バッファが再成長する
必要があるので、圧縮率の潜在的な短期間の低減を引き
起こすだろう。
【0046】リセット2 リセット2コードワードに遭遇するときはいつも、履歴
バッファがリセットされ(すなわち、後続のデータがバ
ッファの始めに置かれる)、あとに続くすべてのデータ
・コードワードは手法2のデータ・コードワードであ
る。リセット1か手法1コードワードのどちらかに遭遇す
るまで、これが適用される。
【0047】他のすべてにおいて、リセット2コードワ
ードはリセット1コードワードに同じに扱われる。
【0048】手法1 手法1コードワードは、あとに続くすべてのデータ・コ
ードワードが手法1データ・コードワードであることを
示し、リセット2または手法2コードワードのどちらかに
遭遇するまで、これが適用される。手法1コードワード
はレコードの中と外の両方に生じることができる。
【0049】コードワードには詰め条件がないが、それ
がレコードの外で生じるとき、EORコードワードに続い
てそれはいつも32ビット境界で始まり、そのすぐ後に常
にフラッシュ(詰め)コードワードが続くので、次のレ
コードまたはファイル・マークはワード境界で始まる。
【0050】手法1コードワードはレコードの最初のコ
ードワードとして出力されてもよく、この場合レコード
内にあるのと考えられ、詰めコードワードがあとに続く
必要はない。
【0051】手法2 手法2コードワードは、あとに続くすべてのデータ・コ
ードワードが手法2データ・コードワードであることを
示し、これは、リセット1か手法1コードワードのどちら
かに遭遇するまで適用される。他のすべてにおいて、そ
れは手法1コードワードと同じ効用を与える。
【0052】ファイル・マーク ファイル・マーク・コードワードはファイル・マーク書
き込み(Write FILE MARK)コマンドを表し、従ってレコ
ード内には生じない。ファイル・マーク・コードワード
は、32ビット境界でいつも始まる。なぜなら、それはい
つも、データ転送の始め、レコードの後、または、別の
ファイル・マークの後のいずれかに位置するからであ
る。ファイル・マーク・コードワードには、 それぞれ
の詰め条件があるので、デフォルトとして、32ビットの
定数(1.1111.1111.0100 + 000.0000.0000.0000.00002
= FF980000h)として扱うことができる。
【0053】EOR EORコードワードはレコードの最後のコードワードであ
り、したがって、レコードの外では決して生じることが
できない。このコードワードに続くのは、次の32ビット
のワード境界まで埋め込むためのゼロから31の0であ
る。
【0054】フラッシュ(詰め) 詰めコードワードによって、次のコードワードは次の32
ビット境界を始めることになり、EORコードワードと同
様に、次の32ビットのワード境界まで埋め込むためのゼ
ロから31の0が続く。詰めコードワードはレコードの
中または外のどちらで使用されてもよく、レコード中間
のコードワードを32ビット境界で整列させるために中に
置かれ、手法XおよびリセットXのコードワードの直後に
続くように外側に置かれる。こうして、任意の後続のレ
コード(または部分レコード)、ファイル・マークおよび
エンドマーカーのコードワードが確実に32ビット境界で
始まる。
【0055】既に示したように、詰めコードワードはリ
セットXおよび手法Xのコードワードをサポートするため
にレコードの外で使用することができる。このような訳
で、これらのコードワードも次の表に示すように32ビッ
トの定数として扱うことができる。
【0056】
【表1】'Reset 1 → Flush' = 1.1111.1111.0000 + 1.
1111.1111.0110 + 0000002 = FFAFFC00h 'Reset 2 → Flush' = 1.1111.1111.0001 + 1.1111.111
1.0110 + 0000002 = FFB7FC00h 'Scheme 1 → Flush' = 1.1111.1111.0010 + 1.1111.11
11.0110 + 0000002 = FF8FFC00h 'Scheme 2 → Flush' = 1.1111.1111.0011 + 1.1111.11
11.0110 + 0000002 = FF97FC00h
【0057】これらの場合に、詰めコードワードは常に
32ビットのワードの14番目のビットで始まる。
【0058】これまで、例えばDDSフォーマットにおい
て、レコードかファイル・マークの後、またはデータの
終りに追加する能力を提供することが知られている。こ
のフォーマットの詰めコードワードは、レコードの内部
に追加ポイントおよび任意の位置を生成する一層の能力
を提供する。この機能が非常に役に立つ場合の例を以下
に示す。
【0059】エンドマーカー エンド・マーカー・コードワードは、データセットの中
でそれに続くデータは意味を持たず(それが任意の誤り
検知・訂正冗長性によってカバーされているかもしれな
いが)、それが遭遇されるデータセットの残りについて
の伸長を止めるために使用される。
【0060】エンド・マーカー・コードワードが32ビッ
ト境界で始まり次の32ビット境界まで(1で)埋めら
れているので、それは、32ビットの定数'1.1111.1111.1
111+111.1111.1111.1111.11112' = FFFFFFFFh.として扱
うことができる。
【0061】アクセスポイント アクセス・ポイントは、履歴バッファがリセットされる
位置およびデータセットのデータの伸長を始めることが
できる位置を示すのに使用される。この実施例によると
データセットあたり多くても1つのアクセスポイントが
あり、その位置がDSITに登録されている。コード化され
たデータにおける任意のレコードまたはファイル・マー
クをアクセスするために、復号化は、レコードまたはフ
ァイル・マークの前のストリームにおけるアクセスポイ
ントから始まらなければならず、ターゲットに到達する
まで継続する。
【0062】具体的には、アクセスポイントは、 デー
タ転送における最初のデータセットの始めにあるものと
して規定され、その後は後続のデータセットの始めにあ
るものとして、または前のデータセットからデータセッ
トにスパンする任意のレコードの終わりのすぐあとに続
くものとして規定される。データセットにスパンするレ
コードが長く次のデータセットにもスパンするならば、
有効なアクセスポイントはなく、DSITにファイルされた
アクセスポイントの内容がこのことを示すためにFFFFFF
FFhにセットされる。
【0063】アクセスポイントで履歴バッファがリセッ
トされ、コードワードの1つ(リセット1かリセット2)が
任意のレコード・データに先行すし、任意のデータが書
かれるかまたはこれに遭遇する前にコード化手法が確実
に規定される。これにより、コード化手法が規定される
前にファイル・マーク・コードワードがアクセス・ポイ
ントに書かれることが可能になる。どの処理手法がその
ポイントから必要であるかに依存して適切なリセット・
コードワードが使用される。
【0064】アクセスポイントでは次の1つがなければ
ならない:フラッシュが後に続くリセットX;レコード・
データが後に続くリセットX;エンドマーカー(End Mark
er);または、上記のいずれかが続くファイル・マーク。
【0065】アクセスポイントでの履歴バッファ「リセ
ット」は、アクセスポイントの前にデータ入力を参照す
る逆方向参照が出力されるのを防止する。こうして、圧
縮と伸長は常にアクセスポイントで始まらなければなら
ない。
【0066】データセット充填 データセットの一部分だけがコードワードで満たされて
おり、テープにそのデータセットを書くことが必要であ
るならば、一層の処理ステップが生じる前にデータセッ
トが「完成される」。そのような場合、レコードが完全
でないならばそれはEORコードワードで終えられる。最
後の有効なコードワードは、その位置がDSITと符合(こ
の場合はいずれにしても部分的データセットではない)
しない限り、エンド・マーカー・コードワードである。
オプションで、 エンド・マーカー・コードワードでデ
ータセットの残りを満たすことができる。
【0067】データセット情報テーブル DSITの内容は図7のテーブルの中に示されており、ここ
で説明する。テーブルにおいて、最も有意のバイトは最
も低い番号のバイト位置であり、最も低有意のバイトは
最も大きい番号のバイト位置である。
【0068】データセットの番号 この4バイトのフィールドは、ゼロで始まるテープの始
まり(BOT)からのデータセットの順序数である。
【0069】有効なデータ長 この4バイトのフィールドが、データセットの中に存在
するかもしれないエンド・マーカーまで(エンド・マー
カーを含まず)のプロセスされたコードワードに使用さ
れるデータセットの完全なバイトの数を示す。
【0070】アクセスポイント・オフセット この4バイトのフィールドはアクセスポイントのデータ
セット内でのバイトオフセットである。 カウントはバ
イト0で始まりDSITの始めからである。したがって、ア
クセスポイントがデータセットの最初のバイトであれ
ば、アクセスポイント・オフセットはゼロであろう。デ
ータセット中にアクセスポイントがないならば、このフ
ィールドはすべて1に設定される(すなわち、 FFFFFFFF
h)。
【0071】「現在のアクセスポイント」は、ここでこ
のデータセットに存在するアクセスポイントとして定義
され、データセットにアクセスポイントがないならば、
前の最も近いアクセスポイントとして定義される。
【0072】「次のアクセスポイント」は、ここで次か
後続のデータセットに生じる最初のアクセスポイントと
して定義される。
【0073】合計レコード この6バイトのフィールドは、BOTから現在のアクセスポ
イントまでのすべてのデータセットにおける完全にプロ
セスされたすべてのレコードのカウントを指定する。
【0074】合計のファイル・マーク この6バイトのフィールドは、BOTから現在のアクセスポ
イントまでのすべてのデータセットにおいてプロセスさ
れたすべてのファイル・マークのカウントを指定する。
【0075】レコードカウント この4バイトのフィールドは、現在のアクセスポイント
と次のアクセスポイントの間に存在するレコードの数を
指定する。したがって、レコードが前のデータセットで
始まり、いまのデータセットで終わるならば、そのレコ
ードは数えられない。現在のデータセットにアクセスポ
イントがないならば、このデータセットの中で始まった
り終わったりするレコードはなく、レコード・カウント
は前のデータセットのDSITでのレコード・カウントと同
じである。レコードがこのデータセットで始まるが後の
データセットまで完成しないならば、それはカウントさ
れる。したがって、データセットの中にアクセスポイン
トを持ったりゼロのレコードカウントを持つことはでき
ない。この実施例によるとまた、ファイル・マークはレ
コードとしてカウントされない。
【0076】ファイル・マーク・カウント この4バイトのフィールドは現在のアクセスポイントと
次のアクセスポイントの間に書かれたファイル・マーク
の数を示す。
【0077】部分的レコードの長さ この4バイトのフィールドは、レコードがデータセット
で終わらないならば、どれくらい多くのデータ・バイト
が現在のデータセットの最後のレコードにあるかを示
す。さもなければ、 値はゼロである。
【0078】バイト36から468からの残りのDSITフィー
ルドは、ベンダ特定の情報または テープ用法情報のた
めのものであり、この発明とは関係しない。残りのDSIT
フィールドは、したがってここでは詳細に記述しない。
【0079】テープドライブ・アーキテクチャ この発明にしたがってテープとの間でデータの格納およ
び回復を行うためのテープドライブのための模範的なア
ーキテクチャが図8に示されている。図8を参照する
と、テープドライブ800がSCSIバス806を介してホストコ
ンピュータ(図示されない)に接続される。ホストコンピ
ュータは、適切な‘アプリケーション'および‘ドライ
バー'のソフトウェアをロードしており、テープドライ
ブ800と適切な方法で通信することができる。
【0080】「書き込み」操作においてテープドライブ
800は、テープ876にバックアップすべきデータをホスト
コンピュータから受け取り、「読み取り」操作において
テープドライブ800は、テープ876から検索されたデータ
をホストコンピュータに送り返す。ここで記述される実
施例では、SCSIバス806がホストコンピュータにテープ
ドライブ800を接続する。しかしながら、たくさんの他
の一般的なインタフェース・タイプの任意のものを使用
してもよい。
【0081】ここで記述されるテープドライブ800は、
上で記述されたフォーマットによりデータを格納し検索
する。図8でテープドライブ800はテープ・メカニズム87
0を含み、その他のすべてのコンポーネントで「コント
ローラ」805が形成される。
【0082】コントローラ805は、それぞれが特定のデ
ータ処理操作を実行するように設けられた一連のASIC
(適用業務に特化された集積回路)を含む。ASICは、SCSI
バス806を介してホストコンピュータとテープドライブ8
00の間でのデータの転送を管理するためのホストインタ
フェース810、第1のデータバス815によってホストイン
タフェース810に接続されるフォーマッタ820、およびは
第2のデータバス835によってフォーマッタ820に接続さ
れた読取り書込み回路840である。また、含まれている
のは、データセット形のデータを格納するめの主バッフ
ァ830であり、メモリバス825によってフォーマッタ820
に接続されている。メインバッファ830は、少なくとも1
つのデータセットを格納するに十分なサイズである1ブ
ロックのDRAM(ダイナミックRAM)を含む。
【0083】フォーマッタ820の主な構成要素は図9のダ
イヤグラムに詳細に図示される。示されるように、フォ
ーマッタ820は、受け取られるホストコンピュータ・デ
ータ・バイトを手法Xコードワードとしてコード化する
ためのエンコーダ900を含み、このエンコーダは手法1ま
たは手法2のコードワードをホストコンピュータのデー
タに適用すべきであるかどうか決定するために履歴バッ
ファ903および比較器907を組み込んでいる。フォーマッ
タ820は、32ビットのワード境界の観点からコードワー
ドをコード化されたデータストリームに設えるためのパ
ッカー910を含み、このパッカーは、どのコードワード
が確保されたコードワードであるか、およびどの確保さ
れたコードワードがそれぞれの詰め(フラッシュ)条件
を持つかを解釈するために使われる参照用テーブル915
を組み込んでいる。
【0084】コントローラ805は、さらに例えばモトロ
ーラ68000シリーズ・マイクロプロセッサのようなマイ
クロプロセッサ850、およびメインメモリ860を含む。こ
のメインメモリは、マイクロプロセッサ850によってア
クセス可能なROM(固定メモリ)またはEEPROM(電気的に消
去可能なプログラマブルROM)であってもよい。マイクロ
プロセッサ850は、メインメモリ860に格納されたファー
ムウェア命令によって制御され、後述するようにドライ
ブ805のすべての構成要素を制御する。マイクロプロセ
ッサ850はシステムバス852を通してテープドライブの他
の構成要素に接続され、テープドライブ800のそれぞれ
の構成要素の総合的な操作を制御する。
【0085】ホストインタフェース810とフォーマッタ8
20との間でデータを転送するための第1データバス815
は、16ビットのデータチャネルと2ビットの制御チャネ
ルを備える。それぞれ835および845とラベルされる第2
および第3のデータバスは16ビットのデータチャネルを
含む。データチャネルの実際の幅は重要でないが、より
多くのビットを並列に運ぶことができる広いチャンネル
は、より速い処理パイプラインを提供することができ
る。
【0086】テープ・メカニズム870は、第3のデータバ
ス845によって読取り書込み回路840に接続された読み出
し/書き込みヘッド874、およびヘッド874の動きを制御
するためのヘッド・アクチュエータ833を備える。図3
(A)と3(B)はデータをテープに書き込むことができる2つ
の一般的な方法を図示する。
【0087】図3(A)において、データは、一端から他端
まで一連の斜めのトラック300としてテープの長さに沿
って書き込まれている。一般に、このタイプのデータの
格納方法はヘリカルスキャン方式として知られており、
典型的には4つのヘッド(読み取り書き込みにそれぞれ
2つ)を持つ回転ドラムを有するテープドライブ依存し
ている。そのようなテープドライブはよく知られてお
り、上述のDDSデータ記憶装置標準の基礎を形成する。
【0088】図3(B)はテープ330の長さに沿った一連の
並列チャンネル320として書き込まれたデータを図示す
る。この技法は線データ記録として一般的に知られてい
る。この図で、集合的にトラック340として知られる4つ
(あるいはそれ以上)の並列チャンネルのグループは、テ
ープの一端Aから他端Bまで静止形の多重チャネルヘッド
で書かれている。ヘッドがテープの端Bにデータを書き
込むとき、それはxだけ位置ずれし、テープは巻き戻さ
れるのでデータはテープの他端Aに向けて逆方向に書き
込むことができる。テープの全体の幅が使用されるま
で、データが受け取られる限り、このプロセスを続ける
ことができる。
【0089】上記の技法のどちらでもテープにこの実施
例によってコード化されたデータを書き込むのに使用す
ることができる。この実施例は特定の技法に限られるも
のではない。このデータフォーマットは、しかしなが
ら、線形テープ記録技法に向けられると特に有利である
と期待される。
【0090】テープドライブ操作 テープドライブ800において、ホストインタフェース810
は、基本的なSCSIプロトコルに従ってSCSIバス806を通
してホストコンピュータからデータを受け取る。データ
が制御データ(例えば、ロード、アンロードまたはスペ
ース)であるならば、ホストインタフェース810がマイ
クロプロセッサ850にデータをパスし、マイクロプロセ
ッサ制御がテープドライブ800を制御ししかるべく動作
させる。
【0091】書き込みデータ操作のためにデータがテー
プに格納されるべきレコード・データならばホストイン
タフェース810は、データをフォーマッタ820に送り、デ
ータはコード化され可能な場合はコード化されたデータ
ストリームに圧縮される。エンコーダ900は、レコード
・データのバイトをコード化し、圧縮する目的のために
履歴バッファの903および比較器907と対話する。パッカ
ー910は、それぞれの詰め条件に従って必要に応じてス
トリームのコードワードをビット詰めする。参照用(ル
ックアップ)テーブル915は確保されたコードワードに
関連する情報を含んでおり、このコードワードによって
パッカー910はデータストリームにおいてエンコーダに
よって提供された確保されたコードワードを認識するこ
とができ、それらを適切にパックすることができる。コ
ード化されパックされたデータはメインバッファ830に
転送される。
【0092】また、フォーマッタ820は、データを読取
り書込み回路840に送る前にエラー訂正/検出コーディン
グを適用してもよい。その詳細はこの明細書の範囲外で
あり、説明を省略する。適切な場合、フォーマッタ820
はバッファの主な830からのデータを検索し、それを読
取り書込み回路840に送る。
【0093】読取り書込み回路840はコード化されたデ
ータを受け取り、データを読み出し/書き込みヘッド(s)
874を駆動するのに適当な信号に変える。データを書き
込む目的のために、ヘッド・アクチュエータ872はテー
プ876に関しヘッド874を動かし、テープ・メカニズム87
0はヘッド874に関しテープ876を動かす。既に述べたよ
うに、この実施例に従う操作に適したメカニズムを含む
テープデッキは、一般にテープ記憶装置の技術で知られ
ているので、ここでの説明は省略する。
【0094】データを書き込むことに関し上述したコン
ポーネントは、読取り操作のために、テープからデータ
を読み取り、適切であるならば誤り検出/修正コーディ
ングを取り除き、テープ876から回復されたデータを解
凍復号し、データをホストコンピュータ810にパスする
ために、逆に動作する。
【0095】コントローラのいくつかの構成要素の動作
をここで説明する。
【0096】ホストインタフェース 書き込み操作のために、ホストコンピュータは、 レコ
ードかファイル・マークを書き込むために書き込み(ラ
イト)コマンドをホストインタフェース810に送る。テ
ープドライブが要求に応じるかどうかが、次に説明する
ようにフォーマッタ820がホストコンピュータからデー
タを受け取る準備ができているかどうかによって決定さ
れる。総合的な書き込みプロセスはマイクロプロセッサ
850によって制御される。
【0097】ホストコンピュータからの書き込み要求を
受け取り次第、データ・レコードを書くために、ホスト
インタフェース810はリクエスト信号をマイクロプロセ
ッサ850に送ることによって、レコードに値するデータ
をフォーマッタ820に送る許可を要求する。マイクロプ
ロセッサ850は続いてフォーマッタ820の状態部をテスト
する。フォーマッタ820の状態部が許容するならば、デ
ータ・レコード全体を受け取るスペースがメインバッフ
ァ830にあり、以前に受け取られたデータの処理が完了
しているので、マイクロプロセッサ850はホストインタ
フェース810にフォーマッタ820へのデータ転送を始める
信号を送る。一方、フォーマッタ820の状態が、メイン
バッファが充満していること、または既存のデータがま
だプロセス中であることを示すならば、要求は拒絶さ
れ、または「保留(オフにする)」にされる。準備がで
きている場合、ホストインタフェース810は、レコード
に値するデータを一度に16ビット第1のデータバスを介
してフォーマッタ820に転送する。ファイル・マークを
書くためのプロトコルは、ホストコンピュータ・インタ
フェース810がマイクロプロセッサ850へファイル・マー
ク書き込み命令が受け取られたことを知らせる信号を送
ることである。これに応答して、マイクロプロセッサ85
0は、ファイル・マーク・コードワードをコード化され
たデータストリームに、前のレコード(またはファイル
・マーク)の終わりの後に挿入するようフォーマッタ82
0に信号を送る。
【0098】このフォーマットは、テープドライブ800
との間で書き込むことができるデータの最も小さいチャ
ンクとしてレコードを扱うが、ホストインタフェースお
よびテープドライブ・ホストインタフェース810によっ
てサポートされる基本的なSCSIプロトコルは、実際に、
「バースト」として知られるSCSI定義されたチャンクに
おけるデータ転送を管理する。バーストは典型的にはレ
コードよりも小さい。このように、事実上それぞれのレ
コード内で、ホストコンピュータとテープドライブ800
がバーストによってデータを転送する。SCSIはこの機能
をサポートし、同時に多重デバイスをサービスすること
を可能にする。バースト長さは、典型的にはホストコン
ピュータとテープドライブ800(一般にはSCSIプロトコル
の下で作動する任意のデバイス)によってデータ転送の
前に交渉される値であり、一般的に、32キロバイトか64
キロバイトに設定される。
【0099】ホストコンピュータによってホストインタ
フェース810にパスされるデータのバーストのそれぞれ
は、典型的にはSCSIバスの送信端(例えば、 書き込み操
作中のホストコンピュータのホスト・バス・アダプタ
ー)によって加算され、SCSIバスの受信端(例えば、 書
き込み操作中のテープドライブ800のホストインタフェ
ース810)によってチェックされる、2ビットのパリティ
情報を含む。パリティ情報は受信端でバーストデータの
完全性の簡単なチェックとして使用され、ホストコンピ
ュータ・インタフェース810を超えてはパスされない。
【0100】ホストインタフェース810は、バーストカ
ウンタ811とレコード・カウンタ812の2つのバイト・カ
ウンタを組み込んでおり、レコードおよびバーストの転
送中にホストインタフェース810からフォーマッタ820ま
でのバイト・パスとしてカウンタにサービスを提供す
る。カウンタ(811と812)は、それぞれのバーストまたは
レコードについてバーストまたはレコード内のバイトの
数をプレロードされている。各バイトがホストインタフ
ェース810から去るに従ってカウンタ(811と812)はディ
クレメントする。この方法によって、カウントの1つが
ゼロであるときにホストインタフェース810がバースト
かレコードの終わりが生じたと判断し、フォーマッタ82
0のためにそれぞれのシグナルまたは「フラグ」を生成
する。
【0101】この実施例に従ってバーストとEORシグナ
ルの終わりはフォーマッタ820に、第1のデータバス815
の2ビットの制御チャネル上の2ビットの制御信号として
伝えられる。実際上、これらの信号は、 バーストまた
はレコードの最後のバイトと同時にパスするようにタイ
ミングを合わせられている。これに応答して、フォーマ
ッタ820は、信号を受信し、コード化されたデータスト
リームにおける前のコードワードの最後のバイトの後
に、詰めコードワード(バーストの終わりについて)かEO
Rコードワード(EORのための)を挿入するよう構成されて
いる。バーストの終わりとEORが一致する場合、EORが優
先順位を取り、フォーマッタ820は、EORコードワードを
加算するだけになっている。
【0102】このように、ホストインタフェース810
は、適切な信号によって、ファイル・マーク、EORおよ
び詰めコードワードのコード化されたデータストリーム
への加算を制御するためにフォーマッタ820によって必
要とされるすべての情報を提供する。
【0103】読取り操作のために、プロセスは、ホスト
インタフェース810がタイミングを制御することを除い
て、概して書き込みプロセスの逆である。すなわち、フ
ォーマッタ820は、復号されたデータ、レコードまたは
ファイル・マークを、ホストインタフェース810とホス
トコンピュータがデータを受け取る準備ができているか
どうかに基づいて、ホストインタフェース810に送るた
めの許可を一度に要求しなければならない。
【0104】コード化されたデータストリームに詰めコ
ードワードを加算する能力の1つの利点を次に説明す
る。
【0105】これまで、この発明者にとって知られてい
るテープドライブはホストインタフェースを構成する、
データの1つまたは複数の全体のバーストを受けること
ができるくらい大きいバッファを使った。バッファにお
けるデータの各バーストは前処理され、バーストのバイ
トがデータ圧縮のようなデータ処理に進められる前にパ
リティ情報を参照してその完全性を検査された。パリテ
ィ情報によって、バーストが‘悪い'ことが決定される
ならば、ホストインタフェース(または同等なホスト・
バス・アダプター)はバーストの再転送を要求する。
【0106】この前処理検査の主な理由は、データがデ
ータ処理ステージに入り、コード化され、特に圧縮され
ると、典型的にレコードの中にある「バースト境界」が
結果の圧縮データストリームで「失われる」ことにあ
る。この場合、例えば、1回のバーストにおける最後の
バイトおよび次のバーストの最初のバイトが単一の逆方
向参照によってコード化されたデータストリームに表さ
れるときに、バースト境界が「失われる」ことがある。
このように、再びバーストを送りコード化されたデータ
ストリーム内の正しい位置に置くことは、極度に難し
く、処理面からは扱いにくい。
【0107】一般に、前処理はデータ処理のボトルネッ
クとして認識され、バッファメモリとして高価で速いSR
AMを使うことによってこれまである程度低減されてきて
いる。
【0108】この発明者はボトルネック問題を異なる態
様で記述し、前処理のためのホストインタフェースのバ
ッファの必要性を大きく取り除いた。
【0109】述べられた問題を克服するためのメカニズ
ムは、コード化されたデータストリームのバーストの終
わりを識別するのに詰めコードワードを使用することに
よって可能になる。既に記述したように、詰めコードワ
ードは、ホストコンピュータ・データストリームでの任
意の点をコード化されたデータストリームにおけるワー
ド境界と整列させるために使用することができる。この
場合、詰めコードワードは、それぞれのバーストの終わ
りで次のバーストの始まりをコード化されたデータスト
リームにおける次の32ビットのワード境界と整列させる
のに使用される。このように、バースト境界は、圧縮デ
ータ・ストリームにおいてでも任意の詰めコードワード
のあとに続く32ビットの境界として明確に識別できる。
【0110】このように、再試行され、コード化された
バーストは、データが圧縮されているときであっても、
それぞれのデータセットの「悪い」コード化されたデー
タの上に書き込むことができる。
【0111】データセットの正しい位置へのバーストの
書き直しは、フォーマッタ820によって制御され、この
フォーマッタは、第1のポインタと2番目のポインタの2
つのポインタを有する。第1のポインタはメインバッフ
ァ830における次のデータ・バイトが書き込まれべき記
憶位置を示し、この記憶位置は、1バイトがメイン・バ
ッファに書き込まれるたびにインクリメントされる。第
2のポインタは、データの最新のバーストに先行する、
詰めコードワードによって生成された、32ビット・ワー
ドの境界の記憶位置を示す。それぞれの新しい詰めコー
ドワードがメインバッファ830に書き込まれるにつれ
て、第2のポインタの値が更新される。ホストインタフ
ェース810がバースト・リトライを要求するとき、マイ
クロプロセッサ850を通してフォーマッタ820は第1のポ
インタを最新のアクセスポイントの位置にリセットし、
このアクセスポイントから第2のポインタによって指し
示される記憶位置へと読み出す。その後、 悪いバース
トは再送されたバーストによって上書きされる。このバ
ーストが首尾よくバッファのメイン820に書き込まれる
まで、このプロセスは繰り返される。
【0112】また、バースト・リトライが要求されると
き、ホストインタフェース810のカウンタ(811と812)
は、再び通り抜ける同じバイトを収容するため、バース
トにおけるバイトの数だけインクリメントされる。
【0113】このバースト・リトライ手法の別の利点
は、履歴バッファ903がデフォルトで、再送処理された
バーストを書き込むため元々送られたバージョンのバー
ストを書くためのものと同じ状態にリセットされること
である。
【0114】このように、ホストインタフェース810に
よってバーストにおけるバイトは、受け取られるにつれ
て圧縮のためにフォーマッタ820にパスされることがで
きる。言い換えれば、バイトをフォーマッタ820に送る
前にバースト全体を受け取るのを待つ必要がないので、
ボトルネックが取り除かれる。さらに、前処理のために
データの1つまたは複数の全体バーストを保持する、ホ
ストインタフェース810におけるバッファの必要性もな
い。
【0115】パリティ検査は、バーストが‘悪い'かど
うか判断するために必要である。しかしながら、パリテ
ィチェックは、そのバイトがホストインタフェース810
を通り抜けるときホストインタフェース810によって計
算され、結果のパリティチェック数値は、ホストコンピ
ュータから受信されたバーストについてパリティ情報と
比較される。バーストの任意のデータが「悪い」場合、
ホストインタフェース810はホストコンピュータに、標
準のSCSIコマンドであるバースト・リトライを要求す
る。
【0116】この原理は、再ボジショニングのためにメ
インバッファ830における任意の位置に拡張することが
できる。例えば、 ホストコンピュータは任意の時にSCS
Iコマンド「セーブ・ポインタ」を発行することができ
る。このコマンドは、ホストインタフェース810によっ
て詰めコードワードをコード化されたデータストリーム
に挿入する要求として解釈されることができる。ホスト
コンピュータがデータの各バーストの前に「セーブ・ポ
インタ」コマンドを発行するならば、ホストインタフェ
ース810はこれを詰めコードワードを付加する要求とし
て解釈してもよく、これによりバースト・カウンタ811
が不要になる。
【0117】フォーマッタ フォーマッタ820の操作を図10のフローチャートを参照
して書き込み操作に関してより詳細に説明する。
【0118】フローチャートにおいて書き込みプロセス
は、テープドライブ800がホストコンピュータから書き
込みコマンドを受け取り、マイクロプロセッサ850が書
き込み操作のためにテープドライブを初期化した後にス
テップ1000で始まる。ステップ1010で書き込みコマンド
が「ファイル・マーク書き込み」であり、フォーマッタ
820の準備ができているならば、ホストインタフェース8
10がファイル・マーク信号をマイクロプロセッサ850に
送り、マイクロプロセッサ850がステップ1020でファイ
ル・マークコードワードを出力するためフォーマッタ82
0に信号を送る。
【0119】書き込みコマンドがレコードを書くための
ものであり、フォーマッタ820の準備ができているなら
ば、フォーマッタ820がホストインタフェース810からレ
コード・データを受け取り、エンコーダ900は、ステッ
プ1030においてバイトごとに手法Xコード化を適用す
る。Xは、以下に説明するある基準に依存して1または
2であることができる。
【0120】どの手法が使われるかに関係なく、すべて
のバイトデータが履歴バッファ903を通る。このよう
に、手法1の場合、エンコーダ900は、可能であれば履歴
バッファ903に存在するコードワードを参照してコード
ワード・データを出力する。手法2の場合、エンコーダ9
00にはパススルーモードがあり、エンコーダ900によっ
て受け取られるバイト値は、単にエンコーダを通りエン
コーダの外にパスされる。データがなんの処理も受ける
ことなくパススルーする場合であっても、各バイトはま
だコード化されたデータストリームにおけるコードワー
ドと呼ばれる。
【0121】既に述べたように、バースト処理は、フォ
ーマッタ820がホストインタフェース810から詰めポイン
ト信号を受信するとき、コード化されたデータストリー
ムのバーストの最後のバイトの後に詰めコードワードを
挿入することによって達成される。また、ホストインタ
フェース810からのEOR信号に対応して、コード化された
データストリームのレコードの最後のコードワードの後
にEORコードワードが付加される。
【0122】それぞれのレコードかファイル・マークに
ついてコードワードが書き込まれた後、次のステップ10
40は、アクセスポイントが必要かどうかを判断するため
のものである。新しいデータセットの始まりの後できる
だけ早くアクセスポイントが必要とされる。これは実際
上、データセットの始め、またはデータセットにおける
第1の部分レコードの終わり(レコードが前のデータセッ
トで始まったならば)の後であるだろう。アクセスポイ
ントが必要とされるとき、ステップ1050でフォーマッタ
820は、それぞれのEORコードワードを出力した後、パッ
カー910における残りのデータがメインバッファ830にパ
スするまで、ホストインタフェース810からのさらなる
データを「ホールドオフ」する。そして、メインバッフ
ァ830に保持された現在のデータセットについて、フォ
ーマッタ820はアクセスポイントの位置(現在のデータセ
ットの始まりからのバイト・オフセット)をDSITに登録
する。その後、フォーマッタ820は適切なリセットXコー
ドワードを出力し、ホストコンピュータ・インタフェー
ス810からのデータ・バイトを受け取り続ける。
【0123】最後にステップ1060において、プロセスは
ステップ1010に返りレコードまたはファイル・マークを
さらに処理するか、またはプロセスはステップ1070で終
了する。
【0124】データセットのためのDSIT値は、ホストイ
ンタフェース810から受け取られる信号、特にEORおよび
ファイル・マーク信号、に基づいてフォーマッタ820に
よって生成される。
【0125】メインバッファ830から読取り書込み回路
までのデータをパスすることは、データセットごとにマ
イクロプロセッサ850によって制御される。言い換えれ
ば、マイクロプロセッサは、少なくとも1つのデータセ
ットが完全になるまでメインバッファ830からテープへ
のデータ転送に着手しない。逆に、テープからデータを
読取るとき、1つのデータセット全体のために十分な空
間がメインバッファ830にあるようになるまで、マイク
ロプロセッサ850はテープドライブ800がデータを読み取
るのを許可しない。
【0126】任意の時間にどのコード化手法が動作中で
あるかに関し、フォーマッタ820は、手法1を使ってコ
ード化されたデータの圧縮比をモニタするために比較器
907の形でモニタ機能を含む。比較器907は、2つのカウ
ンタ、すなわち1バイトがエンコーダにパスされるたび
にインクリメントする第1カウンタ904、およびエンコ
ーダ900から出力される(手法1において)かまたは出
力されるであろう(すなわち、手法2における逆方向参
照)圧縮されたビットの数に沿ってインクリメントする
第2のカウンタ905を含む。また、比較器は分割回路906
を含み、この分割回路は、所与の時間における第1のカ
ウンタ906の値にわたって第2のカウンタ905の値の比率
を計算する。明らかに、分割の前に、同等の数のビット
入力を与えて正しい比率を提供するために、バイト入力
の数に8を掛けることが必要である。この比率は所与の
期間にわたる圧縮率の平均(真または潜在的な)を表して
いる。この所与の期間はエンコーダ900へのバイト入力
の数によって測定することができる。例えば、比率は、
それぞれのワードに値するデータ(すなわち32ビッ
ト)、それぞれのバーストに値する(例えば32kバイ
ト)のデータ、またはその他任意の期間(例えば1つの
バイトの後ごと)にわたって計算されてもよい。比率が
計算されるたびに、比較器はどの手法が動作中であるか
を示すフラグを生成し、カウンタは、次の比率計算を始
めるためにリセットされる。明らかに、圧縮比の計算法
には他の多くの方法がある。
【0127】好ましい実施例において、比率が第1のし
きい値の下より小さいならば、比較器907は手法1から手
法2へのスワップをフラグする。手法2にあるとき、すべ
ての入力データが履歴バッファ903をパススルーするの
で、事実上、手法1コード化はまだイネーブルされてお
り、潜在的な圧縮比測定が続けられる。比率が第2のし
きい値を超えて上昇するならば、手法1へのスワップが
比較器907によって合図される。期間としきい値は構成
可能であり、手法1から手法2へのスワップのための第1
のしきい値は、手法2から手法1へのスワップのための第
2のしきい値と同じであっても異なってもよい。最も良
い総合的な圧縮性能を提供するための期間としきい値の
値は、発見的に決定することができる。代わりに、値は
受け取り中のデータの性質に基づいて適応的に決定して
もよい。もちろん、適応型のオプションは余分な機能性
がテープドライブ800に組み込まれることを必要とする
だろうが、これについての説明は省略する。
【0128】このように、手法1が動作中であるとき
(最初のデータセットの最初のレコードに対するデフォ
ルトであり、リセット1コードワードによって判断され
る)、圧縮比が例えば1:1より低下するならば、フォ
ーマッタ820が手法2コードワードをコード化されたデー
タストリームに挿入する。その後、フォーマッタ820に
よって受け取られるレコード・バイトは、コード化され
ないで、エンコーダ900をパススルーする。
【0129】圧縮比のモニタは手法2の動作中続く。圧
縮比が例えば1.5:1より上に上昇するならば(すなわ
ち、手法1と2のスイッチングレベルの間には、ヒステリ
シスの要素がある)、エンコーダ900は手法1コードワー
ドを挿入し、後続のレコード・データ・バイトは、手法
1コード化を使用して出力される。
【0130】コード化中に、手法Xコードワードの加算
は、履歴バッファ903に影響せず、履歴バッファはリセ
ットされない。このことは、手法2から手法1へのスイッ
チの後に完全な履歴バッファの内容が潜在的逆方向参照
として利用可能であることを意味する。
【0131】読取り動作のためにフォーマッタ820の動
作は、書き込み動作の正反対であり、既知の態様で圧縮
の代わりにデータ伸長がエンコーダ900(デコーダとし
て機能する)によって、コード化されたデータに適用さ
れる。実施例によっては、エンコーダ900とは別のデコ
ーダを備えるのが好ましいことがあり、これはデザイン
選択の問題である。
【0132】この実施例において、圧縮比のモニタは必
要とされないので、伸長は圧縮よりも直接的である。伸
長は単に、フォーマッタ820が受け取る手法Xおよびリセ
ットXのコードワードのあとに続いている。確保された
コードワードは別として、データ・コードワードは、既
知のそれぞれの伸長アルゴリズムを適用することによっ
て単に復号される。
【0133】復号化中に、確保されたコードワードが検
出され、データストリームから取り除かれ、必要な場合
はエンコーダ900(デコーダとして動作している)によ
って処理される。エンコーダ900によって検出されたフ
ァイル・マーク・コードワードは、マイクロプロセッサ
850を通してフォーマッタ820が、ファイル・マークがホ
ストコンピュータに送り返されるべきであることを示す
信号をホストインタフェース810に送るようにさせる。
その他の確保されたコードワードは、どれもホストコン
ピュータに関する限り意味をもたないので、それらはデ
ータストリームから単に取り除かれる。しかしながら、
手法XおよびリセットXのコードワードは、それぞれフォ
ーマッタ820にコード化されたデータを復号させ、履歴
バッファをリセットさせる。
【0134】パッカー910の動作を図11のフローチャー
トを参照してより詳細に説明する。
【0135】パッカー910はエンコーダ900から得られる
コードワード・データに作用する。ステップ1100におい
てデータは一度に1つのコードワードでパッカー910に
渡される。それぞれのコードワードが受け取られるにつ
れて、パッカー920は参照用テーブル915を参照して、コ
ードワードがワード境界条件に関連するフラッシュ(詰
め)を持つ確保されたコードワードであるかどうかを判
断する。参照用テーブル915は、確保された各コードワ
ードについてエントリを含んでおり、このエントリは、
詰め条件があるかどうかおよびコードワードの埋め込み
に1を使うのか0を使うのかを示す。また、 参照用テ
ーブル915におけるエントリは、どのコードワードが確
保されたコードワードであるかおよび確保されたコード
ワードはどうプロセスされるべきであるかを判断するた
めに、復号化中に使用される。
【0136】ステップ1105において、受け取られたコー
ドワード・データはパッカー910の「バーレル・シフ
タ」関数912にわたされる。これは、動作的にはFIFOレ
ジスタと似ており、データビットのストリームをその概
念的な「トップエンド(最先端)」に受ける作用を行
い、そのビット(複数)をその概念的な「ボトムエンド
(下端)」にパススルーし、その概念的な「側」から3
2ビット幅のデータワードを並列に出力する。この実施
例によると、データバスの幅は16ビットなので、ビッ
トは必然的に「側」から16ビットの2ブロックとして
出力される。
【0137】バーレル・シフタ関数912は以下のように
動作する。ステップ1110でコードワード・データの付加
が既にバーレル・シフタ(もし必要であればその中に任
意のビットが既に入っている)にあるビットの数を32
ビット以上に増加させるならば、ステップ1115でシフタ
は最も末尾の32ビットをメインバッファ830の現在の
データセットにシフトさせる。次いでステップ1120で
は、バーレル・シフタの残りのビット(残りのビットが
あるならば) は、バーレル・シフタの末尾にシフト(32
ビットだけ)される。プロセスは、次いでステップ1110
に返り、シフタにおけるビットの数がさらにチェックさ
れる。
【0138】シフタにあるビットが32ビットよりも少な
いならば、ステップ1125でパッカがシフタに残りのビッ
トがあるかどうかチェックする。残りのビットがないな
らば、パッカープロセスはステップ1145で終わる。残り
のビットがあるならば、ステップ1130において、パッカ
910が参照用テーブル915を参照して詰め条件を持つ確保
されたコードワードの存在を検出したかどうかに基づい
て、ワード境界へのフラッシュ(詰め)条件がアクセス
される。詰め条件があるならば、ステップ1135におい
て、バーレル・シフタは、詰め条件に依存して最後に受
け取られたコードワードの後から32ビットしきい値ま
でゼロまたは1によって満たされまたは「埋められ
る」。次に、ステップ1140でシフタはその32ビットをメ
インバッファ830のデータセットにシフトアウトする。
最後に、ステップ1145において、プロセスは、受け取ら
れたコードワード・データについて終了する。
【0139】この方法でパッカー826は、デフォルトと
して32ビットのワード単位で、コード化データの転送
を制御し、同時に詰めコードワードについて必要とされ
る、各データセットの32ビット境界へのビット埋め込
みを制御する。
【0140】読取り動作のために、パッカーはテープか
ら読まれたデータを「解凍する」作用も行う。この動作
は、パッカー920が32ビットのワードを受け取り、コー
ドワード・バイトをエンコーダ900(いまデコーダとし
て動作している)に返す点で、「パッキング」の逆であ
る。そうする際に、パッカー920(「アンパッカー」とし
て機能している)は、参照用テーブル915を参照し、以前
に「パック」された確保されたコードワードを検出し、
パッキング・プロセスで付加された埋め込みを取り除
く。さらに、いくつかの実施例では、パッカー910は、
詰めコードワードおよびEORコードワードをコード化さ
れたデータストリームから取り除くようになっていても
よい。フォーマッタ820が復号化プロセス中にこれらの
コードワードの受けとりを必要としないからである。
【0141】以上にこの発明の1つの特定の実施例を説
明した。この発明は、実施例に限られるものではなく、
他の多くのデータ記憶装置において使用することができ
る。いくつかの例は、ハードディスク・システム、並び
にDVD-RAM(ディジタルビデオ・ディスクRAM)を含む光書
き込みまたは読み取り可能なディスクシステムである。
【0142】この発明は、例として次の実施態様を含
む。
【0143】(1) データソースからデータソースによっ
て決定されるデータ構造を有するデータを受け取るステ
ップと、データ構造とは独立に判断される、データにお
ける追加可能ポイントを判断するステップと、データソ
ースからのデータをコード化データストリームにコード
化し、コード化データストリームへ追加可能ポイントを
表すデータを挿入するステップと、記憶装置または媒体
にデータストリームを書き込むステップと、を含む デ
ータソースから受け取られるデータを調整する方法。
【0144】(2) 上記(1)による方法であって、ホスト
・データおよびコード化データストリームにおける追加
可能ポイントを表すデータが一連の固定長データ部に整
えられるデータ調整方法。
【0145】(3) 上記(2)による方法であって、残りの
ホストデータまたは決定された追加可能ポイントの後に
受け取られる後続のホストデータがコード化データスト
リームの追加可能ポイントに追加され、この追加可能ポ
イントが上記一連の固定長のデータ部における固定長の
最初の利用可能なデータ部の始めおよび実際の追加可能
ポイントを表すデータの後にあるデータ調整方法。
【0146】(4) 上記(3)による方法であって、追加可
能ポイントを表すデータが固定長の識別子部分および可
変長パディング部分を含み、この可変長パディング部分
は、固定長の識別子部分と追加可能ポイントとの間にス
ペースがあればこれを満たすに十分なビットを有するデ
ータ調整方法。
【0147】(5) 上記(1)から(4)の任意の1つによる方
法であって、データソースからのデータがバーストかパ
ケットで 受け取られ、各バーストまたはパケットの始
めか終わりが追加ポイントと判断されるデータ調整方
法。
【0148】(6) 上記(1)から(5)の任意の1つによる方
法であって、データソースからのデータをデータ・コー
ドワードの流れにコード化するステップをさらに含み、
実際の追加可能ポイントを表すデータが制御コードワー
ドを含むデータ調整方法。
【0149】(7) 上記(6)による方法であって、書き込
まれたデータを固定長データセットに調整するステップ
をさらに含み、データセットが、データ・コードワード
および制御コードワードのためのデータ領域およびデー
タセットに関連する情報を含む情報を格納するためのデ
ータセット情報領域を含むデータ調整方法。
【0150】(8) データソースからデータ転送で受け取
られるデータのバーストを処理する方法であって、 a)データソースからデータの新しいバーストを受け取る
ステップと、 b)データのバーストの完全性について判断するステップ
と、 c)データのバーストをコード化データストリームにコー
ド化するステップと、 d)記憶装置または媒体において定義された追加可能ポイ
ントから記憶装置または媒体に該コード化データストリ
ームを書き込むステップと、 e)新しい追加可能ポイントを表すデータをコード化デー
タストリームに追加するステップと、 f)バーストが悪いと判断される場合、 i)悪いバーストの再転送を要求し、 ii)データソースからデータの再送されたバーストを受
け取り、 iii)ステップb)からf)を繰り返し、 バーストが良いと判断される場合、データ転送が完全に
なるまでステップa)からf)を反復するデータバーストの
処理方法。
【0151】(9) データソースから受け取られるデータ
を調整するための装置であって、データソースからデー
タソースによって決定されるデータ構造を有するデータ
を受け取り、データ構造とは独立に判断されるデータに
おける追加可能ポイントを判断するインターフェイス手
段と、データソースからのデータをコード化データスト
リームへコード化し、追加可能ポイントを表すデータを
コード化データストリームに挿入し、記憶装置または媒
体にこのデータストリームを書き込むコード化手段と、
を備える調整装置。
【0152】(10) 上記(9)による装置であって、エンコ
ーダ手段はコード化データストリームを一連のの固定長
のデータ部に調整するよう構成されている調整装置。
【0153】(11) 上記(10)による装置であって、前記
エンコーダ方法は、残りのホストデータまたは決定さあ
れた追加可能ポイントの後に受け取られる後続のホスト
データをコード化データストリームの追加可能ポイント
に追加するよう構成され、この追加ポイントは前記一連
の固定長のデータ部における固定長の最初の利用可能な
データ部の始めおよび実際の追加可能ポイントを表すデ
ータの後にある調整装置。
【0154】(12) 上記(9)〜(11)の任意の1つによる装
置であって、インタフェース手段はデータソースからデ
ータをバーストまたはパケットで受け取り、それぞれの
バーストまたはパケットの終わりが追加可能ポイントで
あると判断するようになっている前記調整装置。
【0155】(13) 上記(9)〜(12)の任意の1つによる装
置であって、エンコーダ手段はデータソースからのデー
タをデータ・コードワードの流れコード化し、実際の追
加可能ポイントを表すデータを制御コードワードにコー
ド化する前記調整装置。
【0156】(14)データソースからデータ転送で受け取
られるデータのバーストを処理するための装置であっ
て、データソースからデータの新しいバーストを受け取
り、るためのインターフェイス手段と、データのバース
トの完全性について判断し、それが悪いと判断される場
合データのバーストの再転送を要求するインターフェイ
ス手段と、データのバーストをコード化データストリー
ムにコード化し、このコード化データストリームを記憶
装置または媒体における定義された追加可能ポイントか
ら書き込み、新しい追加可能ポイントを表すデータをコ
ード化データストリームに追加するコード化手段と、を
備え、前記コード化手段は、任意の再送処理されたバー
スト・データを定義された追加可能ポイントから書き、
任意の後続の、 新しいバースト・データを新しい追加
可能ポイントから書くようになっている処理装置。 (15) 上記(1)〜(8)の任意の1つの方法に従って動作する
よう構成されたデータ記憶装置。 (16) 上記(1)〜(7)の任意の1つに従うデータをデコード
するための装置。。 (17) 上記(1)〜(7)の任意の1つに従ってデータを調整す
るよう構成されたASIC。 (18) 上記(1)〜(7)の任意の1つに従ってデータをデコー
ドするよう調整されたASIC。 (19) 埋め込まれたフラッシュ・コードワードを含むユ
ーザデータを表すコードワードの流れを含むコード化デ
ータ。 (20) 磁気テープデータ記憶装置を有する上記(9)〜(16)
の任意の1つによる装置。 (21) ホスト・データをフォーマットする方法であっ
て、ホスト・データを受け取り、該ホスト・データをコ
ードワードとともにコード化し、コード化データストリ
ームを形成するステップと、コード化中の特定のポイン
トで追加可能ポイントを表すために詰めコードワードを
コード化データストリームへ挿入するステップと、メモ
リにコード化データストリームを書き込むステップと、
を含むフォーマット方法。
【0157】
【発明の効果】この発明によると、インデックスの情報
に頼ることなくコード化データストリームにおいて追加
可能ポイントを見いだすことができる。
【図面の簡単な説明】
【図1】(A)はホストコンピュータからのホストコン
ピュータ・データの一般的な形を示す図、(B)は、ホ
ストコンピュータ・データをホストコンピュータ・デー
タをフォーマットする従来技術に従って分類する図。
【図2】図1(B)のデータグループのインデックスに
格納されるタイプのデータをより詳細な態様で示す図。
【図3】(A)および(B)は、データをテープに書く
ことができる2つの共通のフォーマットを示す図。
【図4】この発明の実施例に従ってコード化されたデー
タの一般的な形を示す図。
【図5】この発明の実施例に従って規定されるデータセ
ットの一般的な形を示す図。
【図6】この発明の実施例に従って規定される確保され
たコードワードのテーブルを示す図。
【図7】この発明の実施例に従って規定されるデータセ
ット情報テーブルのエントリのテーブルを示す図。
【図8】この発明の実施例に従ってデータをフォーマッ
トするためのテープドライブのアーキテクチャを示すブ
ロック図。
【図9】この発明の実施例に従ってデータをフォーマッ
トするフォーマッタの主要部のブロック図。
【図10】この発明の実施例に従ってデータをコード化
する際のステップを図示するフローチャート。
【図11】この発明の実施例に従ってコード化されたデ
ータをパックする際のステップを図示するフローチャー
ト。
【図12】特定の実施例で使用されるデータ圧縮手法に
おけるマッチフィールド・データに使用されるコード化
手法のテーブルを示す図。
【符号の説明】
800 テープドライブ 810 ホストインターフェイス 820 データフォーマッタ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】データソースからデータソースによって決
    定されるデータ構造を有するデータを受け取るステップ
    と、 データ構造とは独立に判断される、データにおける追加
    可能ポイントを判断するステップと、 データソースからのデータをコード化データストリーム
    にコード化し、コード化データストリームへ追加可能ポ
    イントを表すデータを挿入するステップと、 記憶装置または媒体にデータストリームを書き込むステ
    ップと、を含む データソースから受け取られるデータ
    を調整する方法。
JP30816098A 1997-10-31 1998-10-29 データソースから受け取ったデータを並べる方法 Expired - Lifetime JP4124887B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP97308779.4 1997-10-31
EP97308779A EP0913761A1 (en) 1997-10-31 1997-10-31 Data encoding scheme

Publications (2)

Publication Number Publication Date
JPH11242856A true JPH11242856A (ja) 1999-09-07
JP4124887B2 JP4124887B2 (ja) 2008-07-23

Family

ID=8229589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30816098A Expired - Lifetime JP4124887B2 (ja) 1997-10-31 1998-10-29 データソースから受け取ったデータを並べる方法

Country Status (3)

Country Link
US (1) US6268973B1 (ja)
EP (1) EP0913761A1 (ja)
JP (1) JP4124887B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012133731A (ja) * 2010-12-24 2012-07-12 Fujitsu Ltd データ処理装置及びデータ記録方法
US10818314B1 (en) 2019-05-07 2020-10-27 International Business Machines Corporation Storing multiple instances of a housekeeping data set on a magnetic recording tape

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532121B1 (en) 1999-10-25 2003-03-11 Hewlett-Packard Company Compression algorithm with embedded meta-data for partial record operation augmented with expansion joints
US6865656B2 (en) * 2001-09-10 2005-03-08 Qualcomm Incorporated Method and system for efficient transfer of data between custom application specific integrated circuit hardware and an embedded microprocessor
US20090269023A1 (en) * 2008-04-25 2009-10-29 Mediatek Inc. Methods and apparatuses for dv (digital video) dubbing without frame loss
DE112011103868B4 (de) * 2010-11-23 2024-01-25 Intel Corporation (N.D.Ges.D. Staates Delaware) Füllung nach Kanalkodierung (Wiederholung) und Verschachteln
SE540178C2 (en) * 2016-01-29 2018-04-24 Zeropoint Tech Ab Methods, devices and systems for compressing and decompressing data

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2751201B2 (ja) * 1988-04-19 1998-05-18 ソニー株式会社 データ伝送装置及び受信装置
US4891784A (en) * 1988-01-08 1990-01-02 Hewlett-Packard Company High capacity tape drive transparently writes and reads large packets of blocked data between interblock gaps
JP2585710B2 (ja) * 1988-05-13 1997-02-26 株式会社日立製作所 Pcm信号記録再生装置及びpcm信号記録再生方法
EP0464191B1 (en) * 1990-01-19 1996-03-27 Hewlett-Packard Limited Compressed data access
EP0459041B1 (en) * 1990-05-29 1997-07-09 Hewlett-Packard Limited Tape storage
US5485321A (en) * 1993-12-29 1996-01-16 Storage Technology Corporation Format and method for recording optimization
US5754754A (en) * 1995-07-26 1998-05-19 International Business Machines Corporation Transmission order based selective repeat data transmission error recovery system and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012133731A (ja) * 2010-12-24 2012-07-12 Fujitsu Ltd データ処理装置及びデータ記録方法
US10818314B1 (en) 2019-05-07 2020-10-27 International Business Machines Corporation Storing multiple instances of a housekeeping data set on a magnetic recording tape

Also Published As

Publication number Publication date
EP0913761A1 (en) 1999-05-06
JP4124887B2 (ja) 2008-07-23
US6268973B1 (en) 2001-07-31

Similar Documents

Publication Publication Date Title
JP4124886B2 (ja) ホストデータをフォーマットする方法
US5097261A (en) Data compression for recording on a record medium
US5298895A (en) Data compression method and apparatus utilizing an adaptive dictionary
US5167034A (en) Data integrity for compaction devices
US7133228B2 (en) Using data compression to achieve lower linear bit densities on a storage medium
KR920002581B1 (ko) 블럭간 갭 사이의 블럭 데이타의 커다란 패킷을 명확하게 기입 및 판독하는 고용량 테이프 드라이브
US5280600A (en) Storage of compressed data with algorithm
JP2915568B2 (ja) テープドライブシステムのための適応データ圧縮装置
EP0760977A1 (en) Packing variable length record in fixed blocks
EP0264602B1 (en) Fixed time gap format variable field length data transfer
US5535327A (en) Method and apparatus for communicating formatted data from a mass storage device to a host computer
EP0913825B1 (en) Data encoding scheme
JP4124887B2 (ja) データソースから受け取ったデータを並べる方法
EP0913823B1 (en) Data encoding method and apparatus
US6295177B1 (en) Method of and apparatus for arranging data received in a data transfer from a data source
JPH04359315A (ja) データ圧縮制御装置及びデータ復元制御装置
US4398225A (en) Combined serializer encoder and decoder for data storage system
EP0915413A1 (en) Data encoding scheme with switchable compression
US6268975B1 (en) Tape drive utilizing encoded file markers to locate target positions
EP0913824B1 (en) Generating appendable points in encoded data
EP0464181A1 (en) Data storage
JPH04242424A (ja) データ圧縮制御装置およびデータ復元制御装置
US7127153B2 (en) Host system, driving apparatus, information recording and reading method for the host system, and information recording and reading method for the driving apparatus
JPH10271440A (ja) 記録再生装置
WO1991011000A1 (en) Data dictionary sharing

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051017

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070911

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20071204

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20071207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080422

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080507

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term