JPH02500693A - データ圧縮用装置 - Google Patents

データ圧縮用装置

Info

Publication number
JPH02500693A
JPH02500693A JP50539387A JP50539387A JPH02500693A JP H02500693 A JPH02500693 A JP H02500693A JP 50539387 A JP50539387 A JP 50539387A JP 50539387 A JP50539387 A JP 50539387A JP H02500693 A JPH02500693 A JP H02500693A
Authority
JP
Japan
Prior art keywords
link
value
current
address
codeword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP50539387A
Other languages
English (en)
Inventor
ジエプソン・クレース・ハカン
ジエプソン・テイナ・ヘレン
ジエプソン・マーチン・ビルヘルム・イバン
Original Assignee
インベントロニツク・データ・システムズ・エービー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US06/905,237 external-priority patent/US4782325A/en
Application filed by インベントロニツク・データ・システムズ・エービー filed Critical インベントロニツク・データ・システムズ・エービー
Publication of JPH02500693A publication Critical patent/JPH02500693A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】
データ圧縮用装置 1、ここで使用されている用語の定義 (a)一般、 (b)ユーザー環境、 (C)システム環境(a)特性・・・本 質的な特徴。エレメント・・・それ以上別々に小さくできないもの。エンティテ ィ(独立体)・・・その特性により特有の性質を所有する別々のもの。組・・・ 共に属する多数の異なる“もの′。メンバー・・・組に属する異なるもの。整列 された組・・・異なる連続した順序で配列された全てのそのメンバーを有する組 。アイテム・・・整列された組のメンバー。オージナル(順序)・・・アイテム の順番。情報のビット・・・2つの等しい可能性の別々のものの間の選択結果と 等価の情報の単位。 (b)シンボル・・・何かの可視的な象徴表示。コードシンボル10.シンボル コードのメンバー。シンボルコード・・・データのグラフ記録のために構成され たグラフおよび/または制御コードシンボルの1組。文字・・・逐語的および辞 書的ワードのようなグラフワードを形成するために結合する複数のグラフコード の1つ。数字・・・数を形成するために結合する複数のグラフコードシンボルの 1つ。2進数・・・2進数を形成するために結合される2つの数Oおよび1のい ずれか。10進数・・・lO進数を形成するために結合する10個の数0,1. 2.3.4.5,6.7.Lおよび9のいずれか。16進数・・・16進数を形 成するために結合する16個の数0.1.2,3,4.5.Ei、7.8.9. A、B、C,D、E、およびFのいずれか−明瞭化のために基数表示“X゛が例 えばFX、FFXのように数字および数に付加されてもよい。アルファデシマル 数字01.アルファデシマルを形成するために結合する32個の数字0.1.2 .3,4.5.6,7,8,9.A、B、C,D、E、F、G、H,I、J、に 、LJl、N、P、Q、R。 S、T、υ、■およびνのいずれか一明瞭化のために基数表示“α。 が例えばWα、WWαのように数字および数に付加されてもよい。符号・・・例 えば句読点等のグラフデータ記録のために文字および/または数字と共に使用さ れる任意の他のグラフコードシンボル。制御コードシンボル・・・例えばプリン タにライン供給、新しい頁等を実行することを命令する等の制御関数を表わすコ ードシンボル。SPまたは5PACE・・・記録されたコードシンボルの間の分 離を生じる制御関数を表わす制御コードシンボル。NULまたはNULL・・・ ゼロを表わす制御コードシンボル。記録・・・シンボルコードに基いたデータの グラフ記録。セグメント・・・例えば連続テキスト等の逐語的ワードまたは文節 等のテキストセグメント、データプログラムセグメントまたはデータ合計セグメ ントの記録を構成するコードシンボルのシーケンス。ファイル・・・互いに関連 し、異なるシーケンスで整列された一連のセグメント。テキストファイル・・・ 連続テキストを形成するセグメントを含むファイル。プログラムファイル・・・ データプログラムを形成するセグメントを含むファイル。データファイル・・・ データ合計を形成するセグメントを含むファイル。頻発セグメント・・・ファイ ルの特定のクラス内で頻繁に生じるセグメント。稀発セグメント・・・ファイル の特定のクラス内で稀にしか生じないセグメント。 基準セグメント・・・基準として選択された頻発セグメント。 R5S・・・1組の基準セグメント内の基準セグメントシーケンス番号。エンテ ィティ記録・・・エンティティに関する記録。エンティティ記録セット・・・1 組のエンティティ記録。EK(エンティティキー)・・・エンティティ記録セッ ト内の具体的エンティティ記録の識別子であり、さらにデータを含むようなエン ティティ記録またはそれより大きいエンティティ記録の一部分と同一であるエン ティティキー。EKS・・・エンティティキーのシーケンス番号すなわちEKセ ット内のEKオリジナル。EK特性・・・1組のエンティティキーの1個以上の メンバーを区別する特性。EGG特性セット・・・例えば1組の逐語ワードサフ ィックス等のEK特性の選択された組。Ilo・・・データシステムへの入力お よび/またはそれからの出力。I10コード・・・I10コードシンホルとI1 0コードワード間の1組の関係(以下参照)であり、ユーザー/システムインタ ーフェイスを容易にする。 (C)システム・・・ここに記載された1つ以上の手段を含む相互作用装置。I 10コードワード・・・特定のI10コードによるI10コードシンボルの異な るシステム表示。l/“コードワード値・・・例えば2進、10進または16進 法を使用するシンボルおよび名称によって示される異なる数値量(例えば、情報 交換用の拡張された米国標準コードをI10コードとして使用し、10進の数字 名“4′を表わすI10コードシンボル“4″は2進値00110100を有す るI10コードワードに対応し、“52”と呼ばれる10進値“52°と等価で あり、“34HEX″と呼ばれる16進値−34x ”と等し一一。蓄積する( 動詞)・・・蓄積を行なう−“前に蓄積された値′という用語はまだ蓄積され続 けている値であることを意味する“蓄積され続ける°という関係では使用されな い。ここで使、用されているような用語“蓄積する′および“蓄積を行う”は例 えば大量生産過程で読出し専用メモリ装置内にデータを蓄積する場合を排除しな い。蓄積すること・・・蓄積する動作。蓄積・・・継続的に蓄積されている状態 および蓄積し続けるための場所。エンティティデータセット・・・エンティティ 記録セットのシステム表示。 EKシステム・・・エンティティキーシステム、すなわちEK上セツト蓄積し続 けるためのシステムであり、ユーザーによる関連したエンティティ記録の検索お よび/またはシステム内における内部使用のために関連したエンティティキー表 示の検索を容易にする。圧縮ファイル・・・蓄積され続けている、もしくは別々 の位置の間に伝送されたコンパクトファイル表示。 ファイル処理システム・・・例えば圧縮ファイルの蓄積および伝送等のファイル 表示の蓄積および伝送用システム。ディジット・・・数字のシステム表示あり、 システム内で、永久読出し専用メモリまたは消去可能な読出し/書込みメモリの いずれかに保持されている数値、ビット・・・binary digit、すな わち基数2からのデジット−2つの要素Oおよび1に基くシステムであり、した がって2進デジツトは蓄積用の2状態メモリセルを必要とする。蓄積のビット・ ・・1つの2進デジツトを保持するための能力を表わす蓄積能力の単位。(蓄積 の)バイト・・・8番目の2進デジツトを保持するための能力を表わす蓄積能力 の単位。バイト位置・・・1バイトの蓄積能力を有する物理的な蓄積装置。3進 デジツト・・・基数3のデジットであり、蓄積のために3状態メモリセルを必要 とする。ニブル・・・基数16のデジットであり、4つの蓄積ビットを必要とす る。アルフィツト・・・alphadeclmal digitである。すなわ ち基数32のデジットであり、5つの蓄積ビットを必要とする(名称アルフィツ トは1Mの32アルフイツトが現在使用されているほとんどのアルファベットの 完全な1組のより小さいまたはより大きい活字ケース文字を表わすのに十分であ るために選択された)。オクテツト・・・基数256のデジットであり、1つの 蓄積バイトを必要とする。デジタルワード・・・メモリセルの機能的に継続した ストリング内に保持されている、もしくはある位置から別の位置に伝送されるデ ジットのシーケンスであり、シンボル形状で参照または示されたときはいつでも シーケンスまたはストリングの左端のデジット位置が最も桁の大きいデジットを 存する。接続されたデジタルワード(鎖状ワード)・・・機能的に1つの継続シ ーケンス中に結合される2つ以上の分離したデジタルワード。値・・・デジタル ワードを特有に表わす異なる数値量であり、値という用語はメモリセルのストリ ング内に保持されている、もしくはある位置から別の位置に伝送されるものを示 すために使用され、このような値は例えば2進、10進、16進またはアルファ デシマル法等を使用するシンボルおよび名称によって表わされる。全体値・・・ 接続されたデジタルワードの値。コードワード・・・コードのメンバーを表わす デジタルワード。コードワードセット・・・コードの全てのメンバーを表わす1 組の一定長ざまたは可変長さのコードワード。序数コードワード・・・整列され たセットのメンバーのシーケンス番号表示。コードワード値・・・コードワード を表わす値。圧縮コード・・・あるコードワードと別のよりコンパクトなすなわ ち冗長の少ないものとの間の変換を容易にするシステムコードであり、コードワ ードセットは同一のコードメンバーを表わす。コンパクトコード・・・非コンパ クトコードの圧縮コード変換によって生成される冗長の少ないコード。コンパク トコードワード・・・コンパクトコードのメンバーを表わすデジタルワード。リ ンク・・・機能的に接続された一連の蓄積装置中の1蓄積装置。リンク値・・・ リンクの内容を表わす値。アドレスワード・・・絶対または相対的アドレスを表 わすデジタルワード。アドレス値・・・絶対または相対的アドレスを量子化した 値。アドレス成分・・・アドレスワードを形成するために別のアドレス成分値・ ・・アドレス成分を表わす値、すなわちアドレス値を計算するために別のアドレ ス成分値との組合せにおいて使用される値。テーブル・・・値を蓄積するために 機能的に1行以上に配列された読出し/書込みまたは読出し専用メモリ領域。境 界アドレステーブル(第1のリンクメモリユニット)・・・第1のリンク値の入 力に応答して出力のときに1つ以上の境界アドレスを発生するテーブルであり、 必要な場合には境界アドレスの入力に応答して、適切な第1のリンク値の出力だ けでなく、もしあるならばこのような第1のリンク値に関連した別の境界アドレ スも発生する。冗長性・・・蓄積位置またはIMiのコードワードの未使用容量 、すなわち使用されていない可能性のある値の数。冗長比・・・使用される値の 数に対する使用されない値の数の割合(例えば、蓄積のバイトはにプルだけを保 持するために使用される。16個の可能なニブル値の各々が使用されるならば、 冗長比は(256−16)/1B−15である)。 ユーザー環境において上記で限定されたいくつかの用語は、例えば記録、セグメ ント、ファイル、エンティティキー、EK特性、EKSおよびR8Sなどの対応 したシステム表示という意味でシステム環境においてもしばしば使用される。 2、序論および背景 本発明はコンピュータシステムにおけるデータの蓄積および伝送用の処理および 装置、特に圧縮データの蓄積および伝送用装置に関する。結合または分離して使 用するための2つの関連した装置は、別々゛のエンティティキー人力に関連した データの迅速な検索のためのエンティティキーセットをコンパクトに蓄積される ことを容易にする。さらにエンティティキーシステムは、完全なエンティティデ ータセットの迅速な伝送用のみならず、コンパクト蓄積用のツールとして使用さ れてもよい。ファイル処理システムは、ファイルセグメントを表わすためのエン ティティキーコードワードの非冗長セットを生じるように2つの装置のいずれか 一方または両者が結合したものを使用してもよく、それによってコンパクト蓄積 および種々のファイルの迅速伝送を可能にする。 エンティティキーセットのコンパクトデータシステム蓄積を実現するための既知 の方法にはC,J、ディトによる文献(”An Introductton t o Database System’ 、 51乃至52頁)%およびジニー ムズ・マーティンによる文献(“Coll1puterData−Base O rganization” 、 517乃至526頁)において説明されている 前端および後端圧縮技術が含まれる。精巧なワード処理プログラムは、訂正スペ ル基準として使用するために1組の逐語ワードにアクセスし圧縮する類似した方 法を使用する。このようなプログラムは50000の異なる逐語ワードを保持す るために150000のバイト蓄積、および約数秒間通常のページのテキスト量 を表わすテキストファイルを走査するために必要な時間を典型的に使用する。 3、発明の説明 本発明による第1のタイプのエンティティキーシステムは、入力される個々のエ ンティティキーが蓄積され続けている1組のエンティティキーのいずれかのメン バーに等しいかどうかを示す方式で入力応答を生成する。訂正スペル基準のよう なエンティティキーシステムの使用方法が例示されている。 それでは蓄積され続けているエンティティキーのセットは頻繁に発生する逐語ワ ードのセットであり、エンティティキー人力は試験された連続テキストからの個 々の逐語ワードである。50000個の異なる逐語ワードの蓄積は150000 より少ないバイトの蓄積を必要とし、テキストファイルを走査するために必要な 時間は実質的に典型的なワード処理装置を参照し、て上述された時間よりも短い 。 本発明による第2のタイプのエンティティキーシステムは、EKSコードワード すなわち(i)エンティティキーセット内の個々のエンティティキーを特有に識 別するエンティティキ−シーケンス番号表示、または(ii)無効なエンティテ ィキーが入力された場合のりジニクト信号のいずれかの形態で入力応答を生成す る。この第2のタイプのエンティティキーシステムは例えば用語基準として機能 し、共通の逐語ワードおよび文節のEKS表示を行うことができる。このエンテ ィティキーシステムの使用目的は、どのようなファイルでもその全てまたはほと んどのセグメントを表示するコンパクトなシステムを提供することであり、この ようなコンパクトシステムの各表示は基準セグメントシーケンス番号コードワー ドまたはR5Sコードワードとして参照され使用されるためにエンコードされ’ t: E K Sである。テキストファイルの実質的な圧縮は適切なR8Sコー ドワードを共通ワードおよび文節のような頻繁に発生するテキストセグメントに 置換することによって達成されることができる。圧縮度は頻発セグメントおよび 活発セグメントの個々の頻発シンボルを表わす可変長コードワードを適用するこ とによって強調されてもよい。オリジナルテキストを表示したときにコードワー ドは適切なテキストセグメント、すなわち逐語ワードおよび文節を形成するため にデコードされる。 本発明による第3のタイプのエンティティキーは(i)入力されるエンティティ キーに特有に関連されたポインタアドレス、または(11)無効のエンティティ キーが入力された場合のりジェクト信号のいずれかの形態で入力応答を生成する 。エンティティキーと関連されたデータのどれかが外部の装置へ伝送され、およ び/またはそれから出力され、このような装置内の位置はポインタアドレスを使 用することによって発見される。この第3のタイプのエンティティシステムの使 用例は、完全なコンビコータベースエンサイクロペディアのエンティティ記録へ の迅速なアクセスを行うツールである。各入力は辞書的ワードであると考えられ 、したがってこの場合は辞書的ワードがエンティティキーとして使用される。 上述された3つのシステムタイプのそれぞれはまたエンティティキー人力状態で 動作してもよく、入力されるエンティティキーの蓄積を容易にし、それによって 必要な分類動作を容易にする。 本発明により構成され動作するデータ圧縮装置の効率は通常のバッフマン、(H urf+nan )コーディング技術の使用によって強化されてもよい。195 2年にデーピッドA、”ラフマンの文献(−A Method for the  construction of Minimum−Redundancy  Code ”がProc、 IRE、 40(9)に発表された。最近ではバッ フマンコーディング技術がギルバート。ベルトにより文献’Data Comp ression”において説明された。 4、
【図面の簡単な説明】
(a)第1A図乃至第1F図は、入力手段をメモリ手段とインターフェイスする ための精巧でない入力手段および接続されたデジタルワードの2つだけを使用し たエンティティキーシステム実施例の異なった基本的特徴を示す。 第1A図はEK入カシ−ケンスが“abc”である場合を表わす。 第1B図はどのように前に蓄積されなかったEKが蓄積されるかを示す。 第1C図はEKSの入力に応答するEK I10コードワードの出力の反転処理 、すなわち特定のEKシーケンス番号を示す。 第1D図乃至第1F図はEK I10コードワード入力に応答してポインタアド レスを出力する手段を有するEKシステムに関する。第1D図に示された実施例 はEK整合モードで動作し、第1E図および第1F図に示されたものはEK非整 合モードで動作する。 (b)第2A図乃至第2C図は標準I10コードからコンパクトコードへのコー ド変換用の3つの異なるコーディングスキムを示す。第2A図は5ビツトアルフ イツトコードワードへの変換を示し、第2B図は4ビツトニブルコードワードへ の変換を示し、第2C図は可変長コードワードへの変換を示す。これらのコーデ ィングスキムは、コンパクトコードワードシーケンスの標準I10コードワード 出力への再変換に適用可能である。 (C)第3A図乃至第3C図は、5ビツトアルフイツトコードワードへのコード 変換を使用した入力手段を具備したEKシステムの実施例に関する。 第3A図は11個の異なるEKを蓄積し続けている実施例を示す。入力シーケン スは°etch’の20ビツトコンパクトコ一ド表示に圧縮された32ビツトシ ーケンスである。 第3B図は、第3A図の実施例が複合されたワード“et cetra”を蓄積 するために使用されてもよいことを示す。この図はまた表示されることができる 以上のシンボルを含むEKが特有の全体的リンク値をさらに生成し得ることを示 す。 第3C図はビットマツプメモリ手段に基〈実施例を示す。 入力シーケンスは“etcetra”である。ビットマツプはIHのマークされ たビットを保持し、第3A図に示されたのと同一の11個のEKを表わす。 (d)第4A図および第4B図は、大文字および構成ワードが含まれたときの適 切な分類順序を容易にする手段を示す。 アルフィツトコードワードへのコード変換が使用される。 (e)MSA図乃至第5C図は付加的リンクの概念を導入する。アルフィツトコ ードワードへのコード変換が使用される。 第5B図はどのように適切な分類順序が維持されるかを示す。 第5C図は付加的リンク内の冗長性を取除くビットマツプメモリ手段の使用方法 を示す。 (f)第6A図乃至第6D図は中間リンクの概念を表わす。 アルフィツトコードワードへのコード変換が使用される。 第6A図は変数および値を示すために適用される約束を説明する。 第6B図および第6C図は実施例の変形を示し、両者は入力としてシーケンス“ etaonrih”を使用する。2つの変形は、中間リンクユニット内にアドレ ス要素値を蓄積するために2つの異なる原理を使用する。 第6D図はどのようにビットマツプメモリ手段を使用するEKシステムがEKシ ステム実施例においてコード変換手段の部分として使用されるかを示し、その他 の場合には通常のメモリ手段を使用する。 第6E図は14個までのシンボルを含む入力シーケンスに対処する実施例を示す 。コード変換は2つのステップにおいて使用される。 (q)第7A図と第7B図は、それぞれ4ビツトニブルコードワードおよび可変 長コードワードへのコード変換を使用する入力手段を具備したEKシステムの実 施例に関する。 (h) NSA図は、可変長コードワードを使用するファイル処理システムの実 施例に関する。 5、詳細な説明 第1A図乃至第7B図を参照すると、本発明によるEKシステムの好ましい実施 例の機能は、以下において詳細に種々の入力への応答が生成される方法により説 明される。特有のEKは入力を育し、1組の大きなEKのセットの1部分として 予め蓄積されると仮定する。このような入力は大量生産処理において読出し専用 メモリ装置内に予め蓄積されてもよく、あるいはそれらはEKを作動システム中 に入力することによって蓄積されていてもよい。後者の場合、実施例は読出し/ 書込みタイプのメモリ装置を使用し、前に蓄積されなかったEKを蓄積するため のモードで設定されることができる。蓄積されたEKを消去することは明白な逆 処理であり、ここではこれ以上論じない。 はとんどの図面において示されているように、第1A図はボックスの複数のスト リングを示し、各々は蓄積位置のストリングを表わす。このようなストリングは 、常に左から右へまたは上部から下部ヘアドレス値を増加する順序で入力手段l O内のように水平にまたはメモリユニット12および14内のように垂直に図示 されている。垂直ストリング16および18は水平に描かれたシステムバス20 の下に設けられている。特定のボックスを位置させるアドレス値は、例えば位置 されたボックスのバス20と上部24との間に描かれたライン22のように垂直 ラインの長さを増加すると共に増加される。ボックスの位置が直接的にアドレス され、ボックス位置のアドレスが探索動作の結果として記録されることを示すよ うに上に向いているならば、このような垂直ラインは下方に向いている。ボック スから読出された値は、ボックスから派生しバスを指しているライン28によっ て示される。ストリング内の特定の値の探索は垂直ライン28によって示され、 探索アーギュメント値L2により示される。ライン28は特有の探索範囲内の一 連のボックスに関し、各々このようなボックスはストリングの左手側に沿ってマ ークを付けられている。実行される各試験は、ボックス内に蓄積され続けている 探索アーギュメントL2と値し210間の整合に対して最初に試験されるボック スを表わす序数°O“によってマークされる。整合はすでに発見されているので 、星印“*′は調べられる必要のないボックスをマークするために使用される。 試験番号2における整合は、整合値L212を保持するボックスの左手側を横断 する短い水平ラインによって示される。実際にL2pQの値は番号を付けられた ボックスから1つづつ読出され、制御プロセッサブロック30内の値L2との比 較のためにライン28に沿って伝送される。 インデックスするシステムは、規則的な方法でこのような値を保持するテーブル だけでなくアドレス値、データ値を示すようにこの特性において使用される。主 に4つのインデクス変数p、q、rおよびSが使用される。q、rおよびSのイ ンデクスは、組合せpQrS%I)Qrおよびpq内のそれらの各位置において 使用されるだけである。インデクス変数は、アルファデシマル番号を使用する実 際値と交換されてもよい。シンボル2はセット内の最後の項目の順序番号を表わ す。全ての4つのインデクスは順序インデクスであり、それぞれはシリーズ0, 1,2.・・・Z内の値を有する。 インデクスpは蓄積され続けたEK上セツト示に関するLlp値のセット内の項 目シーケンス番号である。Llp番目の値はこのように蓄積され続けるが、しか しながら各L1pの値はストリング1B内の蓄積位置の相対的アドレスとして表 わされ、それぞれのこのような位置が関連した境界アドレス値B2pを保持する 。B2oからB2z十までの一連の値は各特定のテーブルT2pの大きさを決定 する。B2pの値はpの値を増加しながら高い値の順に有効なLlpと共に蓄積 するために前に与えられた全てのこれら個々の主リンクL2pq値を保持するた めに各T2pのテーブルを十分大きくするステップにより割当てられる。 インデクスqはpの各特定値に対する項目シーケンス番号であり、それによって 各テーブルT2p内のL2pqの値を別々に示す。全てのL2pqの値は、アド レス値を増加しながら値の高い順に各テーブルT2p内において1つの機能的に 連続したストリング18に保持されている。したがって、連続して複合したpq 番号はアドレス値を高めながらpq値の高い順に番号シリーズを形成する。値L 2ooは最少のアドレスB2oに保持され、最高のアドレスB2z+−1におい て値L2z7が保持される。B2z+の値は最後のテーブルT2zの最後を決定 するために使用される。インデッス番号を児成する正または負の符号がインデク ス番号シリーズにおける次のより高いまたはより低い番号を示す。例えばL2p 7がテーブルT2p内において最高のアドレスで蓄積され続けており、pの値が 1である場合、インデクスp7+はpq−20に等しい。 ボックスの蓄積能力は幅、すなわち蓄積能力の各ビットに対して1/10インチ で示される。したがってバイトボックスは8/lOインチの幅である。破線フレ ームは蓄積能力が示された幅よりも高いことを示すために用いられる。 第1A図乃至第1F図は、精巧ではない入力手段および入力手段をメモリ手段に インターフェイスするただ2つの接続デジタルワードを使用するシステム実施例 の異なる別々の基本的特徴を示す。第1C図に示された逆処理を除いて、入力手 段は蓄積位置32および34の2つの短いストリングと、現在の110コードワ ード入力の表示を一時的に保持するストリング32と、および2つの接続デジタ ルワードを一時的に保持するストリング34とを含むブロック10の形状で図面 の上部に示されている。 ストリング32はオクテツト値Oo・ 01および02を蓄積し、3つの8ビツ ト110コードワードから直接的に得られる値は3つのシンボルEK入カシーケ ンスを表わす。オクテツトの値は16プラス8ビツトストリング34中に存在す る2つの接続デジタルワードに直接的に伝送される。16ビツトワードは値Ll −0(、+256 +01を獲得し、8ビツトワードは値L2−.02を得る。 入力に使用されるI10コードは情報交換用の拡張された米国標準コード(EA SCII)であり、さらに前に蓄積されたEKは英語のアルファベットの第1の 8つの小活字ケース文字の全ての512の可能な3文字の組合せを含む。 リンク値L1は、境界アドレス値B2pが読出される第1のリンクメモリユニッ ト12にアクセスするようにアドレス値を生成するために制御プロセッサ30に よって使用される。リンク値L2は、境界アドレス値対B2pおよびB2pによ って決定されたアドレス範囲内において主リンクメモリユニット14内において 蓄積され続ける値と比較するために使用される。 制御プロセッサ30はシステムバス20を介してシステムのその他の全部分と通 信する。プロセッサ30は各入力シーケンスに対して制御プログラムを実行し、 バス20を介して応答の出力を支配し、入力手段10はリセットされそれらが新 しい入力シーケンスを受信する準備をさせる。 蓄積され続けている83−512の異なるEKであると仮定すると、その蓄積は 82−64の異なる境界アドレス値B2゜乃至B22を生成し、ここでZ−63 である。これら64の値は64の別々のテーブルT 2 o乃至T22の第1の 蓄積位置36のアドレスであり、ここでZ−63である。それぞれのこのような テーブルは8つの値L2po乃至L2p7を保持し、ここでpは0から63まで の範囲であり、全部で512のL2pQ値は512の蓄積されたEKを表わす。 第1A図は、現在のEK入カシ−ケンスがabc−である場合を表わす。シンボ ル“abc”を表わす10進EASCII値はそれぞれ97.98および99で ある。シンボル”a b’はL 1−97*256 +98−24930として 表わされる。 下位のB1値を発生したただ1つのシンボル対”aa−1すなわちインデクスp は対“aa”に対して値0を、また対“ab”に対して値1を仮定する。8つの L2pQの値すなわち10進法で97から104はテーブルT2】において蓄積 され続け、10進数で99である第3の値は現在の主リンク値L2を整合する。 図面に示されているように整合は、テーブルT2゜内の0とマークされた第1の 蓄積位置における探索開始の結果として得られ、位置は現在のL1値24930 によって支配されるオフセットアドレスにおいてテーブルTl内の2バイト蓄積 位置から得られた境界アドレス値B2.により指示される。前記整合は11バイ ト蓄積位置において褥られ、最下位のアトレイB2oから数えられ、したがって 10のEKS値は出力である。EKS値はシリーズO,′1,2.・・・511 内の項目シーケンス番号であり、512のEKの補数を特有に表わす番号が予め 入力されている。 テーブルT1内において、25185から25188までの値のLipのグルー プと、シンボルの対“ba、bb、bc。 bd=に対応したし18乃至LIBの値に関連したB2pも示されている。また 65535082p値を発生した蓄積されないEKに関連されたシンボル対“h h”および最後の2つのB2z+の位置に対応した最高のLlpの値26728 が示されている。蓄積されないEKに関連した全てのT1の位置は先行するT1 位置内に蓄積されたものと同一の820値を保持する。インデクスnは、値が有 効EKに関連されていないことを強調するためにインデクスpの代わりに使用さ れる。指示LIOは後に任意の可能なLl値を表わすときに使用され、無効値を 含む。この実施例のように使用された場合にはテーブルT1は複数の冗長情報を 含むことが明かである。512のEKだけを蓄積し続ける場合、257バイトの 蓄積が各EKに必要とされ、十分に長いT1テーブルが使用される場合には65 53702つのバイトの行を有する。他方ではこのような実施例に関して非常に 少ないコンピュータ命令がシステムから応答を得るために必要とされる。 記載されている特有の実施例は、256シンボルコード、すなわちオクテツトコ ードワード表示の場合には最大の可能なコードを使用して全ての可能な3つのシ ンボルの組合せを蓄積する能力を有する。蓄積能力は、第1A図に示された2バ イト幅テーブルの代わりに3バイト幅T1テーブルを必要とする2583−16 80万個の異なるEKである。しかしながらテーブルT1が必要とする蓄積量は 非常に少ない。合計で1.01バイトの蓄積が各EKに必要とされる。他方おい て、各72 p内の探索範囲は合計で256バイトの蓄積となるため、応答時間 は増加する。しかしながら、応答時間は通常の2進探索方法を使用してこのよう な範囲を検索することにより非常に短く維持されることができる。最少の応答時 間は迅速なアクセスタイプの電子メモリに蓄積される全てのテーブルを必要とす るという考えも適切であり、高度な圧縮が得られるならば要求は容易に満足され る。 第1B図は、予め蓄積されないEKがどのように蓄積されるかを示す。この図は 第1A図に示されたものと同一の実施例を表わしているが、蓄積されたEKの数 は512から511に減少されている。しかしながら、テーブル16および18 はEKシーケンス“abb”の蓄積後に第1A図に示されたものと同一の値を含 む。 “abb’を表わすオクテツト値の入力すなわち97.98および98は249 30の現在のLl値を発生する。この値は境界アドレスB21およびB22をテ ーブルT1から読出させる。 プロセッサ30はB22が821よりも大きく、前記境界アドレスによって特定 されたT2□テーブル内の現在のB2の値98の探索を開始することをテストす る。値L210−97は第1の蓄積位置36から読出され、現在の値L2−98 より小さいことが分る。次の値L21.−99は98よりも大きいことが分り、 探索は全ての残りL2pQ値が非常に高く、高い値の順に蓄積されるときに停止 される′。EKリジェクト信号40はバス20を介して出力され、まだ行われて いなければ、システムユーザーは制御プロセッサ30に挿入指示シーケンスを実 行するこのようなりジニクト信号40に応答するように命令してもよい。 このようなシーケンスは(i) 10よりも高いpqインデクスを有し、それぞ れ前にL2pq値を蓄積された次に高いアドレスに移動し、<ii)前に蓄積さ れた値L20.の蓄積位置内の現在のB2値を挿入し、(iii) 1より大き い全てのp値に対して1だけ全ての82p値を増加することを含む。 EKの第1の2つのシンボルが前に蓄積されていなかったように、それらが“a b”を持たない場合には、プロセッサ30はB22はB21に等しいことが分る 。T2□テーブルが全く存在せず、EKリジェクト信号40が第1のリンク基準 に基いて出力される。このような場合に、挿入指示シーケンスは(i)821以 上のアドレスを有するL2pq値をそれぞれ前に蓄積された次に高いアドレスに 移動し、(11)アドレスB2.における蓄積位置内の現在のし2値を挿入し、 (iil) 1より大きい全てのp値に対して全ての82p値を1だけ増加する ことを含む。 時間の浪費を避けるために、大きい番号値の予備の蓄積位置は都合の良い間隔で 移動して調整される。 第1C図は、EKSの入力に応答するEK I10コードワード表示、すなわち 特有のEKシーケンス番号の逆処理を示す。プロセッサ30はシステムバス20 を介して受信された現在の入力EKS値10を境界アドレス値にB2oに加え、 結果的なアドレスB2o+10においてストリング18から現在の主リンク値L 2−99を読出す。第1のリンク値L1を決定するために、T1テーブル16は このような結果的アドレス以下の最高のB2p値を探索される。2進探索はこの ようなり2p値を発見するために必要とされる試験の数を減少するために使用さ れる。図中では0から9の番号が付いている10回の2進探索試験の後、連続的 な探索がB 1 o+ 24928で開始される。これは、この点において目標 位置が近接しており、番号8のときに試験されたものよりも低いアドレスにおい て確認されなければならないからである。3つの連続的な試験において、B20 +IOよりも低いA、BおよびCの値がテーブルT1から読出され、アドレスB lo+L1+1で見られる値は番号DB2o+16において高いことが分る。プ ロセッサ30は、B10+1を発見されたアドレスから減算することによって現 在の第1のリンク値L 1−24930を決定することができる。 最後に、出力手段42は現在のリンク値を3つの110コードワードのシーケン スに変換する。第1のオクテツト値O。 は24930 /25B−97の愁数部分として計算される。第2のオクテツト 値01は24930−oo*25B −98として計算され、第3の値02は現 在の主リンク値99に等しい。これら3つの値はシンボルシーケンス“abc” を表わす。 第1D図乃至第1F図は、EK I10コードワード入力に応答してポインタア ドレスを出力する手段を有するEKシステムに関する。第1D図に示されている 実施例はEK整合モードで動作し、第1E図および第1F図に示されているもの はEK非整合モードで動作する。EK整合モードという用語は、ポインタアドレ ス出力およびEKS出力のようなシステムからの任意の出力が前に蓄積されたE Kに整合するEK大入力関連するという事実を強調するために使用される。 EK非整合モードという用語は、システム出力が全てのリンク値を発生し前に蓄 積されたEKを表わす全てのリンク値の間に落ちる任意のEK大入力関連すると いう事実を強調するために使用される。したがってこの後者のモードは以下にお いて動作のゲートウェイモードとして参照されている。 第1D図乃至第1F図に示されている実施例は、ポインタアドレスP21)Qを 保持する第2の列44が各T2pテーブルに付加され、このよう、なP2pQア ドレス値はそれぞれ特定の第1の列L2pQ値に関連されることを除いて、第1 A図に示されたものと類似している。しかしながら、ゲートウェイモードにおい て各P2pQ値は、もし入力されているならばこのようなL2pq値とその最も 近接したちのL2pQ+との間にB21)Q値を挿入させる任意のEKに関連さ れている。 EKと関連された任意のデータは外部装置へ伝送され、および/または外部装置 から出力されてもよく、このような装置内の位置はポインタ値P2pqの使用に よって発見される。 このようなデータは動作の整合モードで特定のEKに厳密に関連されていると考 えられ、ゲートモードにおいてシステムはEKグループを共通の外部装置アドレ スに関連する。 前に蓄積されていないEKの蓄積において、新しい行は適切なT2pテーブル内 に挿入され、行に保持されるL2p(1/B2pq値の対は移動されなければな らないことが重要である。 このように各主リンク値L2pQとその関連したポインタアドレス値PI)Qと の間の一定関係が維持される。しかしながら、メモリ空間の限界のためにテーブ ルT2pのこのような第2の列44は安価な外部蓄積装置内に設けられてもよく 、その場合にはEKSコードワードがこのような外部テーブルへのポインタとし て使用されてもよい。 第1D図乃至第1F図において、便宜上コードワード値を表わすために異なる方 法が導入されている。入力シンボルがボックスの内側またはブラケット内に現れ たときはいつでも、それらは対応したコードワード値を示すものとして解釈され るべきである。 第1D図はどのようにポインタ値Pユ2がテーブルT21の列44内において発 見され、システムバス20を介して出力に読出されるかを示す。EK″abc” と関連されたデータの操作はアドレス用のポインタ値を使用して容易にされる。 第1E図は、ポインタ出力応答が前に蓄積されていなかったEK入力シーケシス に対しても促進されることを除いて、第1D図に示されたものと同一の実施例を 示す。したがってこの実施例はゲートウェイモードで動作する。シーケンス“a ai”は入力として使用され、蓄積されたシーケンスの一部として前に入力され た第1のリンク値を発生し、したがって動作のゲートウェイモードはこの場合に 第1のリンクメモリユニットの機能に影響を与えない。テーブルT2oにおいて 整合する探索が全くない場合には、現在のB2値[Dは値し2自体より高くない が可能な限り高い特定のL2oq値と関連される。図面において、このような状 態がL2o7で満たされることを示すために“〉′という符号が使用され、両向 きの矢印は関連されたポインタアドレスPO7がそれによって発見されたことを 示す。またテーブルT21を探索しL2Q。 より低いB2値はPO7に関連されている。 第1F図は、シンボルシーケンス“a i a”が入力として使用されているこ とを除いて第1E図に示されたものと同一の実施例を示す。この入力は蓄積され たシーケンスの一部分として予め入力されない第1のリンク値を発生する。値B 28がストリング16からL 1−24938およびL 1−24937に対し て読出されるとき、LlとL1+1とに対するB2゜間で行われる比較には全く 差がない。ゲートウェイモードでのシステム動作により制御プロセッサは、アド レスB28−1においてシステムバス20を介してT2pテーブルの第2の列4 4からポインタ値P77を直接読出す。同様のことが24937から25184 までの任意のB1値に対して生じる。次の値L1−25185は前に蓄積された シンボルシーケンスによって発生された値、すなわち対“ba”で始まる値であ る。図面において、両向きの矢印はポインタアドレスP77の位置を示す。 ポインタアドレスP00を具備したボックスは24929の下のLl値をカバー するために付加される。 これまで記載された実施例は3つのシンボルEKだけを蓄積することができ、こ れはほとんどの適用において厳しい制限である。コンパクトコードへの変換は、 ストリング32内において増加する数のコードワードの適用を容易にし、それに よって1つのEKに対する入力シンボル数を増加することができる。コンパクト コード表示はメモリ空間要求を減少するという付加的な利点を有する。これによ って、より多くのEKが所定の作動メモリ領域内に同時に保持され得るときによ り短い応答時間をもたらす。コンパクト表示はより短い応答時間となる。これも またより少ないビットがそれぞれの検索動作で関連するためである。さらにコン パクトコードの使用は、第1のリンクメモリ要求を減少するストリング32の短 縮を促進する。1ビット分だけ短くすることによって、境界アドレステーブル1 6の長さは半分にカットされる。 第2A図乃至第2C図は、入力手段10内において適用されるための標準I10 コードからコンパクトコードへのコード変換用の3つの異なるコードスキムを示 す。第2A図は5ビツトアルフイツトコードワードへの変換を示し、第2B図は 4ビツトニブルコードワードへの変換を示し、第2C図は可変的長さのコードワ ードへの変換を示す。これらのコーディングスキムはまたコンパクトコードワー ドシーケンスの標準I10コードワード出力への再変換にも適用可能である。 第2A図のアルフィツトコードは精巧な分類順序要求への適合に適している。第 3A図乃至第6E図において、種々の特性を示し分類順序特性を含むこのような コードが使用されている。 可変長コードワードを使用するコードだけでなくニブルコードもまた特定の分類 要求を有する適用において使用されることができない。しかしながら、このよう なコードは分類順序が関与しないところではそれらが適切であるという別の特性 を有する。第7A図および第7B図において、このようなコードが使用され高度 なコンパクト化の重要性を強調している。 コンパクトコード変換を含むシステム実施例の機能は、一度リンク値が決定され ると基本的に第1A図乃至第1F図を参照して説明されたものと同一である。し たがってこれらの図面に示された特有の性質は、コンパクトコードを使用する実 施例にも適用可能である。 第3A図はEK″etch−を表わす4つのオクテツト11コードワードの入力 シーケンスを有する実施例を示す。 コード変換が使用され、32ビツト入力を5ビツトアルフイツトコードワードに 基いた20ビツトコンパクトコ一ド表示に縮小する。コード変換手段46はルッ クアップテーブル48の形態で示され、アドレスBOoにおいてその第1のアル フィツト位置を有する25Bアルフイツトコードワードのストリングを含む。ア ルフィツト値AnはアドレスBOO+Onにおいてn−0からn−3までの順次 でテーブル48から読出される。 以下のテーブルは、連続したアルフィツト値が一時的に保持される小さいストリ ング32の内容がどのようにストリング34に伝送され、ここではリンク値L1 およびB2で表わされた2つの接続されたデジタルワードを一時的に保持するか を説明している。コードシンボルを表わすアルフィツト値は、対応した2進法お よびアルファデシマル法で表に示されている第2A図のエンコードスキムから得 られる。ビット表示はテーブルの中間の行内に位置された1つの隣接した連続と して示されている。リンク値は16進法で示されている。 第1のリンクメモリユニットは第3A図におけるブロック12である。T1テー ブルの内側は第1A図乃至第1F図の実施例における65537行と比較すると この場合4097行だけを含む。制御プロセッサ30は、リンク値L1から生成 されたT1蓄積位置からB2p境界アドレス値を読取る。Ll−4EOXに対し てB25およびB26が読出され、ストリングの11個のEKが前に蓄積された ものとして示されるストリング18内において探索範囲を決定する。各L2pQ 値は16進法で示されている。4つより少ないシンボルを含むEKは、オクテツ ト110コードワードの各入カシケンスが無効を表わすコードワード、すなわち 2のアルフィツト値を持つNULを付加することによって一杯にされたという仮 定の下にL2pq値を割当てられている。EK″etch”を表わす主リンク値 ECxは、探索範囲の最後において最終項目として読出され、現在のB2値と整 合することが分る。 図面に示されるように、これら11個の前に蓄積されたEKは、EMS番号順に 連続して出力されるならば第1C図の技術を使用して適切な分類順序で供給され る。長いワード“etCetera”は“e t c e−として出力される。 第3B図はどのように前に蓄積されなかったEK−et cetera’の入力 が不適切な位置における現在の主リンク値L2−67Xの挿入を生じ、望ましい 分類順序を考慮する。この問題の解決方法は第4B図を参照して後に説明される 。挿入における機能の説明に対しては第1B図の説明が参照される。 第3c図はビットマツプメモリ手段52に基〈実施例を示す。 第3A図に示されたもと同一の11個のEKが前に蓄積されており、パそれらの 1つ、すなわち“etcetera”が現在の入力用に使用されると仮定する。 コード変換手段46を含む入力手段10は、長さを増加された小さいストング3 4を除いて第3A図に示された対応した手段と同一である。sl乃至S8のセク ション値はリンク値として正確に生成される。新しい用語セクションは、同一の 小さいストリングがリンク値およびセクション値を保持していてもよいEKシス テムの記入を促進するために対応した用語リンクの代わりに導入され、セクショ ン値はビットマツプメモリ手段に関連され、リンク値は通常のメモリ手段に関連 される。このような結合使用の例示は第6D図を参照して論じられる。 第3C図に示された実施例は各アルフィツトに対して1つのセクションを有し、 それによってアルフィツト値と同一のセクション値を形成し、これがこれらの値 を保持する1組だけの蓄積位置の使用を容易にする。換言すると、2つの短いス トリング32および34が1つの共通のストリングによって置換されてもよい。 最大の8つのセクション値は、1組の8ビツトマツプ、すなわちテーブルT1乃 至テーブルT8を必要とする各EKに対して適用される。11個のEKを表わす シーケンスの長さは、1から8アルフイツト値まで変化するが、しかしながらE K I10コードワード入力に応答するEKSの出力を促進するためにコード変 換手段46はこのような各シーケンスにそれら全てを8アルフイツト長にするの に適切な数の制御機能アルフィツトを付加する。適切な分類順序を得るためにこ のようなアルフィツトが、EKシンボルを表わすアルフィツトの後に付加されな ければならない。しかしながら、第3C図に示された実施例は適切な分類順序を 要求しない適用において好ましい少ないメモリの別の態様を示す。制御機能アル フィツトは前に付加され、それによってこれらのアルフィツトは各ビットマツプ 内において1度だけ表わされる。したがって5つのシンボルa、b、c、dおよ びeは、1状態であるとマークされた丁度1ビツトによって全てテーブルT1乃 至T7のそれぞれの範囲内に表わされる。 これらのマークされたビットは各テーブル内の相対ビットアドレス02α、すな わち各テーブルの第1の行内の右から左にカウントされる第3のビット位置に位 置される。このビットアドレス値は、システム制御機能NULを表わすために使 用されるアルフィツト値2αに対応する。 テーブルT8内において、相対的なビットアドレスoOα−〇Wαにおける第1 のグループの32ビット位置は、各テーブルT1乃至T7内の最低のアドレスビ ットマークによって表わされる前に蓄積されたセクション値S1乃至S7に関連 した前に蓄積されたS8値を表わすために使用される。したがってM3C図にお いて、テーブルT8内の第1の32ビツトグループが単一文字シンボル入力を表 わすために使用される。 このグループ内の5つのマークされたビットは蓄積されたシンボル“a、b、c 、d、e−を表わす。例えば相対ビットアドレス07αにおける第1の行内の左 端のビット位置は、7αのコードワード値を有するシンボルを表わす。この値は 、第2A図のコードテーブルから分るようにシンボル゛C′を表わす。シンボル コードワード値に等しい相対的なビットアドレスにおいてテーブルT8内の特定 のビット位置をマークすることによって、前に蓄積されなかった任意の単一シン ボルEKが付加されてもよいことは興味深い。 現在のEK大入力etcetera’は、小さいストリング32内に位置された 8つのアルフィツト値を発生し、それによって現在のセクション値S1乃至S8 が決定される。これらの値は、各テーブルT1乃至T8内の現在の相対ビット位 置アドレスを生成するために使用される。第3C図によると、各ビットマツプテ ーブルはバイト蓄積位置のストリングを含み、各バイト内の最少桁ビットの相対 ビットアドレスはアルファデシマル法を使用して各テーブルの右側に沿って示さ れる。他のビット位置のアドレスは右から左にカウントするときに0乃至7を加 算することによって図から決定される。 記載された実施例でこのために使用された値はSIL乃至S8Lで示され、6値 S1乃至S8から3つの最少桁のビットを取除くことによって得られる。第2A 図から理解できるように、Slの値9αは2進法の01001に等しく、シたが ってSILは値001を取る。 テーブルT1において、アドレスのために使用される現在の相対バイトアドレス はSl/8−01として計算される。図面において、対応した相対ビットアドレ ス5IB=S1−SIL−O8αが示されている。制御プロセッサはこのバイト 位置から値M]。8を読取り、値SILがビット値1を有するビット位置001 を示すことが分ったときにビットマーク整合を生じる。整合とは現在のSl値に 等しいSl値が前に蓄積されていたことを意味する。 連続したテーブルT2乃至T8のそれぞれに対して、現在の相対バイトアドレス はS2/8+Ml*4.S3/8+M2*4・・・S8/8+M7*4として計 算され、第3C図において対応した相対ビットアドレスS2s乃至S 8 B  sすなわちそれぞれIPα、10α、18α、2Pα、38α。 4Gαおよび50αとして示されている。値Ml乃至M7はそれぞれ現在のもの よりも低いビット位置アドレスでマークされたビット番号の各テーブルT1乃至 T7内におけるカウントとして生成される。対応したM8値は出力として使用さ れた現在のEKS値に等しい。 マークされたビットの速いカウントを促進するために、7Mテーブルとも呼ばれ るマークカウントテーブル54は第3C図において示されるように使用される。 このテーブルは相対入来アドレスとして8ビツトのグループの値の全て、すなわ ちバイト値を使用する4ビツト幅捜索テーブルである。 バイト内のマークされたビット番号は1度の迅速な動作でテーブル54から読出 される。テーブル54の右側において、入来相対アドレス値■ は18進法で示 されている。 多数の連続した8ビツトグループが調査されなければならないときにさらにカウ ンティングプロセスを高速化するために、総計マークカウントテーブル56が使 用されてもよい。第3C図に示されているテーブルTM8と呼ばれるこのような テーブルは32ビツトグループ用の一連の総計マークカウントを保持している。 例えば、相対バイト蓄積アドレス5で発見される値M85は、テーブルT8の第 1の5つの32ビツトグループ内の合計のマークされたビットカウントを表わす 。この特定の値M85−10は現在のEK″etcetera’に関連されたE KS値を決定するために第1のステップとして読出される。 EKS値を決定するための第2および最後のステップは、6番目の32ビツトグ ループのテーブルT8内のマークカウントを生成することである。この場合最後 のシンボル“a′を表わしているマークされたビットは相対ビットアドレス55 αで発見される。このマークされるビットは32ビツトグループの第1のバイト 内に位置され、したがって55αより下のビットアドレスにおいてこのバイト内 のマークされたビットが存在する場合には試験だけが残っている。バイト値M  8 s。が読出され、3つの最も左のビット位置がマスクされ、偶発的に00x になる残った全ての値はv8゜入来値として7Mテーブル54に供給され、Ms o””0が読出される。EKS値はEKS−Mg2 +M、。纏10として決定 される。 現在のEKS値は、現在のものよりも低いビット位置アドレスにおけるT8テー ブル内のマークされたビット番号のカウントとして生成され、EKS値はEKS 順序で与えられた場合に適切なアルファベット順で分類されるような全ての単一 シンボルEKが現れる順序で発生される。全ての2つのシンボルEKは次に分類 順に、その後3つのシンボルEK全で等の順序で現れる。これは第1のものに後 続して各テーブル内において32ビツトのグループがこのような32ビツトグル ープに関連されたビット位置よりも低いビット位置アドレスにおける直前のテー ブル内のマークビットのカウントによって支配される順序で前に蓄積されたEK を表わすために割当てられるためである。11個のEKのセット内で最長のもの である現在の入力EK″etcetera’は、no、 10として一連のEK S番号0乃至10内に現れる。 第4A図および第4B図は、E、e、ET、Et、et。 ETA、Eta、eta、ETC,Etc、etc。 ETC,、etc、、et cetera、ETCETERA。 Etcetera、etcetera、ETCH,Etch。 etchのような適切な分類順序を促進するだめの手段を有する修正された実施 例を示す。修正された実施例は、8ビツト幅TLO捜索テーブル48およびテー ブル48に示された左端の3ビツトの値に基いてQ値を決定する制御プログラム 機能を有することにより第3A図および第3B図におけるものとは異なる。第4 A図および第4B図は、適切な分類順序が得られるようにリンク値全体を形成す るために使用されるアルゴリズム49を提供する。これはストリング32の末端 のQ値を含み、前のアルフィツト値シーケンスを生成するときに全ての単一スペ ースまたはハイフンコードワードを無視することによって達成される。 第5A図乃至第5C図は第3A図に示された実施例と等価なものを示しているが 、しかしながら任意の長さのI10コードワード入力を十分に特有に表わすため に付加的なリンクメモリユニット50をも含む。′リンク上1およびL2は任意 の入力に対して使用される強制的リンクであり、L2は上記に記載された実施例 の全てにおけるように主リンクである。 第5A図において、第3A図における前に蓄積された11個のEK上セツト同一 のものが示されており、現在のEK大入力“etcetera”である。第5B 図においてEK“et cetera”が付加され、第5C図における前および 現在の入力は第5A図ような状態である。 EK整合信号および/またはEKS値の形態の出力は、状態と整合する全体リン ク値が生成されている場合に発生される。EKS値は、現在の主リンク値が発見 される主リンク蓄積位置の相対アドレスから得られる。第1E図および第1F図 の実施例からの類推において、ポインタアドレス値は各主リンクテーブルT2P 内にこのような値を保持する第2の列からaカされてもよい。 第5A図において、コード変換手段46がアルフィツト値1αを有する制御コー ドワードの形態でストリング32の末端でターミネータを付加する。 第5B図における“et ctera”の付加は、付加的なリンクが使用される 場合に適切な分類順序がどのように達成されるかを説明するために機能する。大 文字を有するEKとEKとの複合を表わすために、2つのアルフィツトシーケン スがターミネータとして使用され、システム制御コードワードOαでスタートす る。 第5C図の目的は、付加的リンクメモリユニット50の前端部にビットマツプメ モリ手段を内包する利点を表わすことである。 MSA図および第5B図に示された付加的なリンクメモリユニット50はそれ自 体一連の小さいEKシステムを含み、ここにおいてサブシステムとして使用され ている。このような直列の第1のサブシステムは入力として第3のリンクアルフ ィツトと連結され2つのデジタルワードに変換されたEKSコードワードを使用 する。これら2つのデジタルワードの第2のものは、第3のリンクアルフィツト と結合されたEKSコードワードからの最後の3ビツトを含む。第1のデジタル ワードはベースアドレスB3oに付加され、結果的アドレスは1対の境界アドレ スを位置し、アドレスB30におけるその第1の行を有する境界アドレステーブ ルからそれを読出すために使用される。この第1のサブシステムは出力としてシ ーケンス番号TBSを生成する。直列する次のサブシステムは、2つの新しいデ ジタルワードに変換される入力として次のリンクアルフィツトと連結されたTB Sコードワードを使用する。機能は残っているリンクアルフィツトがなくなるま で反復する。 整合が発見されない場合には、状態と整合する全体的なリンク値は別の全体的な 付加リンク値の試験によって捜索され、前に蓄積されたリンク値がこのような別 のものを発生しなければならない。このような代替値は、同じ現在の主リンク値 を保持する複写された主リンク蓄積位置に個別に関連していても、関連していな くてもよい。このような複写のケースはisB図に示されており、ここにおいて 付加的なEK’et ctera”の蓄積が主リンクメモリユニ0.ト内にLP 01値を蓄積させ、LP01値と同一の値はEK“etcetera’を表わす 。第5A図および第5B図におけるストリング32の内容を比較することによっ て、分離複合語“et cetea−は適切な分類順序を促進するために全体的 なリンク値の最少桁部分を調節するように構成されているターミネータを除いて 、対応した密着複合語“etcetera”として正確に蓄積されることが理解 さることができる。1つ以上の大文字がEKの一部分である場合には、代わりの ものを位置する各大文字が特別に選択されたB8値によりて表わされる。第5B 図に示されているように、状態と整合する全体的なリンク値は値Egxすなわち L25q値の連続的な探索における4番目を保持する2つのボックスの第1のも のを試験したときに既に生成されている。 EKS−9は、この最初の整合した代りのものに関連された主リンク蓄積位置、 すなわちL254位置の相対アドレスから得られる。 585 C図においてビットマツプメモリ手段52は入力として主リンクメモリ ユニット14から生成されたEKS出力を使用する。したがって5l−EKSで ある。マツプの機能は第3C図を参照して説明されたものに等しい。しかしなが ら第5C図においてはただ1つの大きいマツプ調整WWWXビット位置すなわち WWWX EKS値が示されている。マツプ出力M 1は、4より多いアルフィ ツトを必要とする全てのEKを含むセット内の基数である。前に蓄積されたと考 えられる11個のコードワードの中の2つだけが、十分に識別される4つ以下の アルフィツトを必要とするその他のEKとしてマツプ内にビットマークを生成し ている。探索動作において、ビットマツプは常にビットマーク状態に対して試験 されている。 適切なビット位置がマークされない場合には、これは最初の4つのアルフィツト に後続するものが蓄積されなかったこと、すなわち第5A図および第5B図を参 照して論じられたような付加的リンクメモリユニットの試験は行われなかったこ とを表わす。 その他の図面を参照して以下において示されているように、付加的リンクメモリ ユニットはI10フードワードシーケンスの後のポイントで作用してもよい。 第6A図乃至第6E図は中間リンクを含む実施例に関する。 アルフィツトコードワードへのコード変換が使用される。第6A図は第6B図乃 至第6E図に示された全ての実施例に適用される基本概念を示す。以下の例示は 値、アドレス、テーブルなどを示すために使用される。 pは、全ての前に蓄積された境界アドレス値の対B2およびB4を値が高くなる アドレス順で示す序数表示(0,1゜2、・・・)である。B2およびB4値は それぞれテーブルの第1の行アドレス、中間リンクメモリユニット内に位置され たテーブルT2pを示すアドレスB2pおよび主リンクメモリユニット内のテー ブルT 4 pooを示すアドレスB4poo□を表わす。 qは、L2pq値のように値が高くなる順番で前に蓄積されたL2p値を示すp の各特定の値に対する序数表示(0,1゜2、・・・)である。 rはL B pqr値のように値が高くなる順番で前に蓄積されたLBpq値を 示すpqの各特定の値に対する序数表示(0゜1.2.・・・)である。 SはL J pqrs値のように値が高くなる順番で前に蓄積されたL 41) Qr値を示すpqrの各特定の値に対する序数表示(0,1,2,・・・)であ る。 前に蓄積されたB4値は主リンクメモリユニット14内のある機能的な隣接する ストリング中に保持され、それぞれのこのような指示は図面に示される場合にp qrs表示を有する。 第6A図において、値L 4 pqro乃至L 4 pqrNがアドレス値を高 めながら値の高い順に蓄積される。全てのpqrグループの後にこの例示が続く ため、一連の複合語pqrs番号がアドレス値を高めながら値の高いpqrsの 順に番号シリーズを形成する。第6A図の実施例は入力手段10を含み、ストリ ング32内に8つの現在のアルフィツト値Ao乃至A7およびストリング34内 に4つの現在のリンク値L1乃至L4を有する。第1のリンクメモリユニット1 2は現在の第1のリンク値L1に関連された現在の境界アドレス値B2pおよび B 4 pooを供給する。主リンクメモリユニット14は前に蓄積された主リ ンク値L 4 pQSを蓄積し続ける。中間リンクメモリユニット58は2列関 係のテーブル60および62に機能的に配置された複数の蓄積位置を有する。こ れらのテーブルは値の対を保持し、それぞれはリンク値および関連したアドレス 複合値を含む。値の対は2セツトのテーブルすなわち1セツトのT2pテーブル 60および1セツトのT3pqテーブル62において調整され、各テーブルはそ の分離した行において1つ以上の値の対を保持する。現在の第2のリンク境界ア ドレス値B2pは現在の第2のリンクテーブルを位置するために使用され、この ような現在の第2のリンクテーブル内に保持されるリンク値L2m)Qは現在の 第2のリンク値と比較するために読出される。前に蓄積された同一の第2のリン ク値Lp9が発見され、アドレス値が生成され、前に蓄積された第2のリンク値 L2に関連されるように前に蓄積された第3のリンク値L3pq全てを含む現在 の第3のリンクテーブルT3pqrを示す場合に、L2状態整合値が生成される 。アドレス値は、第2のリンクテーブル60の位置に関するオフセット値を決定 するために第2のリンクテーブル60から読出された関連したアドレス成分値C 2pqを使用して生成される。このような現在の第3のリンクテーブル内に保持 されたリンク値L3pqrは現在の第3のリンクヒアタイL3との比較のために 読出され、L3値整合状憇は前に蓄積された同一の第3のリンク値L3pqrが 発見された場合に生成される。現在の主リンクテーブル64、すなわち前に蓄積 された第3のリンク値L31)Qrに関連されるように前に蓄積されている全て の主リンク値L 4 pqrsを保持するテーブルがこのとき設けられることが できる。 現在の境界アドレス値B4pQrおよびB 4 pQr+は現在の境界アドレス 値B 4 pooをオフセット値に付加することによって生成され、このような ラットオフ値はそれぞれ1つ以上のアドレス成分値C3J)Qrから決定され、 現在の第3のリンクテーブルから読出される。このような現在の第4のリンクテ ーブル内に保持されているリンク値L 4 pqrsは現在の第4のリンク値L 4と比較するために読出され、L4状態整合値は前に蓄積された同一の主リンク 値L 4 pqrsが発見された場合に生成される。テーブル64は第6A図に 示されたアルファデシマル番号にしたがって連続的に探索される。番号1αにお いて、整合が得られ、関連したポインタアドレスPpqrlが出力される。 i6B図および第6C図は、中間゛リンクユニット58内に前に蓄積されたアド レス成分値を蓄積し続けるために異なる方法を使用する2つの配置を示す。した がってオフセット値を決定するために異なる過程が後続される。I10コードワ ード入力は、英語のアルファベットの“etaonrih=という8つの最も頻 発した文字シンボルによって形成されるシーケンスを表わす。前に蓄積されたリ ンク値およびアドレス成分値は、16,777.216個の異なるEKに対応し たこれら8つの特有の文字シンボルの全ての考え得る8つのシンボル組合せを表 わすと考えられる。主リンクメモリユニット14は、関連したポインタアドレス 値を保持するストリングに加えてL J pqrs値の対応した数を保持する約 17.000.000個のバイト蓄積位置のストリングを含む。現在の境界アド レスB 4 po。 からのオフセットによりこれらストリングのアドレシングの広いアドレス範囲を 都合良くカバーすることが、第6A図を参照して上記に説明されているように用 いられる。両方の配置は異なる過程およびB 4 pooアドレス値に関して同 一のオフセットアドレス値を使用して生成される。 第6B図は、0,1.2および3の番号を付けられた4つのステップを含むテー ブル60内における2進探索の後どのようにL2とL2p9間の整合が得られる かを示す。第2の列から行0乃至9内保持された全てのアドレス成分値が読出さ れ、整数符号が示すようにこれらC2pq値が付加される。相対アドレス値とし て使用される合計はテーブルT3p9を示し、ここにおいて4ステツプ2進探索 の後に現在の値L3と整合する値L3p9Qが発見される。B 4 p9Rに等 しいB 4 p9Q十値はC3poo乃至C3p9QのC3pQr値の合計によ って生成され、合計の中に84 pooを含む。B 4 p9Qは合計からCp 9Qを取除くことによって生成される。境界アドレス値B2+)は第1の2進探 索を開始すべき場所およびC2pq値の合計を開始すべき場所を決定するために 使用された。値B2p+はテーブルT3pNが関連する場合にのみ使用され、T 3pN探索範囲の端部を決定する。第6C図だけでなく第6B[lにも示されて いるように、C2pOおよびC2pA値がそれぞれの現在の探索範囲の端部を決 定するために使用される。 第6C図は、第6B図を参照して上記された2つの合計を避けるために導入され たテーブル60おび62内の16ビツト幅の第2の列を示す。それによってテー ブルT3p9の位置は、テーブルT2pに関するポインタのように値C2p9お よびC2pAの直接的な使用によってずっと素早く発見される。さらに値C3p qPおよびC3p9Qは値B 4 pooに加算されるオフセット値として直接 的に使用され、それによって出力ポインタP p9Q]は最少の遅延で発見され る。第6B図および第6C図から分るように、2進探索技術が不必要な遅延を避 けるためにテーブル64内においても使用される。 第6D図は、コード変換手段の一部分を構成するサブシステムとして使用される ビットマツプメモリ手段を示す。ビットマツプサブシステムは第1のリンクメモ リユニット12内の全ての冗長境界アドレス蓄積位置の除去を容易にする。メモ リユニット12内に表わされた1組のLlp値は序数のコードワードの小さいセ ットに圧縮される。それによって第6A図乃至第6D図に示された実施例に対し て最高であると考えられるLlp値は、前に蓄積されたEK上セツト特性に依存 して65535から実質的に低い値に減少される。第6B図および第6C図を参 照して上記のことを仮定すると、最高のLlp値は1023に減少され、それに よって第1のリンク蓄積要求が係数84だけ減少される。ビットマツプメモリは 256バイトT1テーブル、64バイトTMIテーブル、512バイトT2テー ブル、128 *2バイトTM2テーブルおよび小さい序数7Mテーブル54を 必要とする。 第6D図において、第3A図に示されたものと同一の11個のEKが前に蓄積さ れており、それらの内の1つ、すなわち“etcetera−が現在の入力に使 用されると考えられる。この場合、ビットマツプメモリ要求は、それぞれ24お よび6バイトに減少されたテーブルT2および7M2を除いて同一である。ビッ トマツプメモリシステムの詳細な機能は第3C図に関連して示され説明されてい る。現在のリンク値L1として割当てられた上記に関する序数コードワードの値 はビットマツプサブシステムのEMS出力に等しい。したがってLlは相対ビッ トアドレス05Eαより下のビットアドレスにおけるテーブル60内のマークさ れたビットの数のカウントとして生成され、現在の入力を表わすために第6D図 に示されている。第6D図から、L 1 =M25 +M2o+Mzt=7であ ることが結論づけられる。ビットマツプサブシステムを加えずに、Llは(9* 32*32+24*32+7)第2−19982と等価である。 第6E図は、14個のアルフィツト値を発生する入力シーケンスをコピーする実 施例を示す。余白が制限されているため、可能な付加的リンクユニットは第6E 図に示されていない。 コード変換は、第6D図および第6E図においてそれぞれ第1の入力手段66お よび第2の入力手段68内で実行されるような2つのステップで行われる。第2 の入力手段68内において、序数コードワード値すなわち、ストリング32内で 結合されたときに特有に現在のEK値を表わすEK値を生成するだめのサブシス テムとして2つの並列のEKシステムが使用される。 第7A図および第7B図は、4ビツトニブルコードワードおよび可変長コードワ ードへの各コード変換を使用する入力手段を具備したEKシステムの実施例に関 する。2つの実施例は共にEK接頭辞特性およびEK接尾辞特性のコンパクト表 示を促進するコード変換手段を有する。 第7A図は、第2B図に示されたコード概要にしたがってどのようにEK″et ching−を表わす入力フードワードシーケンスがニブルシーケンス3D15 69F1xに変換されるかを示す。コード変換制御プログラムは調査テーブル7 0内のEK接頭辞特性および調査テーブル72内のEK接尾辞特性のコンパクト コードワード表示の探索を実行する。 アルゴリズムは図面の左下隅に示されている。第1の4つのニブル値3D15X は探索理由として接頭辞テーブルに与えられ、値Eが戻されてコンパクトニブル 値N8を割当てられたニブルの数を示す。E−0の応答は発見された接頭辞が全 くないことを意味し、R8は値0と共に戻される。値tJ−4はR9−1と共に 接尾辞テーブルから戻されて、値N9=1が探索理由の最後の4つの;、プルす なわち接尾辞”ing”を表わす69F1xの全てに代わることを示す。4つの ニブル値3D15xはR4乃至R7に割当てられ、EK入カシ−ケンスを表わす のに必要のない残りの二°プル対はシステム制御コードワード値FDxに割当て られ、無効を表わす。任意の単一の使用されないニブルは位置7に配置されて値 Fxを与えられ、また接頭辞および接尾辞を表わすために使用されるニブルの前 の最後の位置に配置された場合には無効を表わす。FD 値は付加的リンクター ミネータとしても使用される。 第7B図は、EK″etcetera”表わす入力コードワードシーケンスが第 2C図に示されたコード概要にしたがってどのように可変長コードワード表示に 変換されるかを示す。接頭辞および接尾辞は全く発見されないが、しかしながら 8シンボルEKが第1の3つのリンク値によって容易に表わされることができる 。接頭辞および接尾辞を表わすために使用されたニブル位置の前の最後の2ビッ ト位置がIIBで満たされ、2進法の1の任意のシーケンスがこの位置における 無効を表わす。 第8A図、第7A図、第2C図および第10を参照して、圧縮テキストファイル の蓄積および伝送用ファイル処理システムの好ましい実施例の機能が説明されて いる。 第8A図は、可変長コードワードを使用するテキストファイル処理システムの実 施例に関す乞。以下において、このようなファイル処理システムは簡単化のため にFHシステムと呼ばれている。第8A図は、連続テキスト内に現れたときに逐 語的ワードをエンコードおよびデコードするために使用される図表すなわち序数 グラフワードを示す。テキストは、例えばEASCII標準方式によるオクテツ トI10コードワードなどの標準I10コードワードの長いシーケンスの形態で FHシステムに入力される。 間隔セパレータすなわち逐語的ワード間の各サブシーケンスは、FHシステムに より以下においてファイルセグメントと呼ばれるエンティティとして識別される 。例えば引用符、句読点および括弧等の逐語的ワードの初めおよび終わりにおけ る文字および特別の記号の大文字化は、記載された実施例の技術的範囲外の技術 を別に使用するものである。 例えば一般使用ための序数英語テキスト等のFHシステムによって処理される特 定のタイプのテキストファイルにおいて、予測される発生頻度は全ての頻発セグ メントに対して決定されている。80個の最高共通セグメントは、第8A図に示 されているように8ビツトRSSコードワードIOX −5FXに割当てられて いる。発生することの少ない頻発セグメントへの割当て用の1280個の12ビ ツトRSSコードワードおよびほとんど発生しない頻発セグメントへの割当て用 の20480個の16ビツトR8Sコードワードも示されている。 3つのRSSコードワードグループは、それぞれ以下においてセグメント基準手 段として示されている第7A図によるEKシステムの実施例で表わされる。この ようなセグメント基準手段はそれぞれ任意の荷動セグメント入力すなわち前に蓄 積されたEKと等しい入力に応答して、以下においてR5Sコードワードと呼ば れているEKSコードワードを提供する。FHシステムは、有効RSSコードワ ードが生成されるまで予め定められた順序で3つのセグメント基準手段に各ファ イルセグメントを入力する。3つのセグメント基準手段が全てこのような応答を 与えない場合には゛FHシステムは4ビツトRSSコードワードOxを選択する 。それは特定数の連続したコードワードが第2C図に示されたコード概要にした がってエンコードおよびデコードされること、すなわち可変長コードワードがシ ンボル−シンボルベースで任意の活発ファイルセグメントをエンコードおよびデ コードできることを意味する。第8A図に示されているように、直接的に後続す るRSSコードワードOXは後続するコードワードの数を決定する1つ以上の4 ビツトコードワードであり、個々の活発セグメントシンボルを表わす。 全てのFHコードワードは接頭辞なしの特性を有し、蓄積され続けるかもしくは 伝送されるときに任意の長さのストリングに連結されてもよい。セグメント間の 間隔はそれぞれどのような特別の表示も必要としない。デコードは第7A図によ る実施例を使用して実行されるが、しかしながら制御プログラムは第1C図を参 照して記載されているように基本的に逆モードで動作するように設定される。 齢に殖矩ンη6−ちt ’L J +)zj−η帽補正書の翻訳文提出書(特許 法第184条の7第1項)10国際出願番号 PCT/5E87100406 2、発明の名称 データ圧縮用装置 3、特許出願人 住所 スウェーデン国 スメドスイツツベイゲン 6B名称 インベントロニッ ク・データ・システムズ・ニービー国籍 スウェーデン国 4、代理人 住所 東京都千代田区霞が関3丁目7番2号5、補正書の提出年月日 請求の範囲 (1)1組のエンティティキーを蓄積し、個々のエンティティキーコード表示の 連続入力に応答するシステムにおいて、現在のエンティティキー110コードワ ード入力の一部分を2つ以上の連結デジタルワードに変換し、それによって各々 が現在のリンク値およびこのようなI10コードワード入力のこのような一部分 を特許に表わす現在の全体的なリンク値を得る入力手段と、 前に蓄積されたエンティティキーに関連したリンク値およびアドレス成分値を蓄 積保持するメモリ手段と、前記入力手段および前記メモリ手段に接続され、前に 蓄積されたアドレス成分値を発見するために1つ以上の現在のリンク値を使用し て第1のリンクに後続する各リンクに対する現在のアドレス範囲を定めてこのよ うな現在の範囲の境界を決定し、第1のリンク値に後続する各リンクの現在の値 をこのような現在のアドレス範囲内に前から蓄積されていた1つ以上のリンク値 と比較し、(i)第1のリンク値に後続する各リンクに対して現在のリンク値が 前に蓄積されたリンク値と整合する場合には全体的なリンク値整合状態を生成し 、もしくは(11)現在の全体的なリンク値が前に蓄積されたエンティティキー に関連した全体的リンク値の間にあることが分った場合には、全体的なリンク値 非整合状態を生成する制御手段とを具備しているシステム。 (2)読出し/書込みタイプのメ、そり手段によって与えられる前記メモリ手段 内に蓄積位置を有し、それによって前に蓄積されなかったエンティティキー11 0コードワード入力の蓄積を促進し、 前記制御手段は、現在の第1のリンク値が後続リンクアドレス範囲を生成しない 場合には第1のリンクリジェクト信号を発生する手段と、 現在の後続するリンク値が現在のアドレス範囲内における前に蓄積された任意の リンク値と整合しない場合には、後続リンクリジェクト信号を発生する手段と、 第1のリンクリジェクト信号に応答して書込み命令を実行し、少なくとも次のリ ンクのために現在の第1のリンク値に関連した位置において前記メモリ手段内に 新しいアドレス範囲を決定するために重要なアドレス成分値を蓄積し、最後のリ ンク以外の全ての後続リンクのそれぞれに対してこのような新しいアドレス範囲 内に現在の後続リンク値を挿入し、少なくとも次のリンクのために新しいアドレ ス範囲を決定するために重要な各挿入リンク値に関連したアドレス成分値を蓄積 する手段と、 後続リンクリジェクト信号に応答して書込み命令を実行し、現在のリンク値が前 に蓄積されたいずれのリンク値とも整合しないことが分った場合にこのような現 在のアドレス範囲内の位置において前記メモリ手段内にこのような整合しない現 在のリンク値を挿入し、任意の残りの後続リンクの各々のために新しいアドレス 範囲内に最後のリンク以外の現在の後続リンク値を挿入し、少なくとも任意の残 りの後続リンクの次のもののために新しいアドレス範囲を決定するために重要な 各挿入リンク値に関連したアドレス成分値を蓄積する手段と、現在のリンク値を 挿入する前に移動命令を実行し、それによってこのような現在のリンク値および 任意の関連したアドレス成分値の調整を行い、このような移動命令を実行した結 果変化した任意のアドレスに一致するように前に蓄積されたアドレス成分値を調 節する手段とを含む請求項1記載のシステム。 (3)前記制御手段は、全体的リンク値整合状態が生成された場合に、このよう な全体的リンク値に特有に関連されるような前記メモリ手段内に前から蓄積され ていたアドレス成分値を出力する手段を含む請求項1記載のシステム。 (4)前記制御手段は、全体リンク値非整合状態が生成された場合に、(i)現 在の全体リンク値を含み、(ii)2つの前から蓄積されていたエンティティキ ーを表わす隣接した全体リンク値の対によって限定されている間隔に関連して前 から蓄積されていた1つ以上のアドレス成分値を出力する手段を含む請求項1記 載のシステム。 (5)前記入力手段は、コンパクトコードから導圧される1つ以上のコンパクト コードワードをエンティティキー110コードワード入力に置換するコード変換 手段を備え、このようなコンパクトコードは連続するコンパクトコードワード内 における各々の位置に対して同じである必要はなく、前記コード変換手段はコン パクトコードワード表示の全体的リンク値を機能的に連続したメモリセルに一時 的に割当て、このような連続したメモリセルの内容を結合されたデジタルワード に割当て、このような割当てに先立って1つ以上の序数コードワードをこのよう な機能的に連続したメモリセルの1つ以上のセクションの内容と置換することを 除外しない請求項1記載のシステム。 (6)前記入力手段は、エンティティキーI10コードワード入力の一部分のス トリング表示の1つ以上のセクションを置換して表わすために1つの序数コード ワードを生成し、最後の連結デジタルワードの全体値を機能的に連続したメモリ セルに一時的に割当てるために、生成された序数コードワードをこのようなスト リングの1つ以上のセクションと任意の予め定められた順序で結合することによ って形成された連結デジタルワードを置換して表わすために1つ以上のさらに別 の序数コードワードを反復的に生成し、このような最後のデジタルワードは生成 された序数コードワードを任意の残りのストリングのセクションと任意の予め定 められた順序で結合することによって形成され、1つ以上の結合されたデジタル ワードにこのように連続したメモリセルの内容を割当てるコード変換手段を含む 請求項1記載のシステム。 (7)2つ以上の専用リンクが前記エンティティキー110コードワード入力の 任意のものにおいて使用され、このような専用リンクの最後のものが主リンクで あり、前記制御手段は、前に蓄積された主リンク値の全ての相対アドレスを含む 1組内において出力として主リンクシーケンス番号を供給する手段を具備し、こ のようなシーケンス番号は現在の主リンク値に整合する前から蓄積されている主 リンク値が発見される特定の相対アドレスを表わす序数に等しい請求項1記載の システム。 (8)入力手段は、エンティティキー110コードワード入力が定められたリン ク値を得るためにこのようなリンクのために十分な数のデジットを発生しない場 合、エンティティキーI10コーディングに関する限り無効を表わす特定のデジ ットを1つ以上の前記専用リンク内に挿入する手段を含む請求項7記載のシステ ム。 (9)一連の付加的リンクサブシステムが使用され、このようなサブシステムは それぞれエンティティキーシステムとして機能し、第1のこのようなサブシステ ムの入力手段は入力として(1)主リンクシーケン、ス番号出力および(11) 第1の付加的リンク値を使用する内部サブシステムリンク値を生成するコード変 換手段を含み、 任意の後続するサブシステムの入力手段は(1)先行するサブシステムシーケン ス番号出力および(if)次の付加的リンク値を入力として使用する内部サブシ ステムリンク値を生成するコード変換手段を含み、 制御手段は、前記サブシステムシーケンス番号出力を供給するサブシステム出力 手段と、 (1)前に蓄積されたI10コードワード入力が現在のI10コードワード入力 によって発生されたものと同一である蓄積されるべき内部サブシステムリンク値 を生成する場合には、全体的リンク値整合状態を、または(11)全体的リンク 値非整合状態を供給するシステム出力手段とを含む請求項7記載のシステム。 (10) 1つ以上の付加的リンクが1組のエンティティキーの全てのメンバー の明確な表示を容易にするために使用され、メモリ手段は、サブセットの主リン クシーケンス番号のビットマーク表示を蓄積保持するビットマツプメモリ手段を 含み、このようなサブセットの各メンバーは1つ以上の付加的リンク値を発生す る前から蓄積されていたエンティティキーI10コードワード入力を表わす請求 項7記載のシステム。 (11)制御手段は、現在の主リンクシーケンス番号を表わす特有のビット位置 を発見し、前に蓄積されたエンティティキーI10コードワード入力が前記特有 のビット位置でビットマークを発生した場合試験するためにこのような位置のビ ット値を読出し、ビットマークが整合したときに現在のビット位置のアドレスよ りも下または上のビット位置アドレス範囲内のマークされたビット位置のカウン トから序数コードワードを生成し、このような序数コードワード、すなわちゼロ が余分なサブセットの主リンクシーケンス番号のあるメンバーを出力として後続 する付加的リンクサブシステムに提供する前記ビットマツプメモリ手段に接続さ れたビットマツプ制御手段を含む請求項1O記載のシステム。 (12)メモリ手段は、第1の付加的リンク値を蓄積する付加的リンク主メモリ ユニットを含み、 コード変換手段は、どの付加的リンク値シーケンスでも表わすシーケンス番号コ ードワードを供給し、このようなコードワードを前記第1の付加的リンク値と置 換し、任意の長さのこのようなシーケンスの前記付加的リンク主メモリユニット 内における蓄積を容易にする手段を含む請求項7記載のシステム。 (13)前記メモリ手段は、前に蓄積されたリンク値が同一の全体的専用リンク 値を発生する異なる入力を特有に表わすために別の全体的付加リンク値を発生し た場合、このような別の全体的付加リンク値を試験することによって全体的リン ク値整合状態を生成し、 前記制御手段は、全体的リンク値整合状態がこのような試験において生成された 場合に、2部分エンティティキー基準番号と、現在の主リンク値が発見された蓄 積位置の相対アドレスから得られた主部分と、整合した全体的付加リンク値を特 有に識別する付加的部分とを出力する手段を含む請求項7記載のシステム。 (14)前記メモリ手段は、前に蓄積されたリンク値が同一の主リンク位置を保 持する複写された主リンク蓄積位置に別々に関連された別の全体的付加リンク値 を発生した場合、このような別の全体的付加リンク値を試験することによって全 体的リンク値整合状態を生成し、 前記制御手段は、全体的リンク値整合状態がこのような試験において生成された 場合に、整合する別のものに関連した特有の主リンク蓄積位置の相対アドレスか ら得られたエンティティキーシーケンス番号を出力する手段を含む請求項7記載 のシステム。 (15)現在のエンティティキーシーケンス番号のコード表示の入力に応答して エンティティキー110コードワード出力を発生する手段を有し、 前記制御手段は、その現在の相対アドレスは現在のエンティティキーシーケンス 番号に等しい特有の主リンク蓄積位置の現在の絶対アドレスを決定し、このよう な特有の蓄積位置から現在の主リンク値を読出す手段と、現在の絶対アドレスを 含んでいる現在の主リンクアドレス範囲のために前記メモリ手段を探索し、現在 の主リンクアドレス範囲に関連されるような現在の前のリンク値および現在の主 リンク絶対アドレスに関連されるような任意の現在の付加的リンク値を生成する 手段と、 完全に連続した現在のリンク値の全体的リンク値を対応したエンティティキーI 10コードワード出力に再変換する出力手段とを含む請求項1O記載のシステム 。 (16)エンティティキーI10コードワード入力を3つ以上のデジタルワード に変換し、 前記メモリ手段は、現在の第1のリンク値に関連された現在の境界アドレスを供 給する第1のリンクメモリユニットと、前に蓄積された主リンク値を蓄積し続け る主リンクメモリユニットと、 値対を保持する2列関係のテーブルに機能的に配列された多数の蓄積位置を有し 、このような対はそれぞれリンク値および関連したアドレス成分値を含み、1ま たは複数組のテーブル中の値対を調整し、1つの中間リンクに対して1組が対応 し、各テーブルは分離した行中に1または複数組の値対を保持し、現在の第2の リンクテーブルを位置するために1つ以上の現在の第2のリンク境界アドレスを 使用する中間リンクメモリユニットとを含み、 前記制御手段は、このような現在の第2のリンクテーブル内に保持されたリンク 値を現在の第2のリンク値と比較し、前に蓄積された同一の第2のリンク値が発 見された場合には第2のリンク値整合状態を生成し、前に蓄積された第2のリン ク値に関連するように前に蓄積されている全ての第3のリンク値を含む現在の第 3のリンクテーブルを示すアドレス値を計算し、アドレス値は現在の第2のリン クテーブルの位置、または前記第1のリンクメモリユニットから得られる現在の 第3のリンク境界アドレスに関するオフセット値を計算するために現在の第2の リンクテーブルから抽出された関連したアドレス成分値を使用して生成され、こ のような現在の第3のリンクテーブル内に保持されているリンク値を現在の第3 のリンク値と比較し、前に蓄積された同一の第3のリンク値が発見された場合に 第3のリンク値整合状態を生成し、当該リンクが主リンクでない場合には現在の 第4のリンクテーブルを示すアドレス値は前に蓄積された第3のリンク値と関連 される前に蓄積された全て第4のリンク値を含み、アドレス値は現在の第3のリ ンクテーブルから抽出された関連したアドレス成分値を使用して生成され、現在 の第2のリンクテーブルに関連するサブセットの第3のリンクテーブル内の先行 する第3のリンクテーブルからアドレス成分値を抽出する別のものを除外せず、 現在の第3のリンクテーブルの位置、現在の第2のリンクテーブルの位置、また は前記第1のリンクメモリユニットから得られる現在の第4のリンク境界アドレ スに関するオフセット値を計算し、主リンクが到達されるまでリンクづつアナロ グ方式によりこのような機能を反復する手段を含む請求項1記載のシステム。 (17)小活字ケース文字を表わすためにコンパクトコードワードを使用し、ア ルファベット類に低い値から割当てられていることが好ましく、 前記コード変換手段は、大文字をこのように連続して表わすために連続するコン パクトコードワードの端部において制御機能コードワードを含み、このような制 御機能コードワードは別の大文字の配置、特にシーケンスに全て大文字のエンテ ィティキーを表示させる極値に対して全ての小活字ケース文字シーケンスおよび 小さい方が好ましい種々の他の値を支配する場合、1ビット以上を含み最高値を 1つ有することが好ましく、それによってこのようなエンティティキーは全体的 リンク個順で分類されるエンティティキーのシーケンス内に正確に位置される手 段、および/または、連続したコンパクトコードワードの端部にこのような連続 で分離複合語または密着複合語を表示させる制御機能コードワードを含み、この ような制御機能コードワードは正確な間隔またはハイフン位置、特に“a pr iori−のような第1の成分の単一文字でシーケンスに分離複合語を表示させ る極値、および同じコンパクトコードワードの連続で対応したハイフン複合語す なわち°a−priori’を表示させる二のような極値の次の値を支配したと きに密着複合語および別の値を支配した場合に、1ビット以上を含み最高値を1 つ有することが好ましい手段、または、コンパクトコードワードの連続の端部に このような連続で大文字複合語を表示させる制御機能コードワードを含み、さら に制御機能コードワード値の広いスペクトルを使用することによって望ましい分 類順序を保存し、”A PRIORI−のような第1の文字の後で分離した全大 文字複合語を支配するために極値を使用する手段を含む請求項5記載のシステム 。 (18)前記コード変換手段は、コンパクトコード表示を発生する手段を含み、 それによってコンパクトコードワードは頻発するエンティティキー110コード ワードを表わし、エンティティキーI10コードワードの対またはエンティティ キーI10コードワードの大きいグループがより少ないビットから成り、活発エ ンティティキーI10コードワードの場合にはより多いビットから成る請求項5 記載のシステム。 (19)前記コード変換手段は、1つ以上のエンティティキー特性セットのコン パクトコードワード表示を蓄積し続け、このようなセットはそれぞれエンティテ ィキー特性の特有の選択を表わす手段と、 コンパクトコードワードの連続を1つ以上のエンティティキー特性セットのコン パクトコードワード表示と比較し、1つの特定のコンパクトコードワードを特有 のエンティティキー特性のコンパクトコードワード表示と等しいコンパクトコー ドワードのこのような連続の特有の部分を置換し、このような特有のコンパクト コードワードはコンパクトコードワードの更新された連続内の個々のコードワー ド位置に特有であるか、またはコードシフト制御コードワードにより支配されて いるような特有のコンパクトコードから引出される手段とを含む請求項5記載の システム。 (20) 1組のエンティティキーを蓄積し、個々のエンティティキーコード表 示の連続的な入力に応答するシステムにおいて、 現在のエンティティキーI10コードワード入力の一部分を1つ以上のセクショ ンを含む1つのデジタルワードに変換し、それによってこのようなセクションは それぞれ現在のセクション値を獲得し、結合された場合には現在の全体的セクシ ョン値がこのようなI10コードワード入力のこのような部分を特有に表わす入 力手段と、 前に蓄積されたエンティティキーに関連されたセクション値のビットマーク表示 を蓄積し続けるビットマツプメモリ手段と、 前記入力手段および前記メモリ手段に接続され、相対アドレス値のような現在の 第1のセクション値を使用して現在のビット位置を発見し、前に蓄積されたエン ティティキーがとットマークを生成したかどうかを試験するためにこのような位 置のビット値を読出し、ビットマーク整合により現在のビット位置のアドレスよ り下または上のビット位置アドレス範囲内のマークされたビット位置の数のカウ ントからセクション序数コードワードを生成し、使用されていない現在のセクシ ョン値が全く残っていない場合に入力応答を出力し、その他の場合には任意の予 め定められた順序で連結することによってさらに別の相対アドレス値を生成し、 前のセクション序数コードワードを具備した1つ以上の残ったセクションの現在 の内容が生成され、このようなさらに別の相対アドレス値を使用してビットマツ プの一部分に関連された各セクション内においてさらに別の現在のビット位置を 発見し、どの現在のセクション値も使用されないままでありビットマーク整合が 生成される限り、セクションづつ機能を反復する制御手段とを含むシステム。 (21)前記制御手段は、それぞれ連続したビット位置を含む連続したビットマ ツプサブエリアから全体的2進ワード値を読出すことによってマークされたビッ トカウントを生成し、出力としてサブエリアカウントを供給する調査テーブル中 に入来する全体値を使用する手段を有する請求項20記載の装置。 (22)前記メモリ手段は、少なくともビットマツプの1つのセクション関連部 分内に1mのマークされたビットカウントを蓄積し続け、このようなセットの6 数は限定されたアドレス範囲内で得られたカウントを表わし、1つ以上のこのよ うな限定されたアドレス範囲のカウントから生成された合計カウント値を現在の ビット位置に近いビット位置に関連させ、このような合計カウント値から現在の セクション序数コードワードを生成し、近いビット位置と現在のビット位置との 間の間隔に対して生成されたマークされたビットカウントを加算または減算する 手段を有する請求項20記載のシステム。 (23)圧縮されたファイルを蓄積し伝送し、各ファイルが1つ以上のセグメン トを含み、このような任意のセグメントは頻発セグメントまたは活発セグメント のいずれかであり、各セグメントは異なるI10コードから引出されたI10コ ードワード中にエンコードされたシステムに入力され、またはそれから出力され るファイル処理システムにおいて、それぞれ頻発セグメントの特別な選択のシス テム表示を含む1つ以上の基準セグメントデータセットを保持し、異なるRSS コードワードを各基準セグメントに分配し、このような異なるRSSコードワー ドはキーとして頻発セグメントを使用して任意の頻発セグメントに対して検索さ れることができ、逆に任意の頻発セグメントはキーとして異なるRSSコードワ ードを使用して検索されることができるセグメント基準手段と、 1つの異なるRSSコードワードを異なる頻発セグメントを表わすI10コード ワードのそれぞれ異なるシーケンスに置換させ、このような異なるR5Sコード ワードはそれぞれ特有の基準セグメントデータセットから検索され、ファイルコ ードワードとしてファイル処理システムの内側に供給され、ファイルコードワー ドの異なるシーケンスを異なる活発セグメントを表わす170コードワードの各 シーケンスに置換し、このようなファイルコードワードは頻発するI10コード ワード、I10コードワードの対または大きいI10コードワードのグループを 表わすためにより少ないデジットを使用し、少ない発生の場合には多数のデジッ トを使用する異なる可変長タイプのコードから引出されるコーディング手段と、 システム蓄積から検索されるか、または別のシステム位置から伝送されるファイ ルのI10コードワード表示を8カし、それによってI10コードワードをファ イルコードワードと置換するデコーディング手段とを含むファイル処理システム 。 (24)前記コーディング手段は、頻発セグメントを表わすために可変長のR8 Sコードワードを使用し、さらに頻繁に生じる頻発セグメントを表わすためによ り少ないデジットを使用し、あまり発生しない頻発セグメントの場合にはもっと 多くのデジットを使用する手段を含む請求項23記載のファイル処理システム。 (25) 1組のエンティティキーを蓄積し、個々のエンティティキーフード表 示の連続入力に応答する方法において、現在のエンティティキーI10コードワ ード入力の一部分を2つ以上の結合されたデジタルワードに変換し、それによっ てそれぞれが現在のリンク値およびこのようなI10コードワード入力のこのよ うな部分を特有に表わす現在の全体的リンク値を獲得し、 第1のリンクに後続する各リンクに対して現在のアドレス範囲を決定し、このよ うな現在の範囲の境界を決定するために前に蓄積されたアドレス成分値を発見す るために1つ以上の現在のリンク値を使用し、 第1のリンクに後続する各リンクの現在の値をこのような現在のアドレス範囲内 に前に蓄積された1つ以上のリンク値と比較し、 (i)第1のリンクに後続する各リンクに対して現在のリンク値が前に蓄積され たリンク値に整合する場合は全体的リンク値整合状態を生成し、もしくは(11 )現在の全体的リンク値が前に蓄積されたエンティティキーに関連する全体的リ ンク値の間にあることが分った場合には、全体的リンク値非整合状態を生成する ステップを含む方法。 国際調査報告 ”嘲11”ゝ”1A1a11+m@、pCτ、、、三B、、OOムo6

Claims (21)

    【特許請求の範囲】
  1. (1)1組のエンティティキーを蓄積し、個々のエンティティキーコード表示の 連続入力に応答するシステムにおいて、現在のエンティティキー1/Oコードワ ード入力の一部分を2つ以上の連結デジタルワードに変換し、それによって各々 が現在のリンク値およびこのようなI/Oコードワード入力のこのような一部分 を特有に表わす現在の全体的なリンク値を得る入力手段と、 前に蓄積されたエンティティキーに関連したリンク値およびアドレス成分値を蓄 積保持するメモリ手段と、前記入力手段および前記メモリ手段に接続され、前に 蓄積されたアドレス成分値を発見するために1つ以上の現在のリンク値を使用し て第1のリンクに後続する各リンクに対する現在のアドレス範囲を定めてこのよ うな現在の範囲の境界を決定し、第1のリンク値に後続する各リンクの現在の値 をこのような現在のアドレス範囲内に前から蓄積されていた1つ以上のリンク値 と比較し、(i)第1のリンク値に後続する各リンクに対して現在のリンク値が 前に蓄積されたリンク値と整合する場合には全体的なリンク値の整合状態を生成 し、もしくは(ii)現在の全体的なリンク値が前に蓄積されたエンティティキ ーに関連した全体的リンク値の間にあることが分った場合には、全体的なリンク 値の非整合状態を生成する制御手段とを具備しているシステム。
  2. (2)読出し/書込みタイプのメモリ手段によって与えられる前記メモリ手段内 の蓄積位置を有し、それによって前に蓄積されなかったエンティティキー1/O コードワード入力の蓄積を促進し、 前記制御手段は、現在の第1のリンク値が後続リンクアドレス範囲を生成しない 場合には第1のリンクリジェクト信号を発生する手段と、 現在の後続するリンク値が現在のアドレス範囲内における前に蓄積された任意の リンク値と整合しない場合には、後続リンクリジェクト信号を発生する手段と、 第1のリンクリジェクト信号に応答して書込み命令を実行し、少なくとも次のリ ンクのために現在の第1のリンク値に関連した位置において前記メモリ手段内に 新しいアドレス範囲を決定するために重要なアドレス成分値を蓄積し、最後のリ ンク以外の全ての後続リンクのそれぞれに対してこのような新しいアドレス範囲 内に現在の後続リンク値を挿入し、少なくとも次のリンクのために新しいアドレ ス範囲を決定するために重要な各挿入リンク値に関連したアドレス成分値を蓄積 する手段と、 後続リンクリジェクト信号に応答して書込み命令を実行し、現在のリンク値が前 に蓄積されたいずれのリンク値とも整合しないことが分った場合にこのような現 在のアドレス範囲内の位置において前記メモリ手段内にこのような整合しない現 在のリンク値を挿入し、任意の残りの後続リンクの各々のために新しいアドレス 範囲内に最後のリンク以外の現在の後続リンク値を挿入し、少なくとも任意の残 りの後続リンクの次のもののために新しいアドレス範囲を決定するために重要な 各挿入リンク値に関連したアドレス成分値を蓄積する手段と、現在のリンク値を 挿入する前に移動命令を実行し、それによってこのような現在のリンク値および 任意の関連したアドレス成分値の調整を行い、このような移動命令を実行した結 果変化した任意のアドレスに一致するように前に蓄積されたアドレス成分値を調 節する手段とを含む請求項1記載のシステム。
  3. (3)前記制御手段は、全体的リンク値整合状態が生成された場合に、このよう な全体的リンク値に特有に関連されるような前記メモリ手段内に前から蓄積され ているアドレス成分値を出力する手段を含む請求項1記載のシステム。
  4. (4)前記制御手段は、全体リンク値非整合状態が生成された場合に、前から蓄 積されていた土ンティティキーを表わす隣接した全体リンク値の間の現在の全体 リンク値を含む間隔に関連されるような前に蓄積されたアドレス成分値を出力す る手段を含む請求項1記載のシステム。
  5. (5)前記入力手段は、1つ以上のコンパクトコードワードをエンティティキー 1/Oコードワード入力に置換し、各コンパクトコードワードがコンパクトコー ドから導出され、このようなコンパクトコードはコンパクトコードワード表示の 全体的リンク値を機能的に連続したメモリセルに一時的に割当てるために連続す るコンパクトコードワード内における個々の位置のそれぞれに対して同じである 必要はなく、このような連続したメモリセルの内容を結合されたデジタルワード に割当て、このような割当ての前に1つ以上の序数コードワードのこのような機 能的に連続したメモリセルの1以上のセクションの内容と置換することを排除し ないコード変換手段を含む請求項1記載のシステム。
  6. (6)前記入力手段は、エンティティキー1/Oコードワード入力の一部分のス トリング表示の1つ以上のセクションを置換して表わすために1つの序数コード ワードを生成し、最後の連結デジタルワードの全体値を機能的に連続したメモリ セルに一時的に割当てるために、生成された序数コードワードをこのようなスト リングの1つ以上のセクションと任意の予め定められた順序で結合することによ って形成された連結デジタルワードを置換して表わすために1つ以上の別の序数 コードワードを反復的に生成し、このような最後のデジタルワードは生成された 序数コードワードを任意の残りのストリングのセクションと任意の予め定められ た順序で結合することによって形成され、1つ以上の結合されたテジクルワード にこのように連続したメモリセルの内容を割当てるコード変換手段を含む請求項 1記載のシステム。
  7. (7)強制リンクすなわち一定の最少数のリンクが任意の入力に使用され、その 最後のものが主リンクであり、1つ以上の付加的リンクは強制リンク内において 調整され得るよりも多くのデジットを発生するこのような1/Oコードワード入 力を十分に特有的に表わすために必要であり、前記入力手段は、エンティティキ ー1/Oコードワード入力が限定されたリンク値を得るために強制リンクに対し て十分な数のデジットを発生しない場合に、エンティティキー1/Oコーディン グに関する限り無効を表わす特有デジットを1つ以上の強制リンク内に挿入する 手段を含み、前記制御手段は、全体リンク値整合状態が生成される場合には現在 の主リンク値が発見される主リンク蓄積位置の相対アドレスから得られたエンテ ィティキー基準番号を出力する手段を含む請求項1記載のシステム。
  8. (8)強制リンクすなわち一定の最少数リンクは任意の入力に使用され、その最 後のものは主リンクであり、1つ以上の付加的リンクは強制リンク内で調整され 得るよりも多くのデジットを発生するこのようなI/Oコードワード入力を十分 に特有的に表わすために必要であり、 前記メモリ手段は、このような付加的リンクを必要とする前から蓄積されていた I/Oコードワード入力に関連した主リンク基準番号のセットのビットマーク表 示を蓄積し続けるためのビットマップメモリ手段を含む請求項1記載のシステム 。
  9. (9)前記メモリ手段は、前に蓄積されたリンク値が同一の全体的強制リンク値 を発生する異なる入力を特有に表わすために代わりのものを発生した場合に、別 の全体的付加リンク値を検査することによって全体的リンク値整合状態を生成す る手段を含み、 前記制御手段は、全体的リンク値整合状態がこのような検査で生成された場合に 2部分エンティティキー基準番号、現在の主リンク値が発見された蓄積位置の相 対アドレスから得られた主部分、および整合した全体的付加リンク値を特有に識 別する付加的部分を出力する手段を含む請求項7記載のシステム。
  10. (10)前記メモリ手段は、前から蓄積されていたリンク値が同一の現在の主リ ンク値を保持する複写された主リンク蓄積位置に別々に関連された代わりの全体 的付加リンク値を発生した場合に、このような代わりの全体的付加リンク値を検 査することによって全体的リンク値整合状態を生成する手段を含み、 前記制御手段は、全体的リンク値整合状態がこのような検査で生成された場合に 、整合する代わりのものに関連された特有の主リンク蓄積位置の相対アドレスか ら得られたエンティティキーシーケンス番号を出力する手段を含む請求項7記載 のシステム。
  11. (11)現在のエンティティキーシーケンス番号のコード表示の入力に応答して エンティティキー1/Oコードワード出力を発生する手段を有し、 前記制御手段は、現在の相対アドレスが現在のエンティティキーシーケンス番号 に等しい特定の主リンク蓄積位置の現在の絶対アドレスを決定して、このような 特定の蓄積位置から現在の主リンク値を読出す手段と、 現在の絶対アドレスを含んでいる現在の主リンクアドレス範囲を発見するために 前記メモリ手段を探索し、現在の主リンクアドレス範囲に関連されているような 現在の先行リンク値および現在の主リンク絶対アドレスに関連する任意の付加リ ンク値を生成する手段と、 完全に連続した現在のリンク値の全体的リンク値を対応したエンティティキー1 /Oコードワード出力に再変換する出力手段とを含む請求項10記載のシステム 。
  12. (12)エンティティキー1/Oコードワード入力を3つ以上のデジタルワード に変換し、 前記メモリ手段は、現在の第1のリンク値に関連された現在の境界アドレスを設 けるための第1のリンクメモリユニットと、 前に蓄積されたリンク値を蓄積し続けるための主リンクメモリユニットと、 値対を保持するための2列関係のテーブルに機能的に配列された複数の蓄積位置 を有し、このような対がそれぞれリンク値および関連したアドレス成分値を含み 、1つまだは複数のセットのテーブルにおいて値対を調整し、各中間リンクに対 して1組が設けられ、各テーブルはその別々の行中に1つまたは複数の値対を保 持し、現在の第2のリンクテーブルを設けるために1つ以上の現在の第2のリン ク境界アドレスを使用する中間リンクメモリユニットとを含み、前記制御手段は 、このような現在の第2のリンクテーブル内に保持されたリンク値を現在の第2 のリンク値と比較し、前に蓄積された同一の第2のリンク値が発見された場合に 第2のリンク値整合状態を生成し、前に蓄積された第2のリンク値に関連するよ うに前から蓄積されていた全ての第3のリンク値を含む現在の第3のリンクテー ブルを示すアドレス値を計算し、アドレス値は現在の第2のリンクテーブルの位 置に関する、もしくは前記第1のリンクメモリユニットから得られる現在の第3 のリンク境界アドレスに関するオフセット値を計算するために現在の第2のリン クテーブルから抽出された関連したアドレス成分値を使用して生成され、前に蓄 積された同一の第3のリンク値が発見された場合にこのような現在の第3のリン ク値整合状態を生成し、当該リンクが主リンクでない場合はアドレス値が前に蓄 積された第3のリンク値に関連されるように前に蓄積された全ての第4のリンク 値を含む現在の第4のリンクテーブルを示し、アドレス値は現在の第3のリンク テーブルから抽出された関連したアドレス成分値を使用して生成され、現在の第 2のリンクテーブルに関連された第3のリンクテーブルのサブセット内の前の第 3のリンクテーブルからアドレス成分値を抽出する代わりのものを取除かず、前 記第1のリンクメモリユニットから得られる現在の第3のリンクテーブルの位置 、現在の第2のリンクテーブルの位置または現在の第4のリンク境界アドレスに 関するオフセット値を計算し、主リンクが到達するまでアナログ方式でリンクづ つこのような機能を反復する手段を含む請求項1記載のシステム。
  13. (13)小活字ケース文字を表わすためにコンパクトコードワードを使用し、ア ルファベット順に低い値から割当てられていることが好ましく、 前記コード変換手段は、大文字をこのように連続して表わすために連続するコン パクトコードワードの端部において制御機能コードワードを含み、このような制 御機能コードワードは別の大文字の配置、特にシーケンスに全て大文字のエンテ ィティキーを表示させる極値に対して全ての小活字ケース文字シーケンスおよび 小さい方が好ましい種々の他の値を支配する場合、1ビット以上を含み最高値を 1つ有することが好ましく、それによってこのようなエンティティキーは全体的 リンク値順で分類されるエンティティキーのシーケンス内に正確に位置される手 段、および/または、連続したコンパクトコードワードの端部にこのような連続 で分離複合語または密着複合語を表示させる制御機能コードワードを含み、この ような制御機能コードワードは正確な間隔またはハイフン位置、特に“apri ori”のような第1の成分の単一文字でシーケンスに分離複合語を表示させる 極値、および同じコンパクトコードワードの連続に対応したハイフン複合語すな わち“a−priori”を表示させるこのような極値の次の値を支配したとき に密着複合語および別の値を支配した場合に、1ビット以上を含み最高値を1つ 有することが好ましい手段、または、コンパクトコードワードの連続の端部でこ のような連続で大文字複合語を表示させる制御機能コードワードを含み、さらに 制御機能コードワード値の広いスペクトルを使用することによって望ましい分類 順序を保存し、“APRIORI”のような第1の文字の後で分離した全大文字 複合語を支配するために極値を使用する手段を含む請求項5記載のシステム。
  14. (14)前記コード変換手段は、コンパクトコード表示を発生する手段を含み、 それによってコンパクトコードワードは頻発するエンティティキー1/Oコード ワードを表わし、エンティティキー1/Oコードワードの対またはエンティティ キー1/Oコードワードのもっと大きいグループがより少ないビットから成り、 稀発エンティティキー1/Oコードワードの場合にはより多いビットから成る請 求項5記載のシステム。
  15. (15)前記コード変換手段は、1つ以上のエンティティキー特性セットのコン パクトコードワード表示を蓄積し続け、このようなセットはそれぞれエンティテ ィキー特性の特有の選択を表わす手段と、 コンパクトコードワードの連続を1つ以上のエンティティキー特性セットのコン パクトコードワード表示と比較し、1っの特定のコンパクトコードワードを特有 のエンティティキー特性のコンパクトコードワード表示と等しいコンパクトコー ドワードのこのような連続の特有の部分を置換し、このような特有のコンパクト コードワードはコンパクトコードワードの更新された連続内の個々のコードワー ド位置に特有であるか、またはコードシフト制御コードワードにより支配されて いるような特有のコンパクトコードから引出される手段とを含む請求項5記載の システム。
  16. (16)1組のエンティティキーを蓄積し、個々のエンティティキーコード表示 の連続的な入力に応答するシステムにおいて、 現在のエンティティキー1/Oコードワード入力の一部分を1つ以上のセクショ ンを含む1つのデジタルワードに変換し、それによってこのようなセクションは それぞれ現在のセクション値を獲得し、結合された場合には現在の全体的セクシ ョン値がこのようなI/Oコードワード入力のこのような部分を特有に表わす入 力手段と、 前に蓄積されたエンティティキーに関連されたセクション値のビットマーク表示 を蓄積し続けるビットマップメモリ手段と、 前記入力手段および前記メモリ手段に接続され、相対アドレス値のような現在の 第1のセクション値を使用して現在のビット位置を発見し、前に蓄積されたエン ティティキーがビットマークを生成したかどうかを試験するためにこのような位 置のビット値を読出し、ビットマーク整合により現在のビット位置のアドレスよ り下または上のビット位置アドレス範囲内のマークされたビット位置の数のカウ ントからセクション序数コードワードを生成し、使用されていない現在のセクシ ョン値が全く残っていない場合に入力応答を出力し、その他の場合には予め定め られた順序のいずれかで連結することによって次の相対アドレス値を生成し、前 のセクション序数コードワードを具備した1つ以上の残ったセクションの現在の 内容が生成され、このような次の相対アドレス値を使用してビットマップの一部 分に関連された各セクション内において次の現在のピット位置を発見し、どの現 在のセクション値も使用されないままでありビットマーク整合が生成される限り 、セクションづつ機能を反復する制御手段とを含むシステム。
  17. (17)前記制御手段は、連続したビットマップサブエリアから全体の2進ワー ド値を読取ることによってマークされたビットカウントを生成し、それぞれ連続 したビット位置を含み、出力するときにサブエリアカウントを供給する調査テー ブル中に入来するような全体値を使用する手段を含んでいる請求項16記載の装 置。
  18. (18)前記メモリ手段は、少なくともビットマップの1つのセクション関連部 分内に1組のマークされたビットカウントを蓄積し続け、このようなセットの各 数は限定されたアドレス範囲内で得られたカウントを表わし、1つ以上のこのよ うな限定されたアドレス範囲のカウントから生成された合計カウント値を現在の ビット位置に近いビット位置に関連させ、このような合計カウント値から現在の セクション序数を生成し、近いビット位置と現在のものとの間の間隔に対して生 成されたマークされたビットカウントを加算または減算する請求項16記載のシ ステム。
  19. (19)圧縮されたファイルを蓄積し伝送し、各ファイルが1つ以上のセグメン トを含み、このような任意のセグメントは頻発セグメントまたは稀発セグメント のいずれかであり、各セグメントは異なるI/Oコードから引出されたI/Oコ ードワード中にエンコードされたシステムに入力またはそれから出力されるファ イル処理システムにおいて、頻発セグメントの特別な選択のシステム表示を含む 1つ以上の基準セグメントデータセットを保持し、異なるRSSコードワードを 各基準セグメントに分配し、このような異なるRSSコードワードはキーとして 頻発セグメントを使用して任意の頻発セグメントに対して検索されることができ 、逆に頻発セグメントはキーとして異なるRSSコードワードを使用して検索さ れることができるセグメント基準手段と、1つの異なるRSSコードワードを異 なる頻発セグメントを表わすI/Oコードワードのそれぞれ異なるシーケンスに 置換させ、このような異なるRSSコードワードはそれぞれ特有の基準セグメン トデータセットから検索され、ファイルコードワードとしてファイル処理システ ムの内側に供給され、ファイルコードワードの異なるシーケンスを異なる稀発セ グメントを表わすI/Oコードワードの各シーケンスに置換し、このようなファ イルコードワードは頻発するI/Oコードワード、I/Oコードワードの対また は大きいI/Oコードワードのグループを表わすためにより少ないデジットを使 用し、少ない発生の場合には多数のデジットを使用する異なる可変長タイプのコ ードから引出されるコーディング手段と、システム蓄積から検索されるか、また は別のシステム位置から伝送されるファイルのI/Oコードワード表示を出力し 、それによってI/Oコードワードをファイルコードワードの代わりにするデコ ーディング手段とを含むファイル処理システム。
  20. (20)前記コーディング手段は、頻発セグメントを表わすために可変長のRS Sコードワードを使用し、さらに頻繁に生じる頻発セグメントを表わすためによ り少ないデジットを使用し、あまり発生しない頻発セグメントの場合には多数の デジットを使用する手段を含む請求項19記載のファイル処理システム。
  21. (21)1組のエンティティキーを蓄積し、個々のエンティティキーコード表示 の連続入力に応答する方法において、現在のエンティティキー1/Oコードワー ド入力の一部分を2つ以上の結合されたデジタルワードに変換し、それによって それぞれが現在のリンク値およびこのようなI/Oコードワード入力のこのよう な部分を特有に表わす現在の全体的リンク値を獲得し、 第1のリンクに後続する各リンクに対して現在のアドレス範囲を決定し、このよ うな現在の範囲の境界を定めるように前に蓄積されたアドレス成分値を発見する ために1つ以上の現在のリンク値を使用し、 第1のリンクに後続する各リンクの現在の値をこのような現在のアドレス範囲内 に前に蓄積された1つ以上のリンク値と比較し、 (i)第1のリンクに後続する各リンクに対して現在のリンク値が前に蓄積され たリンク値に整合する場合は全体的リンク値整合状態を生成し、もしくは(ii )現在の全体的リンク値が前に蓄積されたエンティティキーに関連された全体的 リンク値の間にあることが分った場合には、全体的リンク値非整合状態を生成す るステップを含む方法。
JP50539387A 1986-09-09 1987-09-09 データ圧縮用装置 Pending JPH02500693A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US06/905,237 US4782325A (en) 1983-12-30 1986-09-09 Arrangement for data compression
US905,237 1986-09-09

Publications (1)

Publication Number Publication Date
JPH02500693A true JPH02500693A (ja) 1990-03-08

Family

ID=25420474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50539387A Pending JPH02500693A (ja) 1986-09-09 1987-09-09 データ圧縮用装置

Country Status (4)

Country Link
EP (1) EP0326560A1 (ja)
JP (1) JPH02500693A (ja)
AU (1) AU7915387A (ja)
WO (1) WO1988002144A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU624205B2 (en) * 1989-01-23 1992-06-04 General Electric Capital Corporation Variable length string matcher

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3821711A (en) * 1972-12-26 1974-06-28 Ibm Self adaptive compression and expansion apparatus for changing the length of digital information
FR2491703B1 (fr) * 1980-10-03 1988-04-29 Thomson Csf Dispositif de compression et dispositif de decompression temporelle de donnees et systeme de transmission comportant au moins l'un de ces dispositifs
US4560976A (en) * 1981-10-15 1985-12-24 Codex Corporation Data compression
US4491934A (en) * 1982-05-12 1985-01-01 Heinz Karl E Data compression process
US4558302A (en) * 1983-06-20 1985-12-10 Sperry Corporation High speed data compression and decompression apparatus and method
JPH0828053B2 (ja) * 1983-08-08 1996-03-21 株式会社日立製作所 データ記録方法
US4612532A (en) * 1984-06-19 1986-09-16 Telebyte Corportion Data compression apparatus and method
GB2172127B (en) * 1985-03-06 1988-10-12 Ferranti Plc Data compression system

Also Published As

Publication number Publication date
EP0326560A1 (en) 1989-08-09
AU7915387A (en) 1988-04-07
WO1988002144A1 (en) 1988-03-24

Similar Documents

Publication Publication Date Title
US4782325A (en) Arrangement for data compression
US5721899A (en) Retrieval apparatus using compressed trie node and retrieval method thereof
US20080222148A1 (en) Lexicographical ordering of real numbers
US4955066A (en) Compressing and decompressing text files
US7185018B2 (en) Method of storing and retrieving miniaturized data
US7877364B2 (en) Method of storing and retrieving miniaturised data
WO1985001814A1 (en) Method and apparatus for data compression
De Jonge et al. Two access methods using compact binary trees
JPS59231683A (ja) データ圧縮方法
US5225833A (en) Character encoding
US8463759B2 (en) Method and system for compressing data
JPH02500693A (ja) データ圧縮用装置
JP3199292B2 (ja) ハフマン符号の符号化でのランレングス抽出方法、ハフマン符号変換方法およびmh符号化処理方法
Fraenkel et al. Combinatorial compression and partitioning of large dictionaries
JPH0227423A (ja) 日本語文字データの並び換え方法
JPH03270417A (ja) データ圧縮方法および圧縮データのデータ復元方法
JPH04265020A (ja) データ圧縮方式
CN113934690A (zh) 日志存储方法、系统、存储介质及电子设备
JPH06251070A (ja) 単語検索のための電子辞書圧縮方法及び装置
JPH09232967A (ja) データ圧縮装置及び復元装置
JP3722231B2 (ja) コンパクトにエンコードされて記憶されたストリングの組を有する製品
JPH04123619A (ja) データ圧縮及び復元装置
JP2690175B2 (ja) 不等長符号復号回路
JPH03282961A (ja) 相互変換辞書方式
JP3236747B2 (ja) データ伸長方式