JP2000148553A - 情報処理装置 - Google Patents
情報処理装置Info
- Publication number
- JP2000148553A JP2000148553A JP10316389A JP31638998A JP2000148553A JP 2000148553 A JP2000148553 A JP 2000148553A JP 10316389 A JP10316389 A JP 10316389A JP 31638998 A JP31638998 A JP 31638998A JP 2000148553 A JP2000148553 A JP 2000148553A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- code
- character string
- significant character
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 本来の意味と異なる符号に置き換えられた内
容を含むファイルを出力する情報処理装置において、出
力結果をユーザに理解しやすくする。 【解決手段】 意味を表す有意文字列とそれを置き換え
た置換符号との対応関係を表す意味付け辞書22を備え
る。データ変換手段20は、比較手段6の出力中の置換
符号の位置を意味付け辞書22から認識し、その位置の
バイナリデータをキーにして意味付け辞書22を検索
し、対応する有意文字列を取得する。データ変換手段2
0からの出力においては、置換符号は有意文字列に書き
換えられ、結果編集出力手段8へ渡される。結果編集出
力手段8は出力形式指定情報ファイル28に基づいて、
出力結果の形式を編集し、出力装置10からユーザへ出
力を提供する。
容を含むファイルを出力する情報処理装置において、出
力結果をユーザに理解しやすくする。 【解決手段】 意味を表す有意文字列とそれを置き換え
た置換符号との対応関係を表す意味付け辞書22を備え
る。データ変換手段20は、比較手段6の出力中の置換
符号の位置を意味付け辞書22から認識し、その位置の
バイナリデータをキーにして意味付け辞書22を検索
し、対応する有意文字列を取得する。データ変換手段2
0からの出力においては、置換符号は有意文字列に書き
換えられ、結果編集出力手段8へ渡される。結果編集出
力手段8は出力形式指定情報ファイル28に基づいて、
出力結果の形式を編集し、出力装置10からユーザへ出
力を提供する。
Description
【0001】
【発明の属する技術分野】本発明は、意味を有する文字
列を他の符号に置き換えて格納されたファイルの内容を
出力する情報処理装置に関し、特にコンピュータシステ
ムにおいて用いられるバイナリデータで記録されたファ
イルの出力に関する。
列を他の符号に置き換えて格納されたファイルの内容を
出力する情報処理装置に関し、特にコンピュータシステ
ムにおいて用いられるバイナリデータで記録されたファ
イルの出力に関する。
【0002】
【従来の技術】コンピュータシステムにおいては、ファ
イル容量を抑制してメモリや補助記憶装置を有効利用を
図るために、ファイルに格納されるデータ内容をよりデ
ータ量の少ないものに置き換えることが行われる。つま
り、1又は複数の文字から構成され、ある意味を表す文
字列(有意文字列)をそのままバイナリデータに変換し
てファイルに格納するのではなく、識別番号などの符号
を表すバイナリデータに置き換えたり、その他、複数の
有意文字列を互いに区別することができるようにビット
パターンが定められたバイナリデータ形式の符号に置き
換えることが行われる。このような符号(置換符号)
は、複数の有意文字列を互いに区別することができれば
よいので、そのデータ長は元の有意文字列の長さ(すな
わちデータ長)には直接には依存せず、有意文字列の種
類に依存する。多くの場合、ファイルの特定のデータ項
目に使用される文字列の種類は限られるので、このよう
な置き換えによってデータ量を抑制することができる。
イル容量を抑制してメモリや補助記憶装置を有効利用を
図るために、ファイルに格納されるデータ内容をよりデ
ータ量の少ないものに置き換えることが行われる。つま
り、1又は複数の文字から構成され、ある意味を表す文
字列(有意文字列)をそのままバイナリデータに変換し
てファイルに格納するのではなく、識別番号などの符号
を表すバイナリデータに置き換えたり、その他、複数の
有意文字列を互いに区別することができるようにビット
パターンが定められたバイナリデータ形式の符号に置き
換えることが行われる。このような符号(置換符号)
は、複数の有意文字列を互いに区別することができれば
よいので、そのデータ長は元の有意文字列の長さ(すな
わちデータ長)には直接には依存せず、有意文字列の種
類に依存する。多くの場合、ファイルの特定のデータ項
目に使用される文字列の種類は限られるので、このよう
な置き換えによってデータ量を抑制することができる。
【0003】従来の情報処理装置の例として、図8に、
特開平5−225009号公報に開示されたファイル比
較装置の概略のブロック構成図を示す。この装置は、2
つのバイナリデータファイル2,4が、比較手段6にお
いて突き合わされる。バイナリデータファイル2,4
は、上述のように必要に応じて有意文字列を置換符号に
置き換えたデータ項目を含む。結果編集出力手段8は比
較結果を編集したデータを生成する。そして生成された
データが出力装置10から出力される。データ項目情報
ファイル12は、比較対象のファイル2,4に格納され
るデータ項目の属性等を格納したファイルである。また
出力形式指定情報ファイル14は、ユーザの指定した比
較結果出力形式を格納したファイルである。
特開平5−225009号公報に開示されたファイル比
較装置の概略のブロック構成図を示す。この装置は、2
つのバイナリデータファイル2,4が、比較手段6にお
いて突き合わされる。バイナリデータファイル2,4
は、上述のように必要に応じて有意文字列を置換符号に
置き換えたデータ項目を含む。結果編集出力手段8は比
較結果を編集したデータを生成する。そして生成された
データが出力装置10から出力される。データ項目情報
ファイル12は、比較対象のファイル2,4に格納され
るデータ項目の属性等を格納したファイルである。また
出力形式指定情報ファイル14は、ユーザの指定した比
較結果出力形式を格納したファイルである。
【0004】次に上記従来装置の動作を説明する。比較
手段6は、データ項目情報ファイル12に格納されてい
るデータ項目の属性、項目長、項目名等を参照して、バ
イナリデータファイル2,4それぞれから互いに対応す
るデータ項目を取り出し、当該項目単位で両ファイルの
データを比較する。比較結果は結果編集出力手段8へ渡
される。結果編集出力手段8は、例えば、項目名を見出
しとして出力し、さらに変更のあった項目が分かるよう
に、変更があった項目のみデータを出力するといった項
目編集を行う。その際、結果編集出力手段8は出力形式
指定情報ファイル14を参照し、例えば、出力文字形
式、出力位置等について、ユーザが指定した形式に応じ
た編集を行う。
手段6は、データ項目情報ファイル12に格納されてい
るデータ項目の属性、項目長、項目名等を参照して、バ
イナリデータファイル2,4それぞれから互いに対応す
るデータ項目を取り出し、当該項目単位で両ファイルの
データを比較する。比較結果は結果編集出力手段8へ渡
される。結果編集出力手段8は、例えば、項目名を見出
しとして出力し、さらに変更のあった項目が分かるよう
に、変更があった項目のみデータを出力するといった項
目編集を行う。その際、結果編集出力手段8は出力形式
指定情報ファイル14を参照し、例えば、出力文字形
式、出力位置等について、ユーザが指定した形式に応じ
た編集を行う。
【0005】
【発明が解決しようとする課題】上述の従来のファイル
比較装置は、比較結果として元のバイナリデータファイ
ル2,4に含まれる内容を出力するが、その際、データ
項目の属性、項目長、項目名等は比較処理時に参照され
るにとどまり、比較結果の出力に関しては、出力形式は
整えられるが、出力されるデータは元のバイナリデータ
ファイル2,4に格納されていたそのままのデータであ
った。つまり、出力される項目が符号に置き換えられた
ものである場合、出力されるデータはその置き換えられ
た符号であり、ユーザはその置換符号から元の有意文字
列を認識するのに労力を要する、つまり一目見て出力結
果を理解することが容易でないという問題があった。
比較装置は、比較結果として元のバイナリデータファイ
ル2,4に含まれる内容を出力するが、その際、データ
項目の属性、項目長、項目名等は比較処理時に参照され
るにとどまり、比較結果の出力に関しては、出力形式は
整えられるが、出力されるデータは元のバイナリデータ
ファイル2,4に格納されていたそのままのデータであ
った。つまり、出力される項目が符号に置き換えられた
ものである場合、出力されるデータはその置き換えられ
た符号であり、ユーザはその置換符号から元の有意文字
列を認識するのに労力を要する、つまり一目見て出力結
果を理解することが容易でないという問題があった。
【0006】本発明は、上記問題点を解決し、有意文字
列から符号に置き換えられたデータを含むファイルの内
容を出力する際に、出力されるデータの意味を迅速・容
易に理解することができる出力方式を有した情報処理装
置を提供することを目的とする。
列から符号に置き換えられたデータを含むファイルの内
容を出力する際に、出力されるデータの意味を迅速・容
易に理解することができる出力方式を有した情報処理装
置を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明に係る情報処理装
置は、有意文字列と置換符号との対応関係を表す意味付
け辞書と、前記意味付け辞書を検索し、表示対象のファ
イル中に現れる前記置換符号を前記有意文字列に変換す
るデータ変換手段とを有し、前記有意文字列を用いて前
記ファイル内容を出力することを特徴とする。
置は、有意文字列と置換符号との対応関係を表す意味付
け辞書と、前記意味付け辞書を検索し、表示対象のファ
イル中に現れる前記置換符号を前記有意文字列に変換す
るデータ変換手段とを有し、前記有意文字列を用いて前
記ファイル内容を出力することを特徴とする。
【0008】本発明に係る他の情報処理装置において
は、前記意味付け辞書は、1又は複数バイトのビット列
で表されるビットパタンが1つの有意文字列に対応付け
られる前記置換符号であるバイト単位符号と、1又は複
数バイトのビット列で表され当該ビット列の各ビットの
状態がそれぞれ有意文字列に対応付けられる前記置換符
号であるビット単位符号とを区別する符号種別情報を有
することを特徴とする。
は、前記意味付け辞書は、1又は複数バイトのビット列
で表されるビットパタンが1つの有意文字列に対応付け
られる前記置換符号であるバイト単位符号と、1又は複
数バイトのビット列で表され当該ビット列の各ビットの
状態がそれぞれ有意文字列に対応付けられる前記置換符
号であるビット単位符号とを区別する符号種別情報を有
することを特徴とする。
【0009】さらに本発明に係る他の情報処理装置にお
いては、表示対象となる前記ファイルに応じて、前記検
索に用いる前記意味付け辞書を変更する辞書変更手段を
有することを特徴とする。
いては、表示対象となる前記ファイルに応じて、前記検
索に用いる前記意味付け辞書を変更する辞書変更手段を
有することを特徴とする。
【0010】また本発明に係る他の情報処理装置は、前
記有意文字列と前記置換符号との対応関係を前記意味付
け辞書に登録する辞書登録手段を有することを特徴とす
る。
記有意文字列と前記置換符号との対応関係を前記意味付
け辞書に登録する辞書登録手段を有することを特徴とす
る。
【0011】さらに本発明に係る他の情報処理装置にお
いては、前記辞書登録手段が、前記ファイルの内容を前
記データ変換手段を介さずに画面上にダンプ表示するダ
ンプ手段と、前記ダンプ表示上でユーザが登録対象とす
る前記置換符号に対応する範囲を指定することを可能と
する置換符号指定手段と、前記置換符号指定手段により
指定された前記置換符号に対応付ける前記有意文字列を
ユーザに入力させる意味入力手段とを有することを特徴
とする。
いては、前記辞書登録手段が、前記ファイルの内容を前
記データ変換手段を介さずに画面上にダンプ表示するダ
ンプ手段と、前記ダンプ表示上でユーザが登録対象とす
る前記置換符号に対応する範囲を指定することを可能と
する置換符号指定手段と、前記置換符号指定手段により
指定された前記置換符号に対応付ける前記有意文字列を
ユーザに入力させる意味入力手段とを有することを特徴
とする。
【0012】
【発明の実施の形態】次に、本発明の実施形態について
図面を参照して説明する。
図面を参照して説明する。
【0013】[実施の形態1]図1は、本発明の第1の
実施の形態であるファイル比較装置の概略のブロック構
成図である。この図において、発明の理解を容易とする
ため上記従来装置と同様の構成要素には同一の符号を付
している。2つのバイナリデータファイル2,4は比較
対象となるファイルである。バイナリデータファイル
2,4は、後に具体例を示すように有意文字列を符号に
置き換えたデータ項目を含む。比較手段6は、対象ファ
イルをバイト単位で突き合わせ、データ値を比較する手
段である。データ変換手段20は、比較結果に現れる置
換符号をそれに対応する有意文字列に変換する手段であ
る。
実施の形態であるファイル比較装置の概略のブロック構
成図である。この図において、発明の理解を容易とする
ため上記従来装置と同様の構成要素には同一の符号を付
している。2つのバイナリデータファイル2,4は比較
対象となるファイルである。バイナリデータファイル
2,4は、後に具体例を示すように有意文字列を符号に
置き換えたデータ項目を含む。比較手段6は、対象ファ
イルをバイト単位で突き合わせ、データ値を比較する手
段である。データ変換手段20は、比較結果に現れる置
換符号をそれに対応する有意文字列に変換する手段であ
る。
【0014】意味付け辞書22は、有意文字列と置換符
号との対応関係を表すものである。また、意味付け辞書
22はバイナリデータファイル2,4中の各データ項目
の位置情報を有する。すなわち、意味付け辞書22は置
き換えられた符号に対応するバイナリデータが、例えば
ファイルの先頭などの基準位置から数えて何バイト目か
ら始まり、どこで終了するかの情報を有する。データ項
目がどこで終了するかの情報は、ファイルの基準位置か
ら数えたバイト数で指定することもできるし、各データ
項目のバイト長により各データ項目の開始位置からの相
対位置として指定することもできる。
号との対応関係を表すものである。また、意味付け辞書
22はバイナリデータファイル2,4中の各データ項目
の位置情報を有する。すなわち、意味付け辞書22は置
き換えられた符号に対応するバイナリデータが、例えば
ファイルの先頭などの基準位置から数えて何バイト目か
ら始まり、どこで終了するかの情報を有する。データ項
目がどこで終了するかの情報は、ファイルの基準位置か
ら数えたバイト数で指定することもできるし、各データ
項目のバイト長により各データ項目の開始位置からの相
対位置として指定することもできる。
【0015】本装置では、置換符号を以下に説明するバ
イト単位符号とビット単位符号との2種類に区別してお
り、意味付け辞書22はその種類を区別する符号種別情
報も有している。置換符号は装置内ではバイナリデー
タ、すなわちビット列で表現される。本装置では、1つ
の置換符号は1又は複数バイト長を有している。上記バ
イト単位符号は、この1つの置換符号に対応するビット
列で表されるビットパタンが1つの有意文字列に対応付
けられるものである。つまり、一般には異なるビットパ
タンにはそれぞれ異なる有意文字列が対応付けられるも
のであり、置換符号と有意文字列とは一対一対応の関係
にある。一方、ビット単位符号は、1つの置換符号に対
応するビット列の各ビットの状態がそれぞれ別個の有意
文字列に対応付けられるものである。例えば、1バイト
のビット単位符号において、最上位ビット(MSB)が
“1”である場合には、このビット単位符号には有意文
字列「ユーザ指定」が対応し、最下位ビット(LSB)
が“1”である場合には、このビット単位符号には有意
文字列「デバッグ」が対応する。既に述べたように1つ
のビット単位符号の中の各ビットはそれぞれが「意味」
に対応付けられ、バイナリ形式“10000000”と
いうビット単位符号は「ユーザ指定」という意味に、ま
たバイナリ形式“00000001”というビット単位
符号は「デバッグ」という意味に、またバイナリ形式
“10000001”というビット単位符号は「ユーザ
指定」と「デバッグ」との両方の意味にそれぞれ対応す
る。つまり、一般に、置換符号と有意文字列とは一対多
対応の関係にある。
イト単位符号とビット単位符号との2種類に区別してお
り、意味付け辞書22はその種類を区別する符号種別情
報も有している。置換符号は装置内ではバイナリデー
タ、すなわちビット列で表現される。本装置では、1つ
の置換符号は1又は複数バイト長を有している。上記バ
イト単位符号は、この1つの置換符号に対応するビット
列で表されるビットパタンが1つの有意文字列に対応付
けられるものである。つまり、一般には異なるビットパ
タンにはそれぞれ異なる有意文字列が対応付けられるも
のであり、置換符号と有意文字列とは一対一対応の関係
にある。一方、ビット単位符号は、1つの置換符号に対
応するビット列の各ビットの状態がそれぞれ別個の有意
文字列に対応付けられるものである。例えば、1バイト
のビット単位符号において、最上位ビット(MSB)が
“1”である場合には、このビット単位符号には有意文
字列「ユーザ指定」が対応し、最下位ビット(LSB)
が“1”である場合には、このビット単位符号には有意
文字列「デバッグ」が対応する。既に述べたように1つ
のビット単位符号の中の各ビットはそれぞれが「意味」
に対応付けられ、バイナリ形式“10000000”と
いうビット単位符号は「ユーザ指定」という意味に、ま
たバイナリ形式“00000001”というビット単位
符号は「デバッグ」という意味に、またバイナリ形式
“10000001”というビット単位符号は「ユーザ
指定」と「デバッグ」との両方の意味にそれぞれ対応す
る。つまり、一般に、置換符号と有意文字列とは一対多
対応の関係にある。
【0016】意味付け辞書指定手段24は、バイナリデ
ータファイル2,4のデータ構造等に応じて、処理に使
用する意味付け辞書22を指定、変更する辞書変更手段
である。意味付け辞書指定手段24は、ユーザからの辞
書名の入力に応じて使用辞書を切り換えるように構成す
ることができるし、また、バイナリデータファイル2,
4のファイル識別子や、例えばファイル先頭に記録され
るファイル属性を自動的に認識して、切り換えるように
構成することもできる。
ータファイル2,4のデータ構造等に応じて、処理に使
用する意味付け辞書22を指定、変更する辞書変更手段
である。意味付け辞書指定手段24は、ユーザからの辞
書名の入力に応じて使用辞書を切り換えるように構成す
ることができるし、また、バイナリデータファイル2,
4のファイル識別子や、例えばファイル先頭に記録され
るファイル属性を自動的に認識して、切り換えるように
構成することもできる。
【0017】結果編集出力手段8は、データ変換手段2
0から出力される比較結果を編集したデータを生成す
る。そして生成されたデータが出力装置10から出力さ
れる。出力形式指定情報ファイル28は、ユーザの指定
した比較結果出力形式を格納したファイルであり、当該
ファイルは、出力データ中のデータ項目の情報も有して
いる。
0から出力される比較結果を編集したデータを生成す
る。そして生成されたデータが出力装置10から出力さ
れる。出力形式指定情報ファイル28は、ユーザの指定
した比較結果出力形式を格納したファイルであり、当該
ファイルは、出力データ中のデータ項目の情報も有して
いる。
【0018】図2は、意味付け辞書22の構造を説明す
るための模式図である。この辞書は、大きくは、辞書イ
ンデックス部40と辞書レコード部42とから構成され
ている。辞書インデックス部40は、有意文字列と置換
符号との対応関係毎に定義されるインデックスレコード
44の集合である。
るための模式図である。この辞書は、大きくは、辞書イ
ンデックス部40と辞書レコード部42とから構成され
ている。辞書インデックス部40は、有意文字列と置換
符号との対応関係毎に定義されるインデックスレコード
44の集合である。
【0019】各インデックスレコード44は、比較対象
ファイル中における置換符号の先頭位置情報44a、置
換符号がバイト単位符号であるかビット単位符号である
かを表す符号種別情報44b、辞書レコード部42中の
対応するブロックの先頭アドレスを指し示すポインタ4
4c、当該ブロックに格納される辞書レコードの数(辞
書レコード数44d)を含んで構成される。
ファイル中における置換符号の先頭位置情報44a、置
換符号がバイト単位符号であるかビット単位符号である
かを表す符号種別情報44b、辞書レコード部42中の
対応するブロックの先頭アドレスを指し示すポインタ4
4c、当該ブロックに格納される辞書レコードの数(辞
書レコード数44d)を含んで構成される。
【0020】辞書レコード部42は、それぞれインデッ
クスレコード44毎に対応して設けられるブロックの集
合である。各ブロックは、符号への置換が行われるデー
タ項目毎に設けられ、ポインタ44cで指定されるアド
レスから始まり、1又は複数の辞書レコード50で構成
される。
クスレコード44毎に対応して設けられるブロックの集
合である。各ブロックは、符号への置換が行われるデー
タ項目毎に設けられ、ポインタ44cで指定されるアド
レスから始まり、1又は複数の辞書レコード50で構成
される。
【0021】辞書レコード50は、バイト単位符号に関
しては符号を表すデータの先頭1バイト目の値を見出し
にして、その値ごとに設けられる。よって、同一の見出
しに対応する複数の置換符号が存在する場合がある。各
辞書レコード50は、上記見出し50a、当該見出しに
対応する置換符号の数50b、置換符号のバイト長50
cを含み、さらに辞書レコード50にはそれらフィール
ド50a〜50cに続いて、当該見出しに対応する置換
符号ごとのサブレコード52がフィールド50bで指定
される数だけ繰り返される。置換符号の数50b、バイ
ト長50cはそれぞれ所定バイト数の数値データであ
る。ビット単位符号に関しても辞書レコード50の構造
は同様である。しかし、ビット単位符号においてはその
特質上、先頭1バイト目の値を見出しとして複数辞書レ
コード50に分けることは検索処理に役立たないので、
1つのビット単位符号は1つの辞書レコード50にまと
め、フィールド50aは処理に使用しない。よってビッ
ト単位符号ではフィールド50aの値は意味を有さな
い。
しては符号を表すデータの先頭1バイト目の値を見出し
にして、その値ごとに設けられる。よって、同一の見出
しに対応する複数の置換符号が存在する場合がある。各
辞書レコード50は、上記見出し50a、当該見出しに
対応する置換符号の数50b、置換符号のバイト長50
cを含み、さらに辞書レコード50にはそれらフィール
ド50a〜50cに続いて、当該見出しに対応する置換
符号ごとのサブレコード52がフィールド50bで指定
される数だけ繰り返される。置換符号の数50b、バイ
ト長50cはそれぞれ所定バイト数の数値データであ
る。ビット単位符号に関しても辞書レコード50の構造
は同様である。しかし、ビット単位符号においてはその
特質上、先頭1バイト目の値を見出しとして複数辞書レ
コード50に分けることは検索処理に役立たないので、
1つのビット単位符号は1つの辞書レコード50にまと
め、フィールド50aは処理に使用しない。よってビッ
ト単位符号ではフィールド50aの値は意味を有さな
い。
【0022】サブレコード52はそれぞれ置換符号の値
52a、当該置換符号に対応する有意文字列の長さ52
b、及びその有意文字列52cで構成される。ちなみ
に、置換符号の値52aは、フィールド50cで指定さ
れたバイト長分の領域に格納される。また有意文字列の
長さ52bは所定バイト数の数値データである。
52a、当該置換符号に対応する有意文字列の長さ52
b、及びその有意文字列52cで構成される。ちなみ
に、置換符号の値52aは、フィールド50cで指定さ
れたバイト長分の領域に格納される。また有意文字列の
長さ52bは所定バイト数の数値データである。
【0023】次に動作について説明する。ファイル比較
装置は、磁気ディスク等に格納されているバイナリデー
タファイル2,4をそれぞれ全部又は必要に応じたデー
タ量だけ順次、メモリに読み込む。比較手段6は、メモ
リ上に読み込まれた両ファイル2,4をバイト単位で先
頭から比較する。例えば、この比較はファイルの終了ま
で繰り返される。比較手段6は比較結果情報を作成し、
それをデータ変換手段20へ渡す。ここで比較手段6は
例えば比較結果情報を格納したファイルを作成して、当
該ファイル単位でデータ変換手段20への結果出力を行
うことができる。この比較結果情報は、例えば、それぞ
れのファイルのデータ項目の1バイト毎の値とその一致
・不一致の情報とを含んだ比較結果レコードが比較順序
に応じて並んだものである。データ項目値には、各ファ
イルのデータ値がそれぞれそのまま転記され出力され、
よって、符号への置き換えが行われているデータ項目に
ついては、置換符号がそのまま出力される。
装置は、磁気ディスク等に格納されているバイナリデー
タファイル2,4をそれぞれ全部又は必要に応じたデー
タ量だけ順次、メモリに読み込む。比較手段6は、メモ
リ上に読み込まれた両ファイル2,4をバイト単位で先
頭から比較する。例えば、この比較はファイルの終了ま
で繰り返される。比較手段6は比較結果情報を作成し、
それをデータ変換手段20へ渡す。ここで比較手段6は
例えば比較結果情報を格納したファイルを作成して、当
該ファイル単位でデータ変換手段20への結果出力を行
うことができる。この比較結果情報は、例えば、それぞ
れのファイルのデータ項目の1バイト毎の値とその一致
・不一致の情報とを含んだ比較結果レコードが比較順序
に応じて並んだものである。データ項目値には、各ファ
イルのデータ値がそれぞれそのまま転記され出力され、
よって、符号への置き換えが行われているデータ項目に
ついては、置換符号がそのまま出力される。
【0024】データ変換手段20は、意味付け辞書22
を検索し、各データ項目の比較結果が置換符号に関わる
ものであるかどうかを判定し、そうである場合には置換
符号を意味付け辞書22から得られる有意文字列へ変換
する。データ変換手段20によって置換符号から有意文
字列への変換が行われた比較結果情報が結果編集出力手
段8へ渡される。変換された比較結果は結果編集出力手
段8により出力形式を整えられ、画像表示装置や印刷装
置等の出力装置10から出力される。
を検索し、各データ項目の比較結果が置換符号に関わる
ものであるかどうかを判定し、そうである場合には置換
符号を意味付け辞書22から得られる有意文字列へ変換
する。データ変換手段20によって置換符号から有意文
字列への変換が行われた比較結果情報が結果編集出力手
段8へ渡される。変換された比較結果は結果編集出力手
段8により出力形式を整えられ、画像表示装置や印刷装
置等の出力装置10から出力される。
【0025】図3は、データ変換手段20の動作を詳細
に説明するフロー図である。動作開始時に、バイナリデ
ータファイル2,4上でのバイト単位での位置に対応す
るポインタPの値が初期値0にリセットされる(S10
0)。データ変換手段20は、ポインタPの値pでイン
デックスレコード44の先頭位置情報44aを検索する
(S102)。
に説明するフロー図である。動作開始時に、バイナリデ
ータファイル2,4上でのバイト単位での位置に対応す
るポインタPの値が初期値0にリセットされる(S10
0)。データ変換手段20は、ポインタPの値pでイン
デックスレコード44の先頭位置情報44aを検索する
(S102)。
【0026】値pに一致する先頭位置情報44aを有す
るインデックスレコード44が辞書インデックス部40
に存在する場合(S104)、つまりポインタPがバイ
ナリデータファイル2,4中のある置換符号データ項目
の先頭バイトの位置を指し示している場合には、当該イ
ンデックスレコード44中のポインタ44cが指すブロ
ックを検索して、置換符号と有意文字列との対応関係を
取得する。この取得処理は当該インデックスレコード4
4に定義された符号データ長単位44bがバイトである
かビットであるかに応じて場合分けされる(S10
6)。
るインデックスレコード44が辞書インデックス部40
に存在する場合(S104)、つまりポインタPがバイ
ナリデータファイル2,4中のある置換符号データ項目
の先頭バイトの位置を指し示している場合には、当該イ
ンデックスレコード44中のポインタ44cが指すブロ
ックを検索して、置換符号と有意文字列との対応関係を
取得する。この取得処理は当該インデックスレコード4
4に定義された符号データ長単位44bがバイトである
かビットであるかに応じて場合分けされる(S10
6)。
【0027】まず、符号種別情報44bがバイト単位符
号を示す場合には、ポインタPの値で指定されるp番目
の比較結果レコードから、バイナリデータファイル2,
4それぞれの第pバイトのデータ値を取得する。取得さ
れたデータ値はそれぞれファイル2,4中の置換符号の
先頭第1バイトであり、当該データ値に一致する見出し
50aを有する辞書レコード50がそれぞれ検索される
(S108)。
号を示す場合には、ポインタPの値で指定されるp番目
の比較結果レコードから、バイナリデータファイル2,
4それぞれの第pバイトのデータ値を取得する。取得さ
れたデータ値はそれぞれファイル2,4中の置換符号の
先頭第1バイトであり、当該データ値に一致する見出し
50aを有する辞書レコード50がそれぞれ検索される
(S108)。
【0028】置換符号の先頭1バイト目のデータ値と一
致する見出し50aを有する辞書レコード50が当該ブ
ロック中に存在する場合には(S110)、当該辞書レ
コード50中に格納された置換符号のバイト長50c
(その値をlenとする)が読み出される。データ変換手
段20は、p番目から(p+len−1)番目までの比較
結果レコードに格納されたデータ値に基づいて、バイナ
リデータファイル2,4それぞれに格納されていた長さ
lenバイトの置換符号のデータ値dを取得する(S11
2)。
致する見出し50aを有する辞書レコード50が当該ブ
ロック中に存在する場合には(S110)、当該辞書レ
コード50中に格納された置換符号のバイト長50c
(その値をlenとする)が読み出される。データ変換手
段20は、p番目から(p+len−1)番目までの比較
結果レコードに格納されたデータ値に基づいて、バイナ
リデータファイル2,4それぞれに格納されていた長さ
lenバイトの置換符号のデータ値dを取得する(S11
2)。
【0029】データ変換手段20は置換符号のデータ値
dをキーにして、当該辞書レコード50に格納されてい
るサブレコード52を検索する(S114)。フィール
ド52aの値が当該データ値dと一致するサブレコード
52がある場合には(S116)、当該サブレコード5
2のフィールド52cに格納された有意文字列で比較結
果情報の置換符号データを書き換え(S118)、ポイ
ンタPの値pをlenだけインクリメントする(S12
0)。
dをキーにして、当該辞書レコード50に格納されてい
るサブレコード52を検索する(S114)。フィール
ド52aの値が当該データ値dと一致するサブレコード
52がある場合には(S116)、当該サブレコード5
2のフィールド52cに格納された有意文字列で比較結
果情報の置換符号データを書き換え(S118)、ポイ
ンタPの値pをlenだけインクリメントする(S12
0)。
【0030】一方、処理S114にてデータ値dと一致
するサブレコード52を見出すことができなかった場合
には(S116)、置換符号データを有意文字列で書き
換えることなく、処理S120へ移行し、ポインタPの
値pをlenだけインクリメントする。なお、このように
データ値dと一致するサブレコード52を見出すことが
できないという状況は、意味付け辞書22に置換符号と
有意文字列との対応関係が未登録である場合に起こりう
る。
するサブレコード52を見出すことができなかった場合
には(S116)、置換符号データを有意文字列で書き
換えることなく、処理S120へ移行し、ポインタPの
値pをlenだけインクリメントする。なお、このように
データ値dと一致するサブレコード52を見出すことが
できないという状況は、意味付け辞書22に置換符号と
有意文字列との対応関係が未登録である場合に起こりう
る。
【0031】また、処理S104において、pに一致す
る先頭位置情報44aを有するインデックスレコード4
4が辞書インデックス部40に存在しないと判定された
場合、つまりポインタPがバイナリデータファイル2,
4中の置換符号データ項目の先頭バイト以外の位置を指
し示している場合には、置換符号の書き換え処理を行う
ことなく、ポインタPの値pを1だけ進める(S12
2)。
る先頭位置情報44aを有するインデックスレコード4
4が辞書インデックス部40に存在しないと判定された
場合、つまりポインタPがバイナリデータファイル2,
4中の置換符号データ項目の先頭バイト以外の位置を指
し示している場合には、置換符号の書き換え処理を行う
ことなく、ポインタPの値pを1だけ進める(S12
2)。
【0032】また、判定処理S106において、インデ
ックスレコード44に定義された符号種別情報44bが
ビット単位符号を示す場合には、処理S130へ分岐す
る。処理S130では、ポインタ44cが指すブロッ
ク、すなわち辞書レコード50(ビット単位符号の場合
には、上記ブロックは1つの辞書レコード50しか含ま
ないためブロックと辞書レコード50とは同一の単位と
なる)中のフィールド50cに格納された置換符号のバ
イト長lenが参照される。そして、ポインタPが指すp
番目の比較結果レコードからlenレコード分の比較結果
情報を参照し、バイナリデータファイル2,4それぞれ
に含まれるlenバイトのビット単位符号が取得される
(S130)。
ックスレコード44に定義された符号種別情報44bが
ビット単位符号を示す場合には、処理S130へ分岐す
る。処理S130では、ポインタ44cが指すブロッ
ク、すなわち辞書レコード50(ビット単位符号の場合
には、上記ブロックは1つの辞書レコード50しか含ま
ないためブロックと辞書レコード50とは同一の単位と
なる)中のフィールド50cに格納された置換符号のバ
イト長lenが参照される。そして、ポインタPが指すp
番目の比較結果レコードからlenレコード分の比較結果
情報を参照し、バイナリデータファイル2,4それぞれ
に含まれるlenバイトのビット単位符号が取得される
(S130)。
【0033】データ変換手段20は、その置換符号(ビ
ット単位符号)のデータ値dOと、辞書レコード50中
のサブレコード52のフィールド52aに格納された置
換符号のデータ値dDとのビット毎の論理積を計算する
(S132)。そして、その論理積の結果のビット列が
“真”すなわち非零の値を示す場合、比較結果情報に含
まれるデータ値dOは、当該サブレコード52中のフィ
ールド52cに格納された有意文字列に対応付けられ、
意味格納領域に当該有意文字列を格納し(S134)、
次のサブレコード52があるか否かの判断S136に移
る。一方、論理積の結果のビット列が“偽”すなわち零
となる場合には、意味格納領域には何も格納せずに判断
S136に移る。処理S132〜134は、辞書レコー
ド50に含まれる全てのサブレコード52について順次
行われ、判断S132で“真”となる毎に意味格納領域
には、有意文字列が追加格納される。当該辞書レコード
50に格納される全てのサブレコード52について処理
S132〜134が終了すると(S136)、処理S1
18に移行し、意味格納領域に保持された有意文字列
(群)で比較結果情報の置換符号データを書き換える。
そして、ポインタPの値pをlenだけインクリメントす
る(S120)。
ット単位符号)のデータ値dOと、辞書レコード50中
のサブレコード52のフィールド52aに格納された置
換符号のデータ値dDとのビット毎の論理積を計算する
(S132)。そして、その論理積の結果のビット列が
“真”すなわち非零の値を示す場合、比較結果情報に含
まれるデータ値dOは、当該サブレコード52中のフィ
ールド52cに格納された有意文字列に対応付けられ、
意味格納領域に当該有意文字列を格納し(S134)、
次のサブレコード52があるか否かの判断S136に移
る。一方、論理積の結果のビット列が“偽”すなわち零
となる場合には、意味格納領域には何も格納せずに判断
S136に移る。処理S132〜134は、辞書レコー
ド50に含まれる全てのサブレコード52について順次
行われ、判断S132で“真”となる毎に意味格納領域
には、有意文字列が追加格納される。当該辞書レコード
50に格納される全てのサブレコード52について処理
S132〜134が終了すると(S136)、処理S1
18に移行し、意味格納領域に保持された有意文字列
(群)で比較結果情報の置換符号データを書き換える。
そして、ポインタPの値pをlenだけインクリメントす
る(S120)。
【0034】上述のように処理S102〜136が終了
し、処理S120又はS122にてポインタPをインク
リメントした結果、比較結果情報ファイルの終端に達し
た場合には(S140)、データ変換手段20は置換符
号の書き換え処理を終了する(S142)。一方、まだ
比較結果情報が残っている場合には(S140)、処理
S102に戻り、処理S102〜136を繰り返す。
し、処理S120又はS122にてポインタPをインク
リメントした結果、比較結果情報ファイルの終端に達し
た場合には(S140)、データ変換手段20は置換符
号の書き換え処理を終了する(S142)。一方、まだ
比較結果情報が残っている場合には(S140)、処理
S102に戻り、処理S102〜136を繰り返す。
【0035】図4は、上述したファイル比較装置の処理
の一例を示す模式図である。図において、図1と同一の
符号は同一の構成要素を表す。バイナリデータファイル
2(ファイルA)及びバイナリデータファイル4(ファ
イルB)に図示されるレコード200a〜200c、2
02a〜202cは、それぞれのファイルの最初の3レ
コードである。これら各レコードはそれぞれ第0バイト
〜第10バイトの計11バイトで構成される。なお、そ
れらレコード中に示される“数字H”は、当該数字が1
6進数表示であることを示している。16進表示では4
ビットを0〜9及びA〜Fの16種類の文字を用いて1
桁の文字で表現でき、よって1バイトは2桁の文字で表
現される。
の一例を示す模式図である。図において、図1と同一の
符号は同一の構成要素を表す。バイナリデータファイル
2(ファイルA)及びバイナリデータファイル4(ファ
イルB)に図示されるレコード200a〜200c、2
02a〜202cは、それぞれのファイルの最初の3レ
コードである。これら各レコードはそれぞれ第0バイト
〜第10バイトの計11バイトで構成される。なお、そ
れらレコード中に示される“数字H”は、当該数字が1
6進数表示であることを示している。16進表示では4
ビットを0〜9及びA〜Fの16種類の文字を用いて1
桁の文字で表現でき、よって1バイトは2桁の文字で表
現される。
【0036】各レコード200,202は第0バイトで
構成される第1フィールド、第1,第2バイトで構成さ
れる第2フィールド、第3,第4バイトで構成される第
3フィールド、第5,第6バイトで構成される第4フィ
ールド、第7,第8バイトで構成される第5フィール
ド、第9,第10バイトで構成される第6フィールドを
含んでいる。
構成される第1フィールド、第1,第2バイトで構成さ
れる第2フィールド、第3,第4バイトで構成される第
3フィールド、第5,第6バイトで構成される第4フィ
ールド、第7,第8バイトで構成される第5フィール
ド、第9,第10バイトで構成される第6フィールドを
含んでいる。
【0037】このバイナリデータファイル2,4に対応
する意味付け辞書22の辞書インデックス部40のイン
デックスレコード44-1〜44-3には、先頭位置情報4
4aに、0,7,9が格納され、レコード200,20
2の第0,7,9バイトが置換符号の先頭バイトである
ことを示している。
する意味付け辞書22の辞書インデックス部40のイン
デックスレコード44-1〜44-3には、先頭位置情報4
4aに、0,7,9が格納され、レコード200,20
2の第0,7,9バイトが置換符号の先頭バイトである
ことを示している。
【0038】インデックスレコード44-1の第4フィー
ルド44cは、当該インデックスレコードに対応するブ
ロックの先頭を指す。このブロックはインデックスレコ
ード44-1の第3フィールド44dに示されるように4
つの辞書レコードで構成され、それらレコードは具体的
には辞書レコード50-1〜50-4である。例えば、辞書
レコード50-1は、その第2、第3フィールド50b,
50cに指定されるように、1バイトの値を有する置換
符号に関するサブレコード52を1つだけ含んでいる。
第4〜6フィールドがサブレコード52であり、第4フ
ィールド52aに1バイトの置換符号の値“01”が格
納され、第6フィールド52cに当該置換符号に対応付
けられる6バイトの有意文字列の値“[加算]”が格納さ
れている。この有意文字列の長さは第5フィールドに指
定されている。当該置換符号は上述したようにバイト単
位符号であり、この場合、辞書レコード50-1の第1フ
ィールド50aには、置換符号の先頭1バイトである
“01”が格納される。
ルド44cは、当該インデックスレコードに対応するブ
ロックの先頭を指す。このブロックはインデックスレコ
ード44-1の第3フィールド44dに示されるように4
つの辞書レコードで構成され、それらレコードは具体的
には辞書レコード50-1〜50-4である。例えば、辞書
レコード50-1は、その第2、第3フィールド50b,
50cに指定されるように、1バイトの値を有する置換
符号に関するサブレコード52を1つだけ含んでいる。
第4〜6フィールドがサブレコード52であり、第4フ
ィールド52aに1バイトの置換符号の値“01”が格
納され、第6フィールド52cに当該置換符号に対応付
けられる6バイトの有意文字列の値“[加算]”が格納さ
れている。この有意文字列の長さは第5フィールドに指
定されている。当該置換符号は上述したようにバイト単
位符号であり、この場合、辞書レコード50-1の第1フ
ィールド50aには、置換符号の先頭1バイトである
“01”が格納される。
【0039】インデックスレコード44-2の第4フィー
ルド44cがその先頭を指し示すブロックに格納される
全ての置換符号は共通の先頭1バイトの値“00”を有
するため、1つの見出し50aでまとめることができ
る。そのため当該ブロックは、インデックスレコード4
4-2の第3フィールド44dに示されるように1つのみ
の辞書レコード50-5で構成される。辞書レコード50
-5は、その第2、第3フィールド50b,50cに指定
されるように、2バイトの値を有する置換符号に関する
サブレコード52を6つ含んでいる。第4フィールド以
降、3つずつのフィールドで1つのサブレコード52が
構成される。例えば、第4〜6フィールドで構成される
サブレコード52は、2バイトの置換符号の値“000
1”と1バイトの有意文字列の値“=”との対応関係を
定義し、第7〜9フィールドで構成されるサブレコード
52は、2バイトの置換符号の値“0002”と2バイ
トの有意文字列の値“N=”との対応関係を定義してい
る。
ルド44cがその先頭を指し示すブロックに格納される
全ての置換符号は共通の先頭1バイトの値“00”を有
するため、1つの見出し50aでまとめることができ
る。そのため当該ブロックは、インデックスレコード4
4-2の第3フィールド44dに示されるように1つのみ
の辞書レコード50-5で構成される。辞書レコード50
-5は、その第2、第3フィールド50b,50cに指定
されるように、2バイトの値を有する置換符号に関する
サブレコード52を6つ含んでいる。第4フィールド以
降、3つずつのフィールドで1つのサブレコード52が
構成される。例えば、第4〜6フィールドで構成される
サブレコード52は、2バイトの置換符号の値“000
1”と1バイトの有意文字列の値“=”との対応関係を
定義し、第7〜9フィールドで構成されるサブレコード
52は、2バイトの置換符号の値“0002”と2バイ
トの有意文字列の値“N=”との対応関係を定義してい
る。
【0040】インデックスレコード44-3の第2フィー
ルド44bには、当該インデックスレコードに対応する
置換符号がビット単位符号であることが示されている。
この場合には、辞書レコード部42は置換符号の先頭1
バイトを見出しとして複数辞書レコード50に分類する
ことは行われないため、対応するブロックはインデック
スレコードの第3フィールド44dに示されるように1
つの辞書レコード50-6のみで構成される。図において
は、辞書レコード50-6の見出し50aには値“00”
が格納されているが、ビット単位符号においてはこの見
出し50aは意味を有さない。辞書レコード50-6は、
その第2、第3フィールド50b,50cに指定される
ように、2バイトの値を有する置換符号に関するサブレ
コード52を4つ含んでいる。第4フィールド以降、3
つずつのフィールドで1つのサブレコード52が構成さ
れる。例えば、第4〜6フィールドで構成されるサブレ
コード52は、2バイトの置換符号の値“8000”と
10バイトの有意文字列の値“ユーザ指定”との対応関
係を定義し、第7〜9フィールドで構成されるサブレコ
ード52は、2バイトの置換符号の値“1000”と8
バイトの有意文字列の値“デバッグ”との対応関係を定
義している。
ルド44bには、当該インデックスレコードに対応する
置換符号がビット単位符号であることが示されている。
この場合には、辞書レコード部42は置換符号の先頭1
バイトを見出しとして複数辞書レコード50に分類する
ことは行われないため、対応するブロックはインデック
スレコードの第3フィールド44dに示されるように1
つの辞書レコード50-6のみで構成される。図において
は、辞書レコード50-6の見出し50aには値“00”
が格納されているが、ビット単位符号においてはこの見
出し50aは意味を有さない。辞書レコード50-6は、
その第2、第3フィールド50b,50cに指定される
ように、2バイトの値を有する置換符号に関するサブレ
コード52を4つ含んでいる。第4フィールド以降、3
つずつのフィールドで1つのサブレコード52が構成さ
れる。例えば、第4〜6フィールドで構成されるサブレ
コード52は、2バイトの置換符号の値“8000”と
10バイトの有意文字列の値“ユーザ指定”との対応関
係を定義し、第7〜9フィールドで構成されるサブレコ
ード52は、2バイトの置換符号の値“1000”と8
バイトの有意文字列の値“デバッグ”との対応関係を定
義している。
【0041】出力装置10にはバイナリデータファイル
2,4を本装置で比較した結果が例えば画面表示され
る。バイナリデータファイル2,4それぞれの第1レコ
ードの比較結果は不一致であるため、出力装置10には
ファイルA,Bそれぞれの第1レコードの内容が第1行
及び第2行に、それぞれファイルA,Bの区別を行先頭
に付して表示される。このとき、元のファイルA,Bで
はそのレコードの第1,4,5フィールドには置換符号
が格納されているが、本装置では、その置換符号の値が
有意文字列に書き換えられて表示されている。つまり、
ファイルAの第1レコード第1フィールドの値“01”
は、辞書レコード部42の辞書レコード50-1に格納さ
れた対応関係に基づいて、有意文字列“[加算]”に書き
換えられ、ファイルBの第1レコード第1フィールドの
値“02”は、辞書レコード50-2に格納された対応関
係に基づいて、有意文字列“[減算]”に書き換えられ、
また、ファイルBの第1レコード第6フィールドの値
“8000”は、辞書レコード50-6に格納された対応
関係に基づいて、有意文字列“ユーザ指定”に書き換え
られる。また、対応関係が意味付け辞書22に定義され
ていないビット単位符号、すなわちファイルAの第1レ
コード第5,6フィールド等の値“0000”は空白に
書き換えられる。
2,4を本装置で比較した結果が例えば画面表示され
る。バイナリデータファイル2,4それぞれの第1レコ
ードの比較結果は不一致であるため、出力装置10には
ファイルA,Bそれぞれの第1レコードの内容が第1行
及び第2行に、それぞれファイルA,Bの区別を行先頭
に付して表示される。このとき、元のファイルA,Bで
はそのレコードの第1,4,5フィールドには置換符号
が格納されているが、本装置では、その置換符号の値が
有意文字列に書き換えられて表示されている。つまり、
ファイルAの第1レコード第1フィールドの値“01”
は、辞書レコード部42の辞書レコード50-1に格納さ
れた対応関係に基づいて、有意文字列“[加算]”に書き
換えられ、ファイルBの第1レコード第1フィールドの
値“02”は、辞書レコード50-2に格納された対応関
係に基づいて、有意文字列“[減算]”に書き換えられ、
また、ファイルBの第1レコード第6フィールドの値
“8000”は、辞書レコード50-6に格納された対応
関係に基づいて、有意文字列“ユーザ指定”に書き換え
られる。また、対応関係が意味付け辞書22に定義され
ていないビット単位符号、すなわちファイルAの第1レ
コード第5,6フィールド等の値“0000”は空白に
書き換えられる。
【0042】以上のように、本装置では、有意文字列が
対応付けられるバイナリデータの単位はバイト単位であ
っても、ビット単位であってもよい。有意文字列から置
換された符号を表すバイナリデータは、本装置により、
有意文字列に書き換えられて出力される。そのため、従
来必要であった、出力された置換符号を表すバイナリデ
ータの意味を調べるユーザ作業が不要となり、ユーザは
出力された比較結果を一目見て容易に理解することがで
きる。また、意味付け辞書を指定できるように構成して
いるため、予め複数種類の意味付け辞書を登録してお
き、比較されるファイルの種類に応じて適切なものを選
択して使用することができる。
対応付けられるバイナリデータの単位はバイト単位であ
っても、ビット単位であってもよい。有意文字列から置
換された符号を表すバイナリデータは、本装置により、
有意文字列に書き換えられて出力される。そのため、従
来必要であった、出力された置換符号を表すバイナリデ
ータの意味を調べるユーザ作業が不要となり、ユーザは
出力された比較結果を一目見て容易に理解することがで
きる。また、意味付け辞書を指定できるように構成して
いるため、予め複数種類の意味付け辞書を登録してお
き、比較されるファイルの種類に応じて適切なものを選
択して使用することができる。
【0043】[実施の形態2]図5は、本発明に係る第
2の実施の形態であるファイル比較装置の概略のブロッ
ク構成図である。図において、図1と同様の機能を有す
る構成要素には同一の符号を付し、説明を簡略化する。
2の実施の形態であるファイル比較装置の概略のブロッ
ク構成図である。図において、図1と同様の機能を有す
る構成要素には同一の符号を付し、説明を簡略化する。
【0044】上記実施の形態に係るファイル比較装置
は、予め作成された意味付け辞書を使用して、有意文字
列を検索する機能を有していたが、本装置はさらに、意
味付け辞書に新しい意味、すなわち新しい有意文字列と
置換符号との対応関係を登録する機能を有している。こ
の機能は辞書登録手段300により実現される。辞書登
録手段300は、装置起動時に、ファイル内容の比較に
先行して処理を実行する。辞書登録手段300はユーザ
により指定されたファイル中のバイナリデータを置換符
号を表すものとして取り扱い、その置換符号の意味をユ
ーザに入力させる。ユーザが意味として有意文字列を入
力すると、辞書登録手段300は、当該置換符号と入力
された有意文字列との対応関係が意味付け辞書22に存
在するかどうかをチェックし、未登録の場合には、当該
対応関係を意味付け辞書22に新規登録する。
は、予め作成された意味付け辞書を使用して、有意文字
列を検索する機能を有していたが、本装置はさらに、意
味付け辞書に新しい意味、すなわち新しい有意文字列と
置換符号との対応関係を登録する機能を有している。こ
の機能は辞書登録手段300により実現される。辞書登
録手段300は、装置起動時に、ファイル内容の比較に
先行して処理を実行する。辞書登録手段300はユーザ
により指定されたファイル中のバイナリデータを置換符
号を表すものとして取り扱い、その置換符号の意味をユ
ーザに入力させる。ユーザが意味として有意文字列を入
力すると、辞書登録手段300は、当該置換符号と入力
された有意文字列との対応関係が意味付け辞書22に存
在するかどうかをチェックし、未登録の場合には、当該
対応関係を意味付け辞書22に新規登録する。
【0045】図6は、辞書登録手段300の概略の処理
を表すフロー図である。装置が起動されると(S31
0)、辞書登録手段300は例えば、辞書に新たな対応
関係を作成するか否かを尋ねるメッセージを画面に表示
し、ユーザからの指示を受け付ける。その指示が辞書に
登録を行わないという指示である場合には(S31
2)、直ちに比較手段6に処理が移される(S31
4)。一方、辞書登録する場合には(S312)、比較
対象となるバイナリデータファイル2又は4のファイル
内容であるバイナリデータを画面に表示する(S31
6)。この表示は、2進数表示であってもよいが、表示
が冗長となることを避けるため、16進数表示として1
バイトを2桁で表すようにしてもよい。
を表すフロー図である。装置が起動されると(S31
0)、辞書登録手段300は例えば、辞書に新たな対応
関係を作成するか否かを尋ねるメッセージを画面に表示
し、ユーザからの指示を受け付ける。その指示が辞書に
登録を行わないという指示である場合には(S31
2)、直ちに比較手段6に処理が移される(S31
4)。一方、辞書登録する場合には(S312)、比較
対象となるバイナリデータファイル2又は4のファイル
内容であるバイナリデータを画面に表示する(S31
6)。この表示は、2進数表示であってもよいが、表示
が冗長となることを避けるため、16進数表示として1
バイトを2桁で表すようにしてもよい。
【0046】ユーザは、このファイル内容の画面表示に
基づいて、登録を行う置換符号を指定する。例えば、ユ
ーザが画面表示にファイル内容とともに表示されたアド
レスを参照して置換符号の先頭と終わりのアドレスとを
入力するように辞書登録手段300を構成することがで
きるし、また、ユーザがマウス等のポインティングデバ
イスを用いて、画面表示されたファイル内容の上で置換
符号の範囲指定を行うように構成することもできる。ま
た、置換符号にはバイト単位符号とビット単位符号との
2種類があるので、その種別を指定する手段も辞書登録
手段300は提供する。辞書登録手段300はこのよう
にして指定された置換符号に対応付ける有意文字列をユ
ーザに入力させ、この有意文字列と置換符号との対応関
係を意味付け辞書22に登録する(S318)。
基づいて、登録を行う置換符号を指定する。例えば、ユ
ーザが画面表示にファイル内容とともに表示されたアド
レスを参照して置換符号の先頭と終わりのアドレスとを
入力するように辞書登録手段300を構成することがで
きるし、また、ユーザがマウス等のポインティングデバ
イスを用いて、画面表示されたファイル内容の上で置換
符号の範囲指定を行うように構成することもできる。ま
た、置換符号にはバイト単位符号とビット単位符号との
2種類があるので、その種別を指定する手段も辞書登録
手段300は提供する。辞書登録手段300はこのよう
にして指定された置換符号に対応付ける有意文字列をユ
ーザに入力させ、この有意文字列と置換符号との対応関
係を意味付け辞書22に登録する(S318)。
【0047】図7は、辞書登録手段300が処理S31
6にて行う画面表示の一例を示す模式図である。この画
面350には、辞書登録手段300中のダンプ手段がバ
イナリデータファイル2又は4の内容を16進表示で各
行16バイトずつダンプ表示する。そのダンプ表示領域
352には、例えば最上段に、16進表示によるアドレ
ス値の下1桁が表示され、左欄にはアドレス値の下2桁
目以上が表示され、ユーザがファイル中における目的と
するバイナリデータの位置を見当付けるのに便利なよう
に配慮されている。この例では、辞書登録手段300中
の置換符号指定手段は、ダンプ表示領域352上でユー
ザが所望の位置をカーソル等で指定することを可能とし
ている。指定されたバイナリデータは置換符号値表示欄
354に表示される。またバイト単位符号、ビット単位
符号の区別は、単位指定欄356内に設けられたボタン
をマウスを用いてクリックすることにより選択される。
また辞書登録手段300中の意味入力手段は、有意文字
列入力欄358を画面350上に表示する。ユーザは、
この有意文字列入力欄358へカーソルを移動し、指定
した置換符号に対応する有意文字列をキーボードから入
力する。また、ビット単位符号の場合には、置換符号と
して指定された1又は数バイト分のバイナリデータ中の
特定のビットに、有意文字列が割り付けられる。そのた
め、単位指定欄356にてビット単位が選択された場合
には、ダンプ表示領域352で指定された16進表示の
値を、2進数表示に変換して置換符号値表示欄354に
表示し、その表示上でユーザが意味を割り付ける特定の
ビットをマウス等で指定するように構成することができ
る。以上のようにして、ユーザは、対応関係の指定が完
了すると、画面350内に用意された「設定」ボタン3
60をマウスでクリック等する。辞書登録手段300は
これを検知すると、意味付け辞書22を検索して、画面
350上で指定された置換符号の値及びファイル中での
位置と有意文字列との対応関係が新規なものと判断する
と、これを意味付け辞書22に追加登録する。
6にて行う画面表示の一例を示す模式図である。この画
面350には、辞書登録手段300中のダンプ手段がバ
イナリデータファイル2又は4の内容を16進表示で各
行16バイトずつダンプ表示する。そのダンプ表示領域
352には、例えば最上段に、16進表示によるアドレ
ス値の下1桁が表示され、左欄にはアドレス値の下2桁
目以上が表示され、ユーザがファイル中における目的と
するバイナリデータの位置を見当付けるのに便利なよう
に配慮されている。この例では、辞書登録手段300中
の置換符号指定手段は、ダンプ表示領域352上でユー
ザが所望の位置をカーソル等で指定することを可能とし
ている。指定されたバイナリデータは置換符号値表示欄
354に表示される。またバイト単位符号、ビット単位
符号の区別は、単位指定欄356内に設けられたボタン
をマウスを用いてクリックすることにより選択される。
また辞書登録手段300中の意味入力手段は、有意文字
列入力欄358を画面350上に表示する。ユーザは、
この有意文字列入力欄358へカーソルを移動し、指定
した置換符号に対応する有意文字列をキーボードから入
力する。また、ビット単位符号の場合には、置換符号と
して指定された1又は数バイト分のバイナリデータ中の
特定のビットに、有意文字列が割り付けられる。そのた
め、単位指定欄356にてビット単位が選択された場合
には、ダンプ表示領域352で指定された16進表示の
値を、2進数表示に変換して置換符号値表示欄354に
表示し、その表示上でユーザが意味を割り付ける特定の
ビットをマウス等で指定するように構成することができ
る。以上のようにして、ユーザは、対応関係の指定が完
了すると、画面350内に用意された「設定」ボタン3
60をマウスでクリック等する。辞書登録手段300は
これを検知すると、意味付け辞書22を検索して、画面
350上で指定された置換符号の値及びファイル中での
位置と有意文字列との対応関係が新規なものと判断する
と、これを意味付け辞書22に追加登録する。
【0048】以上のように、本装置は意味付け辞書22
の生成、または既存の意味付け辞書22への追加登録を
可能とする手段を有するため、意味付け辞書22の生
成、メンテナンスが容易となる。また、画面上で置換符
号となるバイナリデータを参照しながら、その範囲を指
定することにより、単に位置や置換符号の値を入力させ
る方法より入力誤りが少なくなる。
の生成、または既存の意味付け辞書22への追加登録を
可能とする手段を有するため、意味付け辞書22の生
成、メンテナンスが容易となる。また、画面上で置換符
号となるバイナリデータを参照しながら、その範囲を指
定することにより、単に位置や置換符号の値を入力させ
る方法より入力誤りが少なくなる。
【0049】また、上記処理手順では、装置の起動時に
意味付け辞書22への追加登録を行うことができたが、
これをさらに比較処理中に行うように構成することもで
きる。例えば、図3に示す処理フローにおいて、辞書イ
ンデックス部40により置換符号格納領域に格納された
値に対して有意文字列が辞書レコード部42に登録され
ていない場合、例えば判断S110やS116にて“N
o”と判断された場合、辞書登録手段300を起動し
て、意味付け辞書22への追加登録を行うか否かをユー
ザに確認するように構成してもよい。
意味付け辞書22への追加登録を行うことができたが、
これをさらに比較処理中に行うように構成することもで
きる。例えば、図3に示す処理フローにおいて、辞書イ
ンデックス部40により置換符号格納領域に格納された
値に対して有意文字列が辞書レコード部42に登録され
ていない場合、例えば判断S110やS116にて“N
o”と判断された場合、辞書登録手段300を起動し
て、意味付け辞書22への追加登録を行うか否かをユー
ザに確認するように構成してもよい。
【0050】なお、ここでは、本発明をファイル比較装
置を例に説明したが、本発明はバイナリデータで記録さ
れたファイル内容を単に参照するための情報処理装置に
も適用することができる。
置を例に説明したが、本発明はバイナリデータで記録さ
れたファイル内容を単に参照するための情報処理装置に
も適用することができる。
【0051】
【発明の効果】本発明に係る情報処理装置によれば、有
意文字列と当該有意文字列を表すバイナリデータと異な
るバイナリデータで表される置換符号との対応関係を表
す意味付け辞書を有し、データ変換手段が当該意味付け
辞書を検索して置換符号を有意文字列に書き換えてファ
イル内容が出力されるので、ユーザは置換符号を表すバ
イナリデータの意味(有意文字列)を覚えたり、思い出
す必要がなく、また自身で対応関係を調べて意味を把握
する必要がないので、出力結果に表される意味内容を容
易に理解することができるという効果が得られる。
意文字列と当該有意文字列を表すバイナリデータと異な
るバイナリデータで表される置換符号との対応関係を表
す意味付け辞書を有し、データ変換手段が当該意味付け
辞書を検索して置換符号を有意文字列に書き換えてファ
イル内容が出力されるので、ユーザは置換符号を表すバ
イナリデータの意味(有意文字列)を覚えたり、思い出
す必要がなく、また自身で対応関係を調べて意味を把握
する必要がないので、出力結果に表される意味内容を容
易に理解することができるという効果が得られる。
【0052】本発明に係る情報処理装置によれば、バイ
ト単位のビット列の各ビットの状態がそれぞれ有意文字
列に対応付けられる置換符号であるビット単位符号と、
バイト単位で有意文字列に対応付けられる置換符号であ
るバイト単位符号とを区別する符号種別情報を意味付け
辞書に備え、それら2種類の置換符号を区別することに
より、置換符号の意味付け単位がバイト単位である場合
だけでなく、ビット単位である場合にも対応できる。つ
まり、ビットパタンの各ビット毎に意味が割り付けられ
る場合に、意味付け辞書において、それらの意味毎に別
個のバイト単位の置換符号を定義する必要がなく、意味
付け辞書のサイズを抑制することができるという効果が
得られる。
ト単位のビット列の各ビットの状態がそれぞれ有意文字
列に対応付けられる置換符号であるビット単位符号と、
バイト単位で有意文字列に対応付けられる置換符号であ
るバイト単位符号とを区別する符号種別情報を意味付け
辞書に備え、それら2種類の置換符号を区別することに
より、置換符号の意味付け単位がバイト単位である場合
だけでなく、ビット単位である場合にも対応できる。つ
まり、ビットパタンの各ビット毎に意味が割り付けられ
る場合に、意味付け辞書において、それらの意味毎に別
個のバイト単位の置換符号を定義する必要がなく、意味
付け辞書のサイズを抑制することができるという効果が
得られる。
【0053】本発明に係る情報処理装置によれば、辞書
変更手段を有し、入力されるファイルに応じて意味付け
辞書を変更することができるので、装置に複数の異なる
意味付け辞書を備え、様々な入力ファイル内容の出力を
行うことができる効果が得られる。
変更手段を有し、入力されるファイルに応じて意味付け
辞書を変更することができるので、装置に複数の異なる
意味付け辞書を備え、様々な入力ファイル内容の出力を
行うことができる効果が得られる。
【0054】本発明に係る情報処理装置によれば、辞書
登録手段を有し、有意文字列と置換符号との対応関係を
意味付け辞書に追加登録することができるので、意味付
け辞書の生成、メンテナンスが容易となるという効果が
得られる。
登録手段を有し、有意文字列と置換符号との対応関係を
意味付け辞書に追加登録することができるので、意味付
け辞書の生成、メンテナンスが容易となるという効果が
得られる。
【0055】本発明に係る情報処理装置によれば、辞書
登録手段は、ファイル内容を画面上にダンプ表示し、そ
のダンプ表示上で登録対象とする置換符号を範囲指定
し、それに対する有意文字列を入力させるので、登録す
る置換符号の指定における誤りを低減し、登録作業を容
易にするという効果が得られる。
登録手段は、ファイル内容を画面上にダンプ表示し、そ
のダンプ表示上で登録対象とする置換符号を範囲指定
し、それに対する有意文字列を入力させるので、登録す
る置換符号の指定における誤りを低減し、登録作業を容
易にするという効果が得られる。
【図1】 本発明の第1の実施の形態であるファイル比
較装置の概略のブロック構成図である。
較装置の概略のブロック構成図である。
【図2】 本装置に用いられる意味付け辞書の構造を説
明するための模式図である。
明するための模式図である。
【図3】 本装置のデータ変換手段の動作を詳細に説明
するフロー図である。
するフロー図である。
【図4】 本装置の処理の一例を示す模式図である。
【図5】 本発明に係る第2の実施の形態であるファイ
ル比較装置の概略のブロック構成図である。
ル比較装置の概略のブロック構成図である。
【図6】 本装置の辞書登録手段の概略の処理を表すフ
ロー図である。
ロー図である。
【図7】 本装置の辞書登録手段による画面表示の一例
を示す模式図である。
を示す模式図である。
【図8】 従来のファイル比較装置の概略のブロック構
成図を示す。
成図を示す。
2,4 バイナリデータファイル、6 比較手段、8
結果編集出力手段、10 出力装置、20 データ変換
手段、22 意味付け辞書、24 意味付け辞書指定手
段、28 出力形式指定情報ファイル、40 辞書イン
デックス部、42 辞書レコード部、44 インデック
スレコード、50 辞書レコード、52サブレコード、
300 辞書登録手段、350 画面、352 ダンプ
表示領域、354 置換符号値表示欄、356 単位指
定欄、358 有意文字列入力欄。
結果編集出力手段、10 出力装置、20 データ変換
手段、22 意味付け辞書、24 意味付け辞書指定手
段、28 出力形式指定情報ファイル、40 辞書イン
デックス部、42 辞書レコード部、44 インデック
スレコード、50 辞書レコード、52サブレコード、
300 辞書登録手段、350 画面、352 ダンプ
表示領域、354 置換符号値表示欄、356 単位指
定欄、358 有意文字列入力欄。
Claims (5)
- 【請求項1】 有意文字列に対応付けられた置換符号を
含むファイルの内容を出力する情報処理装置において、 前記有意文字列と前記置換符号との対応関係を表す意味
付け辞書と、 前記意味付け辞書を検索し、表示対象の前記ファイル中
に現れる前記置換符号を前記有意文字列に変換するデー
タ変換手段と、 を有し、前記有意文字列を用いて前記ファイル内容を出
力する情報処理装置。 - 【請求項2】 請求項1記載の情報処理装置において、 前記意味付け辞書は、1又は複数バイトのビット列で表
されるビットパタンが1つの有意文字列に対応付けられ
る前記置換符号であるバイト単位符号と、1又は複数バ
イトのビット列で表され当該ビット列の各ビットの状態
がそれぞれ有意文字列に対応付けられる前記置換符号で
あるビット単位符号とを区別する符号種別情報を有する
こと、を特徴とする情報処理装置。 - 【請求項3】 請求項1又は請求項2に記載の情報処理
装置において、 表示対象となる前記ファイルに応じて、前記検索に用い
る前記意味付け辞書を変更する辞書変更手段を有するこ
とを特徴とする情報処理装置。 - 【請求項4】 請求項1から請求項3のいずれかに記載
の情報処理装置において、 前記有意文字列と前記置換符号との対応関係を前記意味
付け辞書に登録する辞書登録手段を有することを特徴と
する情報処理装置。 - 【請求項5】 請求項4記載の情報処理装置において、 前記辞書登録手段は、 前記ファイルの内容を前記データ変換手段を介さずに画
面上にダンプ表示するダンプ手段と、 前記ダンプ表示上でユーザが登録対象とする前記置換符
号に対応する範囲を指定することを可能とする置換符号
指定手段と、 前記置換符号指定手段により指定された前記置換符号に
対応付ける前記有意文字列をユーザに入力させる意味入
力手段と、 を有することを特徴とする情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10316389A JP2000148553A (ja) | 1998-11-06 | 1998-11-06 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10316389A JP2000148553A (ja) | 1998-11-06 | 1998-11-06 | 情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000148553A true JP2000148553A (ja) | 2000-05-30 |
Family
ID=18076544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10316389A Pending JP2000148553A (ja) | 1998-11-06 | 1998-11-06 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000148553A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015185063A (ja) * | 2014-03-26 | 2015-10-22 | 日本電気株式会社 | 情報処理装置、情報処理システム、情報処理方法およびプログラム |
-
1998
- 1998-11-06 JP JP10316389A patent/JP2000148553A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015185063A (ja) * | 2014-03-26 | 2015-10-22 | 日本電気株式会社 | 情報処理装置、情報処理システム、情報処理方法およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6564206B1 (en) | Information search apparatus and method, and storage medium | |
JP2693914B2 (ja) | 検索システム | |
JP2000148553A (ja) | 情報処理装置 | |
JP3632643B2 (ja) | 構造化文書管理装置 | |
JPH05101102A (ja) | 検索装置 | |
JP2001056809A (ja) | 文書管理システム | |
JP3709890B2 (ja) | 文字列検索装置 | |
JP2007047849A (ja) | プログラマブル表示器用画面データの作成プログラム、コンピュータ読み取り可能な記録媒体及び画面データ作成装置 | |
JP2007179347A (ja) | プログラム検証支援システム | |
JP2000250930A (ja) | 構造化文書検索システム | |
JP2569857B2 (ja) | 不定バイト長文字入力制御方式 | |
JP3059330B2 (ja) | Cadデータ変換装置 | |
JPH11232149A (ja) | ファイル比較処理方法,装置およびファイルの比較処理プログラムを記憶した媒体 | |
JPH05181719A (ja) | 可変長データの格納および参照システム | |
JPH07262061A (ja) | データ定義情報に基づく比較装置 | |
JPH06162096A (ja) | レコード検索方法 | |
JPH09269952A (ja) | 文書検索装置及びその方法 | |
JPH11161666A (ja) | ドキュメントデータ検索方法および装置、並びにドキュメント編集装置 | |
JP2609680B2 (ja) | データ登録装置 | |
JPH03282744A (ja) | ファイル内レコード検索方式 | |
JPH04167123A (ja) | 混在データ処理方式 | |
JP3216660B2 (ja) | データ型及びデータ定数展開方式 | |
JPH0225941A (ja) | データ記憶装置 | |
JPH04230576A (ja) | 項目選択装置 | |
JPH0764821A (ja) | メモリのストア内容表示装置 |