JPS62169273A - 言語処理プログラムにおけるラベル情報の登録・参照方式 - Google Patents

言語処理プログラムにおけるラベル情報の登録・参照方式

Info

Publication number
JPS62169273A
JPS62169273A JP61011406A JP1140686A JPS62169273A JP S62169273 A JPS62169273 A JP S62169273A JP 61011406 A JP61011406 A JP 61011406A JP 1140686 A JP1140686 A JP 1140686A JP S62169273 A JPS62169273 A JP S62169273A
Authority
JP
Japan
Prior art keywords
label
name
label name
label information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61011406A
Other languages
English (en)
Inventor
Susumu Umatani
馬谷 晋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61011406A priority Critical patent/JPS62169273A/ja
Publication of JPS62169273A publication Critical patent/JPS62169273A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Devices For Executing Special Programs (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、言語処理プログラムにおけるラベル情報の登
録・参照方式に関する。
言語処理プログラムの翻訳過程においては、ユ−ザブロ
グラムから指定されたデータ等にラベル名(名標)を付
すと共に、そのデータ等をラベル情報としてそのラベル
名に対応して格納しておき、後にそのラベル名が使用さ
れたとき対応するラベル情報を捜索することが行なわれ
る。
〔従来の技術〕
上述のような言語処理プログラムにおけるラベル情報の
登録、参照方式として、従来、例えば第3図に示すよう
な方式が知られている。即ち、ラベル名をある種のハツ
シュロジックにより分類して得たハツシュ値1 (0”
l〜I (r+)をインデックスとして持ち且つ各イン
デックスに対応したエントリにラベル情報へのポインタ
値P (0)〜P(n)全格納したラベル情報ポインタ
列1と、JI38形式のラベル名をそのまま表現したラ
ベル名とこのラベル名に対応するラベル情報とを組にし
たラベル名対ラベル情報2a、2b、・−9を、ラベル
情報ポインタ列1の各同一ポインタ値に対応してチェー
ン化(待ち行列化)したラベル名対ラベル情報チェーン
2とを主記憶装置上に設けておき、あるラベル名のラベ
ル情報を捜索する際は、そのラベル名のハツシュ値を求
めてこのハツシュ値をインデックスとしてラベル情報ポ
インタ列1から対応するポインタ値を求め、この求めた
ポインタ値に対応する最初のラベル多対ラベル情12a
中のラベル名と捜索すべきラベル名とを一文字ずつ比較
し、ラベル名が一致すればその一敗したラベル名と組に
なっているラベル情報を目的のラベル情報とし、一致し
ない場合にはラベル名対ラベル情報2aに付加された同
一ハツシュ値の次のポインタ値からラベル名対ラベル情
報2b以降について同様の処理を行なって目的とするラ
ベル情報を捜索するものであった。
(発明が解決しようとする問題点〕 しかし、上述した従来の登録、参照方式では、JI38
形式のラベル名をそのままの形で主記憶装置上に格納し
ているため、ラベル名の文字長が長い場合あるいはラベ
ル名が数多く出現する場合、主記憶装置の使用量が増大
してしまう欠点がある。
また、該当ラベル名を捜索する時、JI38形式のラベ
ル名中の一文字ずつを比較しているので、比較文字長が
長くなって捜索に時間がかかるという欠点もある。
本発明はこのような従来の欠点を解決したもので、その
目的は、主記憶装置の使用容量が少なく且つ捜索に要す
る時間を短縮し得る言語処理プログラムにおけるラベル
情報の登録・参照方式を′提供することにある。
〔問題点を解決するための手段〕
本発明は上記目的を達成するために、ラベル名をある種
のハツシュロジックにより分類して得たハツシュ値をイ
ンデックスとして持ち、各インデックスの指示するエン
トリにラベル情報へのポインタ値を記憶したラベル情報
ポインタ手段と、ラベル名と該ラベル名に対応するラベ
ル情報とを組にしたラベル名対ラベル情報を、前記ラベ
ル情報ポインタ手段の同一ポインタ値に対応してチェ7
ン化したラベル名対ラベル情報チェーンとを備え、 捜索すべきうにル名が与えられたとき、該捜索ラベル名
に対応するラベル情報を、前記ラベル情報ポインタ手段
および前記ラベル名対ラベル情報チェーンを用いて捜索
する言語処理プログラムにおけるラベル情報の登録・参
照方式において、前記ラベル名対ラベル情報チェーンの
各ラベル名対ラベル情報に登録するラベル名を、該ラベ
ル名のビット数を圧縮した圧縮ラベル名にすると共に該
圧縮ラベル名をある種のハツシュロジックにより分類し
て得たハフシュ値を前記ラベル情報ポインタ手段のイン
デックスとし、且つ、捜索すべきラベル名が与えられた
とき、該捜索ラベル名の圧縮ラベル名とハツシュ値を求
め、該ハツシュ値をインデックスとして前記ラベル情報
ポインタ手段からポインタ値を取得し、該取得したポイ
ンタ値に対応する前記ラベル名対ラベル情報チェーンに
おける圧縮ラベル名と捜索すべきラベル名の圧縮ラベル
名との比較により目的とするラベル情報を得るようにし
たものである。
〔作用〕
ラベル名対ラベル情報チェーンの各ラベル名対ラベル情
報に含めるラベル名は、従来のJI38形式で表された
ラベル名のビット敗を圧縮した圧縮ラベル名としたので
、その分生記憶装置の使用量が少なくなり、且つ、ラベ
ル名の比較も圧縮ラベル名で行なうので比較文字数が少
なくなって捜索時間も短縮される。
〔実施例〕
次に本発明の実施例について図面を参照して説明する。
第1図は本発明を適用した情報処理装置の実施例のブロ
ック図であり、lOは中央処理装置、11は主記憶装置
である。主記憶袋′t11には、言語処理プログラム1
2と、ラベル情報ポインタ列13と、このラヘル情報ポ
インタ列13中の同一ポインタ値に対応してチェーン化
された複数のラベル名対ラベル情報14a、14b、・
・・、を含むラベル名対ラベル情報チェーン14とが設
けられる。
上記ラベル情報ポインタ列13は、JIS8形式で表現
されたラベル名を、その中の連続する3文字を一組とし
て、3バイトを2バイトに圧縮し、その後、この圧縮さ
れたラベル名をある種のハツシュロジックにより分類し
て得たハツシュ値をインデックス■(0)〜I (n)
として持ち、また各インデックスが指示するエントリに
ラベル情報へのポインタ(直P(0)〜P (n)を記
憶したものである。
上記の文字圧縮の方法としては、捜索ラベル名に対し3
文字を一組として、次のような圧縮アルゴリズムにより
、3バイトの文字列を2バイトに圧縮変更する。
第1番目の2バイト= + (c+  *40) 十C
,’I  *40+C2 第2番目の2バイト−((C4*40) +C%)*4
0+Cb ここで、CRは文字に対応する番号である。この文字に
対応する番号は、空白は0.数値(0〜9)は1〜10
.   (アンダーパー)は11.$は12゜英文字(
A−Z)は13〜38.そして、 、(ピリオド)は3
9に対応している。
例えば、上記のような圧縮アルゴリズムによれば、JI
S8形式のラベル名$ABCDEは、16進表現で4D
16 6051の圧縮ラベル名に変換される。
また、主記憶装置11上のラベル多対うヘル情報14a
、14b、・・・、は、上記のようにして求めた圧縮ラ
ベル名と、この圧縮ラベル名に対応するラベル情報とを
対にして記憶したもので、同一ポインタ値即ち同一ハツ
シュ値に対応する圧縮ラベル名が複数ある場合、本実施
例のように複数のラベル多対うベル情fl14a、 1
4b、・・・、がチェーン化すなわち待ち行列的に複数
個関連付けられて用意される。このチェーン化の為に、
先行するラベル名対ラベル情報例えば14aには同一ハ
ツシュ値の次のポインタ値(即ちラベル名対ラベル情報
14bのポインタ値)が付加されている。なお、第1図
にはラベル情報ポインタ列13のポインタ値P (n−
1)に対応するラベル名対ラベル情報チェーンのみ図示
し、他のポインタ値に対応するチェーンは図示を省略し
である。
第2図は言語処理プログラム12による処理のうちラベ
ルfR報の登録、参照処理の一例を示す流れ図であり、
文字圧縮処理SL、ハツシュインデックス値変換処理S
2.ラベル比較処理S3.登録処理S4.参照処理S5
が含まれ、登録時には、文字圧縮処理S1.ハツシュイ
ンデックス値変換処理S2.ラベル比較処理33.登録
処理S4の順で実行され、参照時(捜索時)には文字圧
縮処理31.ハツシュインデックス値変換処理32゜ラ
ベル比較処理S3.参照処理S5の順で実行される。各
処理の内容は次の通りである。
(文字圧縮処理31) 通常の言語処理プロセッサの言語仕様で規定されている
文字要素〔空白、$、、(ビリオツド)。
−(アンダーパー)、英数字(A−Z、O〜9)〕のJ
I38形式の合計40文字を使ってプログラム中で利用
者が記述したラベル名を、そのラベル名中の3文字を1
&Ilとして、前述した圧縮アルゴリズムにより3バイ
トを2バイトに圧縮して圧縮ラベル名を求める。
(ハツシュインデックス値変換処理S2)文字圧縮処理
S1で得られた圧縮ラベル名に基づいてハツシュ値を求
める処理である。これは、圧縮ラベル名の例えば第2ビ
ツト目から第nビット目のビット列を2進数として認識
した場合のその2進数値をハツシュ値とする。即ち、例
えばn=6の場合、第2ビツト目〜第6ビツト目までの
5ビツトが全てOsのときハフシュ値はrOJとなり、
第2ビツト目のみが“1″のときハフシュ値は「1」と
なるもので、n=6ではハフシュ値の最大値は31とな
る。ハツシュ数を多くするにはnを大きくすれば良い。
この求められたハツシュ値はラベル情報ポインタ列13
のインデックスとなる。例えば、第2ビツト目から第6
ビノト目で表現された2進数値をインデックス値とする
場合、ハツシュ値の総数は32となり、例えば$ABC
DEのラベル名のインデックス値は「13」となる。
なお、ハツシュ値を求める方法として、JIS8形式で
表現された元のラベル名にある種のハッシェロジ7りを
適用することも可能である。しかし、本実施例のように
圧縮されたラベル名のあるビット列が表現する2進数値
そのものをハツシュ値とすることにより、ラベル圧縮演
算の実行終了と同時にハフシュ値を得ることができ、ハ
ツシュ値を求めるロジックと圧縮のロジックとが同一と
なり、圧縮作業を追加したことによる時間の遅延を解消
することができる。
(ラベル比較処理33) ・  ハツシュインデックス値変換処理S2において求
めたインデックス(ハソシュイ直)に工亥当するラベル
情報ポインタ列13中のポインタ値が示す、同一ハツシ
ュ値を持つ複数のラベル名対ラベル情報14 a 、 
14 b 、・・・、のチェーンをたどり、捜索ラベル
名(圧縮されたラベル名)と、ラベル名対ラベル情報1
4a、14b、・・・、に登録されている圧縮ラベル名
とを言語処理プログラム12が動作する情報処理装置上
で最高速に比較できる命令で比較し、該当ラベル名であ
るか否かを捜索発見する処理を行なう。
(登録処理S4) 捜索ラベル名が登録の目的で捜索された場合に実行され
、同一の圧縮ラベル名がチェーン14上に存在した場合
にはエラー表示を行ない、存在しない場合には、新たに
同一ハツシュ値を持つチェーン14の最後にその圧縮ラ
ベル名とこれに対応するラベル情報との組であるラベル
名対ラベル情報を追加作成し、直前のラベル名対ラベル
情報にそのポインタ値を付加する。
(参照処理S5) 捜索ラベル名が参照の目的で捜索された場合に実行され
、同一の圧縮ラベル名がチェーン14上に存在した場合
にはそのラベル情報を要求元に返送し、存在しない場合
にはエラー表示を行なう。
次に本実施例の動作を登録時と参照(捜索時)とに分け
て説明する。
(登録時) 登録すべきラベル名とラベル情報が与えられると、言語
処理プログラム12は、第2図に示すように先ずそのラ
ベル名の圧縮ラベル名を前述のようにしてを求め(31
)、次にその圧縮ラベル名からハツシュ値を得てインデ
ックスを得る(S2)。
次に、この求めたインデックスに対応してラベル情報ポ
インタ列13に格納されているポインタ値をもとに、ラ
ベル名対ラベル情報チェーン14をたどりそこに登録さ
れている2バイトまたは4バイトの圧縮ラベル名と、捜
索すべきラベルの圧縮ラベル名とを比較する(S3)、
この比較処理S3は、捜索すべき圧縮ラベル名と登録さ
れた圧縮ラベル名とが一致するまで、同一ハツシュ値に
よる主記憶装置上のチェーン14上を捜索する。次に、
登録処理S4において、ラベル比較処理S3で捜索した
結果同一ラベル名が存在した時はエラーとし、存在しな
かった場合は同一ハツシュ値の主記憶装置上のチェーン
14の最後に、文字圧縮処理S1で求めた圧縮ラベル名
とこれに対応するラベル情報とを組にしたラベル名対ラ
ベル情報を新たに登録する。
(参照時) 捜索すべきラベル名が与えられると、言語処理プログラ
ム12は、第2図に示すように文字圧縮処理SL、ハツ
シュインデックス値変換処理S2゜ラベル比較処理S3
.参照処理S5を実施する。
このうら、文字圧縮処理Sl、ハツシュインデックス値
変換処理S2.  ラベル比較処理S3における処理は
登録時と同じである。参照処理S5においては、ラベル
比較処理S3での捜索により同一ラベル名が存在した時
はその圧縮ラベル名と対にして格納されているラベル情
報を要求元に返送し、同一ラベル名が存在しなかった場
合にはエラーとして要求元に通知する。
〔発明の効果〕
以上説明したように、本発明では、ラベル名対ラベル情
報チェーンの各ラベル名対ラベル情報に登録するラベル
名は、従来のJIS8形式で表されたラベル名のビット
数を圧縮した圧縮ラベル名としたので、主記憶装置上の
ラベル名の記憶に要する容量を節約できると共に、文字
長が減少したことでラベル名捜索時に該当ラベル名か否
かを調べるための命令上の比較回数が減り処理速度を向
上することが可能となる。
【図面の簡単な説明】
第1図は本発明の実施例のブロック図、第2図は本発明
の実施例の処理の流れ図および、第3図は従来例の説明
図である。 図において、10は中央処理Vi置、11は上記tα装
置、12は言語処理プログラム、13はラベル情fVi
ポインタ列、14はラベル名対ラベル情報チェーン、1
4a、14bは同一ハツシュ値のラベル名対ラベル情報
である。

Claims (1)

  1. 【特許請求の範囲】 ラベル名をある種のハッシュロジックにより分類して得
    たハッシュ値をインデックスとして持ち、各インデック
    スの指示するエントリにラベル情報へのポインタ値を記
    憶したラベル情報ポインタ手段と、 ラベル名と該ラベル名に対応するラベル情報とを組にし
    たラベル名対ラベル情報を、前記ラベル情報ポインタ手
    段の同一ポインタ値に対応してチェーン化したラベル名
    対ラベル情報チェーンとを備え、 捜索すべきラベル名が与えられたとき、該捜索ラベル名
    に対応するラベル情報を、前記ラベル情報ポインタ手段
    および前記ラベル名対ラベル情報チェーンを用いて捜索
    する言語処理プログラムにおけるラベル情報の登録・参
    照方式において、前記ラベル名対ラベル情報チェーンの
    各ラベル名対ラベル情報に登録するラベル名を、該ラベ
    ル名のビット数を圧縮した圧縮ラベル名にすると共に該
    圧縮ラベル名をある種のハッシュロジックにより分類し
    て得たハッシュ値を前記ラベル情報ポインタ手段のイン
    デックスとし、且つ、捜索すべきラベル名が与えられた
    とき、該捜索ラベル名の圧縮ラベル名とハッシュ値を求
    め、該ハッシュ値をインデックスとして前記ラベル情報
    ポインタ手段からポインタ値を取得し、該取得したポイ
    ンタ値に対応する前記ラベル名対ラベル情報チェーンに
    おける圧縮ラベル名と捜索すべきラベル名の圧縮ラベル
    名との比較により目的とするラベル情報を得るようにし
    たことを特徴とする言語処理プログラムにおけるラベル
    情報の登録・参照方式。
JP61011406A 1986-01-22 1986-01-22 言語処理プログラムにおけるラベル情報の登録・参照方式 Pending JPS62169273A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61011406A JPS62169273A (ja) 1986-01-22 1986-01-22 言語処理プログラムにおけるラベル情報の登録・参照方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61011406A JPS62169273A (ja) 1986-01-22 1986-01-22 言語処理プログラムにおけるラベル情報の登録・参照方式

Publications (1)

Publication Number Publication Date
JPS62169273A true JPS62169273A (ja) 1987-07-25

Family

ID=11777137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61011406A Pending JPS62169273A (ja) 1986-01-22 1986-01-22 言語処理プログラムにおけるラベル情報の登録・参照方式

Country Status (1)

Country Link
JP (1) JPS62169273A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01267736A (ja) * 1988-04-19 1989-10-25 Nec Corp 言語処理プログラムの定数展開処理方式
JPH0219724A (ja) * 1988-07-08 1990-01-23 Hitachi Denshi Service Kk 音響スペクトル測定装置
JPH0612572A (ja) * 1992-06-26 1994-01-21 Sharp Corp 金銭登録機

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01267736A (ja) * 1988-04-19 1989-10-25 Nec Corp 言語処理プログラムの定数展開処理方式
JPH0219724A (ja) * 1988-07-08 1990-01-23 Hitachi Denshi Service Kk 音響スペクトル測定装置
JPH0551852B2 (ja) * 1988-07-08 1993-08-03 Hitachi Denshi Service Kk
JPH0612572A (ja) * 1992-06-26 1994-01-21 Sharp Corp 金銭登録機

Similar Documents

Publication Publication Date Title
US7451143B2 (en) Programmable rule processing apparatus for conducting high speed contextual searches and characterizations of patterns in data
JP3152868B2 (ja) 検索装置および辞書/テキスト検索方法
JP3889762B2 (ja) データ圧縮方法、プログラム及び装置
US4780810A (en) Data processor with associative memory storing vector elements for vector conversion
JPS62169273A (ja) 言語処理プログラムにおけるラベル情報の登録・参照方式
JP2880199B2 (ja) 記号列検索方法および検索装置
JPH06290021A (ja) ソースプログラム圧縮方法
JP2772125B2 (ja) 辞書検索方式
JP2772124B2 (ja) 辞書検索方式
JPH06162096A (ja) レコード検索方法
JP3127869B2 (ja) 類似データ抽出システム及びその方法
JPS6373422A (ja) 情報検索装置
CN114676289A (zh) 前缀树的处理方法、装置、终端及存储介质
JP2001195413A (ja) 文字列検索装置および文字列検索方法
JPH0496868A (ja) 辞書検索方式
JP3018579B2 (ja) 名前検索処理装置
JPS6330935A (ja) テ−ブルルツクアツプ装置
JPH0528194A (ja) データアクセス方式
JPH0546666A (ja) 情報検索装置
JPH09101965A (ja) 情報登録方法および情報検索方法
JPS63170742A (ja) 共通文字列検索処理装置
JPS63296147A (ja) デ−タ圧縮処理方式
JPH0262684A (ja) オンライン手書き文字の認識装置
JPH0736187B2 (ja) 情報処理装置
JPS6295628A (ja) インデクスキ−管理方式