JPS5947669A - 辞書検索装置 - Google Patents
辞書検索装置Info
- Publication number
- JPS5947669A JPS5947669A JP57159243A JP15924382A JPS5947669A JP S5947669 A JPS5947669 A JP S5947669A JP 57159243 A JP57159243 A JP 57159243A JP 15924382 A JP15924382 A JP 15924382A JP S5947669 A JPS5947669 A JP S5947669A
- Authority
- JP
- Japan
- Prior art keywords
- try
- dictionary
- search
- signal
- kanji
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、辞書検索装置、特に、辞書ファイルの高速検
索を行なうための辞書検索装置に関する。
索を行なうための辞書検索装置に関する。
従来の辞書検索装置は、カナ、ひらがな見出し語をもつ
辞書ファイル検索では、ハツシュ法、インデクス法、ト
ライ法等にもとづいた検索方式が提案され°C′いるが
、それらはソフト的に実現されるのが通常であり、高速
性に欠けるという欠点があった。
辞書ファイル検索では、ハツシュ法、インデクス法、ト
ライ法等にもとづいた検索方式が提案され°C′いるが
、それらはソフト的に実現されるのが通常であり、高速
性に欠けるという欠点があった。
また従来の他の、辞書検索装置は、漢字見出しをもつ辞
書ファイル検索では、バッジ−法においてはユリジ目ン
の頻発、インデクス法、トライ法ではインデクストライ
本の爆発的増大等、漢字字種の多様さから発生する問題
すなわち、記憶容量が多大になったシ検索効率が悪いと
いう問題を解決できないという欠点があった。
書ファイル検索では、バッジ−法においてはユリジ目ン
の頻発、インデクス法、トライ法ではインデクストライ
本の爆発的増大等、漢字字種の多様さから発生する問題
すなわち、記憶容量が多大になったシ検索効率が悪いと
いう問題を解決できないという欠点があった。
本発明の目的は高速化できるとともに記憶容量を削減し
検索効率を向上できる辞書検索装琴ヲ提供することにあ
る。
検索効率を向上できる辞書検索装琴ヲ提供することにあ
る。
すなわち、本発明の目的は上述の欠点を補うべく漢字カ
ナ混じシコード見出し語の辞書ファイル全高速に検索で
きる辞書検索装置を提供することにある。
ナ混じシコード見出し語の辞書ファイル全高速に検索で
きる辞書検索装置を提供することにある。
本発明の辞書検索装置は、漢字・カナ混じり見出し語金
もつ辞書ファイルの検索装置において、辞書ファイルを
格納する電子辞書ファイル装置と、前記辞書ファイルを
検索する電子ファイル検索機構と、見出し語と前記辞書
フ・rイル装置中のエントリーヲ対応付けるトライ構造
を格納するトライ記憶装置と、前記トライ構造子検索す
るトライ検索機構と、前記トライ検索機構を用いて前記
電子辞書ファイル検索機構を起動するトライ選択機構と
、辞書検索装置への入力および出力を管理し前記トライ
選択機構を制御する制御機構゛とを含んで構成される。
もつ辞書ファイルの検索装置において、辞書ファイルを
格納する電子辞書ファイル装置と、前記辞書ファイルを
検索する電子ファイル検索機構と、見出し語と前記辞書
フ・rイル装置中のエントリーヲ対応付けるトライ構造
を格納するトライ記憶装置と、前記トライ構造子検索す
るトライ検索機構と、前記トライ検索機構を用いて前記
電子辞書ファイル検索機構を起動するトライ選択機構と
、辞書検索装置への入力および出力を管理し前記トライ
選択機構を制御する制御機構゛とを含んで構成される。
本発明の実施例について具体的に説明するまえに、本発
明の基礎となるトライ法に関する基本的概念について述
べる。
明の基礎となるトライ法に関する基本的概念について述
べる。
トライ手法は、比較的文字セットが小さい見出し語金も
つ辞書検索手法として多くの場で使われている。例えば
、英文字見出しを持つ辞書検索では1つのトライ木ノー
ドは26個のレコードによって実現され、各々は各々の
英字a −zの1つに対応する。各々のレコードは英文
字コードに対応する第1フイールドF1と、その英文字
で終わる語の格納アドレスを保持する第2フイールドF
2と、その英文字に後接する文字全ホイントするトライ
木ノードのアドレスを持つ第3フイフルト1(3とから
なる。
つ辞書検索手法として多くの場で使われている。例えば
、英文字見出しを持つ辞書検索では1つのトライ木ノー
ドは26個のレコードによって実現され、各々は各々の
英字a −zの1つに対応する。各々のレコードは英文
字コードに対応する第1フイールドF1と、その英文字
で終わる語の格納アドレスを保持する第2フイールドF
2と、その英文字に後接する文字全ホイントするトライ
木ノードのアドレスを持つ第3フイフルト1(3とから
なる。
こうしたトライ木構造を用いて、入力文字の先頭から1
文字づつトライ本をたどってその語の内容を格納した辞
書アドレスを発見し読み出し全行なう。
文字づつトライ本をたどってその語の内容を格納した辞
書アドレスを発見し読み出し全行なう。
漢字コード見出しの場合その′−!マその字種全トライ
本ノードに写像すると1つが大きくな−シすぎ、高速メ
モリ上に格納することができなくなる。
本ノードに写像すると1つが大きくな−シすぎ、高速メ
モリ上に格納することができなくなる。
本発明では、漢字(通常2バイトで表わされる)、かな
(2バイトあるいは1バイトで表わされる)の1部の4
ビツト(2=16)f、用いてトライ衣を構成すること
によシトライ水の過大化、トライ水選択回路の過大化を
避けることができる。
(2バイトあるいは1バイトで表わされる)の1部の4
ビツト(2=16)f、用いてトライ衣を構成すること
によシトライ水の過大化、トライ水選択回路の過大化を
避けることができる。
本発明によれば、辞書内容を保持する電子辞書ファイル
装置と、トライ格納用トライ記憶装置と、トライ検索機
構と、電子辞書検索機構と、トライ選択機構と、これら
を制御する制御機構とからなる辞書検索装置が得られる
。
装置と、トライ格納用トライ記憶装置と、トライ検索機
構と、電子辞書検索機構と、トライ選択機構と、これら
を制御する制御機構とからなる辞書検索装置が得られる
。
次に、本発明の実施例について、図面を参照して説明す
る。
る。
第1図は本発明の一実施例を示すブロック図である。
第1図において漢字あるいは、ひらがな、カナコードの
ビット列である見出し語01が制御機構1に入力される
と、この制御装置1は、見出、し語01の入力ビソト列
1r、4ビットのビット列に分解し最初の4ビツトで構
成されるビット列信号12とトライ選択機構2へ送信す
る。
ビット列である見出し語01が制御機構1に入力される
と、この制御装置1は、見出、し語01の入力ビソト列
1r、4ビットのビット列に分解し最初の4ビツトで構
成されるビット列信号12とトライ選択機構2へ送信す
る。
以後、前記トライ選択機構2から起動信号21を受は取
るたびに、次々と4ビツト情報からなるビット列信号1
2を送出し、情報がなくなった時点で見出し語01を入
力するための入力モードとなる。
るたびに、次々と4ビツト情報からなるビット列信号1
2を送出し、情報がなくなった時点で見出し語01を入
力するための入力モードとなる。
トライ選択機構2は第2図に示すトライ本節構造に対応
するセルを1つ保持する能力があり、以下の処理を行な
う。
するセルを1つ保持する能力があり、以下の処理を行な
う。
第2図に示すトライ本節構造は16コのレコードからな
り、1つのレコードは3つのフィールドからなる。第1
フイールドF1は4ビツト情報で文字コード中にある4
ビツトコードの全ての種類の中の1つでキーエリアと呼
ぶ。第2フイールドF2は電子辞書ファイル6中へのポ
インタアドレス金保持する。第3フイールドF3は接続
するトライ木セルへのポインターアドレスを保持する。
り、1つのレコードは3つのフィールドからなる。第1
フイールドF1は4ビツト情報で文字コード中にある4
ビツトコードの全ての種類の中の1つでキーエリアと呼
ぶ。第2フイールドF2は電子辞書ファイル6中へのポ
インタアドレス金保持する。第3フイールドF3は接続
するトライ木セルへのポインターアドレスを保持する。
トライ選択機構2はビット列信号12全受信すると、そ
の4ビツトと一致する第1フイールドF1の値をもつレ
コードt−16コのレコードの中から選択し、第2フイ
ールドF2の中のポインタアドレス信号25を電子辞書
検索機構5へ送る。これと同時に第3フイールドF3か
ら得られたポインタアドレス信号23をトライ検索機構
3へ送信する。
の4ビツトと一致する第1フイールドF1の値をもつレ
コードt−16コのレコードの中から選択し、第2フイ
ールドF2の中のポインタアドレス信号25を電子辞書
検索機構5へ送る。これと同時に第3フイールドF3か
ら得られたポインタアドレス信号23をトライ検索機構
3へ送信する。
また、このとき、起動信号21が前記制御機構1へ送ら
れる。
れる。
ポインタアドレス信号25fc受けとった電子辞書検索
機構5は、アドレス変換を行なったのちアドレスを含む
辞書読み出し起動信号56を送信し、辞書読出信号65
を受信するとともに、出力信号50全出力する。その際
入力信号中のアドレス情報が全て”O′°なら動作しな
い。
機構5は、アドレス変換を行なったのちアドレスを含む
辞書読み出し起動信号56を送信し、辞書読出信号65
を受信するとともに、出力信号50全出力する。その際
入力信号中のアドレス情報が全て”O′°なら動作しな
い。
供給されたポインタアドレス信号23は前記トライ検索
機構3でアドレス変換爆れ、トライ記憶装置4に読出信
号34として送信され、その1セルから読み出された出
力信号43を出力信号32としてトライ選択機構3に送
る。このときポインタアドレス信号23が全て“0”な
らば停止信号31を出力する。停止信号31金受けとっ
た前記制御機構1はモード全人カモードに変更する。
機構3でアドレス変換爆れ、トライ記憶装置4に読出信
号34として送信され、その1セルから読み出された出
力信号43を出力信号32としてトライ選択機構3に送
る。このときポインタアドレス信号23が全て“0”な
らば停止信号31を出力する。停止信号31金受けとっ
た前記制御機構1はモード全人カモードに変更する。
本発明の辞書検索装置は速度、記憶量両側面においてI
漢字、カナ混り見出し語を持つ電子辞書ファイルの検索
を効率よく実行できるという効果がある。
漢字、カナ混り見出し語を持つ電子辞書ファイルの検索
を効率よく実行できるという効果がある。
また上述した辞書検索装置で用いた4ピットトライ手法
は漢字、カナに限らず、文字種の多い見出し語を持つ辞
書の検索機構として容易に利用することができるととも
K、このような辞書検索装置を用いることにより、分か
ち書き装置、構文解析装置等の開発の基本機能をより効
率化することが可能である。
は漢字、カナに限らず、文字種の多い見出し語を持つ辞
書の検索機構として容易に利用することができるととも
K、このような辞書検索装置を用いることにより、分か
ち書き装置、構文解析装置等の開発の基本機能をより効
率化することが可能である。
第1図は本発明による辞書検索装置の一実施例を示すブ
ロック図、第2図は第1図に示すドライド・・・・・制
御機構、2・・・・・・トライ選択機構、3・・・・・
・トライ検索機構、4・・・・・・トライ記憶装置、5
・・・・・・電子辞書ファイル検索機構、6・・・・・
・電子辞書ファイル装置、 01・・・・・・見出し1語、10・・・・・・出力信
号、12・・・・・・ビット列信号、2ト旧・・起動信
号、22・・・・・・ポインタアドレス信号、25・・
・・・・ポインタアドレス信号、31・・・・・・停止
信号、32・・・・・・出力信号、34・・・・・・読
出信号、43・・・・・・出力信号、50・・・・・・
出力信号、56・・・・・・辞書読出起動信号、65・
・・・・辞書読出信号、 Fl・・・・・・第1フイールド、F2・・・・・・第
2フイールド、F3・・・・・・第3フイールド。 361 第 l 図 K bit 茅 2 図
ロック図、第2図は第1図に示すドライド・・・・・制
御機構、2・・・・・・トライ選択機構、3・・・・・
・トライ検索機構、4・・・・・・トライ記憶装置、5
・・・・・・電子辞書ファイル検索機構、6・・・・・
・電子辞書ファイル装置、 01・・・・・・見出し1語、10・・・・・・出力信
号、12・・・・・・ビット列信号、2ト旧・・起動信
号、22・・・・・・ポインタアドレス信号、25・・
・・・・ポインタアドレス信号、31・・・・・・停止
信号、32・・・・・・出力信号、34・・・・・・読
出信号、43・・・・・・出力信号、50・・・・・・
出力信号、56・・・・・・辞書読出起動信号、65・
・・・・辞書読出信号、 Fl・・・・・・第1フイールド、F2・・・・・・第
2フイールド、F3・・・・・・第3フイールド。 361 第 l 図 K bit 茅 2 図
Claims (1)
- 漢字・カナ混じり見出し語をもつ辞書ファイルの検索装
置において、辞書ファイlLf格納する電子辞書ファイ
ル装置と、前記辞書ファイルを検索する電子ファイル検
索機構と、見出し語と前記辞書ファイルのエントリーヲ
対応付けるトライ構造を格納するトライ記憶装置と、前
記トライ構造を検索するトライ検索機構と、前記トライ
検索機構を用いて前記電子辞書゛ファイル検索機構を起
動するトライ選択機構と、辞書検索装置への入力および
出力を管理し前記トライ選択機構を制御する制御機構と
を含むことを特徴とする辞書検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57159243A JPS5947669A (ja) | 1982-09-13 | 1982-09-13 | 辞書検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57159243A JPS5947669A (ja) | 1982-09-13 | 1982-09-13 | 辞書検索装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5947669A true JPS5947669A (ja) | 1984-03-17 |
Family
ID=15689469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57159243A Pending JPS5947669A (ja) | 1982-09-13 | 1982-09-13 | 辞書検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5947669A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6280043A (ja) * | 1985-09-30 | 1987-04-13 | ダブリュー・アール・グレイス・アンド・カンパニー―コネチカツト | 熱可塑性多層包装フイルム |
US9465860B2 (en) | 2009-03-19 | 2016-10-11 | Fujitsu Limited | Storage medium, trie tree generation method, and trie tree generation device |
-
1982
- 1982-09-13 JP JP57159243A patent/JPS5947669A/ja active Pending
Non-Patent Citations (1)
Title |
---|
THE ART OF COMPUTER PROGRAMMING VOL.3 SORTING AND SEARCHING=1973 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6280043A (ja) * | 1985-09-30 | 1987-04-13 | ダブリュー・アール・グレイス・アンド・カンパニー―コネチカツト | 熱可塑性多層包装フイルム |
JPH0378065B2 (ja) * | 1985-09-30 | 1991-12-12 | Grace W R & Co | |
US9465860B2 (en) | 2009-03-19 | 2016-10-11 | Fujitsu Limited | Storage medium, trie tree generation method, and trie tree generation device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4959785A (en) | Character processing system with spelling check function that utilizes condensed word storage and indexed retrieval | |
US5099426A (en) | Method for use of morphological information to cross reference keywords used for information retrieval | |
US6862602B2 (en) | System and method for rapidly identifying the existence and location of an item in a file | |
US6212525B1 (en) | Hash-based system and method with primary and secondary hash functions for rapidly identifying the existence and location of an item in a file | |
EP0304302A3 (en) | Data retrieval system | |
CN105404677A (zh) | 一种基于树形结构的检索方法 | |
JPS6033665A (ja) | キ−ワ−ド自動抽出方式 | |
JPS5947669A (ja) | 辞書検索装置 | |
CN105426490A (zh) | 一种基于树形结构的索引方法 | |
JPH056398A (ja) | 文書登録装置及び文書検索装置 | |
JPS63136224A (ja) | キ−ワ−ド自動抽出装置 | |
JPH09114856A (ja) | 検索用索引生成装置 | |
JPS6162163A (ja) | 日本語ワ−ドプロセツサ装置 | |
Paijmans | Free text data bases on small computers | |
JP2751681B2 (ja) | 文書検索装置 | |
JPS5727366A (en) | Electronic translator | |
Kaufman | The IBM information retrieval center-(ITIRC) system techniques and applications | |
JPH07182353A (ja) | 自己学習型文書検索方法およびその検索装置 | |
JPS6389976A (ja) | 言語解析装置 | |
Kelly et al. | Glossary Lookup Made Easy | |
JPH0531788B2 (ja) | ||
JPH03127254A (ja) | 単語検索装置 | |
Rubinoff | Man-Machine Communication Through a Teletypewriter. | |
JP2002063202A (ja) | 情報検索システムおよび方法 | |
JPS60211540A (ja) | デ−タ検索回路 |