JPS5947669A - 辞書検索装置 - Google Patents

辞書検索装置

Info

Publication number
JPS5947669A
JPS5947669A JP57159243A JP15924382A JPS5947669A JP S5947669 A JPS5947669 A JP S5947669A JP 57159243 A JP57159243 A JP 57159243A JP 15924382 A JP15924382 A JP 15924382A JP S5947669 A JPS5947669 A JP S5947669A
Authority
JP
Japan
Prior art keywords
try
dictionary
search
signal
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57159243A
Other languages
English (en)
Inventor
Kazushi Muraki
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP57159243A priority Critical patent/JPS5947669A/ja
Publication of JPS5947669A publication Critical patent/JPS5947669A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、辞書検索装置、特に、辞書ファイルの高速検
索を行なうための辞書検索装置に関する。
従来の辞書検索装置は、カナ、ひらがな見出し語をもつ
辞書ファイル検索では、ハツシュ法、インデクス法、ト
ライ法等にもとづいた検索方式が提案され°C′いるが
、それらはソフト的に実現されるのが通常であり、高速
性に欠けるという欠点があった。
また従来の他の、辞書検索装置は、漢字見出しをもつ辞
書ファイル検索では、バッジ−法においてはユリジ目ン
の頻発、インデクス法、トライ法ではインデクストライ
本の爆発的増大等、漢字字種の多様さから発生する問題
すなわち、記憶容量が多大になったシ検索効率が悪いと
いう問題を解決できないという欠点があった。
本発明の目的は高速化できるとともに記憶容量を削減し
検索効率を向上できる辞書検索装琴ヲ提供することにあ
る。
すなわち、本発明の目的は上述の欠点を補うべく漢字カ
ナ混じシコード見出し語の辞書ファイル全高速に検索で
きる辞書検索装置を提供することにある。
本発明の辞書検索装置は、漢字・カナ混じり見出し語金
もつ辞書ファイルの検索装置において、辞書ファイルを
格納する電子辞書ファイル装置と、前記辞書ファイルを
検索する電子ファイル検索機構と、見出し語と前記辞書
フ・rイル装置中のエントリーヲ対応付けるトライ構造
を格納するトライ記憶装置と、前記トライ構造子検索す
るトライ検索機構と、前記トライ検索機構を用いて前記
電子辞書ファイル検索機構を起動するトライ選択機構と
、辞書検索装置への入力および出力を管理し前記トライ
選択機構を制御する制御機構゛とを含んで構成される。
本発明の実施例について具体的に説明するまえに、本発
明の基礎となるトライ法に関する基本的概念について述
べる。
トライ手法は、比較的文字セットが小さい見出し語金も
つ辞書検索手法として多くの場で使われている。例えば
、英文字見出しを持つ辞書検索では1つのトライ木ノー
ドは26個のレコードによって実現され、各々は各々の
英字a −zの1つに対応する。各々のレコードは英文
字コードに対応する第1フイールドF1と、その英文字
で終わる語の格納アドレスを保持する第2フイールドF
2と、その英文字に後接する文字全ホイントするトライ
木ノードのアドレスを持つ第3フイフルト1(3とから
なる。
こうしたトライ木構造を用いて、入力文字の先頭から1
文字づつトライ本をたどってその語の内容を格納した辞
書アドレスを発見し読み出し全行なう。
漢字コード見出しの場合その′−!マその字種全トライ
本ノードに写像すると1つが大きくな−シすぎ、高速メ
モリ上に格納することができなくなる。
本発明では、漢字(通常2バイトで表わされる)、かな
(2バイトあるいは1バイトで表わされる)の1部の4
ビツト(2=16)f、用いてトライ衣を構成すること
によシトライ水の過大化、トライ水選択回路の過大化を
避けることができる。
本発明によれば、辞書内容を保持する電子辞書ファイル
装置と、トライ格納用トライ記憶装置と、トライ検索機
構と、電子辞書検索機構と、トライ選択機構と、これら
を制御する制御機構とからなる辞書検索装置が得られる
次に、本発明の実施例について、図面を参照して説明す
る。
第1図は本発明の一実施例を示すブロック図である。
第1図において漢字あるいは、ひらがな、カナコードの
ビット列である見出し語01が制御機構1に入力される
と、この制御装置1は、見出、し語01の入力ビソト列
1r、4ビットのビット列に分解し最初の4ビツトで構
成されるビット列信号12とトライ選択機構2へ送信す
る。
以後、前記トライ選択機構2から起動信号21を受は取
るたびに、次々と4ビツト情報からなるビット列信号1
2を送出し、情報がなくなった時点で見出し語01を入
力するための入力モードとなる。
トライ選択機構2は第2図に示すトライ本節構造に対応
するセルを1つ保持する能力があり、以下の処理を行な
う。
第2図に示すトライ本節構造は16コのレコードからな
り、1つのレコードは3つのフィールドからなる。第1
フイールドF1は4ビツト情報で文字コード中にある4
ビツトコードの全ての種類の中の1つでキーエリアと呼
ぶ。第2フイールドF2は電子辞書ファイル6中へのポ
インタアドレス金保持する。第3フイールドF3は接続
するトライ木セルへのポインターアドレスを保持する。
トライ選択機構2はビット列信号12全受信すると、そ
の4ビツトと一致する第1フイールドF1の値をもつレ
コードt−16コのレコードの中から選択し、第2フイ
ールドF2の中のポインタアドレス信号25を電子辞書
検索機構5へ送る。これと同時に第3フイールドF3か
ら得られたポインタアドレス信号23をトライ検索機構
3へ送信する。
また、このとき、起動信号21が前記制御機構1へ送ら
れる。
ポインタアドレス信号25fc受けとった電子辞書検索
機構5は、アドレス変換を行なったのちアドレスを含む
辞書読み出し起動信号56を送信し、辞書読出信号65
を受信するとともに、出力信号50全出力する。その際
入力信号中のアドレス情報が全て”O′°なら動作しな
い。
供給されたポインタアドレス信号23は前記トライ検索
機構3でアドレス変換爆れ、トライ記憶装置4に読出信
号34として送信され、その1セルから読み出された出
力信号43を出力信号32としてトライ選択機構3に送
る。このときポインタアドレス信号23が全て“0”な
らば停止信号31を出力する。停止信号31金受けとっ
た前記制御機構1はモード全人カモードに変更する。
本発明の辞書検索装置は速度、記憶量両側面においてI
漢字、カナ混り見出し語を持つ電子辞書ファイルの検索
を効率よく実行できるという効果がある。
また上述した辞書検索装置で用いた4ピットトライ手法
は漢字、カナに限らず、文字種の多い見出し語を持つ辞
書の検索機構として容易に利用することができるととも
K、このような辞書検索装置を用いることにより、分か
ち書き装置、構文解析装置等の開発の基本機能をより効
率化することが可能である。
【図面の簡単な説明】
第1図は本発明による辞書検索装置の一実施例を示すブ
ロック図、第2図は第1図に示すドライド・・・・・制
御機構、2・・・・・・トライ選択機構、3・・・・・
・トライ検索機構、4・・・・・・トライ記憶装置、5
・・・・・・電子辞書ファイル検索機構、6・・・・・
・電子辞書ファイル装置、 01・・・・・・見出し1語、10・・・・・・出力信
号、12・・・・・・ビット列信号、2ト旧・・起動信
号、22・・・・・・ポインタアドレス信号、25・・
・・・・ポインタアドレス信号、31・・・・・・停止
信号、32・・・・・・出力信号、34・・・・・・読
出信号、43・・・・・・出力信号、50・・・・・・
出力信号、56・・・・・・辞書読出起動信号、65・
・・・・辞書読出信号、 Fl・・・・・・第1フイールド、F2・・・・・・第
2フイールド、F3・・・・・・第3フイールド。 361 第 l 図 K bit 茅 2 図

Claims (1)

    【特許請求の範囲】
  1. 漢字・カナ混じり見出し語をもつ辞書ファイルの検索装
    置において、辞書ファイlLf格納する電子辞書ファイ
    ル装置と、前記辞書ファイルを検索する電子ファイル検
    索機構と、見出し語と前記辞書ファイルのエントリーヲ
    対応付けるトライ構造を格納するトライ記憶装置と、前
    記トライ構造を検索するトライ検索機構と、前記トライ
    検索機構を用いて前記電子辞書゛ファイル検索機構を起
    動するトライ選択機構と、辞書検索装置への入力および
    出力を管理し前記トライ選択機構を制御する制御機構と
    を含むことを特徴とする辞書検索装置。
JP57159243A 1982-09-13 1982-09-13 辞書検索装置 Pending JPS5947669A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57159243A JPS5947669A (ja) 1982-09-13 1982-09-13 辞書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57159243A JPS5947669A (ja) 1982-09-13 1982-09-13 辞書検索装置

Publications (1)

Publication Number Publication Date
JPS5947669A true JPS5947669A (ja) 1984-03-17

Family

ID=15689469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57159243A Pending JPS5947669A (ja) 1982-09-13 1982-09-13 辞書検索装置

Country Status (1)

Country Link
JP (1) JPS5947669A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6280043A (ja) * 1985-09-30 1987-04-13 ダブリュー・アール・グレイス・アンド・カンパニー―コネチカツト 熱可塑性多層包装フイルム
US9465860B2 (en) 2009-03-19 2016-10-11 Fujitsu Limited Storage medium, trie tree generation method, and trie tree generation device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
THE ART OF COMPUTER PROGRAMMING VOL.3 SORTING AND SEARCHING=1973 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6280043A (ja) * 1985-09-30 1987-04-13 ダブリュー・アール・グレイス・アンド・カンパニー―コネチカツト 熱可塑性多層包装フイルム
JPH0378065B2 (ja) * 1985-09-30 1991-12-12 Grace W R & Co
US9465860B2 (en) 2009-03-19 2016-10-11 Fujitsu Limited Storage medium, trie tree generation method, and trie tree generation device

Similar Documents

Publication Publication Date Title
US4959785A (en) Character processing system with spelling check function that utilizes condensed word storage and indexed retrieval
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
US6862602B2 (en) System and method for rapidly identifying the existence and location of an item in a file
US6212525B1 (en) Hash-based system and method with primary and secondary hash functions for rapidly identifying the existence and location of an item in a file
EP0304302A3 (en) Data retrieval system
CN105404677A (zh) 一种基于树形结构的检索方法
JPS6033665A (ja) キ−ワ−ド自動抽出方式
JPS5947669A (ja) 辞書検索装置
CN105426490A (zh) 一种基于树形结构的索引方法
JPH056398A (ja) 文書登録装置及び文書検索装置
JPS63136224A (ja) キ−ワ−ド自動抽出装置
JPH09114856A (ja) 検索用索引生成装置
JPS6162163A (ja) 日本語ワ−ドプロセツサ装置
Paijmans Free text data bases on small computers
JP2751681B2 (ja) 文書検索装置
JPS5727366A (en) Electronic translator
Kaufman The IBM information retrieval center-(ITIRC) system techniques and applications
JPH07182353A (ja) 自己学習型文書検索方法およびその検索装置
JPS6389976A (ja) 言語解析装置
Kelly et al. Glossary Lookup Made Easy
JPH0531788B2 (ja)
JPH03127254A (ja) 単語検索装置
Rubinoff Man-Machine Communication Through a Teletypewriter.
JP2002063202A (ja) 情報検索システムおよび方法
JPS60211540A (ja) デ−タ検索回路