JPS60151779A - 辞書検索方式 - Google Patents

辞書検索方式

Info

Publication number
JPS60151779A
JPS60151779A JP59007117A JP711784A JPS60151779A JP S60151779 A JPS60151779 A JP S60151779A JP 59007117 A JP59007117 A JP 59007117A JP 711784 A JP711784 A JP 711784A JP S60151779 A JPS60151779 A JP S60151779A
Authority
JP
Japan
Prior art keywords
key
character
record
dictionary
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59007117A
Other languages
English (en)
Inventor
Masahiro Abe
正博 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59007117A priority Critical patent/JPS60151779A/ja
Publication of JPS60151779A publication Critical patent/JPS60151779A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明のオU用分野〕 不発明はファイルの検索方式に係り、特に与えられた文
字列と辞書ファイルとの最長一致恢索を効率よく行なう
方式に関する。
〔発明の背景〕
従来の最長一致法による辞薔検系は、昭和48年NHK
技術研死第25巻第5号「計算戦によるカナ漢字変換」
の中に述べられているように、与えられた文字列をキー
として辞書を検索し、該当するレコードが見つからない
場合は与えらIした文字列の末尾を1字Fi1」って新
たにキーとし、辞書検索?行い、該当するキーのレコー
ドが見つかるまで繰返す方式を用いていたので、与えら
れた文字列長’r N 、 目的とするレコードのキー
の窒白でない文子列長をMとすると、該当するレコード
を見つけるまで1〜−IVi+1回の辞書慎索奮竹う心
安があった。
〔発明の目的〕
不発明の目的は、最長−叙法による辞書検索における無
駄な検索回数を低減する方式を提供することにある。
〔発明の概賛〕
与えられtc長さNの文字列Aをal a2 a3・・
・ai・・・aHと表わし、空白文字をΔで表わすとす
る。ただしal≠Δ(i=1〜N)。またAの先頭から
i番目までの部分文字列k A +とする。よってAt
 =al )Ax =aI B2.At =ataz・
・・a I、 AN= A= at at・・・a、と
なる。各文字に対し数値で表現される1つのキャラクタ
コードが定義されておpl Δのキャラクタコードは他
のどの文字のキャラクタコードよシ小さいとする。m個
の連続する空白文字をΔmで表わす。
辞書のi番目のレコードのキーをB、とし、その又字列
をす、 b、 B3・・・bk・・・bLと表わす。た
だしLはレコードのキーの長さとする(L≧N)。また
bhはΔでもよいとするただしbk−Δlらばb k+
l = b k+2−・・・bL=Δでりるとする。す
なわちキーの文字は圧づめで人っているとする。
八1の後ろにΔL−霞工絖く又字列をAI’と表わすと
すると、与えられた文壬列Aに対して経書の蹴艮一致検
累を行うといりことは、iが最大となるA r’= B
 4 の静−蓬のレコード−Hji氷めることでおる。
AI’をLヶのキャラクタコード列からなる数1直とみ
なすと、AI’<A2 ’ <・・・< A I’<・
・・(A N ’ となる。また静置のレコードがキー
の上昇1獣に配列されているとするとBl<B2<・・
・< HJ < Bj+1く・・・となる。
今与えられたキーに対して、等しいキーまたは等しいキ
ーが存在しないときはそのキーよシは小さくそのキーに
一番近いキーのことkKLE(Key Less or
 Equal)のキード呼フコ、!:に’iル。
AN’に対する辞書のKLEのキーをB、とすると、B
、≦AN’。B、=As’ ならばB1のレコードがめ
る或艮−牧のものである。もしB w (A N ’な
らばB y < A I’ < A N’を満すiの長
さのキーには最長−紋の解が存在せず、あるとしたらA
t’≦B、を満すものの中だけである。よって販艮一致
の解を見つけるにはAI’≦By(At’。! となる
As’7j”ら再び検索すればよいことになる。このよ
うなAI′はB、とi文字目までは一致しi +IX字
目で不−玖となるものであるから、幀局B1とAM’の
先頭から一致した文字列をめればそれがAt となる。
このAI′を耕しいキーとして上記のように辞書のKL
Eのキーをめる処理を等しいキーが得られるかまたはA
、/で等しいキーをめることに失敗するまで続ければ、
最長−蚊の答が得られるととKなる。
すなわち本方法によれば、AN’ 、 AN −+ ’
 + AN−2+・・・のように1又字ずつ縮めて辞書
を検索しなくてもAN’のKLEのレコードのキーと一
致部分をとることによって途中の無駄な検索金少なくす
ることが可能でるる。
〔発明の実施例〕
以下、本発明の一笑施列を詳細に説明する。
第1図において1はM艮−攻検索を制御する装置、2は
単語辞書装置、12のTルは与えられた文字列を保持す
るレジスタ、13のKRは年給辞書2に対する横系のキ
ーを保持するレジスタ、140i(比はKl(、に対す
る読出しレコードを保持するレジスタ、11は読み出し
の制御を行う制御部を表わす。
第2図は読み出し制−1llの詳細を表わす図で、30
00のCMPAtiK几13とRル14のデータを比威
し1002によシ結果を報廿する比戟器、2000の5
ELAはK1−113に格納すべきデータを選択する選
択器、1000は制一部を表わす。
第3図は1lL14の構成?示す図でキ一部1−LH,
にとデータ部RRDよりなる。
第4図は制御部1000の処理を示すフローチャートで
める。
外ff1X(図示せず)より第1図のライン110を辿
して伐木文字列が与えられると共にライ/12゜により
横木指示が与えられる。羊語辞薔2には第5図1cボす
キーを狩りレコードが格調されているとする。
以下第4図のフローチャートに従って本夾施例の動作を
説明する。
i1ステップ:与えられた又字列を’1’)1.12に
格納しそのデータをKR13にセットする。)Ar又字
列として「プンシ仔すョウカラ」が与えられたとする。
第2ステップ:Kn、ta2キーとして率飴静書2にK
LEのキーを待つレコードの検累狭求を出す。単語辞書
2は検索を行い第6図のように「ブンシリョウカラ」を
越えず敢も近いレコードの千−「ブンショウΔΔへ」を
探し出しR几14にセットする。
第3ステップ:K)Li2とR几14の先頭1文字をC
MPA3000によシ比較する。
第4ステップ:比較の結果一致がとれたので第5ステッ
プ第1項に進む。
第5ステツプ二゛まだ比較していない文字がKR13に
残っているので第3ステツプに戻る。
第3ステツフ゛二KR13とit凡14の次の1又字を
CMPA3000によシ比較する。
′@4ステップ:比収の結果一致がとれたので第5ステ
ップ第1項に進む。
以下同様にして、第3文字目までの比較が行なわれ一致
がとれる。第4文字目の比較で一致がとれず第5ステッ
プ第2項に進む。
第5ステップ:KI:Li2の第4文字目で失敗でおる
ので第6ステップ第2項に進む。
第6ステツプ:KR13の4又字目以降紫空臼と、LK
R13は「ブンシ△△△△Δ」となる。仄に第2ステツ
プに進みこのKtt13i用いて前と同様の処理を繰返
す。その結果、Rル14のR几Kには「ブンシ△△△△
Δ」が横系されて格納される。今度はKR13と全文字
で比較が一致し、結局「ブンシΔΔ△Δ△」のレコード
がめる最長一致のレコードとなシ第6ステツプ第2項で
制御部1000はライン130を通して層重を報告する
不笑施劉によれば、上の動作の説明で述べたごとく、最
長一致のレコードを得るまでの構案回数を従来の1文字
ずつ縮めながら検索する場合にくらべて減少させる効果
がある。
〔発明の効果〕
本発明によれば、最長一致のレコード?慣索する回数を
減少させることができるので、本発明を仮名漢字変換に
適用すれば質侠処理時間の減少すなわち、変換速度の同
上をもたらす効果かめる。
【図面の簡単な説明】
第1図は本発明の一実施例になる最長一致検索のための
1till XJ装置のブロック図、第2図は読み出し
制御部のブロック図、第3図は辞$vコードの構成図、
第4図は制御の動作を表わすフローチャート図、第5図
は辞書の内容を表わす模式図、第6図は!幼作の説明を
補足する図でめる。 12・・・文字列を保持するレジスタ、13・・・単語
辞書に対する検索キーを保持するレジスタ、14・・・
単語辞書からの読み出しレコードを保持するレジスタ、
3000・・・データ比収器、2000・・・データ選
V2図 等4図

Claims (1)

    【特許請求の範囲】
  1. キーの上昇順に配列されたレコードからなる辞書ファイ
    ルと、与えられたキーに対して、等しいキーまたは等し
    いキーが存任しないときはそのキーより小さく一番その
    キーに近いキーヶ持つレコードを検索する機構と、横系
    されたレコード?保持する機構と、検索に用いたキーと
    検索されたレコードのキーの先頭からの一致部分を検出
    する機構と、その一致部分を用いて新たにキーを設定す
    る機構と°を持ち、横系に用いた斤−と検索されたレコ
    ードのキーが一致するが、811者および佐省のキーの
    1文字目が不一致となるまでキーを設足しなおしながら
    検索を繰返すこと(f−%徴とする辞書検索方式。
JP59007117A 1984-01-20 1984-01-20 辞書検索方式 Pending JPS60151779A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59007117A JPS60151779A (ja) 1984-01-20 1984-01-20 辞書検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59007117A JPS60151779A (ja) 1984-01-20 1984-01-20 辞書検索方式

Publications (1)

Publication Number Publication Date
JPS60151779A true JPS60151779A (ja) 1985-08-09

Family

ID=11657139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59007117A Pending JPS60151779A (ja) 1984-01-20 1984-01-20 辞書検索方式

Country Status (1)

Country Link
JP (1) JPS60151779A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06139288A (ja) * 1992-03-23 1994-05-20 Matsushita Electric Ind Co Ltd 光ディスク検索装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06139288A (ja) * 1992-03-23 1994-05-20 Matsushita Electric Ind Co Ltd 光ディスク検索装置

Similar Documents

Publication Publication Date Title
JPH08194719A (ja) 検索装置および辞書/テキスト検索方法
CN111984673B (zh) 一种电网电能量计量系统树形结构模糊检索方法和装置
JPS60151779A (ja) 辞書検索方式
JPS617936A (ja) 情報検索方式
Roberts Help: a question answering system
JPS6049931B2 (ja) 情報検索方式
JPS61141036A (ja) デ−タ検索方式
JPH07210565A (ja) 情報検索方法及び装置
JPH03127254A (ja) 単語検索装置
JPH0353378A (ja) 同音異字および異字同音の姓を検索する氏名検索方式
JPH0227423A (ja) 日本語文字データの並び換え方法
JPS617937A (ja) 知識の連想検索方式
JPS59100939A (ja) 日本語入力装置
JPH01219927A (ja) データベースの情報検索方式
JPS58144251A (ja) 漢字熟語入力装置
JPH0342774A (ja) 情報処理装置
JPS62298869A (ja) 文尾変換方式
JPS5850044A (ja) インデクス・レコ−ドの検索処理方式
JPS6243769A (ja) 仮名漢字変換装置
JPS63229523A (ja) 情報処理装置
JPS61285573A (ja) 仮名漢字変換装置
JPH0244467A (ja) 単語辞書検索装置
Marron et al. Chemical Substructure Searching with Linear Notations.
JPH0434645A (ja) 文書検索装置
JPS588379A (ja) 仮名漢字変換方式