JPS60151779A - 辞書検索方式 - Google Patents
辞書検索方式Info
- Publication number
- JPS60151779A JPS60151779A JP59007117A JP711784A JPS60151779A JP S60151779 A JPS60151779 A JP S60151779A JP 59007117 A JP59007117 A JP 59007117A JP 711784 A JP711784 A JP 711784A JP S60151779 A JPS60151779 A JP S60151779A
- Authority
- JP
- Japan
- Prior art keywords
- key
- character
- record
- dictionary
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明のオU用分野〕
不発明はファイルの検索方式に係り、特に与えられた文
字列と辞書ファイルとの最長一致恢索を効率よく行なう
方式に関する。
字列と辞書ファイルとの最長一致恢索を効率よく行なう
方式に関する。
従来の最長一致法による辞薔検系は、昭和48年NHK
技術研死第25巻第5号「計算戦によるカナ漢字変換」
の中に述べられているように、与えられた文字列をキー
として辞書を検索し、該当するレコードが見つからない
場合は与えらIした文字列の末尾を1字Fi1」って新
たにキーとし、辞書検索?行い、該当するキーのレコー
ドが見つかるまで繰返す方式を用いていたので、与えら
れた文字列長’r N 、 目的とするレコードのキー
の窒白でない文子列長をMとすると、該当するレコード
を見つけるまで1〜−IVi+1回の辞書慎索奮竹う心
安があった。
技術研死第25巻第5号「計算戦によるカナ漢字変換」
の中に述べられているように、与えられた文字列をキー
として辞書を検索し、該当するレコードが見つからない
場合は与えらIした文字列の末尾を1字Fi1」って新
たにキーとし、辞書検索?行い、該当するキーのレコー
ドが見つかるまで繰返す方式を用いていたので、与えら
れた文字列長’r N 、 目的とするレコードのキー
の窒白でない文子列長をMとすると、該当するレコード
を見つけるまで1〜−IVi+1回の辞書慎索奮竹う心
安があった。
不発明の目的は、最長−叙法による辞書検索における無
駄な検索回数を低減する方式を提供することにある。
駄な検索回数を低減する方式を提供することにある。
与えられtc長さNの文字列Aをal a2 a3・・
・ai・・・aHと表わし、空白文字をΔで表わすとす
る。ただしal≠Δ(i=1〜N)。またAの先頭から
i番目までの部分文字列k A +とする。よってAt
=al )Ax =aI B2.At =ataz・
・・a I、 AN= A= at at・・・a、と
なる。各文字に対し数値で表現される1つのキャラクタ
コードが定義されておpl Δのキャラクタコードは他
のどの文字のキャラクタコードよシ小さいとする。m個
の連続する空白文字をΔmで表わす。
・ai・・・aHと表わし、空白文字をΔで表わすとす
る。ただしal≠Δ(i=1〜N)。またAの先頭から
i番目までの部分文字列k A +とする。よってAt
=al )Ax =aI B2.At =ataz・
・・a I、 AN= A= at at・・・a、と
なる。各文字に対し数値で表現される1つのキャラクタ
コードが定義されておpl Δのキャラクタコードは他
のどの文字のキャラクタコードよシ小さいとする。m個
の連続する空白文字をΔmで表わす。
辞書のi番目のレコードのキーをB、とし、その又字列
をす、 b、 B3・・・bk・・・bLと表わす。た
だしLはレコードのキーの長さとする(L≧N)。また
bhはΔでもよいとするただしbk−Δlらばb k+
l = b k+2−・・・bL=Δでりるとする。す
なわちキーの文字は圧づめで人っているとする。
をす、 b、 B3・・・bk・・・bLと表わす。た
だしLはレコードのキーの長さとする(L≧N)。また
bhはΔでもよいとするただしbk−Δlらばb k+
l = b k+2−・・・bL=Δでりるとする。す
なわちキーの文字は圧づめで人っているとする。
八1の後ろにΔL−霞工絖く又字列をAI’と表わすと
すると、与えられた文壬列Aに対して経書の蹴艮一致検
累を行うといりことは、iが最大となるA r’= B
4 の静−蓬のレコード−Hji氷めることでおる。
すると、与えられた文壬列Aに対して経書の蹴艮一致検
累を行うといりことは、iが最大となるA r’= B
4 の静−蓬のレコード−Hji氷めることでおる。
AI’をLヶのキャラクタコード列からなる数1直とみ
なすと、AI’<A2 ’ <・・・< A I’<・
・・(A N ’ となる。また静置のレコードがキー
の上昇1獣に配列されているとするとBl<B2<・・
・< HJ < Bj+1く・・・となる。
なすと、AI’<A2 ’ <・・・< A I’<・
・・(A N ’ となる。また静置のレコードがキー
の上昇1獣に配列されているとするとBl<B2<・・
・< HJ < Bj+1く・・・となる。
今与えられたキーに対して、等しいキーまたは等しいキ
ーが存在しないときはそのキーよシは小さくそのキーに
一番近いキーのことkKLE(Key Less or
Equal)のキード呼フコ、!:に’iル。
ーが存在しないときはそのキーよシは小さくそのキーに
一番近いキーのことkKLE(Key Less or
Equal)のキード呼フコ、!:に’iル。
AN’に対する辞書のKLEのキーをB、とすると、B
、≦AN’。B、=As’ ならばB1のレコードがめ
る或艮−牧のものである。もしB w (A N ’な
らばB y < A I’ < A N’を満すiの長
さのキーには最長−紋の解が存在せず、あるとしたらA
t’≦B、を満すものの中だけである。よって販艮一致
の解を見つけるにはAI’≦By(At’。! となる
As’7j”ら再び検索すればよいことになる。このよ
うなAI′はB、とi文字目までは一致しi +IX字
目で不−玖となるものであるから、幀局B1とAM’の
先頭から一致した文字列をめればそれがAt となる。
、≦AN’。B、=As’ ならばB1のレコードがめ
る或艮−牧のものである。もしB w (A N ’な
らばB y < A I’ < A N’を満すiの長
さのキーには最長−紋の解が存在せず、あるとしたらA
t’≦B、を満すものの中だけである。よって販艮一致
の解を見つけるにはAI’≦By(At’。! となる
As’7j”ら再び検索すればよいことになる。このよ
うなAI′はB、とi文字目までは一致しi +IX字
目で不−玖となるものであるから、幀局B1とAM’の
先頭から一致した文字列をめればそれがAt となる。
このAI′を耕しいキーとして上記のように辞書のKL
Eのキーをめる処理を等しいキーが得られるかまたはA
、/で等しいキーをめることに失敗するまで続ければ、
最長−蚊の答が得られるととKなる。
Eのキーをめる処理を等しいキーが得られるかまたはA
、/で等しいキーをめることに失敗するまで続ければ、
最長−蚊の答が得られるととKなる。
すなわち本方法によれば、AN’ 、 AN −+ ’
+ AN−2+・・・のように1又字ずつ縮めて辞書
を検索しなくてもAN’のKLEのレコードのキーと一
致部分をとることによって途中の無駄な検索金少なくす
ることが可能でるる。
+ AN−2+・・・のように1又字ずつ縮めて辞書
を検索しなくてもAN’のKLEのレコードのキーと一
致部分をとることによって途中の無駄な検索金少なくす
ることが可能でるる。
以下、本発明の一笑施列を詳細に説明する。
第1図において1はM艮−攻検索を制御する装置、2は
単語辞書装置、12のTルは与えられた文字列を保持す
るレジスタ、13のKRは年給辞書2に対する横系のキ
ーを保持するレジスタ、140i(比はKl(、に対す
る読出しレコードを保持するレジスタ、11は読み出し
の制御を行う制御部を表わす。
単語辞書装置、12のTルは与えられた文字列を保持す
るレジスタ、13のKRは年給辞書2に対する横系のキ
ーを保持するレジスタ、140i(比はKl(、に対す
る読出しレコードを保持するレジスタ、11は読み出し
の制御を行う制御部を表わす。
第2図は読み出し制−1llの詳細を表わす図で、30
00のCMPAtiK几13とRル14のデータを比威
し1002によシ結果を報廿する比戟器、2000の5
ELAはK1−113に格納すべきデータを選択する選
択器、1000は制一部を表わす。
00のCMPAtiK几13とRル14のデータを比威
し1002によシ結果を報廿する比戟器、2000の5
ELAはK1−113に格納すべきデータを選択する選
択器、1000は制一部を表わす。
第3図は1lL14の構成?示す図でキ一部1−LH,
にとデータ部RRDよりなる。
にとデータ部RRDよりなる。
第4図は制御部1000の処理を示すフローチャートで
める。
める。
外ff1X(図示せず)より第1図のライン110を辿
して伐木文字列が与えられると共にライ/12゜により
横木指示が与えられる。羊語辞薔2には第5図1cボす
キーを狩りレコードが格調されているとする。
して伐木文字列が与えられると共にライ/12゜により
横木指示が与えられる。羊語辞薔2には第5図1cボす
キーを狩りレコードが格調されているとする。
以下第4図のフローチャートに従って本夾施例の動作を
説明する。
説明する。
i1ステップ:与えられた又字列を’1’)1.12に
格納しそのデータをKR13にセットする。)Ar又字
列として「プンシ仔すョウカラ」が与えられたとする。
格納しそのデータをKR13にセットする。)Ar又字
列として「プンシ仔すョウカラ」が与えられたとする。
第2ステップ:Kn、ta2キーとして率飴静書2にK
LEのキーを待つレコードの検累狭求を出す。単語辞書
2は検索を行い第6図のように「ブンシリョウカラ」を
越えず敢も近いレコードの千−「ブンショウΔΔへ」を
探し出しR几14にセットする。
LEのキーを待つレコードの検累狭求を出す。単語辞書
2は検索を行い第6図のように「ブンシリョウカラ」を
越えず敢も近いレコードの千−「ブンショウΔΔへ」を
探し出しR几14にセットする。
第3ステップ:K)Li2とR几14の先頭1文字をC
MPA3000によシ比較する。
MPA3000によシ比較する。
第4ステップ:比較の結果一致がとれたので第5ステッ
プ第1項に進む。
プ第1項に進む。
第5ステツプ二゛まだ比較していない文字がKR13に
残っているので第3ステツプに戻る。
残っているので第3ステツプに戻る。
第3ステツフ゛二KR13とit凡14の次の1又字を
CMPA3000によシ比較する。
CMPA3000によシ比較する。
′@4ステップ:比収の結果一致がとれたので第5ステ
ップ第1項に進む。
ップ第1項に進む。
以下同様にして、第3文字目までの比較が行なわれ一致
がとれる。第4文字目の比較で一致がとれず第5ステッ
プ第2項に進む。
がとれる。第4文字目の比較で一致がとれず第5ステッ
プ第2項に進む。
第5ステップ:KI:Li2の第4文字目で失敗でおる
ので第6ステップ第2項に進む。
ので第6ステップ第2項に進む。
第6ステツプ:KR13の4又字目以降紫空臼と、LK
R13は「ブンシ△△△△Δ」となる。仄に第2ステツ
プに進みこのKtt13i用いて前と同様の処理を繰返
す。その結果、Rル14のR几Kには「ブンシ△△△△
Δ」が横系されて格納される。今度はKR13と全文字
で比較が一致し、結局「ブンシΔΔ△Δ△」のレコード
がめる最長一致のレコードとなシ第6ステツプ第2項で
制御部1000はライン130を通して層重を報告する
。
R13は「ブンシ△△△△Δ」となる。仄に第2ステツ
プに進みこのKtt13i用いて前と同様の処理を繰返
す。その結果、Rル14のR几Kには「ブンシ△△△△
Δ」が横系されて格納される。今度はKR13と全文字
で比較が一致し、結局「ブンシΔΔ△Δ△」のレコード
がめる最長一致のレコードとなシ第6ステツプ第2項で
制御部1000はライン130を通して層重を報告する
。
不笑施劉によれば、上の動作の説明で述べたごとく、最
長一致のレコードを得るまでの構案回数を従来の1文字
ずつ縮めながら検索する場合にくらべて減少させる効果
がある。
長一致のレコードを得るまでの構案回数を従来の1文字
ずつ縮めながら検索する場合にくらべて減少させる効果
がある。
本発明によれば、最長一致のレコード?慣索する回数を
減少させることができるので、本発明を仮名漢字変換に
適用すれば質侠処理時間の減少すなわち、変換速度の同
上をもたらす効果かめる。
減少させることができるので、本発明を仮名漢字変換に
適用すれば質侠処理時間の減少すなわち、変換速度の同
上をもたらす効果かめる。
第1図は本発明の一実施例になる最長一致検索のための
1till XJ装置のブロック図、第2図は読み出し
制御部のブロック図、第3図は辞$vコードの構成図、
第4図は制御の動作を表わすフローチャート図、第5図
は辞書の内容を表わす模式図、第6図は!幼作の説明を
補足する図でめる。 12・・・文字列を保持するレジスタ、13・・・単語
辞書に対する検索キーを保持するレジスタ、14・・・
単語辞書からの読み出しレコードを保持するレジスタ、
3000・・・データ比収器、2000・・・データ選
V2図 等4図
1till XJ装置のブロック図、第2図は読み出し
制御部のブロック図、第3図は辞$vコードの構成図、
第4図は制御の動作を表わすフローチャート図、第5図
は辞書の内容を表わす模式図、第6図は!幼作の説明を
補足する図でめる。 12・・・文字列を保持するレジスタ、13・・・単語
辞書に対する検索キーを保持するレジスタ、14・・・
単語辞書からの読み出しレコードを保持するレジスタ、
3000・・・データ比収器、2000・・・データ選
V2図 等4図
Claims (1)
- キーの上昇順に配列されたレコードからなる辞書ファイ
ルと、与えられたキーに対して、等しいキーまたは等し
いキーが存任しないときはそのキーより小さく一番その
キーに近いキーヶ持つレコードを検索する機構と、横系
されたレコード?保持する機構と、検索に用いたキーと
検索されたレコードのキーの先頭からの一致部分を検出
する機構と、その一致部分を用いて新たにキーを設定す
る機構と°を持ち、横系に用いた斤−と検索されたレコ
ードのキーが一致するが、811者および佐省のキーの
1文字目が不一致となるまでキーを設足しなおしながら
検索を繰返すこと(f−%徴とする辞書検索方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59007117A JPS60151779A (ja) | 1984-01-20 | 1984-01-20 | 辞書検索方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59007117A JPS60151779A (ja) | 1984-01-20 | 1984-01-20 | 辞書検索方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60151779A true JPS60151779A (ja) | 1985-08-09 |
Family
ID=11657139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59007117A Pending JPS60151779A (ja) | 1984-01-20 | 1984-01-20 | 辞書検索方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60151779A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06139288A (ja) * | 1992-03-23 | 1994-05-20 | Matsushita Electric Ind Co Ltd | 光ディスク検索装置 |
-
1984
- 1984-01-20 JP JP59007117A patent/JPS60151779A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06139288A (ja) * | 1992-03-23 | 1994-05-20 | Matsushita Electric Ind Co Ltd | 光ディスク検索装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH08194719A (ja) | 検索装置および辞書/テキスト検索方法 | |
CN111984673B (zh) | 一种电网电能量计量系统树形结构模糊检索方法和装置 | |
JPS60151779A (ja) | 辞書検索方式 | |
JPS617936A (ja) | 情報検索方式 | |
Roberts | Help: a question answering system | |
JPS6049931B2 (ja) | 情報検索方式 | |
JPS61141036A (ja) | デ−タ検索方式 | |
JPH07210565A (ja) | 情報検索方法及び装置 | |
JPH03127254A (ja) | 単語検索装置 | |
JPH0353378A (ja) | 同音異字および異字同音の姓を検索する氏名検索方式 | |
JPH0227423A (ja) | 日本語文字データの並び換え方法 | |
JPS617937A (ja) | 知識の連想検索方式 | |
JPS59100939A (ja) | 日本語入力装置 | |
JPH01219927A (ja) | データベースの情報検索方式 | |
JPS58144251A (ja) | 漢字熟語入力装置 | |
JPH0342774A (ja) | 情報処理装置 | |
JPS62298869A (ja) | 文尾変換方式 | |
JPS5850044A (ja) | インデクス・レコ−ドの検索処理方式 | |
JPS6243769A (ja) | 仮名漢字変換装置 | |
JPS63229523A (ja) | 情報処理装置 | |
JPS61285573A (ja) | 仮名漢字変換装置 | |
JPH0244467A (ja) | 単語辞書検索装置 | |
Marron et al. | Chemical Substructure Searching with Linear Notations. | |
JPH0434645A (ja) | 文書検索装置 | |
JPS588379A (ja) | 仮名漢字変換方式 |