JPH0668145A - 探索方法 - Google Patents

探索方法

Info

Publication number
JPH0668145A
JPH0668145A JP4220071A JP22007192A JPH0668145A JP H0668145 A JPH0668145 A JP H0668145A JP 4220071 A JP4220071 A JP 4220071A JP 22007192 A JP22007192 A JP 22007192A JP H0668145 A JPH0668145 A JP H0668145A
Authority
JP
Japan
Prior art keywords
data
search
dictionary
database
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4220071A
Other languages
English (en)
Inventor
Akira Hamada
明 濱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP4220071A priority Critical patent/JPH0668145A/ja
Publication of JPH0668145A publication Critical patent/JPH0668145A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 共起辞書のようなデータベースに含まれうる
値(単語番号)の範囲に比べて、同音語の単語番号のよ
うな十分小さな範囲の複数の値の2分探索を一度に行う
ことにより、探索回数の減少及び、処理速度の高速化を
図るものである。 【構成】 101はデータ(単語番号など)が昇順に配
列された辞書データベースである。102は、辞書デー
タベース101の探索範囲及びデータ格納位置を示すア
ドレスデータである。104は制御部であり、目標値デ
ータ(探索キー)は単一ではなく、目標値上限データ1
05と目標値下限データ106を与えることにより数値
幅を指定出来るようになっている。比較部103は、こ
れら二つの値と辞書101から取り出したデータを比較
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語ワードプロセッ
サの用例処理等で用いられる共起情報の検索など各種の
探索方法に関するものである。
【0002】
【従来の技術】探索方法の中に、項目の順番付けられた
集合に対して行う探索であって、集合を2分し、その一
方を捨て、受け入れられた部分に対してこの処理を探索
が完了するまで繰り返す方法として、2分探索があり、
特に代表的な例に2等分探索がある。この2等分探索と
は、探索の各段階で項目の集合を同数の要素をもつ2つ
の部分に分けるものである。
【0003】従来、項目が昇順または降順に配列された
データベースから、2分探索(特に2等分探索)によ
り、指定された単一の値を探索することを行っていた。
以下、図をもとに従来の2分探索について説明する。図
3は従来の探索方法のブロック図であり、図4は従来の
探索方法のフローチャート図である。
【0004】図3において、101はデータ(単語番号
など)が昇順に配列された辞書データベースである。1
02は、辞書データベース101の探索範囲及びデータ
格納位置を示すアドレスデータである。107は辞書デ
ータベース101から探索すべき目標値データ(探索キ
ー)である。103は辞書データベース101から取り
出したデータと目標値データ107を比較する比較部で
ある。104は制御部であり、比較部103の比較結果
とアドレスデータ102の状態に基づいて、探索の終了
を判断する。また、探索続行の場合は、探索範囲を変更
及び次に比較するデータの格納位置を示すようにアドレ
スデータ102を変更する。ここでは、データが昇順に
配列されていると仮定しているが、降順であっても構わ
ないことは言うもでもない。
【0005】以下、図4のフローチャート図に従って、
2分探索の代表例である2等分探索の動作を説明する。
まず、初期化として、目標値(No)及び辞書の探索範
囲(LOWとHIGH)をセットする(S301)。L
OWとHIGHの間のデータ件数の中央に当たるアドレ
スをMIDにセットする(S302)。項目が偶数個の
場合は中央の2個のどちらかに決める。LOW〜MID
の件数とMID〜HIGHの件数を出来るだけ等しくす
ればよい。次にS303において、MIDがさす辞書の
データがNoより大きければ(YES)S306へ、そ
うでなければ(NO)S304へ進む。S304におい
て、MIDがさす辞書のデータがNoより小さければ
(YES)S307へ、そうでなければ(NO)S30
5へ進む。S305において、MIDがさす辞書のデー
タがNoと等しいので、目標値が辞書データベースにあ
った場合の処理(例えば単語の優先など)を行い探索を
終了する。
【0006】一方、S306において、MIDが指すデ
ータよりも一つLOW側を指すアドレスを新たなHIG
Hとして、S308へ進み、また、S307において
は、MIDが指すデータよりも一つHIGH側を指すア
ドレスを新たなLOWとして、S308へ進む。そし
て、S308において、探索の繰り返しと共に、LOW
が初期の下限アドレスから上限側へ進むか、HIGHが
初期の上限アドレスから下限側に進むか、あるいはその
両方が行われることにより、HIGHがLOWより下限
側に来れば(YES)S309へ進む。そうでなければ
(NO)S302へ進み、探索を繰り返す。S309に
おいて、目標値が辞書データベースに無かった場合の処
理を行い探索を終了する。
【0007】
【発明が解決しようとする課題】仮名漢字変換を例に取
ると、読みと表記を対応させた辞書(変換辞書)を用い
て、読み仮名を漢字交じりの表記に変換する際に、共起
処理を用いてより尤もらしい表記に変換するようにして
いる。共起処理のために、特定の単語または単語群と結
び付きやすい単語を単語番号(変換辞書中の単語の並び
順)の形で昇順に配列した辞書(共起辞書)がよく用い
られている。共起処理においては、変換辞書を用いて読
み仮名を解析した表記候補の単語番号が共起辞書に有る
かどうか探索することにより第1候補の変更を行ってい
る。
【0008】このため、上述した探索方法を用いると、
共起辞書に対する2分探索を候補となった単語番号毎に
行う必要があった。例えば、「いきしょうてん」を変換
した場合に「意気衝天」を優先するために、前単語「意
気」に対する用例データに「衝天」の単語番号を登録し
てある場合を想定してみる。「意気」の用例データに対
して「商店」「焦点」「小篆」などの同音語の個数回2
分探索を繰り返すことになる。さらに、前単語の「行
き」「遺棄」などの用例データに対して同様の処理を繰
り返すことになる。通常、これら前単語別の用例データ
をまとめて用例辞書とし、探索範囲アドレスの初期値を
前単語別に用意している。各々の前単語に対応する初期
の探索範囲内のデータは昇順に配列されている。
【0009】よって、従来の探索方法によれば、探索回
数が増加して、処理に大変時間掛かっていた。
【0010】
【課題を解決するための手段】通常、変換辞書の単語は
読み仮名の順に配列されているため、同音語は連続した
単語番号を持つことから、本発明は、共起辞書のような
データベースに含まれうる値(単語番号)の範囲に比べ
て、同音語の単語番号のような十分小さな範囲の複数の
値の2分探索を一度に行うことにより(例えば、「商
店」「焦点」「衝天」「小篆」などは連続した単語番号
を持っており、これら一連の単語番号の範囲の番号の2
分探索をまとめて行うことにより)、探索回数の減少及
び、処理速度の高速化を図るものであり、本発明は、上
記課題の解決を目的としてなされたもので、請求項1記
載の発明は、一定の項目の順番に従って配列された集合
に対して探索を行う探索方法において、目標値に幅を持
たせて、前記集合を2分した2つの集合のうち前記一定
の範囲を有する目標値を含む集合に対して同様の処理を
繰り返して探索を行うものである。
【0011】
【作用】本発明は、一定の項目の順番に従って配列され
た集合に対して探索を行う探索方法において、目標値に
幅を持たせて、前記集合を2分した2つの集合のうち前
記一定の範囲を有する目標値を含む集合に対して同様の
処理を繰り返して探索を行うものであり、これにより、
探索回数の減少及び、処理速度の高速化を図るものであ
る。
【0012】
【実施例】図1に本発明の探索方法のブロック図を、図
2に本発明の探索方法のフローチャート図を示す。図1
において、辞書101、アドレスデータ102、制御部
104は従来と同様である。目標値データ(探索キー)
は単一ではなく、目標値上限データ105と目標値下限
データ106を与えることにより数値幅を指定出来るよ
うになっている。比較部103は、これら二つの値と辞
書101から取り出したデータを比較する。ここでは、
データベースが昇順に配列されていると仮定している。
以下図2のフローチャート図に従って、探索キーに幅を
持たせた2等分探索の動作を説明する。
【0013】まず、初期化として、目標値範囲(Nol
とNoh)及び辞書の探索範囲(LOWとHIGH)を
セットする(S201)。LOWとHIGHの間のデー
タ件数の中央に当たるアドレスをMIDにセットする
(S202)。項目が偶数個の場合は中央の2個のどち
らかに決める。LOW〜MIDの件数とMID〜HIG
Hの件数を出来るだけ等しくすればよい。次に、S20
3において、MIDがさす辞書のデータがNohより大
きければ(YES)S206へ、そうでなければ(N
O)S204へ進む。S204において、MIDがさす
辞書のデータがNolより小さければ(YES)S20
7へ、そうでなければ(NO)S205へ進む。S20
5において、MIDがさす辞書のデータがNolとNo
hで示される範囲にあったので、目標値が辞書データベ
ースにあった場合の処理を行い探索を終了する。
【0014】一方、S206において、MIDが指すデ
ータよりも一つLOW側を指すアドレスを新たなHIG
Hとして、S208へ進む。また、S207において、
MIDが指すデータよりも一つHIGH側を指すアドレ
スを新たなLOWとして、S208へ進む。そして、S
208において、探索の繰り返しと共に、LOWが初期
の下限アドレスから上限側へ進むか、HIGHが初期の
上限アドレスから下限側に進むか、あるいはその両方が
行われることにより、HIGHがLOWより下限側に来
れば(YES)S209へ進み、目標値が辞書データベ
ースに無かった場合の処理を行い探索を終了する。そう
でなければ(NO)S202へ進み、探索を繰り返す。
【0015】NolとNohで示される範囲内の全てが
対象でない場合や、目標値範囲内の全データについて辞
書に有るかどうかをチェックする場合などには、ステッ
プ205でMIDが指すデータの前後に目標値範囲内の
データが並んでいるので、逐次探索を行えばよい。ま
た、目標値上限データ(Noh)と目標値下限データ
(Nol)を等しくすれば、探索キーを単一の値とした
2分検索も行うことが出来る。
【0016】
【発明の効果】本発明によれば、一定範囲の複数の値が
昇順または降順に配列されたデータベースに存在するか
否かは一度の2分探索により判定できる。また、この2
分探索で一定範囲内の値(単語番号)を持つデータが一
つ見付かれば、その前後のデータを逐次調べることによ
り他の値(単語番号)の有無を判定できる。このため、
一定範囲内の複数の値(単語番号)に対して2分探索を
繰り返す必要がなくなり、処理速度を改善できる。
【図面の簡単な説明】
【図1】本発明の探索方法のブロック図である。
【図2】本発明の探索方法のフローチャート図である。
【図3】従来技術の探索方法のブロック図である。
【図4】従来技術の探索方法のフローチャート図であ
る。
【符号の説明】
101 辞書データベース 102 アドレスデータ 103 比較部 104 制御部 105 目標値上限データ 106 目標値下限データ 107 目標値データ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 一定の項目の順番に従って配列された集
    合に対して探索を行う探索方法において、目標値に幅を
    持たせて、前記集合を2分した2つの集合のうち前記一
    定の範囲を有する目標値を含む集合に対して同様の処理
    を繰り返して探索を行うことを特徴とする探索方法。
JP4220071A 1992-08-19 1992-08-19 探索方法 Pending JPH0668145A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4220071A JPH0668145A (ja) 1992-08-19 1992-08-19 探索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4220071A JPH0668145A (ja) 1992-08-19 1992-08-19 探索方法

Publications (1)

Publication Number Publication Date
JPH0668145A true JPH0668145A (ja) 1994-03-11

Family

ID=16745493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4220071A Pending JPH0668145A (ja) 1992-08-19 1992-08-19 探索方法

Country Status (1)

Country Link
JP (1) JPH0668145A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11016299B2 (en) 2017-11-27 2021-05-25 Fujitsu Limited Storage medium, control method, and control device for changing setting values of a wearable apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11016299B2 (en) 2017-11-27 2021-05-25 Fujitsu Limited Storage medium, control method, and control device for changing setting values of a wearable apparatus

Similar Documents

Publication Publication Date Title
JP3143079B2 (ja) 辞書索引作成装置と文書検索装置
US6377942B1 (en) Multiple string search method
US5649023A (en) Method and apparatus for indexing a plurality of handwritten objects
US20050278292A1 (en) Spelling variation dictionary generation system
JPH06131398A (ja) 複数の文書検索方法
CN102915299A (zh) 一种分词方法及装置
JPH0668145A (ja) 探索方法
JPH056398A (ja) 文書登録装置及び文書検索装置
JPH06274546A (ja) 情報量一致度計算方式
JP2002132789A (ja) 文書検索方法
AU2021104537A4 (en) A relevance feedback-based query expansion method using borda count and semantic similarity approach
JPH10228484A (ja) データベース検索装置および方法
JP2967275B2 (ja) 仮名漢字変換装置
JP2006178865A (ja) 固有表現抽出装置、方法、プログラム及びそれを記録した記録媒体
JPH07210565A (ja) 情報検索方法及び装置
JP2000348059A (ja) 文書検索方法
JP2835065B2 (ja) 文字列検索方法
JP2759123B2 (ja) かな漢字変換装置
JP3104893B2 (ja) 情報検索方式
JPH07121665A (ja) 文字認識辞書の構成方法及び検索方法
JPS6162949A (ja) デ−タ管理方式
JP2590698B2 (ja) 文字列データ検索装置
JPH0766380B2 (ja) かな漢字変換装置
JPH03125264A (ja) キーワード抽出装置
JPH01259418A (ja) 文字列検索装置