JPH1021262A - Information retrieval device - Google Patents

Information retrieval device

Info

Publication number
JPH1021262A
JPH1021262A JP8176215A JP17621596A JPH1021262A JP H1021262 A JPH1021262 A JP H1021262A JP 8176215 A JP8176215 A JP 8176215A JP 17621596 A JP17621596 A JP 17621596A JP H1021262 A JPH1021262 A JP H1021262A
Authority
JP
Japan
Prior art keywords
character
transition
information
character string
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8176215A
Other languages
Japanese (ja)
Other versions
JP3419205B2 (en
Inventor
Keiko Gunji
圭子 郡司
Akihiro Katsura
晃洋 桂
壮四郎 ▲葛▼貫
Soshiro Kuzunuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP17621596A priority Critical patent/JP3419205B2/en
Publication of JPH1021262A publication Critical patent/JPH1021262A/en
Application granted granted Critical
Publication of JP3419205B2 publication Critical patent/JP3419205B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To execute fuzzy retrieval of a desired character string by accessing a dictionary by means of an address with the group of character strings described in an inter- character transition information table and displaying the group of the character string in a dictionary corresponding to the address as a retrieval result. SOLUTION: An inputted handwritten pattern is character-recognized a3 by matching with a character pattern in a recognition dictionary a3. In order to optimize the candidate precedence of a candidate character obtained as the result of character recognition, a character transition and probability table a4, which is prepared by learning and describes transition probability between characters and pointers of candidate words in a word dictionary including character transition, and a character appearance probability table d8 are referred to and the candidate precedence is optimized in order to improve appearing probability as a character string, and a pointer to a word in the word dictionary to which the optimized character string corresponds to (a5). The obtained word in the word dictionary a6 and the candidate character string are collated to obtain (a7) the pertinent word and information before/after it from hierarchical information in the word dictionary to display the result on LCDa8.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、予め登録されてい
る文字列を、後から入力されたキーとなる文字を元に検
索する情報検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information retrieval apparatus for retrieving a character string registered in advance based on a key character input later.

【0002】[0002]

【従来の技術】従来、単語辞書の単語を検索する場合、
単語全体や単語の頭の文字列を入力し、検索するのが一
般的である。例えば、あるカーナビゲーションの50音
検索では、単語の頭の部分から文字を入力してゆくと、
入力された文字を単語の先頭に含む単語に候補を絞って
ゆく。
2. Description of the Related Art Conventionally, when searching words in a word dictionary,
It is common to search by inputting the whole word or the character string at the beginning of the word. For example, in the Japanese syllabary search for a car navigation system, when you start typing characters from the beginning of a word,
The candidates are narrowed down to words that include the input character at the beginning of the word.

【0003】また、別の従来例では、PenPC(ペン
入力コンピュータ)などの伝票処理等では、住所や定形
句の入力が用途として多い。従来の住所や定形句の入力
方法としては、(1)メニューによる選択や、(2)文
字認識とメニューの組み合わせで、郵便番号を入力する
と、関連する住所をメニューで表示し、選択する方法、
(3)手書き入力した文字を認識し、その候補を単語辞
書で最適化する方法などが開示されている。
[0003] In another conventional example, input of an address or a fixed phrase is often used in slip processing of a PenPC (pen input computer) or the like. Conventional methods of inputting addresses and fixed phrases include (1) menu selection, and (2) a combination of character recognition and menu, when a zip code is input, a relevant address is displayed in a menu and selected.
(3) A method of recognizing a handwritten input character and optimizing the candidate with a word dictionary is disclosed.

【0004】(1)のメニューによる方法は、例えば、
文献「文字位置のずれを許容する枠なし筆記住所認識」
(電子情報通信学会論文誌D−2,1994年1月号)
に開示されるように、住所のように階層化されたデータ
では、上位階層から順々に下位まで(例えば、「茨城
県」→「日立市」→「大みか町」のように)選択する方
法が一般的である。そこで、もし、「日立市」と入力す
るのに、「日立市」が何県にあるのか、例えば「茨城
県」か「栃木県」か分からなかったら、なかなか「日立
市」を選べない問題がある。
The method using the menu (1) is, for example, as follows:
Reference "Frameless Handwritten Address Recognition Allowing Character Position Shift"
(Transactions of the Institute of Electronics, Information and Communication Engineers D-2, January 1994)
As disclosed in the above, in data hierarchized like an address, a method of selecting sequentially from the upper hierarchy to the lower hierarchy (for example, "Ibaraki prefecture" → "Hitachi city" → "Omika town") Is common. Therefore, if you enter "Hitachi City", but you do not know in which prefecture "Hitachi City" is located, for example, "Ibaraki Prefecture" or "Tochigi Prefecture", there is a problem that you cannot easily select "Hitachi City". is there.

【0005】(2)の郵便番号を入力すると、関連する
住所をメニューで表示する方法は、郵便番号のみ文字入
力し、あとは、郵便番号から決まる地名はメニューで選
べるので、比較的容易に入力可能である。しかし、自分
の住所の郵便番号は覚えられるが、他の郵便番号まで覚
えるのは困難である。
[0005] In the method of (2), when the postal code is input, the relevant address is displayed on the menu by inputting only the postal code as a character, and after that, the place name determined from the postal code can be selected from the menu. It is possible. However, it is difficult to memorize the postal code of his / her address, but also to other postal codes.

【0006】(3)の手書き入力した文字を認識し、そ
の候補を単語辞書で最適化する方法について、図面を用
いて説明する。図3は、従来の文字認識の構成図であ
る。タブレットa1より入力された手書きパターンを認
識辞書a2とパターンマッチして文字認識a3し、得ら
れた候補文字を単語辞書a6と単語照合b7し、該当す
る単語をLCDa8に表示する。
A method of (3) recognizing a handwritten input character and optimizing the candidate with a word dictionary will be described with reference to the drawings. FIG. 3 is a configuration diagram of conventional character recognition. The handwritten pattern input from the tablet a1 is subjected to character recognition a3 by pattern matching with the recognition dictionary a2, the obtained candidate characters are subjected to word matching b7 with the word dictionary a6, and the corresponding words are displayed on the LCD a8.

【0007】図4は、従来の文字認識を用いて住所を入
力する場合の動作概要図である。例えば、「茨城県 日
立市 大みか町」と入力するには、「茨城県 日立市
大みか町」と全部を所定の住所入力エリアb1に手書き
入力する。すると、文字認識a3し、得られた候補文字
を単語辞書a6を用いて、最上位階層の都道府県から単
語照合し、候補文字を最適化し、結果を候補文字として
出力していた。
FIG. 4 is a schematic diagram showing the operation when an address is input using conventional character recognition. For example, to enter "Omika Town, Hitachi City, Ibaraki Prefecture," enter "
"Omika-cho" is input by hand in the predetermined address input area b1. Then, the character recognition a3 is performed, and the obtained candidate characters are word-matched from the highest hierarchy prefecture using the word dictionary a6, the candidate characters are optimized, and the result is output as a candidate character.

【0008】従来、住所のような階層データを最上位の
階層からアクセスしていたのは、一般に階層の上位ほど
データ量が少なく、上位が決まれば下位の候補を絞るこ
とができたからである。もし、仮に従来のシステムで
「大みか」というキーワードを入力して、単語辞書を検
索したならば、どの階層にあるかも分からないので、約
1.5MB もある単語辞書を全文検索するしかなく、オ
ンライン文字認識のように応答性が必要な場合には実用
的でなかったためである。
Conventionally, hierarchical data such as an address is accessed from the highest hierarchical level because, generally, the higher the hierarchical level, the smaller the data amount, and if a higher level is determined, lower candidates can be narrowed down. If you search the word dictionary by inputting the keyword "Omika" in the conventional system, you cannot know which level it is in, so you have to do a full-text search for a word dictionary of about 1.5MB. This is because it is not practical when responsiveness is required as in character recognition.

【0009】 ((住所単語辞書の例) 都道府県: 約50個×約3文字×2バイト = 約300B 市町村 : 約4000個×約3文字×2バイト = 約2.5KB それ以下: 約160000個×約4文字×2バイト = 約1.3MB 合 計 : 約1.5MB ) しかし、従来の方式のように、例えば「茨城県 日立市
大みか町」と、長い住所を全部を手書き入力しなけれ
ばならないのでは、ユーザにとっては大変である。
((Example of address word dictionary) Prefecture: about 50 × about 3 characters × 2 bytes = about 300B Municipalities: about 4000 × about 3 characters × 2 bytes = about 2.5KB Less: about 160,000 X about 4 characters x 2 bytes = about 1.3 MB Total: about 1.5 MB) However, as in the conventional method, for example, "Imaki-cho, Hitachi City, Ibaraki prefecture" If not, it would be difficult for the user.

【0010】[0010]

【発明が解決しようとする課題】従来の、単語の頭から
文字を入力し、候補を絞る方式(前方一致方式)では、
単語の頭の部分を知らなければ、所望の単語を検索する
ことはできない。そのため、うろ覚えで、単語の途中や
終りを知っていても、その情報が生かされないという問
題がある。
In the conventional method of inputting characters from the beginning of a word and narrowing down candidates (front matching method),
Without knowing the beginning of the word, the desired word cannot be searched. For this reason, there is a problem in that even if one knows the middle or the end of a word by learning the information, the information is not used.

【0011】また、上記従来技術(1)〜(3)に共通す
る問題点としては、文字認識利用の例では、住所や定形
句などを全て手書き入力する必要がありユーザにとって
煩わしい点、また、単語辞書を最上位以外の階層から探
索すると探索に膨大な時間を要してしまう点、メニュー
により選択する場合においても住所のように階層構造に
なっていると、上位が分からないと下位を選択できない
点がある。
[0011] In addition, as a problem common to the above-mentioned prior arts (1) to (3), in the case of using character recognition, it is necessary to input all addresses and fixed phrases by hand, which is troublesome for the user. Searching a word dictionary from a hierarchy other than the highest level requires a huge amount of time to search, and when selecting from a menu, if the hierarchy is like an address, if the upper level is not known, the lower level is selected. There is a point that cannot be done.

【0012】本発明の目的は、検索したい文字列の先頭
や末尾の文字に限らずに、うろ覚えの情報をキー入力と
して、目的の文字列を曖昧検索できる情報検索装置を提
供することにある。
An object of the present invention is to provide an information retrieval apparatus capable of performing an ambiguous search for a target character string by using not only the head or end characters of the character string to be searched but also information on spelling as a key input.

【0013】さらに、本発明の他の目的は、キー文字を
入力して候補が絞りきれなかった時には、順序を気にせ
ずに、キー入力情報を追加できる情報検索装置を提供す
ることにある。
Still another object of the present invention is to provide an information retrieval apparatus which can add key input information without concern for the order when key characters are input and candidates cannot be narrowed down.

【0014】[0014]

【課題を解決するための手段】本発明の特徴は、入力さ
れた文字列を含む文字群を検索する情報検索装置におい
て、予め複数の文字列群を、それぞれ固有のアドレスに
記憶する辞書と、少なくとも、ある文字から他の文字へ
の遷移情報と、前記複数の文字列群のうち前記遷移関係
にある文字の組み合わせを含む文字列群のアドレスとを
それぞれ対応付けて記憶した文字遷移情報テーブルを有
し、前記入力された文字列に対応する文字列群を前記文
字遷移情報テーブルに記載したアドレスにより前記辞書
をアクセスし、当該アドレスに対応する前記辞書中の文
字列群を検索結果として表示するようにしたことにあ
る。
According to the present invention, there is provided an information retrieval apparatus for retrieving a character group including an input character string, a dictionary for storing a plurality of character string groups in advance at respective unique addresses, A character transition information table storing at least transition information from one character to another character and an address of a character string group including a combination of the characters having the transition relationship among the plurality of character string groups, The dictionary is accessed by an address described in the character transition information table for a character string group corresponding to the input character string, and a character string group in the dictionary corresponding to the address is displayed as a search result. That's what I did.

【0015】このことにより、検索したい文字列の一部
を適当に入力することにより、所望の文字列を高速に得
ることができる。
Thus, a desired character string can be obtained at a high speed by appropriately inputting a part of the character string to be searched.

【0016】[0016]

【発明の実施の形態】以下、図面を用いて、手書きによ
り住所を入力する装置に本発明を適用した実施例、およ
び、単語の曖昧検索に適用した例を用いて説明する。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing an embodiment of the present invention applied to a device for inputting an address by handwriting and an example applied to an ambiguous word search.

【0017】[手書き住所入力装置]図2は、本発明の
一実施例である手書き入力住所認識装置の動作概要図で
ある。住所入力エリアb1に、スタイラスペンa9で、
住所のキーとなる文字「大みか」を手書き入力する。す
ると、手書きされたストローク(筆跡)は、文字認識a
3により認識され、キーワードの候補文字,第一候補
「大みか」と第二候補「犬るカ」が得られる。これらの
候補文字を、文字遷移確率テーブルa4にある文字間の
遷移確率((文字A)→(文字B)に続く確率)と、文
字の出現確率テーブルa8を参照し、候補文字をどのよ
うに組み合わせると、文字列として出現確率が高くなる
かを求め、文字列としての出現確率が高くなるように、
候補文字の順位を最適化する。さらに、文字遷移確率テ
ーブルの候補単語No.を参照し、候補文字列にある文字
遷移を含む単語のポインタを求める。図の例では、「大
みか」と候補文字を組み合わせると出現確率が高くな
り、文字遷移確率テーブルより、(大→み)と(み→
か)を含む単語のポインタNo.A11が求められる。本
方式では、文字認識の後処理に用いる、遷移確率テーブ
ルに、新たに単語辞書中の単語へのポインタを設けるこ
とにより、高速に目的の単語にアクセスすることができ
る。そして、単語辞書中で該当する単語が分かったら、
単語辞書の階層情報により、上位の階層は一意に求めら
れる。この例では、最下位の階層の「大みか町」が一意
に求められたので、上位は「茨城県 日立市」と一意に
求めることができる。従って、「大みか」しか手書き入
力していないのに、「茨城県 日立市 大みか町」と、
住所を頭から候補表示し、入力することができる。
[Handwritten Address Input Device] FIG. 2 is a schematic diagram showing the operation of a handwritten input address recognition device according to one embodiment of the present invention. In the address input area b1, with the stylus pen a9,
Hand-write the character "Omika" which is the key of the address. Then, the handwritten stroke (handwriting) is recognized by character recognition a.
3 to obtain a keyword candidate character, a first candidate "Omika", and a second candidate "Inukaru". The candidate characters are determined by referring to the transition probability between characters (probability following (character A) → (character B)) in the character transition probability table a4 and the character appearance probability table a8. When combined, it is determined whether the probability of appearance as a character string is high, and so that the probability of appearance as a character string is high,
Optimize the order of candidate characters. Further, referring to the candidate word No. in the character transition probability table, a pointer to a word containing a character transition in the candidate character string is obtained. In the example of the figure, the appearance probability increases when "Omika" is combined with the candidate character. From the character transition probability table, (Omi → Mi) and (Mi →
The pointer No. A11 of the word containing the word "?" In this method, a target word can be accessed at high speed by newly providing a pointer to a word in the word dictionary in the transition probability table used for post-processing of character recognition. And if you find the corresponding word in the word dictionary,
The upper hierarchy is uniquely obtained from the hierarchy information of the word dictionary. In this example, "Omika-cho" at the lowest level is uniquely obtained, so that "Hitachi City, Ibaraki Prefecture" can be uniquely obtained at the higher level. Therefore, even though only "Omika" was handwritten, "Omika town, Hitachi City, Ibaraki Prefecture"
The address can be displayed as a candidate from the beginning and input.

【0018】図1は、本発明の一実施例である手書き入
力住所認識装置の機能ブロック図である。図1を用いて
動作を簡単に説明する。スタイラスペンa9をタブレッ
トa1上に滑らせることにより、手書き文字パターンが
入力される。入力された手書きパターンを、認識辞書a
2にある文字パターンとマッチングして文字認識a3す
る。文字認識の結果得られた候補文字の候補順位を最適
化するために、予め学習して作成してある、文字間の遷
移確率と文字遷移を含む単語辞書中の候補単語のポイン
タが載っている文字遷移確率テーブルa4及び文字の出
現確率テーブルa8を参照し、文字列としての出現確率
が高くなるように候補順位を最適化するとともに、最適
化した文字列が該当する単語辞書中の単語へのポインタ
を求める(a5)。前記方法で求めた単語辞書a6の単
語と候補文字列を照合し、該当する単語とその前後の情
報を単語辞書の階層情報より求める(a7)。求められ
た結果をLCDa8に表示する。
FIG. 1 is a functional block diagram of a handwritten input address recognition apparatus according to one embodiment of the present invention. The operation will be briefly described with reference to FIG. By sliding the stylus pen a9 on the tablet a1, a handwritten character pattern is input. The input handwritten pattern is converted into a recognition dictionary a
Then, character recognition a3 is performed by matching with the character pattern in step 2. In order to optimize the candidate rank of candidate characters obtained as a result of character recognition, pointers of candidate words in the word dictionary, which include learning and transition probability between characters and character transitions, which are created in advance by learning. With reference to the character transition probability table a4 and the character appearance probability table a8, the candidate order is optimized so that the appearance probability as a character string is increased, and the optimized character string is added to the word in the corresponding word dictionary. A pointer is obtained (a5). The words in the word dictionary a6 obtained by the above method are compared with the candidate character strings, and the corresponding word and information before and after the word are obtained from the hierarchical information of the word dictionary (a7). The obtained result is displayed on LCDa8.

【0019】尚、本発明の特徴である、[1]文字遷移
確率テーブルa4の作成方法、[2]文字遷移確率テー
ブルa4を用いて、候補文字を文字列としての出現確率
が高くなるように候補順位を最適化するとともに、最適
化した文字列にある文字遷移を含む単語へのポインタを
求める方法、[3]求めた単語のポインタを利用して手
書き入力した単語(キーワード)を含む文字列を推測す
る方法、[4]推測した文字列の表示方法については、
後に図面を用いて詳細に説明する。
By using the [1] method of creating the character transition probability table a4 and [2] the character transition probability table a4, which are the features of the present invention, the probability of occurrence of candidate characters as a character string is increased. A method of optimizing the candidate order and obtaining a pointer to a word including a character transition in the optimized character string, [3] a character string including a handwritten input word (keyword) using the obtained word pointer For how to guess, and [4] how to display the guessed string,
This will be described later in detail with reference to the drawings.

【0020】図5は、本発明の一実施例である手書き入
力住所認識装置のハード構成図である。入力パターンと
辞書パターンをマッチングする機能,パターンマッチン
グにより得られた候補文字を最適化し、候補文字を含む
単語へのポインタを求める機能,候補文字を単語照合し
て、さらに前後の情報を検索する機能は、例えば、RO
Mc5に記憶してあるプログラムをCPUc3が読みだし、
実行することにより実現される。尚、各機能について
は、後に図面を用いて詳細に説明する。
FIG. 5 is a hardware configuration diagram of a handwritten input address recognition device according to an embodiment of the present invention. Function to match input pattern and dictionary pattern, function to optimize candidate characters obtained by pattern matching, find pointer to word containing candidate character, function to match candidate characters to words, and search for information before and after Is, for example, RO
CPUc3 reads the program stored in Mc5,
It is realized by executing. Each function will be described later in detail with reference to the drawings.

【0021】[1]文字遷移確率テーブルa4の作成方
法 図6は、文字遷移確率テーブルa4の作成方法を説明す
るフロー図である。まず、学習用の単語辞書a6を読み
出すd1。読み出した単語について、単語中に含まれる
文字の出現回数をカウントし(d2)、出現回数テーブ
ルd3に記録する。続いて、文字遷移回数をカウントし
(d4),遷移回数テーブルd6に記録する。続いて、
遷移回数テーブルd6に、文字遷移が含まれた元の単語
の単語No.(単語のポインタ)を記録するd5。例え
ば、単語「大みか」の例では、文字の出現回数は、
「大」「み」「か」それぞれ1回、文字遷移回数では
「大→み」と「み→か」がそれぞれ1回とカウントされ
る。また、「大→み」と「み→か」の候補単語No.に
は、単語「大みか」の単語No.が記録される。このよう
な処理d1〜d6を、単語辞書a6中の全ての単語につ
いて繰り返し行う。その後、前記処理により作成した文
字出現回数テーブルd3と文字遷移回数テーブルd6を
参照して、文字間の遷移確率と文字遷移を含む候補単語
No.の情報を記述した文字遷移確率テーブルa4を作成
する(d9)。さらに、必要があれば、文字出現回数テ
ーブルd3を参照して、文字毎の出現確率を記述した文
字出現確率テーブルd8を作成する(d7)。それぞれ
のテーブルの構成については、以下図面を用いて説明す
る。
[1] Method of Creating Character Transition Probability Table a4 FIG. 6 is a flowchart illustrating a method of creating the character transition probability table a4. First, d1 for reading out the word dictionary a6 for learning. For the read word, the number of appearances of the characters included in the word is counted (d2), and recorded in the appearance number table d3. Subsequently, the number of character transitions is counted (d4) and recorded in the transition number table d6. continue,
D5 for recording the word No. (word pointer) of the original word including the character transition in the transition count table d6. For example, in the example of the word "Omika", the number of occurrences of a character is
"Large", "mi" and "ka" are counted once each, and in the number of character transitions, "large → mi" and "mi → ka" are counted once each. In addition, the word No. of the word "Omika" is recorded in the candidate words No. of "O-mi" and "Mi-oka". Such processes d1 to d6 are repeatedly performed for all the words in the word dictionary a6. Thereafter, referring to the character appearance frequency table d3 and the character transition frequency table d6 created by the above-described processing, a character transition probability table a4 describing information on transition probabilities between characters and candidate words No. including character transitions is created. (D9). Further, if necessary, a character appearance probability table d8 describing the appearance probability of each character is created with reference to the character appearance frequency table d3 (d7). The configuration of each table will be described below with reference to the drawings.

【0022】図7は、単語辞書の概要図である。ここで
は例として、住所の単語辞書a6を示す。この辞書は、
都道府県・市町村・それ以下で階層化された構造になっ
ており、各要素は、単語No.(単語の位置情報),上位
単語No.,単語(文字列)からなる。各単語にアクセス
するには、単語No.によりアクセスできる。また、単語
の階層関係は、上位単語No.によって分かる。
FIG. 7 is a schematic diagram of a word dictionary. Here, as an example, an address word dictionary a6 is shown. This dictionary is
It has a hierarchical structure of prefectures, municipalities, and lower levels, and each element is composed of a word No. (word position information), an upper word No., and a word (character string). Each word can be accessed by the word No. The hierarchical relationship between words can be known from the upper word No.

【0023】図8は、文字出現回数テーブルの概要図で
ある。文字出現回数テーブルd3には、学習用単語辞書
中に各文字が現れた回数が記憶され、学習用単語中の全
文字数をカウントするのに用いられる。
FIG. 8 is a schematic diagram of a character appearance frequency table. The character appearance frequency table d3 stores the number of times each character appears in the learning word dictionary, and is used to count the total number of characters in the learning word.

【0024】図9は、文字遷移回数テーブルの概要図で
ある。文字遷移回数テーブルd6は、学習用単語辞書中
に各文字遷移が現れた回数と、文字遷移が含まれていた
単語のNo.(候補単語No.)を記録するのに用いる。
FIG. 9 is a schematic diagram of a character transition number table. The character transition number table d6 is used to record the number of times each character transition appears in the learning word dictionary and the No. (candidate word No.) of the word containing the character transition.

【0025】図10は、文字出現確率テーブルの概要図
である。例えば、文字「日」の出現確率は、出現確率
(日)=出現回数(日)/全文字数で表せる。従って、
文字出現確率テーブルd8を作成するには、出現回数テ
ーブルd3を参照し、各文字の出現回数を求め、文字出
現確率テーブルd8に記録すればよい。
FIG. 10 is a schematic diagram of a character appearance probability table. For example, the appearance probability of the character “day” can be represented by appearance probability (day) = number of appearances (day) / total number of characters. Therefore,
In order to create the character appearance probability table d8, the number of appearances of each character may be obtained by referring to the appearance frequency table d3 and recorded in the character appearance probability table d8.

【0026】図11は、文字遷移確率テーブルの概要図
である。例えば、文字遷移「日→立」の遷移確率は、遷移
確率(日→立)=遷移回数(日→立)/出現回数(日)
で表せる。従って、文字遷移確率テーブルa4を作成す
るには、出現回数テーブルd3と遷移回数テーブルd6
を参照して、各文字の遷移確率を求め、文字遷移確率テ
ーブルa4に記録すればよい。
FIG. 11 is a schematic diagram of a character transition probability table. For example, the transition probability of the character transition "day → standing" is: transition probability (day → standing) = number of transitions (day → standing) / number of appearances (day)
Can be represented by Therefore, in order to create the character transition probability table a4, the appearance number table d3 and the transition number table d6
, The transition probability of each character may be obtained and recorded in the character transition probability table a4.

【0027】以上の処理により、単語辞書の単語へのポ
インタのついた文字遷移確率テーブルa4を作成するこ
とができる。尚、本実施例においては、単語辞書中の各
単語を識別するための単語識別情報として単語No.を用
いたが、これに限られるものではなく、コード情報であ
っても良い。また、同様に、単語辞書中の単語間の階層
関係を示す階層情報として上位単語No.を用いたが、こ
れに限られるものではなく、階層関係を表し得るもので
あれば良く、例えばコード情報であっても良い。
With the above processing, a character transition probability table a4 with a pointer to a word in the word dictionary can be created. In this embodiment, the word No. is used as word identification information for identifying each word in the word dictionary. However, the present invention is not limited to this, and may be code information. Similarly, the upper word No. is used as the hierarchical information indicating the hierarchical relationship between the words in the word dictionary. However, the present invention is not limited to this. It may be.

【0028】[2]遷移確率による後処理(候補文字の
最適化と候補単語のポインタの決定)方法 図12は、遷移確率テーブルを用いて行う文字認識後処
理の概要図である。図のように、入力パターン「大み
か」の候補文字が、第一候補「大るか」・第二候補「犬
みカ」であるとする。尚、ここでは文字認識結果に誤り
がある場合でも、遷移確率による候補文字の最適化で対
応できることを示すため、特に、図2の例とは異なる
「大みか」を誤認識した例を用いて説明する。候補文字
の組み合わせは、図に示す8通りが考えられる。これら
文字列の組について、文字遷移確率テーブルを参照し
て、文字列の出現確率と単語辞書中の単語候補の単語の
ポインタを求める。文字列の出現確率が高い候補文字の
組み合わせが、最適な組み合わせ(パス)である。従っ
て、その文字組を候補単語No.と共に遷移確率後処理の
結果とする。
[2] Post-Processing Based on Transition Probability (Optimization of Candidate Characters and Determination of Candidate Word Pointer) FIG. 12 is a schematic diagram of character recognition post-processing performed using a transition probability table. As shown in the figure, it is assumed that the candidate characters of the input pattern "Omika" are the first candidate "Omika" and the second candidate "Inumika". It should be noted that, here, in order to show that even if there is an error in the character recognition result, it is possible to cope with the optimization of the candidate character based on the transition probability. I do. There are eight possible combinations of candidate characters shown in the figure. For the set of these character strings, the character transition probability table and the pointer to the word candidate word in the word dictionary are obtained with reference to the character transition probability table. A combination of candidate characters having a high appearance probability of a character string is an optimal combination (path). Therefore, the character set is used as the result of the transition probability post-processing together with the candidate word No.

【0029】それでは、まず、文字列の出現確率の計算
方法を述べる。
First, a method of calculating the appearance probability of a character string will be described.

【0030】一般に、文字列S1 S2 …Snの出現
確率は、次式で近似できる。
In general, the appearance probabilities of the character strings S1 S2... Sn can be approximated by the following equations.

【0031】[0031]

【数1】 出現確率(S1 S2 …Sn) =出現確率(S1)×遷移確率(S1→S2)×…×遷移確率(Sn−1→Sn) …(数1) 図の候補文字の組み合わせNo.3の「大みか」の例で
は、以下の通りとなる。出現確率(大みか)=出現確率
(大)×遷移確率(大→み)×遷移確率(み→か)具体的に
は、文字遷移確率テーブルa4と出現確率テーブルa8
とにより、次式の通り値が求められる。
## EQU1 ## Appearance probability (S1 S2... Sn) = appearance probability (S1) .times.transition probability (S1.fwdarw.S2) .times..times.transition probability (Sn-1.fwdarw.Sn)... In the example of “Omika” in .3, it is as follows. Appearance probability (Omika) = Appearance probability
(Large) × transition probability (large → mi) × transition probability (mi → ka) Specifically, the character transition probability table a4 and the appearance probability table a8
The value is obtained by the following equation.

【0032】[0032]

【数2】 出現確率(大みか) =(18/89274)×(1/18)×(2/15)×(2/198) =14940×10~8% …(数2) 次に、候補単語No.(単語辞書中の単語候補のポインタ
0を求める方法を述べる。文字列S1 S2 …Snの
候補単語No.は、次式のように求めることができる。
[Number 2] occurrence probability (Omika) = (18/89274) × (1/18 ) × (2/15) × (2/198) = 14940 × 10 ~ 8% ... ( number 2) Next, the candidate word No. (A method of obtaining a pointer 0 of a word candidate in a word dictionary will be described. A candidate word No. of a character string S1 S2... Sn can be obtained as in the following equation.

【0033】[0033]

【数3】 候補単語No.(S1 S2 …Sn) =候補単語No.(S1→S2)∩…∩候補単語No.(Sn−1→Sn) …(数3) 図の例、文字列「大みか」の場合は、文字遷移確率テー
ブルa4により次式のようになる。
[Equation 3] Candidate word No. (S1 S2... Sn) = Candidate word No. (S1 → S2) ∩ ∩ {Candidate word No. (Sn-1 → Sn) ... (Equation 3) In the case of "Omika", the following expression is obtained from the character transition probability table a4.

【0034】[0034]

【数4】 候補単語No.(大みか) =∩候補単語No.(大→み)∩候補単語No.(み→か) =(A11)∩(A11,A12) =A11 …(数4) この例では、アンド(∩)をとることにより、候補を
「大みか町」(A11)に絞ったが、オア(∪)をとり
候補を「大みか町」と「みかの原町」にしてもよい。こ
の場合、一致数を考慮すれば「大みか町」を第一候補に
することができる。詳細は、後で図面を用いて述べる。
(Equation 4) Candidate word No. (Omika) = {Candidate word No. (Obvi → Mi)} Candidate word No. (Omika) = (A11) ∩ (A11, A12) = A11 ... (Equation 4) In the example, the candidates are narrowed down to “Omika-cho” (A11) by taking an AND (∩), but the candidates may be “Omika-cho” and “Mikanohara-machi” by taking OR (∪). In this case, considering the number of matches, “Omika-cho” can be the first candidate. Details will be described later with reference to the drawings.

【0035】以上の方法により、文字認識により得られ
た候補文字を文字列としての出現確率が高くなるように
最適化し、最適化した候補文字列の候補単語No.(単語
へのポインタ)を求めることができる。尚、上記の方法
によれば、例えば、「大みか町」の一部分である「み
か」のみを入力しても、「大みか町」と「みかの原町」
を候補にすることができる。
According to the above method, the candidate character obtained by the character recognition is optimized so that the probability of appearance as a character string is increased, and a candidate word No. (pointer to a word) of the optimized candidate character string is obtained. be able to. According to the above method, for example, even if only "Mika" which is a part of "Omika-cho" is input, "Omika-cho" and "Mikahara-cho"
Can be a candidate.

【0036】[3]手書き入力した単語(キーワード)
を含む文字列の推測方法 続いて、最適化した候補文字列(手書き入力したキーワ
ード)を含む文字列全体の推測方法について、図面を用
いて説明する。
[3] Words (Keywords) Input by Handwriting
Next, a method of estimating the entire character string including the optimized candidate character string (keyword input by handwriting) will be described with reference to the drawings.

【0037】図13は、後処理結果により文字列を推測
する概要図である。この例では、遷移確率による後処理
でキーワード(候補文字)「大みか」と候補単語No.A
11が得られた場合を示す。この図から分かるように、
キーワード「大みか」は単語辞書中に1つしかなく、ま
た最下位の階層なので、上位の文字列「茨城県 日立
市」は一意に決まる。そこで、手書き文字「大みか」の
全体の推測結果として、候補文字列「茨城県 日立市
大みか町」を表示した。
FIG. 13 is a schematic diagram for estimating a character string based on the post-processing result. In this example, the keyword (candidate character) “Omika” and the candidate word No.
11 shows the case where 11 was obtained. As you can see from this figure,
The keyword “Omika” has only one in the word dictionary and is the lowest level, so the high-order character string “Hitachi, Ibaraki” is uniquely determined. Therefore, as a result of estimating the entire handwritten character “Omika”, the candidate character string “Hitachi
Omika-cho "is displayed.

【0038】図22は、図13と同様の例であるが、手
書き文字「大みか」の候補文字列として、文字列推測結
果の「茨城県 日立市 大みか町」と推測結果なしの文
字認識結果の「大みか町」を両方候補として出し、ユー
ザが選択できるようにしたことが特徴である。このよう
に、キーワードから推測した文字列と推測なしのキーワ
ードのみの両方を候補にすると、ユーザは好みの方を選
べる利点がある。
FIG. 22 is an example similar to FIG. 13, but as a candidate character string for the handwritten character “Omika”, the character string guess result “Omika-cho, Hitachi City, Ibaraki Prefecture” and the character recognition result without the guess result are shown. The feature is that "Omika-cho" is selected as both candidates so that the user can select it. In this way, when both the character string guessed from the keyword and only the keyword without guess are set as candidates, there is an advantage that the user can select a favorite one.

【0039】図14は、後処理結果により文字列を推測
する概要図である。この例では、遷移確率による後処理
の結果、単語辞書の中間階層の単語である「日立」(候
補単語No.A1)得られた場合を示す。図より分かるよ
うに、キーワード「日立」は、単語辞書テーブル中に1
つしかないので、上位階層の文字列「茨城県」は一意に
決まる。しかし、下位の階層は複数あるので、例えば、
候補を「茨城県 日立市 大みか町」「茨城県 日立市
みかの原町」・・・と複数表示し、ユーザに選択して
もらえば良い。
FIG. 14 is a schematic diagram for estimating a character string based on the post-processing result. In this example, a case where “Hitachi” (candidate word No. A1), which is a word in the middle hierarchy of the word dictionary, is obtained as a result of the post-processing by the transition probability. As can be seen from the figure, the keyword “Hitachi” has 1 in the word dictionary table.
Since there is only one, the upper-level character string "Ibaraki" is uniquely determined. However, since there are multiple lower layers, for example,
A plurality of candidates may be displayed as "Omika-cho, Hitachi-shi, Ibaraki", "Mikahara-cho, Hitachi-shi, Ibaraki", and the user may select one.

【0040】図15は図14と同様に後処理の結果単語
辞書の中間階層の単語である「日立」(候補単語No.A
1)遷移確率により得られ、下位の候補が複数ある例で
ある。この図の例では、単語辞書には各都市毎の人口情
報を保持しており、複数ある下位の階層のうち、人口の
多い町を優先的に高い候補順位で表示することにより、
操作性を向上している。
FIG. 15 shows a word "Hitachi" (candidate word No. A) which is a word in the middle hierarchy of the word dictionary as a result of post-processing as in FIG.
1) In this example, there are a plurality of lower-order candidates obtained by the transition probability. In the example of this figure, the word dictionary holds population information for each city, and displays a town with a large population in a plurality of lower layers in a priority order with higher priority.
Operability has been improved.

【0041】図16は、図15と似ているが、単語辞書
には人口情報の代わりに、単語間の遷移確率を持ってい
る。複数ある下位の階層のうち、遷移確率の高い単語を
優先的に高い候補順位で表示することにより、操作性を
向上できる。この単語間の遷移確率は、地名がよく現れ
るテキストなどから学習することができる。また、簡易
には、都市の人口により頻度を決定して学習してもよ
い。
FIG. 16 is similar to FIG. 15, but the word dictionary has transition probabilities between words instead of population information. The operability can be improved by preferentially displaying words having a high transition probability in a high candidate order among a plurality of lower layers. The transition probability between words can be learned from a text or the like where a place name frequently appears. Further, simply, the frequency may be determined based on the population of the city, and the learning may be performed.

【0042】図21は、図14と同様に後処理の結果単
語辞書の中間階層のキーワード「日立」(単語No.A
1)が得られ、下位の候補が一意に定まらない例であ
る。図14と異なるのは、一意に候補が決まった「茨城
県 日立市」のみを表示しており、一意に定まらない市
町村以下は、ユーザが再度入力するようにした点であ
る。
FIG. 21 shows a keyword "Hitachi" (word No. A) in the middle hierarchy of the word dictionary as a result of post-processing as in FIG.
1) is obtained, and lower candidates are not uniquely determined. The difference from FIG. 14 is that only “Hitachi City, Ibaraki Prefecture”, for which a candidate has been uniquely determined, is displayed, and for cities, towns and villages that are not uniquely determined, the user inputs again.

【0043】以上より、わかるように、キーワードより
上位の階層は、自動で一意に推測できるし、キーワード
より下位の候補が複数ある場合は、一意には定められな
いので、メニューを提示したり、その部分だけ際入力し
てもらえばよい。
As can be seen from the above, the hierarchy higher than the keyword can be automatically and uniquely guessed, and if there are a plurality of candidates lower than the keyword, it cannot be uniquely determined. You only need to input that part.

【0044】[4]推測した文字列の表示方法 さて、次に、上記方法で求めた文字列候補の表示の仕方
について述べる。図17〜図20は、推測した文字列の
表示形態を示す図である。いずれも「大みか町」と入力
して、推測認識結果の文字列「茨城県 日立市 大みか
町」を表示しているが、各々表示の位置を変えて、特徴
を出している。
[4] Method of Displaying Guessed Character String Next, a method of displaying the character string candidates obtained by the above method will be described. FIG. 17 to FIG. 20 are diagrams showing display forms of the estimated character strings. In each case, "Omika-cho" is entered and the character string of the guess recognition result is displayed, "Omika-cho, Hitachi City, Ibaraki Prefecture".

【0045】図17では、「大みか町」と手書きした近
くに候補文字列「茨城県 日立市大みか町」の中の「大
みか町」の部分を表示している。この表示方法では、手
書きした筆跡と認識結果の候補を対比しやすいメリット
がある。
In FIG. 17, the part of "Omika-cho" in the candidate character string "Omika-cho, Hitachi-shi, Ibaraki" is displayed near the handwritten "Omika-cho". This display method has an advantage that it is easy to compare handwritten handwriting with a candidate for a recognition result.

【0046】さて、図18は、「大みか町」と手書きし
た位置の近くから、「茨城県 日立市 大みか町」と表
示している。この表示方法では、手書き文字と候補文字
列の頭が揃っているので、結果の表示開始位置が容易に
分かるメリットがある。
FIG. 18 shows "Omika-cho, Hitachi City, Ibaraki Prefecture" from near the handwritten position of "Omika-cho". In this display method, since the heads of the handwritten characters and the candidate character strings are aligned, there is an advantage that the display start position of the result can be easily recognized.

【0047】図19では、「大みか町」と手書きした位
置を中心として、候補文字列「茨城県 日立市 大みか
町」と表示している。この表示方法では、手書き文字と
候補文字列の位置が全体的に見て一番近く、視点をあま
り動かさなくて済むというメリットがある。
In FIG. 19, a candidate character string "Omika-cho, Hitachi-shi, Ibaraki" is displayed centering on the position handwritten as "Omika-cho". This display method has an advantage that the positions of the handwritten character and the candidate character string are the closest as a whole, and the viewpoint does not need to be moved much.

【0048】図20では、「大みか町」と手書きした終
りの位置と候補文字列「茨城県 日立市 大みか町」の
最後の文字の位置を揃えてと表示している。この表示方
法では、特に右利きのユーザでは、ペンを持った手の下
に候補文字列が隠れないメリットがある。
In FIG. 20, it is displayed that the position of the end handwritten as "Omika-cho" and the position of the last character of the candidate character string "Omika-cho, Hitachi City, Ibaraki Prefecture" are aligned. This display method has an advantage that a candidate character string is not hidden under a hand holding a pen, especially for right-handed users.

【0049】図17〜図20のように、各々特徴ある表
示方法があるが、システムが適宜どれか1つの方法に決
めてもよいし、ユーザが複数の表示方法から自分にあっ
た表示方法を選択できるようにしてもよい。
As shown in FIGS. 17 to 20, there are characteristic display methods, but the system may appropriately determine any one of the display methods. You may make it selectable.

【0050】また、図17〜図20では、候補文字列中
のキーワード「大みか」を反転表示して分かりやすくし
ているが、例えばフォントを変えるなど、他の方法でも
よい。また、特に反転表示やフォントを変えるなどを行
わなくてもよい。
In FIGS. 17 to 20, the keyword "Omika" in the candidate character string is displayed in reverse video for easy understanding. However, other methods such as changing the font may be used. In addition, it is not necessary to perform the reverse display or change the font.

【0051】以上、本実施例によれば、住所のような階
層データや定形句などを入力する際に、キーとなる文字
を入力するだけで、文字列全体を推測し、候補として表
示することができる。また、単語辞書に高速にアクセス
して単語照合することができ、上記実施例のように単語
辞書が階層化されているときでも、階層の上位・下位に
関係なく高速にアクセスができる。
As described above, according to the present embodiment, when inputting hierarchical data such as an address, a fixed phrase, or the like, the entire character string can be guessed and displayed as candidates only by inputting a key character. Can be. Further, the word dictionary can be accessed at a high speed to perform word collation, and even when the word dictionary is hierarchized as in the above-described embodiment, the word dictionary can be accessed at a high speed regardless of the upper or lower level of the hierarchy.

【0052】[5]キー入力文字の曖昧検索 それでは、次に、入力文字をキーにした曖昧検索につい
て述べる。ここで、曖昧検索とは、キー入力と完全に一
致していなかったり、一部欠損していたり、キー文字の
並び順が一部異なっていたりする曖昧な情報をキーにし
て検索する意味である。
[5] Fuzzy Search for Key Input Characters Next, a fuzzy search using input characters as keys will be described. Here, the ambiguous search means that a search is performed using ambiguous information that does not completely match the key input, is partially missing, or has a partially different order of key characters as a key. .

【0053】図23は、キーとして、「大みか」と入力
した。これを、文字遷移に分解すると、図のように、
「大→み」「み→か」に分けられる。これらの文字遷移
を含む文字は、「大→み」に対して「大みか町」が、
「み→か」に対して「大みか町」と「みかの原町」が候
補になる。これらは、両方とも、「町村以下」の地名な
ので、階層で繋がって纏められることはない。そこで、
次に、2つの候補それぞれの得点(キー文字の一致数と
文字遷移の一致数)を計算する。文字の一致数では、
「大みか町」は、キー文字「大みか」と3文字が一致し
ているので3点、「みかの原町」は、キー文字「大み
か」のうち「みか」の2文字が一致しているので2点と
数える。文字遷移では、「大→み」と「み→か」の2つ
が該当しているので、2点、「みかの原町」は、「み→
か」のみが該当しているので、1点と計算できる。図2
3の例では、(キー文字一致数>キー文字の文字遷移の
一致数>キー文字該当階層順>キー文字一致位置)の順
に強い優先とした。そこで、優先度が一番高い、文字の
一致数の得点の高い「大みか町」が1位,「みかの原
町」が2位になり、単語辞書a6を参照して、1位:
「茨城県 日立市 大みか町」,2位:「茨城県 日立
市 みかの原町」となる。
In FIG. 23, "Omika" is input as a key. When this is decomposed into character transitions, as shown in the figure,
It is divided into “Large → Mi” and “Mi → Ka”. The characters that include these character transitions are:
"Mikakamachi" and "Mikanoharamachi" are candidates for "Mikaka". Since both of these are place names under “Municipalities and below,” they are not linked together in a hierarchy. Therefore,
Next, the score of each of the two candidates (the number of matching key characters and the number of matching character transitions) is calculated. For character matching,
"Omika-cho" has 3 points because the key character "Omika" matches 3 characters, and "Mika Hara-machi" has 2 points because the two characters "Mika" among the key characters "Omika" match. Count. In the character transition, "Large → Mi" and "Mi → Ka" correspond, so two points, "Mika Haramachi" is "Mi → Hara"
Since only "?" Is applicable, it can be calculated as one point. FIG.
In the example of No. 3, priority was given in the order of (the number of matching key characters> the number of matching character transitions of the key characters> the order of the corresponding key characters> the key character matching position). Therefore, "Omika-cho", which has the highest priority and the highest score of the number of matching characters, is ranked first, and "Mikahara-cho" is ranked second. Referring to the word dictionary a6, the first is:
"Omika-cho, Hitachi City, Ibaraki Prefecture", 2nd place: "Mikanohara Town, Hitachi City, Ibaraki Prefecture".

【0054】このように、入力キー文字「大みか」を
(一部でも)含む住所を検索する場合、検索結果に表示
優先順位を付け、尤もらしい結果が先に表示されるよう
にして、操作性を向上することが必要である。優先順
は、キー文字の一致数,キー文字の文字遷移の一致数,
キー文字の階層順,キー文字が一致した位置,キー文字
の並び順,キー文字間距離,単語の使用頻度の少なくと
も1つを考慮すればよい。図24の例では、「みか」と
キーの文字を入力した。文字遷移「み→か」を含む地名
は、図23と同様に、「大みか町」と「みかの原町」が
ある。この例では、「大みか町」も「みかの原町」も、
キー文字を2文字含み(2点)、キー文字と同じ遷移1
つを含む(1点)ので、文字一致数と文字遷移一致数か
らは、優先は付けられない。また、階層も、両方等も同
じ「町村以下」のレベルである。そこで、一般には、キ
ー文字を頭に含む文字列を入力することが多いので、キ
ー文字「みか」を先頭に含む「みかの原町」を1位にす
る。そして、2位が、「大みか町」となる。検索結果と
しては、単語辞書a6を参照して、1位:「茨城県日立
市 みかの原町」,2位:「茨城県 日立市 大みか
町」を表示した。
As described above, when searching for an address that includes the input key character "Omika" (or even a part thereof), display priorities are assigned to the search results, and a likely result is displayed first, so that operability is improved. It is necessary to improve. The priority order is the number of matching key characters, the number of matching character transitions of key characters,
At least one of the hierarchical order of the key characters, the position where the key characters match, the arrangement order of the key characters, the distance between the key characters, and the frequency of use of the words may be considered. In the example of FIG. 24, "Mika" and a key character are input. As in FIG. 23, the place names including the character transition “Mika” are “Omikacho” and “Mikaharamachi”. In this example, both "Omika town" and "Mika Hara town"
Transition 1 including 2 key characters (2 points), same as key character
(One point), no priority is given from the number of character matches and the number of character transition matches. In addition, the hierarchy, both levels, etc. are at the same level of “Municipalities and below”. Therefore, in general, a character string including a key character at the beginning is often input. Therefore, “Mika Haramachi” including the key character “Mika” at the top is ranked first. The second place is Omika-cho. As the search results, the first place: “Mikahara-cho, Hitachi City, Ibaraki Prefecture” and the second place: “Omika-cho, Hitachi City, Ibaraki Prefecture” are displayed with reference to the word dictionary a6.

【0055】図25の例では、キー入力文字として「常
陸太田市真弓」と入力した。「常陸太田市真弓」を文字
遷移に分解すると、「常陸」「陸太」「太田」「田市」
「市真」「真弓」となる。これらの文字遷移を含む単語
は、図の例では「常陸」「陸太」「太田」「田市」を含
む単語として「常陸太田市」が、「太田」「田市」を含
む単語として「太田市」「太田市町」が、「太田」を含
む単語「太田」,「市真」を含む単語はないが、「真
弓」を含む単語として「真弓(常陸太田市)」「真弓
(生駒市)」「真弓南」が得られる。ところで、この中
で、「常陸太田市」−「真弓(常陸太田市)」および「太
田市」−「太田」は、単語辞書a6より、階層関係にあ
ることがわかる。そこで、「常陸太田市真弓」と「太田
市太田」は、繋いで考えることができる。
In the example of FIG. 25, "Mayumi Hitachi-Ota-shi" is input as a key input character. Breaking down "Hitachi Ota City Mayumi" into character transitions, "Hitachi""Rikuta""Ota""Taichi"
"Ichima" and "Mayumi". In the example shown in the figure, words including these character transitions include “Hitachi”, “Rikuta”, “Ota”, and “Taichi”, and “Hitachi-Ota-shi” includes words that include “Ota” and “Taichi”. "Ota City" and "Ota City" do not contain the words "Ota" or "Ichima" that contain "Ota", but "Mayu (Hitachi-Ota City)" or "Mayumi (Ikoma City)" as words that contain "Mayumi" ) "And" Mayumi Minami ". By the way, it can be seen from the word dictionary a6 that “Hitachi Ota City” − “Mayumi (Hitachi Ota City)” and “Ota City” − “Ota” have a hierarchical relationship. Therefore, "Mayumi Hitachi-Ota City" and "Ota City, Ota City" can be considered by connecting them.

【0056】これらの単語の文字一致数による得点は、
「常陸太田市真弓」が7点,「太田市太田」が3点,
「常陸太田市」が5点,「太田市」が3点,「太田市
町」が3点,「真弓(生駒市)」が2点,「真弓南」が
2点となる。これらの単語の文字遷移一致数による得点
は、これらの単語が含むキー文字の文字遷移の数の和と
すると、「常陸太田市真弓」が4点+1点=5点。但
し、「太田市太田」はキー文字の「太田」は1度しか書
いていないのに、2回出現したと見なしているので、重
みは小さくして、例えば、2点+0.1点=2.1点とす
る。その他の単語は、単語が含むキー文字の文字遷移の
数を得点とし、「常陸太田市」が4点,「太田市」が2
点,「太田市町」も2点,「真弓(生駒市)」が1点,
「真弓南」が1点となる。そこで、文字一致数の点数で
優先を付け、文字一致数が同点のものについては、文字
遷移一致数で優先を付け、それでも優先が付けられない
ものについては、階層順で優先を付けると、1位:「常
陸太田市真弓」,2位:「常陸太田市」,3位:「太田
市太田」,4位:「太田市」,5位:「太田市町」,6
位:「真弓(生駒市)」,6位:「真弓南」となる。
(4位と5位は、階層順により優先を付けた。) 検索結果は、単語辞書a6を参照し、1位:「茨城県
常陸太田市 真弓町」,2位:「茨城県 常陸太田市 山
下町」,3位:「群馬県 太田市 太田」,4位:「群
馬県 太田市 本町」,5位:「奈良県 橿原市 太田
市町」,6位:「奈良県 生駒市 真弓」,6位:「奈
良県 生駒市 真弓南」となる。
The score based on the number of character matches of these words is:
"Hitachi Ohta City Mayumi" 7 points, "Ota City Ota" 3 points,
"Hitachi Ota City" has 5 points, "Ota City" has 3 points, "Ota City" has 3 points, "Mayumi (Ikoma City)" has 2 points, and "Mayumi Minami" has 2 points. The score based on the number of character transition matches of these words is 4 points + 1 point = 5 points for "Mayumi Hitachi-Ota City", assuming the sum of the number of character transitions of key characters included in these words. However, the key character "Ota" is regarded as having appeared twice, although the key character "Ota" has been written only once. Therefore, the weight is reduced, for example, 2 points + 0.1 points = 2 .1 point. For other words, score the number of character transitions of the key characters included in the word, 4 points for "Hitachi Ota City" and 2 points for "Ota City"
Point, "Ota City" also has 2 points, "Mayumi (Ikoma City)" has 1 point,
"Mayumi Minami" is one point. Therefore, priority is given by the number of character matches, priority is given by the number of character transition matches for characters with the same number of characters, and priority is given in the order of hierarchy to those that cannot be given priority. Rank: "Mayumi Hitachi-Ota City", 2nd place: "Hitachi Ota City", 3rd place: "Ota City, Ota", 4th place: "Ota City", 5th place: "Ota City Town", 6th place
Rank: Mayumi (Ikoma City), 6th: Mayumi Minami.
(The 4th and 5th ranks are given priority in order of hierarchy.) The search result refers to the word dictionary a6, and the 1st rank: "Ibaraki Prefecture
Mayumi-cho, Hitachi-Ota City, 2nd place: Yamashita-cho, Hitachi-Ota-shi, Ibaraki, 3rd place: "Ota-shi, Ota-shi, Gunma", 4th place: "Honmachi, Ota-shi, Gunma", 5th: "Kashihara-shi, Nara Prefecture" Ota City ”, 6th place:“ Mayumi, Ikoma City, Nara Prefecture ”, 6th place:“ Mayumi Minami, Ikoma City, Nara Prefecture ”.

【0057】図48は、キー入力文字として「常陸太田
真弓」と入力した。ここでは、優先順位を(キー文字一
致数(a)>キー文字該当階層(b)>キー文字一致位
置(c)>余り文字数(d))の総合得点により付ける
方法を述べる。さて、「常陸太田真弓」を文字遷移に分
解すると、「常陸」「陸太」「太田」「田真」「真弓」
となり、これらの文字遷移を含む単語として「常陸太田
市真弓町」「常陸太田市」「太田市太田」「太田市」
「上太田」「真弓(生駒市)」「真弓南」が得られたと
する。これらの単語の文字一致数による得点(a)は、
キー文字のうち、候補単語に含まれれば1点、含まれな
ければ0点として加算すると、「常陸太田市真弓町」が
6点,「常陸太田市」が4点で、それ以外は2点とな
る。階層による得点(b)は、都道府県レベルが3点,
市・郡レベルが2点,町村以下レベルが1点として、複
数階層を含む場合は加算する。すると、市・郡と町村以
下を含む「常陸太田市真弓町」「太田市太田」が2+1
点=3点,市・郡の「常陸太田市」「太田市」が2点,
「上太田」「真弓(生駒市)」「真弓南」が1点にな
る。次に、キー文字一致位置による評価値(c)では、
単語の頭からキー文字と一致すれば0点,2文字目から
なら−1点,3文字目からなら−2点・・・と得点計算
する。すると、「上太田」が−1点で、それ以外は0点
になる。余り文字による得点(d)では、候補の単語の
うち、キー文字以外の文字が何文字含まれるかという値
で、N文字含めば、−N点とカウントする。図に示すよ
うに、「常陸太田市真弓町」が−2点,「常陸太田市」
「太田市太田」「太田市」「上太田」「真弓南」が−1
点,「真弓」が0点になる。最後に、これらの総合得点
(e)は、(キー文字一致数(a)>キー文字該当階層
(b)>キー文字一致位置(c)>余り文字数(d))の
優先度を付けるため、ここでは、(e)=1000×
(a)+100×(b)+10×(c)+(d)とし
た。各評価値に付ける重みは、優先度が高い評価値ほど
大きくすればよい。また、優先度を絶対的にするために
は、優先度が低い評価値の最大値よりも大きな値を重み
にすればよい(例:余り文字数の評価値(d)の最大が
0ならば、キー文字一致位置による評価値(c)は、1
以上ならよい。)。このようにして定めた評価値によ
り、優先順位を決定し、単語辞書a6を参照して、検索
結果を得る。
In FIG. 48, "Mayumi Hitachi Ohta" is input as a key input character. Here, a method will be described in which priorities are assigned based on the total score of (key character matching number (a)> key character corresponding hierarchy (b)> key character matching position (c)> remaining character number (d)). By the way, if you break down "Hitachi Ota Mayumi" into character transitions, you can get "Hitachi", "Rikuta", "Ota", "Tama", "Mayumi"
The words containing these character transitions are "Mayumicho, Hitachi-Ota City", "Hitachi-Ota City", "Ota, Ota", and "Ota City".
It is assumed that "Ueota", "Mayumi (Ikoma City)" and "Mayumi Minami" are obtained. The score (a) based on the number of character matches of these words is:
Of the key characters, 1 point if included in the candidate word, 0 points if not included, 6 points for "Mayumi-cho, Hitachi-Ota-shi", 4 points for "Hitachi-Ota-shi", and 2 points for others Becomes The score (b) according to the hierarchy is 3 points at the prefecture level,
If the city / county level is 2 points and the level below the towns and villages is 1 point, and there are multiple levels, add them. Then, “Mayumi-cho, Hitachi-Ota-shi” and “Ota, Ota-shi” including cities, counties and municipalities are 2 + 1.
Points = 3 points, "Hitachi Ota City" and "Ota City" of cities and counties are 2 points,
"Kamiota", "Mayumi (Ikoma City)" and "Mayumi Minami" will be one point. Next, in the evaluation value (c) based on the key character matching position,
Scores are calculated from the beginning of the word, such as 0 point, from the second character, -1 point, from the third character, -2 points, and so on. Then, "Ueota" is -1 point, and the other points are 0 points. In the remaining character score (d), the number of characters other than the key characters included in the candidate word is counted. If N characters are included, -N is counted. As shown in the figure, "Mayumi-cho, Hitachi-Ota City" has -2 points, and "Hitachi-Ota City"
"Ota City Ota""OtaCity""Kamiota""MayumiMinami" is -1
The point "Mayumi" becomes 0 point. Finally, these total scores (e) are given priority in order of (number of key character matches (a)> key character corresponding hierarchy (b)> key character match position (c)> number of remaining characters (d)) Here, (e) = 1000 ×
(A) + 100 × (b) + 10 × (c) + (d). The weight given to each evaluation value may be increased as the evaluation value has a higher priority. Further, in order to make the priority absolute, a value larger than the maximum value of the evaluation value with a low priority may be weighted (for example, if the maximum of the evaluation value (d) of the number of remaining characters is 0, The evaluation value (c) based on the key character matching position is 1
That's fine. ). The priority is determined based on the evaluation value thus determined, and a search result is obtained by referring to the word dictionary a6.

【0058】さて、これまで説明したような、文字遷移
に分解して検索する手法を用いれば、キー入力文字が一
部欠損していたり、一部誤りがあったり、キー文字の順
序が曖昧であっても検索が可能である。そのような例を
紹介する。
By using the technique of decomposing into character transitions and searching as described above, key input characters are partially missing or partially erroneous, or the order of key characters is ambiguous. Even if there is, search is possible. Here are some examples.

【0059】図26は、図25で検索したのと同じ地名
「茨城県 常陸太田市 真弓町」を検索するのに、キー
文字を、「真弓太田」と、順序を逆に入力している。し
かし、キー文字を文字遷移に分解すれば、図25と同じ
ように、「真弓」を含む単語として、「真弓(常陸太田
市)」「真弓(生駒市)」「真弓南」が得られる。「弓
太」を含む単語はないが、「太田」を含む単語として、
「常陸太田市」「太田市」「太田市町」「太田」が得ら
れる。あとは、図25と同様に、階層で繋がる単語は繋
ぎ「常陸太田市真弓」「太田市太田」、同様に得点計算
をすると、1位の「茨城県 常陸太田市 真弓町」が得
られる。この例のように、キー文字の順序を逆にして
も、妥当な結果が得られるのは、単語辞書へのポインタ
(インデックス)に文字遷移(2文字組)という、文字
の並びを意識した情報を用いているためである(2文字
の熟語が多いことなどからも分かる)。これが、もし、
1文字毎のインデックスを付けているとすると、順序を
気にせずに検索したら、予想しないおかしな検索結果が
含まれるのは容易に想像がつく(例:「山形」と入力し
たのに、「形山」がたくさん含まれる)。
In FIG. 26, key characters are input in reverse order of "Mayumi-Ota" to search for the same place name "Mayumi-cho, Hitachi-Ota-city, Ibaraki-ken" as searched in FIG. However, when the key characters are decomposed into character transitions, "Mayumi (Hitachi Ota City)", "Mayumi (Ikoma City)", and "Mayumi Minami" are obtained as words including "Mayumi", as in FIG. No word contains "Yuta", but as a word containing "Ota"
"Hitachi Ota City""OtaCity""Ota City Town""Ota" is obtained. After that, as in FIG. 25, words connected in a hierarchy are connected to “Mayumi Hitachi-Ota-shi” and “Ota-shi Ota”, and if the score is calculated in the same manner, the first place “Mayumi-cho, Hitachi-Ota-shi, Ibaraki” is obtained. Even if the order of the key characters is reversed, as in this example, a valid result can be obtained by using character transition (two-character set) in the pointer (index) to the word dictionary. (It can also be seen from the fact that there are many two-character idioms). If this is
Assuming that each character is indexed, it is easy to imagine that if you search without regard to order, unexpected and unexpected search results will be included (for example, if you enter “Yamagata”, Is included).

【0060】図27は、「茨城県 常陸太田市 真弓
町」を検索したく、「常陸太田市真弓」と入力すべきと
ころを、「常陸大田市真弓」と、「太田」−「大田」を
誤って入力した例である。単語で考えれば、「常陸太田
市」と「常陸大田市」では異なるが、キー入力文字を文
字遷移に分解すれば、「常陸」「陸太」「大田」「田
市」「市真」「真弓」となり、「常陸」「田市」から、
「常陸太田市」を候補に含めることが可能である。単語
辞書a6より、階層で繋がる単語は繋いで、前記方法と
同様に得点計算をすれば、「常陸太田市真弓」がキー文
字「常陸大田市真弓」の文字遷移「常陸」「陸太」「大
田」「田市」「市真」「真弓」との一致数が最も多く、
「茨城県 常陸太田市 真弓町」が第1位になる。この
ように、キー入力文字の途中など、一部に誤りがあって
も、残りの文字をキーとして、欲しい文字列を検索する
ことができる。
FIG. 27 shows a case where "Mayumi-cho, Hitachi-Ota-shi, Ibaraki-ken" is to be searched, and "Mayumi, Hitachi-Ota-shi" should be input, and "Mayumi, Hitachi-Ota-shi" and "Ota"-"Ota" are entered. This is an example of incorrect input. In terms of words, "Hitachi Ota City" and "Hitachi Ota City" are different, but if key input characters are decomposed into character transitions, "Hitachi""Rikuta""Ota""Taichi""Ichima"" Mayumi, and from Hitachi and Taichi,
"Hitachi-Ota City" can be included in the candidate. From the word dictionary a6, words connected in a hierarchy are connected, and if the score is calculated in the same manner as described above, the character transition of “Mayumi Hitachi-Ota-shi” becomes the character transition of the key character “Mayumi Hitachi-Ota-shi”. Daejeon "," Taichi "," Ichima "," Mayumi "has the highest number of matches,
"Mayumicho, Hitachiota City, Ibaraki Prefecture" is ranked first. In this way, even if there is an error in a part of the key input character or the like, a desired character string can be searched using the remaining characters as a key.

【0061】ところで、図25〜図27などでは、キー
入力文字の文字数が増えたため、曖昧検索の検索結果の
数が多くなっている。曖昧検索結果を全部表示した方が
嬉しい場合もあるが、全部見るのも大変だし、キー文字
をたくさん入れたのだから、候補を絞って欲しい場合も
ある。その場合、図28のように、検索結果の表示条件
をユーザが指定できるようにすれば、ユーザは、好みに
応じて、必要な情報を選択できるようになる。図の例で
は、キー入力文字の80%以上を含む検索結果のみを表
示するように指定している。そのため、検索システム
は、検索により得られた住所候補がキー文字の何%を含
むか計算し、ユーザの指定条件に合った検索結果のみを
表示する。
By the way, in FIGS. 25 to 27 and the like, the number of search results of the fuzzy search increases because the number of key input characters has increased. Sometimes it's nice to see all of the fuzzy search results, but it's hard to see them all, and sometimes you want to narrow down the candidates because you've put a lot of key letters. In this case, as shown in FIG. 28, if the user can specify the display condition of the search result, the user can select necessary information according to his / her preference. In the example of the figure, it is specified that only the search results including 80% or more of the key input characters are displayed. Therefore, the search system calculates what percentage of the key characters are included in the address candidates obtained by the search, and displays only the search results that meet the conditions specified by the user.

【0062】図28の例では、曖昧検索の結果をどのく
らい出力するかを、キー入力文字との一致割合などの指
標を元に、ユーザに選択させるものであった。この外に
も、(キー入力と完全にANDがとれる結果を表示する
/キー入力のORの結果を表示する)などで、結果の出
力をユーザに選択させてもよい。
In the example of FIG. 28, the user is caused to select how much the result of the fuzzy search is to be output, based on an index such as a matching ratio with the key input character. In addition, the user may be allowed to select the output of the result by, for example, (displaying a result that can be completely ANDed with a key input / displaying an OR result of the key input).

【0063】さらには、図29のように、曖昧検索結果
の優先順位の付け方をユーザに指定させるようにして、
ユーザの欲しい情報が優先的に表示されるようにしても
よい。図の例では、(階層>文字一致数)の順に優先を
付けるように指定があるので、キー文字を含む曖昧検索
結果のうち、階層が高いものが優先的に表示される。 [6]1文字の曖昧検索 さて、これまで、文字遷移情報を使った曖昧検索につい
て述べてきた。文字遷移情報とは、2文字間の関係を表
す情報なので、一般には、2文字以上の単語について有
効である。しかし、単語の中には1文字のものも存在す
る(例:住所単語の「泉」や「イ」「ロ」「ハ」など)
ため、文字遷移情報による曖昧検索を、1文字の単語に
も拡張する必要がある。次に、文字遷移情報を用いて1
文字の単語を曖昧検索する方法を述べる。
Further, as shown in FIG. 29, the user is allowed to specify how to prioritize fuzzy search results.
Information desired by the user may be preferentially displayed. In the example shown in the figure, since there is a designation to give priority in the order of (hierarchy> number of character matches), among the fuzzy search results including key characters, those with higher hierarchies are displayed with priority. [6] Fuzzy Search of One Character By now, the fuzzy search using the character transition information has been described. The character transition information is information indicating a relationship between two characters, and is generally effective for words having two or more characters. However, some words have one letter (eg, "Izumi", "I", "B", "C", etc.)
Therefore, it is necessary to extend the fuzzy search based on the character transition information to one-character words. Next, using character transition information, 1
A method for ambiguous search for words in letters is described.

【0064】図30は、文字遷移情報をベースにしなが
ら、1文字の情報でも検索するための遷移情報学習方法
と検索方法の概要を示す。1文字検索のポイントは、1
文字の単語WをW→Nullという文字遷移で表すことにあ
る。例えば、図の例では、「埼玉県 川口市 峯」を、
「埼→玉」「玉→県」「川→口」「口→市」「峯→Nul
l」という文字線遷移に見立てて学習した。
FIG. 30 shows an outline of a transition information learning method and a retrieval method for retrieving even one character information based on the character transition information. The point of one character search is 1
The word W of a character is represented by a character transition of W → Null. For example, in the example in the figure, "Mine, Kawaguchi-shi, Saitama"
“Sai → Tama” “Tama → Prefecture” “River → Mouth” “Mouth → City” “Mine → Nul”
I learned it assuming the character line transition "l".

【0065】このように学習しておけば、例えば、検索
するためのキーワードとして、「川口,峯」と区切って
入力されれば、「川→口」と「峯→Null」(あるいは、
「峯→*(なんでもよい)」)の遷移を含むと解釈し、
図のように、「川口市 峯」を第一候補に選択できる。
(1文字の単語wを「w→Null」と学習したのに、検索
する場合には、「w→*(何でもよい)」と見なす方が
好都合な場合がある。これについては、次の図31で詳
しく述べる。) 前に述べた「川口,峯」のように、1文字のキーワード
を区切って入力してもらえれば良いが、「川口峯」のよ
うに、区切られないで入力されることも考えられる。そ
の場合には、「川口峯」を、これまでと同じように2文
字の遷移(「川→口」「口→峯」)と見なす他に、図の
ように、1文字毎の遷移(「川→*」「口→*」「峯→
*」)と見なすことにより、1文字の単語「峯」も取り
こぼさずに検索することができる。
By learning in this way, for example, if a keyword for searching is entered by separating “Kawaguchi, Mine”, “Kawaguchi → Mouth” and “Mine → Null” (or
"Mine → * (anything)"
As shown in the figure, “Kawaguchi Ichimine” can be selected as the first candidate.
(While learning the word w of one character as “w → Null”, it is sometimes convenient to regard it as “w → * (anything is acceptable)” when searching. The details are described in 31.) It is sufficient if you enter the keyword of one character separated like “Kawaguchi, Mine” mentioned above, but it should be input without being separated like “Kawaguchi Mine”. Is also conceivable. In this case, "Kawaguchimine" is regarded as a two-character transition ("river → mouth", "mouth → mine") as in the past, and as shown in FIG. River → *, Mouth → *, Mine →
*)), It is possible to search for the one-character word “mine” without missing it.

【0066】さて、先ほど、1文字の単語wを「w→Nu
ll」と学習したのに、検索する場合には、「w→*(何
でもよい)」と見なす方が好都合な場合があると述べた
が、そのような例を図31を用いて説明する。
By the way, the word w of one character is changed to “w → Nu”.
Although it has been described that it may be more convenient to regard “w → * (anything)” in the case of searching for a search after learning “ll”, such an example will be described with reference to FIG.

【0067】図31の例では、「千葉県 旭市 イ」と
いう住所の学習と検索の例を示す。学習時は、図30の
例と同様に、文字遷移「千→葉」「葉→県」「旭→市」
「イ→Null」に分解して学習する。
The example of FIG. 31 shows an example of learning and searching for an address "A, Asahi-shi, Chiba". At the time of learning, as in the example of FIG. 30, the character transitions “1000 → leaf” “leaf → prefecture” “Asahi → city”
Learn by breaking down into "I → Null".

【0068】次に、検索の話をする。「旭市」のよう
に、固有の地名が「旭」1文字で、後ろに単位を表す
「市」がついて2文字になったような地名の場合、検索
時には、固有の地名を表す「旭」1文字のみを入力した
いことがよくある。例えば、「千葉県 旭市 イ」を検
索したく、「旭,イ」のように入力する場合がこれに当
たる。このような場合、「旭,イ」を「旭→Null」と
「イ→Null」としか見なさないと、「イ」という単語に
ついては、「イ→Null」と学習してあるため検索できる
が、「旭市」については、「旭→市」と学習してあるた
め、検索ができない。このような不具合を防ぐために
は、学習するときには、1文字の単語wを文字遷移「W
→Null」と見なしてよいが、検索する場合には、1文字
の単語(あるいは文字)Wを、「W→*(なんでもよ
い)」と見なすほうがよい。但し、この場合、Wが頭に
つく文字遷移を全部含めるため、意図しない候補も急に
増えることが予想される。そのような場合には、「旭
市」のように、固有の地名が先頭の1文字で、後ろに単
位を表す「都道府県・市郡・町村」等がついて2文字に
なったような地名を優先するとよい。それには、まず
は、「W→都」「W→道」「W→府」・・・「W→村」を
優先的に検索し、さらに、ユーザに提示する検索結果の
数に余裕があれば、「W→*(なんでもよい)」を実行
するとよい。
Next, the search will be described. In the case of a place name such as "Asahi City" where the unique place name is one letter of "Asahi" and followed by "City" indicating the unit and becomes two letters, "Asahi" which represents the unique place name at the time of search Often you want to enter only one character. For example, this is a case where the user wants to search for "Asahi-shi, Chiba-ken", and inputs "Asahi-a". In such a case, if "Asahi, I" is regarded only as "Asahi → Null" and "I → Null", the word "I" can be searched because it has been learned as "I → Null". , "Asahi City" cannot be searched because "Asahi → City" has been learned. In order to prevent such a problem, when learning, the word w of one character is changed to the character transition “W
"→ Null", but when searching, it is better to regard the one-character word (or character) W as "W → * (anything is acceptable)". However, in this case, since all character transitions preceded by W are included, the number of unintended candidates is expected to increase rapidly. In such a case, a unique place name such as "Asahi City" has one letter at the beginning, followed by "prefecture / city / county / town / village" indicating the unit and has two letters. Should be given priority. To do this, first, "W → capital", "W → road", "W → prefecture" ... "W → village" are searched preferentially, and if there is room in the number of search results presented to the user, , "W → * (anything is fine)" may be executed.

【0069】あるいは、まずは、「W→都」「W→道」
「W→府」・・・「W→村」を優先的に検索し、結果を
ユーザに見せ、その中に欲しい検索結果があれば、そこ
で終了。もし、なければ、「W→*(なんでもよい)」
を実行する方法もある。
Alternatively, first, "W → capital" and "W → road"
"W → fu" ... "W → village" is searched preferentially, the result is shown to the user, and if there is a desired search result, the search is terminated. If not, "W → * (anything is fine)"
There is also a way to execute.

【0070】あるいは、図29のような、ユーザの検索
の条件設定パネルで、「W→都」「W→道」「W→府」
・・・「W→村」を優先的に検索すればよいか、あるい
は、「W→*(なんでもよい)」まで検索する必要があ
るかを設定してもらってもよい。
Alternatively, in the user's search condition setting panel as shown in FIG. 29, “W → Tokyo”, “W → Road”, “W → Fu”
... It may be set whether to search for “W → village” preferentially or to search for “W → * (anything)”.

【0071】以上により、文字遷移情報を用いる曖昧検
索を、1文字の曖昧検索もできるように拡張することが
できた。
As described above, the ambiguous search using the character transition information can be extended so that the ambiguous search of one character can be performed.

【0072】[7]単語辞書と文字遷移回数および出現
回数の学習 図32は、単語辞書と遷移&出現回数テーブル(文字の
遷移確率と出現確率の元データ)の学習システムの構成
を示す。動作概要を説明する。ユーザは、単語入力部h
1により、新しい単語を入力する。すると、学習システ
ムは、学習機能付き単語辞書h3に、新たに入力された
単語を追加登録するh2。もし、新たに入力された単語
が、以前に登録済みであった場合には、追加登録せず
に、次のステップ(遷移&出現回数のカウント)に進
む。続いて、新たに入力された単語を文字遷移に分解
し、単語に含まれる文字の遷移回数と出現回数を学習機
能付きユーザ遷移&出現回数テーブルh5に記録する。
さらに、入力された単語が学習機能付き単語辞書h3の
どこに記録されているか、そのアドレスを文字遷移に関
連づけて、学習機能付きユーザ遷移&出現回数テーブル
h5に記録する。以上を、ユーザが新たに単語を学習さ
せる度に行えばよい。それでは、次に、図面を用いて、
学習機能付き単語辞書h3と学習機能付きユーザ遷移&
出現回数テーブルh5の構成を詳細に述べる。
[7] Learning of Word Dictionaries, Number of Character Transitions, and Number of Appearances FIG. 32 shows the configuration of a learning system for a word dictionary and a transition & appearance number table (character transition probability and appearance probability original data). An outline of the operation will be described. The user enters the word input unit h
1 inputs a new word. Then, the learning system additionally registers the newly input word in the word dictionary with learning function h3. If the newly input word has been registered before, the process proceeds to the next step (counting of transition and number of appearances) without additional registration. Subsequently, the newly input word is decomposed into character transitions, and the number of transitions and the number of appearances of the characters included in the word are recorded in the user transition & appearance number with learning function table h5.
Further, where the input word is recorded in the word dictionary with learning function h3, its address is recorded in the user transition with learning function & appearance count table h5 in association with the character transition. The above may be performed each time the user learns a new word. Then, using the drawings,
Word dictionary h3 with learning function and user transition with learning function &
The configuration of the appearance count table h5 will be described in detail.

【0073】図33は、学習機能付き単語辞書h3と学
習機能付きユーザ遷移&出現回数テーブルh5の構成を
示す。この図の例では、学習機能付き単語辞書h3に
は、氏名と電話番号の情報(電話帳情報)が記録できる
ようになっている。電話帳情報のテーブルには、Nextの
電話帳情報を差すポインタがついて、情報を増やせるよ
うになっている。この図では、「田中博」,「菊池圭
二」,「田所ゆかり」の3名の電話帳情報を登録してあ
る。
FIG. 33 shows the structure of the word dictionary with learning function h3 and the user transition & appearance count table with learning function h5. In the example of this figure, information (phonebook information) of names and telephone numbers can be recorded in the word dictionary with learning function h3. In the telephone directory information table, a pointer pointing to the next telephone directory information is attached so that the information can be increased. In this figure, telephone directory information of three people, "Hiroshi Tanaka", "Keiji Kikuchi", and "Yukari Tadokoro" is registered.

【0074】図33は、前記、学習機能付き単語辞書h
3のデータを高速検索するための、学習機能付きユーザ
遷移&出現回数テーブルh5の様子を示す。学習機能付
きユーザ遷移&出現回数テーブルh5には、単語に現れ
た文字遷移の情報(遷移元文字とその出現回数、およ
び、文字遷移の遷移先文字と文字遷移回数)と文字遷移
を含む単語(関連単語)のアドレスを記録する構成にな
っている。こちらも、Nextの文字遷移情報を指すポイン
タが付いていて、情報を増やせるようになっている。こ
こで、後で、単語や住所の曖昧検索を行う際に、高速な
検索を実現するためには、遷移元文字や、各遷移元文字
に繋がる遷移先文字のデータを、図のように文字コード
順に並べておくとよい。そうすれば、後から検索を行う
際には、文字遷移情報をバイナリサーチなどで、高速に
探すことができる。
FIG. 33 shows the word dictionary h with the learning function.
9 shows a state of a user transition & appearance count table h5 with a learning function for high-speed retrieval of data No. 3. In the user transition & appearance count table h5 with learning function, information on character transitions appearing in the word (transition source character and its appearance frequency, and transition destination character and character transition frequency of the character transition) and the word including the character transition ( (Relevant word). Here, too, a pointer to the character transition information of Next is attached, so that the information can be increased. Here, in order to realize a high-speed search when performing an ambiguous search for a word or an address later, data of a transition source character and data of a transition destination character connected to each transition source character are written as shown in the figure. It is better to arrange them in code order. Then, when performing a search later, the character transition information can be searched at high speed by a binary search or the like.

【0075】さて、図34は、図33の学習機能付き単
語辞書h3に、新たに、「郡司圭子(電話番号056−
41−5046)」という情報を追加し、学習機能付き
ユーザ遷移&出現回数テーブルh5を更新した様子を示
す。学習機能付きユーザ遷移&出現回数テーブルh5
に、以前には、「郡→司」や「圭→子」という文字遷移
情報が登録されていなかった。そのため、新たに、「郡
→司」と「圭→子」という文字遷移情報を追加した。追
加の際には、後で検索する時に高速に行えるよう、図に
示すように、遷移元文字と、遷移元文字に繋がる遷移先
文字のデータが文字コード順に並ぶ位置に挿入した。
FIG. 34 shows that the word dictionary with learning function h3 shown in FIG.
41-5046) is added, and the user transition & appearance count table h5 with the learning function is updated. User transition & appearance count table h5 with learning function
Previously, character transition information such as "Gun → Tsuka" or "Kei → Child" was not registered. Therefore, new character transition information "Gun → Tsuka" and "Kei → Child" has been added. At the time of addition, as shown in the figure, the data of the transition source character and the data of the transition destination character connected to the transition source character are inserted at positions where the data are arranged in the order of the character codes, so that the retrieval can be performed quickly at a later time.

【0076】図35には、図34の例に、さらに、学習
機能付き単語辞書h3に、新たに、「菊池博(電話番号
03−453−5587)」という情報を追加し、学習
機能付きユーザ遷移&出現回数テーブルh5を更新した
様子を示す。さて、学習機能付きユーザ遷移&出現回数
テーブルh5には、以前から、「菊→池」や「博→Nul
l」という文字遷移情報が登録されていた。そこで、こ
こでは、以前からある「菊→池」「博→Null」という文
字遷移情報テーブルの、遷移元文字出現回数と文字遷移
の遷移回数、および、遷移情報を含む単語(関連単語)
を書き換えればよい。以上のような学習を用いれば、ユ
ーザが新たに単語情報を追加したい場合、従来から学習
している単語辞書や遷移&出現回数テーブルを生かした
まま、高速曖昧検索のためのデータを更新できる。
In FIG. 35, in addition to the example of FIG. 34, information “Hiroshi Kikuchi (telephone number 03-453-5587)” is newly added to the word dictionary with learning function h3. The state which updated the transition & appearance frequency table h5 is shown. By the way, the user transition & appearance frequency table h5 with the learning function has previously stored “Kiku → Ike” and “Haku → Nul”
The character transition information "l" was registered. Therefore, here, a word including the transition frequency of the transition source character, the transition frequency of the character transition, and the transition information (the related word) in the character transition information table of “Kiku → Ike” and “Haku → Null” which has been used before.
Can be rewritten. By using the above learning, when the user wants to add new word information, the data for the high-speed fuzzy search can be updated while utilizing the word dictionary and the transition & appearance frequency table which have been conventionally learned.

【0077】図36は、単語辞書とユーザ遷移&出現回
数テーブルの学習機能を単語の曖昧検索装置に組み込ん
だ例を示す。前述した方法で、学習機能付き単語辞書h
3と学習機能付きユーザ遷移&出現回数テーブルh5の
学習を行う。ここでポイントは、これらのテーブルを学
習したら、その度に、曖昧検索システムは、学習機能付
き単語辞書h3と学習機能付きユーザ遷移&出現回数テ
ーブルh5のロードを行い、最新の情報を用いて検索で
きるようにしたことにある。
FIG. 36 shows an example in which the learning function of the word dictionary and the user transition & appearance count table is incorporated in the word fuzzy search device. In the manner described above, the word dictionary with learning function h
3 and learning of the user transition & appearance count table h5 with a learning function. Here, the point is that each time these tables are learned, the fuzzy search system loads the word dictionary with learning function h3 and the user transition & appearance count table with learning function h5, and searches using the latest information. It was made possible.

【0078】図37は、単語辞書やユーザ遷移&出現回
数テーブルを、標準の辞書(テーブル)と、ユーザの辞
書(テーブル)に分けた例である。例えば、一般的に用
いるデータは標準辞書に、個人に特有なデータはユーザ
辞書に登録する。すると、複数の人間がシステムを共用
する場合にも、標準辞書は共用し、個人に特有のデータ
は、各自が持てばよい。標準辞書が更新されたときなど
にも、個人に特有のデータをユーザ辞書に分けておくこ
とで、個人のデータが保護されるし、新しい標準辞書デ
ータも用いることができる。
FIG. 37 shows an example in which the word dictionary and the user transition & appearance count table are divided into a standard dictionary (table) and a user dictionary (table). For example, generally used data is registered in a standard dictionary, and data unique to an individual is registered in a user dictionary. Then, even when a plurality of people share the system, the standard dictionary is shared, and each person may have data unique to the individual. Even when the standard dictionary is updated, by dividing the data unique to the individual into the user dictionary, the personal data is protected and new standard dictionary data can be used.

【0079】このように、ユーザ辞書と標準辞書を複数
使う場合には、例えば、図に示すように、最初に、学習
機能付きユーザ遷移&出現回数テーブルh5を使って、
候補文字列の最適化と単語のポインタ決定を行いi5、
その最適化結果が妥当なものかどうかをチェックするi
6。もし、これが妥当ならば、ユーザの単語辞書h3を
参照して結果を導ける。しかし、もし、妥当でなかった
ならば、ユーザは検索キーとして、学習機能付きユーザ
遷移&出現回数テーブルh5にはない情報(標準のテー
ブルにある情報)を入力したと考えられる。そこで、標
準出現確率テーブルd8や、標準の文字遷移確率テーブ
ルa4,標準の単語辞書a6を用いて、図1で説明した
のと同様の検索を行えばよい。
As described above, when a plurality of user dictionaries and standard dictionaries are used, for example, as shown in FIG.
Optimize the candidate character string and determine the word pointer, i5,
Check if the optimization result is valid i
6. If this is appropriate, the result can be derived by referring to the user's word dictionary h3. However, if it is not appropriate, it is considered that the user has input, as a search key, information that is not in the user transition & appearance frequency table h5 with learning function (information in the standard table). Therefore, a search similar to that described with reference to FIG. 1 may be performed using the standard appearance probability table d8, the standard character transition probability table a4, and the standard word dictionary a6.

【0080】学習機能付きユーザ遷移&出現回数テーブ
ルh5による文字列最適化が妥当ならば、ユーザ遷移&
出現回数テーブルに記載されている、その文字遷移を含
む単語辞書アドレスを参照して、単語検索を行うi7。
もし、検索結果が妥当ならばi8、結果を表示するi
4。もし、妥当でなかったならば、ユーザは検索キーと
して、学習機能付きユーザ遷移&出現回数テーブルh5
にはない情報(標準のテーブルにある情報)を入力した
と考えられる。そこで、標準出現確率テーブルd8や、
標準の文字遷移確率テーブルa4,標準の単語辞書a6
を用いて、図1で説明したのと同様の検索を行えばよ
い。
If the character string optimization by the user transition & appearance frequency table h5 with the learning function is appropriate, the user transition &
A word search is performed by referring to the word dictionary address including the character transition described in the appearance count table i7.
If the search result is valid i8, display the result i
4. If it is not appropriate, the user uses the user transition with learning function & appearance count table h5 as a search key.
It is probable that you have entered information that is not in the information (information in the standard table). Therefore, the standard appearance probability table d8,
Standard character transition probability table a4, standard word dictionary a6
, A search similar to that described with reference to FIG. 1 may be performed.

【0081】[曖昧検索の様々な応用] [11]各種の入力(キーボード・文字・音声)に適用
する例 さて、これまでは、文字遷移情報テーブルと単語辞書を
用いて、文字認識結果の最適化と曖昧検索を行う例を中
心に述べてきた。しかし、この、文字遷移情報テーブル
と単語辞書を用いて、文字列の最適化と曖昧検索を行う
方法は、文字認識以外にも、音声認識等にも適用可能で
あるし、さらには、曖昧検索をキーボード等、各種の方
法で入力した文字に対して用いることも可能である。
[Various Applications of Fuzzy Search] [11] Examples of Application to Various Inputs (Keyboard / Character / Speech) Up to now, the optimal character recognition result has been obtained using a character transition information table and a word dictionary. We have focused on the example of categorization and fuzzy search. However, this method of optimizing a character string and performing an ambiguous search using a character transition information table and a word dictionary can be applied to voice recognition and the like in addition to character recognition. Can be used for characters input by various methods such as a keyboard.

【0082】文字遷移情報テーブルと単語辞書を用いた
文字列最適化と住所の曖昧検索をキーボード・文字(文
字認識入力)・音声による入力に適用した場合の検索モ
ジュール関連図を図38に示す。文字入力は、図に示す
ように、キーボード・文字(文字認識入力)・音声な
ど、様々な手段で入力することができる(図の例では、
「大みか」と入力した)。
FIG. 38 shows a diagram related to a search module when character string optimization and an ambiguous address search using a character transition information table and a word dictionary are applied to keyboard, character (character recognition input), and voice input. As shown in the figure, the character can be input by various means such as a keyboard, a character (character recognition input), and voice (in the example of the figure,
"Omika").

【0083】文字や音声などは、文字認識や音声認識な
どの認識系により、文字コード化される。但し、認識系
を用いる場合、得られた文字コード(丈みか・大るカ)
は、あくまでも、正解の候補であり、確定はしていな
い。この不確定な候補文字をできるだけ正解らしくする
ために、文字遷移確率テーブルa4に記載されている文
字間の遷移確率の情報を用いて、文字列として尤もらし
くする(図の例で「大みか」に候補が訂正された)。そ
の後は、候補文字を最適化するために用いた文字遷移確
率テーブルに記載された、文字遷移を含む候補単語のデ
ータアドレスを参照し、文字遷移を含む単語を検索(直
接参照)する。そして、単語辞書a6から、住所の階層
情報を使って、ユーザが検索したい住所の候補を表示す
る(詳細は、前述したとおり)。
Characters and voices are converted into character codes by a recognition system such as character recognition or voice recognition. However, if a recognition system is used, the resulting character code (length or large)
Is a candidate for a correct answer, and has not been finalized. In order to make this uncertain candidate character as accurate as possible, the character transition probability information between the characters described in the character transition probability table a4 is used to make the candidate character likely to be a character string (in the example of FIG. The candidate has been corrected). After that, the data address of the candidate word including the character transition described in the character transition probability table used for optimizing the candidate character is referred to, and the word including the character transition is searched (directly referred). Then, from the word dictionary a6, using the hierarchical information of the address, the candidate of the address that the user wants to search is displayed (details are as described above).

【0084】もし、認識系を使わないキーボード等でキ
ー文字(「大みか」)が入力された場合(ユーザの入力
ミスがないとすれば)、入力された情報は、確定した情
報と見なせる。従って、例えば、文字や音声による入力
で、認識と候補文字最適化を終えた状態と考えられる。
そこで、認識と候補文字最適化を飛ばして、単語検索の
部分から、同様に行えばよい。
If a key character (“Omika”) is input using a keyboard or the like that does not use a recognition system (if there is no input error by the user), the input information can be regarded as determined information. Therefore, for example, it is considered that recognition and optimization of candidate characters have been completed by input using characters or voice.
Therefore, the recognition and the candidate character optimization may be skipped, and the same process may be performed from the word search.

【0085】[12]住所の曖昧検索を地図情報の検索
等に用いる例 さて、図39は、住所の曖昧検索を地図情報の検索に適
用した例を示す。この例では、例えば、「大みか」と音
声等で入力すると、「大みか町」付近の地図を表示する
ようになっており、カーナビゲーションの操作等に用い
ることができる。ここでのポイントは、単語辞書の情報
(地名単語とその階層情報)に、各地名単語が表す場所
の地図データへのポインタ(該当地図アドレス情報)を
付加したことにある。例えば、「大みか」と入力する
と、音声や文字など、コード化するのに認識系が必要な
場合は、認識して候補文字を得て、文字遷移確率テーブ
ルa4を参照し、候補の最適化をする(キーボードなら
ば、認識と候補の最適化は飛ばす。)。さらに、文字遷
移確率テーブルa4に記載されている、文字遷移と関連
する単語のアドレスを参照する。そこには、「大みか
町」という単語の他に「大みか町」付近の地図のアドレ
ス(MA11)が記載されている。そこで、地図データ
j2のアドレスMA11にアクセスし、「大みか町」付
近の地図を表示した。
[12] Example of Using Ambiguous Address Search for Map Information Search, etc. FIG. 39 shows an example in which the ambiguous address search is applied to map information search. In this example, for example, when "Omika" is input by voice or the like, a map near "Omika town" is displayed, and can be used for car navigation operations and the like. The point here is that a pointer to the map data of the place represented by each place name word (corresponding map address information) is added to the word dictionary information (place name word and its hierarchical information). For example, when "Omika" is input, if a recognition system is required to encode a voice or character, a candidate character is obtained by recognizing the character and referencing the character transition probability table a4 to optimize the candidate. (If it is a keyboard, skip recognition and candidate optimization.) Furthermore, the address of a word related to the character transition described in the character transition probability table a4 is referred to. In addition to the word “Omika-cho”, the address (MA11) of the map near “Omika-cho” is described therein. Therefore, the user accesses the address MA11 of the map data j2 and displays a map near “Omika-cho”.

【0086】さて、図39の例では、地名を表す単語辞
書に地図データのポインタを加えた例を示した。この例
のように、単語辞書に各種データへのポインタを張った
り、単語辞書に単語と一緒に各種データを記憶するとい
うアイディアは、他にも様々に応用ができる。例えば、
地名単語辞書に郵便番号を付加すれば、地名の一部を入
力して郵便番号を調べるシステムができる。また、地名
の回に人名を階層化したような単語辞書に電話番号を付
加すれば、住所と氏名の一部を曖昧に入力して電話番号
を調べるようなシステムもできる。また、単語辞書に、
その単語の意味情報(国語辞典の様なデータ)へのポイ
ンタを張れば、曖昧に入力して、正しい表記(単語)と
その意味を調べるような、国語辞典システムも作成可能
である。その他にも、図書館の書名・著者名・出版社な
どから、本を検索するシステム。医者が扱う薬を、薬の
記号や薬品名の一部から検索するシステム。住所・氏名
情報(単語辞書)と戸籍情報をリンクしておき、住所・
氏名の曖昧入力から、戸籍情報を探すシステム。インタ
ーネットのキーワードを曖昧な入力から検索するシステ
ムなど、あらゆる情報の検索に応用が可能である。
In the example of FIG. 39, an example is shown in which a map data pointer is added to a word dictionary representing a place name. The idea of setting pointers to various data in the word dictionary and storing various data together with words in the word dictionary as in this example can be applied in various other ways. For example,
If the postal code is added to the place name word dictionary, a system for inputting a part of the place name and examining the postal code can be performed. Also, if a telephone number is added to a word dictionary in which personal names are hierarchized at the time of a place name, a system in which a part of an address and a full name is ambiguously input and a telephone number is checked can be provided. Also, in the word dictionary,
By setting a pointer to the meaning information (data like a Japanese dictionary) of the word, it is possible to create a Japanese language dictionary system in which the input is vague and the correct notation (word) and its meaning are checked. In addition, a system that searches for books by library title, author, publisher, etc. A system that searches for medicines handled by doctors based on part of the medicine symbol or medicine name. Address / name information (word dictionary) is linked to family register information,
A system that searches for family register information from ambiguous input of names. It can be applied to search for all kinds of information, such as a system for searching for Internet keywords from ambiguous input.

【0087】[13]単語辞書を複数表記で記憶し曖昧
検索の曖昧さをさらに広げる 次に、図38と同様の検索システムで、単語辞書k1を
複数の表記(一般の表記・読み・英語・ドイツ語・ひら
がな・カタカナ・音節など)で持つ。文字遷移確率テー
ブルは、全ての表記について持ち、全ての表記から単語
辞書へポインタを張ることにより、検索キーがこれらの
どれでも良いようにして、さらに検索の曖昧度を広げる
方法について述べる。
[13] The word dictionary is stored in a plurality of notations to further expand the ambiguity of the fuzzy search. Next, the word dictionary k1 is stored in a plurality of notations (general notation, reading, English, German, Hiragana, Katakana, syllable, etc.) A character transition probability table is provided for every notation, and a method of extending a search ambiguity by setting a pointer from every notation to a word dictionary so that any of these search keys can be used.

【0088】図40は、住所の単語辞書を複数の表記
(一般の表記・よみ・英語表記)で持ち、漢字とかな文
字の混ぜ書きや、英語の入力にも対応できるようにした
例である。ここでは、表記(漢字など)と表記に対応す
る読みを、表記1文字毎に対応させて記憶してある。表
記・よみ・英語のいずれからも、文字遷移情報を抽出
し、単語辞書へのポインタが張ってある。そこで、図の
例のように、漢字とかなの混ぜ書き(「いし名坂」)で
入力されても、単語を特定し、例えば、正しい表記に直
して表示することが可能である。
FIG. 40 shows an example in which an address word dictionary is provided in a plurality of notations (general notation, reading, and English notation) so that mixed writing of kanji and kana characters and English input can be supported. . Here, the notation (such as kanji) and the reading corresponding to the notation are stored in correspondence with each notation. Character transition information is extracted from any of notation, reading, and English, and a pointer to a word dictionary is attached. Therefore, as shown in the example in the figure, even if the characters are input in a mixture of kanji and kana (“Ishinazaka”), it is possible to specify the word and display it in, for example, a correct notation.

【0089】図40の例では、検索結果を一般的な表記
で表示したが、単語辞書k1を複数表記で持っていれ
ば、結果を図41のように、複数表記で表示したり、図
42のように、入力された表記(言語)で表示してもよ
い。
In the example of FIG. 40, the search result is displayed in a general notation. If the word dictionary k1 has a plurality of notations, the result is displayed in a plurality of notations as shown in FIG. May be displayed in the input notation (language).

【0090】[14]一般の表記テーブルを用いて異表
記からの検索を可能にする 図38のような表記のみを単語辞書に用いて、異なる表
記でも図40のような曖昧検索を使えるようにする他の
方法としては、例えば、かな文字やかなと漢字の混ぜ書
きで入力された文字列を漢字変換してから、図38のよ
うな表記のみを単語辞書に用いる方法。英語など、異国
の表記の時には、翻訳してから、図38のような表記の
みを単語辞書に用いる方法などもある。
[14] Using a General Notation Table to Enable Searching from Different Notations Using only the notation as shown in FIG. 38 for the word dictionary, the vague search as shown in FIG. 40 can be used for different notations. As another method, for example, a character string input by mixed writing of kana characters and kana and kanji is converted into kanji, and then only the notation as shown in FIG. 38 is used for the word dictionary. When writing in a foreign language such as English, there is a method of translating and then using only the notation as shown in FIG. 38 for the word dictionary.

【0091】[15]1重マルコフ・2重マルコフ・・
・N重マルコフを使い分ける 一般に、漢字は文字種が多く(約3000文字以上)、
ある漢字の文字遷移(2文字の組み合わせ)を含む単語
は、数が限られる(住所の場合、平均約7単語/文字遷
移)。しかし、ひらがな・カタカナ・英語などでは文字
種が少なく、その文字遷移(2文字の組み合わせ)を含
む単語は、住所の例でも、平均約40単語/文字遷移
と、漢字の場合に比べて、非常に大きくなる。このよう
な場合には、2文字の組み合わせ(遷移)(1重マルコ
フ)では、その文字を含む単語を絞れないし、文字遷移
確率テーブルに記さなければならない候補単語データア
ドレスの量も大きくなる。そこで、ひらがな・カタカナ
・英語などでは、3文字の組み合わせ(遷移)(2重マ
ルコフ)や、もっと多い文字の組み合わせを文字遷移確
率テーブルに用いればよい。
[15] Single Markov / Double Markov ...
・ Use N-fold Markovs In general, Kanji has many character types (about 3000 characters or more),
The number of words including a character transition (a combination of two characters) of a certain kanji is limited (in the case of an address, an average of about 7 words / character transition). However, there are few character types in Hiragana, Katakana, English, etc., and the word including the character transition (combination of two characters) is about 40 words / character transition on average even in the example of an address, which is very much compared to the case of Kanji. growing. In such a case, in a combination (transition) of two characters (single Markov), the word including the character cannot be narrowed down, and the amount of candidate word data addresses that must be written in the character transition probability table also increases. Therefore, in Hiragana, Katakana, English, etc., a combination (transition) of three characters (double Markov) or a combination of more characters may be used in the character transition probability table.

【0092】その際には、漢字のように文字種が多い文
字まで、3文字の組み合わせ(2重マルコフ)などを用
いると、文字の組み合わせが単純には3,000文字の
3乗とテーブルが膨大になる。そこで、図42のよう
に、例えば、漢字は2文字の組み合わせ(1重マルコ
フ)の情報で文字遷移確率テーブルe1に持ち、ひらが
な・カタカナ・英字などは、3文字の組み合わせ(2重
マルコフ)でテーブルに持つなど、文字種に応じて、使
い分ければよい。
At this time, if a combination of three characters (double Markov) or the like is used for characters having many character types such as kanji, the character combination is simply 3,000 characters to the third power and the table is huge. become. Therefore, as shown in FIG. 42, for example, a kanji is stored in the character transition probability table e1 with information of a combination of two characters (single Markov), and a combination of three characters (double Markov) is used for hiragana, katakana, and alphabetical characters. It can be used properly depending on the character type, such as having it in a table.

【0093】[16]誤り表記からでも検索する方法 文字の中には、同じ読みの異表記((の/ノ/之/乃)
(が/ヶ/ケ)(街/町)(太田/大田)など)があ
る。例えば、同じ「みどりがおか」でも、「宮城県 山
形市 緑が丘」/「山形県 酒田市 緑ケ丘」など、地
名により使っている文字が異なっており、混乱を招きや
すい。このような文字を正確に入力しなければ、所望の
文字列を検索できないのでは、使い勝手が悪い。
[16] Method of Retrieving Even from Error Notation In characters, different notations with the same pronunciation ((no / no / no / no)
(Ga / ga / ke) (town / town) (Ota / Ota) etc.). For example, even in the same “Midorioka”, the characters used differ depending on the place name, such as “Midorigaoka, Yamagata City, Miyagi Prefecture” / “Midorigaoka, Sakata City, Yamagata Prefecture”, which is likely to cause confusion. Unless such characters are correctly input, a desired character string cannot be searched, which is inconvenient.

【0094】図43に、このような問題を解決する1つ
の方法を示す。このような誤りを起こしやすい文字を予
め調べておき、誤りやすい語テーブルm1に、誤りやす
い文字組を記しておく。そして、ユーザが入力した検索
キー文字の中に、誤りやすい語が含まれていたならば
(図の例で、「三ノ丸」の「ノ」)、誤りやすい語テー
ブルm1を参照し、誤った可能性のある文字(「の/之
/乃」)を、候補文字に追加する。それから、遷移確率
を用いた候補文字の最適化や遷移情報を使った曖昧検索
を行えば、所望の文字列を検索結果として得ることがで
きる。このような場合、検索結果の表示は、正しい表記
に直して表記すると親切である。
FIG. 43 shows one method for solving such a problem. Such an error-prone character is checked in advance, and an error-prone character set is recorded in the error-prone word table m1. If the search key character input by the user includes a word that is likely to be erroneous (“No” of “Sannomaru” in the example in the figure), the user may refer to the word table m1 that is susceptible to error, and Characters with a gender ("// no / no") are added to the candidate characters. Then, if a candidate character is optimized using the transition probability or an ambiguous search is performed using the transition information, a desired character string can be obtained as a search result. In such a case, the display of the search result is kind to the correct notation.

【0095】誤り表記からでも検索する他の方法として
は、例えば、図40のような複数表記のテーブルを用い
る方法もある。例えば、図43と同じ例で、「三の丸」
が正しいのに、「三ノ丸」と入力したとする。すると、
これを、かな漢字変換の辞書を参照し、読み「さんのま
る」に直す。そして、読みから複数表記で読み情報を持
つ単語辞書を検索すれば、入力した文字「三ノ丸」とは
異なるが、同じ読みで正しい表記の「三の丸」を検索す
ることができる。
As another method of retrieving from an error notation, for example, there is a method using a table of a plurality of notations as shown in FIG. For example, in the same example as FIG.
Is correct, but you enter "Sannomaru". Then
Refer to the Kana-Kanji conversion dictionary, and read it and convert it to "Sannomaru". Then, if the word dictionary having the reading information in a plurality of notations is searched from the reading, it is possible to search for the correct notation “Sannomaru” with the same reading, which is different from the input character “Sannomaru”.

【0096】図40のような複数表記のテーブルを用い
ず、一般の表記のみの単語辞書で、同様の誤り表記の検
索をするには、かな漢字変換の辞書を用いて、誤り表記
(「三ノ丸」)を読み(「さんのまる」)に直し、さら
に、読みから、かな漢字変換して、正しい「三の丸」を
得て、検索する方法もある。
In order to search for a similar error notation in a word dictionary of general notations without using a table of a plurality of notations as in FIG. 40, an error notation ("Sannomaru") is obtained by using a kana-kanji conversion dictionary. ) Is converted to Yomi ("Sannomaru"), and from the Yomi conversion, Kana-Kanji conversion is performed to obtain the correct "Minomaru" for searching.

【0097】[16]文字遷移情報テーブルを用いた文
字検索 これまで述べてきたような文字列の曖昧検索を行う場合
でも、入力手段がキーボードであったり、あるいは、文
字や音声の入力でも、認識系に既に単語処理などが含ま
れていて、文字間の遷移確率を使った候補文字列の最適
化が不要な場合もある。その場合には、遷移確率の細か
い値を使用しないので、図44のような、ありえる文字
遷移とその文字遷移を含む単語のデータアドレスのみを
記した文字遷移情報テーブルを用いてもよい。この場合
でも、検索の部分は、これまで述べた方法と同様に行え
る。
[16] Character Retrieval Using Character Transition Information Table Even in the case of performing an ambiguous character string search as described above, even if the input means is a keyboard or a character or voice is input, recognition is performed. In some cases, word processing or the like is already included in the system, and it is not necessary to optimize candidate character strings using the transition probability between characters. In this case, since a fine value of the transition probability is not used, a character transition information table in which only possible character transitions and data addresses of words including the character transitions are written as shown in FIG. 44 may be used. In this case, the search can be performed in the same manner as the method described above.

【0098】[17]キーボードによる曖昧入力検索 図45に、キーボードによる曖昧入力検索システム(キ
ー入力のミスがあっても、検索できるシステム)の概要
を示す。このシステムの特徴は、キーボードなどによる
入力ミスがあっても、ミスしやすいキーの文字を候補文
字に追加して、遷移確率による候補の最適化や、曖昧検
索を行うことにより、ミスを救済し、所望の検索結果を
得るものである。
[17] Ambiguous Input Search Using Keyboard FIG. 45 shows an outline of an ambiguous input search system using a keyboard (a system that can search even if there is a key input error). The feature of this system is that even if there is an input error with a keyboard, etc., the key characters that are easy to make mistakes are added to the candidate characters, the candidates are optimized by the transition probability, and the fuzzy search is performed, thereby relieving the mistakes. , To obtain desired search results.

【0099】図の例では、ユーザは、「isi」と入力
するつもりが、「idi」と、隣のキーをミスタイプし
た。しかし、キーボードのキー配列情報より、入力文字
「i」「d」の回りのキーを調べ、ミスタイプした可能性
のある候補として候補文字に追加する。そうすれば、そ
の後の遷移確率による候補の最適化や、曖昧検索を行う
ことにより、ミスを救済し、所望の検索結果を得られ
る。
In the example shown, the user intends to enter "is", but miss-types the key next to "idi". However, the keys around the input characters "i" and "d" are checked from the key arrangement information of the keyboard, and are added to the candidate characters as candidates that may have been mistyped. Then, by optimizing the candidate based on the subsequent transition probability or performing an ambiguous search, a mistake can be relieved and a desired search result can be obtained.

【0100】[18]繰り返し使われる情報の曖昧検索 さて、これまで述べた例では、検索する対象が住所のみ
であったり、氏名のみの例で述べてきた。複数の項目を
持つ情報(例:名簿情報など)でも、各情報(例:名前
・所属・住所など)より文字遷移を抽出し、同様の遷移
確率テーブルを作成すれば、曖昧検索が実施できる。
[18] Ambiguous Search for Information Used Repeatably In the examples described so far, an example has been described in which the search target is only an address or only a name. Even for information having a plurality of items (for example, name list information), if character transitions are extracted from each information (for example, name, affiliation, address, etc.) and a similar transition probability table is created, fuzzy search can be performed.

【0101】さて、複数の項目を持つ情報(例:名簿情
報など)では、同じ単語が繰り返し使われることがよく
ある。例えば、名簿情報の例を考えると、同じ所属に複
数の人が存在したり、1つの電話番号を複数の人で共用
したりするため、複数人の名簿の所属や電話の欄に、同
じ文字が繰り返し登場するのである。
In information having a plurality of items (for example, list information), the same word is frequently used. For example, considering the example of roster information, since multiple people exist in the same affiliation or one phone number is shared by multiple people, the same characters are displayed in the affiliation of multiple people and the telephone column. Appears repeatedly.

【0102】図46は、文字遷移や単語をコード化し、
名簿データをコード情報として持った例である。この例
では、文字遷移情報と、その文字遷移を含む単語の情報
(アドレス)を関連づけて記憶してある。また、単語
は、文字遷移の並びとしてコード化されて記憶してあ
り、さらに、単語を含む名簿データの情報(アドレス)
を関連づけて記憶してある。名簿情報は、前記、コード
化された単語情報の並びとして記憶してある。このよう
に、単語を文字遷移ベースに記憶しコード化すると、こ
れまで述べてきたような曖昧検索ができるとともに、名
簿のような同じ単語が繰り返し出てくるデータを圧縮し
て持つことができる。
FIG. 46 shows a code for character transitions and words.
This is an example in which list data is provided as code information. In this example, character transition information and information (address) of a word including the character transition are stored in association with each other. The word is coded and stored as a sequence of character transitions, and furthermore, information (address) of name list data including the word.
Are stored in association with each other. The list information is stored as a sequence of the coded word information. When words are stored and coded in the character transition base in this way, the fuzzy search described above can be performed, and data in which the same word repeatedly appears, such as a list, can be compressed and held.

【0103】図47は、図46の名簿データの内容を、
単語遷移情報で表した例を示す。文字遷移情報と、その
文字遷移を含む単語の情報(アドレス)を関連づけて記
憶してある。また、単語は、文字遷移の並びとしてコー
ド化されて記憶してあり、さらに、名簿情報での単語の
並び方と同じ形になるように、各単語の次に並ぶ単語の
情報(アドレス)(単語間の遷移情報)を関連づけて記
憶してある。文字遷移情報がベースになっているので、
これまで述べてきたような曖昧検索ができるとともに、
単語間の遷移情報を用いることにより、単語を含むデー
タが不要になる。
FIG. 47 shows the contents of the list data of FIG.
An example represented by word transition information is shown. Character transition information is stored in association with word information (address) containing the character transition. The words are coded and stored as a sequence of character transitions, and furthermore, information (addresses) (words) (words) of words arranged next to each word so as to have the same form as the word arrangement in the list information. Transition information between them) are stored in association with each other. Since character transition information is based,
In addition to performing the fuzzy search described above,
By using transition information between words, data including words becomes unnecessary.

【0104】以上のような方法により、名簿のような多
項目の情報も、曖昧検索の機能を保ったまま、容量を圧
縮することが可能となる。
According to the above-described method, it is possible to reduce the capacity of multi-item information such as a list while maintaining the function of fuzzy search.

【0105】[0105]

【発明の効果】本発明によれば、検索したい文字列の先
頭や末尾の文字に限らずに、うろ覚えの情報をキー入力
として、目的の文字列を検索できるため、操作性が大き
く向上する。また、他の効果としては、キーとなる文字
を手書き入力するのみで、残りの文字列を推測し認識結
果として文字列全体が出力されるので、操作性が大幅に
向上できる。
According to the present invention, a target character string can be searched by using not only the head and end characters of the character string to be searched but also the information of spelling as a key input, thereby greatly improving the operability. Further, as another effect, the operability can be greatly improved because the remaining character string is guessed and the entire character string is output as a recognition result only by inputting the key character by handwriting.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例である手書き入力住所認識装
置の機能ブロック図である。
FIG. 1 is a functional block diagram of a handwritten input address recognition device according to an embodiment of the present invention.

【図2】本発明の一実施例である手書き入力住所認識装
置の動作概要図である。
FIG. 2 is an operation schematic diagram of a handwritten input address recognition device according to an embodiment of the present invention.

【図3】従来の文字認識装置の構成図である。FIG. 3 is a configuration diagram of a conventional character recognition device.

【図4】従来の文字認識装置を用いて住所入力する場合
の動作概要図である。
FIG. 4 is an operation schematic diagram when an address is input using a conventional character recognition device.

【図5】本発明の一実施例である手書き入力住所認識装
置のハード構成図である。
FIG. 5 is a hardware configuration diagram of a handwritten input address recognition device according to an embodiment of the present invention.

【図6】文字遷移確率テーブルの作成方法を説明するフ
ロー図である。
FIG. 6 is a flowchart illustrating a method of creating a character transition probability table.

【図7】単語辞書の概要図である。FIG. 7 is a schematic diagram of a word dictionary.

【図8】文字出現回数テーブルの概要図である。FIG. 8 is a schematic diagram of a character appearance frequency table.

【図9】文字遷移回数テーブルの概要図である。FIG. 9 is a schematic diagram of a character transition number table.

【図10】文字出現確率テーブルの概要図である。FIG. 10 is a schematic diagram of a character appearance probability table.

【図11】文字遷移確率テーブルの概要図である。FIG. 11 is a schematic diagram of a character transition probability table.

【図12】遷移確率テーブルを用いて行う文字認識後処
理方法の概要図である。
FIG. 12 is a schematic diagram of a character recognition post-processing method performed using a transition probability table.

【図13】後処理結果より文字列を推測する概要図であ
る。
FIG. 13 is a schematic diagram for estimating a character string from a post-processing result.

【図14】後処理結果より文字列を推測する概要図であ
る。
FIG. 14 is a schematic diagram for estimating a character string from a post-processing result.

【図15】後処理結果より文字列を推測する概要図であ
る。
FIG. 15 is a schematic diagram for estimating a character string from a post-processing result.

【図16】後処理結果より文字列を推測する概要図であ
る。
FIG. 16 is a schematic diagram for estimating a character string from a post-processing result.

【図17】推測した文字列の表示形態を示す図である。FIG. 17 is a diagram illustrating a display form of an estimated character string.

【図18】推測した文字列の表示形態を示す図である。FIG. 18 is a diagram illustrating a display form of an estimated character string.

【図19】推測した文字列の表示形態を示す図である。FIG. 19 is a diagram illustrating a display form of an estimated character string.

【図20】推測した文字列の表示形態を示す図である。FIG. 20 is a diagram showing a display form of an estimated character string.

【図21】後処理結果より文字列を推測する概要図であ
る。
FIG. 21 is a schematic diagram for estimating a character string from a post-processing result.

【図22】後処理結果より文字列を推測する概要図であ
る。
FIG. 22 is a schematic diagram for estimating a character string from a post-processing result.

【図23】曖昧検索結果の優先順位決定方法の概要図で
ある。
FIG. 23 is a schematic diagram of a method for determining a priority order of fuzzy search results.

【図24】曖昧検索結果の優先順位決定方法の概要図で
ある。
FIG. 24 is a schematic diagram of a method for determining a priority order of ambiguous search results.

【図25】曖昧検索結果の優先順位決定方法の概要図で
ある。
FIG. 25 is a schematic diagram of a method for determining a priority order of fuzzy search results.

【図26】曖昧検索結果の優先順位決定方法の概要図で
ある。
FIG. 26 is a schematic diagram of a method for determining a priority order of fuzzy search results.

【図27】曖昧検索結果の優先順位決定方法の概要図で
ある。
FIG. 27 is a schematic diagram of a method for determining a priority order of fuzzy search results.

【図28】検索結果表示条件設定パネルの概要図であ
る。
FIG. 28 is a schematic diagram of a search result display condition setting panel.

【図29】検索結果優先条件設定パネルの概要図であ
る。
FIG. 29 is a schematic diagram of a search result priority condition setting panel.

【図30】文字遷移をベースにした1文字検索の概要図
である。
FIG. 30 is a schematic diagram of one-character search based on character transition.

【図31】文字遷移をベースにした1文字検索の概要図
である。
FIG. 31 is a schematic diagram of one-character search based on character transition.

【図32】単語辞書と遷移&出現回数テーブルの学習装
置の概要図である。
FIG. 32 is a schematic diagram of a learning device for a word dictionary and a transition & appearance count table.

【図33】学習機能付き単語辞書と学習機能付き遷移&
出現回数テーブルの概要図である。
FIG. 33: Word dictionary with learning function and transition & with learning function
It is an outline figure of an appearance number table.

【図34】学習機能付き単語辞書と学習機能付き遷移&
出現回数テーブルの概要図である。
FIG. 34: Word dictionary with learning function and transition & with learning function
It is an outline figure of an appearance number table.

【図35】学習機能付き単語辞書と学習機能付き遷移&
出現回数テーブルの概要図である。
FIG. 35: Word dictionary with learning function and transition & with learning function
It is an outline figure of an appearance number table.

【図36】学習機能付き情報の曖昧検索装置の概要図で
ある。
FIG. 36 is a schematic diagram of a fuzzy search device for information with a learning function.

【図37】学習機能付きユーザ辞書を持った情報の曖昧
検索装置の概要図である。
FIG. 37 is a schematic diagram of an information fuzzy search device having a user dictionary with a learning function.

【図38】キーボード・手書き文字・音声による文字情
報の曖昧検索の概要図である。
FIG. 38 is a schematic diagram of an ambiguous search for character information using a keyboard, handwritten characters, and voice.

【図39】曖昧地図検索装置の概要図である。FIG. 39 is a schematic diagram of an ambiguous map search device.

【図40】複数表記の単語辞書を用い、混ぜ書きに対応
した曖昧検索の概要図である。
FIG. 40 is a schematic diagram of an ambiguous search corresponding to mixed writing using a word dictionary of a plurality of notations.

【図41】複数表記の単語辞書を用い、複数表記で検索
結果を表示する曖昧検索の概要図である。
FIG. 41 is a schematic diagram of an ambiguous search that displays a search result in a plurality of notations using a word dictionary in a plurality of notations.

【図42】複数表記の単語辞書を用い、入力された表記
に合わせて検索結果を表示する曖昧検索の概要図であ
る。
FIG. 42 is a schematic diagram of a fuzzy search in which a search result is displayed in accordance with an input notation using a word dictionary having a plurality of notations.

【図43】誤りやすい誤テーブルを用い、複数表記で検
索結果を表示する曖昧検索の概要図である。
FIG. 43 is a schematic diagram of an ambiguous search that displays search results in a plurality of notations using an error-prone table.

【図44】文字遷移情報テーブルを用いた曖昧検索の概
要図である。
FIG. 44 is a schematic diagram of an ambiguous search using a character transition information table.

【図45】文字遷移確率テーブルを用い、キー入力のミ
スも救済する曖昧検索の概要図である。
FIG. 45 is a schematic diagram of an ambiguous search that uses a character transition probability table to rescue a mistake in key input.

【図46】文字遷移をベースにした単語情報により情報
の圧縮も行える曖昧検索装置の概要図である。
FIG. 46 is a schematic diagram of an ambiguous search device that can also compress information using word information based on character transitions.

【図47】文字遷移をベースにした単語情報と単語間の
遷移確率により情報の圧縮も行える曖昧検索装置の概要
図である。
FIG. 47 is a schematic diagram of an ambiguous search device that can also compress information based on word information based on character transitions and transition probabilities between words.

【図48】本発明における優先順位決定の説明図であ
る。
FIG. 48 is an explanatory diagram of priority order determination in the present invention.

【符号の説明】[Explanation of symbols]

a1…タブレット、a2…認識辞書、a3…文字認識
部、a4…文字遷移確率テーブル、a5…候補文字最適
化と単語のポインタ決定部、a6…単語辞書、a7…単
語照合と文字列推測部、d1…学習用単語の読み出し
部、d2…文字出現回数のカウント部、d3…出現回数
テーブル、d4…文字遷移回数のカウント部、d5…文
字遷移を含む候補単語記憶部、d6…遷移回数テーブ
ル、d7…文字出現確率テーブル作成部、d8…標準出
現確率テーブル、d9…文字遷移確率テーブル作成部、
h1…単語入力部、h2…単語辞書登録部、h3…学習
機能付き単語辞書、h4…遷移&出現回数学習&単語ア
ドレス対応付け部、h5…学習機能付きユーザ遷移&出
現回数テーブル。
a1 tablet, a2 recognition dictionary, a3 character recognition unit, a4 character transition probability table, a5 candidate character optimization and word pointer determination unit, a6 word dictionary, a7 word collation and character string estimation unit, d1 a learning word readout unit, d2 a character appearance count unit, d3 an appearance count table, d4 a character transition count unit, d5 a candidate word storage unit including character transitions, d6 a transition count table, d7: character appearance probability table creation unit; d8: standard appearance probability table; d9: character transition probability table creation unit;
h1: word input unit, h2: word dictionary registration unit, h3: word dictionary with learning function, h4: transition & appearance number learning & word address associating unit, h5: user transition & appearance number table with learning function.

Claims (17)

【特許請求の範囲】[Claims] 【請求項1】入力された文字列を含む文字群を検索する
情報検索装置において、 予め複数の文字列群を、それぞれ固有のアドレスに記憶
する辞書と、 少なくとも、ある文字から他の文字への遷移情報と、前
記複数の文字列群のうち前記遷移関係にある文字の組み
合わせを含む文字列群のアドレスとをそれぞれ対応付け
て記憶した文字遷移情報テーブルを有し、 前記入力された文字列に対応する文字列群を前記文字遷
移情報テーブルに記載したアドレスにより前記辞書をア
クセスし、当該アドレスに対応する前記辞書中の文字列
群を検索結果として表示することを特徴とする情報検索
装置。
An information retrieval apparatus for retrieving a character group including an input character string, comprising: a dictionary for storing a plurality of character string groups in advance at respective unique addresses; A character transition information table in which transition information and an address of a character string group including a combination of characters in the transition relation among the plurality of character string groups are stored in association with each other; An information search device, wherein the dictionary is accessed by an address in which a corresponding character string group is described in the character transition information table, and a character string group in the dictionary corresponding to the address is displayed as a search result.
【請求項2】請求項1において、予め複数の文字列群
を、それぞれ固有のアドレスに記憶する辞書は、複数の
文字群を少なくとも1種類以上の表記方法(表記,ひら
がな,カタカナ,英字,英語,ギリシャ語,音節,異表
記などのうち少なくとも1種類以上)で記憶することを
特徴とする情報検索装置。
2. A dictionary according to claim 1, wherein said plurality of character string groups are stored in advance at respective unique addresses, and said plurality of character groups are stored in at least one or more kinds of notation methods (notation, hiragana, katakana, English characters, , Greek, syllable, different notation, etc.).
【請求項3】請求項1において、言語の翻訳部を具備
し、前記文字列が異なる言語で入力されたならば、前記
翻訳部により、前記辞書に記憶されている言語に翻訳し
て情報検索を行うことを特徴とする情報検索装置。
3. The information retrieval system according to claim 1, further comprising a language translation unit, wherein when the character string is input in a different language, the translation unit translates the character string into a language stored in the dictionary. An information retrieval device characterized by performing:
【請求項4】請求項1において、かな漢字変換部を具備
し、前記辞書に記憶されている記述と異なる記述で入力
されたならば、かな漢字変換部により、前記辞書に記憶
されている記述に直して情報検索を行うことを特徴とす
る情報検索装置。
4. The kana-kanji conversion unit according to claim 1, further comprising a kana-kanji conversion unit, wherein if a description different from the description stored in the dictionary is input, the kana-kanji conversion unit converts the description into the description stored in the dictionary. An information search device characterized in that an information search is performed by using an information search.
【請求項5】請求項2において、入力された文字列と同
じ表記で検索結果を表示することを特徴とする情報検索
装置。
5. An information retrieval apparatus according to claim 2, wherein the retrieval result is displayed in the same notation as the input character string.
【請求項6】請求項1において、 ある文字から他の文字への遷移情報は、辞書に記憶して
ある文字列群の種類により何重の遷移情報を用いるかを
可変にすることを特徴とする情報検索装置。
6. The method according to claim 1, wherein the transition information from one character to another character is variable in the number of transition information to be used depending on the type of a character string group stored in the dictionary. Information retrieval device.
【請求項7】請求項2において、かな漢字変換部を具備
し、 入力された文字列のよみをかな漢字変換部より求め、 入力された文字列とよみが一致する文字列を検索結果と
して求めることを特徴とする情報検索装置。
7. The method according to claim 2, further comprising a kana-kanji conversion unit, wherein the reading of the input character string is obtained by the kana-kanji conversion unit, and a character string whose reading matches the input character string is obtained as a search result. Information retrieval device.
【請求項8】請求項1において、 予め入力文字列で誤りやすい表記の組を記録したテーブ
ルを設け、 入力文字列中に前記テーブルの誤りやすい表記があった
ならば、テーブルに記憶してある誤りやすい表記の組を
入力文字に追加し、得られた候補文字列を含む文字列を
検索することを特徴とする情報検索装置。
8. A table according to claim 1, further comprising: a table in which a set of notations that are susceptible to errors in the input character string is provided in advance. An information search apparatus characterized by adding a set of notation that is easy to be mistaken to input characters and searching for a character string including the obtained candidate character string.
【請求項9】入力された文字列を含む文字群を検索する
情報検索装置において、 予め複数の情報を、それぞれ固有のアドレスに記憶する
情報辞書と、 予め複数の文字列群と、その文字列群に関連する前記情
報のアドレスを、それぞれ固有のアドレスに記憶する辞
書と、 少なくとも、ある文字から他の文字への遷移情報と、前
記複数の文字列群のうち前記遷移関係にある文字の組み
合わせを含む文字列群のアドレスとをそれぞれ対応付け
て記憶した文字遷移情報テーブルを有し、 前記入力された文字列に対応する文字列群を前記文字遷
移情報テーブルに記載したアドレスにより前記辞書をア
クセスし、 当該アドレスに記載した前記文字列に関連した情報のア
ドレスにより、前記文字列に関連する情報をアクセス
し、 前記情報を表示することを特徴とする情報検索装置。
9. An information retrieval apparatus for retrieving a character group including an input character string, comprising: an information dictionary for storing a plurality of pieces of information in advance at respective unique addresses; a plurality of character string groups; A dictionary that stores addresses of the information related to groups at respective unique addresses; at least a transition information from one character to another character; and a combination of the characters in the transition relationship among the plurality of character string groups And a character transition information table storing the character string information corresponding to the input character strings, and accessing the dictionary by the addresses described in the character transition information table. And accessing the information related to the character string by using the address of the information related to the character string described in the address, and displaying the information. Information retrieval apparatus according to claim.
【請求項10】請求項1において、 入力した文字の一部を含む文字列群が複数存在したとき
には、 文字列群のうち入力した文字と一致する文字の数,文字
列群の文字遷移のうち入力した文字の文字遷移と一致す
る文字遷移の数,文字列群の文字列中で入力した文字を
含む位置,文字列群の使用頻度,文字列群の優先度,文
字列群の階層,文字列群の50音順,文字列群の文字コ
ード順,文字列群に関係する情報との関連の強い順及び
検索システムを使用しているユーザの条件(住所,電話
番号など)のうち、少なくとも1つ以上の条件に基づい
て優先順位を決定する手段を設けたことを特徴とする情
報検索装置。
10. A method according to claim 1, wherein when there are a plurality of character strings including a part of the input characters, the number of characters matching the input characters in the character strings, The number of character transitions that match the character transition of the entered character, the position of the character string that contains the entered character, the frequency of use of the character group, the priority of the character group, the hierarchy of the character string, and the character At least of the alphabetical order of the column group, the character code order of the character string group, the order of strong relation with the information related to the character string group, and the conditions (address, telephone number, etc.) of the user using the search system. An information retrieval apparatus, comprising: means for determining a priority order based on one or more conditions.
【請求項11】請求項10において、ユーザが優先条件
を指定できることを特徴とする情報検索装置。
11. An information retrieval apparatus according to claim 10, wherein a user can designate a priority condition.
【請求項12】請求項11又は12において、優先度の
高い検索結果を絞って表示することを特徴とする情報検
索装置。
12. An information retrieval apparatus according to claim 11, wherein the retrieval results having a high priority are narrowed down and displayed.
【請求項13】請求項1において、検索結果の件数を表
示することを特徴とする情報検索装置。
13. The information search device according to claim 1, wherein the number of search results is displayed.
【請求項14】請求項1において用いる少なくとも、あ
る文字から他の文字へ遷移する確率と、前記複数の文字
列群のうち前記遷移関係にある文字の組み合わせを含む
文字列群のアドレスとをそれぞれ対応付けて記憶した文
字遷移確率テーブルは、 遷移確率情報を遷移元の出現回数と遷移回数に分けて記
憶しておき、 辞書に単語が追加されると、前記単語が含む文字遷移の
前記出現回数と遷移回数、および、文字遷移を含む単語
のアドレスを更新して学習することを特徴とする情報検
索装置。
14. The method according to claim 1, wherein at least a probability of transition from one character to another character and an address of a character string group including a combination of the characters in the transition relation among the plurality of character string groups are respectively set. The character transition probability table stored in association with the transition probability information stores the transition probability information separately for the number of appearances of the transition source and the number of transitions. An information search device characterized by learning by updating the number of transitions, the number of transitions, and the address of a word including character transitions.
【請求項15】請求項1において用いる少なくとも、あ
る文字から他の文字へ遷移する確率と、前記複数の文字
列群のうち前記遷移関係にある文字の組み合わせを含む
文字列群のアドレスとをそれぞれ対応付けて記憶した文
字遷移情報テーブルは、 辞書に単語が追加されると、前記単語が含む文字遷移、
および、文字遷移を含む単語のアドレスを更新して学習
することを特徴とする文字遷移情報学習装置。
15. The method according to claim 1, wherein at least a probability of transition from one character to another character and an address of a character string group including a combination of the characters in the transition relation among the plurality of character string groups are respectively defined. When a word is added to the dictionary, the character transition information table stored in association with the
A character transition information learning apparatus characterized in that an address of a word including a character transition is updated and learned.
【請求項16】請求項1において、 文字列が1文字(w)の場合には、ある文字から他の文
字への遷移情報を、文字wから、文字Nullへの遷移情報
と見なして、 1文字でも文字列の最適化、および、検索を可能とする
ことを特徴とする情報検索装置。
16. A method according to claim 1, wherein when the character string is one character (w), transition information from one character to another character is regarded as transition information from the character w to the character Null. An information search apparatus characterized in that a character string can be optimized and searched even for characters.
【請求項17】入力された文字列を含む文字群を検索す
る情報検索装置において、 予め複数の文字列群を、それぞれ固有のアドレスに記憶
する辞書と、 少なくとも、ある文字から他の文字への遷移確率と、前
記複数の文字列群のうち前記遷移関係にある文字の組み
合わせを含む文字列群のアドレスとをそれぞれ対応付け
て記憶した文字遷移確率テーブルと、 キーボードのキー配列の情報を有し、 前記文字列を入力するためにタイプしたキーとそのキー
に近い位置のキーを候補にし、 前記候補キーを前記文字遷移確率テーブルを用いて最適
化する手段とを有し、 前記最適化された候補文字列に対応する文字列群のアド
レスにより前記辞書をアクセスし、当該アドレスに対応
する前記辞書中の文字列群を認識結果として表示するこ
とを特徴とする情報検索装置。
17. An information retrieval apparatus for retrieving a character group including an input character string, comprising: a dictionary for storing a plurality of character string groups in advance at respective unique addresses; A character transition probability table in which a transition probability and an address of a character string group including the combination of characters having the transition relation among the plurality of character string groups are stored in association with each other; Means for selecting a key typed for inputting the character string and a key close to the key as candidates, and optimizing the candidate key using the character transition probability table. The dictionary is accessed by an address of a character string group corresponding to a candidate character string, and a character string group in the dictionary corresponding to the address is displayed as a recognition result. That the information retrieval apparatus.
JP17621596A 1996-07-05 1996-07-05 Information retrieval device Expired - Lifetime JP3419205B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17621596A JP3419205B2 (en) 1996-07-05 1996-07-05 Information retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17621596A JP3419205B2 (en) 1996-07-05 1996-07-05 Information retrieval device

Publications (2)

Publication Number Publication Date
JPH1021262A true JPH1021262A (en) 1998-01-23
JP3419205B2 JP3419205B2 (en) 2003-06-23

Family

ID=16009641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17621596A Expired - Lifetime JP3419205B2 (en) 1996-07-05 1996-07-05 Information retrieval device

Country Status (1)

Country Link
JP (1) JP3419205B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7333817B2 (en) 2002-05-21 2008-02-19 Nec Corporation Data terminal having a telephone function
JP2009008505A (en) * 2007-06-27 2009-01-15 Aisin Aw Co Ltd Navigation system and program for navigation
CN101517363A (en) * 2006-08-18 2009-08-26 谷歌公司 Providing routing information based on ambiguous locations
WO2016074212A1 (en) * 2014-11-14 2016-05-19 Volkswagen China Investment Co., Ltd. Control method and control apparatus for navigation system

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7333817B2 (en) 2002-05-21 2008-02-19 Nec Corporation Data terminal having a telephone function
CN101517363A (en) * 2006-08-18 2009-08-26 谷歌公司 Providing routing information based on ambiguous locations
JP2010503051A (en) * 2006-08-18 2010-01-28 グーグル インク. Providing routing information based on ambiguous locations
JP4778584B2 (en) * 2006-08-18 2011-09-21 グーグル インコーポレイテッド Providing routing information based on ambiguous locations
JP2011204240A (en) * 2006-08-18 2011-10-13 Google Inc Providing routing information based on ambiguous location
JP2009008505A (en) * 2007-06-27 2009-01-15 Aisin Aw Co Ltd Navigation system and program for navigation
WO2016074212A1 (en) * 2014-11-14 2016-05-19 Volkswagen China Investment Co., Ltd. Control method and control apparatus for navigation system

Also Published As

Publication number Publication date
JP3419205B2 (en) 2003-06-23

Similar Documents

Publication Publication Date Title
JP3560289B2 (en) An integrated dictionary-based handwriting recognition method for likely character strings
US4903206A (en) Spelling error correcting system
JP4037608B2 (en) Reduced keyboard clarification system
JP5501625B2 (en) Apparatus and method for filtering distinct characters from indeterminate text input
US8099416B2 (en) Generalized language independent index storage system and searching method
KR100930185B1 (en) Electronic device and dictionary input method with dictionary function
EP0797157A2 (en) Machine interpreter
JP3419205B2 (en) Information retrieval device
JPS646496B2 (en)
JP4004060B1 (en) Character search method
JP3945075B2 (en) Electronic device having dictionary function and storage medium storing information retrieval processing program
JP3275704B2 (en) Input character string guessing recognition device
JPS646499B2 (en)
JPH1021252A (en) Information retrieval device
JP3888701B2 (en) Character converter
JPH0531190B2 (en)
JP5338482B2 (en) Chinese sentence example search device and program
JP3045886B2 (en) Character processing device with handwriting input function
US20070033173A1 (en) Method and apparatus for data search with error tolerance
JPH0521264B2 (en)
JPH04191959A (en) Paragraph segmenting device
JPH0335349A (en) Document processor with example display function
JPH0773279A (en) Character converting device
JPH0721212A (en) Word processor
JPH05242074A (en) Kana/kanji conversion processor

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 11

EXPY Cancellation because of completion of term