JPH09190507A - Address reader - Google Patents

Address reader

Info

Publication number
JPH09190507A
JPH09190507A JP8003609A JP360996A JPH09190507A JP H09190507 A JPH09190507 A JP H09190507A JP 8003609 A JP8003609 A JP 8003609A JP 360996 A JP360996 A JP 360996A JP H09190507 A JPH09190507 A JP H09190507A
Authority
JP
Japan
Prior art keywords
character
address
display number
word
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8003609A
Other languages
Japanese (ja)
Inventor
Hisao Ogata
日佐男 緒方
Hiromichi Fujisawa
浩道 藤澤
Masashi Koga
昌史 古賀
Katsumi Marukawa
勝美 丸川
Tatsuhiko Kagehiro
達彦 影広
Yutaka Sako
裕 酒匂
Yoshihiro Shima
好博 嶋
Shigeru Watanabe
成 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8003609A priority Critical patent/JPH09190507A/en
Publication of JPH09190507A publication Critical patent/JPH09190507A/en
Pending legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve the processing speed of an address reader by detecting and segmenting the horizontally arrayed characters appearing in vertical writing way, adding the marks to the detected character patterns to show the horizontally arrayed characters and then assigning the different wild cards to the marks to carry out the collation of them. SOLUTION: A character segmentation/identification part 109 segments the character images of town areas out of the character rows for every character and identifies every character to convert it into a character code. As a result, the similarity corresponding to the character code serving as a candidate is acquired together with the information showing vertical or horizontal writing way. A town area collation part 110 extracts the town area information on addresses by means of a town area word dictionary 112. Then the part 109 segments the character images of address display numbers for every character out of the information on the character segmentation candidates and the head position of the address display number and identifies every character to convert it into a character code. The presence or absence is judged for the horizontally arrayed characters appearing in vertical writing way based on the vertical/horizontal writing judging information. If the presence of such characters are recognized, the segmentation candidates are generated for the horizontally arrayed characters and these characters are identified.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は,郵便物を自動的に
区分するために,郵便物上に記載されている住所情報を
読み取る住所読み取り装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an address reading device for reading address information written on a mail piece in order to automatically sort the mail piece.

【0002】[0002]

【従来の技術】住所情報として,例えば「秋川市高田11
1-2」が記述されている場合を想定する。この時,「秋
川市高田」を町域情報,「111-2」の数字で記述されて
いる部分を住所表示番号情報と定義する。住所表示番号
には同じ意味を持つ様々な記述形態が存在する。例え
ば,「111番地2号」,「111番地の2」,「11
1−2」,「111の2」は同じ住所表示番号を意味す
る。
2. Description of the Related Art As address information, for example, "11 Takada, Akigawa City" is used.
It is assumed that “1-2” is described. At this time, "Takada, Akikawa-shi" is defined as town area information, and the part described by the number "111-2" is defined as address display number information. There are various description forms having the same meaning in the address display number. For example, “111 No. 2”, “111 No. 2”, “11”
"1-2" and "2 of 111" mean the same address display number.

【0003】従来,住所表示番号の読み取り方法につい
ては,特開平7−53946号に示されるようなワイル
ドカードを利用する方式が知られている。この方式の概
要は以下の通りである。住所表示番号を表す文字パター
ンをそれぞれ切出して識別した結果は,一つの文字パタ
ーンに複数の候補文字が付随する候補文字ラティスとし
て出力される。この候補文字ラティスに対して住所表示
番号の単語照合を行えば,正しい住所表示番号が抽出で
きると考えられる。しかし,住所表示番号は上述したよ
うに様々な表記形態がある上,丁目や番などを表す数字
は任意の数字を取り得る。そのため,全ての数字や表記
の組み合わせについて,住所表示番号の単語を保持する
のは記憶容量と処理速度の点で事実上不可能である。
Conventionally, as a method of reading the address display number, a method using a wild card as disclosed in Japanese Patent Laid-Open No. 7-53946 is known. The outline of this method is as follows. The result of cutting out and identifying the character patterns representing the address display number is output as a candidate character lattice in which one character pattern is accompanied by a plurality of candidate characters. It is considered that the correct address display number can be extracted by matching the address display number with this candidate character lattice. However, the address display number has various notations as described above, and the number indicating the claw or number can be any number. Therefore, it is virtually impossible to hold the word of the address display number for all combinations of numbers and notations in terms of storage capacity and processing speed.

【0004】そこで,候補文字中の数字を直接単語照合
の対象とはせずに,数字候補を任意の数字を表すワイル
ドカードで置き換えた候補文字ラティスを作る。例えば
算用数字なら「n」,漢数字なら「k」という具合であ
る。一方,照合を行うための単語辞書には住所表示番号
の表記パターンをワイルドカードで表した単語を登録し
ておく。「111番地2号」の表記パターンに対応する
単語は「nnn番地n号」である。そして,ワイルドカ
ードで表現された単語とワイルドカードに置き換えられ
た候補文字ラティスとの単語照合を行う。
Therefore, the numbers in the candidate characters are not directly subjected to word matching, but a candidate character lattice is created by replacing the number candidates with a wild card representing an arbitrary number. For example, "n" for arithmetic numbers and "k" for Chinese numbers. On the other hand, in the word dictionary for matching, the word in which the notation pattern of the address display number is represented by a wild card is registered. The word corresponding to the notation pattern of "111 No. 2" is "nnn address n". Then, word matching is performed between the word expressed by the wild card and the candidate character lattice replaced by the wild card.

【0005】これにより,上で述べたような組み合わせ
の問題を回避することができ,正しい住所表示番号表記
パターンを表す単語を抽出することができる。そして,
単語照合の結果,上位の候補に上がってきたワイルドカ
ード単語の数字部分について,元の候補文字ラティスを
参照しながら数字に復元すれば,正しい候補が得られ
る。
With this, it is possible to avoid the problem of the combination described above, and it is possible to extract the word representing the correct address display number notation pattern. And
As a result of word matching, if the numeral part of the wildcard word that has been selected as a higher-ranking candidate is restored to a numeral while referring to the original candidate character lattice, a correct candidate can be obtained.

【0006】[0006]

【発明が解決しようとする課題】しかしながら,上記の
方法では縦書きの住所の場合に大きな問題点がある。例
えば,図3のように縦書きの表記の中に算用数字が書か
れた場合は,算用数字の部分は通常横並びで書かれる。
この時,その部分の文字パターンを切り出しして認識
し,上述した特開平7−53946号の知識処理を適用
しようとすると次の問題が起こる。すなわち,算用数字
の「1」とその下に続く区切り文字「|」の形状が非常
に似通っているために,それぞれの認識結果として,数
字の「1」と区切り文字の「|」が同時に候補文字に挙
がってくる。このため,上記の知識処理を適用したとし
ても,住所表示番号の表記パターンとして許容される
「111|2」,「11|12」,「1|112」が同
じような確信度で候補に挙げられる。
However, the above method has a serious problem in the case of a vertically written address. For example, when an arithmetic number is written in the vertical notation as shown in FIG. 3, the portion of the arithmetic number is usually written horizontally.
At this time, if the character pattern of that portion is cut out and recognized and the knowledge processing of Japanese Patent Laid-Open No. 7-53946 is applied, the following problem occurs. That is, since the arithmetic number "1" and the delimiter "|" following it are very similar in shape, the number "1" and the delimiter "|" It comes up as a candidate character. Therefore, even if the above-mentioned knowledge processing is applied, "111 | 2", "11 | 12", and "1 | 112" which are allowed as the notation pattern of the address display number are listed as candidates with similar confidence. To be

【0007】このような弊害を防ぐために,縦書き中の
文字と縦書き中の横並び文字を検出し,それぞれを区別
して横並び文字列の直前直後の文字は必ず区切り文字で
あると仮定して,区切り文字以外の文字種が来た場合は
追加のペナルティを課すという方法も考えられる。しか
し,図3(b)に示すような「111|1|2」は横並び
文字の「111」の直後は「|」の区切り文字である
が,その後が横書き文字でないために「111|11
2」の候補も許すと言った弊害が出てくる。この弊害を
なくすために,さらに縦書きでは2桁以上の算用数字は
横書き文字しか有りえない等の様々な条件を課すこと
で,不要な候補を減らすことができる。しかし,精度を
高くしようとして様々な拘束条件を課そうとすればする
ほど,それはそれぞれの表記に応じて細かな場合分けを
必要として複雑になるだけでなく,表記法が変わった場
合にその保守も困難となる。
In order to prevent such an adverse effect, a character in vertical writing and a horizontally arranged character in vertical writing are detected, and it is assumed that the characters immediately before and after the horizontally arranged character string are delimiters by distinguishing between them. It is also possible to impose an additional penalty when a character type other than the delimiter comes. However, “111 | 1 | 2” as shown in FIG. 3 (b) is a delimiter of “|” immediately after the side-by-side character “111”, but since it is not a horizontal writing character, “111 | 11”
The harmful effect of allowing the "2" candidate will appear. In order to eliminate this adverse effect, it is possible to reduce unnecessary candidates by imposing various conditions such that the number for arithmetic with two or more digits can only have horizontal characters in vertical writing. However, the more we try to impose various constraints in order to increase the accuracy, the more complicated it is that each case requires detailed case classification, and if the notation changes, its maintenance Will also be difficult.

【0008】本発明は,処理速度を犠牲にすることなく
上記問題点を解決することを目的とする。
An object of the present invention is to solve the above problems without sacrificing the processing speed.

【0009】[0009]

【課題を解決するための手段】上記課題を解決するため
に,本発明では三つの手段を提供する。
In order to solve the above problems, the present invention provides three means.

【0010】第一の手段は,縦書きで現われる横並び文
字を検出して切出し,検出された文字パターンに横並び
文字であることを示すマークを付けることである。
The first means is to detect a horizontally arranged character appearing in vertical writing, cut it out, and add a mark to the detected character pattern to show that it is a horizontally arranged character.

【0011】第二の手段は,第1の手段で付与したマー
クに応じて,同じ算用数字であっても縦書きの算用数字
と,縦書きで現われる横並びの算用数字をそれぞれ別の
ワイルドカードを割り当てて照合を行うことである。ま
ず,単語照合が行われる文字識別結果の候補文字ラティ
スについて述べる。図3(a)の場合では横並び部分「1
11」に対する算用数字の候補文字には,横並び算用数
字であることを示す「N」のワイルドカードで置き換え
る。「2」には通常の算用数字のワイルドカード「n」
で置き換える。その他の候補文字については従来と同じ
置き換えを行う。このような方法で識別結果の候補文字
ラティスから,2種類の算用数字を含めたワイルドカー
ドに置き換えられた候補文字ラティスを生成する。
According to the mark given by the first means, the second means separates the vertically written mathematical numbers and the horizontally arranged mathematical numbers which appear vertically even if they are the same. Matching is performed by assigning a wild card. First, we describe the candidate character lattice of the character identification result for word matching. In the case of FIG. 3 (a), the side-by-side portion "1"
The candidate character of the numeral for 11 ”is replaced with a wild card of“ N ”indicating that it is a horizontally arranged numeral. "2" is a wild card "n" for normal arithmetic digits
Replace with The other candidate characters are replaced as in the conventional case. In this way, a candidate character lattice is generated by replacing the candidate character lattice of the identification result with a wild card containing two types of arithmetic digits.

【0012】次に照合を行う辞書単語について述べる。
住所表示番号の表記パターン辞書には,縦書きに部分的
な横並びが混在する表記パターンを「NNN−n」のよ
うに「N」と「n」の2種類の算用数字ワイルドカード
を用いて表現した単語を格納しておく。このように算用
数字について縦書き用と横並び用の2種類のワイルドカ
ードを用意し,それらのワイルドカードを用いた候補文
字ラティスと住所表示番号の表記パターンの単語を照合
する。その結果,縦書きに部分的な横並びが存在しても
正しい表記パターンが得られる。
Next, the dictionary words to be matched will be described.
In the notation pattern dictionary of address display numbers, notation patterns in which partial horizontal alignment is mixed in vertical writing are used by using two types of arithmetic numeral wildcards such as "NNN" and "n". Store the expressed word. In this way, two types of wildcards, one for vertical writing and one for horizontal arrangement, are prepared for the arithmetic numerals, and the candidate character lattice using these wildcards and the words of the notation pattern of the address display number are collated. As a result, a correct writing pattern can be obtained even if there is a partial horizontal alignment in vertical writing.

【0013】第三の手段は,高速に単語照合を行うため
にインデックスを設けることである。住所表示番号の多
様な表記パターンに対応するためには,縦書きで現われ
る横並びの表記パターンを含めて多くの単語を登録して
おく必要があるり,それら単語群を全て照合すると膨大
な処理時間を必要とする。そこで,インデックスを設け
て不要な単語は照合を行わないようにする。以下に2つ
のインデックスを示す。
The third means is to provide an index for high-speed word matching. In order to support various notation patterns of address display numbers, it is necessary to register many words including the notation patterns that appear horizontally in vertical writing, and it is a huge processing time to collate all these word groups. Need. Therefore, an index is provided so that unnecessary words are not matched. Two indexes are shown below.

【0014】一つ目のインデックスは,記入文字の1文
字目,2文字目の候補文字をインデックスとすることで
ある。1文字目,2文字目の候補文字に単語の文字が含
まれるものは,正しい単語である可能性が高く,それに
漏れるものは可能性が低いと思われる。そこで,1文字
目,2文字目に該当する候補文字を含む単語のみを照合
することで,全ての単語を照合しなくても高速に正しい
解を探索することができる。
The first index is to use the first and second candidate characters of the entered character as an index. It is highly likely that the first and second candidate characters that include a word character are correct words, and those that leak to that are unlikely. Therefore, by matching only the words including the candidate characters corresponding to the first and second characters, the correct solution can be searched at high speed without matching all the words.

【0015】二つ目のインデックスは,縦横書きのフラ
グである。住所表示番号の表記パターンには縦書きにし
か現われないもの,横書きにしか現われないもの,およ
び両方に現われるものの3種類に分けることができる。
例えば,上で述べたような縦書きに部分的な横並びが混
在する表記パターン「NNN−n」は縦書きでしか現わ
れない。そこで,縦書き文字切出しおよび識別を行うと
きに,縦横書きに関するフラグを出力するようにしてお
く。一方,ワイルドカードの単語にも縦横書きに関する
フラグを設けておき,それらのフラグを照らし合せるこ
とで,不必要な単語照合を避けることができる。
The second index is a flag for vertical and horizontal writing. The address display number notation pattern can be divided into three types: one that appears only vertically, one that appears only horizontally, and one that appears in both.
For example, the above-described writing pattern "NNN-n" in which vertical writing is mixed with partial horizontal alignment appears only in vertical writing. Therefore, when performing vertical character cutting and identification, a flag relating to vertical and horizontal writing is output. On the other hand, the wildcard words are also provided with flags regarding vertical and horizontal writing, and by comparing these flags, unnecessary word matching can be avoided.

【0016】[0016]

【発明の実施の形態】以下,本発明の実施例を図1〜図
17を用いて説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to FIGS.

【0017】図1は本実施例の装置全体の構成図であ
る。郵便物100は供給部101に順次送られる。供給
部101において郵便物が所定位置を通過し,その通過
の間に郵便物の表面の画像は画像入力部102により撮
像される。画像入力部102はラインセンサのような光
電変換素子からの画像信号をデジタル化して住所認識部
106に送る。住所認識部106では,郵便物の表面に
記載された住所を読み取り区分情報を生成する。一方,
表面画像が撮像された当該郵便物は遅延搬送路103に
送られる。遅延搬送路103では,表面画像より区分情
報を生成するための所定時間分,郵便物は当該搬送路1
03を移動する。区分部104では,住所認識部106
からの区分情報に従って郵便物を区分けした後,区分棚
105に格納する。
FIG. 1 is a block diagram of the entire apparatus of this embodiment. The postal matter 100 is sequentially sent to the supply unit 101. In the supply unit 101, the mail piece passes through a predetermined position, and an image of the surface of the mail piece is captured by the image input unit 102 during the passage. The image input unit 102 digitizes an image signal from a photoelectric conversion element such as a line sensor and sends it to the address recognition unit 106. The address recognition unit 106 reads the address written on the surface of the postal matter and generates classification information. on the other hand,
The postal matter of which the surface image is captured is sent to the delay conveyance path 103. In the delay conveyance path 103, the mail is sent for the predetermined time for generating the sorting information from the surface image,
Move 03. In the classification unit 104, the address recognition unit 106
After sorting the mail items according to the sorting information from, the items are stored in the sorting shelf 105.

【0018】住所認識部106は,制御部107,画像
処理部108,文字切出識別部109,町域照合部11
0,住所表示番号照合部111からなり,制御部107
は画像処理部108,文字切出識別部109,町域照合
部110,住所表示番号照合部111を制御する。町域
照合部110では町域単語辞書112を,住所表示番号
照合部111では住居表示番号表記パターン辞書113
をアクセスし,文字切出識別部109の認識結果の誤り
などを自動的に修正する。
The address recognition unit 106 includes a control unit 107, an image processing unit 108, a character cutout identification unit 109, and a town area collation unit 11.
0, consisting of the address display number collation unit 111, the control unit 107
Controls the image processing unit 108, the character cutout identifying unit 109, the town area collating unit 110, and the address display number collating unit 111. The town area matching unit 110 uses the town area word dictionary 112, and the address display number matching unit 111 uses the house display number notation pattern dictionary 113.
Is accessed to automatically correct an error in the recognition result of the character cutout identifying unit 109.

【0019】住居表示番号表記パターン辞書113は,
表記パターン単語インデックス辞書114,表記パター
ン単語辞書115からなる。表記パターン単語辞書11
5は,街区の表記パターンを納めた辞書であり,表記パ
ターン単語インデックス辞書114は,表記パターン単
語辞書115から必要な単語を選択的に検索するための
インデックスを納めた辞書である。
The house display number notation pattern dictionary 113 is
It comprises a notation pattern word index dictionary 114 and a notation pattern word dictionary 115. Notation pattern word dictionary 11
Reference numeral 5 is a dictionary that stores the notation patterns of the blocks, and the notation pattern word index dictionary 114 is a dictionary that stores indexes for selectively retrieving necessary words from the notation pattern word dictionary 115.

【0020】図2は図1における住所認識部106の処
理全体の流れを示したものである。図2を用いて住所認
識部106の動作を説明する。
FIG. 2 shows the flow of the entire processing of the address recognition unit 106 in FIG. The operation of the address recognition unit 106 will be described with reference to FIG.

【0021】ステップ120では,画像入力部102が
郵便物の宛名書いてある面を撮像し,その画像を住所認
識部106に入力する。
In step 120, the image input unit 102 captures an image of the surface of the mail addressing, and inputs the image to the address recognition unit 106.

【0022】ステップ121では,画像処理部108が
画像入力部102より送られてきた宛名の書いてある全
面の画像から宛名領域を抽出し,さらに宛名領域の画像
から文字行毎の画像を抽出する。例えば図3(a)の住所
文字行が得られたとする。
In step 121, the image processing unit 108 extracts the address area from the image of the entire surface with the address sent from the image input unit 102, and further extracts the image of each character line from the image of the address area. . For example, assume that the address character line in FIG. 3A is obtained.

【0023】ステップ122では,文字切出識別部10
9がステップ121で得られた文字行の画像から,1文
字毎に町域の文字画像を切り出した後,切り出した1文
字毎に文字を認識して文字コードに変換する。ここで,
文字識別した結果は候補としての複数の文字コードと対
応する類似度が得られる。また,文字の方向,すなわち
縦書きか横書きかの情報も得られる。
In step 122, the character cutout identifying section 10
9 cuts out the character image of the town area for each character from the image of the character line obtained in step 121, and then recognizes the character for each cut out character and converts it into a character code. here,
As a result of character identification, similarities corresponding to a plurality of character codes as candidates are obtained. In addition, information on the direction of characters, that is, vertical writing or horizontal writing can be obtained.

【0024】ステップ122の詳細を図4,図7を用い
て説明する。図4は図3(a)の住所文字行から一文字毎
の文字パターンを切り出すための切出し候補の仮説を,
ネットワークの形で表現した図である。図7は町域文字
切出識別の処理手順を示す図である。
Details of step 122 will be described with reference to FIGS. Fig. 4 shows the extraction candidate hypothesis for extracting a character pattern for each character from the address character line in Fig. 3 (a).
It is a figure expressed in the form of a network. FIG. 7 is a diagram showing a processing procedure of the town area character cutout identification.

【0025】ステップ170では,文字切出識別部10
9が文字パターンの切出し候補を作成し,図4に示すよ
うな切出し候補をネットワークの形で保持する。そし
て,この時点では住所表示番号「111」もその上の町
域と同じように縦方向にのみ文字パターンを切り出す。
In step 170, the character cut-out identifying section 10
Reference numeral 9 creates a cutout candidate of a character pattern and holds the cutout candidate as shown in FIG. 4 in the form of a network. At this time, the address display number "111" is also cut out in the vertical direction in the same manner as the town area above it.

【0026】ステップ171では,文字切出識別部10
9はステップ170で生成した文字切出し候補に対して
文字識別を行う。識別した結果は候補としての複数の文
字コードと,それに対応する類似度が得られる。さら
に,文字パターンを縦向き,横向きに識別してそれぞれ
の識別結果の類似度を比較することで縦書きが横書きか
を判定する。
In step 171, the character cutout identifying section 10
In step 9, character identification is performed on the character cutout candidates generated in step 170. As a result of the identification, a plurality of character codes as candidates and the corresponding similarity are obtained. Further, it is determined whether the vertical writing is horizontal writing by identifying the character patterns vertically and horizontally and comparing the similarities of the respective identification results.

【0027】ステップ172では,各切出し候補の文字
識別結果の類似度や文字パターン同士の隙間を基に各切
出し候補の確信度を計算する。すなわち,例えば図4の
127のような実際に存在しない文字切出しの候補は,
文字識別を行っても高い類似度は得られない。そこで,
識別の類似度を主体として切出し候補の確信度を計算す
ることが可能である。
In step 172, the certainty factor of each cut-out candidate is calculated based on the similarity of the character identification result of each cut-out candidate and the gap between the character patterns. That is, for example, a character cutout candidate that does not actually exist, such as 127 in FIG.
Even if character recognition is performed, a high degree of similarity cannot be obtained. Therefore,
It is possible to calculate the certainty factor of the cut-out candidate mainly based on the similarity of identification.

【0028】ステップ173では,ステップ172で計
算した各文字切出し候補の確信度に基づいて,全体の文
字の切出しの確信度が高くなるように切出し候補を選択
して,それに対応する候補文字ラティスが生成される。
例えば,図4において太線で示されるような切出し候補
が選択され,その切出し候補に対する識別結果が図10
の候補文字ラティスとして出力されえる。図10(a)は
候補文字ラティスの候補文字テーブルの例であり,図1
0(b)はそれに対応するコストテーブルの例である。こ
こでは,文字識別した時の類似度の高い順にコストが割
り当てられている。図10(a)の候補文字テーブルは,
記入文字番号毎に第1位から第m位(mは任意)まで,
候補文字の文字コードが並べられている。図10(b)の
コストテーブルは,図10(a)の候補文字テーブルの文
字コードが格納されている位置と対応する場所に,その
候補文字に対するコストが格納されている。例えば,記
入文字番号1の第1位の候補文字「秋」のコストは
「0」となる。
In step 173, based on the certainty factor of each character segmentation candidate calculated in step 172, the segmentation candidate is selected so that the certainty factor of the segmentation of the entire character becomes high, and the candidate character lattice corresponding thereto is selected. Is generated.
For example, a cutout candidate as indicated by a thick line in FIG. 4 is selected, and the identification result for the cutout candidate is shown in FIG.
Can be output as the candidate character lattice of. FIG. 10A is an example of the candidate character table of the candidate character lattice.
0 (b) is an example of the corresponding cost table. Here, costs are assigned in descending order of similarity when characters are identified. The candidate character table in FIG. 10 (a) is
From 1st place to mth place (m is arbitrary) for each written character number,
Character codes of candidate characters are arranged. In the cost table of FIG. 10B, the cost for the candidate character is stored at a position corresponding to the position where the character code of the candidate character table of FIG. 10A is stored. For example, the cost of the first-ranked candidate character “autumn” with the written character number 1 is “0”.

【0029】以上のステップ170からステップ173
の処理により,図2ステップ122の町域の文字切出し
識別処理が行われる。
The above steps 170 to 173
By the above process, the character cutout identification process of the town area in step 122 of FIG. 2 is performed.

【0030】ステップ123では,町域照合部110
が,町域単語辞書112を用いてステップ122で得ら
れた候補文字ラティスから住所の町域情報を抽出する。
町域情報の抽出法としては,候補文字ラティスからオー
トマトンを生成して単語照合を行う手法が知られてい
る。これは「特願平1−262881」にその詳細が記
述されている。ステップ123の処理の結果,町域情報
として「秋川市高田」という町域文字列と,町域の終わ
りが5文字目,すなわち住所表示番号が6文字目から始
まるという住所表示番号の先頭位置の情報が得られる。
In step 123, the town area collating unit 110
However, the town area information of the address is extracted from the candidate character lattice obtained in step 122 using the town area word dictionary 112.
As a method of extracting town area information, a method is known in which an automaton is generated from a candidate character lattice and word matching is performed. The details are described in "Japanese Patent Application No. 1-262881". As a result of the processing in step 123, the town area character string “Takada, Akigawa-shi” is used as town area information, and the start position of the address display number that the end of the town area is the fifth character, that is, the address display number starts from the sixth character. Information is obtained.

【0031】ステップ124では,文字切出識別部10
9がステップ122で得られた文字の切出し候補とステ
ップ123で得られた住所表示番号の先頭位置の情報か
ら,再度1文字毎に住所表示番号の文字画像を切り出し
た後,切り出した1文字毎に文字を認識して文字コード
に変換する。ここで,ステップ122で得られた縦書き
横書きの判定情報を用いて縦書きの場合は,縦書き中の
横並び文字がないか判定を行う。横並び文字があると判
定された場合は,横並び文字に対して再度文字切出し候
補を生成して文字識別を行う。
In step 124, the character cut-out identification section 10
9 again cuts out the character image of the address display number for each character from the character cutout candidates obtained in step 122 and the information of the start position of the address display number obtained in step 123, and then cuts out each character. Recognize characters and convert them to character codes. Here, in the case of vertical writing, it is determined whether or not there is a horizontally arranged character in vertical writing by using the determination information of vertical writing and horizontal writing obtained in step 122. If it is determined that there is a horizontally arranged character, a character cutout candidate is generated again for the horizontally arranged character to perform character identification.

【0032】ステップ124の詳細を図5,図6,図
8,図10を用いて説明する。図6は図4の切出し候補
から横並び文字を検出して,横並び文字に対する切出し
候補を追加した例である。図8は住所表示番号の文字切
出識別の処理手順を示す図である。
Details of step 124 will be described with reference to FIGS. 5, 6, 8 and 10. FIG. 6 shows an example in which horizontal alignment characters are detected from the extraction candidates of FIG. 4 and the extraction candidates for the horizontal alignment characters are added. FIG. 8 is a diagram showing a processing procedure for identifying character cutouts of an address display number.

【0033】ステップ180では,図2のステップ12
3で得られた住所表示番号先頭位置情報を用いて図5の
128の位置から横並び文字が存在するかを各切出し候
補について判定を行う。ここで,横並び文字が存在する
かどうかの判定は切出し候補の文字識別結果の類似度が
低い,あるいは前後の文字切出し候補の中に「|」,
「丁」,「目」,「番」,「地」,「号」等の区切り文
字が存在するかどうかで行われる。図5に横並び文字が
検出された例を示す。
In step 180, step 12 in FIG.
Using the address display number start position information obtained in step 3, it is determined for each cut-out candidate whether there is a horizontally aligned character from the position 128 in FIG. Here, the determination of whether or not there is a side-by-side character exists is that the character identification result of the cut-out candidate has a low degree of similarity, or "|"
It is performed depending on whether or not there is a delimiter such as “Ding”, “eye”, “ban”, “ground”, “go”. FIG. 5 shows an example in which side-by-side characters are detected.

【0034】ステップ181では,ステップ180の横
並び文字の判定結果に基づき,横並び文字が存在すると
判定される場合は,文字切出認識部109が文字パター
ンの候補を作成し,図6に示すような切出し候補をネッ
トワークの形で追加する。
In step 181, when it is determined that there is a horizontally arranged character based on the result of the horizontally arranged character determination in step 180, the character cutout recognition unit 109 creates a character pattern candidate, and the character pattern candidate is generated as shown in FIG. Add cutout candidates in the form of a network.

【0035】ステップ182では,文字切出認識部10
9はステップ181で追加生成した文字切出し候補に対
して文字識別を行う。識別した結果は候補としての複数
の文字コードと,それに対応する類似度が得られる。
In step 182, the character cutout recognition unit 10
In step 9, a character identification is performed on the character cutout candidate additionally generated in step 181. As a result of the identification, a plurality of character codes as candidates and the corresponding similarity are obtained.

【0036】ステップ183では,図7のステップ17
2と同様に各切出し候補の文字識別結果の類似度や文字
パターン同士の隙間を基に各切出し候補の確信度を計算
する。
In step 183, step 17 in FIG.
Similar to 2, the certainty factor of each cutout candidate is calculated based on the similarity of the character identification result of each cutout candidate and the gap between the character patterns.

【0037】ステップ184では,ステップ183で計
算した各文字切出し候補の確信度に基づいて,全体の文
字の切出しの確信度が高くなるように切出し候補を選択
して,それに対応する候補文字ラティスが生成される。
例えば,図6において斜線中の太線で示されるような切
出し候補が選択され,その切出し候補に対する識別結果
が図11の候補文字ラティスとして出力されえる。図1
1(a)は候補文字ラティス中の候補文字テーブルの例で
あり,図11(b)はそれに対応するコストテーブルの例
である。記入文字番号「6-1」,「6-2」,「6-3」には
図10の記入文字番号「6」の文字パターンが,横並び
文字として識別されたことを示す横並びフラグが立って
いる。
In step 184, based on the certainty factors of the respective character segmentation candidates calculated in step 183, the segmentation candidate is selected so that the certainty factor of the segmentation of the entire character becomes high, and the candidate character lattice corresponding thereto is selected. Is generated.
For example, a cutout candidate as indicated by a bold line in FIG. 6 can be selected, and the identification result for the cutout candidate can be output as the candidate character lattice in FIG. 11. FIG.
1 (a) is an example of a candidate character table in the candidate character lattice, and FIG. 11 (b) is an example of a corresponding cost table. At the entry character numbers "6-1", "6-2", and "6-3", a horizontal alignment flag indicating that the character pattern of the entry character number "6" in FIG. 10 is identified as a horizontal alignment character is set. There is.

【0038】以上のステップ180からステップ184
の処理により,図2ステップ124の住所表示番号の文
字切出識別が行われる。
The above steps 180 to 184
By the processing of step 2, the character cutout identification of the address display number in step 124 of FIG. 2 is performed.

【0039】ステップ125では,住所表示番号照合部
111が住居表示番号表記パターン辞書113を用い
て,ステップ124で得られた候補文字ラティスから住
所表示番号を抽出する。ステップ125の詳細を図1,
図9,図11〜図17を用いて詳細に説明する。図9に
おいてステップ191が本発明の特徴となっている。
In step 125, the address display number collation unit 111 uses the residence display number notation pattern dictionary 113 to extract the address display number from the candidate character lattice obtained in step 124. Details of step 125 are shown in FIG.
This will be described in detail with reference to FIGS. 9 and 11 to 17. In FIG. 9, step 191 is the feature of the present invention.

【0040】ステップ190では,図2のステップ12
4で生成した候補文字ラティスを図1の住所表示番号照
合部111に入力する。
In step 190, step 12 in FIG.
The candidate character lattice generated in 4 is input to the address display number matching unit 111 in FIG.

【0041】ステップ191では,ステップ190で得
られた候補文字ラティスから,ワイルドカードラティス
を生成する。ここで,ワイルドカードラティスとは住所
表示番号の照合を行うために,候補文字ラティス中の数
字を任意の数字を表すワイルドカードで置き換えたラテ
ィスである。
In step 191, a wildcard lattice is generated from the candidate character lattice obtained in step 190. Here, the wildcard lattice is a lattice in which the numbers in the candidate character lattice are replaced with wildcards representing arbitrary numbers in order to match the address display numbers.

【0042】ステップ191の詳細を図11,図12,
図13を用いて説明する。
Details of step 191 are shown in FIGS.
This will be described with reference to FIG.

【0043】図12はワイルドカードラティスを生成す
るために用いる変換テーブルであり,以下に詳細を述べ
る。
FIG. 12 shows a conversion table used to generate a wild card lattice, which will be described in detail below.

【0044】分類における「数字」のテーブルは,丁
目,街区,住居表示番号を表す数字に関わるテーブルで
あり,縦書きの候補文字ラティス中に任意の算用数字と
漢数字の候補文字があれば,それぞれ「n」,「k」と
いうワイルドカードに変換される。但し,縦書き中の横
並び算用数字は縦書きの「n」と区別するために,
「N」というワイルドカードに変換される。「英字」の
テーブルも同様に縦書きの英字は「a」,縦書き中の横
並び英字は「A」に変換される。
The table of "numerals" in the classification is a table relating to the numbers representing the chome, block, and house display number, and if there are arbitrary numbers and Chinese numbers in the vertically-written candidate character lattice. , Are converted into wildcards “n” and “k”, respectively. However, in order to distinguish horizontally aligned numbers in vertical writing from vertical writing "n",
Converted to a wildcard "N". Similarly, in the "alphabet" table, vertically written alphabetic characters are converted into "a" and horizontally arranged alphabetic characters in vertical writing are converted into "A".

【0045】「区切り文字」のテーブルは,例えば住所
中に「3丁目8−1」とある場合に,丁目や街区の数字
同士を区切るために使用される文字「丁目」や「−」に
関するテーブルである。ここでは縦書きの「丁」,
「目」,「番」,「地」,「の」,「ノ」については変
換せずに,そのままの文字を使用する。一方,縦書きの
「|」,「.」,「/」は「|」というワイルドカード
に変換されるが,縦書き中の横並びで現われる「−」,
「〜」は「−」に変換される。
The "delimiter" table is a table relating to the characters "chome" and "-" used to separate the numbers of the chome and the block when there is "3 chome 8-1" in the address, for example. Is. Here, the vertical "Ding",
The "eye", "ban", "ground", "no", and "no" are not converted and the characters are used as they are. On the other hand, vertically written "|", ".", And "/" are converted into wildcards called "|", but "-", which appears in horizontal alignment during vertical writing,
"-" Is converted to "-".

【0046】「その他」のテーブルは,「数字」テーブ
ル,「区切り文字」テーブル以外の文字に関するテーブ
ルで,上記で述べた以外の文字は全て「e」というワイ
ルドカードに変換される。すなわち「その他」というの
は丁目,街区,住居表示番号に関わる文字以外の全てを
指す。
The "other" table is a table relating to characters other than the "numeric" table and the "delimiter" table, and all the characters other than those described above are converted into a wildcard "e". That is, "other" refers to all but the characters related to the chome, block, and house display number.

【0047】図13は,図12の変換テーブルを用い
て,図11で示す住所表示番号の候補文字ラティスか
ら,ワイルドカードラティスを生成した例である。ワイ
ルドカードラティスは図13(a)で示すワイルドカード
テーブルと,図13(b)で示すコストテーブルの2つか
らなる。
FIG. 13 is an example in which a wild card lattice is generated from the candidate character lattice of the address display number shown in FIG. 11 using the conversion table of FIG. The wild card lattice is composed of two parts, a wild card table shown in FIG. 13 (a) and a cost table shown in FIG. 13 (b).

【0048】図13のワイルドカードラティスの生成
は,図11(a)の候補文字テーブルにおいて候補文字の
順位の高いほうから行う。まず第1位の候補文字をワイ
ルドカードに変換して図13(a)で示すワイルドカード
テーブルの第1位の場所に書き込む。それと同時に変換
された候補文字に対応するコストを,図13(b)のコス
トテーブルの該当する場所に書き込む。
The wild card lattice shown in FIG. 13 is generated from the candidate character table having the highest rank in the candidate character table shown in FIG. First, the first-ranked candidate character is converted into a wildcard and written in the first-ranked place of the wildcard table shown in FIG. At the same time, the cost corresponding to the converted candidate character is written in the corresponding place in the cost table of FIG. 13 (b).

【0049】次に,第2位の候補文字を調べ,それが第
1位の候補文字と同じワイルドカードに属するなら,重
複するのでそれを省略する。もし違うワイルドカードに
属するのであれば,そのワイルドカードと対応するコス
トを,それぞれ図13(a)のワイルドカードテーブル,
図13(b)のコストテーブルに書き込む。以下,全ての
候補文字について同じことを繰り返す。
Next, the second-ranked candidate character is examined, and if it belongs to the same wildcard as the first-ranked candidate character, it is duplicated and therefore omitted. If they belong to different wildcards, the costs corresponding to the wildcards are calculated in the wildcard table of FIG.
It writes in the cost table of FIG.13 (b). Hereinafter, the same thing is repeated for all the candidate characters.

【0050】例えば,図11(a)の候補文字テーブルに
おける記入文字番号「6-1」の列の変換を考える。「6-
1」は横並び文字であることを示すフラグが立っている
ので,まず,第1位の候補文字「1」をワイルドカード
「N」に変換して,図13(a)のワイルドカードテーブ
ルにおける記入文字番号「6-1」の第1位の場所に書き
込む。それと同時に,候補文字「1」に対応するコスト
「0」を,図13(b)で示すコストテーブルの該当する
場所に書き込む。
For example, consider conversion of the column of the entry character number "6-1" in the candidate character table of FIG. 11 (a). "6-
Since a flag indicating that "1" is a side-by-side character is set, first, the first-ranked candidate character "1" is converted into a wildcard "N" and entered in the wildcard table of FIG. 13 (a). Write in the first place of the character number "6-1". At the same time, the cost "0" corresponding to the candidate character "1" is written in the corresponding place in the cost table shown in FIG. 13 (b).

【0051】次に,第2位を見ると候補文字「ノ」は違
うワイルドカード「ノ」に属するので,省図13(b)の
コストテーブルの第2位の場所にそれを書き込む。更
に,第3位を見ると候補文字「|」は横並び文字では存
在しないので省略する。第4位についても同様な処理を
行い,第5位を見ると候補文字「7」は第1位の「1」
と同じワイルドカード「N」に属するので,省略して図
13(b)のワイルドカードテーブルには何も書かない。
以下,同様の処理を全ての順位の候補文字に対して行
う。
Next, looking at the second place, the candidate character "no" belongs to a different wild card "no", so it is written in the second place of the cost table of FIG. 13B. Further, looking at the third place, the candidate character “|” does not exist as a side-by-side character, so it is omitted. Similar processing is performed for the fourth place, and when looking at the fifth place, the candidate character "7" is the first place "1".
Since it belongs to the same wildcard "N" as in the above, it is omitted and nothing is written in the wildcard table of FIG. 13 (b).
Hereinafter, the same processing is performed on the candidate characters of all ranks.

【0052】以上のステップ191の処理により,ステ
ップ190で得られた候補文字ラティスから,ワイルド
カードラティスが生成される。
Through the above processing of step 191, a wildcard lattice is generated from the candidate character lattice obtained in step 190.

【0053】ステップ192では,ステップ191で生
成したワイルドカードラティスから,単語照合を行うた
めのオートマトンを生成する。ステップ192の詳細を
図14を用いて説明する。
At step 192, an automaton for word matching is generated from the wild card lattice generated at step 191. Details of step 192 will be described with reference to FIG.

【0054】図14は辞書から単語を取り出し,オート
マトンを用いて住所表示番号の表記パターンの単語照合
を行う過程を示したものである。まず,オートマトン2
41について説明する。住所表示番号パターンを表す辞
書単語とワイルドカードラティスの照合を行うために,
図13で示すワイルドカードラティスから有限オートマ
トン241を生成する。そして,オートマトン241は
文字列として表した辞書単語を順次入力し,その単語の
平均コストがいくらになるかを計算する。
FIG. 14 shows a process of extracting a word from a dictionary and performing word matching of a notation pattern of an address display number using an automaton. First, the automaton 2
41 will be described. To match the dictionary word that represents the address display number pattern with the wildcard lattice,
A finite state automaton 241 is generated from the wild card lattice shown in FIG. Then, the automaton 241 sequentially inputs the dictionary words represented as a character string, and calculates what the average cost of the words is.

【0055】オートマトン241において丸印は状態を
示し,その中に書かれた数字は状態番号を示す。加え
て,状態と状態の間が単語の各記入文字位置に対応し,
状態間の線は遷移経路を示す。遷移経路上の左側の文字
は,ある状態でオートマトンにその文字が入力された時
に,その遷移経路を辿って次の状態に遷移することを示
す。また,遷移経路上で「other」は遷移経路に対応す
る文字として明示されたもの以外の全ての文字を表す。
遷移経路上の[ ]内の数字は,その経路を辿って遷移
した時に有するコストである。
In the automaton 241, a circle indicates a state, and a number written therein indicates a state number. In addition, between states corresponds to each written character position of the word,
Lines between states indicate transition paths. The character on the left side of the transition path indicates that when the character is input to the automaton in a certain state, the transition path is followed to transition to the next state. Further, "other" on the transition path represents all characters other than those explicitly specified as the characters corresponding to the transition path.
The number in brackets [] on the transition route is the cost of having a transition by following the route.

【0056】例として,オートマトン241を用いて,
単語「NNN−n」240が入力された時のコスト計算
を考える。まず,状態1から状態2に遷移するときに
「N」のコスト[0]が加算され,状態2から状態3に
遷移するときは「N」のコスト[2]が加算され,以下
同様に遷移が進んでいく。そして,単語の文字数分の遷
移が全て終わった後,積算されたコストを単語の文字数
で割ることでその単語の平均コスト242が得られる。
As an example, using the automaton 241,
Consider the cost calculation when the word "NNN-n" 240 is entered. First, the cost [0] of "N" is added when transitioning from state 1 to state 2, the cost [2] of "N" is added when transitioning from state 2 to state 3, and so on. Goes on. Then, after all the transitions of the number of characters of the word are completed, the integrated cost is divided by the number of characters of the word to obtain the average cost 242 of the word.

【0057】次に,図13のワイルドカードラティスか
らの有限オートマトン241の生成を説明する。まず,
図14のオートマトン241の状態1と状態2の間の遷
移経路を生成し,図13(a)のワイルドカードテーブル
の記入文字番号「6-1」の候補文字をそれぞれ割り当て
る。それと共に,候補文字に対応する図13(b)で示す
コストテーブルのコストを,同様に状態1と状態2の間
の遷移経路にそれぞれ割り当てる。次に,明示されたも
の以外の全ての文字を表す遷移経路として「other」を
生成し,さらにそのコストを15とする。以下,同様に
状態と遷移経路をワイルドカードラティスから次々に生
成していく。ここで,遷移経路のコストはコストは必ず
しも上記の値にする必要はなく,任意の数字でよい。
Next, the generation of the finite state automaton 241 from the wild card lattice of FIG. 13 will be described. First,
A transition path between the state 1 and the state 2 of the automaton 241 of FIG. 14 is generated, and the candidate character of the entry character number “6-1” in the wildcard table of FIG. At the same time, the costs in the cost table shown in FIG. 13B corresponding to the candidate characters are similarly assigned to the transition paths between the states 1 and 2, respectively. Next, "other" is generated as a transition path that represents all characters other than the specified one, and the cost is set to 15. Similarly, states and transition paths are generated one after another from the wild card lattice. Here, the cost of the transition route does not necessarily have to be the above value, and may be an arbitrary number.

【0058】以上のステップ192の処理により,ワイ
ルドカードラティスからオートマトン241が生成され
る。
By the above processing of step 192, the automaton 241 is generated from the wild card lattice.

【0059】ステップ193では,ステップ192で生
成したオートマトン241と図1の表記パターン単語イ
ンデックス辞書114,表記パターン単語辞書115を
用いて,住所表示番号表記パターンのオートマトン照合
を行う。ステップ193の詳細を図13,図14,図1
5,図16を用いて説明する。図15はオートマトン照
合処理の流れを示したPADである。図16は住所表示
番号単語辞書,住所表示番号単語インデックス辞書の構
成を示した図である。
In step 193, the automaton 241 generated in step 192 and the notation pattern word index dictionary 114 and the notation pattern word dictionary 115 shown in FIG. Details of step 193 are shown in FIGS.
5, it demonstrates using FIG. FIG. 15 is a PAD showing the flow of the automaton matching process. FIG. 16 is a diagram showing the configurations of the address display number word dictionary and the address display number word index dictionary.

【0060】まず,図16の辞書の構成を説明する。表
記パターン単語辞書115はワイルドカードを用いて丁
目,街区,住居表示番号の表記パターンを表した単語,
およびその検索情報や属性を格納した辞書である。丁
目,街区,住居表示番号の表記パターンを表した単語と
しては,例えば「NNN−n」,「NNNのn」等が格
納されている。表記パターン単語インデックス辞書11
4は,照合を行うために必要な単語を表記パターン単語
辞書115から選択的に検索するためのインデックスを
格納した辞書である。インデックスは,辞書単語の第1
文字目,第2文字目の文字を使用する。
First, the structure of the dictionary shown in FIG. 16 will be described. The notation pattern word dictionary 115 is a word that represents notation patterns of chome, block, and house display number using wild cards,
And a dictionary that stores the search information and attributes thereof. For example, “NNN-n”, “NNN's n”, etc. are stored as the words representing the notation patterns of chome, block, and house display number. Notation pattern word index dictionary 11
Reference numeral 4 is a dictionary that stores an index for selectively retrieving words necessary for matching from the writing pattern word dictionary 115. The index is the first of the dictionary words
The first and second characters are used.

【0061】表記パターン単語辞書115は,住所表示
番号の表記パターンを表す単語278,単語の第2文字
目が同一の文字を持つ単語間の相対アドレス279,縦
横書きを示すフラグ280からなる。
The notation pattern word dictionary 115 includes a word 278 representing an address display number notation pattern, a relative address 279 between words having the same second character as the second character, and a flag 280 indicating vertical and horizontal writing.

【0062】縦横書きを示すフラグ280は,街区表記
を表す単語が横書きに属するのであれば1,縦書きに属
するのであれば2,縦横両方に属するのであれば3とい
う数字が格納されている。
The flag 280 indicating vertical / horizontal writing stores a number of 1 if the word representing the block notation belongs to horizontal writing, 2 if it belongs to vertical writing, and 3 if it belongs to both vertical and horizontal writing.

【0063】表記パターン単語インデックス辞書114
は,1文字目インデックステーブル270,2文字目イ
ンデックステーブル274の二つのテーブルからなる。
1文字目インデックステーブル270は,辞書単語の第
1文字目の文字番号を格納したテーブル271,同一の
1文字目を持つ単語の数272,表記パターン単語辞書
115へのポインタテーブル273からなる。2文字目
インデックステーブル274は,同様に辞書単語の2文
字目の文字番号を格納したテーブル275,同一の2文
字目を持つ単語の数276,表記パターン単語辞書11
5へのポインタテーブル277からなる。
Notation pattern word index dictionary 114
Is composed of two tables, a first character index table 270 and a second character index table 274.
The first character index table 270 includes a table 271 in which the first character number of a dictionary word is stored, the number of words 272 having the same first character 272, and a pointer table 273 to the notation pattern word dictionary 115. The second character index table 274 similarly stores a table 275 storing the second character number of the dictionary word, the number of words 276 having the same second character 276, the notation pattern word dictionary 11
5 pointer table 277.

【0064】次に,表記パターン単語インデックス辞書
114を用いて,表記パターン単語辞書115の単語を
検索する時の処理の流れを説明する。実線で表された矢
印は1文字目インデックステーブル270を用いて,第
1文字目が同一の文字である単語を検索するときの検索
の流れを示す。点線で表された矢印は2文字目インデッ
クステーブル274を用いて,2文字目が同一の文字で
ある単語を検索するときの検索の流れを示す。
Next, the flow of processing when searching for words in the notation pattern word dictionary 115 using the notation pattern word index dictionary 114 will be described. The arrow indicated by a solid line indicates the flow of search when searching for a word in which the first character is the same character using the first character index table 270. The arrow indicated by the dotted line shows the flow of search when searching for a word in which the second character is the same character using the second character index table 274.

【0065】例えば,単語の1文字目が「N」である単
語を辞書から検索する場合は,1文字目インデックステ
ーブル270の第1文字目が同一の文字である単語の数
m1,および「N」のポインタP1(1)を参照する。ポイン
タP1(1)には,住所表示番号単語辞書の中で1文字目が
「N」で始まる単語の最初のポインタが格納されている
ので,その単語を参照する。単語辞書の中では1文字目
が同じ文字の単語は連続して並べてあるので,「N」で
始まる最初の単語を見つけると,以下はポインタをイン
クリメントするだけで,次々に単語を検索することがで
きる。そして,m1回検索を行うと「N」で始まる単語の
終わりになるので,そこで単語の検索を終了する。
For example, when retrieving a word in which the first character of the word is "N" from the dictionary, the number of words in which the first character of the first character index table 270 is the same character
The pointer P1 (1) of m1 and "N" is referred to. Since the pointer P1 (1) stores the first pointer of the word whose first character starts with "N" in the address display number word dictionary, that word is referred to. In the word dictionary, words with the same first character are arranged consecutively, so if you find the first word starting with "N", you can search words one after another by simply incrementing the pointer. it can. Then, when the search is performed m1 times, the end of the word starting with "N" is reached, and the word search is terminated at that point.

【0066】単語の2文字目をインデックスとして検索
する場合も同様である。例えば,単語の2文字目が
「丁」である単語を辞書から検索する場合は,2文字目
インデックステーブル224の第1文字目が同一の文字
である単語の数q1,および「丁」のポインタP2(1)を参
照する。ポインタP2(1)には,表記パターン単語辞書の
中で2文字目が「丁」の単語のポインタが格納されてい
るのでその単語を参照する。その後,単語の第2文字目
が同一の文字を持つ単語間の相対アドレス279を参照
してポインタをシフトすることで,第2文字目が同じ
「丁」の単語を検索することができる。そして,q1回検
索を行うと2文字目が同じ「丁」の単語の終わりになる
ので,そこで単語の検索を終了する。
The same applies when searching for the second character of a word as an index. For example, when searching for a word in which the second character of the word is "Ding" from the dictionary, the number of words q1 in which the first character of the second character index table 224 is the same character, and a pointer of "Ding" See P2 (1). The pointer P2 (1) stores the pointer of the word whose second character is "Ding" in the writing pattern word dictionary, so that the word is referred to. After that, by referring to the relative address 279 between words having the same second character of the word and shifting the pointer, it is possible to search for the word "Ding" having the same second character. Then, when the search is performed q1 times, the second character ends at the end of the word with the same "ding", so the word search ends there.

【0067】ここで,図2のステップ122の文字切り
出し・文字認識で,住所が縦書きか横書きかが分かって
いる場合は,縦横書きを示すフラグ280を参照するこ
とで,検索した単語の中から該当する単語を絞り込んで
取り出すことができる。
Here, when it is known whether the address is written vertically or horizontally in the character segmentation / character recognition in step 122 of FIG. 2, by referring to the flag 280 indicating vertical / horizontal writing, among the searched words You can narrow down and extract the corresponding words from.

【0068】次に,ステップ193の具体的処理内容を
図15の処理フロー,および図13,図14,図16を
用いて説明する。
Next, the specific processing contents of step 193 will be described using the processing flow of FIG. 15 and FIGS. 13, 14 and 16.

【0069】ステップ250では,照合を行おうとする
住所に対して,図2のステップ122で得られた住所の
縦横書きを表すフラグをセットする。
In step 250, a flag representing vertical and horizontal writing of the address obtained in step 122 of FIG. 2 is set for the address to be collated.

【0070】ステップ252では,図13(a)のワイル
ドカードテーブルにおける記入文字番号「6-1」の第1
位の候補文字を取り出し,図16の1文字目インデック
ステーブル270を参照して,辞書単語数272,およ
び単語辞書のポインタ273を取得する。
At step 252, the first entry of the entry character number "6-1" in the wild card table of FIG. 13 (a).
The candidate character of rank is taken out, and the number of dictionary words 272 and the pointer 273 of the word dictionary are acquired by referring to the first character index table 270 of FIG.

【0071】ステップ254では,ポインタが指してい
る先の単語を検索し,この単語がステップ250でセッ
トした縦横書きフラグと矛盾がないかを辞書の該当する
テーブル280を参照してチェックする。もし矛盾がな
ければステップ255に進む。
In step 254, the word pointed to by the pointer is searched, and it is checked by referring to the corresponding table 280 in the dictionary whether this word is consistent with the vertical / horizontal writing flag set in step 250. If there is no contradiction, go to step 255.

【0072】ステップ255では,検索した単語を図1
4のオートマトン241に入力して,状態を遷移させな
がら平均コストを計算する。
In step 255, the retrieved word is searched for in FIG.
4 is input to the automaton 241 and the average cost is calculated while transitioning the states.

【0073】ステップ253では,ステップ254から
ステップ255の処理をステップ252で求めた辞書単
語の数だけ繰り返す。
In step 253, the processes of steps 254 to 255 are repeated for the number of dictionary words obtained in step 252.

【0074】ステップ251では,図13(a)における
記入文字番地「6-1」の次順位の候補文字を取り出し,
ステップ252からステップ255の処理を記入文字番
地「6-1」の候補文字数回繰り返す。
At step 251, the candidate character of the next rank of the entered character address "6-1" in FIG. 13 (a) is taken out,
The processing from step 252 to step 255 is repeated several times as many as the candidate characters of the entered character address "6-1".

【0075】ステップ257では,図13(a)のワイル
ドカードテーブルの記入文字番号「6-2」の第1位の候
補文字を取り出し,図16の2文字目インデックステー
ブル274を参照して,辞書単語数276,および単語
辞書のポインタ277を取得する。
In step 257, the first candidate character of the entry character number "6-2" in the wild card table of FIG. 13 (a) is taken out and the dictionary is referred to by the second character index table 274 of FIG. The number of words 276 and the pointer 277 of the word dictionary are acquired.

【0076】ステップ259では,ポインタが指してい
る先の単語を検索し,この単語がステップ250でセッ
トした縦横書きフラグと矛盾がないかを辞書の該当する
テーブルを参照してチェックする。もし矛盾がなければ
ステップ260に進む。
In step 259, the word pointed to by the pointer is searched, and it is checked by referring to the corresponding table in the dictionary whether this word is consistent with the vertical / horizontal writing flag set in step 250. If there is no contradiction, go to step 260.

【0077】ステップ260では,検索した単語を図1
4のオートマトン241に入力して,状態を遷移させな
がら平均コストを計算する。
In step 260, the retrieved word is searched for in FIG.
4 is input to the automaton 241 and the average cost is calculated while transitioning the states.

【0078】ステップ258では,ステップ259から
ステップ260の処理をステップ257で求めた辞書単
語の数だけ繰り返す。
In step 258, the processes of steps 259 to 260 are repeated by the number of dictionary words obtained in step 257.

【0079】ステップ256では,図13(a)の記入文
字番地「6-2」の次順位の候補文字を取り出し,ステッ
プ257からステップ260の処理を記入文字番地「6-
2」の候補文字数回繰り返す。
At step 256, the candidate character of the next rank of the entered character address "6-2" of FIG. 13A is taken out, and the processing from step 257 to step 260 is performed.
Repeat “2” candidate character several times.

【0080】ステップ261では,ステップ250から
ステップ260の処理で求めた単語,および,そのコス
トを昇冪の順に並べ変える。
In step 261, the words obtained by the processing of steps 250 to 260 and the costs thereof are rearranged in the order of increasing and decreasing.

【0081】ステップ262では,ステップ261で並
べ変えたコストの小さい単語の上位L(L>1)個を選
択する。
In step 262, the upper L (L> 1) words with the low cost rearranged in step 261 are selected.

【0082】以上のステップ250からステップ262
の処理により,図9におけるステップ193のオートマ
トン文字列照合が行われ,平均コストの小さい上位L個
の単語およびそのコストが得られる。
The above steps 250 to 262
By the processing described above, the automaton character string collation of step 193 in FIG. 9 is performed, and the upper L words having a small average cost and the costs thereof are obtained.

【0083】ステップ194では,ステップ193で得
られた上位L個のワイルドカードで表された単語につい
て,「N」,「n」,「k」の数字を表すワイルドカー
ドを元の数字に復元して,候補を生成する。ここではL
=1として,図14の単語「NNN−n」240を数字
に復元した結果を図17に示す。数字復元の処理は,ま
ず図11(a)に示す候補文字テーブルと単語「NNN−
n」240の位置合わせを行う。その後,数字「N」に
対応する場所の候補数字を図11(a)候補文字テーブル
から取り出して,実際の丁目や街区を生成する。また,
図11(b)のコストテーブルから数字に対応するコスト
取り出して,復元した表記パターン単語に対するコスト
を積算していく。
At step 194, the wild cards representing the numbers "N", "n", and "k" of the words represented by the top L wild cards obtained at step 193 are restored to the original numbers. To generate candidates. Here L
FIG. 17 shows a result of restoring the word “NNN-n” 240 of FIG. 14 into a numeral when = 1. In the process of digit restoration, the candidate character table and the word “NNN-” shown in FIG.
n ”240 is aligned. After that, the candidate numeral of the place corresponding to the numeral "N" is taken out from the candidate character table of FIG. 11 (a), and the actual chome and block are generated. Also,
The costs corresponding to the numbers are extracted from the cost table of FIG. 11B, and the costs for the restored notation pattern words are added up.

【0084】ステップ195では,ステップ194で数
字に復元した候補からコストの小さいP(P>1)個の
候補を住所表示番号照合結果として選択する。P=2と
すれば,「111|2」,「171|2」が住所表示番
号照合結果として出力される。
In step 195, P (P> 1) candidates having a small cost are selected from the candidates restored to numbers in step 194 as the address display number collation result. If P = 2, “111 | 2” and “171 | 2” are output as the address display number collation result.

【0085】以上のステップ190からステップ195
までの処理により,図2のステップ125住所表示番号
照合が行われ,照合結果として住所表示番号の候補が得
られる。
Steps 190 to 195 above
By the processing up to step 125, the address display number collation in FIG. 2 is performed, and the candidate of the address display number is obtained as the collation result.

【0086】ステップ126では,ステップ123の町
域照合で得られた町域候補「秋川市高田」と,ステップ
125の住所表示番号照合で得られた住所表示番号の候
補「111|2」,「171|2」をつないで住所候補
を生成する。この例では,「秋川市高田111|2」,
「秋川市高田171|2」が得られる。さらに,この住
所情報を用いて図1における区分部104を制御する制
御情報を生成する。
At step 126, the town area candidate “Takada, Akikawa-shi” obtained by the town area collation at step 123 and the address display number candidates “111 | 2”, “at the address display number collation at step 125. 171 | 2 ”is connected to generate an address candidate. In this example, “111 | 2, Takada, Akigawa-shi”,
"171 | 2 Takada, Akigawa-shi" is obtained. Further, using this address information, control information for controlling the sorting unit 104 in FIG. 1 is generated.

【0087】[0087]

【発明の効果】本発明は,次の3つの効果がある。第一
は,縦書き中の横並び文字であるという情報を有効に用
いて,様々な表記パターンの住所表示番号を正しく認識
できることである。本発明では,文字パターンを切出し
識別した結果の候補文字ラティスに対して,同じ算用数
字であっても縦書きの算用数字と,縦書きで現われる横
並びの算用数字をそれぞれ別のワイルドカードを割り当
てて照合を行う。このため,縦書き中の横並び文字があ
ることを含めた表記パターンを候補文字ラティスの中か
ら取り出すことができる。その結果,横並び文字は算用
数字しかありえない,または横並び文字の直前直後は
「|」などの区切り文字しかありえない,などの複雑な
ルールをプログラムに組み込まなくても,従来の単語照
合の枠組みの延長で高精度な住所表示番号の認識が可能
になる。
The present invention has the following three effects. First, it is possible to correctly recognize the address display numbers of various writing patterns by effectively using the information that the characters are horizontally arranged characters in vertical writing. According to the present invention, for a candidate character lattice that is the result of extracting and identifying a character pattern, even if the same arithmetic number is used, vertical arithmetic numbers and horizontal arithmetic numbers that appear vertically are different wildcards. Is assigned for verification. Therefore, it is possible to extract from the candidate character lattice a notation pattern that includes the horizontally aligned characters in vertical writing. As a result, it is possible to extend the conventional framework for word matching without incorporating complicated rules such as side-by-side characters that can be only arithmetic digits, or only delimiters such as "|" immediately before and after the side-by-side characters. It is possible to recognize the address display number with high accuracy.

【0088】第二は,住所表示番号の表記パターンを詳
細に調べることができるにも関わらず,高速に処理され
ることである。まず,辞書から単語を検索するときに,
各文字パターンに対応する候補文字群をインデックスと
して検索するために,照合を行う単語数を減らすことが
できる。さらに,各単語に縦横書きに対応する属性を持
たせいているので,予め認識しようとする住所表示番号
が縦横書きのどちらであるかが分かっていれば,不必要
な単語の照合を防ぐことができ,高速な処理が可能とな
る。
The second is that the notation pattern of the address display number can be examined in detail, but it is processed at high speed. First, when searching a word from a dictionary,
Since the candidate character group corresponding to each character pattern is searched as an index, the number of words to be matched can be reduced. Furthermore, since each word has an attribute corresponding to vertical and horizontal writing, if it is known in advance whether the address display number to be recognized is vertical or horizontal writing, it is possible to prevent unnecessary word collation. This enables high speed processing.

【0089】第三は,プログラムでルールを組み込む方
式ではなく辞書照合方式であるために,新しい表記パタ
ーンが発生した場合は簡単に辞書に登録することがで
き,メンテナンスが容易なことである。
Thirdly, since a dictionary collation method is used instead of a rule incorporation method by a program, when a new notation pattern occurs, it can be easily registered in the dictionary and maintenance is easy.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明における第1の実施例の装置の全体構成
図である。
FIG. 1 is an overall configuration diagram of a device according to a first embodiment of the present invention.

【図2】本発明における第1の実施例の装置の処理全体
の流れを示す図である。
FIG. 2 is a diagram showing the flow of the entire processing of the apparatus of the first embodiment of the present invention.

【図3】縦書き住所の入力画像の例を示す図である。FIG. 3 is a diagram showing an example of an input image of a vertically written address.

【図4】図3の入力画像に対して文字切出し候補をネッ
トワークの形で表現した図である。
FIG. 4 is a diagram in which character cutout candidates are expressed in the form of a network for the input image of FIG.

【図5】図4のネットワークで横並び文字を検出した例
を示す図である。
5 is a diagram showing an example in which horizontally aligned characters are detected in the network of FIG.

【図6】図5で検出された横並び文字に対し,切出し候
補を追加した例を示す図である。
FIG. 6 is a diagram showing an example in which cutout candidates are added to the horizontally arranged characters detected in FIG. 5;

【図7】町域の文字切出し識別の処理の流れを示すPA
Dである。
FIG. 7 is a PA showing a flow of processing for character cutout identification of a town area.
It is D.

【図8】縦書きの中に横並び文字を含む住所表示番号の
文字切出し識別の処理の流れを示す図である。
FIG. 8 is a diagram showing a flow of processing for identifying character cut-out of an address display number including horizontally arranged characters in vertical writing.

【図9】住所表示番号照合を行う処理の流れを示す図で
ある。
FIG. 9 is a diagram showing a flow of processing for performing address display number matching.

【図10】町域照合を行うための候補文字ラティスの例
を示す図である。
FIG. 10 is a diagram showing an example of a candidate character lattice for performing town area matching.

【図11】住所表示番号領域の候補文字ラティスの例を
示す図である。
FIG. 11 is a diagram showing an example of a candidate character lattice of an address display number area.

【図12】候補文字ラティスから住所表示番号照合を行
うためのワイルドカードラティスを生成する変換テーブ
ルを示す図である。
FIG. 12 is a diagram showing a conversion table for generating a wildcard lattice for performing address display number matching from candidate character lattices.

【図13】図12の変換テーブルを用いて,図6の候補
文字ラティスから生成したワイルドカードラティスの例
を示す図である。
13 is a diagram showing an example of a wildcard lattice generated from the candidate character lattice of FIG. 6 using the conversion table of FIG.

【図14】オートマトン単語照合の処理概要を示す図で
ある。
FIG. 14 is a diagram showing a process outline of automaton word matching.

【図15】オートマトン単語照合の処理の流れを示すP
AD図である。
FIG. 15 is a flowchart P showing a flow of processing of automaton word matching.
It is an AD diagram.

【図16】住所表示番号単語インデックス辞書,住所表
示番号単語辞書の構成を示す図である。
FIG. 16 is a diagram showing configurations of an address display number word index dictionary and an address display number word dictionary.

【図17】照合した結果の住所表示番号単語から数字部
分を復元した住所表示番号の候補の例を示す図である。
FIG. 17 is a diagram showing an example of address display number candidates in which a numerical portion is restored from the address display number word as a result of collation.

【符号の説明】[Explanation of symbols]

100…郵便物,101…郵便物供給部,102…画像
入力部,103…遅延搬送部,104…区分部,105
…区分棚,106…住所認識部,107…制御部,10
8…画像処理部,109…文字認識部,110…町域照
合部,111…住所表示番号照合部,112…町域単語
辞書,113…住所表示番号表記パターン辞書,114
…表記パターン単語インデックス辞書,115…表記パ
ターン単語辞書。
100 ... Mail, 101 ... Mail supply section, 102 ... Image input section, 103 ... Delayed transport section, 104 ... Sorting section, 105
... Division shelf, 106 ... Address recognition unit, 107 ... Control unit, 10
8 ... Image processing unit, 109 ... Character recognition unit, 110 ... Town area collation unit, 111 ... Address display number collation unit, 112 ... Town area word dictionary, 113 ... Address display number notation pattern dictionary, 114
... notation pattern word index dictionary, 115 ... notation pattern word dictionary.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 丸川 勝美 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 影広 達彦 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 酒匂 裕 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 嶋 好博 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 渡辺 成 愛知県尾張旭市晴丘町池上1番地 株式会 社日立製作所オフィスシステム事業部内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Katsumi Marukawa, Katsumi Marukawa, 1-280, Higashi Koikeku, Kokubunji, Tokyo, Central Research Laboratory, Hitachi, Ltd. (72) Tatsuhiko Kagehiro, 1-280, Higashi Koikeku, Kokubunji, Tokyo Hitachi, Ltd. Inside the Central Research Laboratory (72) Inventor Hiroshi Sako 1-280 Higashi Koikekubo, Kokubunji City, Tokyo Inside Hitachi Central Research Center (72) Inventor Yoshihiro Shima 1-280 Higashi Koikeku, Tokyo Kokubunji City Central Research, Hitachi, Ltd. In-house (72) Inventor Shigeru Watanabe 1 Ikegami, Haruoka-cho, Owariasahi-shi, Aichi Hitachi Ltd. Office Systems Division

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】郵便物上の文字情報を検出して,町域情報
と住所表示番号情報からなる住所情報を読み取る住所読
み取り装置において,郵便物上の画像を電気信号に変換
して入力する画像入力手段と,入力された画像から文字
情報を切り出して識別し,切り出された各文字パターン
に対して識別候補文字群を出力する文字切出識別手段で
あって,縦書き住所情報から横並び文字を検出して文字
情報を再度切り出して識別し,切り出された各文字パタ
ーンに対して識別候補文字群を出力する文字切出識別手
段と,該文字切出識別手段から出力された認識候補文字
群と,町域情報を格納した町域辞書と照合することによ
り町域を認識する町域照合手段と,該町域照合手段の認
識結果に基づき,住所表示番号領域の先頭を検出する住
所表示番号領域検出手段と,該住所表示番号領域検出手
段からの出力に基づいて決定された住所表示番号領域の
先頭以降の各文字パターンに対して,文字切出識別手段
の出力結果として,縦書き住所情報から横並び文字とし
て検出された各文字パターンに対する識別結果の候補文
字群中の数字を,縦書きと縦書き中の横並び文字に分
け,それぞれを別々に任意の数字を表すワイルドカード
で置き換えた候補文字群に変換するワイルドカード変換
手段と,上記ワイルドカードで表現された住所表示番号
の様々な表記パターンを単語として保持する住所表示番
号表記パターン辞書と,ワイルドカード変換手段の出力
結果と住所表示番号表記パターン辞書の単語とをオート
マトンを用いて照合し,住所表示番号の表記パターンを
認識する住所表示番号照合手段と,住所表示番号照合手
段の出力結果と,文字認識手段から出力される候補文字
群とを照らし合せ,ワイルドカードで置き換えられた候
補文字群中の数字を復元し,住所表示番号の候補を出力
する数字復元手段と,を有することを特徴とする住所読
み取り装置。
1. An image input by converting an image on a mail into an electric signal in an address reading device that detects character information on the mail and reads address information including town area information and address display number information. Input means and character cut-out identification means for extracting and identifying character information from the input image and outputting an identification candidate character group for each cut-out character pattern. A character cut-out identifying means for detecting and re-cutting out character information for identification, outputting an identification candidate character group for each cut-out character pattern; and a recognition candidate character group output from the character cut-out identifying means. , A town area collating means for recognizing a town area by collating with a town area dictionary storing town area information, and an address display number area for detecting the head of the address display number area based on the recognition result of the town area collating means Inspection Means and each character pattern after the head of the address display number area determined based on the output from the address display number area detecting means, as the output result of the character cut-out identifying means, horizontal arrangement from the vertically written address information is performed. The numbers in the candidate character group of the identification result for each character pattern detected as a character are divided into vertical writing and horizontally aligned characters in vertical writing, and each is replaced with a wild card that represents an arbitrary number. A wildcard conversion means for converting, an address display number notation pattern dictionary that holds various notation patterns of the address display number expressed by the above wildcard as words, an output result of the wildcard conversion means, and an address display number notation pattern dictionary The address display number matching means for recognizing the notation pattern of the address display number by matching the word with The output result of the display number collating means is compared with the candidate character group output from the character recognizing means, the numbers in the candidate character group replaced by the wildcard are restored, and the number restoration for outputting the address display number candidates is performed. An address reading device comprising means.
【請求項2】請求項1記載の住所読み取り装置におい
て,郵便物上の住所情報を表す文字群が縦書きである
か,横書きであるかを検出する文字方向検出手段と,各
表記パターンを表す単語に,縦書きで現われる表記パタ
ーンか横書きで現われる表記パターンかに関する属性を
持たせた住所表示番号表記パターン辞書と,ワイルドカ
ードで置き換えた任意の位置にある各文字パターンの候
補文字群に対し,その候補文字群の文字コードをインデ
ックスとして,住居表示番号表記パターン辞書から単語
を検索する単語検索手段と,文字方向検出手段の出力に
基づき,単語検索手段によって検索された単語の中か
ら,縦書き横書きのそれぞれの属性が一致する単語のみ
を読み出す単語選択手段と,を有することを特徴とする
住所読み取り装置。
2. The address reading device according to claim 1, wherein the character direction detecting means for detecting whether the character group representing the address information on the mail is vertically written or horizontally written, and each notation pattern. For the address display number notation pattern dictionary in which the word has the attribute regarding whether the notation pattern appears in vertical writing or the writing pattern that appears in horizontal writing, and the candidate character group of each character pattern in any position replaced with a wildcard, Using the character code of the candidate character group as an index, word writing means for searching words from the house display number notation pattern dictionary and vertical writing from the words searched by the word searching means based on the output of the character direction detecting means An address reading device, comprising: a word selecting unit that reads out only words having the same horizontal writing attribute.
JP8003609A 1996-01-12 1996-01-12 Address reader Pending JPH09190507A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8003609A JPH09190507A (en) 1996-01-12 1996-01-12 Address reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8003609A JPH09190507A (en) 1996-01-12 1996-01-12 Address reader

Publications (1)

Publication Number Publication Date
JPH09190507A true JPH09190507A (en) 1997-07-22

Family

ID=11562242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8003609A Pending JPH09190507A (en) 1996-01-12 1996-01-12 Address reader

Country Status (1)

Country Link
JP (1) JPH09190507A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021883A (en) * 2012-07-23 2014-02-03 Fuji Xerox Co Ltd Information processing device and information processing program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021883A (en) * 2012-07-23 2014-02-03 Fuji Xerox Co Ltd Information processing device and information processing program

Similar Documents

Publication Publication Date Title
JP2734386B2 (en) String reader
US6327373B1 (en) Mail address reading apparatus and mail sorting apparatus
JP3639126B2 (en) Address recognition device and address recognition method
US7415171B2 (en) Multigraph optical character reader enhancement systems and methods
KR100487386B1 (en) Retrieval of cursive chinese handwritten annotations based on radical model
US20060045340A1 (en) Character recognition apparatus and character recognition method
JP2004533069A (en) Method and apparatus for automatically reading an address in more than one language
JP3201207B2 (en) Address reading apparatus and method
KR100571080B1 (en) Document Recognizer and Mail Separator
JPH11232296A (en) Document filing system and document filing method
JPH09190507A (en) Address reader
JP3162552B2 (en) Mail address recognition device and address recognition method
JP2009163689A (en) Address recognition method and device, and postal address sorter
JP3712831B2 (en) Document understanding device and postal sorting machine
JPH09245120A (en) Character segmenting method
JP2991594B2 (en) Mail address reading device
JP2996823B2 (en) Character recognition device
KR200343603Y1 (en) Apparatus of generating infiormation of tributary for delevery and invoice thereof
JPS63282586A (en) Character recognition device
JPH10174935A (en) Address reading apparatus and character data reading apparatus
JPH11300288A (en) Document recognizing and interpreting device and mail sorting machine
JPH05324899A (en) Recognizing device for address written on mail
JP2001043318A (en) Address reader
JPH05242303A (en) Address reader
JPH1196307A (en) Word recognizing device