JP2991594B2 - Mail address reading device - Google Patents

Mail address reading device

Info

Publication number
JP2991594B2
JP2991594B2 JP5215848A JP21584893A JP2991594B2 JP 2991594 B2 JP2991594 B2 JP 2991594B2 JP 5215848 A JP5215848 A JP 5215848A JP 21584893 A JP21584893 A JP 21584893A JP 2991594 B2 JP2991594 B2 JP 2991594B2
Authority
JP
Japan
Prior art keywords
address
recipient name
character
address information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5215848A
Other languages
Japanese (ja)
Other versions
JPH0765107A (en
Inventor
正人 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5215848A priority Critical patent/JP2991594B2/en
Publication of JPH0765107A publication Critical patent/JPH0765107A/en
Application granted granted Critical
Publication of JP2991594B2 publication Critical patent/JP2991594B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、たとえば、郵便物宛名
自動読取区分機などの郵便物処理装置において、郵便物
上に記載された宛名情報を光学的に読取る郵便物の宛名
読取装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a mail address reading apparatus for optically reading address information written on a mail in a mail processing apparatus such as a mail address automatic reading / sorting machine.

【0002】[0002]

【従来の技術】従来、たとえば、郵便物宛名自動読取区
分機における宛名読取装置は、郵便物上の画像情報を分
析し、宛名画像の検出、文字行の切出し、文字の切出し
を行ない、各切出し文字を認識した後、住所単語辞書と
の照合で、都道府県名から町村名までの町名情報を階層
的に認識する。そして、その後に続く街区情報としての
丁目、番地の記載数字は、単語照合が基本的に不可能で
あることから、文字認識結果を直接あてて郵便物の宛名
区分を行なっている。
2. Description of the Related Art Conventionally, for example, an address reading apparatus in a mail address automatic reading / sorting machine analyzes image information on a mail, detects an address image, cuts out a character line, and cuts out a character. After recognizing the characters, the name of the town from the name of the prefecture to the name of the town or village is hierarchically recognized by comparing with the address word dictionary. In addition, since the word collation as the block information following the block information is basically impossible for word collation, the character recognition result is directly applied to perform the mail address classification.

【0003】また、宛名情報が仮に正しく認識できなく
ても、受取人の限定大口名を認識することでの区分も行
なわれている。一方、汎用の文字読取装置による加入申
込などの住所、氏名の読取りは、既に決められた位置の
記入枠を目安に文字行および文字の切出しを行ない、そ
の切出し文字を認識した後、上記同様に単語照合で記載
住所を認識する。さらに、類似単語(類似文字)との区
別を明確化するため、ふり仮名も記載して、その漢字と
仮名の両者の認識結果を編集して住所および氏名を確定
している。
[0003] Even if address information cannot be correctly recognized, classification is performed by recognizing a limited large name of a recipient. On the other hand, when reading the address and name of a subscription application using a general-purpose character reading device, character lines and characters are cut out using the entry frame at a predetermined position as a guide, and after recognizing the cut-out characters, Recognize written addresses by word matching. Furthermore, in order to clarify the distinction from a similar word (similar character), a furigana is also described, and the recognition result of both the kanji and the kana is edited to determine the address and the name.

【0004】[0004]

【発明が解決しようとする課題】ところが、従来の宛名
読取装置では、単語照合が可能な都道府県名から町村名
は階層的に住所認識することで、町村名までの町名情報
は、たとえその一部の文字認識に誤読文字、リジェクト
文字があっても単語として回復できるが、町名情報の後
に続く街区情報である丁目、番地を示す数字のリジェク
トは回復の余地が少なく、数字認識の結果如何で住所情
報の確定が左右されてしまうという問題があった。
However, in the conventional address reading device, the name of the town and the name of the village are hierarchically recognized from the name of the prefecture and the name of the town and village where word matching is possible. Even if there are misread characters or rejected characters in the character recognition of the part, it can be recovered as a word, but the rejection of the number indicating the street and address following the street name information has little room for recovery, depending on the result of the digit recognition. There is a problem that the determination of address information is affected.

【0005】そこで、本発明は、住所情報の一部分に認
識不能文字があっても、高精度に住所情報を一意に確定
でき、住所認識率をより一層向上し得るとともに、受取
人名認識の速度向上と認識率の向上にも寄与する郵便物
の宛名読取装置を提供することを目的とする。
Accordingly, the present invention can uniquely determine address information with high accuracy even if a part of the address information contains unrecognizable characters, further improve the address recognition rate, and improve the speed of recipient name recognition. It is an object of the present invention to provide a mail address reading device that contributes to the improvement of the recognition rate.

【0006】[0006]

【課題を解決するための手段】本発明の郵便物の宛名読
取装置は、郵便物上の画像情報を電気信号に変換して入
力する画像入力手段と、この画像入力手段で入力された
画像情報から、前記郵便物上の住所情報と受取人名とか
らなる宛名情報が記載されている宛名領域を検出する宛
名領域検出手段と、この宛名領域検出手段で検出された
宛名領域に対して文字認識を行なうことにより住所情報
を認識する住所認識手段と、この住所認識手段において
住所情報の一部分が一意に確定できないとき、認識でき
た住所情報に基づき、あらかじめ住所情報と対応させて
受取人名を記憶している受取人名辞書の内容を選択する
ことにより、受取人名を認識する受取人名認識手段と、
前記住所認識手段の認識結果と前記受取人名認識手段の
認識結果とに基づき住所情報を一意に確定する住所確定
手段とを具備している。
According to the present invention, there is provided an apparatus for reading a postal address, comprising: image input means for converting image information on a postal matter into an electric signal and inputting the same; and image information input by the image input means. Address area detecting means for detecting an address area in which address information including address information and a recipient name on the mail is described, and performing character recognition on the address area detected by the address area detecting means. Address recognition means for recognizing address information by performing, and when a part of the address information cannot be uniquely determined by the address recognition means, based on the recognized address information, a recipient name is stored in advance in correspondence with the address information. A recipient name recognizing means for recognizing the recipient name by selecting the contents of the recipient name dictionary,
Address determination means for uniquely determining address information based on the recognition result of the address recognition means and the recognition result of the recipient name recognition means.

【0007】また、本発明の郵便物の宛名読取装置は、
郵便物上の画像情報を電気信号に変換して入力する画像
入力手段と、この画像入力手段で入力された画像情報か
ら、前記郵便物上の住所情報と受取人名とからなる宛名
情報が記載されている宛名領域を検出する宛名領域検出
手段と、この宛名領域検出手段で検出された宛名領域に
対して文字認識を行なうことにより住所情報を認識する
住所認識手段と、この住所認識手段において住所情報の
一部分が一意に確定できないとき、認識できた住所情報
に基づき、あらかじめ住所情報と対応させて受取人名の
文字を記憶している受取人名文字辞書の内容を選択する
ことにより、受取人名の各文字を認識する受取人名文字
認識手段と、前記住所認識手段において住所情報の一部
分が一意に確定できないとき、認識できた住所情報に基
づき、あらかじめ住所情報と対応させて受取人名の単語
を記憶している受取人名単語辞書の内容を選択する受取
人名単語選択手段と、前記受取人名文字認識手段の認識
結果と前記受取人名単語選択手段の選択結果とに基づき
受取人名を一意に確定する受取人名確定手段と、前記住
所認識手段の認識結果と前記受取人名確定手段の確定結
果とに基づき住所情報を一意に確定する住所確定手段と
を具備している。
Further, the mail address reading device of the present invention comprises:
Image input means for converting image information on a mail into an electric signal and inputting the same, and address information including address information and a recipient name on the mail are described from the image information input by the image input means. Address area detecting means for detecting an address area, address recognition means for recognizing address information by performing character recognition on the address area detected by the address area detecting means, and address information in the address recognizing means. If a part of the recipient name cannot be uniquely determined, based on the recognized address information, by selecting the contents of the recipient name character dictionary that stores the recipient name characters in advance in correspondence with the address information, each character of the recipient name Recipient name character recognizing means for recognizing, and when a part of the address information cannot be uniquely determined by the address recognizing means, based on the recognized address information, Recipient name word selecting means for selecting the contents of a recipient name word dictionary storing words of the recipient name in association with place information, recognition results of the recipient name character recognizing means, and selection results of the recipient name word selecting means And the address determination means for uniquely determining the address information based on the recognition result of the address recognition means and the determination result of the recipient name determination means. I have.

【0008】[0008]

【0009】[0009]

【0010】[0010]

【作用】本発明によれば、住所認識において、たとえ
ば、住所情報を構成する街区情報を示す丁目、番地に認
識不能文字があった場合、その認識不能文字に該当する
受取人名について文字認識、単語認識することによっ
て、住所情報を一意に確定するので、街区情報を示す丁
目、番地に認識不能文字があっても、高精度に住所情報
を一意に確定することができ、しかも、受取人名認識の
速度向上と認識率の向上にも寄与することができる。
According to the present invention, in address recognition, for example, if there is an unrecognizable character at the street or address indicating the block information constituting the address information, character recognition is performed on the recipient name corresponding to the unrecognizable character, and the word is recognized. By recognizing the address information, the address information is uniquely determined. Therefore, even if there are unrecognizable characters at the street or the address indicating the block information, the address information can be uniquely determined with high accuracy. It can also contribute to improvement in speed and recognition rate.

【0011】[0011]

【実施例】以下、本発明の一実施例について図面を参照
して説明する。図1は、本実施例に係る郵便物の宛名読
取装置の構成を示すものである。図において、Pは郵便
物で、図示しない搬送路によって搬送される。1は画像
入力手段としての光電変換部で、搬送される郵便物P上
を光学的に走査することにより光電変換し、郵便物P上
の画像情報を入力するものであり、たとえば、郵便物P
上を照明する光源と、その反射光を受光して電気信号に
変換するラインセンサなどによって構成されている。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 shows a configuration of a mail address reading apparatus according to the present embodiment. In the figure, P is a postal matter, which is conveyed by a conveying path (not shown). Reference numeral 1 denotes a photoelectric conversion unit as an image input unit, which photoelectrically converts the conveyed mail P by optically scanning the mail P to input image information on the mail P.
It is composed of a light source that illuminates the top, a line sensor that receives the reflected light and converts it into an electric signal.

【0012】光電変換部1で電気信号に変換された郵便
物Pの画像情報は、A/D変換部2でデジタル信号に変
換された後、宛名領域検出部3に送られる。宛名領域検
出部3は、郵便物Pの画像情報を解析することにより、
郵便物P上の住所情報と受取人名とからなる宛名情報が
記載されている宛名領域を検出し、その結果を文字行切
出部4に送る。
The image information of the postal matter P converted into an electric signal by the photoelectric conversion unit 1 is converted into a digital signal by the A / D conversion unit 2 and then sent to the destination area detection unit 3. The address area detection unit 3 analyzes the image information of the postal matter P,
An address area on the mail P in which address information including address information and a recipient name is described is detected, and the result is sent to the character line cutout unit 4.

【0013】文字行切出部4は、検出された宛名領域か
ら宛名情報を構成する各文字行を行単位に切出し、その
結果を文字切出部5に送る。文字切出部5は、切出され
た文字行の各文字を文字単位に切出し、その結果を町名
認識部6に送る。町名認識部6は、切出された文字に対
して都道府県名から町村名までを文字認識し、その認識
結果と、あらかじめ都道府県名、市、区、町村の単語が
記憶(登録)されている単語辞書の内容と照合すること
により、町村までの町名情報を階層的に確定し、その結
果を街区認識部7に送る。
The character line extracting unit 4 extracts each character line constituting the address information from the detected address area in units of lines, and sends the result to the character extracting unit 5. The character extracting unit 5 extracts each character of the extracted character line in character units, and sends the result to the town name recognizing unit 6. The town name recognizing unit 6 recognizes the characters from the prefecture name to the town / village name for the extracted characters, and stores (registers) the recognition result and the words of the prefecture name, city, ward, and town / village in advance. By comparing the contents with the contents of the word dictionary, the town name information up to the town and village is determined hierarchically, and the result is sent to the block recognition unit 7.

【0014】街区認識部7は、確定された町村名以降に
記載の街区情報、すなわち丁目、番地を示す数字を各文
字単位で認識し、その結果を受取人名認識部8に送る。
受取人名認識部8は、後で詳細を説明するが、街区認識
部7の認識結果に基づき、受取人名の各文字を認識した
後、受取人名単語辞書の内容と照合することにより、受
取人名を認識し、その結果を宛名確定部9に送る。
The block recognizing unit 7 recognizes the block information described after the determined town and village name, that is, the numbers indicating the streets and addresses in units of characters, and sends the result to the recipient name recognizing unit 8.
The recipient name recognition unit 8, which will be described in detail later, recognizes each character of the recipient name based on the recognition result of the block recognition unit 7, and then checks the recipient name against the contents of the recipient name word dictionary, thereby recognizing the recipient name. Recognize and send the result to the address determination unit 9.

【0015】宛名確定部9には、町名認識部6の認識結
果、および、街区認識部7の認識結果も入力されてい
る。したがって、宛名確定部9は、町名認識部6、街区
認識部7、および、受取人名認識部8の各認識結果を編
集・統合することにより、最終的な宛名情報を確定す
る。
The address determination unit 9 also receives the recognition result of the town name recognition unit 6 and the recognition result of the block recognition unit 7. Therefore, the address determination unit 9 determines and finalizes the address information by editing and integrating the recognition results of the street name recognition unit 6, the block recognition unit 7, and the recipient name recognition unit 8.

【0016】図2は、郵便物P上からの文字切出結果の
一例を示し、図3は、住所の階層構造の一例を示す。た
とえば、図2に示すように記載された宛名領域を検出
後、文字行切出、文字の切出が行なわれ、町名認識部6
において、各文字a1 , a2 ,…a7 の順に認識し、図
3の階層構造を用いて「川崎市」「幸区」「柳町」の順
に階層的に町名までの単語認識が行なわれる。
FIG. 2 shows an example of the result of extracting characters from the mail P, and FIG. 3 shows an example of the hierarchical structure of the address. For example, after the address area described as shown in FIG. 2 is detected, character line extraction and character extraction are performed, and the town name recognition unit 6
, A7 are recognized in the order of letters a1, a2,... A7, and words up to the town name are hierarchically recognized in the order of "Kawasaki-shi", "Sachi-ku", and "Yanagimachi" using the hierarchical structure of FIG.

【0017】そして、「柳町」までの認識終了に伴い、
それ以降の文字は街区情報としての丁目、番地と判断さ
れ、丁目、番地のための数字および限定漢字の認識を行
なう。すなわち、街区認識部7における文字の認識が一
意に確定できれば、その結果から宛名を確定する。しか
し、数字の認識が一意に確定できない場合、たとえば、
図2の文字a8 , a9 に示す「70」の「0」が「0」
か「6」か確定できない場合は、「0」または「6」の
候補文字をキー情報に、受取人名の認識結果と組合わせ
て宛名を確定する。
With the end of recognition up to "Yanagimachi",
Subsequent characters are determined to be the street information and the street address, and the numbers and limited kanji for the street and the street are recognized. That is, if character recognition in the block recognition unit 7 can be uniquely determined, the address is determined from the result. However, if the recognition of numbers cannot be determined uniquely, for example,
"0" of "70" shown in characters a8 and a9 in FIG.
If it is not possible to determine whether the address is "6" or "6", the address is determined by combining the candidate character "0" or "6" with the key information and the recognition result of the recipient name.

【0018】すなわち、受取人名認識部8では、一般に
受取人名は宛名領域の後段に位置することや、受取人名
の付随情報である「様」「殿」「君」「さん」「先生」
「行」などをキーワードにして探索し、受取人名の文字
列を検出した後、受取人名の文字認識、単語認識を行な
う。たとえば、図2においては、文字a14の「様」をキ
ーワードに「東柳太郎様」の文字列を受取人名と確定
し、文字a10からa13の「東柳太郎」の単語認識を行な
うものである。
That is, in the recipient name recognizing unit 8, the recipient name is generally located at the latter stage of the address area, and "sama,""dono,""kun,""san,""teacher," which is the accompanying information of the recipient name.
After searching using "line" as a keyword and detecting the character string of the recipient name, character recognition and word recognition of the recipient name are performed. For example, in FIG. 2, the character string "Taro Higashiyanagi" is determined as the recipient name using the character "sama" of the character a14 as a keyword, and the word recognition of "Taro Higashiyanagi" of the characters a10 to a13 is performed.

【0019】図4は、受取人名認識部8を詳細に示すも
のである。すなわち、上記のように、街区情報としての
丁目、番地の数字を認識する街区認識部7での認識の結
果、街区情報の候補として「70」および「76」の2
つの候補が生成された場合、町名認識部6における認識
の結果、すなわち、「川崎市」「幸区」「柳町」を検索
情報として、「70」および「76」に該当する受取人
名単語辞書11の内容を受取人名単語アクセスコントロ
ーラ12によって選出する。ここに、受取人名単語辞書
11には、あらかじめ住所情報に対応させて受取人名の
各種単語が格納されている。
FIG. 4 shows the recipient name recognition section 8 in detail. That is, as described above, as a result of the recognition by the block recognition unit 7 that recognizes the numbers of streets and streets as block information, two blocks of “70” and “76” are set as block information candidates.
When one candidate is generated, the recipient name word dictionary 11 corresponding to “70” and “76” is used as a search result, ie, “Kawasaki City”, “Sachi Ward”, and “Yanagimachi” as search information. Is selected by the recipient name / word access controller 12. Here, in the recipient name word dictionary 11, various words of the recipient name are stored in advance in correspondence with the address information.

【0020】また、上記同様に、町名認識結果を検索情
報として、「70」および「76」に該当する受取人名
の文字辞書13の内容を文字辞書アクセスコントローラ
14によって選出し、受取人名文字認識部15に送る。
ここに、文字辞書13には、あらかじめ住所情報に対応
させて受取人名の各種文字が格納されている。
In the same manner as described above, the contents of the character dictionary 13 of the recipient names corresponding to "70" and "76" are selected by the character dictionary access controller 14 using the street name recognition result as search information, and the recipient name character recognition unit is selected. Send to 15.
Here, various characters of the recipient name are stored in the character dictionary 13 in advance in correspondence with the address information.

【0021】受取人名文字認識部15では、文字切出部
5で切出された受取人名の各文字と文字辞書13から選
出された文字との間で類似度計算を行なうことにより、
受取人名の各文字を認識する。そして、類似度の高い順
に各文字の認識結果をソートし、受取人名情報格納部1
6に格納する。
The recipient name character recognizing unit 15 calculates the similarity between each character of the recipient name extracted by the character extracting unit 5 and the character selected from the character dictionary 13.
Recognize each character of the recipient name. Then, the recognition result of each character is sorted in descending order of similarity, and the recipient name information storage 1
6 is stored.

【0022】次に、単語類似度計算部17では、「7
0」と76」によって選出された受取人名単語辞書11
内の単語と受取人名情報格納部16に格納された文字認
識結果との間で単語単位に類似度計算する。そして、最
大類似度の単語辞書の内容を選択し、その街区出力結果
である「70」と合わせて確定出力する。
Next, the word similarity calculation unit 17 calculates "7
Recipient name word dictionary 11 selected by 0 "and 76"
The similarity is calculated for each word between the words in the character string and the character recognition results stored in the recipient name information storage unit 16. Then, the contents of the word dictionary having the highest similarity are selected and fixedly output together with the block output result “70”.

【0023】図5は、受取人名認識部8の処理をさらに
詳細に説明するためのブロック図である。すなわち、
「川崎市」「幸区」「柳町」の住所階層情報D1と「7
0」および「76」の街区情報D2を検索情報として、
マッピングテーブル18をアクセスする。マッピングテ
ーブル18は、入力した街区情報を辞書ポインタ格納部
19のアドレスに変換するテーブルで構成されている。
FIG. 5 is a block diagram for explaining the processing of the recipient name recognition unit 8 in more detail. That is,
"Kawasaki City", "Sachi Ward", "Yanagimachi" address hierarchy information D1 and "7
The block information D2 of “0” and “76” is used as search information.
Access the mapping table 18. The mapping table 18 is a table for converting the input block information into the address of the dictionary pointer storage unit 19.

【0024】たとえば、「70」の入力に対しては辞書
ポインタ格納部19のアドレスX1をアドレッシング
し、「76」の入力に対してはアドレスXnをアドレッ
シングする。アドレスX1でアドレッシングされる辞書
ポインタ格納部19の「4」は、「70」に該当する受
取人名文字数を表し、Aa,Ab,Ac,Adはそれぞ
れ受取人名文字の文字辞書13のアドレスを表す。同様
に、アドレスXnでアドレッシングされる辞書ポインタ
格納部19の「4」は、「76」に該当する受取人名文
字数を表し、Am,An,Ao,Apはそれぞれ受取人
名文字の文字辞書13のアドレスを表す。
For example, the address X1 of the dictionary pointer storage unit 19 is addressed to the input of "70", and the address Xn is addressed to the input of "76". “4” in the dictionary pointer storage unit 19 addressed by the address X1 represents the number of recipient name characters corresponding to “70”, and Aa, Ab, Ac, and Ad represent addresses of the character dictionary 13 of recipient name characters, respectively. Similarly, “4” in the dictionary pointer storage unit 19 addressed by the address Xn represents the number of recipient name characters corresponding to “76”, and Am, An, Ao, and Ap represent addresses of the character dictionary 13 of the recipient name characters, respectively. Represents

【0025】このように、マッピングテーブル18は辞
書ポインタ格納部19をアクセスし、「70」および
「76」に該当する辞書情報を選出する。文字辞書アク
セスコントローラ14は、文字辞書13内の例えば「7
0」に該当する「東」「柳」「太」「郎」、および、
「76」に該当する「山」「田」「一」「朗」を選出
し、受取人名文字認識部15に送る。受取人名文字認識
部15では、受取人名の各文字と文字辞書13から選出
された文字との間で類似度計算を行なうことにより、受
取人名の各文字を認識し、その認識結果を単語類似度計
算部17に送る。
As described above, the mapping table 18 accesses the dictionary pointer storage unit 19 and selects dictionary information corresponding to "70" and "76". The character dictionary access controller 14 stores, for example, “7” in the character dictionary 13.
0, "East,""Yanagi,""Fat,""Taro," and
“Mountain”, “field”, “one”, and “ro” corresponding to “76” are selected and sent to the recipient name character recognition unit 15. The recipient name character recognizing unit 15 recognizes each character of the recipient name by performing similarity calculation between each character of the recipient name and a character selected from the character dictionary 13, and determines the recognition result as a word similarity degree. It is sent to the calculation unit 17.

【0026】一方、受取人名単語アクセスコントローラ
12は、上記同様に住所階層情報D1と街区情報D2を
検索情報として、受取人名単語辞書11をアクセスする
ことにより、「70」に該当する「東柳太郎」、「7
6」に該当する「山田一朗」を選出し、単語類似度計算
部17に送る。
On the other hand, the recipient name / word access controller 12 accesses the recipient name / word dictionary 11 by using the address hierarchy information D1 and the block information D2 as search information in the same manner as described above, thereby obtaining “Taro Higashiyanagi” corresponding to “70”. , "7
“Ichiro Yamada” corresponding to “6” is sent to the word similarity calculator 17.

【0027】単語類似度計算部17では、受取人名文字
認識部15の認識結果と受取人名単語辞書11から選出
された単語との間で単語単位に類似度計算することによ
り、受取人名の単語を一意に確定する。
The word similarity calculating unit 17 calculates the similarity between the recognition result of the recipient name character recognizing unit 15 and the word selected from the recipient name word dictionary 11 on a word basis, thereby converting the word of the recipient name. Confirm uniquely.

【0028】図6は、単語類似度計算部17において、
文字認識結果と単語辞書との間で単語類似度計算を行な
うことより受取人名を確定する例である。図6では、文
字認識結果の1位は「東」「柳」「太」「朗」である
が、単語類似度計算の結果、「東柳太郎」が選出され、
それに該当する丁目、番地である「70」と共に出力さ
れる。
FIG. 6 shows that the word similarity calculator 17
This is an example of determining a recipient name by performing word similarity calculation between a character recognition result and a word dictionary. In FIG. 6, the first place of the character recognition result is “East”, “Yanagi”, “Fat”, and “Akira”. As a result of the word similarity calculation, “Taro Higashiyanagi” is selected.
It is output together with the corresponding street and the address “70”.

【0029】図7は、受取人住所の確定処理を説明する
フローチャートであり、以下、このフローチャートに基
づく説明を行なう。町名認識において、都道府県名から
町村名までを階層的に処理した後、街区認識において丁
目、番地の認識を行なう。街区認識の結果、リジェクト
文字がなければ受取人の住所を確定し、処理を終了す
る。リジェクト文字があれば、受取人名の認識を行なう
ことで受取人の住所を確定する。
FIG. 7 is a flowchart for explaining the process of determining the address of the recipient. The following description is based on this flowchart. In the street name recognition, after hierarchically processing the names of prefectures and towns and villages, the streets and streets are recognized in the street recognition. If there is no reject character as a result of the block recognition, the address of the recipient is determined, and the process is terminated. If there is a reject character, the address of the recipient is determined by recognizing the recipient name.

【0030】すなわち、リジェクト文字があれば、受取
人名文字の検出処理と、リジェクト文字に相対する限定
受取人名の文字辞書の選択と、リジェクト文字に相対す
る限定受取人名の単語辞書の選択を行なう。検出された
受取人名文字は、限定文字辞書と文字ごとの認識が行な
われる。そして、文字認識の結果は、限定単語辞書との
単語認識を行なうことで、受取人の住所を確定する。
That is, if there is a reject character, the process of detecting the recipient name character, selecting the character dictionary of the limited recipient name relative to the reject character, and selecting the word dictionary of the limited recipient name relative to the reject character are performed. The detected recipient name character is subjected to a limited character dictionary and recognition for each character. The result of the character recognition determines the address of the recipient by performing word recognition with the limited word dictionary.

【0031】なお、前記実施例では、「70」の最下位
桁の文字「0」が認識不能の場合について説明したが、
たとえば、「70」のうち文字「7」が「1」か「7」
か確定できない場合も、前記同様な処理により「10」
と「70」の単語辞書をアクセスすることで可能であ
る。
In the above embodiment, the case where the character "0" of the least significant digit of "70" cannot be recognized has been described.
For example, the character “7” of “70” is “1” or “7”
If it is not possible to determine whether
It is possible by accessing the word dictionary of "70".

【0032】また、たとえば、「70」のうち文字
「0」の桁が候補選出不能のときは、「70」から「7
9」にわたって受取人名認識を行えばよく、また、○−
□−△のように丁目、番地、号の構成であっても、○□
△の認識不能文字に関して文字および単語辞書をアクセ
スすればよい。
For example, if the digit of the character "0" of "70" cannot be selected as a candidate, "70" to "7"
9 ", and the recipient name needs to be recognized.
□-丁
The character and word dictionary may be accessed for unrecognizable characters of Δ.

【0033】さらに、郵便物の宛名読取においては、図
8に示すように、丁目、番地の次に必ずしも受取人名が
続くとは限らない。図8(a)に示すように会社名であ
ったり、図8(b)に示すようにアパート名であったり
する場合もある。会社名の場合は、会社に郵便物が配達
されるため会社名の読取りが必要であり、アパート名の
場合は、個人宛てに配達されるため個人名が読取れれば
よい。
Further, in reading the address of a postal matter, as shown in FIG. 8, the name of the recipient does not always follow the address of the street. The name may be a company name as shown in FIG. 8A or an apartment name as shown in FIG. 8B. In the case of a company name, it is necessary to read the company name because mail is delivered to the company, and in the case of an apartment name, it is sufficient to read the personal name because it is delivered to an individual.

【0034】したがって、たとえば、図9に示すよう
に、「70」番地が会社名であれば、会社名としてのア
クセスフラグ(1)を、「76」番地が個人名であれ
ば、個人名のアクセスフラグ(0)を付加することで、
丁目、番地に応じてどちらの単語をセレクトするかを決
め、それに応じた単語認識を行なうことが可能となる。
Therefore, for example, as shown in FIG. 9, if address "70" is a company name, the access flag (1) as a company name is set, and if address "76" is a personal name, the access flag (1) is changed. By adding an access flag (0),
It is possible to determine which word is to be selected in accordance with the address and the address, and to perform word recognition according to that.

【0035】以上説明したように上記実施例によれば、
住所認識において、街区情報としての丁目、番地を示す
数字に認識不能文字があった場合、その認識不能文字に
該当する受取人名について文字識別、単語認識すること
によって、住所情報を一意に確定するので、街区情報を
示す丁目、番地に認識不能文字があっても、高精度に住
所情報を一意に確定することができ、しかも、受取人名
認識の速度向上と認識率の向上にも寄与することができ
る。
As described above, according to the above embodiment,
In the address recognition, if there is an unrecognizable character in the number indicating the street or street as the block information, the address information is uniquely determined by character recognition and word recognition for the recipient name corresponding to the unrecognizable character. , Even if there is an unrecognizable character in the street or street address indicating the block information, the address information can be uniquely determined with high accuracy, and it also contributes to the improvement of the speed of the recipient name recognition and the improvement of the recognition rate. it can.

【0036】なお、前記実施例では、住所情報を構成す
る街区情報を示す丁目、番地に認識不能文字があった場
合について説明したが、本発明はこれに限定されるもの
ではなく、住所情報を構成する町名情報に認識不能文字
があった場合にも同様に適用できる。
In the above-described embodiment, the case where there are unrecognizable characters in the streets and addresses indicating the block information constituting the address information has been described. However, the present invention is not limited to this. The same applies to the case where unrecognizable characters are included in the constituent town name information.

【0037】[0037]

【発明の効果】以上詳述したように本発明によれば、住
所認識において、住所情報の一部分に認識不能文字があ
った場合、その認識不能文字に該当する受取人名につい
て文字認識、単語認識することによって、住所情報を一
意に確定するので、住所情報の一部分に認識不能文字が
あっても、高精度に住所情報を一意に確定することがで
き、しかも、受取人名認識の速度向上と認識率の向上に
も寄与することができる郵便物の宛名読取装置を提供で
きる。
As described above in detail, according to the present invention, in the address recognition, if there is an unrecognizable character in a part of the address information, character recognition and word recognition are performed for the recipient name corresponding to the unrecognizable character. As a result, the address information is uniquely determined, so that even if there is an unrecognizable character in a part of the address information, the address information can be uniquely determined with high accuracy, and the speed of the recipient name recognition and the recognition rate are improved. And a mail address reading device that can contribute to improvement of the mail address.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例に係る郵便物の宛名読取装置
の構成を概略的に示すブロック図。
FIG. 1 is a block diagram schematically showing a configuration of a mail address reading device according to an embodiment of the present invention.

【図2】郵便物上からの文字切出結果の一例を示す図。FIG. 2 is a diagram showing an example of a character extraction result from a mail.

【図3】住所の階層構造の一例を示す図。FIG. 3 is a diagram showing an example of a hierarchical structure of an address.

【図4】受取人名認識部を詳細に示すブロック図。FIG. 4 is a block diagram showing a recipient name recognition unit in detail.

【図5】受取人名認識部の処理をさらに詳細に説明する
ためのブロック図。
FIG. 5 is a block diagram for explaining processing of a recipient name recognition unit in further detail;

【図6】文字認識結果と単語辞書との間で単語類似度計
算を行なうことより受取人名を確定する例を説明する
図。
FIG. 6 is a diagram illustrating an example of determining a recipient name by performing word similarity calculation between a character recognition result and a word dictionary.

【図7】受取人住所の確定処理を説明するフローチャー
ト。
FIG. 7 is a flowchart illustrating a process for determining a recipient address.

【図8】宛名情報の記載例を示す図。FIG. 8 is a diagram showing a description example of address information.

【図9】本発明の他の実施例を説明するための図。FIG. 9 is a diagram for explaining another embodiment of the present invention.

【符号の説明】[Explanation of symbols]

P……郵便物、1……光電変換部(画像入力手段)、2
……A/D変換部、3……宛名領域検出部、4……文字
行切出部、5……文字切出部、6……町名認識部、7…
…街区認識部、8……受取人名認識部、10……宛名確
定部、11……受取人名単語辞書、13……文字辞書、
15……受取人名文字認識部、17……単語類似度計算
部。
P: mail, 1 ... photoelectric conversion unit (image input means), 2
... A / D conversion section, 3... Address area detection section, 4... Character line extraction section, 5... Character extraction section, 6... Street name recognition section, 7.
... block recognition unit, 8 ... recipient name recognition unit, 10 ... address determination unit, 11 ... recipient name word dictionary, 13 ... character dictionary,
15: Recipient name character recognition unit, 17: Word similarity calculation unit.

フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/00 G06K 9/62 G06K 9/72 B07C 3/14 Continuation of the front page (58) Field surveyed (Int.Cl. 6 , DB name) G06K 9/00 G06K 9/62 G06K 9/72 B07C 3/14

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 郵便物上の画像情報を電気信号に変換し
て入力する画像入力手段と、 この画像入力手段で入力された画像情報から、前記郵便
物上の住所情報と受取人名とからなる宛名情報が記載さ
れている宛名領域を検出する宛名領域検出手段と、 この宛名領域検出手段で検出された宛名領域に対して文
字認識を行なうことにより住所情報を認識する住所認識
手段と、 この住所認識手段において住所情報の一部分が一意に確
定できないとき、認識できた住所情報に基づき、あらか
じめ住所情報と対応させて受取人名を記憶している受取
人名辞書の内容を選択することにより、受取人名を認識
する受取人名認識手段と、 前記住所認識手段の認識結果と前記受取人名認識手段の
認識結果とに基づき住所情報を一意に確定する住所確定
手段と、 を具備したことを特徴とする郵便物の宛名読取装置。
1. An image input means for converting image information on a postal matter into an electric signal and inputting the same, and comprising, from the image information input by the image input means, address information on the postal matter and a recipient name. Address area detecting means for detecting an address area in which address information is described; address recognition means for recognizing address information by performing character recognition on the address area detected by the address area detecting means; When a part of the address information cannot be uniquely determined by the recognizing means, based on the recognized address information, the recipient name is stored in advance by selecting the contents of the recipient name dictionary that stores the recipient name in association with the address information. A recipient name recognizing unit to be recognized, and an address determining unit for uniquely determining address information based on the recognition result of the address recognizing unit and the recognition result of the recipient name recognizing unit. Address reading apparatus of mail, characterized in that Bei was.
【請求項2】 郵便物上の画像情報を電気信号に変換し
て入力する画像入力手段と、 この画像入力手段で入力された画像情報から、前記郵便
物上の住所情報と受取人名とからなる宛名情報が記載さ
れている宛名領域を検出する宛名領域検出手段と、 この宛名領域検出手段で検出された宛名領域に対して文
字認識を行なうことにより住所情報を認識する住所認識
手段と、 この住所認識手段において住所情報の一部分が一意に確
定できないとき、認識できた住所情報に基づき、あらか
じめ住所情報と対応させて受取人名の文字を記憶してい
る受取人名文字辞書の内容を選択することにより、受取
人名の各文字を認識する受取人名文字認識手段と、 前記住所認識手段において住所情報の一部分が一意に確
定できないとき、認識できた住所情報に基づき、あらか
じめ住所情報と対応させて受取人名の単語を記憶してい
る受取人名単語辞書の内容を選択する受取人名単語選択
手段と、 前記受取人名文字認識手段の認識結果と前記受取人名単
語選択手段の選択結果とに基づき受取人名を一意に確定
する受取人名確定手段と、 前記住所認識手段の認識結果と前記受取人名確定手段の
確定結果とに基づき住所情報を一意に確定する住所確定
手段と、 を具備したことを特徴とする郵便物の宛名読取装置。
2. An image input means for converting image information on a postal matter into an electric signal and inputting the same, and the image information input by the image input means comprises address information on the postal matter and a recipient name. Address area detecting means for detecting an address area in which address information is described; address recognition means for recognizing address information by performing character recognition on the address area detected by the address area detecting means; When a part of the address information cannot be uniquely determined by the recognizing means, based on the recognized address information, by selecting the contents of a recipient name character dictionary storing characters of the recipient name in advance in correspondence with the address information, A recipient name character recognizing means for recognizing each character of the recipient name, and when a part of the address information cannot be uniquely determined by the address recognizing means, based on the recognized address information. A recipient name word selecting means for selecting the contents of a recipient name word dictionary storing words of a recipient name in advance in correspondence with address information; a recognition result of the recipient name character recognizing means and the recipient name word selecting means A recipient name deciding unit that uniquely decides a recipient name based on the selection result, and an address deciding unit that uniquely decides address information based on the recognition result of the address recognizing unit and the decision result of the recipient name deciding unit. A mail address reading device comprising:
JP5215848A 1993-08-31 1993-08-31 Mail address reading device Expired - Lifetime JP2991594B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5215848A JP2991594B2 (en) 1993-08-31 1993-08-31 Mail address reading device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5215848A JP2991594B2 (en) 1993-08-31 1993-08-31 Mail address reading device

Publications (2)

Publication Number Publication Date
JPH0765107A JPH0765107A (en) 1995-03-10
JP2991594B2 true JP2991594B2 (en) 1999-12-20

Family

ID=16679279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5215848A Expired - Lifetime JP2991594B2 (en) 1993-08-31 1993-08-31 Mail address reading device

Country Status (1)

Country Link
JP (1) JP2991594B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011434A (en) * 1996-06-21 1998-01-16 Nec Corp Information recognition device

Also Published As

Publication number Publication date
JPH0765107A (en) 1995-03-10

Similar Documents

Publication Publication Date Title
KR20010051346A (en) Recognition device and method of location information, and recording medium thereof
JP3485020B2 (en) Character recognition method and apparatus, and storage medium
US5995664A (en) Information recognition apparatus for recognizing recognition object information
JP3232991B2 (en) Character reading method and address reading method
JP2991594B2 (en) Mail address reading device
JP3201207B2 (en) Address reading apparatus and method
JPH06124366A (en) Address reader
JP2910630B2 (en) Address recognition method, address recognition device, and paper sheet automatic processing system
JP2009163689A (en) Address recognition method and device, and postal address sorter
JP3162552B2 (en) Mail address recognition device and address recognition method
JP3243000B2 (en) Mail processing apparatus and mail processing method
US20050010540A1 (en) Sorting apparatus and address information determination method
JPH0256086A (en) Method for postprocessing for character recognition
JP3088036B2 (en) Address reading sorting machine
JPH05242303A (en) Address reader
JP2996823B2 (en) Character recognition device
JP2000011096A (en) Character recognizing processor, its method and storage medium
JPH11138108A (en) Mail readout and classifying device
Likforman-Sulem et al. Facsimile processing for a messaging server
JPH05324899A (en) Recognizing device for address written on mail
JP2001025713A (en) Posta sorting mail system
JPH0793467A (en) Address reading system
JPH11238093A (en) Mail section processor and mail section processing method
JPH09190507A (en) Address reader
JPH1196307A (en) Word recognizing device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101015

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111015

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111015

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121015

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 14