JP2005040786A - Classification device and method for address information identification - Google Patents

Classification device and method for address information identification Download PDF

Info

Publication number
JP2005040786A
JP2005040786A JP2004185430A JP2004185430A JP2005040786A JP 2005040786 A JP2005040786 A JP 2005040786A JP 2004185430 A JP2004185430 A JP 2004185430A JP 2004185430 A JP2004185430 A JP 2004185430A JP 2005040786 A JP2005040786 A JP 2005040786A
Authority
JP
Japan
Prior art keywords
country
address
information
word
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2004185430A
Other languages
Japanese (ja)
Inventor
Yasuhiro Aoki
泰浩 青木
Bunpei Irie
文平 入江
Takuma Akagi
琢磨 赤木
Tomoyuki Hamamura
倫行 浜村
Hideo Horiuchi
秀雄 堀内
Naoki Natori
直毅 名取
Akihiko Nakao
昭彦 中尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004185430A priority Critical patent/JP2005040786A/en
Publication of JP2005040786A publication Critical patent/JP2005040786A/en
Abandoned legal-status Critical Current

Links

Images

Landscapes

  • Sorting Of Articles (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To efficiently identify address information of a delivery such as mail. <P>SOLUTION: An international delivery identification section 60A judges whether the mail is for abroad or not, based on each collation result by every collation section comprising a sticker-carried information collation section 51, an address format collation section 52, an address word collation section 53, a delivery zone code form collation section 54, and a country name identification word collation section 55 (or, by part of the collation sections). When the mail is judged to be for abroad by the international delivery identification section 60A, a country name identification section 60B identifies the name of the country to which the mail is addressed, based on each collation result by every collation section comprising the sticker-carried information collation section 51, the address format collation section 52, the address word collation section 53, the delivery zone code form collation section 54, and the country name identification word collation section 55 (or, by part of the collation sections). <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、宛先が記載された配達物の区分処理を行う区分装置、およびその区分装置に適用される宛名情報判定方法に関する。   The present invention relates to a sorting apparatus that performs sorting processing of deliverables in which a destination is described, and a destination information determination method applied to the sorting apparatus.

郵便物に付された紙葉類上の宛名情報を光学的に読取って郵便物を区分する郵便物宛名自動読取区分機が知られている。この種の区分機は、一般に、国内郵便に対応して設計されている。すなわち、区分機が使用される国における個々の住所データが登録された辞書を用いて、宛名情報の中の住所(又は居所)などを認識し、これにより区分を行うものとなっている。   2. Description of the Related Art There is known a mail address automatic reading / sorting machine that optically reads address information on a paper sheet attached to a mail and sorts the mail. This sorter is generally designed for domestic mail. That is, the address (or whereabouts) in the address information is recognized using a dictionary in which individual address data in the country where the sorting machine is used is registered, and the sorting is performed based on this.

一方、郵便物の宛先が外国である国際郵便に対しては、上記区分機では対処できないため、国際郵便を示すシール等を添付し、これにより手作業で郵便物を区分するようにしている。   On the other hand, since the above sorting machine cannot deal with international mail where the postal address is a foreign country, a sticker or the like indicating international mail is attached so that the mail is sorted manually.

なお、国内の住所データが登録された辞書だけでなく、国外の住所データが登録された辞書を区分機に搭載させることによって、国際郵便に対処することも考えられる。例えば、特許文献1には、文字パターンデータ記憶部に記憶した文字パターンを用いて照合を行うことによって外国語で書かれた文書が何語であるかを特定する技術が開示されており、外国語で書かれた住所を認識する際には、この文献の技術を利用することが考えられる。
特開2002−245470号公報
It is also conceivable to deal with international mail by installing not only a dictionary in which domestic address data is registered but also a dictionary in which foreign address data is registered in a sorting machine. For example, Patent Document 1 discloses a technique for specifying the language of a document written in a foreign language by performing collation using a character pattern stored in a character pattern data storage unit. When recognizing addresses written in words, it is conceivable to use the technique of this document.
JP 2002-245470 A

しかしながら、前述のように国際郵便に添付されたシール等を見ることにより宛先の国名を判断し区分する作業は、手間と時間が非常にかかり、能率的であるとは言い難い。   However, as described above, the task of determining and classifying the destination country by looking at the sticker attached to the international mail is very time-consuming and time-consuming, and is not efficient.

また、国外の住所データが登録された辞書を区分機に搭載させる場合、あらゆる国の膨大な住所データを十分記憶できるほどの容量を有する記憶媒体や、短時間での検索が可能な高度な検索装置を設ける必要があり、膨大なコストがかかってしまうという問題がある。   In addition, when installing a dictionary with foreign address data registered in the sorting machine, a storage medium that has a capacity sufficient to store a huge amount of address data in any country, and an advanced search that can be performed in a short time There is a problem that it is necessary to provide an apparatus, and enormous costs are required.

この発明は、郵便物などの配達物の宛名情報を効率的に判定することができる区分装置および宛名情報判定方法を提供することを目的とする。   It is an object of the present invention to provide a sorting apparatus and a method for determining address information that can efficiently determine address information of a delivery such as mail.

この発明に係わる区分装置は、宛先が記載された配達物の区分処理を行う区分装置であって、i)所定の国において国外向けの便であることを示すシールの記載情報が登録されているシール記載情報データベース、ii)住所の記載を構成している個々の要素の配列に関する複数種類の住所フォーマットが国グループ別に登録されている住所フォーマットデータベース、iii)各国の住所の記載に使用される特定の単語が母国語で国別に登録されている住所用単語データベース、iv)各国の配達区域コードの記載形式を示す情報が国別に登録されている配達区域コード形式情報データベース、およびv)各国を識別するための国名識別単語が国別に登録されている国名識別単語データベースのうち、少なくともいずれか一つを記憶している記憶手段と、上記配達物に付された紙葉類上の情報を読取る読取手段と、上記読取手段により読取られた情報から、上記紙葉類上の宛名領域を認識する認識手段と、上記認識手段により認識された上記宛名領域の情報から、i)上記シールの記載情報を検出すること、ii)住所の記載を構成している個々の要素の配列に関する住所フォーマットを検出すること、iii)住所に含まれる特定の単語を検出すること、iv)配達区域コードの記載形式を検出すること、およびv)国名識別単語を検出することのうち、少なくともいずれか一つを行う検出手段と、i)上記記憶手段における上記シール記載情報データベースを参照して、上記検出手段により検出されたシール記載情報の照合を行うこと、ii)上記記憶手段における上記住所フォーマットデータベースを参照して、上記検出手段により検出された住所フォーマットの照合を行うこと、iii)上記記憶手段における上記住所用単語データベースを参照して、上記検出手段により検出された単語の照合を行うこと、iv)上記記憶手段における上記配達区域コード形式情報データベースを参照して、上記検出手段により検出された配達区域コードの記載形式の照合を行うこと、およびv)上記記憶手段における上記国名識別単語データベースを参照して、上記検出手段により検出された国名識別単語の照合を行うことのうち、少なくともいずれか一つを行う照合手段と、上記照合手段による各照合結果に基づき、上記配達物が国外向けの便であるか否かを判定する第1の判定手段と、を具備することを特徴とする。   The sorting device according to the present invention is a sorting device that performs sorting processing of deliveries with destinations described therein, and i) description information on a seal indicating that the flight is for a foreign country in a predetermined country is registered. Seal description information database, ii) Address format database in which multiple types of address formats related to the arrangement of individual elements constituting address descriptions are registered for each country group, iii) Identification used for description of addresses in each country A word database for addresses in which the words are registered in the native language, iv) a delivery area code format information database in which information indicating the delivery format of each country's delivery area code is registered, and v) a country identification Storage means storing at least one of country name identification word databases in which country name identification words for registration are registered by country Reading means for reading information on the paper sheet attached to the delivery, recognition means for recognizing the address area on the paper sheet from the information read by the reading means, and recognition by the recognition means I) detecting the description information of the sticker from the information of the addressed area, ii) detecting the address format relating to the arrangement of the individual elements constituting the description of the address, iii) included in the address Detection means for performing at least one of detecting a specific word, iv) detecting a description format of a delivery area code, and v) detecting a country name identification word; i) the storage means Referring to the sticker description information database in the above, the collation of sticker description information detected by the detection means is performed, ii) the address format database in the storage means Referencing the address format detected by the detecting means, iii) referring to the address word database in the storage means, and verifying the word detected by the detecting means, iv ) Refer to the delivery area code format information database in the storage means, and collate the description format of the delivery area code detected by the detection means, and v) Refer to the country name identification word database in the storage means Then, based on the result of the collation performed by the collation means that performs at least one of collation of the country name identification words detected by the detection means, and the collation result of the collation means, And first determination means for determining whether or not.

また、この発明に係わる宛名情報判定方法は、宛先が記載された配達物の区分処理を行う区分装置に適用される宛名情報判定方法であって、i)所定の国において国外向けの便であることを示すシールの記載情報が登録されているシール記載情報データベース、ii)住所の記載を構成している個々の要素の配列に関する複数種類の住所フォーマットが国グループ別に登録されている住所フォーマットデータベース、iii)各国の住所の記載に使用される特定の単語が母国語で国別に登録されている住所用単語データベース、iv)各国の配達区域コードの記載形式を示す情報が国別に登録されている配達区域コード形式情報データベース、およびv)各国を識別するための国名識別単語が国別に登録されている国名識別単語データベースのうち、少なくともいずれか一つを記憶媒体に保管しておき、上記配達物に付された紙葉類上の情報を読取り、上記読取った情報から、上記紙葉類上の宛名領域を認識し、上記認識した宛名領域の情報から、i)上記シールの記載情報を検出すること、ii)住所の記載を構成している個々の要素の配列に関する住所フォーマットを検出すること、iii)住所に含まれる特定の単語を検出すること、iv)配達区域コードの記載形式を検出すること、およびv)国名識別単語を検出することのうち、少なくともいずれか一つを行い、i)上記記憶手段における上記シール記載情報データベースを参照して、上記検出手段により検出されたシール記載情報の照合を行うこと、ii)上記記憶手段における上記住所フォーマットデータベースを参照して、上記検出手段により検出された住所フォーマットの照合を行うこと、iii)上記記憶媒体における上記住所用単語データベースを参照して、上記検出した単語の照合を行うこと、iv)上記記憶媒体における上記配達区域コード形式情報データベースを参照して、上記検出した配達区域コードの記載形式の照合を行うこと、およびv)上記記憶媒体における上記国名識別単語データベースを参照して、上記検出した国名識別単語の照合を行うことのうち、少なくともいずれか一つを行い、上記照合による各照合結果に基づき、上記配達物が国外向けの便であるか否かについて第1の判定を行うことを特徴とする。   Also, the address information determination method according to the present invention is an address information determination method applied to a sorting apparatus that performs sorting processing of deliverables in which a destination is described, and i) is a flight for a foreign country in a predetermined country. Ii) an address format database in which multiple types of address formats related to the arrangement of individual elements constituting the address description are registered for each country group, iii) Address word database in which specific words used to describe addresses in each country are registered in each country in their native language, iv) Delivery in which information indicating the description format of each country's delivery area code is registered in each country Area code format information database, and v) a country name identification word database in which country name identification words for identifying each country are registered for each country. At least one of them is stored in a storage medium, the information on the paper sheet attached to the delivery is read, the address area on the paper sheet is recognized from the read information, From the recognized address area information, i) detecting the description information of the above-mentioned sticker, ii) detecting the address format regarding the arrangement of the individual elements constituting the description of the address, iii) identification included in the address Iv) detecting the description format of the delivery area code, and v) detecting the country identification word, and i) the seal description in the storage means Referring to the information database, collating the seal description information detected by the detection means, ii) referring to the address format database in the storage means, Iii) collating the detected word with reference to the address word database in the storage medium, and iv) the delivery area code format information in the storage medium. Referring to the database, collating the description format of the detected delivery area code, and v) referring to the country name identification word database in the storage medium to collate the detected country name identification word. At least one of them is performed, and a first determination is made as to whether or not the delivery is a foreign flight based on each collation result of the collation.

郵便物などの配達物の宛名情報を効率的に判定することができる。   It is possible to efficiently determine the address information of delivery items such as mail.

この発明の実施の形態を図面に基づいて詳細に説明する。
図1は、この発明の一実施形態に係わる区分機1を示す外観図であり、図2は区分機1の概略構成を示す図である。この区分機1は、大型の箱型状の区分機本体1aを有している。この区分機1は、郵便物P上の情報を読取り、その読取内容から宛名領域や貼付シールの領域などを認識し、この認識結果に基づいて該当する区分先に郵便物Pを区分するものである。
上記区分機本体1aには、供給部2と、スキャナ部(読取手段)3と、搬送部4と、区分部5と、収納部6とが設けられている。この供給部2からの郵便物Pが搬送路によって搬送されることにより、搬送部4、区分部5を順次介して収納部6に導かれる。
Embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is an external view showing a sorting machine 1 according to an embodiment of the present invention, and FIG. 2 is a diagram showing a schematic configuration of the sorting machine 1. This sorter 1 has a large box-shaped sorter body 1a. This sorter 1 reads the information on the postal matter P, recognizes the address area, the sticker sticker region, etc. from the read contents, and sorts the postal matter P to the corresponding sorting destination based on the recognition result. is there.
The sorting machine main body 1 a is provided with a supply unit 2, a scanner unit (reading unit) 3, a transport unit 4, a sorting unit 5, and a storage unit 6. When the postal matter P from the supply unit 2 is conveyed by the conveyance path, it is guided to the storage unit 6 through the conveyance unit 4 and the sorting unit 5 in order.

上記供給部2は、郵便物Pを載置する載置台7と、この載置台7から郵便物Pを一通ずつ取り出して搬送路に送る取出し部8とを有している。上記スキャナ部3は、搬送路によって搬送される1通ずつの郵便物P上の全体の画像を光学的に読取って画像情報を生成する。上記搬送部4は、スキャナ部3を通過してきた郵便物Pを区分部5へ搬送する。上記収納部6は、郵便物Pを区分収納する多数の収納ポケット6aを有している。上記区分部5は、搬送部4から送られてくる郵便物Pをスキャナ部3からの画像情報に対する後述する認識結果に基づいて収納ポケット6a、…のいずれかに振り分ける。   The supply unit 2 includes a mounting table 7 on which the postal matter P is placed, and a taking-out unit 8 that takes out the postal matter P one by one from the mounting table 7 and sends it to the conveyance path. The scanner unit 3 optically reads the entire image on each postal matter P conveyed by the conveyance path and generates image information. The transport unit 4 transports the postal matter P that has passed through the scanner unit 3 to the sorting unit 5. The storage unit 6 has a large number of storage pockets 6a for sorting and storing the postal matter P. The sorting unit 5 sorts the postal matter P sent from the transport unit 4 into one of the storage pockets 6a,... Based on a recognition result described later with respect to image information from the scanner unit 3.

上記スキャナ部3は、郵便物P上を光学的に走査して光電変換することによりパターン信号として紙葉類上の情報を読取る読取手段であり、たとえば郵便物P上に光を照射する光源、およびその反射光を受けて電気信号に変換する自己走査形のCCDイメージセンサ等によって構成される。上記スキャナ部3の出力は情報処理部10中の認識部に供給される。   The scanner unit 3 is a reading unit that reads information on a paper sheet as a pattern signal by optically scanning and photoelectrically converting the postal matter P. For example, a light source that irradiates light on the postal matter P, And a self-scanning CCD image sensor that receives the reflected light and converts it into an electrical signal. The output of the scanner unit 3 is supplied to a recognition unit in the information processing unit 10.

上記区分機1において、上記供給部2、スキャナ部3、搬送部4、区分部5、情報処理部10は、制御部11に接続されている。この制御部11は、区分機1の全体の動作を制御する。たとえば、制御部11は図示しないメモリに記憶されている区分指定テーブルを用いて、上記情報処理部10での認識結果(もしくは判定結果)に対応する区分指定データを読出し、この読出した区分指定データ(収納ポケット6a、…のアドレス)に対応する収納ポケット6a、…に上記郵便物Pを搬送せしめるものである。
さらに、上記制御部11はドライバ(図示せず)により上記搬送路等の搬送機構部(図示せず)を駆動することにより、搬送系全体の制御を行うようになっている。
In the sorting machine 1, the supply unit 2, the scanner unit 3, the transport unit 4, the sorting unit 5, and the information processing unit 10 are connected to a control unit 11. The control unit 11 controls the overall operation of the sorting machine 1. For example, the control unit 11 reads out the category designation data corresponding to the recognition result (or determination result) in the information processing unit 10 using the category designation table stored in the memory (not shown), and the read category designation data. The postal matter P is transported to the storage pockets 6a,... Corresponding to (addresses of the storage pockets 6a,...).
Further, the control unit 11 controls the entire transport system by driving a transport mechanism unit (not shown) such as the transport path by a driver (not shown).

上記郵便物Pに付されている紙葉類の表面には、図3に示されるように、宛名が記載された宛名領域71と、文章が記載された文書領域72とがあり、切手73が添付されている。また、国外向けの郵便の場合、国外向けであることを示すシール74が添付されている。また、上記宛名領域71には、図4に示されるように、宛先の住所(又は居所)81が記載されるほか、配達区域を示す配達区域コード(ZIPコード、郵便番号)82が所定の形式で記載されたり、各国を識別するための国名識別単語(国名の略称など)83が記載されたりする。なお、配達区域コード82や国名識別単語83は、書かれていない場合もある。   As shown in FIG. 3, on the surface of the paper sheet attached to the postal matter P, there are an address area 71 in which an address is described and a document area 72 in which a text is described. It is attached. Further, in the case of mail for overseas, a seal 74 indicating that the mail is for overseas is attached. In the address area 71, as shown in FIG. 4, a destination address (or residence) 81 is described, and a delivery area code (ZIP code, zip code) 82 indicating a delivery area is in a predetermined format. Or a country name identification word (such as a country name abbreviation) 83 for identifying each country. The delivery area code 82 and the country name identification word 83 may not be written.

上記情報処理部10は、図5に示されるように、認識部(認識手段)101と、宛名情報判定部102と、記憶部(記憶手段もしくは記憶媒体)103と、住所判定部104とで構成されている。   As shown in FIG. 5, the information processing unit 10 includes a recognition unit (recognition unit) 101, an address information determination unit 102, a storage unit (storage unit or storage medium) 103, and an address determination unit 104. Has been.

認識部101は、スキャナ部3から供給される画像から、郵便物P上の宛名領域71やシール74の領域などを認識する。具体的には、当該宛名領域71内の住所に関する住所フォーマットや、文字列や、配達区域コードや、配達区域コードの枠などのフォーマット情報や、シール74の記載情報を認識する。また、この認識部101は、国内の住所データや配達区域コードなどが登録された各種の辞書を有しており、これらの辞書を使用することにより国内向けの郵便物の住所や配達区域コードの文字列を認識することもできる。   The recognition unit 101 recognizes the address area 71 on the postal matter P, the area of the seal 74, and the like from the image supplied from the scanner unit 3. Specifically, it recognizes the address format, the character string, the delivery area code, the format information such as the delivery area code frame, and the description information on the sticker 74 regarding the address in the address area 71. The recognizing unit 101 has various dictionaries in which domestic address data, delivery area codes, and the like are registered. By using these dictionaries, addresses of domestic mail and delivery area codes can be obtained. It can also recognize character strings.

宛名情報判定部102は、認識部101により認識された宛名領域71の情報から、i)住所に含まれる特定の単語、ii)配達区域コードの記載形式、およびiii)国名識別単語を検出すると共に、記憶部103内の該当する各種データベース(以下、データベースをDBと称す)を参照することによって上記検出した単語等の照合を行い、それらの照合結果に基づいて郵便物Pの宛先となる国名を判定するものである。ここで得られた判定結果は、制御部11へ供給される。   The address information determination unit 102 detects, from the information in the address area 71 recognized by the recognition unit 101, i) a specific word included in the address, ii) a description format of the delivery area code, and iii) a country name identification word. , Collation of the detected word or the like is performed by referring to the corresponding various databases (hereinafter referred to as DB) in the storage unit 103, and the name of the destination country of the postal matter P is determined based on the collation result. Judgment. The determination result obtained here is supplied to the control unit 11.

記憶部103は、宛名情報判定部102により使用される各種DB(後述)を記憶するものである。
住所判定部104は、認識部101による住所の文字列の認識が成功した場合には、この認識部101から住所の文字列を得る。一方、認識部101による住所の文字列の認識が成功しなかった場合、住所判定部104は、リジェクト処理することを決定するか、もしくは、認識部101により認識された氏名の文字列に最も近似する文字列を記憶部103内の所定のデータベースの中から検索して住所を決定する。ここで得られた住所の文字列は、住所判定結果として制御部11へ供給される。
The storage unit 103 stores various DBs (described later) used by the address information determination unit 102.
The address determination unit 104 obtains an address character string from the recognition unit 101 when the recognition unit 101 succeeds in recognizing the address character string. On the other hand, if the recognition unit 101 has not successfully recognized the address character string, the address determination unit 104 decides to perform the rejection process or is closest to the name character string recognized by the recognition unit 101. A character string to be searched is searched from a predetermined database in the storage unit 103 to determine an address. The character string of the address obtained here is supplied to the control unit 11 as an address determination result.

次に、図6を参照して、宛名情報判定部102および記憶部103の詳細について説明する。
記憶部103には、シール記載情報DB31、住所フォーマットDB32、住所用単語DB33、配達区域コード形式情報DB34、国名識別単語DB35などの各種DBが備えられる。
Next, the details of the address information determination unit 102 and the storage unit 103 will be described with reference to FIG.
The storage unit 103 includes various databases such as a sticker description information DB 31, an address format DB 32, an address word DB 33, a delivery area code format information DB 34, and a country name identification word DB 35.

シール記載情報DB31には、当該区分機1が適用される本国(例えば、スエーデン)において国外向けの便であることを示すシールの記載情報が登録されている。具体的には、図7に示されるように、本国において流通している各種のシール(タイプA,タイプB,タイプC,…)に記載されているデザインの画像情報が登録される。各種のシールは、例えば使用頻度の高い順に配列され、使用頻度の高い順に照合処理の対象にされる。対象となるシールが上記タイプA,タイプB,タイプC,…のいずれか1つに該当すれば、郵便物Pが国外向けの便であることになる。   In the sticker description information DB 31, sticker description information indicating that it is a flight for a foreign country in the home country (for example, Sweden) to which the sorting machine 1 is applied is registered. Specifically, as shown in FIG. 7, image information of designs described in various seals (type A, type B, type C,...) Distributed in the home country is registered. The various seals are arranged, for example, in order of frequency of use, and are subjected to collation processing in order of frequency of use. If the target seal corresponds to any one of the type A, type B, type C,..., The postal matter P is a foreign flight.

住所フォーマットDB32には、住所の記載を構成している個々の要素の配列に関する複数種類の住所フォーマットが国グループ別(もしくは国別に)に登録されている。具体的には、図8に示されるように、欧州型(I),欧州型(II),米国型,…といった各種の住所フォーマットが登録される。   In the address format DB 32, a plurality of types of address formats related to the arrangement of individual elements constituting address descriptions are registered for each country group (or each country). Specifically, as shown in FIG. 8, various address formats such as European type (I), European type (II), US type,... Are registered.

図8中の欧州型(I)の住所フォーマットにおいては、1段目に、「サルティション(salutation)」(書出しの文句)が配置される場合がある(任意)。2段目には、「連絡先(contact name)」(個人名や法人名など)が配置される。3段目には、「通り(thoroughfare)」(ストリート、ロード、アベニューなど)が配置され、その右側に「番号(number)」(上記通り(thoroughfare)の番号)が配置される。4段目には、「郵便番号(postal code)」が配置され、その右側に「地域(settlement)」(都市名、地区名など)が配置される。   In the European type (I) address format in FIG. 8, “salutation” (writing phrase) may be arranged in the first row (optional). In the second row, “contact name” (personal name, corporate name, etc.) is arranged. In the third row, “thoroughfare” (street, road, avenue, etc.) is arranged, and “number” (thoroughfare number) is arranged on the right side. In the fourth row, “postal code” is arranged, and “settlement” (city name, district name, etc.) is arranged on the right side.

図8中の欧州型(II)の住所フォーマットにおいては、1段目に、「連絡先(contact name)」(個人名や法人名など)が配置される。2段目には、「番号(number)」(通り(thoroughfare)の番号)が配置され、その右側に「通りの種類(thoroughfare type)」が配置され、その右側に「通りの名前(thoroughfare name)」が配置される。3段目には、「郵便番号(postal code)」が配置され、その右側に「地域(settlement)」(都市名、地区名など)が配置される。   In the European type (II) address format in FIG. 8, “contact name” (personal name, corporate name, etc.) is arranged in the first row. In the second row, “number” (thoroughfare number) is arranged, “thoroughfare type” is arranged on the right side, and “thoroughfare name” is on the right side. ) ”Is arranged. In the third row, “postal code” is arranged, and “settlement” (city name, district name, etc.) is arranged on the right side.

図8中の米国型の住所フォーマットにおいては、1段目に、「連絡先(contact name)」(個人名や法人名など)が配置される。2段目には、「番号(number)」(通り(thoroughfare)の番号)が配置され、その右側に「通りの名前(thoroughfare name)」が配置され、その右側に「通りの種類(thoroughfare type)」が配置される。3段目には、「地域(settlement)」が配置され、その右側に「州(state code)」が配置され、その右側に「郵便番号(postal code)」が配置される。   In the US address format in FIG. 8, “contact name” (personal name, corporate name, etc.) is arranged in the first row. In the second row, “number” (thoroughfare number) is arranged, “thoroughfare name” is arranged on the right side, and “thoroughfare type” is on the right side. ) ”Is arranged. In the third row, “settlement” is arranged, “state code” is arranged on the right side thereof, and “postal code” is arranged on the right side thereof.

住所用単語DB33には、各国の住所の記載に使用される特定の単語が母国語で国別に登録されている。具体的には、図9に示されるように、各国における「区域」(市、町、区など)もしくは「通り(thoroughfare)」(ストリート、ロード、アベニューなど)を表す単語が母国語で国別に複数種登録されている。この場合、各単語は、使用頻度の高い順に配列される。例えば、図9中の項目(i)に該当する単語が最も使用頻度が高く、項目(ii)、項目(iii)、項目(iv)の順で単語の使用頻度が低くなるように配列される。なお、各単語に点数を付記しておき、その点数を国名判定部60B(後述)による国名判定の際に使用するようにしてもよい。この場合、使用頻度の高い単語ほど高い点数を割り当てるようにする。これにより、国名判定部60Bは、国名判定の際に、使用頻度の高い単語ほど高い点数を割り当てた上で、国毎の点数の合計を算出することになる。   In the address word DB 33, specific words used for describing addresses in each country are registered in their native languages for each country. Specifically, as shown in FIG. 9, the words representing “areas” (city, town, ward, etc.) or “thoroughfare” (street, road, avenue, etc.) in each country are native languages and are classified by country. Multiple types are registered. In this case, the words are arranged in descending order of use frequency. For example, the words corresponding to item (i) in FIG. 9 are arranged so that the frequency of use is the highest, and the frequency of use of words is reduced in the order of item (ii), item (iii), and item (iv). . Note that a score may be added to each word, and the score may be used for country name determination by the country name determination unit 60B (described later). In this case, a higher score is assigned to a frequently used word. As a result, the country name determination unit 60B calculates a total score for each country after assigning a higher score to a frequently used word when determining the country name.

配達区域コード形式情報DB34には、各国の配達区域コード(ZIPコード、郵便番号)の記載形式を示す情報が国別に登録されている。例えば、図10中の項目Aおよび項目Bに示されるように、記載形式を示す情報が国別に複数種登録される。なお、図中の“N”は1桁分の数字に相当するものであり、“[ ]”はスペース(もしくはハイフン)に相当するものである。項目Bに示される配達区域コードは、項目Aに示される配達区域コードの先頭に、その国の頭文字を付加した形態となっている。   In the delivery area code format information DB 34, information indicating the description format of the delivery area code (ZIP code, zip code) of each country is registered for each country. For example, as shown in item A and item B in FIG. 10, a plurality of types of information indicating the description format are registered for each country. In the figure, “N” corresponds to a single digit number, and “[]” corresponds to a space (or hyphen). The delivery area code shown in item B has a form in which the initial letter of the country is added to the head of the delivery area code shown in item A.

国名識別単語DB35には、各国を識別するための国名識別単語が国別に登録されている。例えば、図10中の項目Cおよび項目Dに示されるように、複数種類の記載形式を示す情報が国別に複数種登録される。図10の例では、項目Cに示される単語は、その国の言語(母国語)による国名となっている。また、項目Dに示される単語は、国名の略称となっている。   In the country name identification word DB 35, country name identification words for identifying each country are registered for each country. For example, as shown in item C and item D in FIG. 10, a plurality of types of information indicating a plurality of types of description formats are registered for each country. In the example of FIG. 10, the word shown in the item C is a country name in the language (native language) of the country. Moreover, the word shown in the item D is an abbreviation for the country name.

一方、宛名情報判定部102には、シール記載情報検出部(検出手段)41、住所フォーマット検出部(検出手段)42、住所用単語検出部(検出手段)43、配達区域コード形式検出部(検出手段)44、国名識別単語検出部(検出手段)45、シール記載情報照合部(照合手段)51、住所フォーマット照合部(照合手段)52、住所用単語照合部(照合手段)53、配達区域コード形式照合部(照合手段)54、国名識別単語照合部(照合手段)55、および判定部(判定手段)60が備えられる。   On the other hand, the address information determination unit 102 includes a sticker information detection unit (detection unit) 41, an address format detection unit (detection unit) 42, an address word detection unit (detection unit) 43, and a delivery area code format detection unit (detection). Means) 44, country name identification word detection section (detection means) 45, seal description information collation section (collation means) 51, address format collation section (collation means) 52, address word collation section (collation means) 53, delivery area code A format collation unit (collation unit) 54, a country identification word collation unit (collation unit) 55, and a determination unit (determination unit) 60 are provided.

シール記載情報検出部41は、識別部101により認識された情報から、シール74の記載情報を検出するものである(シール74の有無の検出も含む)。住所フォーマット検出部42は、識別部101により認識された宛名領域71の情報から、住所フォーマットを検出するものである。住所用単語検出部43は、識別部101により認識された宛名領域71の情報から、住所に含まれる特定の単語を検出するものである。配達区域コード形式検出部44は、識別部101により認識された上記宛名領域71の情報から、配達区域コードの記載形式を検出するものである。国名識別単語検出部45は、識別部101により認識された宛名領域71の情報から、国名識別単語を検出するものである。なお、配達区域コードや国名識別単語が宛名領域71に記載されていない場合には、当然のごとく、当該配達区域コードや国名識別単語は検出されない。   The seal description information detection unit 41 detects the description information of the seal 74 from the information recognized by the identification unit 101 (including detection of the presence or absence of the seal 74). The address format detection unit 42 detects the address format from the information of the address area 71 recognized by the identification unit 101. The address word detection unit 43 detects a specific word included in the address from the information of the address area 71 recognized by the identification unit 101. The delivery area code format detection unit 44 detects the description format of the delivery area code from the information of the address area 71 recognized by the identification unit 101. The country name identification word detection unit 45 detects a country name identification word from the information in the address area 71 recognized by the identification unit 101. If no delivery area code or country name identification word is described in the address area 71, the delivery area code or country name identification word is not detected as a matter of course.

シール記載情報照合部51は、シール記載情報DB31を参照して、シール記載情報検出部41により検出されたシール記載情報の照合を行うものである(例えば、検出されたシール記載情報が、シール記載情報DB31中に用意されたタイプA,タイプB,タイプC,…のいずれか1つに該当すれば、郵便物Pが国外向けの便であることを示す結果を出力し、一方該当するものがなければ、その他の便であることを示す結果を出力する)。住所フォーマット照合部52は、住所フォーマットDB32を参照して、住所フォーマット検出部42により検出された住所フォーマットの照合を行うものである(例えば、検出された住所フォーマットが属している国グループを示す情報を出力する)。住所用単語照合部53は、住所用単語DB33を参照して、住所用単語検出部43により検出された単語の照合を行うものである。なお、この際に、アルファベット列に関するbi-gram情報やtri-gram情報などの連接情報(連関情報)を援用するにより、当該単語同士の照合を行うようにしてもよい。配達区域コード形式照合部54は、配達区域コード形式情報DB34を参照して、配達区域コード形式検出部44により検出された配達区域コードの記載形式の照合を行うものである。国名識別単語照合部55は、国名識別単語DB35を参照して、国名識別単語検出部45により検出された国名識別単語の照合を行うものである。なお、上記照合部52〜55による各照合結果は、国別に、例えば点数の形で表現される。   The seal description information collation unit 51 refers to the seal description information DB 31 and collates the seal description information detected by the seal description information detection unit 41 (for example, the detected seal description information is the seal description If any one of type A, type B, type C,... Prepared in the information DB 31 is applicable, a result indicating that the postal matter P is a flight destined for a foreign country is output. If not, output a result indicating that it is another flight). The address format verification unit 52 refers to the address format DB 32 and performs verification of the address format detected by the address format detection unit 42 (for example, information indicating a country group to which the detected address format belongs). Is output). The address word collation unit 53 refers to the address word DB 33 and collates the words detected by the address word detection unit 43. At this time, the words may be collated by using connection information (association information) such as bi-gram information and tri-gram information related to the alphabet string. The delivery area code format collation unit 54 refers to the delivery area code format information DB 34 and collates the description format of the delivery area code detected by the delivery area code format detection unit 44. The country name identification word collation unit 55 refers to the country name identification word DB 35 and collates the country name identification word detected by the country name identification word detection unit 45. In addition, each collation result by the collation parts 52-55 is expressed in the form of points, for example, for each country.

判定部60は、国際便判定部60Aと国名判定部60Bとを含んでいる。
国際便判定部60Aは、シール記載情報照合部51、住所フォーマット照合部52、住所用単語照合部53、配達区域コード形式照合部54、および国名識別単語照合部55(もしくは、それらの一部)による各照合結果に基づき、上記郵便物Pが国外向けの便であるか否かを判定するものである。例えば、国際便判定部60Aは、各照合部51〜55による照合結果をそれぞれ点数の形で取得し、その集計結果が閾値を超えたか否かに応じて判定を行うようにしてもよい。また、この際、各照合部52〜55による照合結果の点数に、それぞれ異なる重み係数を乗算した上で、集計を行うようにしてもよい。上記国際便判定部60Aは、例えば、シール記載情報照合部51および住所フォーマット照合部52の照合結果だけに基づいて判定を行うことも可能である。
Determination unit 60 includes an international flight determination unit 60A and a country name determination unit 60B.
The international flight determination unit 60A includes a sticker description information verification unit 51, an address format verification unit 52, an address word verification unit 53, a delivery area code format verification unit 54, and a country name identification word verification unit 55 (or a part thereof). It is determined whether the postal matter P is a flight for overseas. For example, the international flight determination unit 60A may acquire the collation results by the collation units 51 to 55 in the form of points, and may perform the determination according to whether or not the aggregation result exceeds a threshold value. At this time, the totals may be calculated after multiplying the points of the collation results obtained by the collation units 52 to 55 by different weighting factors. The international flight determination unit 60 </ b> A can also make a determination based only on the collation results of the sticker description information collation unit 51 and the address format collation unit 52, for example.

国名判定部60Bは、上記国際便判定部60Aにより郵便物Pが国外向けの便であると判定された場合に、シール記載情報照合部51、住所フォーマット照合部52、住所用単語照合部53、配達区域コード形式照合部54、および国名識別単語照合部55(もしくは、それらの一部)による各照合結果に基づき、上記郵便物Pの宛先となる国名を判定するものである。例えば、国名判定部60Bは、各照合部53〜55による照合結果をそれぞれ点数の形で国別に取得し、各点数の合計が最も高い国が郵便物の宛先であるものと判定する。また、この際、各照合部53〜55による照合結果の点数に、それぞれ異なる重み係数を乗算した上で、国毎の点数の合計を算出するようにしてもよい(例えば、配達区域コード形式照合部54による照合結果に対しては係数=0.8を掛け、国名識別単語照合部55による照合結果に対しては係数=0.5を掛け、住所用単語照合部53による照合結果に対しては係数=0.4を掛けて、得られたそれぞれの数値を国毎に合計するようにしてもよい)。これにより、国名判定の精度を一層高めることが可能となる。   When the international mail determination unit 60A determines that the postal matter P is a flight destined for a foreign country, the country name determination unit 60B has a seal description information verification unit 51, an address format verification unit 52, an address word verification unit 53, The country name which is the destination of the postal matter P is determined based on the respective matching results by the delivery area code format matching unit 54 and the country name identification word matching unit 55 (or part of them). For example, the country name determination unit 60B obtains the collation results obtained by the collation units 53 to 55 by country in the form of points, and determines that the country having the highest total score is the destination of the mail. At this time, the total of the scores for each country may be calculated after multiplying the scores of the matching results by the matching units 53 to 55 by different weighting factors (for example, delivery area code format matching) The matching result by the unit 54 is multiplied by a coefficient = 0.8, the matching result by the country name identification word matching unit 55 is multiplied by a coefficient = 0.5, and the matching result by the address word matching unit 53 is multiplied. May be multiplied by a coefficient = 0.4 and the obtained numerical values may be summed up for each country). As a result, the accuracy of country name determination can be further increased.

なお、図6の構成例では、i)シール記載情報DB31とシール記載情報検出部41とシール記載情報照合部51との組合せ、ii)住所フォーマットDB32と住所フォーマット検出部42と住所フォーマット照合部52との組合せ、iii)住所用単語DB33と住所用単語検出部43と住所用単語照合部53との組合せ、iv)配達区域コード形式情報DB34と配達区域コード形式検出部44と配達区域コード形式照合部54との組合せ、およびv)国名識別単語DB35と国名識別単語照合部45と国名識別単語照合部55との組合せの全てを設けた場合が示されているが、必ずしも全ての組合せを設ける必要はなく、少なくともいずれか一つの組合せがあればよい。   In the configuration example of FIG. 6, i) a combination of the sticker description information DB 31, the sticker description information detection unit 41, and the sticker description information verification unit 51 ii) the address format DB 32, the address format detection unit 42, and the address format verification unit 52. Iii) Combination of address word DB 33, address word detecting unit 43 and address word collating unit 53, iv) Delivery area code format information DB 34, delivery area code format detecting unit 44, and delivery area code format collation The combination with the unit 54, and v) the case where all the combinations of the country name identification word DB 35, the country name identification word matching unit 45, and the country name identification word matching unit 55 are shown are shown, but all combinations need to be provided. There is at least any one combination.

次に、図11を参照して、本実施形態における宛名情報判定の動作を説明する。
事前に、シール記載情報DB31、住所フォーマットDB32、住所用単語DB33、配達区域コード形式情報DB34、国名識別単語DB35などの各種DBが事前に作成され、記憶部103に保管される(ステップS1)。
Next, with reference to FIG. 11, the address information determination operation in the present embodiment will be described.
Various DBs such as a sticker description information DB 31, an address format DB 32, an address word DB 33, a delivery area code format information DB 34, and a country name identification word DB 35 are created in advance and stored in the storage unit 103 (step S1).

郵便物Pが区分機1に供給されると、当該郵便物Pの情報がスキャナ部3により読取られ(ステップS2)、認識部101において郵便物P上の宛名領域71の認識が行われる(ステップS3)。   When the postal matter P is supplied to the sorting machine 1, the information of the postal matter P is read by the scanner unit 3 (step S2), and the recognition unit 101 recognizes the address area 71 on the postal matter P (step S2). S3).

シール記載情報検出部41では、認識部101で認識したシール74から、シール記載情報が検出される。そして、シール記載情報照合部51では、シール記載DB31を参照することにより、上記検出したシール記載情報の照合が行われる(ステップS4)。   The seal description information detection unit 41 detects seal description information from the seal 74 recognized by the recognition unit 101. Then, the seal description information collating unit 51 collates the detected seal description information with reference to the seal description DB 31 (step S4).

住所フォーマット検出部42では、認識部101で認識した宛名領域71の情報から、住所フォーマットが検出される。そして、住所フォーマット照合部52では、住所フォーマットDB32を参照することにより、上記検出した住所フォーマットの照合が行われる(ステップS5)。   The address format detection unit 42 detects the address format from the information of the address area 71 recognized by the recognition unit 101. Then, the address format collation unit 52 collates the detected address format with reference to the address format DB 32 (step S5).

住所用単語検出部43では、認識部101で認識した宛名領域71の情報から、住所に含まれる特定の単語が検出される。そして、住所用単語照合部53では、住所用単語DB33を参照することにより、上記検出した単語の照合が行われる(ステップS6)。   The address word detection unit 43 detects a specific word included in the address from the information of the address area 71 recognized by the recognition unit 101. The address word matching unit 53 matches the detected word by referring to the address word DB 33 (step S6).

配達区域コード形式検出部44では、認識部101で認識した宛名領域71の情報から、配達区域コードの記載形式が検出される。そして、配達区域コード形式照合部54では、配達区域コード形式情報DB34を参照することにより、上記検出した配達区域コードの記載形式の照合が行われる(ステップS7)。   The delivery area code format detection unit 44 detects the delivery area code description format from the information of the address area 71 recognized by the recognition unit 101. The delivery area code format collation unit 54 collates the description format of the detected delivery area code by referring to the delivery area code format information DB 34 (step S7).

国名識別単語検出部45では、認識部101で認識した宛名領域71の情報から、国名識別単語が検出される。そして、国名識別単語照合部55では、国名識別単語DB35を参照することにより、上記検出した国名識別単語の照合が行われる(ステップS8)。   The country name identification word detection unit 45 detects the country name identification word from the information in the address area 71 recognized by the recognition unit 101. Then, the country name identification word collating unit 55 collates the detected country name identification word with reference to the country name identification word DB 35 (step S8).

最後に、国際便判定部60Aにおいて、上記5つの照合のうち少なくとも1つの照合結果に基づき、郵便物Pが国外向けの便であるか否かが判定される。郵便物Pが国内向けの便である場合は、国内向けの住所判定を行う住所判定部104に制御が渡される。一方、郵便物Pが国外向けの便である場合は、国名判定部60Bにおいて、上記5つの照合のうち少なくとも1つの照合結果に基づき、郵便物Pの宛先となる国名が判定される(ステップS9)。   Finally, the international flight determination unit 60A determines whether or not the postal matter P is an international flight based on at least one of the above five verifications. If the postal item P is a domestic flight, control is passed to the address determination unit 104 that performs domestic address determination. On the other hand, when the postal matter P is a flight destined for a foreign country, the country name determination unit 60B determines the name of the country that is the destination of the postal matter P based on at least one of the above five verifications (step S9). ).

このように本実施形態によれば、国際郵便に添付されたシール等を見て宛先の国名などを判断し区分するような手作業が不要となり、無駄な手間や時間を削減することが可能となる。また、あらゆる国の膨大な住所データを十分記憶できるほどの容量を有する記憶媒体などを設ける必要がないので、余計なコストがかからない。   As described above, according to the present embodiment, it is not necessary to perform manual work such as judging and categorizing the destination country name by looking at a sticker attached to an international mail, and it is possible to reduce unnecessary labor and time. Become. In addition, since there is no need to provide a storage medium having a capacity sufficient to store a large amount of address data in any country, no extra cost is incurred.

なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。   Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

本発明の一実施形態に係わる区分機を示す外観図。The external view which shows the sorter concerning one Embodiment of this invention. 同区分機の概略構成を示す図。The figure which shows schematic structure of the sorting machine. 郵便物に付されている紙葉類の表面を説明するための図。The figure for demonstrating the surface of the paper sheets attached | subjected to the mail. 紙葉類上の宛名領域に含まれる情報を説明するための図。The figure for demonstrating the information contained in the address area | region on paper sheets. 情報処理部の詳細を示すブロック図。The block diagram which shows the detail of an information processing part. 宛名情報判定部および記憶部の詳細を示すブロック図。The block diagram which shows the detail of an address information determination part and a memory | storage part. シール記載情報DBに登録される情報の例を示す図。The figure which shows the example of the information registered into sticker description information DB. 住所フォーマットDBに登録される情報の例を示す図。The figure which shows the example of the information registered into address format DB. 住所用単語DBに登録される情報の例を示す図。The figure which shows the example of the information registered into word DB for addresses. 配達区域コード形式情報DBおよび国名識別単語DBに登録される情報の例を示す図。The figure which shows the example of the information registered into delivery area code format information DB and country name identification word DB. 国名判定の動作を説明するためのフローチャート。The flowchart for demonstrating operation | movement of a country name determination.

符号の説明Explanation of symbols

1…区分機、2…供給部、3…スキャナ部、4…搬送部、5…区分部、10…情報処理部、11…制御部、31…シール記載情報DB、32…住所フォーマットDB、33…住所用単語DB、34…配達区域コード形式情報DB、35…国名識別単語DB、41…シール記載情報検出部、42…住所フォーマット検出部、43…住所用単語検出部、44…配達区域コード形式検出部、45…国名識別単語検出部、51…シール記載情報照合部、52…住所フォーマット照合部、53…住所用単語照合部、54…配達区域コード形式照合部、55…国名識別単語照合部、60…判定部、60A…国際便判定部、60B…国名判定部、71…宛名領域、72…文書領域、73…切手、74…シール、81…住所(又は居所)、82…配達区域コード、83…国名識別単語、101…認識部、102…宛名情報判定部、103…記憶部、104…住所判定部。   DESCRIPTION OF SYMBOLS 1 ... Sorting machine, 2 ... Supply part, 3 ... Scanner part, 4 ... Conveyance part, 5 ... Sorting part, 10 ... Information processing part, 11 ... Control part, 31 ... Sticker description information DB, 32 ... Address format DB, 33 ... Address word DB, 34 ... Delivery area code format information DB, 35 ... Country identification word DB, 41 ... Sticker description information detection section, 42 ... Address format detection section, 43 ... Address word detection section, 44 ... Delivery area code Format detector 45 ... Country name identification word detector 51 ... Sticker description information verification unit 52 ... Address format verification unit 53 ... Address word verification unit 54 ... Delivery area code format verification unit 55 ... Country name identification word verification Part 60 ... determination part 60A ... international flight judgment part 60B ... country name determination part 71 ... address area 72 ... document area 73 ... stamp 74 ... seal 81 ... address (or residence) 82 ... delivery area Co , 83 ... country name identifying words, 101 ... recognition unit, 102 ... address information determining unit, 103 ... storage unit, 104 ... address determination unit.

Claims (12)

宛先が記載された配達物の区分処理を行う区分装置であって、
i)所定の国において国外向けの便であることを示すシールの記載情報が登録されているシール記載情報データベース、ii)住所の記載を構成している個々の要素の配列に関する複数種類の住所フォーマットが国グループ別に登録されている住所フォーマットデータベース、iii)各国の住所の記載に使用される特定の単語が母国語で国別に登録されている住所用単語データベース、iv)各国の配達区域コードの記載形式を示す情報が国別に登録されている配達区域コード形式情報データベース、およびv)各国を識別するための国名識別単語が国別に登録されている国名識別単語データベースのうち、少なくともいずれか一つを記憶している記憶手段と、
上記配達物に付された紙葉類上の情報を読取る読取手段と、
上記読取手段により読取られた情報から、上記紙葉類上の宛名領域を認識する認識手段と、
上記認識手段により認識された上記宛名領域の情報から、i)上記シールの記載情報を検出すること、ii)住所の記載を構成している個々の要素の配列に関する住所フォーマットを検出すること、iii)住所に含まれる特定の単語を検出すること、iv)配達区域コードの記載形式を検出すること、およびv)国名識別単語を検出することのうち、少なくともいずれか一つを行う検出手段と、
i)上記記憶手段における上記シール記載情報データベースを参照して、上記検出手段により検出されたシール記載情報の照合を行うこと、ii)上記記憶手段における上記住所フォーマットデータベースを参照して、上記検出手段により検出された住所フォーマットの照合を行うこと、iii)上記記憶手段における上記住所用単語データベースを参照して、上記検出手段により検出された単語の照合を行うこと、iv)上記記憶手段における上記配達区域コード形式情報データベースを参照して、上記検出手段により検出された配達区域コードの記載形式の照合を行うこと、およびv)上記記憶手段における上記国名識別単語データベースを参照して、上記検出手段により検出された国名識別単語の照合を行うことのうち、少なくともいずれか一つを行う照合手段と、
上記照合手段による各照合結果に基づき、上記配達物が国外向けの便であるか否かを判定する第1の判定手段と、
を具備することを特徴とする区分装置。
A sorting device that performs sorting processing of deliveries with destinations,
i) seal description information database in which seal description information indicating that the flight is for a foreign country in a given country is registered; ii) a plurality of types of address formats related to the arrangement of individual elements constituting the address description Iii) Address word database in which specific words used to describe addresses in each country are registered in their native languages and iv) Delivery area codes in each country At least one of a delivery area code format information database in which information indicating the format is registered by country, and v) a country name identification word database in which country name identification words for identifying each country are registered by country Storing storage means; and
Reading means for reading information on a paper sheet attached to the delivery item;
Recognition means for recognizing the address area on the paper sheet from the information read by the reading means;
I) detecting the description information of the seal from the information of the address area recognized by the recognition means, ii) detecting the address format relating to the arrangement of the individual elements constituting the description of the address, iii Detecting means for performing at least one of:) detecting a specific word included in an address; iv) detecting a description format of a delivery area code; and v) detecting a country name identification word;
i) collating the seal description information detected by the detection means with reference to the seal description information database in the storage means; ii) referring to the address format database in the storage means; Iii) collating the words detected by the detecting means with reference to the address word database in the storage means, iv) delivering the delivery in the storage means Referring to the area code format information database, and verifying the description format of the delivery area code detected by the detection means, and v) referring to the country identification word database in the storage means, by the detection means At least one of collation of detected country name identification words And matching means for performing,
First determination means for determining whether or not the delivery is a foreign flight based on each verification result by the verification means;
A sorting apparatus comprising:
上記第1の判定手段により上記配達物が国外向けの便であると判定された場合に、上記照合手段による各照合結果に基づき、上記配達物の宛先となる国名を判定する第2の判定手段を更に具備することを特徴とする請求項1記載の区分装置。   Second determination means for determining a country name which is a destination of the delivery based on each collation result by the collating means when the first judging means determines that the delivery is a flight destined for overseas. The sorting apparatus according to claim 1, further comprising: 上記住所用単語データベースには、各国における区域もしくは通りを表す単語が国別に登録されていることを特徴とする請求項2記載の区分装置。   3. The sorting apparatus according to claim 2, wherein a word representing an area or street in each country is registered in each address word database. 上記照合手段は2つ以上の照合を行い、
上記第2の判定手段は、上記照合手段による各照合結果をそれぞれ点数として国別に取得し、各点数の合計が最も高い国が上記配達物の宛先であるものと判定することを特徴とする請求項2または請求項3に記載の区分装置。
The verification means performs two or more verifications,
The second determination unit obtains each collation result obtained by the collation unit as a score for each country, and determines that the country having the highest total score is the destination of the delivery item. The sorting apparatus according to claim 2 or claim 3.
上記第2の判定手段は、上記照合手段による各照合結果の点数に、それぞれ異なる重み係数を乗算した上で、国毎の点数の合計を算出することを特徴とする請求項4記載の区分装置。   5. The sorting apparatus according to claim 4, wherein the second determination means calculates the total of the scores for each country after multiplying the score of each collation result by the collation means by a different weighting factor. . 上記住所用単語データベースには、各国において住所の記載に使用される各種の単語が使用頻度の高い順に登録されており、
上記第2の判定手段は、使用頻度の高い単語ほど高い点数を割り当てた上で、国毎の点数の合計を算出することを特徴とする請求項4記載の区分装置。
In the above address word database, various words used to describe addresses in each country are registered in order of frequency of use.
5. The sorting apparatus according to claim 4, wherein the second determining means calculates a total score for each country after assigning a higher score to a frequently used word.
宛先が記載された配達物の区分処理を行う区分装置に適用される宛名情報判定方法であって、
i)所定の国において国外向けの便であることを示すシールの記載情報が登録されているシール記載情報データベース、ii)住所の記載を構成している個々の要素の配列に関する複数種類の住所フォーマットが国グループ別に登録されている住所フォーマットデータベース、iii)各国の住所の記載に使用される特定の単語が母国語で国別に登録されている住所用単語データベース、iv)各国の配達区域コードの記載形式を示す情報が国別に登録されている配達区域コード形式情報データベース、およびv)各国を識別するための国名識別単語が国別に登録されている国名識別単語データベースのうち、少なくともいずれか一つを記憶媒体に保管しておき、
上記配達物に付された紙葉類上の情報を読取り、
上記読取った情報から、上記紙葉類上の宛名領域を認識し、
上記認識した宛名領域の情報から、i)上記シールの記載情報を検出すること、ii)住所の記載を構成している個々の要素の配列に関する住所フォーマットを検出すること、iii)住所に含まれる特定の単語を検出すること、iv)配達区域コードの記載形式を検出すること、およびv)国名識別単語を検出することのうち、少なくともいずれか一つを行い、
i)上記記憶手段における上記シール記載情報データベースを参照して、上記検出手段により検出されたシール記載情報の照合を行うこと、ii)上記記憶手段における上記住所フォーマットデータベースを参照して、上記検出手段により検出された住所フォーマットの照合を行うこと、iii)上記記憶媒体における上記住所用単語データベースを参照して、上記検出した単語の照合を行うこと、iv)上記記憶媒体における上記配達区域コード形式情報データベースを参照して、上記検出した配達区域コードの記載形式の照合を行うこと、およびv)上記記憶媒体における上記国名識別単語データベースを参照して、上記検出した国名識別単語の照合を行うことのうち、少なくともいずれか一つを行い、
上記照合による各照合結果に基づき、上記配達物が国外向けの便であるか否かについて第1の判定を行う、
ことを特徴とする宛名情報判定方法。
A method for determining address information applied to a sorting device that performs sorting processing of deliveries with destinations,
i) seal description information database in which seal description information indicating that the flight is for a foreign country in a given country is registered; ii) a plurality of types of address formats related to the arrangement of individual elements constituting the address description Iii) Address word database in which specific words used to describe addresses in each country are registered in their native languages and iv) Delivery area codes in each country At least one of a delivery area code format information database in which information indicating the format is registered by country, and v) a country name identification word database in which country name identification words for identifying each country are registered by country Keep it in a storage medium,
Read the information on the paper attached to the delivery,
From the read information, recognize the address area on the paper sheet,
I) detecting the description information of the seal from the recognized address area information, ii) detecting the address format relating to the arrangement of the individual elements constituting the address description, and iii) included in the address Detecting at least one of a specific word, iv) detecting a description format of a delivery area code, and v) detecting a country identification word,
i) collating the seal description information detected by the detection means with reference to the seal description information database in the storage means; ii) referring to the address format database in the storage means; Iii) collating the detected word with reference to the address word database in the storage medium, and iv) the delivery area code format information in the storage medium. Referring to the database, collating the description format of the detected delivery area code, and v) referring to the country name identification word database in the storage medium to collate the detected country name identification word. Do at least one of them,
A first determination is made as to whether or not the deliverable is a flight destined for a foreign country based on each collation result by the collation.
The address information determination method characterized by the above.
上記第1の判定により上記配達物が国外向けの便であると判定された場合に、上記照合による各照合結果に基づき、上記配達物の宛先となる国名について第2の判定を行うことを特徴とする請求項7記載の宛名情報判定方法。   When it is determined by the first determination that the delivery item is a flight destined for a foreign country, a second determination is made for the country name that is the destination of the delivery item based on the result of each verification by the verification. The address information determination method according to claim 7. 上記住所用単語データベースには、各国における区域もしくは通りを表す単語を国別に登録しておくことを特徴とする請求項8記載の宛名情報判定方法。   9. The address information determination method according to claim 8, wherein a word representing an area or street in each country is registered in the address word database for each country. 上記照合においては2つ以上の照合を行い、
上記第2の判定においては、上記照合による各照合結果をそれぞれ点数の形で国別に取得し、各点数の合計が最も高い国が上記配達物の宛先であるものと判定することを特徴とする請求項8または請求項9に記載の宛名情報判定方法。
In the above verification, two or more verifications are performed,
In the second determination, each collation result obtained by the collation is obtained for each country in the form of a score, and it is determined that the country having the highest total score is the destination of the delivery item. The address information determination method according to claim 8 or 9.
上記照合による各照合結果の点数に、それぞれ異なる重み係数を乗算した上で、国毎の点数の合計を算出することを特徴とする請求項10記載の宛名情報判定方法。   11. The address information determination method according to claim 10, wherein the sum of the scores for each country is calculated after multiplying the score of each result of matching by a different weighting factor. 上記住所用単語データベースには、各国において住所の記載に使用される各種の単語を使用頻度の高い順に登録しておき、
上記第2の判定においては、使用頻度の高い単語ほど高い点数を割り当てた上で、国毎の点数の合計を算出することを特徴とする請求項10記載の宛名情報判定方法。
In the address word database, various words used for address descriptions in each country are registered in order of frequency of use,
11. The address information determination method according to claim 10, wherein, in the second determination, a higher score is assigned to a word that is used more frequently, and a total score for each country is calculated.
JP2004185430A 2003-07-08 2004-06-23 Classification device and method for address information identification Abandoned JP2005040786A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004185430A JP2005040786A (en) 2003-07-08 2004-06-23 Classification device and method for address information identification

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003193792 2003-07-08
JP2004185430A JP2005040786A (en) 2003-07-08 2004-06-23 Classification device and method for address information identification

Publications (1)

Publication Number Publication Date
JP2005040786A true JP2005040786A (en) 2005-02-17

Family

ID=34277227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004185430A Abandoned JP2005040786A (en) 2003-07-08 2004-06-23 Classification device and method for address information identification

Country Status (1)

Country Link
JP (1) JP2005040786A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013192969A (en) * 2012-03-15 2013-09-30 Toshiba Corp Address recognition apparatus and address recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013192969A (en) * 2012-03-15 2013-09-30 Toshiba Corp Address recognition apparatus and address recognition system

Similar Documents

Publication Publication Date Title
KR100323350B1 (en) Detecting apparatus for destination of postal matter and classification apparatus thereof
US20050137991A1 (en) Method and system for name and address validation and correction
EP1736913A1 (en) Information processing apparatus having learning function for character dictionary
JP4855698B2 (en) Address recognition device
JPH0739820A (en) Street zone recognizing device and address reading and classifying machine
JP5433470B2 (en) Address database construction device and address database construction method
JP2005040786A (en) Classification device and method for address information identification
JP5178851B2 (en) Address recognition device
EP1496460A1 (en) Sorting apparatus and address information determination method
JPH07271899A (en) Character recognition device
JPH0957199A (en) Address reading apparatus and mail-sorting apparatus
JP3162552B2 (en) Mail address recognition device and address recognition method
JPH09192609A (en) Address recognizer, postal items sorter and postal items handling system
JPH08103730A (en) Method and device for recognizing address and paper and leaflet automatic processing system
JP3088036B2 (en) Address reading sorting machine
JPH0739816A (en) Address reading device
JP3088038B2 (en) Mail sorting device and mail sorting method
JP4659947B2 (en) Reading device, reading method, sorting device, and sorting method
JP2007075761A (en) Sorting device and sorting method
JPH11207265A (en) Information processing device and mail processing device
JPH0739819A (en) Address reading and classifying device
JP3450608B2 (en) Address recognition device, address recognition method, sorting device, sorting method
JP2003141443A (en) Recognizing device, sorter, recognizing method and sorting method
JPH0975857A (en) Address reading apparatus, sorting machine, and address reading method
JPH0975859A (en) Method and apparatus for recognizing zip code and sorting machine

Legal Events

Date Code Title Description
A621 Written request for application examination

Effective date: 20070515

Free format text: JAPANESE INTERMEDIATE CODE: A621

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20080912