KR100286163B1 - Address recognition method, address recognition device and paper sheet automatic processing system - Google Patents

Address recognition method, address recognition device and paper sheet automatic processing system Download PDF

Info

Publication number
KR100286163B1
KR100286163B1 KR1019950024342A KR19950024342A KR100286163B1 KR 100286163 B1 KR100286163 B1 KR 100286163B1 KR 1019950024342 A KR1019950024342 A KR 1019950024342A KR 19950024342 A KR19950024342 A KR 19950024342A KR 100286163 B1 KR100286163 B1 KR 100286163B1
Authority
KR
South Korea
Prior art keywords
name
neighborhood
character
address
neighborhood name
Prior art date
Application number
KR1019950024342A
Other languages
Korean (ko)
Other versions
KR960008620A (en
Inventor
니시지마야스오
사까마또야스하루
야마우찌도시후미
가네꼬이찌로
Original Assignee
가네꼬 히사시
닛뽕덴끼 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가네꼬 히사시, 닛뽕덴끼 가부시끼가이샤 filed Critical 가네꼬 히사시
Publication of KR960008620A publication Critical patent/KR960008620A/en
Application granted granted Critical
Publication of KR100286163B1 publication Critical patent/KR100286163B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

[목적] 방대한 수의 동네이름을 등록하는 일 없이 주소를 고속·고정도로 읽어낸다.[Purpose] Read addresses quickly and accurately without registering a large number of neighborhood names.

[구성] 지엽류상에 기재되는 동네이름별로 대응하는 동네이름 코드, 도도부현시구 동네이름 및 주거표시번호를 포함하는 주소를 나타내는 입력문자열을 화상추출하고, 화상추출된 입력문자열을 1 문자별로 슬라이스하여, 각각의 문자를 미리 문자정보가 등록된 문자사전 (105) 의 내용과 조회하고 문자인식하는 문자인식부 (104) 와, 문자인식부 (104) 에 있어서의 문자인식결과에 의거하여 입력문자열의 각 문자의 문자종류를 판정하는 문자종류 판정부 (106) 와, 입력문자열을 선두부분으로부터 순차 문자종류를 체크해 가고, 동네이름 코드 및 주거표시번호를 검출하고, 검출된 동네이름 코드 및 주거표시번호를 함께 주소로서 인식하는 주소인식부 (107) 를 갖는다.[Configuration] Image extraction of input strings indicating addresses including neighborhood name codes, prefectural prefecture neighborhood names, and residential display numbers corresponding to neighborhood names listed on paper sheets, and sliced image extracted input strings by 1 character The character recognition section 104, which inquires each character in advance of the contents of the character dictionary 105 in which the character information is registered and the character recognition section, and the character recognition section of the input string based on the character recognition result in the character recognition section 104 A character type determination unit 106 that determines the character type of each character, and checks the character type sequentially from the head of the input string, detects the neighborhood name code and the residential display number, and detects the detected neighborhood name code and the residential display number. Has an address recognition unit 107 that recognizes as an address together.

Description

주소인식방법, 주소인식장치 및 지엽류 자동처리 시스템Address recognition method, address recognition device and paper sheet automatic processing system

제1도는 본 발명의 제 1 의 실시형태 (실시형태 1) 의 구성을 나타내는 블럭도.1 is a block diagram showing a configuration of a first embodiment (Embodiment 1) of the present invention.

제2도는 지엽류에 기재된 주소의 일예를 나타내는 도면.2 is a diagram showing an example of an address described in a paper sheet.

제3도는 문자사전의 일예를 나타내는 도면.3 is a diagram showing an example of a text dictionary.

제4도는 실시형태 1 의 동작을 설명하기 위한 플로우 차트.4 is a flow chart for explaining the operation of the first embodiment.

제5도는 입력문자열과 문자위치 P (ⅰ) 와의 관계, 사전 NO. D(j) 와 사전, 카테고리, 문자종류와의 관계, r (ⅰ) 에 격납되는 조회결과의 카테고리, 문자인식부로부터 출력되는 문자인식결과를 나타내는 도면.5 shows the relation between input string and character position P (P), dictionary NO. A diagram showing a relationship between D (j), a dictionary, a category, and a character type, a category of an inquiry result stored in r (iii), and a character recognition result output from the character recognition unit.

제6도는 문자종류와 카테고리와의 관계, f (1)~f (m) 에 격납되는 최종결과의 카테고리, 문자종류 판정부로부터 출력되는 문자종류판정 결과를 나타내는 도면.6 is a diagram showing a relationship between a character type and a category, a category of the final result stored in f (1) to f (m), and a character type determination result output from the character type determination unit.

제7도는 본 발명의 제 2 형태 (실시형태 2) 의 구성을 나타내는 블럭도.7 is a block diagram showing a configuration of a second embodiment (Embodiment 2) of the present invention.

제8도는 동네이름 문자수 테이블의 일예를 나타내는 도면.8 is a diagram showing an example of the neighborhood name character table.

제9도는 시구명 테이블의 일예를 나타내는 도면.9 is a diagram illustrating an example of a city name table.

제10도는 실시형태 2 의 동작을 설명하기 위한 플로우 챠트.10 is a flowchart for explaining the operation of the second embodiment.

제11도는 본 발명의 제 3 의 실시형태 (실시형태 3) 의 구성을 나타내는 블럭도.11 is a block diagram showing the configuration of a third embodiment (Embodiment 3) of the present invention.

제12도는 시구명 테이블의 일예를 나타내는 도면.12 is a diagram illustrating an example of a city name table.

제13도는 동네이름 테이블의 일예를 나타내는 도면.13 is a view showing an example of the neighborhood name table.

제14도는 실시형태 3 의 동작을 설명하기 위한 플로우 챠트.14 is a flow chart for explaining the operation of the third embodiment.

제15도는 인식한 주소를 바코드 코드로 변환하고 지엽류상에 인자하여 처리를 행하는 우편물 자동처리 시스템의 개요를 예시하는 도면.FIG. 15 is a diagram illustrating an outline of an automatic mail processing system that converts a recognized address into a barcode code, prints on paper sheets, and performs processing; FIG.

제16도는 중국 및 한국의 우편물의 예를 나타내는 도면.FIG. 16 is a diagram showing examples of mail items in China and Korea.

제17도는 종래의 주소 인식장치의 구성을 나타내는 블럭도.17 is a block diagram showing the structure of a conventional address recognition apparatus.

〈도면의 주요부분에 대한 부호의 설명〉<Explanation of symbols for main parts of drawing>

101 : 화상추출부 102 : 주소위치검출부101: image extraction unit 102: address position detection unit

103 : 문자 슬라이스부 104 : 문자인식부103: character slice portion 104: character recognition portion

105 : 문자사전 106 : 문자종류 판정부105: character dictionary 106: character type determination unit

107 : 주소인식부 201 : 동네이름 문자수 검색부107: address recognition unit 201: neighborhood name character search unit

202 : 동네이름 문자수 테이블 203 : 시구명 검색부202: the number of characters in the neighborhood name table 203: city name search unit

204 : 시구명 테이블 205 : 주소인식부204: City name table 205: Address recognition unit

301 : 시구명 검색부 302 : 시구명 테이블301: City name search unit 302: City name table

303 : 동네이름 검색부 304 : 동네이름 테이블303: neighborhood name search unit 304: neighborhood name table

305 : 동네이름 문자수 검색부 306 : 주소인식부305: character name search unit neighborhood name 306: address recognition unit

1 A : 동네이름 코드 1 B : 시구명/동네이름1 A: Neighborhood name code 1 B: City name / neighborhood name

1 C : 주거표시번호1 C: Residential labeling number

본 발명은, 지엽류 구분기 등에 있어서 지엽류상에 기재된 주소를 고속이면서 고정도(高精度) 로 일어내는 주소인식방법, 주소인식장치 및 그 읽어낸 주소를 바코드에 변환하여 지엽류상에 인자하고 처리하는 지엽류 자동처리 시스템에 관한 것이다.The present invention relates to an address recognition method for generating an address written on a paper sheet at a high speed and high accuracy in a paper sheet classifier, an address recognition device and the read address, and converts it into a barcode to print and process on a paper sheet. It relates to a paper sheet automatic processing system.

종래의 주소인식장치에 대해서 제 17 도를 참조하여 설명한다. 이 주소인식장치에서는, 먼저, 화상추출부 (121) 에 있어서, 지엽류상에 기재된 문자패턴이 입력되어서 화상신호로 변환되고, 화상신호중 주소에 해당하는 부분의 문자패턴이 추출된다. 그리고, 문자 인식부 (122) 에 있어서 화상 추출부 (121) 에서 추출된 문자패턴에 대해서, 문자 슬라이스처리가 행해진다. 그리고, 이후, 문자인식부 (122) 에서, 사전 (123) 에 미리 격납되어 있는 문자와 1 문자별로 슬라이스된 문자가 비교되고, 문자인식이 행해진다.A conventional address recognition apparatus will be described with reference to FIG. In this address recognition apparatus, first, in the image extraction unit 121, the character pattern described on the paper sheet is input, converted into an image signal, and the character pattern of the part corresponding to the address in the image signal is extracted. Then, the character slice processing is performed on the character pattern extracted by the image extraction unit 121 in the character recognition unit 122. Then, in the character recognition unit 122, the characters previously stored in the dictionary 123 and the characters sliced for each character are compared, and character recognition is performed.

다음에, 단어인식부 (124) 에 있어서, 문자인식부 (122) 에서 인식된 문자열에 대하여, 미리 단어가 격납된 단어사전 (125) 으로부터 단어가 읽히고, 그 읽어낸 단어와 인식된 문자열을 비교조회함으로써, 단어인식이 행해진다. 그리고, 주소 인식부 (126) 에서, 미리 주소가 격납된 주소사전 (127) 으로부터 읽어낸 주소와 단어인식부 (124) 에서 인식된 단어를 비교조회함으로써, 주소인식이 행해진다.Next, in the word recognition unit 124, a word is read from the word dictionary 125 in which the word is stored in advance with respect to the character string recognized by the character recognition unit 122, and the read word is compared with the recognized character string. By inquiring, word recognition is performed. Then, the address recognition unit 126 compares the address read out from the address dictionary 127 in which the address is stored in advance with the word recognized by the word recognition unit 124 to perform address recognition.

그리고, 읽어내기의 대상이 되는 주소명을 미리 주소사전에 등록해 두고, 지엽류상의 문자열의 읽어낸 결과와 주소사전으로부터 읽어낸 주소명을 비교조회하여, 주소명을 인식하는 방법에 대해서는, 에를 들면 일본국 특개평 2-181287 호 공보나 USPS 수신 주소자동읽어내기 구분기 (NEC 기보 통권 187 호 Vol. 38 No.4 P41~47 USPS 수신 주소자동읽어내기 구분기 (1985) 에 개시되어 있다.Then, register the address name to be read in advance in the address dictionary, compare the result of reading the string on the paper sheet with the address name read from the address dictionary, and refer to e. For example, Japanese Patent Application Laid-Open No. 2-181287 or USPS Receiving Address Automatic Reading Separator (NEC Publication No. 187 Vol. 38 No. 4 P41 to 47 USPS Receiving Address Automatic Reading Separator (1985)) is disclosed.

또, 지엽류상에 기재된 문자를 주사하고, 주사패턴을 단어단위로서 추출하는 단어추출수단과, 주소를 나타내는 미리 설정된 사전패턴을 격납하는 기억수단과, 단어추출수단으로부터 추출된 단어를 지엽류 상에 기재된 순서에 따라서 조회하면서 사전패턴과 비교하는 비교수단을 설치하고, 이 비교수단에서의 비교결과로부터 가장 유사도가 높은 조합을 선별함으로써 주소를 인식하는 방법에 대해서, 예를 들면 일본국 특공소 62-62388 호 공보에 개시되어 있다.In addition, word extraction means for scanning characters written on paper sheets and extracting scanning patterns as word units, storage means for storing a preset dictionary pattern indicating an address, and words extracted from the word extraction means on paper sheets. A method for recognizing an address by providing a comparison means for comparing with a prepattern while inquiring according to the described procedure, and selecting the combination having the highest similarity from the comparison result in the comparison means, for example, JP-A-62 62388 is disclosed.

그러나, 이와 같은 종래의 주소인식장치에서는, 읽기의 대상이 되는 주소명을 전부 주소사전에 등록하지 않으면 안된다. 예를 들면, 일본국에 있어서, 도도부현시구 (都道府縣市區) 명까지 약 3000 개, 동네이름까지 포함하면 약 120000 개의 주소명을 등록하지 않으면 안되며, 주소사전의 내용이 방대해 진다. 이로써, 장치가 대규모로 되어 버린다는 문제가 있었다. 또, 비교조회할 건수가 매우 많기 때문에, 처리속도가 매우 늦다는 문제도 있었다.However, in such a conventional address recognition apparatus, all address names to be read must be registered in advance of the address dictionary. For example, in Japan, about 3,000 prefectures and up to 120,000 address names must be registered, and the contents of address dictionaries become enormous. As a result, there is a problem that the apparatus becomes large. In addition, there is a problem that the processing speed is very slow because the number of comparison queries is very large.

본 발명은 이와 같은 문제를 해결하기 위하여 이루어진 것으로, 그 목적으로 하는 것은, 방대한 수의 동네이름을 등록하는 일 없이, 주소를 고속이면서 고정도로 읽을 수 있는 주소 인식방법 및 주소인식 장치를 제공하는 것에 있다. 또, 그 읽은 주소를 바코드로 변환하여 지엽류 상에 인자하고 처리하는 지엽류 자동처리 시스템을 제공하는 것에 있다.SUMMARY OF THE INVENTION The present invention has been made to solve such a problem, and an object thereof is to provide an address recognition method and an address recognition device capable of reading an address at high speed and with high accuracy without registering a large number of neighborhood names. have. Another object is to provide a paper sheet automatic processing system which converts the read address into a barcode and prints and processes the paper sheets.

이와 같은 목적을 달성하기 위하여, 제 1 및 2 발명 (청구항 제 1 항 에 관한 발명) 및 제 6 및 7 발명 (청구항 제 6 항에 관한 발명) 은, 지엽류 상에 기재되는 동네이름별로 대응하는 동네이름 코드, 지역명 (도도부현시구 동네이름) 및 주거표시번호를 포함하는 주소를 나타내는 입력문자열을 화상추출하고, 이 화상추출한 입력문자열을 1 문자별로 슬라이스하여, 각각의 문자를 미리 문자정보가 등록된 문자사전의 내용과 비교조회하여 문자인식하고, 이 문자인식결과에 의거하여 동네이름 코드 및 주거표시번호를 검출하고, 그 검출한 동네이름 코드 및 주거표시번호를 함께 주소로서 인식하고, 문자인식결과에 의거하여 입력문자열의 각 문자의 문자종류를 판정하는 것으로 하고, 입력문자열을 그 선두부분으로부터 순차 문자종류를 체크함으로써, 동네이름 코드 및 주거표시번호를 검출하도록 한 것이다.In order to achieve this object, the first and second inventions (invention according to claim 1) and the sixth and seventh inventions (invention according to claim 6) correspond to each neighborhood name described on the paper sheet. An image is extracted from an input string representing an address including a neighborhood name code, a district name (provincial prefecture's neighborhood name), and a housing display number, and the image extracted input string is sliced by one character, and each character is pre-text information. Character recognition is compared with the contents of the registered text dictionary, and the neighborhood name code and residential indication number are detected based on this character recognition result, and the detected neighborhood name code and residential indication number are recognized together as addresses, and Based on the recognition result, the character type of each character of the input string is determined, and the character string is sequentially checked from the head of the input string to determine the character type. It will have to detect a code name and number display housing.

예를 들면, 문자인식결과에 의거하여, 입력문자열의 각 문자의 문자종류(한자, 숫자, 기호 등의 구별) 를 판정하고, 입력문자열을 그 선두부분으로부터 순차 문자종류를 체크해 가고, 최초로 숫자 또는 기호가 연속하는 부분을 동네이름 코드로 보고, 또, 문자종류의 변화에 의거하여, 예를 들면, 입력문자열에 있어서 한자로부터 숫자나 기호로 문자종류가 변하였을 때에, 그 숫자나 기호를 주거표시번호로 검출한다.For example, based on the character recognition result, the character type (a distinction of Chinese characters, numbers, symbols, etc.) of each character of the input string is determined, and the character string is sequentially checked from the head of the input string, and the number of characters is firstly counted. When the character type is changed from a kanji to a number or symbol in the input string, for example, the area name code is regarded as a neighborhood name code. Detect by number.

제 3 발명 (청구항 제 3 항에 관한 발명) 및 제 8 발명 (청구항 제 8 항에 관한 발명) 은, 제 2 발명 및 제 7 발명에서, 동네이름 코드에 대응하는 동네이름의 문자수를 미리 등록한 제 1 테이블과 시구명을 미리 등록한 제 2 테이블을 설치하고, 문자인식결과에 의거하여 동네이름 코드를 검출하고, 그 동네이름 코드에 대응하는 동네이름의 문자수를 제 1 테이블로부터 검색하는 것으로 하고, 문자인식결과에 의거하여, 제 2 테이블로부터 입력문자열을 구성하는 시구명을 검색하는 것으로 하고, 이로써 검색한 동네이름의 문자수와 시구명에 의거하여 주거표시번호를 검출하는 것으로 한 것이다.In the third invention (invention according to claim 3) and the eighth invention (invention according to claim 8), in the second invention and the seventh invention, the number of characters of the neighborhood name corresponding to the neighborhood name code is registered in advance. A first table and a second table in which the city name is registered in advance are installed, the neighborhood name code is detected based on the character recognition result, and the number of characters of the neighborhood name corresponding to the neighborhood name code is retrieved from the first table. Based on the character recognition result, the city name constituting the input string is searched from the second table, and the residential display number is detected based on the number of characters and the city name of the searched neighborhood name.

예를 들면, 제 3 발명 및 제 8 발명에서는, 문자인식결과에 의거하여, 숫자 또는 기호가 연속하는 부분을 동네이름 코드로 보고, 그 동네이름 코드에 대응하는 동네이름의 문자수를 제 1 테이블로부터 검색한다. 또한, 문자인식결과에 의거하여, 입력문자열을 구성하는 시구명을 제 2 테이블로부터 검색한다. 그리고, 제 1 테이블로부터 검색된 동네이름의 문자수 및 제 2 테이블로부터 검색된 시구명에 의거하여 주거표시번호의 개시위치를 검출하고, 그 개시위치 이후의 문자열을 주거표시번호로 본다.For example, in the third invention and the eighth invention, based on the character recognition result, the portion where the numbers or symbols are continuous is regarded as the neighborhood name code, and the number of characters of the neighborhood name corresponding to the neighborhood name code is shown in the first table. Search from. Further, based on the character recognition result, the name of the city constituting the input string is retrieved from the second table. Then, the starting position of the housing display number is detected based on the number of characters of the neighborhood name retrieved from the first table and the municipality name retrieved from the second table, and the character string after the starting position is regarded as the residential display number.

제 4 발명 (청구항 제 4 항에 관한 발명) 및 제 9 발명 (청구항 제 9 항에 관한 발명) 은, 제 3 발명 및 제 8 발명에 있어서, 제 2 테이블에 등록된 시구명중 미리 지정된 특정지역의 시구명에 동네이름 플래그를 부가하는 것으로 하고, 검색한 시구명에 동네이름 플래그가 부가되어 있는 경우, 문자인식결과 및 검색한 시구명에 의거하여, 동네이름 플래그가 부가된 시구명에 대응하는 동네이름 및 그 동네이름에 대응하는 동네이름 코드가 미리 등록된 제 3 테이블로부터 입력문자열에 기재된 동네이름 및 그 동네이름에 대응하는 동네이름 코드를 검색하는 것으로 하고, 이 검색한 시구명 및 동네이름에 의거하여 주거표시번호를 검출하도록 한 것이다.In the third invention and the eighth invention, the fourth invention (invention according to claim 4) and the ninth invention (invention according to claim 9) are used in the specific area designated in advance among the city names registered in the second table. If the neighborhood name flag is added to the city name and the searched city name is added, the neighborhood corresponding to the city name to which the neighborhood name flag is added based on the character recognition result and the searched city name. The name of the neighborhood and the neighborhood name code corresponding to the neighborhood name are searched from the third table in which the name and the neighborhood name code corresponding to the neighborhood name are pre-registered, and the neighborhood name code corresponding to the neighborhood name. Based on this, the house number is detected.

제 5 발명 (청구항 제 5 항에 관한 발명) 및 제 10 발명 (청구항 제 10 항에 관한 발명) 은, 제 4 발명 및 제 9 발명에 있어서, 동네이름 플래그가 부가되는 특정지역을, 지역별로 취급하는 지엽류의 수량에 의거하여 미리 지정하도록 한 것이다.In the fifth invention (invention according to claim 5) and the tenth invention (invention according to claim 10), in the fourth invention and the ninth invention, a specific region to which a neighborhood name flag is added is handled for each region. Based on the number of paper sheets to be specified, they are to be designated in advance.

제 11 발명 (청구항 제 11 항에 관한 발명) 은, 반송 (搬送) 되어 오는 지엽류상에 기재된 주소를 나타내는 입력문자열로부터 제 2 발명의 주소인식방법으로 주소를 인식하고, 이 인식한 주소를 바코드로 변환하여 상기 지엽류상에 인자하고, 이 바코드에 인자된 지엽류를 그 인자된 바코드에 따라서 처리하도록 한 것이다.The eleventh invention (invention according to claim 11) recognizes an address by the address recognition method of the second invention from an input string representing an address written on a conveyed paper sheet, and converts the recognized address into a barcode. The paper sheet is converted and printed on the paper sheets, and the paper sheets printed on the barcode are processed according to the printed barcode.

이하, 본 발명을 실시형태에 의거하여 상세하게 설명한다.EMBODIMENT OF THE INVENTION Hereinafter, this invention is demonstrated in detail based on embodiment.

지엽류상에 기재되어 있는 주소는, 예를 들면, 일본의 경우, 시구명에 대응하는 우편번호, 도도부현시구 동네이름 및 주거표시 등으로 이루어지며, 일반적으로 도도부현시구 동네이름은 대략 한자로 기재되고, 주거표시번호는 숫자 및 하이픈 등의 기호로 표기되어 있다. 여기에서 이하에 설명하는 실시형태에서는, 주소의 선두에는 동네이름에 대응하는 숫자 등으로 이루어지는 코드 (이하, 동네이름 코드라 부른다) 가 부가되어 있는 것으로 한다. 이하, 이 동네이름 코드, 도도부현시구 동네이름 및 주거표시번호를 포함하여 주소라 부르기로 한다.For example, in the case of Japan, an address written on a paper sheet is composed of a postal code corresponding to a city name, a prefectural prefecture's neighborhood name, and a residential indication. The housing number is indicated by symbols such as numbers and hyphens. Here, in the embodiment described below, it is assumed that a code consisting of a number corresponding to the neighborhood name (hereinafter referred to as neighborhood name code) is added to the head of the address. Hereinafter, this neighborhood name code, the prefecture prefectural municipal district name, and the residential indication number will be called an address.

여기에서, 주소의 일예를 제 2 도에 나타낸다. 동 도면에 있어서, 1 A 는 동네이름 코드, 1 B 는 시구명/동네이름, 1 C 는 주거표시번호이다. 이 주소의 예에서는, 동네이름 코드 1 A 의 위 3 자리 즉 「183」은, 현재 정해져있는 우편번호에 상당하는 것이며, 이 경우는, 「府中市 (부중시)」를 나타내는 것이다. 동네이름 코드 1 A 의 아래 3 자리 즉 「123」은 동네이름인 「日新町 (일신정)」에 대응되어 있는 것이다.Here, an example of an address is shown in FIG. In the figure, 1 A is a neighborhood name code, 1 B is a city name / village name, and 1 C is a residential display number. In the example of this address, the upper three digits of the neighborhood name code 1 A, namely, "183", correspond to a currently defined postal code, and in this case, "Chu Zhong City". The lower three digits of the neighborhood name code 1 A, `` 123, '' correspond to the neighborhood name 日新 町.

[실시형태 1]Embodiment 1

다음에, 본 발명의 제 1 실시형태 (실시형태 1) 에 대하여, 도면을 참조하여 설명한다.Next, 1st Embodiment (1st Embodiment) of this invention is described with reference to drawings.

이 실시형태는, 주소에 해당하는 입력문자열을 1 문자별로 문자인식하고, 그 인식결과에 의거하여 문자종류 (한자, 숫자, 기호 등의 구별) 을 판정한다. 그리고, 입력문자열의 선두로부터 순차 문자종류를 체크해 가고, 먼저, 숫자 또는 기호가 연속하는 부분을 동네이름 코드로 본다. 또한, 문자종류가 한자로부터 숫자 또는 기호로 변하는 위치를 검출하고, 그 이후의 부분을 주거표시번호로 본다. 이 동네이름 코드와 주거표시번호를 함께 주소로서 인식하는 것이다.In this embodiment, an input string corresponding to an address is character-recognized for each character, and a character type (a distinction of Chinese characters, numbers, symbols, etc.) is determined based on the recognition result. Then, the character type is sequentially checked from the head of the input string. First, the portion where the number or symbol is continuous is viewed as a neighborhood name code. In addition, the position where the type of character changes from a Chinese character to a number or a symbol is detected, and the subsequent part is regarded as a residential display number. This neighborhood name code and residential identification number are recognized together as an address.

제 1 도는, 실시형태 1 의 구성을 나타내는 블럭도이며, 화상추출부 (101)는, 지엽류상의 문자나 부호 등을 전기적인 화상신호로 변환한다.FIG. 1 is a block diagram showing the structure of Embodiment 1, and the image extraction unit 101 converts letters, symbols, and the like on paper sheets into electrical image signals.

주소위치 검출부 (102) 는, 화상추출부 (101) 에서 변환된 화상신호로부터, 그 문자열의 길이, 방향 및 열의 수 등의 정보를 검출하고, 검출한 정보에 의거하여 지엽류상에 기재된 주소에 해당하는 문자열을 검출한다. 이 경우의 주소위치 검출기술로서, 예를 들면 본 출원인에 의한 일본국 특공소 59-39065 호 공보에 나타나 있는 기술의 채용을 생각할 수 있다.The address position detection unit 102 detects information such as the length, the direction and the number of columns of the character string from the image signal converted by the image extraction unit 101, and corresponds to the address described on the paper sheet based on the detected information. Find the string to As the address position detection technique in this case, for example, the technique described in Japanese Patent Application Laid-Open No. 59-39065 by the present applicant can be considered.

일본국 특공소 59-39065 호 공보에서는, 정속도로 주행하는 우편물의 수신인명 기재측의 어느 정해진 넓이의 범위를 주사하고, 그것에 의해 얻어지는 문자열을 어느 일정기간별로 압축조작을 행하고, 그것에 의해 얻어지는 일정기간의 압축화 문자열의 문자열 개시 및 종점위치를 검출하고, 그것에 의해 얻어지는 압축문자열의 조합으로부터 우편물상의 수신인명 기입군 및 그 행, 위치, 수신인명 문자의 크기와, 행의 경사 등을 판별하도록 하고 있다.In Japanese Unexamined Patent Publication No. 59-39065, a certain range of the area of a mailing address traveling at a constant speed is scanned, and a character string obtained by this is compressed for a certain period, and a fixed period of time is obtained. The character string start and end positions of the compressed character string of the compressed character string are detected, and the group of address names written on the mail, its line, position, size of the character name character, and the slope of the line are determined from the combination of the compressed strings obtained thereby. .

문자 슬라이스부 (103) 는, 주소로서 검출된 문자열을 1 문자별로 슬라이스 처리를 행한다. 이 경우의 문자 슬라이스 기술로서, 예를 들면 본 출원인에 의한 일본국 특공소 63-57831 호 공보에 나타내고 있는 기술의 채용을 생각할 수 있다.The character slice unit 103 slices the character string detected as an address for each character. As the character slicing technique in this case, for example, the adoption of the technique described in Japanese Patent Application Laid-Open No. 63-57831 by the present applicant can be considered.

일본국 특공소 63-57831 호 공보에서는, 입력조작신호를 주사선의 방향과 직각방향으로 압축하면서 갱신함과 동시에, 압축된 주사신호의 문자블럭별로 압축폭을 순차 기억해 가고, 압축된 주사신호와 입력주사신호를 비교하고, 압축되어 연속한 문자블럭에 대응하는 입력주사신호에 문자를 나타내는 부분이 없는 경우에 문자 슬라이스가 행해지는 것을 검출하는 것으로 하고, 문자 슬라이스의 타이밍으로 기억되어 있는 압축폭을 읽어내도록 하고 있다.In Japanese Patent Application Laid-Open No. 63-57831, the input operation signal is updated while being compressed at right angles to the direction of the scanning line, and the compression width is sequentially stored for each character block of the compressed scanning signal. The scanning signal is compared, and if the input scanning signal corresponding to the continuous character block is compressed and there is no portion representing the character, the character slice is detected. The compression width stored at the timing of the character slice is read. I'm making it.

문자인식부 (104) 는, 슬라이스된 문자와, 미리 등록해 둔 문자사전 (105)을 비교조회하고, 슬라이스된 문자를 인식한다. 문자사전 (105) 에는, 약 3000 개의 한자, 숫자 및 기호 등이 미리 등록되어 있으며, 문자인식부 (104) 에 있어서의 문자인식결과는 예를 들면 JIS 코드로 출력된다. 즉, 슬라이스된 문자가 「1」이나 「府(부)」의 경우에는, 문자인식부 (105) 에서의 문자인식결과는, 각각 JIS 코드의 「2331」및 「495C」로서 출력된다. 이 경우의 문자인식기술로서, 예를 들면 본 출원인에 의한 일본국 특개평 1-94490 호 공보나 일본국 특개평 2-137080 호 공보에 나타나 있는 기술의 채용을 생각할 수 있다.The character recognition unit 104 compares the sliced character with the previously registered character dictionary 105 and recognizes the sliced character. In the character dictionary 105, about 3000 Chinese characters, numbers, symbols, and the like are registered in advance, and the character recognition results in the character recognition unit 104 are output as JIS codes, for example. That is, when the sliced character is "1" or "府 (part)", the character recognition result in the character recognition part 105 is output as "2331" and "495C" of JIS code, respectively. As the character recognition technology in this case, for example, the application of the technique shown in Japanese Patent Laid-Open No. 1-94490 or Japanese Patent Laid-Open No. 2-137080 by the present applicant can be considered.

일본국 특개평 1-94990 호 공보에서는, 인식용 사전에서 동일 카테고리의 표준도형을 블럭화하고, 그 카테고리내에서, 조회를 도중에 중지하는 설정치를 순서적으로 작은 것으로 갱신하고, 또, 불일치가 0 일 때, 그 카테고리의 조회을 중지하고, 또한 1 카테고리당의 하나의 최소불일치수를 결과로서 출력하도록 하고 있다.In Japanese Patent Laid-Open No. 1-94990, the standard dictionary of the same category is blocked in the recognition dictionary, and the set value for stopping the inquiry in the middle of the category is sequentially updated to smaller ones, and the inconsistency is 0 days. At that time, the inquiry of the category is stopped, and one minimum non-uniformity per category is output as a result.

일본국 특개평 2-137080 호 공보에서는, 특징패턴 기억부로부터 특징패턴신호를 읽고, 참조패턴 기억부로부터 각 읽기대상 문자별로의 참조패턴을 읽고, 특징 패턴의 각 부분영역과 참조패턴상의 대응하는 부분영역의 사이의 상이도를 구할 때에, 특징패턴의 각 부분영역의 특징을 기술하는 각 방향의 특징계열과 각 특징계열에 대하여 인접하는 부분영역상의 인접하는 특징계열의 일부를 부가함으로써 얻어지는 계열을 복수로 부가하는 방법으로 복수종류의 특징계열을 작성하고, 각 방향에 대하여 원특징계열 및 작성된 복수종류의 특징계열의 각각과 원특징계열에 대응하는 참조패턴의 특징계열 사이에서 비선형 매칭을 행하고, 각 방향의 비선형매칭의 평가치가 최소의 것의 총합을 부분영역간의 상위도로 정함으로써 문자패턴과 각 문자종류의 참조패턴의 상위도를 결정하고, 상위도에 따라서 분류를 행하고, 분리결과를 출력하도록 하고 있다.In Japanese Patent Laid-Open No. 2-137080, a feature pattern signal is read from a feature pattern storage unit, a reference pattern for each character to be read is read from the reference pattern storage unit, and a corresponding pattern on each partial region of the feature pattern and the reference pattern When calculating the degree of difference between the subregions, a sequence obtained by adding a feature sequence in each direction describing the feature of each subregion of the feature pattern and a portion of the adjacent feature sequence on the adjacent subregion with respect to each feature sequence A plurality of types of feature sequences are created by a plurality of methods, nonlinear matching is performed between each of the original feature sequences and the created plurality of feature sequences and the feature sequences of reference patterns corresponding to the original feature sequences in each direction. The character pattern and the true value of each character type are determined by determining the sum of the minimum of the nonlinear matching in each direction as the difference between the subregions. Determining a top view of a pattern, and subjected to classification according to the high-road, and outputs the separated results.

문자종류 판정부 (106) 는, 문자인식부 (104) 로부터 출력된 주소에 이용되고 있는 문자의 인식결과에 의거하여, 문자종류 (한자, 숫자 기호 등) 를 판정한다. 즉, 문자인식부(104) 에 있어서의 문자인식결과가 JIS 코드로서 출력된 경우, 그 JIS 코드가 2300 번대 (코드의 위 3 자리 233) 라면, 그 문자는 「0」~「9」의 산용숫자로 판정하고, 또, JIS 코드가 3000 번대 이상 (코드의 1 자리째는 3 이상)이라면, 그 문자는 한자(漢字) 인 것으로 판정한다. 하이픈 등의 기호에 대해서도 동일하게 판정한다. 제 3 도에 문자종류의 판정결과의 일예를 나타낸다.The character type determination unit 106 determines the character type (a Chinese character, a numeric symbol, etc.) on the basis of the recognition result of the character used for the address output from the character recognition unit 104. That is, when the character recognition result in the character recognition part 104 is output as a JIS code, if the JIS code is 2300th (three digits of the code 233), the character is used for the calculation of "0"-"9". If the JIS code is 3000 or more (the first digit of the code is 3 or more), the character is determined to be a Chinese character. The same determination is made for symbols such as hyphens. 3 shows an example of the result of the character type determination.

주소인식부 (107)는, 먼저, 문자종류 판정부 (106) 에 있어서는 판정결과에 의거하여, 주소에 대응하는 입력문자열을 그 선두부분으로부터 순차 문자종류를 체크해 가고, 숫자 또는 기호가 연속하는 부분을 동네이름 코드로 보고, 일시 기억해 둔다. 또한 입력 문자열에 있어서 문자종류가 한자로부터 숫자로 변하는 점, 즉 주거표시번호의 개시위치를 검출하고, 이 개시위치 이후의 숫자 및 기호를 주거 표시번호로 본다. 그리고, 일시 기억해둔 동네이름와 주거표시번호를 함께, 주소로서 인식한다.First, in the character type determination unit 106, the address recognition unit 107 checks the character type sequentially from the head of the input string corresponding to the address based on the determination result, and the number or symbol is continuous. Look at the neighborhood name code, and remember it temporarily. In addition, the point where the character type changes from Chinese characters to numbers in the input character string, that is, the start position of the residential display number is detected, and the numbers and symbols after the start position are regarded as the residential display number. Then, the temporarily stored neighborhood name and residential display number are recognized as addresses.

다음에, 이 주소인식장치에 대해서, 더욱 구체적으로 설명한다.Next, the address recognition device will be described in more detail.

지엽류상에는, 예를 들면, 제 2 도에 나타내는 바와 같은 주소에 해당하는 문자열 「183-123 府中市 日新町 (부중시 일신정) 1-10」가 기재되어 있다. 그리고, 이 문자열은, 주소의 선두에 기재되어 있는 동네이름코드 1 A, 도도부현시구 동네이름 1 B 및 주거표시번호 1C 로부터 구성되어 있다.On the paper sheet, for example, the character string "183-123 Nippon-shi Shinjuku 1-10" corresponding to the address shown in FIG. 2 is described. The character string is composed of the neighborhood name code 1 A, the prefecture prefectural city neighborhood name 1 B, and the residential display number 1C described at the beginning of the address.

먼저, 화상추출부 (101) 는, 이 지엽상의 문자나 부호 등을 전기적인 화상신호로 변환한다 (제 4 도에 나타내는 스텝 (401)). 이 추출된 화상신호는 주소위치 검출부 (102) 로 보내진다. 주소위치 검출부 (102) 는, 주소위치를 검출하고 (스텝 (402)), 주소에 해당하는 입력문자열, 즉 「183-123 府中市 日新町 (부중시 일신정) 1-10」의 화상신호를 추출한다.First, the image extracting unit 101 converts this paper sheet character, code, etc. into an electric image signal (step 401 shown in FIG. 4). The extracted image signal is sent to the address position detection unit 102. The address position detecting unit 102 detects the address position (step 402), and inputs an input string corresponding to the address, that is, an image signal of 1183-123, Nishi-jin, Japan. Extract.

그리고, 주소위치 검출부 (102) 에서 추출된 입력문자열은, 문자 슬라이스부 (103) 에서 1 문자별로 슬라이스된다 (403). 그리고, 이 슬라이스된 문자가 각각, 문자 인식부 (104) 에서, 문자사전 (105) 의 내용과 조회된다. 즉, 문자인식부 (104) 는, 문자위치의 초기화를 행함과 동시에 (i=1 : 스텝 (404)), 사전 NO. 의 초기화를 행하고 (j=1 : 스텝 (405)), 문자위치 P (i) 의 문자와 사전 NO. D (j) 의 문자를 비교 조회한다 (스텝 (406)). 제 5 도 (a) 에 입력문자열과 문자위치 P (i) 의 관계를 나타낸다. 제 5 도 (b) 에 사전 NO. D (j) 와 사전, 카테고리 (JIS 코드), 문자종류와의 관계를 나타낸다.The input string extracted by the address position detection unit 102 is sliced by one character in the character slice unit 103 (403). The sliced characters are then inquired by the character recognition unit 104 with the contents of the character dictionary 105. That is, the character recognition unit 104 initializes the character position and simultaneously (i = 1: step 404) and the dictionary NO. Is initialized (j = 1: step 405), and the character at the character position P (i) and the dictionary NO. The characters of D (j) are compared and queried (step 406). Fig. 5A shows the relationship between the input string and the character position P (i). In Fig. 5 (b), the dictionary NO. Shows the relationship between D (j), dictionary, category (JIS code), and character type.

문자 인식부 (104) 는, 문자위치 P (i) 의 문자와 사전 NO. D (j) 의 문자가 일치하지 않으면, j=j + 1 로한 후에 (스텝 (408)), 스텝 (406) 으로 되돌아간다. 문자위치 P (i) 의 문자와 사전 NO. D (j) 의 문자가 일치하면, 스텝 (409) 으로 진행한다. 스텝 (409) 에서는, r (i) 에 조회결과의 카테고리 (JIS 코드) 를 격납하고 (제 5 도 (c) 참조), i=n 인지 여부를 체크하고 (스텝 (410)), i=n 이 아니면, i=i+1 로 한 후 (스텝 (411)), 스텝 (405) 로 되돌아간다. 스텝 (410)에서 i=n 이라면, 문자인식부 (104) 로부터 문자종류 판정부 (106) 로 조회결과 r (1) ~ r (n) 를 출력한다. 즉, 조회결과 r (1) ~ r (n) 를 문자인식결과로서, 제 5 도 (d) 에 나타내는 바와 같은 JIS 코드로 출력한다.The character recognition unit 104 includes a character at the character position P (i) and a dictionary NO. If the characters of D (j) do not match, after setting j = j + 1 (step 408), the process returns to step 406. Character at character position P (i) and dictionary NO. If the characters of D (j) match, the process proceeds to step 409. In step 409, the category (JIS code) of the search result is stored in r (i) (see FIG. 5 (c)), and it is checked whether i = n (step 410), and i = n Otherwise, after setting i = i + 1 (step 411), the flow returns to step 405. If i = n in step 410, the inquiry results r (1) to r (n) are output from the character recognition unit 104 to the character type determination unit 106. That is, the inquiry results r (1) to r (n) are output as the character recognition results in the JIS code as shown in FIG. 5 (d).

문자종류 판정부 (106) 는, 문자 인식부 (104) 로부터의 조회결과 r (1) ~ r (n) 을 얻고, 조회결과의 격납위치를 초기화한다 (i=1:스텝 (412)). 그리고, 조회결과 r (i) 의 카테고리에 의해 문자종류를 판정하고 (스텝 (413)), 그 판정한 문자종류를 k (i) 에 격납한다 (스텝 (414)). 제 6 도 (a) 에 문자종류와 카테고리 (JIS 코드) 의 관계를 나타낸다. 즉, 「2330」≤r (i) ≤ 「2339」라면 숫자로 판정하고, r (i) = 「213D」라면 기호로 판정하고, r (i) ≥「3000」이라면 한자로 판정하고, 그 판정결과를 k (i) 에 격납한다. 그리고, i=n 인지 여부를 체크하고 (스텝 (415)), i=n 이 아니라면, i= i+1 로 한후에 (스텝 (416)), 스텝 (413) 으로 되돌아 간다. 스텝 (415) 에서 i=n 으로 되면, 문자종류 판정부 (106) 로부터 주소인식부 (107) 로 판정결과 k (1) ~ k (n) 을 출력한다. 즉, 판정결과 k (1) ~ k (n) 를 문자판정결과로서, 제 6 도 (c) 에 나타내는 바와 같이 출력한다.The character type determination unit 106 obtains the inquiry results r (1) to r (n) from the character recognition unit 104 and initializes the storing position of the inquiry result (i = 1: step 412). The character type is determined based on the category of the inquiry result r (i) (step 413), and the determined character type is stored in k (i) (step 414). Fig. 6A shows the relationship between the character type and category (JIS code). That is, if "2330" ≤ r (i) ≤ "2339", it is determined as a number, if r (i) = "213D", it is determined as a symbol, and if r (i) ≥ "3000", it is determined as a Chinese character, and the judgment is made. The result is stored in k (i). Then, it is checked whether i = n (step 415), and if i = n, i = i + 1 (step 416), and the flow returns to step 413. When i = n in step 415, the determination results k (1) to k (n) are output from the character type determination unit 106 to the address recognition unit 107. That is, the determination results k (1) to k (n) are output as the character determination results as shown in Fig. 6C.

주소인식부 (107) 는, 문자종류 판정부 (106) 로부터의 판정결과 k (1) ~ k (n) 를 얻어서, 조회결과 및 판정결과의 격납위치를 초기화함과 동시에 (i=1:스텝 (417)), 최종결과의 격납위치를 초기화한다 (j=1:스텝 (418)). 그리고, 판정결과 k (i) 를 체크하고 (스텝 (419)), 숫자 또는 기호라면, 조회결과 r (i) 의 카테고리를 최종결과 f (i) 에 격납하고 (스텝 (420)), j=j+1 로 하고 (스텝 (421)), 스텝 (422) 으로 진행한다. 스텝 (419) 에서, 그 판정결과 k (i) 가 한자이면, 바로 스텝 (422) 으로 진행한다. 스텝 ((422)) 에서는, i=n 인지의 여부를 체크하고, i=n 이 아니면, i=i+1 로한 후에 (스텝 (423)), 스텝 (419) 으로 되돌아간다. 스텝 (422) 에서, i=n 으로 되면, 스텝 (420) 에서 얻어진 최종결과 f (1) ~ f (m) 를 주소로서 인식한다 (제 6 도 (b) 참조).The address recognition unit 107 obtains the determination results k (1) to k (n) from the character type determination unit 106, initializes the storing position of the inquiry result and the determination result (i = 1: step). (417), the storage position of the final result is initialized (j = 1: step 418). Then, the result of the determination k (i) is checked (step 419), and if it is a number or a symbol, the category of the inquiry result r (i) is stored in the final result f (i) (step 420), and j = It becomes j + 1 (step 421), and it progresses to step 422. In step 419, if the determination result k (i) is a Chinese character, the flow proceeds directly to step 422. In step (422), it is checked whether i = n, and if i = n, i = i + 1 (step 423), and the process returns to step 419. When i = n in step 422, the final results f (1) to f (m) obtained in step 420 are recognized as addresses (see FIG. 6 (b)).

즉, 주소 인식부 (107) 는, 주소에 대응하는 입력문자열을 그 선두부분으로 부터 순차 문자종류를 체크하고, 먼저, 숫자 또는 기호가 연속하는 부분 「183-123」을 동네이름 코드로 보고, 일시 기억한다. 또한, 입력문자열에 있어서, 문자종류가 한자로부터 숫자로 변하는 점, 즉 주거표시번호의 개시위치를 검출하고, 그 개시위치 이후의 숫자 및 기호 「1-10」을 주거표시번호로 본다. 그리고, 일시 기억된 동네이름 코드 「183-123」와 주거표시번호 「1-10」를 함께 주소로서 인식한다.That is, the address recognizing unit 107 checks the character type in sequence from the head of the input string corresponding to the address, firstly sees the area &quot; 183-123 &quot; where the numbers or symbols are consecutive as the neighborhood name code, Remember temporarily. Further, in the input string, the point at which the character type changes from Chinese characters to a number, that is, the starting position of the housing display number is detected, and the numbers and symbols "1-10" after the starting position are regarded as the housing display number. Then, the temporarily stored neighborhood name code "183-123" and the residential display number "1-10" are recognized together as an address.

[실시형태 2]Embodiment 2

다음에 본 발명의 제 2 실시형태 (실시형태 2) 에 대해서, 도면을 참조하여 설명한다.Next, a second embodiment (second embodiment) of the present invention will be described with reference to the drawings.

이 실시형태는, 주소에 해당하는 입력문자열을 1 문자별로 문자인식하고, 먼저 입력문자열중의 시구명을 인식함으로써, 시구명과 동네이름의 경계위치를 검출하고, 또한 동네이름 코드를 검출하고, 그 동네이름 코드에 대응하는 동네이름의 문자수를 검출한다. 그리고, 시구명과 동네이름의 경계위치와 동네이름의 문자수에 의거하여 주거표시번호의 기재개시위치를 검출하고, 그 개시위치 이후의 입력문자열을 주거표시번호로서 검출한다. 이 주거표시번호와 동네이름 코드를 함께 주소인식결과로 하는 것이다.In this embodiment, by character recognition of an input string corresponding to an address for each character and first recognizing the city name in the input string, the boundary position between the city name and the neighborhood name is detected, and the neighborhood name code is detected. Detects the number of characters in the neighborhood name corresponding to the neighborhood name code. Then, the starting position of description of the housing display number is detected based on the boundary of the city name, the neighborhood name, and the number of characters of the neighborhood name, and the input string after the start position is detected as the housing display number. The residential identification number and the neighborhood name code are the address recognition results.

제 7 도는, 실시형태 2 의 구성을 나타내는 블럭도이며, 화상추출부 (101), 주소위치검출부 (102), 문자 슬라이스부 (103), 문자 인식부 (104) 및 문자사전 (105)은, 상술한 실시형태 1 의 구성과 동일하므로, 중복부분의 설명은 생략한다. 이 실시형태에서는, 문자인식부 (104) 에 있어서의 문자인식결과를, 동네이름 문자수 검색부 (201), 시구명 검색부 (203) 및 주소 인식부 (205) 로 보내지도록 하고 있다.7 is a block diagram showing the configuration of Embodiment 2, wherein the image extraction unit 101, the address position detection unit 102, the character slice unit 103, the character recognition unit 104, and the character dictionary 105 are Since it is the same as the structure of Embodiment 1 mentioned above, description of a duplicate part is abbreviate | omitted. In this embodiment, the character recognition results in the character recognition unit 104 are sent to the neighborhood name character number retrieval unit 201, the municipality name retrieval unit 203, and the address recognition unit 205.

동네이름 문자수 검색부 (201) 는, 문자인식부 (104) 에 있어서의 문자인식 결과인 주소에 대응하는 입력문자열을 선두부분으로부터 순차 체크해 가고, 동네이름 코드를 검출하여 일시 기억해 둔다. 그리고, 이 동네이름 코드에 대응하는 동네이름의 문자수를, 제 8 도에 나타내는 바와 같은 동네이름 코드와 그 동네이름 코드에 대응하는 동네이름의 문자수가 미리 등록된 동네이름 문자수 테이블 (202) 로부터 검색한다.The neighborhood name character number search unit 201 sequentially checks the input string corresponding to the address which is the result of the character recognition in the character recognition unit 104 from the beginning, detects and temporarily stores the neighborhood name code. Then, the number of characters of the neighborhood name corresponding to the neighborhood name code, the neighborhood name code as shown in FIG. 8 and the number of characters of the neighborhood name corresponding to the neighborhood name code are registered in advance. Search from.

시구명 검색부 (203) 는, 문자인식부 (104) 에서의 문자인식결과와 시구명이 미리 등록된 시구명 테이블 (204) 의 내용을 비교하여 시구명을 검색한다. 그리고, 시구명을 검색함으로써, 입력문자열에 있어서의 시구명과 그 후에 계속하여 기재되는 동네이름의 경계위치를 검출한다. 여기에서, 시구명 테이블 (204) 에는, 제 9 도 에 나타내는 바와 같이, 일본전국의 시구명과 그에 대응하는 문자의 JIS 코드가 등록되어 있다. 그리고, 이 시구명 테이블 (204) 의 용량은, 현상으로서 약 3000 의 시구명에 한정되어 있는 관계상, 동네이름이 등록된 테이블의 용량과 비교하여 매우 작다.The city name search unit 203 searches the city name by comparing the text recognition result in the character recognition unit 104 with the contents of the city name table 204 in which the city name is registered in advance. Then, by searching for the name of the city, the boundary position of the name of the city in the input string and the neighborhood name described subsequently is detected. Here, in the city name table 204, as shown in FIG. 9, the JIS code of the city name of the whole country and the corresponding character is registered. And the capacity of this municipality table 204 is very small compared with the capacity of the table in which the neighborhood name is registered, since it is limited to about 3000 municipal names as a phenomenon.

주소 인식부 (205) 는, 동네이름 문자수 검색부 (201) 에서 검색된 동네이름 코드에 대응하는 동네이름의 문자수 및 시구명검색부 (203) 에서 검출된 시구명과 동네이름의 경계위치에 의거하여 주거표시번호의 개시위치를 검출한다. 그리고, 이 주거표시번호와 동네이름 문자수 검색부 (201) 에서 일시 기억된 동네이름 코드를 함께 주소의 인식결과로 한다.The address recognizing unit 205 is based on the number of characters of the neighborhood name corresponding to the neighborhood name code retrieved by the neighborhood name character number retrieval unit 201 and the boundary position of the city name and the neighborhood name detected by the municipality name retrieval unit 203. To detect the starting position of the residential display number. Then, the residential display number and the neighborhood name code temporarily stored in the neighborhood name character number search unit 201 are used as the recognition result of the address.

다음에, 이 주소인식 장치에 대해서, 더욱 구체적으로 설명한다.Next, the address recognition device will be described in more detail.

이 실시형태에 있어서도, 지엽류 상에는 제 2 도에 나타내는 바와 같은 주소에 해당하는 문자열 「183-123 府中市 日新町 (부중시 일신정) 1-10」가 기재되어 있는 것으로 한다.Also in this embodiment, it is assumed that on the paper sheet, the character string "183-123 Nippon City Shinjuku 1-10" corresponding to the address shown in FIG. 2 is described.

먼저 화상추출부 (101) 는, 이 지엽류상의 문자나 부호 등을 전기적인 화상 신호 변환한다 (제 4 도에 나타내는 스텝 (401)), 이 추출된 화상신호는 주소위치 검출부 (102) 로 보내진다. 주소위치 검출부 (102) 는, 주소위치를 검출하고 (스텝 (402)), 주소에 해당하는 입력문자열, 즉 「183-123 府中市 日新町 (부중시 일신정) 1-10」의 화상신호를 추출한다.First, the image extraction unit 101 converts the characters, symbols, and the like on this paper sheet into electrical image signals (step 401 shown in FIG. 4), and the extracted image signals are sent to the address position detection unit 102. FIG. Lose. The address position detecting unit 102 detects the address position (step 402), and inputs an input string corresponding to the address, that is, an image signal of 1183-123, Nishi-jin, Japan. Extract.

그리고, 주소위치 검출부 (102) 에서 추출된 입력문자열은, 문자 슬라이스 부 (103) 에서 1 문자별로 슬라이스된다 (스텝 (403)). 그리고, 이 슬라이스된 문자가 각각 , 문자 인식부 (104) 에서, 문자사전 (105) 의 내용과 조회된다. 이하, 실시형태 1 에서 설명한 것과 동일한 처리를 행하고 (스텝 (404) ~ (411)), 문자인식부 (104) 는 조회결과 r (1) ~ r (n) 을 문자인식결과로서, 제 5 도 (d)에 나타내는 바와 같은 JIS 코드로 출력한다.The input string extracted by the address position detection unit 102 is sliced by one character in the character slice unit 103 (step 403). The sliced characters are then inquired by the character recognition unit 104 with the contents of the character dictionary 105. Hereinafter, the same processing as described in Embodiment 1 is performed (steps 404 to 411), and the character recognition unit 104 uses the inquiry results r (1) to r (n) as character recognition results. It outputs with JIS code as shown to (d).

동네이름 문자수 검색부 (201) 는, 문자 인식부 (104) 로부터의 조회결과 r (1) ~ r (n) 을 얻어서, 이 조회결과 r (1) ~ r (n) 을 선두부분으로부터 순차 체크해 가고, 동네이름 코드에 해당하는 카테고리를 추출한다 (제 10 도에 나타내는 스텝 (501)). 즉, 문자인식부 (104) 에서의 문자인식결과인 주소에 대응하는 문자열을 선두부분으로부터 체크해 가고, 동네이름 코드 「183-123」을 검출하고 일시 기억한다. 그리고, 이 동네이름 코드 「183-123」에 대응하는 동네이름 「日新町 (일신정)」의 문자수 「3」을 제 8 도에 나타내는 동네이름 문자수 테이블 (202) 로부터 검색하고, 그것을 CNO 에 격납한다 (CNO = 「3」: 스텝 (502)).The neighborhood name character number search unit 201 obtains the inquiry results r (1) to r (n) from the character recognition unit 104, and sequentially orders the inquiry results r (1) to r (n) from the head part. It checks and extracts the category corresponding to a neighborhood name code (step 501 shown in FIG. 10). That is, the character string corresponding to the address which is the character recognition result in the character recognition unit 104 is checked from the beginning, and the neighborhood name code "183-123" is detected and stored temporarily. The character number "3" of the neighborhood name "日新 町" corresponding to this neighborhood name code "183-123" is searched from the neighborhood name number table 202 shown in FIG. (CNO = "3": step 502).

이 동네이름 문자수 검색부 (201) 에서의 처리와 동시에, 시구명 검색부 (203) 는, 문자 인식부 (104) 에 있어서의 문자 인식결과와 시구명이 미리 등록된 시구명 테이블 (204) 의 내용을 비교하고, 시구명 「府中市 (부중시)」를 검색한다. 그리고 그 시구명 「府中市 (부중시)」를 검색함으로써, 도도부현시구 동네이름이 기재된 부분의 입력문자열 「府中市 日新町 (부중시 일신정)」에 있어서의 시구명 「府中市 (부중시)」와 동네이름 「日新町 (일신정)」의 경계위치를 검출한다.Simultaneously with the processing in the neighborhood name character number search unit 201, the city name search unit 203 performs the character recognition result and the name of the city name table in the character recognition unit 104. We compare contents and search for city name "府中 市". Then, by searching for the name of the city, (中 市, the name of the city in the input string `` 中 中 日 日 '' was written. ) And the neighborhood name "日新 町".

즉, 시구명 검색부 (203) 는, 시구명의 선두위치를 i=8 로 하여 설정한다 (스텝 (503)). 그리고, 시구명의 테이블 위치를 초기화하고 (j=1 : 스텝 (504)), 시구명 테이블 (204) 의 C (j) 의 문자코드 r (8) 이후의 결과를 조회한다. (스텝 (505)). 시구명 테이블 (204) 의 C (j) 의 문자코드와 r (8) 이후의 결과가 일치하면, 스텝 (506) 에서의 아니오에 응하여 스텝 (507) 으로 진행하고, j=j+1 로 하고, 스텝 (505) 으로 되돌아 간다. 시구명 테이블 (204) 의 C (j) 의 문자 코드 r (8) 이후의 결과가 일치하면, 스텝 (506) 에서의 예에 응하여 스텝 (508) 으로 진행한다. 스텝 (508) 에서는, 시구명과 동네이름의 경계, 즉 동네이름의 선두위치를 CST 에 격납한다. 이 경우, 시구명이 「府中市 (부중시)」로 하여 얻어지기 때문에 CST = 「11」로 된다.That is, the city name search unit 203 sets the head position of the city name to i = 8 (step 503). Then, the table position of the city name is initialized (j = 1: step 504), and the result after the character code r (8) of C (j) of the city name table 204 is inquired. (Step 505). If the character code of C (j) of the city name table 204 and the result after r (8) coincide, the flow proceeds to step 507 in response to NO in step 506, and j = j + 1. The flow returns to step 505. If the result after the character code r (8) of C (j) of the city name table 204 matches, it progresses to step 508 according to the example in step 506. FIG. In step 508, the boundary between the city name and the neighborhood name, that is, the head position of the neighborhood name, is stored in the CST. In this case, since the city name is obtained as "middle city", CST = "11".

주소 인식부 (205) 는, 동네이름 문자 검색부 (201) 에서 검색된 동네이름 코드에 대응하는 동네이름 문자수 「3」(CNO = 「3」) 및 시구명 검색부 (203) 에 있어서 검출된 시구명 「府中市 (부중시)」과 동네이름 「日新町 (일신정)」의 경계 위치 (CST= 「11」) 에 의거하여 주거표시번호의 개시위치 JST 를 산출하고 (JST= CNO+CST : 스텝 (509)), 이 주거표시번호의 개시위치 JST 이후에 기재된 문자 「1-10」을 주거표시번호로 본다. 그리고, 이 주거표시번호 「1-10」과 동네이름 문자수 검색부 (201) 에서 일시 기억된 동네이름 코드 「183-123」을 함께 주소의 인식결과 「183-123 1-10」로 한다.The address recognition unit 205 is detected by the neighborhood name character number "3" (CNO = "3") and the city name search unit 203 corresponding to the neighborhood name code retrieved by the neighborhood name character search unit 201. Based on the boundary position (CST = “11”) of the city name 府中 市 and the neighborhood name 日新 町, the starting position JST of the residential display number is calculated (JST = CNO + CST). In step 509), the character &quot; 1-10 &quot; described after the start position JST of this residential display number is regarded as the residential display number. The residential display number &quot; 1-10 &quot; and the neighborhood name code &quot; 183-123 &quot; temporarily stored in the neighborhood name character number search unit 201 are set together as the recognition result &quot; 183-123 1-10 &quot;.

즉, 주소인식부 (205) 는, 동네이름 코드에 해당하는 조회결과 r (1) ~ r (7) 를 최종결과 f (1) ~ f (7) 에 격납하고 (스텝 (510)), 주거표시번호에 해당하는 조회결과 r (JST) 이후를 최종결과 f (8) 이후에 격납한다 (스텝 (511)). 이로써, 제 6 도 (b) 에 나타낸 바와 같이 최종 결과 f (1) ~ f (m) 이 얻어진다.That is, the address recognition unit 205 stores the search results r (1) to r (7) corresponding to the neighborhood name codes in the final results f (1) to f (7) (step 510), After the inquiry result r (JST) corresponding to the display number is stored after the final result f (8) (step 511). As a result, as shown in FIG. 6 (b), final results f (1) to f (m) are obtained.

[실시형태 3]Embodiment 3

다음에, 본 발명의 실시형태 (실시형태 3) 에 대해서, 도면을 참조하여 설명한다.Next, Embodiment (Embodiment 3) of this invention is described with reference to drawings.

이 실시형태는, 예를 들면, 취급할 지엽류의 량이 매우 많은 특정지역을 미리 지정해 두고, 이 지정된 특정지역에 있어서는, 주소에 해당하는 입력문자열중에 동네이름 코드가 기재되어 있지 않은 경우라도, 주소를 인식할 수 있도록 하는 것에 있다. 즉, 이 특정지역에 있어서는, 동네이름 및 그 동네이름에 대응하는 동네이름 코드를 등록한 사전을 준비하고, 입력문자열중에 기재되어 있는 동네이름으로 부터 동네이름 코드를 찾아내려 한 것이다.In this embodiment, for example, a specific area having a large amount of paper sheets to be handled is designated in advance, and in this designated specific area, even if the neighborhood name code is not described in the input string corresponding to the address, Is to be able to recognize. That is, in this specific area, a dictionary in which a neighborhood name and a neighborhood name code corresponding to the neighborhood name is registered is prepared, and a neighborhood name code is found from the neighborhood name described in the input string.

제 11 도는, 실시형태 3 의 구성을 나타내는 블럭도이며, 화상추출부 (101), 주소위치 검출부 (102), 문자 슬라이스부 (103), 문자인식부 (104) 및 문자사전 (105) 은, 상술한 실시형태 (1) 의 구성과 동일하므로, 중복부분의 설명은 생략한다. 이 실시형태에서는, 문자 인식부 (104) 에 있어서의 문자인식결과를, 시구명 검색부 (301), 동네이름 문자수 검색부(303), 동네이름 문자수 검색부 (305) 및 주소인식부 (306) 로 보내도록 하고 있다.11 is a block diagram showing the configuration of Embodiment 3, wherein the image extraction unit 101, the address position detection unit 102, the character slice unit 103, the character recognition unit 104, and the character dictionary 105 are Since it is the same as the structure of embodiment (1) mentioned above, description of a duplicate part is abbreviate | omitted. In this embodiment, the character recognition results in the character recognition unit 104 include the city name search unit 301, the neighborhood name character number search unit 303, the neighborhood name character number search unit 305, and the address recognition unit. 306 is sent to.

시구명 검색부 (301) 는, 문자인식부 (104) 에 있어서의 문자인식결과와 문자명이 미리 등록된 시구명 테이블 (302) 의 내용을 비교하여 시구명을 검색한다. 그리고, 시구명을 검색함으로써, 도도부현시구 동네이름이 기재된 부분의 문자열에 있어서의 시구명의 동네이름과의 경계위치를 검출하고, 그 검출결과를 동네이름 검색부 (303) 및 주소 인식부 (306) 에 출력한다.The city name search unit 301 searches the city name by comparing the character recognition result in the character recognition unit 104 with the contents of the city name table 302 in which the character name is registered in advance. Then, by searching for the name of the municipality, the boundary position with the name of the neighborhood of the name of the municipality is detected in the character string of the part where the prefectures of the prefecture municipality is written, and the detected result is the neighborhood name searching unit 303 and the address recognition unit 306. )

또, 시구명 테이블 (302) 에는, 제 12 도에 나타내는 바와 같이, 등록된 시구명중 미리 지정된 특정지역에 해당하는 시구명에는 동네이름 플래그 「있음」과, 또, 해당하지 않는 시구명에는 동네이름 플래그 「없음」으로 등록되어 있다. 그리고, 시구명 검색부 (301) 에서 검색된 시구명에 대응하는 동네이름 플래그 「있음」인 경우에는, 동네이름 검색부 (303) 에 동네이름 플래그 「있음」이 출력된다. 또, 검색된 시구명의 동네이름 플래그가 「없음」인 경우에는, 동네이름 문자수 검색부 (305) 에 동네이름 플래그 「없음」이 출력된다. 여기에서, 동네이름 플래그가 「있음」으로 될 시구명은, 예를 들면, 취급되는 지엽류가 다른 지역과 비교하여 매우 많은 지역이 지정된다.In the city name table 302, as shown in FIG. 12, the neighborhood name flag "Yes" is included in the city name corresponding to the specific area designated in advance among the registered city names, and the town name is in the city name not applicable. It is registered with the flag "none". And if the neighborhood name flag "Yes" corresponding to the municipal name searched by the city name search unit 301, the neighborhood name flag "Yes" is output to the neighborhood name search unit 303. If the searched neighborhood name flag is "none", the neighborhood name flag "none" is outputted to the neighborhood name character number search unit 305. Here, as for the city name where the neighborhood name flag is "is", a very large area is designated, for example compared with the area | region where papers are handled.

동네이름 검색부 (303) 는, 시구명 검색부 (301) 로부터 동네이름 플래그 「있음」의 출력을 받은 경우에, 시구명 검색부 (301) 로부터 출력되는 시구명과 동네이름의 경계위치 및 문자 인식부 (104) 로부터 출력되는 문자인식결과에 의거하여, 시구명 이후의 문자열의 문자인식결과와 미리 특정지역의 동네이름이 등록된 동네이름 테이블을 비교조회하고, 동네이름을 검색한다. 이 동네이름 테이블에는, 제 13 도에 나타내는 바와 같이, 동네이름 및 그 동네이름에 대응하는 동네이름 코드가 등록되어 있다. 동네이름 검색부 (303)는, 그 검색한 동네이름 및 동네이름에 대응하는 동네이름 코드를 출력한다. 그리고, 이 동네이름 테이블에 등록되어 있는 동네이름은 미리 지정된 특정지역내의 동네이름뿐이며, 일본 전국의 동네이름을 등록하는 경우와 비교하여 그 사용용량은 매우 적다.When the neighborhood name search unit 303 receives the output of the neighborhood name flag "Yes" from the street name search unit 301, the boundary position and character recognition of the street name and neighborhood name output from the street name search unit 301 Based on the character recognition result outputted from the unit 104, the character recognition result of the character string after the name of the municipality is compared with the neighborhood name table in which the neighborhood name of the specific region is registered in advance, and the neighborhood name is searched. As shown in FIG. 13, the neighborhood name and the neighborhood name code corresponding to the neighborhood name are registered in this neighborhood name table. The neighborhood name search unit 303 outputs a neighborhood name code corresponding to the searched neighborhood name and neighborhood name. In addition, the neighborhood names registered in the neighborhood name table are only neighborhood names in a specific area designated in advance, and their use capacity is very small as compared with the case of registering neighborhood names throughout Japan.

동네이름 문자수 검색부 (305) 는, 시구명 검색부 (301) 로부터 동네이름 플래그 「없음」의 출력을 받은 경우, 문자 인식부 (104) 에 있어서의 문자인식결과인 주소인 대응하는 입력문자열을 선두부분으로부터 순차 체크해 가고, 동네이름 코드를 검출하여 일시 기억해 둔다. 그리고, 이 코드에 대응하는 동네이름의 문자수를, 제 8 도에 나타내는 바와 같은 동네이름 코드와 그 동네이름 코드에 대응하는 동네이름의 문자수가 미리 등록된 동네이름 문자수 테이블 (202) 로부터 검색한다.When the neighborhood name character number search unit 305 receives the output of the neighborhood name flag "none" from the city name search unit 301, the corresponding input string which is an address which is the character recognition result in the character recognition unit 104 is received. Are checked sequentially from the beginning, and the neighborhood name code is detected and stored temporarily. Then, the number of characters of the neighborhood name corresponding to this code is retrieved from the neighborhood name code table 202 in which the neighborhood name code as shown in FIG. 8 and the number of characters of the neighborhood name corresponding to the neighborhood name code are registered in advance. do.

주소인식부 (306) 는, 시구명 검색부 (301) 에 있어서 동네이름 플래그가 「있음」으로 검색된 경우에는, 문자 인식부 (104) 로부터 출력되는 입력 문자열의 문자인식결과, 시구명 검색부 (301) 로부터 출력되는 시구명과 동네이름의 경계위치 및 동네이름 검색부 (303) 로부터 출력되는 동네이름에 의거하여 주거표시번호를 검출하고, 이 주거표시 번호와 동네이름 검색부 (303) 로부터의 동네이름 코드와 함께 주소를 인식한다.The address recognition unit 306, when the neighborhood name flag is searched for in the city name search unit 301 with "Yes," the character recognition result of the input string output from the character recognition unit 104, the city name search unit ( The housing display number is detected based on the boundary name of the city name and the neighborhood name output from 301 and the neighborhood name output from the neighborhood name search unit 303, and the neighborhood from the neighborhood display number and the neighborhood name search unit 303. Recognize an address with a name code.

또, 시구명 검색부 (301) 에 있어서 동네이름 플래그가 「없음」으로 검색된 경우에는, 문자 인식부 (104) 로부터 출력되는 입력 문자열의 문자인식결과, 시구명 검색부 (301) 로부터 출력되는 시구명과 동네이름의 경계위치 및 동네이름 문자수 검색부 (305) 로부터 출력되는 동네이름의 문자수에 의거하여 주거표시번호 개시 위치를 검출하고, 그 개시위치 이후의 문자를 주거표시번호로서 검출한다. 그리고, 이 주거표시번호와 동네이름 문자수 검색부 (305) 에 있어서 일시 기억된 동네이름 코드를 함께 주소로서 인식한다.In addition, when the neighborhood name flag is searched for in the neighborhood name search section 301 as "none", the character section of the input character string output from the character recognition section 104 results in the city section output from the street name search section 301. Based on the boundary position between the name and the neighborhood name and the number of characters of the neighborhood name output from the neighborhood name character number search unit 305, the starting position of the housing display number is detected, and the characters after the starting position are detected as the housing display number. The residential display number and the neighborhood name character number search unit 305 together recognize the temporarily stored neighborhood name code as an address.

다음에, 이 주소인식장치에 있어서, 더욱 구체적으로 설명한다.Next, the address recognition apparatus will be described in more detail.

이 실시형태에 있어서도, 지엽류 상에는 제 2 도에 나타내는 바와 같은 주소에 해당하는 문자열 「183-123 府中市 日新町 (부중시 일신정) 1-10」이 기재되어 있는 것으로 한다.Also in this embodiment, it is assumed that on the paper sheets, the character string "183-123 Nippon-shi Shinjuku 1-10" corresponding to the address shown in FIG. 2 is described.

먼저, 화상추출부 (101) 는, 이 지엽류상의 문자나 부호 등을 전기적인 화상신호로 변환한다 (제 4 도에 나타내는 스텝 (401)). 이 추출된 화상신호는 주소위치 검출부 (102) 로 보내진다. 주소위치 검출부 (102) 는, 주소위치를 검출하고 (스텝 (402)), 주소에 해당하는 입력 문자열, 즉 「183-123 府中市 日新町 (부중시 일신정) 1-10」의 화상신호를 추출한다.First, the image extraction unit 101 converts the letters, symbols, etc. on the paper sheets into electrical image signals (step 401 shown in FIG. 4). The extracted image signal is sent to the address position detection unit 102. The address position detecting unit 102 detects the address position (step 402), and inputs an input string corresponding to the address, that is, an image signal of "183-123 Nippon City Shinjuku 1-10". Extract.

그리고, 주소위치 검출부 (102) 에서 추출된 입력문자열은, 문자 슬라이스부 (103) 에서 1 문자별로 슬라이스된다 (스텝 (403)). 그리고, 이 슬라이스된 문자가 각각, 문자 인식부 (104) 에서, 문자사전 (105) 의 내용과 조회된다. 이하, 실시형태 1 에서 설명한 것과 동일한 처리를 행하고 (스텝 (404)~(411)), 문자 인식부 (104) 는 조회결과 r (1) ~(n) 를 문자인식결과로서, 제 5 도 (d) 에 나타내는 것과 같은 JIS 코드로 출력한다.The input string extracted by the address position detection unit 102 is sliced by one character in the character slice unit 103 (step 403). The sliced characters are then inquired by the character recognition unit 104 with the contents of the character dictionary 105. Hereinafter, the same processing as described in Embodiment 1 is performed (steps 404 to 411), and the character recognition unit 104 uses the inquiry results r (1) to (n) as the character recognition results. It outputs with JIS code as shown to d).

시구명 검색부 (301) 는, 문자인식부 (104) 에 있어서의 문자인식결과와 시구명이 미리 등록된 시구명 테이블 (302) 의 내용을 비교하고, 시구명 「府中市 (부중시)」를 검색한다. 그리고, 시구명을 검색함으로써, 도도부현시구 동네이름이 기재된 부분의 입력문자열에 있어서의 시구명 「府中市 (부중시)」와 동네이름 「日新町 (일신정)」의 경계위치를 검출하고, 그 검출결과를 동네이름 검색부 (303) 및 주소인식부 (306) 에 출력한다. 또, 검색된 시구명의 「府中市 (부중시)」는, 제 12 도에 나타내는 바와 같이, 미리 지정된 특정지역에 해당하므로, 동네이름 플래그 「있음」이 검출된다. 이로써, 동네이름 검색부 (303) 에, 동네이름 플래그 「있음」이 출력된다. 이 경우, 동네이름 문자수 검색부 (305) 는, 시구명 검색부 (301) 로부터 동네이름 플래그 「없음」이 보내지지 않기 때문에 동작하지 않는다.The city name search unit 301 compares the character recognition result in the character recognition unit 104 with the contents of the city name table 302 in which the city name is registered in advance, and selects the city name "市 中 市". Search. Then, by searching for the name of the city, the boundary position of the city name "府中 市" and the neighborhood name "日新 町" in the input string of the part where the prefecture prefecture city name is written is detected. The detection result is output to the neighborhood name search unit 303 and the address recognition unit 306. In addition, as shown in FIG. 12, the searched "city of city" corresponds to a specific area designated in advance, so that the neighborhood name flag "is present" is detected. In this way, the neighborhood name flag "Yes" is output to the neighborhood name search unit 303. In this case, the neighborhood name character count search unit 305 does not operate because the neighborhood name flag "none" is not sent from the city name search unit 301.

동네이름 검색부 (303) 는, 시구명 검색부 (301) 로부터 동네이름 플래그 「있음」의 출력을 받아서, 시구명 검색부 (301) 로부터 출력되는 시구명 「府中市 (부중시)」과 동네이름 「日新町 (일신정)」의 경계위치 및 문자인식부 (104) 로부터 출력되는 문자인식결과에 의거하여, 동네이름 테이블 (304) 로부터 동네이름 「日新町 (일신정)」을 검색하고, 그 검색한 동네이름 및 동네이름에 대응하는 동네이름 코드를 주소인식부 (306) 에 출력한다.The neighborhood name search unit 303 receives the output of the neighborhood name flag "Yes" from the municipal name search unit 301, and outputs the neighborhood name "府中 市 (Bujung City)" and the neighborhood output from the municipal name search unit 301. Based on the boundary position of the name "日新 町" and the character recognition result output from the character recognition unit 104, a neighborhood name "日新 일" is searched from the neighborhood name table 304, The neighborhood name code corresponding to the searched neighborhood name and neighborhood name is output to the address recognition unit 306.

주소인식부 (306) 는, 문자인식부 (104) 로부터 출력되는 입력문자열의 문자인식결과, 시구명검색부 (301) 로부터 출력되는 시구명 「府中市 (부중시)」와 동네이름 「日新町 (일신정)」의 경계위치 정보 및 동네이름 검색부 (303) 로부터 출력되는 동네이름에 의거하여, 주거표시번호 「1-10」를 검출하고, 이 주거표시번호「1-10」와 동네이름 검색부 (303) 로부터의 동네이름 코드 「183-123」을 함께 주소 「183-123, 1-10」로서 인식한다.The address recognition unit 306 is a character recognition result of the input string output from the character recognition unit 104, the city name "府中 市 (Bujung City)" output from the city name search unit 301 and the neighborhood name "日新 町Based on the boundary position information of &quot; (New Decision) &quot; and the neighborhood name output from the neighborhood name search unit 303, a housing display number &quot; 1-10 &quot; is detected, and this residential display number &quot; 1-10 &quot; The neighborhood name code "183-123" from the search unit 303 is also recognized as the addresses "183-123, 1-10".

즉, 시구명 검색부 (301) 는, 문자인식부 (104) 로부터의 조회결과 r (1) ~(n) 를 받아서, 시구명의 테이블 위치를 초기화한다 (j=1 : 제 10 도에 나타내는 스텝 (504)). 그리고, 시구명 테이블 C (j) 의 문자코드 r (8) 이후의 결과를 조회하고 (스텝 (505)), 일치하면, 그때의 j 를 CFL 에 격납한다 (CFL=j : 제 14 도에 나타내는 스텝 (601)). 그리고, 동네이름 플래그 g (CFL) 의 유.무 를 체크하고 (스텝 (602)), 동네이름 플래그 g (CFL) 이 없으면, 스텝 (603) 에서의 아니오에 응하여, 동네이름 플래그 「없음」을 동네이름 문자수 검색부 (305) 로 보낸다. 이로써, 제 10 도에 나타낸 스텝 (508) 이후의 처리가, 동네이름 검색부 (305) 및 주소인식부 (306) 에 의해서 실행된다. 동네이름 플래그 g (CFL) 가 있으면, 스텝 (603) 에서의 예에 응하여, 동네이름의 선두위치를 CST 에 격납한 후에 (스텝 (604)), 그 동네이름의 선두위치 (CST) 및 동네이름 플래그 「있음」을 동네이름 검색부 (303) 로 보낸다.That is, the city name search unit 301 receives the inquiry results r (1) to (n) from the character recognition unit 104 and initializes the table position of the city name (j = 1: step shown in FIG. 10). (504)). Then, the result after the character code r (8) of the city name table C (j) is inquired (step 505), and if there is a match, the corresponding j is stored in the CFL (CFL = j: shown in FIG. 14). Step 601). Then, the presence or absence of the neighborhood name flag g (CFL) is checked (step 602). If the neighborhood name flag g (CFL) is not present, the neighborhood name flag "none" is returned in response to a no at step 603. Send to the neighborhood name character search unit (305). In this way, the process after step 508 shown in FIG. 10 is executed by the neighborhood name search unit 305 and the address recognition unit 306. If there is a neighborhood name flag g (CFL), in response to the example in step 603, after storing the leading location of the neighborhood name in the CST (step 604), the leading location (CST) and neighborhood name of the neighborhood name The flag "Yes" is sent to the neighborhood name search unit 303.

동네이름 검색부 (303) 는, 시구명 검색부 (301) 로부터의 동네이름 플래그 「있음」을 받아서, 동네이름의 테이블 위치를 초기화하고 (j=1 : 스텝 (605)), 동네이름 테이블 t (j) 의 문자코드와 r (CST) 이후의 결과를 조회한다 (스텝 (606)). 동네이름 테이블 t (j) 의 문자코드와 r (CST) 이후의 결과가 일치하지 않으면, 스텝 (607) 에서의 아니오에 응하여 스텝 (608) 으로 진행하고, j=j+1 로 하고, 스텝 (606) 으로 되돌아간다. 동네이름 테이블 t (j) 의 문자코드와 r (CST) 이후의 결과가 일치하면, 스텝 (607) 에서의 예에 응하여 스텝 (609) 으로 행한다. 스텝 (609) 에서는, r (CST) 이후의 결과와 일치한 동네이름 테이블 t (j) 이 나타내는 동네이름과 동네이름 코드를, 주소인식부 (306) 로 출력한다. 이때, 동네이름 코드에 대해서는, 그 각 문자의 카테고리를 선두로부터 r' (1) ~ r' (7) 에 격납하고, 이를 조회결과 r' (1) ~ r' (7) 로서 주소인식부 (306) 에 출력한다.The neighborhood name search unit 303 receives the neighborhood name flag "Yes" from the city name search unit 301, initializes the table position of the neighborhood name (j = 1: step 605), and the neighborhood name table t. The character code of (j) and the result after r (CST) are inquired (step 606). If the character code of the neighborhood name table t (j) and the result after r (CST) do not match, the process proceeds to step 608 in response to NO in step 607, where j = j + 1, and step ( Return to 606). If the character code of the neighborhood name table t (j) and the result after r (CST) coincide, the process proceeds to step 609 in accordance with the example in step 607. In step 609, the neighborhood name and the neighborhood name code indicated by the neighborhood name table t (j) corresponding to the result after r (CST) are output to the address recognition unit 306. At this time, for the neighborhood name code, the category of each character is stored in r '(1) to r' (7) from the beginning, and this is referred to as the address recognition unit (r '(1) to r' (7). 306).

주소인식부 (306) 는, 시구명 검색부 (301) 로부터의 시구명과 동네이름의 경계위치, 즉 동네이름의 선두위치 (CST) 및 동네이름 검색부 (303) 로부터의 주거 표시번호의 선두위치 JST 를 구한다 (스텝 (610)). 또, 동네이름 검색부 (303) 로부터의 조회결과 r' (1) ~ r' (7) 를 최종결과 f (1) ~ f (7) 에 격납한다 (스텝 (611)). 또, 주거표시번호의 선두위치 JST 이후의 조회결과 (JST) 를 주거표시번호로 보고, 이 주거표시번호에 해당하는 조회결과 r (JST) 이후를 최종결과 f (8) 이후에 격납한다. 이로써, 제 6 도 (b) 에 나타낸 것과 동일한 최종결과 f (1) ~ f (m) 를 얻을 수 있다.The address recognition unit 306 is a boundary between the city name and the neighborhood name from the city name search unit 301, namely, the head position of the neighborhood name (CST) and the first position of the residential display number from the neighborhood name search unit 303. The JST is found (step 610). The search results r '(1) to r' (7) from the neighborhood name search unit 303 are stored in the final results f (1) to f (7) (step 611). In addition, the inquiry result (JST) after the first position JST of the residence indication number is regarded as the residence indication number, and after inquiry result r (JST) corresponding to this residence indication number is stored after the final result f (8). Thereby, final results f (1) to f (m) similar to those shown in FIG. 6 (b) can be obtained.

[우편물 자동처리 시스템][Mail Automatic Processing System]

그리고, 상기 각 실시형태에 있어서 주소로서 인식된 「183-123 1-10」을 예를 들면, 바코드 코드 등으로 변환하고, 그 바코드 코드를 지엽류상에 인쇄하면, 자동처리 시스템의 처리를 매우 효율화할 수 있다. 이 경우의 우편물 자동처리 시스템의 처리를 매우 효율화할 수 있다. 이 경우의 자동우편물처리 시스템의 개요를 제 15 도에 예시한다. 동 도면에 있어서, (2-1) 은 지엽류 공급부, (2-2) 는 광학문자 인식부, (2-3) 은 바코드인자부, (2-4) (2-4l ~ 2-4n) 은 집적부, (2-5) 는 게이트 컨트롤러, (2-6) 은 반송로, (2-7) (2-71 ~ 2-7n) 은 게이트이다. 또, (3-1) 은 지엽류 공급부, 3-2 는 바코드 리드부, (3-3) (3-31 ~ 3-3n) 은 집적부, (3-4) 는 게이트 컨트롤러, (3-5) 는 반송로, (3-6) (3-61 ~ 3-6n) 은 게이트이다.Then, by converting "183-123 1-10" recognized as an address in each of the above embodiments into a barcode code, for example, and printing the barcode code on paper sheets, the processing of the automatic processing system becomes very efficient. can do. In this case, the processing of the automatic mail processing system can be made very efficient. An outline of the automatic mail processing system in this case is illustrated in FIG. In the figure, (2-1) is a paper sheet supply unit, (2-2) is an optical character recognition unit, (2-3) is a barcode factor unit, (2-4) (2-4l to 2-4n) The silver integrated part, (2-5) is a gate controller, (2-6) is a conveyance path, and (2-7) (2-71-2-7n) is a gate. (3-1) is a paper sheet supply part, 3-2 is a barcode lead part, (3-3) (3-31 to 3-3n) is an integrated part, (3-4) is a gate controller, and (3- 5) is a conveyance path, and (3-6) (3-61 to 3-6n) is a gate.

이 우편물처리 시스템에서는, 지엽류 공급부 (2-1) 로부터의 지엽류 (4) 가, 반송로 (2-6) 에 공급된다. 지엽류 (4) 가 광학문자 인식부 (2-2) 에 달하면, 광학문자 인식부 (2-2) 는, 지엽류 (4) 상에 기재된 주소에 해당하는 문자열을 검출하고, 본 발명에 의한 방식으로 주소로 인식한다. 즉, 지엽류 (4) 에 「183-123 府中市 日新町 (부중시 일신정) 1-10」 이라고 기재되어 있다면, 「183-123 1-10」을 주소로서 인식한다. 그리고, 광학문자 인식부 (2-2) 는, 이 인식한 주소 「183-123 1-10」을 바코드 인자부 (2-3) 로 보낸다. 바코드 인자부 (2-3) 는, 광학문자인식부 (2-2) 로부터의 주소 「183-123 1-10」을 바코드로 변환하고, 이를 광학문자 인식부 (2-2) 를 거쳐서 보내져 오는 지엽류 (4) 의 소정의 부분에 인자한다.In this postal matter processing system, the paper sheets 4 from the paper sheet supply unit 2-1 are supplied to the conveying path 2-6. When the paper sheet 4 reaches the optical character recognition unit 2-2, the optical character recognition unit 2-2 detects a character string corresponding to the address described on the paper sheet 4 and according to the present invention. It is recognized as an address. In other words, if the paper sheet 4 is described as "183-123, Nippon-Dongjin 1-1", "183-123 1-10" is recognized as an address. And the optical character recognition part 2-2 sends this recognized address "183-123 1-10" to the barcode printing part 2-3. The barcode printing unit 2-3 converts the address "183-123 1-10" from the optical character recognition unit 2-2 into a barcode, which is sent through the optical character recognition unit 2-2. It prints on the predetermined part of the paper sheet 4.

이 바코드가 인자된 지엽류 (4) 는 집적부 (2-4) 로 보내진다. 여기에서, 광학문자 인식부 (2-2) 에서 인식한 지엽류 (4) 의 주소 「183-123 1-10」는 게이트 컨트롤러 (2-5) 에도 보내지고, 게이트 컨트롤러 (2-5) 는 이 보내져오는 주소 「183-123 1-10」에 의거하여 게이트 (2-71) ~ (2-7n) 의 개폐를 제어한다. 이로써, 지엽류 (4) 는, 광학문자인식부 (2-2) 에서 인식된 주소 「183-123 1-10」에 대응하는 집적부 (2-4) 에 집적된다.The paper sheet 4 on which this barcode has been printed is sent to the accumulation section 2-4. Here, the address "183-123 1-10" of the paper sheet 4 recognized by the optical character recognition unit 2-2 is also sent to the gate controller 2-5, and the gate controller 2-5 is The opening / closing of the gates 2-71 to 2-7n is controlled based on the address “183-123 1-10”. Thereby, the paper sheet 4 is integrated in the accumulation part 2-4 corresponding to the address "183-123 1-10" recognized by the optical character recognition part 2-2.

지엽류 공급부 (3-1) 로부터의 지엽류 (4) 는, 즉 상술한 방법에 의해서 바코드가 인자된 지엽류 (4) 는, 반송로 (3-5) 에 공급된다. 지엽류 (4) 가 바코드 리드부 (3-2) 에 달하면, 바코드 리드부 (3-2) 는, 지엽류 (4) 상에 인자된 바코드를 읽는다. 그리고, 이 읽어낸 바코드의 내용을 게이트 컨트롤러 (3-4) 로 보낸다. 게이트 컨트롤러 (3-4) 는, 이 보내져오는 바코드의 내용에 의거하여 게이트 (3-61) ~ (3-6n) 의 개폐를 제어한다. 이로써, 지엽류 (4) 는, 바코드 리드부 (3-2) 에서 읽힌 바코드가 나타내는 주소에 대응하는 집적부 (3-3) 에 집적된다.The paper sheets 4 from the paper sheet supply unit 3-1, that is, the paper sheets 4 with the barcode printed by the above-described method, are supplied to the conveying path 3-5. When the paper sheet 4 reaches the barcode reading section 3-2, the barcode reading section 3-2 reads the barcode printed on the paper sheet 4. As shown in FIG. Then, the contents of the read barcode are sent to the gate controller 3-4. The gate controller 3-4 controls the opening and closing of the gates 3-61 to 3-6n based on the contents of the bar code sent. In this way, the paper sheets 4 are accumulated in the accumulation section 3-3 corresponding to the address indicated by the barcode read by the barcode reading section 3-2.

또, 상술한 각 실시형태에 있어서는, 일본국내를 대상으로서, 주소형태를 한자, 기호 및 숫자의 조합으로 설명하였지만, 중국이나 한국 등의 지엽류에 대해서도 동일한 방법을 적용할 수 있다. 중국의 우편물의 예를 제 16 도 (a) 에, 한국의 우편물의 예를 제 16 도 (b) 에 나타낸다. 중국의 우편물이라도 일본과 동일하게 도도부현시구 동네이름에 상당하는 부분이 한자로 기재되어 있으며, 주거표시 번호가 숫자로 표기되어 있다. 또, 한국의 우편물에서는, 도도부현시구 동네이름에 상당하는 부분이 한글로 기재되어 있으며, 주거표시번호가 숫자 및 하이픈 등의 기호로 표기되어 있다.In each of the above-described embodiments, the address form is described by a combination of Chinese characters, symbols, and numbers for the domestic market. However, the same method can be applied to paper sheets such as China and Korea. An example of a postal matter in China is shown in FIG. 16 (a), and an example of a Korean postal matter is shown in FIG. 16 (b). Even in the case of China's mail, the portion corresponding to the prefecture's prefecture's name is written in Chinese characters, and the housing number is marked with numbers. In the Korean postal matters, portions corresponding to the prefectures of the prefectures of the prefecture are written in Korean, and the residential display numbers are indicated by symbols such as numbers and hyphens.

이상 설명한 것으로부터 확실해지듯이 본 발명에 의하면, 제 1 발명 및 제 6 발명에서는, 동네이름 코드 및 주거표시 번호를 함께 주소로서 인식하도록 하였으므로, 미리 숫자 등으로 이루어지는 동네이름 코드를 대응시킴으로써, 방대한 수의 동네이름을 등록하는 일 없이, 주소를 고속이면서 고정도로 읽어낼 수 있게 된다.As will be apparent from the above description, according to the present invention, since the neighborhood name code and the residential display number are recognized together as addresses in the first and sixth inventions, a large number of neighborhood name codes consisting of numbers and the like are matched in advance. Without registering the name of the neighborhood, the address can be read at high speed and with high accuracy.

제 2 발명 및 제 7 발명에서는, 제 1 발명 및 제 6 발명에 있어서, 입력문자열을 그 선두부분으로부터 순차 문자종류를 체크함으로써 동네이름 코드 및 주거표시번호를 검출하도록 하였으므로, 제 1 발명 및 제 6 발명의 효과에 더하여, 동네이름 코드 및 주거표시번호의 검출을 확실하게 할 수 있다는 효과를 얻는다.In the second invention and the seventh invention, in the first invention and the sixth invention, the neighborhood name code and the residential display number are detected by checking the character type sequentially from the head of the input string. In addition to the effects of the invention, it is possible to ensure the detection of the neighborhood name code and the residential display number.

제 3 발명 및 제 8 발명에 에서는, 제 1 발명 및 제 6 발명에 있어서, 동네이름 코드에 대응하는 동네이름의 문자수를 제 1 테이블로부터 검색한 것으로 하고, 입력문자열을 구성하는 시구명을 제 2 테이블로부터 검색한 것으로 하고, 그 검색한 동네이름의 문자수와 시구명에 의거하여 주거표시번호를 검출하도록 하였으므로, 제 1 발명 및 제 6 발명의 효과에 더하여, 동네이름 코드 및 주거표시번호의 검출을 확실하게 할 수 있다는 효과를 얻는다.In the third invention and the eighth invention, in the first invention and the sixth invention, the number of characters of the neighborhood name corresponding to the neighborhood name code is retrieved from the first table, and the city name constituting the input string is determined. 2 The table was searched, and the residential display number was detected based on the number of characters and the city name of the searched neighborhood name. Therefore, in addition to the effects of the first and sixth inventions, The effect of ensuring the detection is obtained.

제 4 발명 및 제 9 발명에서는, 제 3 발명 및 제 8 발명에 있어서, 제 2 테이블에 등록된 시구명중 미리 지정된 특정지역의 시구명에 동네이름 플래그를 부가한 것으로 하고, 검색한 시구명에 동네이름 플래그가 부가되어 있는 경우, 문자인식결과 및 검색한 시구명에 의거하여, 제 3 테이블로부터 입력문자열에 기재된 동네이름 및 그 동네이름에 대응하는 동네이름 코드를 검색하는 것으로 하고, 이 검색한 시구명 및 동네이름에 의거하여 주거표시번호를 검출하도록 하였으므로, 제 3 발명 및 제 8 발명의 효과에 더하여, 동네이름 코드가 기재되어 있지 않은 경우라도, 주소를 확실하게 인식할 수 있다는 효과를 얻는다.In the fourth and ninth inventions, in the third and eighth inventions, the neighborhood name flag is added to the municipal name of a specific region previously designated among the municipal names registered in the second table, and the neighborhood is searched for. When the name flag is attached, the neighborhood name described in the input string and the neighborhood name code corresponding to the neighborhood name are searched from the third table based on the character recognition result and the searched city name. Since the residential display number is detected based on the name and the neighborhood name, in addition to the effects of the third and eighth inventions, the address can be reliably recognized even if the neighborhood name code is not described.

제 5 발명 및 제 10 발명에서는, 제 4 발명 및 제 9 발명에 있어서, 동네이름 플래그가 부가되는 특정지역을 지역별로 취급되는 지엽류의 수량에 의거하여 미리 지정하도록 하였으므로, 제 4 발명 및 제 9 발명의 효과에 가하여, 적어도 동네이름의 등록에 의해서 매우 큰 효과를 얻을 수 있다.In the fifth invention and the tenth invention, in the fourth invention and the ninth invention, the specific area to which the neighborhood name flag is added is specified in advance based on the number of paper sheets handled for each area. In addition to the effects of the invention, at least registration of the neighborhood name can achieve a very large effect.

제 11 발명에서는, 반송되어서 오는 지엽류상에 기재된 주소를 나타내는 입력문자열 보다 제 1 발명의 주소인식 방법으로 주소를 인식하고, 이 인식한 주소를 바코드로 변환하여 상기 지엽류상에 인자하고, 이 바코드가 인자된 지엽류를 그 인자된 바코드에 따라서 처리하도록 하였으므로, 제 1 발명의 효가에 더하여, 바코드 즉 인식한 주소에 따라서, 지엽류를 자동적으로 분류하여 집적할 수 있는 것이 가능해진다는 효과를 얻을 수 있다.In the eleventh invention, an address is recognized by the address recognition method of the first invention rather than an input string indicating an address written on a paper sheet to be returned, and the recognized address is converted into a barcode to be printed on the paper sheet. Since the printed paper sheets are processed according to the printed bar codes, in addition to the effect of the first invention, the paper sheets can be automatically sorted and accumulated according to the barcodes or recognized addresses. have.

Claims (7)

지엽류상에 기재되는 동네이름별로 대응하는 일련의 숫자 또는 숫자와 기호 양자로 이루어진 동네이름 코드, 일련의 한글이나 한자 또는 영문으로 이루어진 지역명 및 일련의 숫자 또는 숫자와 기호 양자로 이루어진 주거표시번호를 포함하는 주소를 나타내는 입력문자열을 화상추출하고, 이 화상추출한 입력문자열을 1 문자별로 슬라이스하여, 각각의 문자를 미리 상기 동네이름코드와 상기 주거표시번호의 문자종류로 한정된 문자 정보가 등록된 문자사전의 내용과 비교 조회하되, 일련의 숫자 또는 숫자와 기호 양자로 이루어진 상기 동네이름코드와 상기 주거표시번호만을 문자인식하고, 이 문자인식결과에 의거하여 상기 동네이름 코드 및 상기 주거표시번호만을 검출하고, 그 검출한 동네이름 코드 및 주거표시번호를 함께 주소로서 인식하도록 하되, 상기 문자인식결과에 의거하여 상기 입력문자열의 각 문자의 문자종류를 판정하는 것으로 하고, 상기 입력문자열을 그 선두부분으로부터 순차 문자종류를 체크함으로써, 동네이름 코드 및 주거표시번호를 검출하도록 하고, 동네이름 코드에 대응하는 동네이름의 문자수를 미리 등록한 제 1 테이블과 시구명(市區名)을 미리 등록한 제 2 테이블을 설치하고, 상기 문자 인식결과에 의거하여 동네이름 코드를 검출하고, 그 동네이름 코드에 대응하는 동네이름의 문자수를 상기 제 1 테이블로부터 검색하는 것으로 하고, 상기 문자인식결과에 의거하여, 상기 제 2 테이블로부터 상기 입력문자열을 구성하는 시구명을 검색하는 것으로 하고, 이로써 검색한 동네이름의 문자수와 시구명에 의거하여 주거표시번호를 검출하도록 한 것을 특징으로 하는 주소인식방법.A neighborhood name code corresponding to a series of numbers or numbers and symbols corresponding to each neighborhood name listed on a paper sheet, a region name consisting of a series of Korean, Chinese, or English characters, and a residential designation number consisting of a series of numbers or both numbers and symbols. Image extracting an input string indicating an address to be included, and extracting the image extracted input string by one character, and each character is previously registered with character information limited to the character type of the neighborhood name code and the residential display number. Compare and search the contents of, but only character recognition of the neighborhood name code and the residential display number consisting of a series of numbers or both numbers and symbols, and detects only the neighborhood name code and the residential display number based on the character recognition result. To recognize the detected neighborhood name code and residential identification number as addresses. The character type of each character of the input string is determined based on the character recognition result, and the neighborhood name code and the residential display number are detected by checking the character type sequentially from the head of the input string. Install a first table that pre-registers the number of characters of the neighborhood name corresponding to the neighborhood name code and a second table that pre-registers the city name, and detect the neighborhood name code based on the character recognition result; The number of characters of the neighborhood name corresponding to the neighborhood name code is searched from the first table, and the city name constituting the input string is searched from the second table based on the character recognition result. Thus, the address characterized in that to detect the residential display number based on the number of characters and the city name of the searched neighborhood name Recognition method. 제1항에 있어서, 상기 제 2 테이블에 등록된 시구명중 미리지정된 특정지역의 시구명에 동네이름 플래그를 부가하는 것으로 하고, 검색한 시구명에 동네이름 플래그가 부가되어 있는 경우, 상기 문자인식결과 및 검색한 시구명에 의거하여, 동네이름 플래그가 부가된 시구명에 대응하는 동네이름 및 그 동네이름에 대응하는 동네이름 코드가 미리 등록된 제 3 테이블로부터 입력문자열에 기재된 동네이름 및 그 동네이름에 대응하는 동네이름 코드를 검색하는 것으로 하고, 이 검색한 시구명 및 동네이름에 의거하여 주거표시번호를 검출하도록 한 것을 특징으로 하는 주소인식방법.The character recognition result according to claim 1, wherein the town name flag is added to a preliminary name of a specific area among the precinct names registered in the second table, and the town name flag is added to the searched prefecture name. And the neighborhood name and its neighborhood name described in the input string from the third table in which the neighborhood name corresponding to the neighborhood name to which the neighborhood name flag has been added and the neighborhood name code corresponding to the neighborhood name are pre-registered based on the retrieved city name. And searching for a neighborhood name code corresponding to the neighborhood name code, and detecting a residential display number based on the searched district name and neighborhood name. 제2항에 있어서, 동네이름 플래그를 부가하는 특정지역을, 지역별로 취급하는 지엽류의 수량에 의거하여 미리 지정하도록 한 것을 특징으로 하는 주소인식방법.The address recognition method according to claim 2, wherein the specific area to which the neighborhood name flag is added is specified in advance based on the number of paper sheets handled for each area. 지엽류상에 기재되는 동네이름별로 대응하는 일련의 숫자 또는 숫자와 기호 양자로 이루어진 동네이름 코드, 일련의 한글이나 한자 또는 영문으로 이루어진 지역명 및 일련의 숫자 또는 숫자와 기호 양자로 이루어진 주거표시번호를 포함하는 주소를 나타내는 입력문자열을 화상추출수단과, 이 화상추출수단에 의해 화상추출된 입력문자열을 1 문자별로 슬라이스하여, 각각의 문자를 미리 상기 동네이름코드와 상기 주거표시번호의 문자종류로 한정된 문자정보가 등록된 문자사전의 내용과 비교 조회하되, 일련의 숫자 또는 숫자와 기호 양자로 이루어진 상기 동네이름코드와 상기 주거표시번호만을 문자인식하는 문자인식수단과, 이 문자인식수단에서의 문자인식결과에 의거하여 상기 동네이름 코드 및 상기 주거표시번호만을 검출하는 검출수단과, 이 검출수단으로 검출된 동네이름 코드 및 주거표시번호를 함께 주소로서 인식하는 주소인식수단을 구비하되, 상기 검출수단은, 상기 문자인식수단에서의 문자인식결과에 의거하여 상기 입력문자열의 각 문자의 문자종류를 판정하는 문자종류판정수단을 구비하고, 상기 입력문자열을 그 선두부분으로부터 순차 문자종류를 체크함으로써, 동네이름 코드 및 주거표시번호를 검출하며, 상기 검출수단은 동네이름 코드에 대응하는 동네이름의 문자수가 미리 등록된 제 1 테이블과 시구명이 미리 등록된 제 2 테이블과, 상기 문자인식수단에서의 문자인식수단에 의거하여 동네이름 코드를 검출하고, 그 동네이름 코드에 대응하는 동네이름의 문자수를 상기 제 1 테이블로부터 검색하는 동네이름 문자수 검색수단과, 상기 문자인식수단에서의 문자인식결과에 의거하여, 상기 제 2 테이블로부터, 상기 입력문자열을 구성하는 시구명을 검색하는 시구명 검색수단을 구비하고, 상기 동네이름 검색수단에서 검색된 동네이름의 문자수와 상기 시구명 검색수단에서 검색된 시구명에 의거하여 주거표시번호를 검출하는 것을 특징으로 하는 주소인식장치.A neighborhood name code corresponding to a series of numbers or numbers and symbols corresponding to each neighborhood name listed on a paper sheet, a region name consisting of a series of Korean, Chinese, or English characters, and a residential designation number consisting of a series of numbers or both numbers and symbols. The image extracting means and the input string extracted by the image extracting means are sliced by one character, and each character is previously limited to the character type of the neighborhood name code and the residential display number. Character information means for searching and comparing the text information with the contents of the registered text dictionary, a character recognition means for character recognition only the neighborhood name code and the residential display number consisting of a series of numbers or both numbers and symbols, and the character recognition in the character recognition means Detecting means for detecting only the neighborhood name code and the residential display number based on a result; Address recognition means for recognizing the neighborhood name code and the residential display number detected by the detection means together as an address, wherein the detection means is based on the character recognition result of the character recognition means for each character of the input string. A character type determination means for determining a character type, and checking the character type sequentially from the head of the input string to detect a neighborhood name code and a residential display number, and the detection means is a neighborhood corresponding to the neighborhood name code The neighborhood name code is detected based on the first table in which the number of characters of the name is registered in advance, the second table in which the city name is registered in advance, and the text recognition means in the text recognition means, and the name of the neighborhood corresponding to the neighborhood name code is detected. Neighborhood name character number search means for searching the number of characters from the first table, and character recognition result in the character recognition means; And a county name search means for searching for a county name constituting the input string from the second table, wherein the number of characters of the neighborhood name searched by the neighborhood name search means and the county searched by the county name search means are provided. Address recognition device characterized in that for detecting the residential display number based on the name. 제4항에 있어서, 상기 제 2 테이블에 등록된 시구명중 미리 지정된 특정지역의 시구명에는 동네이름 플래그가 부가되어 있으며, 상기 시구명 검색수단에서 검색된 시구명에 동네이름 플래그가 부가되어 있는 경우에, 상기 문자인식수단에서의 문자인식결과 및 상기 시구명 검색수단에서 검색된 시구명에 의거하여, 상기 동네이름 플래그가 부가된 시구명에 대응하는 동네이름 및 그 동네이름에 대응하는 동네이름 코드가 미리 등록된 제 3 테이블로부터 상기 입력문자열에 기재된 동네이름 및 그 동네이름에 대응하는 동네이름 코드를 검색하는 동네이름 검색수단과, 상기 시구명 검색수단에서 검색된 시구명 및 상기 동네이름 검색수단에서 검색된 동네이름에 의거하여 주거표시번호를 검출하는 것을 특징으로 하는 주소인식장치.5. The method of claim 4, wherein a neighborhood name flag is added to a preliminary name of a specific region among the precinct names registered in the second table, and a neighborhood name flag is added to the precinct name retrieved by the prefecture name searching means. Based on the character recognition result of the character recognition means and the city name searched by the city name search means, the neighborhood name corresponding to the neighborhood name to which the neighborhood name flag is added and the neighborhood name code corresponding to the neighborhood name are previously displayed. Neighborhood name search means for searching for a neighborhood name described in the input string and a neighborhood name code corresponding to the neighborhood name from a registered third table, a neighborhood name searched by the city name search means and the neighborhood name search means Address recognition device characterized in that for detecting the residential display number based on the name. 제5항에 있어서, 상기 동네이름 플래그가 부가되는 특정지역은, 지역별로 취급하는 지엽류의 수량에 의거하여 미리 지정되는 것을 특징으로 하는 주소인식장치.The address recognition device according to claim 5, wherein the specific area to which the neighborhood name flag is added is specified in advance based on the number of paper sheets handled for each area. 반송되어 오는 지엽류상에 기재된 주소를 나타내는 입력문자열로부터 청구항 제1항의 주소인식방법으로 주소를 인식하는 주소인식수단과, 이 주소인식수단에 의해 인식된 주소를 바코드로 변환하여 상기 지엽류상에 인자하는 바코드 인자수단과, 이 바코드에 인자수단에 의해서 바코드가 인자된 지엽류를 그 인자된 바코드에 따라서 처리하는 처리수단을 구비한 것을 특징으로 하는 지엽류 자동처리 시스템.An address recognition means for recognizing an address by the address recognition method of claim 1 from an input string representing an address written on the returned paper sheet, and converting the address recognized by the address recognition means into a barcode to print on the paper sheet. And a bar code printing means, and processing means for processing paper sheets on which the bar code has been printed by the bar code printing means in accordance with the bar code.
KR1019950024342A 1994-08-08 1995-08-07 Address recognition method, address recognition device and paper sheet automatic processing system KR100286163B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP94-185564 1994-08-08
JP18556494 1994-08-08

Publications (2)

Publication Number Publication Date
KR960008620A KR960008620A (en) 1996-03-22
KR100286163B1 true KR100286163B1 (en) 2001-04-16

Family

ID=16173022

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950024342A KR100286163B1 (en) 1994-08-08 1995-08-07 Address recognition method, address recognition device and paper sheet automatic processing system

Country Status (2)

Country Link
KR (1) KR100286163B1 (en)
CN (1) CN1102461C (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100692327B1 (en) * 1999-07-01 2007-03-09 가부시키가이샤 히타치세이사쿠쇼 An expression method of names of places, a recognition method of names of places and a recognition apparatus of names of places
KR100697689B1 (en) * 2005-08-10 2007-03-20 (주)공영디비엠 Method of fixing of atypical database using fixed form apparatus

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251012A (en) * 1999-03-01 2000-09-14 Hitachi Ltd Method and system for document processing
JP2001134716A (en) * 1999-11-09 2001-05-18 Toshiba Corp Location information recognizing method, recognition application, recording medium and location information recognizing device
CN1300739C (en) * 2005-01-25 2007-02-14 邮政科学上海研究所 Letter checking and identifying method
CN101887519B (en) * 2010-08-16 2012-04-18 同方知网(北京)技术有限公司 Character recognition and modification method
FR2965193B1 (en) * 2010-09-23 2012-08-31 Solystic POSTAL SORTING METHOD WITH RECOVERY OF USER TREATMENT INFORMATION BETWEEN SORT PASSES
JP6203084B2 (en) * 2014-03-06 2017-09-27 株式会社東芝 Delivery classification processing system and delivery classification processing method
JP2015176241A (en) * 2014-03-13 2015-10-05 株式会社東芝 Database management device and address recognition device
CN104624509B (en) * 2015-01-16 2017-06-13 浙江百世技术有限公司 A kind of express delivery Automated Sorting System and automatic sorting method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5216725A (en) * 1990-10-31 1993-06-01 Environmental Research Institute Of Michigan Apparatus and method for separating handwritten characters by line and word

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5169033A (en) * 1974-12-04 1976-06-15 Furuta Denki Kk Nosakubutsuno bosohoho

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5216725A (en) * 1990-10-31 1993-06-01 Environmental Research Institute Of Michigan Apparatus and method for separating handwritten characters by line and word

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100692327B1 (en) * 1999-07-01 2007-03-09 가부시키가이샤 히타치세이사쿠쇼 An expression method of names of places, a recognition method of names of places and a recognition apparatus of names of places
KR100697689B1 (en) * 2005-08-10 2007-03-20 (주)공영디비엠 Method of fixing of atypical database using fixed form apparatus

Also Published As

Publication number Publication date
CN1148221A (en) 1997-04-23
CN1102461C (en) 2003-03-05
KR960008620A (en) 1996-03-22

Similar Documents

Publication Publication Date Title
US6327373B1 (en) Mail address reading apparatus and mail sorting apparatus
KR100286163B1 (en) Address recognition method, address recognition device and paper sheet automatic processing system
US4524453A (en) Postal code distinguishing apparatus
US5581628A (en) Characters reading apparatus having collating means of envelope
KR20010030737A (en) Method and device for recognition of delivery data on mail matter
JP2004533069A (en) Method and apparatus for automatically reading an address in more than one language
US5995664A (en) Information recognition apparatus for recognizing recognition object information
JP2910630B2 (en) Address recognition method, address recognition device, and paper sheet automatic processing system
US7711642B2 (en) Payment form discrimination method and apparatus
CA2473278C (en) Sorting apparatus and address information determination method
JPH07271899A (en) Character recognition device
JP3162552B2 (en) Mail address recognition device and address recognition method
JP3425257B2 (en) Mail reading sorter
JP2991594B2 (en) Mail address reading device
JP3243000B2 (en) Mail processing apparatus and mail processing method
CA2620180A1 (en) Method for retrieving text blocks in documents
JP3160347B2 (en) Mail address reading device
JP3088036B2 (en) Address reading sorting machine
JP2001025713A (en) Posta sorting mail system
JP3088038B2 (en) Mail sorting device and mail sorting method
JPH0793467A (en) Address reading system
JPH07271909A (en) Device and method for recognizing character
JPH01316887A (en) Address information reader
JPH01161587A (en) Postcode reader
JPH05242303A (en) Address reader

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20101222

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee