KR101470748B1 - Character recognition method, character recognition apparatus and financial apparatus - Google Patents

Character recognition method, character recognition apparatus and financial apparatus Download PDF

Info

Publication number
KR101470748B1
KR101470748B1 KR1020130087482A KR20130087482A KR101470748B1 KR 101470748 B1 KR101470748 B1 KR 101470748B1 KR 1020130087482 A KR1020130087482 A KR 1020130087482A KR 20130087482 A KR20130087482 A KR 20130087482A KR 101470748 B1 KR101470748 B1 KR 101470748B1
Authority
KR
South Korea
Prior art keywords
character
characters
image
predetermined
groups
Prior art date
Application number
KR1020130087482A
Other languages
Korean (ko)
Inventor
구범용
Original Assignee
주식회사 엘지씨엔에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지씨엔에스 filed Critical 주식회사 엘지씨엔에스
Priority to KR1020130087482A priority Critical patent/KR101470748B1/en
Priority to CN201310329263.2A priority patent/CN103577820B/en
Priority to US13/955,782 priority patent/US9563811B2/en
Application granted granted Critical
Publication of KR101470748B1 publication Critical patent/KR101470748B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)

Abstract

The present invention relates to a character recognizing method for recognizing characters of a medium. The character recognizing method includes the steps of: obtaining a character image of an individual character from a medium; and determining a character by reading, in a stepwise manner, the character image according to a hierarchical structure in which a group of certain characters is hierarchically classified into multiple groups including superordinate and subordinate groups.

Description

문자 인식 방법, 문자 인식 장치 및 금융기기{Character recognition method, character recognition apparatus and financial apparatus}Technical Field [0001] The present invention relates to a character recognition method, a character recognition apparatus and a financial apparatus,

문자 인식 방법, 문자 인식 장치 및 금융기기에 관한 것이다.A character recognition method, and a financial instrument.

금융기기는 지폐나 수표와 같은 매체를 투입하거나 인출하는 등의 금융업무를 처리하는 기기로, 금융업무의 신뢰성을 높이기 위해서는 매체에 포함된 문자들을 정확하게 인식하는 것이 중요하다. Financial equipment is a device that processes financial business such as inputting or withdrawing a medium such as banknotes or checks. It is important to accurately recognize the characters included in the medium in order to enhance the reliability of the financial business.

문자 인식의 정확성을 높이기 위하여, 최근에는 광학식 문자 판독 방식이 널리 이용되고 있다. 그러나, 광학식 문자 판독 방식의 경우, 스캔된 이미지의 품질이 좋은 경우에는 문자 인식의 정확성이 좋으나, 스캔된 이미지의 품질이 좋지 않은 경우에는 문자 인식의 정확성이 떨어진다. 이에 따라, 스캔된 이미지의 품질이 좋지 않은 경우에도 정확하고 신속하게 매체의 문자를 인식할 수 있는 문자 인식 방법이 요구된다. In order to improve the accuracy of character recognition, an optical character reading method is widely used in recent years. However, in the case of the optical character reading system, when the quality of the scanned image is good, the accuracy of character recognition is good, but when the quality of the scanned image is poor, the accuracy of character recognition is low. Accordingly, there is a need for a character recognition method capable of accurately and quickly recognizing characters on a medium even when the quality of the scanned image is poor.

본 발명의 적어도 하나의 실시예가 이루고자 하는 기술적 과제는 매체의 문자를 정확하게 인식할 수 있는 문자 인식 방법, 문자 인식 장치 및 금융기기를 제공하는 데 있다. 문자 인식 방법, 문자 인식 장치 및 금융기기가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and it is an object of the present invention to provide a character recognition method, a character recognition apparatus, and a financial instrument. The character recognition method, the character recognition apparatus, and the financial apparatus are not limited to the above-described technical problems, and other technical problems may exist.

일 측면에 따른 문자 인식 방법은 상기 매체로부터 개별적 문자의 문자 이미지를 획득하는 단계; 및 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 계층 구조에 따라, 상기 문자 이미지를 단계적으로 판독하여 문자를 결정하는 단계;를 포함한다.A character recognition method according to one aspect includes: obtaining a character image of an individual character from the medium; And determining a character by stepwise reading the character image according to a hierarchical structure hierarchically classifying a set of predetermined characters into a plurality of groups composed of upper groups and lower groups.

다른 측면에 따른 문자 인식 장치는 매체로부터 개별적 문자의 문자 이미지를 획득하는 이미지 획득부; 및 상기 개별적 문자의 문자 이미지로부터 상기 개별적 문자를 결정하는 문자 결정부; 를 포함하되, 상기 문자 결정부는 서로 다른 매체에 대해 소정 회수 이상 상기 개별적 문자의 결정을 수행하는 경우, 상기 서로 다른 매체의 동일 자리수의 소정 영문 문자를 소정의 숫자 문자들의 집합 내에서 결정한다.According to another aspect of the present invention, there is provided a character recognition apparatus comprising: an image obtaining unit obtaining a character image of an individual character from a medium; And a character determination unit for determining the individual character from a character image of the individual character; Wherein the character determination unit determines a predetermined number of alphabetic characters of the same number of the different media in a predetermined number of characters when performing determination of the individual characters over a predetermined number of times for different media.

또 다른 측면에 따른 문자 인식 장치는 제1국 지폐로부터 개별적 문자의 문자 이미지를 획득하는 이미지 획득부; 및 개별적 문자의 문자 이미지로부터 개별적 문자를 결정하는 문자 결정부;를 포함하되, 상기 제1국 지폐의 제1국 일련번호의 숫자 문자 자리수에 제2국 일련번호의 영문 문자가 대체된 경우, 제2국 일련번호의 영문 문자는 0 내지 9를 포함하는 숫자의 집합에서 일부의 숫자 또는 숫자들을 포함하는 집합 내의 숫자로 결정된다.According to another aspect of the present invention, there is provided a character recognition apparatus comprising: an image obtaining unit obtaining a character image of an individual character from a first bank bill; And a character determination unit for determining an individual character from the character image of the individual character, wherein when the alphabetical character of the second station serial number is substituted for the numeric character digit of the first station serial number of the first national bills, The alphabetical character of the binary serial number is determined as a number in the set of numbers including 0 to 9 or a number in the set containing the numbers.

또 다른 측면에 따른 금융기기는 문자들을 포함하는 매체를 인입하거나 인출하는 매체 입출부; 상기 매체로부터 개별적 문자의 문자 이미지를 획득하고 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 계층 구조에 따라 상기 문자 이미지를 판독하여 문자를 결정하는 문자 인식 장치; 및 상기 매체 입출부와 상기 문자 인식 장치의 동작을 제어하는 제어부;를 포함한다.According to another aspect of the present invention, there is provided a financial device comprising: a media input / output unit for inputting / withdrawing a medium including characters; Obtaining a character image of an individual character from the medium and determining the character by reading the character image according to a hierarchical structure hierarchically classifying a set of predetermined characters into a plurality of groups composed of upper groups and lower groups A character recognition device; And a controller for controlling operations of the media input / output unit and the character recognition apparatus.

본 발명의 또 다른 측면에 따른 문자 인식 방법은 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.A character recognition method according to another aspect of the present invention provides a computer-readable recording medium having recorded thereon a program for execution on a computer.

상기된 바에 따르면, 매체에 포함된 문자들을 정확하고 신속하게 인식할 수 있다. According to the above, characters included in the medium can be recognized accurately and quickly.

도 1은 본 발명의 일 실시예에 따른 금융기기를 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 문자 인식 장치를 도시한 블록도이다.
도 3은 본 발명의 일 실시예에 따라 문자 인식 장치가 계층 구조에 따라 문자를 판독하여 문자를 결정하는 방법을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 문자 이미지를 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 문자 인식 장치에서 계층 구조를 이용하여 매체의 문자를 결정하는 일례를 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따라 매체의 문자를 결정하는 문자 인식 방법을 나타낸 흐름도이다.
도 7은 본 발명의 다른 실시예에 따라 매체의 문자를 결정하는 문자 인식 방법을 나타낸 흐름도이다.
1 is a block diagram illustrating a financial device according to an embodiment of the present invention.
2 is a block diagram illustrating a character recognition apparatus according to an embodiment of the present invention.
3 is a diagram for explaining a method for a character recognition apparatus to determine a character by reading a character according to a hierarchical structure according to an embodiment of the present invention.
4 is a diagram for explaining a character image according to an embodiment of the present invention.
5 is a diagram for explaining an example of determining a character of a medium using a hierarchical structure in a character recognition apparatus according to an embodiment of the present invention.
6 is a flowchart illustrating a character recognition method for determining a character of a medium according to an embodiment of the present invention.
7 is a flowchart illustrating a character recognition method for determining a character of a medium according to another embodiment of the present invention.

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 실시예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한다.Hereinafter, some embodiments of the present invention will be described in detail with reference to exemplary drawings. It should be noted that, in adding reference numerals to the constituent elements of the drawings, the same constituent elements are denoted by the same reference numerals whenever possible, even if they are shown in different drawings. In the following description of the embodiments of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the difference that the embodiments of the present invention are not conclusive.

또한, 본 발명의 실시예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.In describing the components of the embodiment of the present invention, terms such as first, second, A, B, (a), and (b) may be used. These terms are intended to distinguish the constituent elements from other constituent elements, and the terms do not limit the nature, order or order of the constituent elements. When a component is described as being "connected", "coupled", or "connected" to another component, the component may be directly connected or connected to the other component, Quot; may be "connected," "coupled," or "connected. &Quot;

본 발명의 일 실시예에 따른 금융기기는 일례로 지폐, 증권, 지로, 동전, 상품권 등과 같은 다양한 매체를 입수하여 입금처리, 지로수납, 상품권 교환 등과 같은 처리 및/또는 출금처리, 지로 방출, 상품권 방출 등과 같은 처리와 같은 매체 처리를 수행하는 금융업무를 수행하는 장치이다. 이러한 금융기기의 예로는 현금 방출기(CD:Cash Dispenser), 현금 입출금기(Cash Recycling Device) 등과 같은 금융자동화기기(ATM: Automated Teller Machine) 등이 될 수 있다. 하지만, 금융기기는 전술한 예에 한정되지 않고, FIS(Financial Information System)와 같이 금융업무를 자동화하는 장치가 될 수도 있다.The financial device according to an embodiment of the present invention may be a financial device that obtains various media such as banknotes, securities, geographical coins, coins, gift certificates and the like and processes and / or withdraws money such as deposits, And the like, and performs a financial task to perform the media processing such as the processing such as the release. Examples of such financial instruments include an automated teller machine (ATM) such as a cash dispenser (CD), a cash recycling machine, and the like. However, the financial instrument is not limited to the above-described example, and may be a device for automating financial business such as FIS (Financial Information System).

이하에서는 금융기기가 금융자동화기기인 것으로 가정하여 본 발명의 실시예를 설명한다. 다만, 이러한 가정은 설명의 편의를 위한 것일 뿐, 본 발명의 기술사상이 금융자동화기기에 한정되어 적용되는 것은 아니다.Hereinafter, an embodiment of the present invention will be described on the assumption that the financial instrument is a financial automatic instrument. However, this assumption is for convenience of explanation, and the technical idea of the present invention is not limited to the financial automation equipment.

도 1은 본 발명의 일 실시예에 따른 금융기기를 도시한 블록도이다. 도 1을 참조하면, 금융기기(100)는 매체 입출부(110), 제어부(120) 및 문자 인식 장치(200)로 구성된다. 금융기기(100)는 보관부(130), 사용자 인터페이스부(140) 또는 메모리(150)를 더 포함할 수 있다. 1 is a block diagram illustrating a financial device according to an embodiment of the present invention. 1, the financial instrument 100 includes a media input / output unit 110, a control unit 120, and a character recognition apparatus 200. [ The financial instrument 100 may further include a storage unit 130, a user interface unit 140, or a memory 150.

매체 입출부(110)는 매체를 인입하거나 인출한다. 예를 들면, 매체는 지폐, 수표, 지로 또는 상품권이 될 수 있으나, 이에 한정되지 않는다. 매체 입출부(110)는 매체가 인입 또는 인출되었는지 여부를 판단하는 센서를 더 포함할 수 있다. The medium input / output unit 110 draws in or draws out the medium. For example, the medium may be, but is not limited to, a bill, a check, a paper clip, or a gift certificate. The media input / output unit 110 may further include a sensor for determining whether or not the medium has been inserted or withdrawn.

문자 인식 장치(200)는 매체를 인식하여 문자를 결정한다. 예를 들면, 문자 인식 장치(200)는 광학식 문자 판독 방식을 이용하여 문자를 결정할 수 있다. 문자 인식 장치(200)는 광원에서 방출된 광을 매체에 비추고, 매체에 반사되거나 투과된 광을 수신하는 방식으로 매체의 이미지를 획득할 수 있다. 문자 인식 장치(200)는 획득된 매체의 이미지를 이용하여 매체에 포함된 문자를 결정한다. 이와 관련된 구체적인 설명은 도 2를 참조한다.The character recognition apparatus 200 recognizes the medium and determines a character. For example, the character recognition apparatus 200 can determine a character using an optical character reading system. The character recognition apparatus 200 can acquire an image of the medium in such a manner that the light emitted from the light source is reflected on the medium and the reflected or transmitted light is received on the medium. The character recognition apparatus 200 determines the character included in the medium by using the image of the obtained medium. See FIG. 2 for a detailed description related to this.

제어부(120)는 금융기기(100)의 전반적인 동작을 제어한다. 즉, 제어부(120)는 매체 입출부(110)로 하여금 매체를 인입하거나 인출하도록 제어하거나, 문자 인식 장치(200)가 매체를 인식하여 매체에 인쇄된 문자들을 결정하도록 제어하며, 보관부(130)로 하여금 인입되어 인식된 매체를 보관하거나 보관하는 매체를 방출하여 매체 입출부(110)를 통해 인출되도록 제어하며, 사용자 인터페이스부(140)로 하여금 사용자로부터 명령 또는 정보 등의 데이터를 입력받거나 사용자에게 정보를 디스플레이하도록 제어한다. The control unit 120 controls the overall operation of the financial instrument 100. [ That is, the control unit 120 controls the media input / output unit 110 to draw in or out the medium, or controls the character recognition device 200 to recognize the printed characters on the medium, And controls the user interface unit 140 to receive data such as a command or information from the user or to receive data from the user via the media input / To display the information.

예를 들어, 제어부(120)는 매체 입출부(110)로 투입된 매체가 매체 입출부(110)로부터 문자 인식 장치(200)로 이송되고 있음을 감지하면, 문자 인식 장치(200)로 하여금 매체에 인쇄된 문자들을 결정하도록 제어할 수 있다. For example, when the control unit 120 detects that the media input to the media input / output unit 110 is being transferred from the media input / output unit 110 to the character recognition device 200, It is possible to control to determine printed characters.

본 실시예에 따른 제어부(120)는 적어도 하나 이상의 프로세서(processor)에 해당하거나, 적어도 하나 이상의 프로세서를 포함할 수 있다. 이에 따라, 제어부(120)는 마이크로 프로세서나 범용 컴퓨터 시스템과 같은 다른 하드웨어 장치에 포함된 형태로 구동될 수 있다.The controller 120 according to the present embodiment may correspond to at least one processor or may include at least one processor. Accordingly, the control unit 120 may be operated in a form included in another hardware device such as a microprocessor or a general-purpose computer system.

보관부(130)는 매체를 보관한다. 예를 들면, 보관부(130)는 매체 입출부(110)로부터 인입된 매체를 수신하여 보관하거나, 보관된 매체를 인출을 위하여 매체 입출부(110)로 전송할 수 있다. The storage unit 130 stores the medium. For example, the storage unit 130 may receive and store the media input from the media input / output unit 110, or may transfer the stored media to the media input / output unit 110 for fetching.

사용자 인터페이스부(140)는 사용자로부터 입력 정보를 획득하고, 사용자에게 출력 정보를 표시한다. 예를 들면, 사용자 인터페이스부(140)는 사용자에게 문자 인식 장치(200)에서 인식된 문자를 표시하거나, 문자 인식 장치(200)에서 문자인식에 실패한 경우, 문자 인식 오류가 발생했음을 표시할 수 있다. 또한, 사용자 인터페이스부(140)는 필요한 경우 문자인식에 실패한 문자를 지정하기 위한 문자 정보를 사용자로부터 입력받을 수도 있다.The user interface unit 140 acquires input information from a user and displays output information to a user. For example, the user interface unit 140 may display a character recognized by the character recognition apparatus 200 or may indicate that a character recognition error occurs when the character recognition apparatus 200 fails to recognize the character . If necessary, the user interface unit 140 may receive character information for designating characters that fail to recognize characters from the user.

사용자 인터페이스부(140)는 디스플레이 패널, 터치 화면, 모니터, 키보드, 스피커 등의 입출력 장치 및 이들을 구동하기 위한 소프트웨어 모듈을 모두 포함할 수 있다. The user interface unit 140 may include input / output devices such as a display panel, a touch screen, a monitor, a keyboard, and a speaker, and a software module for driving them.

메모리(150)는 문자 인식에 필요한 정보들을 저장한다. 예를 들면, 메모리(150)는 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 계층 구조, 계층 구조에 따라 문자 이미지를 단계적으로 판독하는 조건들, 및 문자 판독에 필요한 템플릿 등을 저장할 수 있다. 다만, 이러한 템플릿 등은 메모리에 단독적으로 저장되지 않고 문자 판독을 위한 프로그램에 포함되어 프로그램의 형태로 메모리(150)에 저장될 수 있다. 또한, 메모리(150)는 문자 인식 장치(200)에 의해 인식된 문자를 저장할 수 있다. The memory 150 stores information necessary for character recognition. For example, the memory 150 may include a hierarchical structure in which a predetermined set of characters is hierarchically classified into a plurality of groups composed of upper groups and lower groups, conditions for reading character images step by step according to a hierarchical structure , And a template necessary for character reading. However, such a template and the like may be stored in the memory 150 in the form of a program included in a program for reading characters, rather than being stored alone in the memory. In addition, the memory 150 may store characters recognized by the character recognition apparatus 200. [

본 발명의 일 실시예에 따른 메모리(150)는 통상적인 저장매체로서 본 실시예와 관련된 기술 분야에서 통상의 지식을 가진 자라면, 메모리(150)는 하드 디스크 드라이브(Hard Disk Drive, HDD), ROM(Read Only Memory), RAM(Random Access Memory), 플래쉬 메모리(Flash Memory), 메모리 카드(Memory Card) 및 솔리드 스테이트 드라이브(Solid State Drive, SDD)등으로 구현될 수 있음을 알 수 있다. The memory 150 may be a hard disk drive (HDD), a hard disk drive (HDD), a hard disk drive (HDD) The present invention can be implemented by a ROM, a RAM, a flash memory, a memory card, and a solid state drive (SDD).

도 2는 본 발명의 일 실시예에 따른 문자 인식 장치를 도시한 블록도이다. 도 2를 참조하면, 문자 인식 장치(200)는 매체에 포함된 문자를 인식하는 장치로, 이미지 획득부(210) 및 문자 결정부(220)를 포함할 수 있다. 도 1에서 문자 인식 장치(200)와 관련하여 기재된 내용은 도 2에도 적용이 가능하므로, 이와 관련하여 중복된 설명은 생략한다. 2 is a block diagram illustrating a character recognition apparatus according to an embodiment of the present invention. Referring to FIG. 2, the character recognition apparatus 200 is a device for recognizing characters included in a medium, and may include an image acquisition unit 210 and a character determination unit 220. Since the contents described in relation to the character recognition apparatus 200 in FIG. 1 are also applicable to FIG. 2, duplicated description thereof will be omitted.

본 실시예에 따른 문자 인식 장치(200)는 적어도 하나 이상의 프로세서(processor)에 해당하거나, 적어도 하나 이상의 프로세서를 포함할 수 있다. 이에 따라, 문자 인식 장치(200)는 마이크로 프로세서나 범용 컴퓨터 시스템과 같은 다른 하드웨어 장치에 포함된 형태로 구동될 수 있다.The character recognition apparatus 200 according to the present embodiment may correspond to at least one processor or may include at least one processor. Accordingly, the character recognition apparatus 200 can be operated in a form included in another hardware apparatus such as a microprocessor or a general-purpose computer system.

그리고, 이미지 획득부(210)와 문자 결정부(220)는 문자 인식 장치(200)에 포함된 하나의 프로세서에 의해서 구동되거나, 각각 별개의 프로세서에 의해서 구동될 수 있다. The image acquisition unit 210 and the character determination unit 220 may be driven by one processor included in the character recognition apparatus 200 or may be driven by a separate processor.

이미지 획득부(210)는 매체로부터 개별적 문자의 문자 이미지를 획득한다. 개별적 문자의 문자 이미지의 일례는 도 4를 참조한다. 이미지 획득부(210)는 광을 이용하여 매체의 이미지를 획득할 수 있다. 이미지 획득부(210)는 매체의 이미지를 획득한 후, 다양한 이미지 처리를 수행하여 개별적 문자의 문자 이미지를 획득할 수 있다. 이에 따라, 이미지 획득부(210)는 광원을 포함한 발광부, 수광부, 이미지 처리 장치를 포함할 수 있다. 이와 관련된 구체적인 설명은 도 4를 참조한다.The image acquiring unit 210 acquires character images of individual characters from the medium. See FIG. 4 for an example of a character image of an individual character. The image acquiring unit 210 may acquire an image of the medium using light. After acquiring the image of the medium, the image acquiring unit 210 may perform various image processing to acquire a character image of an individual character. Accordingly, the image obtaining unit 210 may include a light emitting unit including a light source, a light receiving unit, and an image processing apparatus. See FIG. 4 for a detailed description related to this.

문자 결정부(220)는 이미지 획득부(210)에 의해 획득된 개별적 문자의 문자 이미지로부터 개별적 문자를 결정한다. 문자 결정부(220)는 계층 구조에 따라 판독하여 문자를 결정한다. 계층 구조는 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 것이다. 여기서, 상위 그룹에 포함된 문자들은 해당 상위 그룹의 하위 그룹들에 포함된 문자들을 포함한다. The character determination unit 220 determines individual characters from the character images of the individual characters acquired by the image acquisition unit 210. The character determination unit 220 determines the character by reading it according to the hierarchical structure. The hierarchical structure is a hierarchical classification of a set of predetermined characters into a plurality of groups composed of upper groups and lower groups. Here, the characters included in the upper group include characters included in the lower groups of the upper group.

일 실시예에 따라, 계층 구조는 소정의 문자들의 집합에 포함된 문자들 사이의 형태의 유사성에 기초하여 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹으로 분류할 수 있다. According to one embodiment, the hierarchical structure may classify a predetermined set of characters into a plurality of groups composed of upper groups and lower groups based on the similarity of shapes among characters included in the set of predetermined characters .

예를 들면, 소정의 문자들의 집합은 숫자 0 내지 9의 집합 또는 알파벳 A 내지 Z의 집합 등이 될 수 있다. 문자는 한글, 알파벳, 한자, 로마자, 숫자 등의 시각적인 기호 체계를 모두 포함할 수 있으므로, 소정의 문자들의 집합은 위의 예에 한정되지 않는다. For example, the set of predetermined characters may be a set of numbers 0 to 9, a set of alphabets A to Z, and the like. The character may include all the visual symbol systems such as Hangul, alphabet, kanji, roman, and numeral, so the set of predetermined characters is not limited to the above example.

위 예에 따르면, 숫자 0 내지 9의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 계층 구조에 따라 문자를 단계적으로 판독할 수 있다. 이 계층 구조는 숫자 0 내지 9 사이의 각 숫자의 형태의 유사성에 기초하여 숫자 0 내지 9의 집합을 복수의 그룹으로 분류한 것이 될 수 있다. According to the above example, characters can be read step by step according to a hierarchical structure hierarchically classified into a plurality of groups composed of upper groups and lower groups. This hierarchical structure can be obtained by classifying the sets of numbers 0 to 9 into a plurality of groups based on the similarity of the shapes of the respective numbers between the numbers 0 to 9. [

문자 결정부(220)는 계층 구조에 따라 문자 이미지를 단계적으로 판독함에 있어서, 계층 구조의 각 단계별로 문자 이미지의 소정의 위치의 문자 픽셀들의 수, 배경 픽셀들의 수, 또는 문자 픽셀들의 수와 배경 픽셀들의 수의 비율 중 어느 하나를 기준값과 비교하고, 비교 결과에 기초하여 문자 이미지를 판독할 수 있다.In stepwise reading the character image according to the hierarchical structure, the character determination unit 220 determines the number of character pixels, the number of background pixels, or the number of character pixels in a predetermined position of the character image, The ratio of the number of pixels can be compared with the reference value, and the character image can be read based on the comparison result.

일 실시예에 따라, 문자 결정부(220)는 문자를 결정함에 있어서, 적어도 하나 이상의 템플릿을 이용하여 문자를 결정할 수 있다. 예를 들면, 문자 결정부(220)는 제어부(120)의 제어 신호에 따라 템플릿을 문자 이미지 상의 소정의 위치에 위치시키고, 소정의 위치의 템플릿 내에 포함되는 픽셀들의 픽셀값과 문자 픽셀들 사이의 종, 횡 방향의 인접성을 확인하여 문자를 결정할 수 있다. 문자 픽셀들 사이의 종, 횡 방향의 인접성은 서로 다른 위치의 두 묶음의 문자 픽셀들의 사이의 배경 픽셀들의 개수에 의해서 확인될 수 있다. According to one embodiment, the character determination unit 220 may determine a character using at least one template in determining a character. For example, the character determination unit 220 may position the template at a predetermined position on the character image in accordance with a control signal from the control unit 120, Characters can be determined by confirming the adjacency in the longitudinal and lateral directions. The species and transversal adjacency between character pixels can be ascertained by the number of background pixels between two sets of character pixels at different positions.

이때, 문자 결정부(220)는 소정의 문자들의 집합에 포함된 문자들을 판독하기 위해서, 다양한 크기의 복수의 템플릿을 이용할 수 있다. 문자 결정부(220)는 문자들의 크기, 종류에 따라 메모리(150)에 저장된 다양한 템플릿들을 이용할 수 있다. At this time, the character determination unit 220 can use a plurality of templates of various sizes to read characters included in a predetermined set of characters. The character determination unit 220 may use various templates stored in the memory 150 according to the size and type of characters.

또한, 문자 결정부(220)는 문자를 판독할 때, 계층 구조에 따라 복수의 템플릿들을 계층적으로 적용할 수도 있다. In addition, the character determination unit 220 may hierarchically apply a plurality of templates according to a hierarchical structure when reading a character.

이상에서의 실시예들에 따르면, 문자 인식 장치(200)는 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 계층 구조에 따라, 문자 이미지를 단계적으로 판독함으로써, 매체에 포함된 문자들을 정확하고 신속하게 인식할 수 있다. According to the embodiments described above, the character recognition apparatus 200 can classify character images in a hierarchical manner according to a hierarchical structure hierarchically classifying a set of predetermined characters into a plurality of groups composed of upper groups and lower groups The characters included in the medium can be accurately and quickly recognized.

도 3은 본 발명의 일 실시예에 따라 문자 인식 장치가 계층 구조에 따라 문자를 판독하여 문자를 결정하는 방법을 설명하기 위한 도면이다. 도 3에 기재된 문자를 판독하는 방법은 도 1 내지 도 2에 도시된 문자 인식 장치(200)에서 시계열적으로 처리될 수 있다. 따라서, 하기에 생략된 내용이라 하더라도 도 1 내지 도 2에 도시된 문자 인식 장치(200)에 관하여 이상에서 기술된 내용은 도 3에도 적용됨을 알 수 있다. 3 is a diagram for explaining a method for a character recognition apparatus to determine a character by reading a character according to a hierarchical structure according to an embodiment of the present invention. The method of reading characters shown in Fig. 3 can be processed in a time-series manner in the character recognition apparatus 200 shown in Figs. Therefore, even if the contents are omitted in the following description, it can be understood that the description described above with respect to the character recognition apparatus 200 shown in Figs. 1 and 2 also applies to Fig.

이미지 획득부(210)에서 개별적 문자의 문자 이미지를 획득된 후, 이미지 획득부(210)로부터 문자 이미지가 문자 결정부(220)에 입력되면, 문자 결정부(220)는 계층 구조에 따라 문자를 단계적으로 판독한다. 도 3에 개시된 계층 구조는 일 실시예에 불과하며, 이 외에도 다양한 계층 구조가 적용될 수 있음을 해당 기술 분야에서 통상의 지식을 가진 자라면 알 수 있다.After the character image of the individual character is obtained by the image obtaining unit 210 and the character image is input from the image obtaining unit 210 to the character determining unit 220, the character determining unit 220 determines the character according to the hierarchical structure Read it step by step. It is to be understood by those skilled in the art that the hierarchical structure disclosed in FIG. 3 is merely an embodiment, and various hierarchical structures other than the hierarchical structure can be applied.

계층 구조는 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹으로 계층적으로 분류한 것으로, 상위 그룹에 포함된 문자들은 해당 상위 그룹의 하위 그룹들에 포함된 문자들을 포함한다. 계층 구조는 외부 장치에서 미리 생성된 후, 메모리(150)에 저장되어 사용될 수 있다. 이하에서는 설명의 편의를 위하여, 외부 장치인 하나의 프로세서에서 계층 구조를 생성하는 것으로 가정하고 설명한다. 프로세서는 다음과 같은 방법으로 계층 구조를 생성할 수 있다. The hierarchical structure hierarchically classifies a set of predetermined characters into a plurality of groups composed of upper groups and lower groups, and the characters included in the upper group include characters included in the lower groups of the upper group . The hierarchical structure may be generated in advance in the external device, and then stored in the memory 150 and used. Hereinafter, for the sake of convenience of explanation, it is assumed that a hierarchical structure is generated by one processor as an external device. The processor can create a hierarchy in the following manner.

먼저, 프로세서에서 소정의 문자들의 집합을 최상위 그룹들로 그룹화하는 기준이 되는 조건 1이 결정된다. 예를 들면, 소정의 문자들의 집합에 포함된 문자들 사이의 형태의 유사성에 기초하여 조건 1이 결정될 수 있다.First, the processor 1 determines a condition 1 as a reference for grouping a predetermined set of characters into highest-level groups. For example, condition 1 may be determined based on the similarity of the forms between characters included in the set of predetermined characters.

프로세서는 소정의 문자들의 집합을 조건 1에 따라 분류한다. 이에 따라, 조건 1을 만족하는 문자들은 제 A 그룹으로, 조건 1을 만족하지 않는 문자들은 제 B 그룹으로 그룹화될 수 있다. The processor classifies a set of predetermined characters according to condition 1. [ Accordingly, the characters satisfying the condition 1 can be grouped into the group A, and the characters that do not satisfy the condition 1 can be grouped into the group B.

다음으로, 최상위 그룹들 각각에 포함된 문자들은 소정의 기준에 따라, 하위 그룹들로 그룹화될 수 있다. 예를 들면, 각 그룹에 포함된 문자들의 형태에 기초하여, 각 그룹에 포함된 문자들을 하위 그룹들로 그룹화하는 기준이 되는 조건을 각각 결정하고, 결정된 조건에 따라 각 그룹에 포함된 문자들을 분류한다. Next, the characters included in each of the top groups may be grouped into subgroups according to a predetermined criterion. For example, based on the type of characters included in each group, each of the conditions for grouping the characters included in each group into lower groups is determined, and the characters included in each group are classified do.

도 3에 따르면, 제 A 그룹의 문자들은 조건 2에 따라 분류하여, 제 A 그룹에 포함된 문자들 중 조건 2를 만족하는 문자들은 제 a 그룹으로, 조건 2를 만족하지 않는 문자들은 제 b 그룹으로 그룹화한다. 제 B 그룹의 문자들은 조건 3에 따라 분류하여, 제 B 그룹에 포함된 문자들 중 조건 3을 만족하는 문자들은 제 c 그룹으로, 조건 3을 만족하지 않는 문자들은 제 d 그룹으로 그룹화한다. According to FIG. 3, the characters of the group A are classified according to the condition 2. The characters that satisfy the condition 2 among the characters included in the group A are the group a, and the characters that do not satisfy the condition 2 are the group b . The characters in the B group are classified according to the condition 3, and the characters included in the B group are grouped into the c group and the characters that do not satisfy the condition 3 are grouped into the d group.

더 나아가, 상기 하위 그룹들을 소정의 기준에 따라 더 세분화될 수 있다. 도 3을 참조하면, 제 c 그룹에 포함된 문자들을 조건 4에 따라 분류하여, 제 c 그룹을 제 1 그룹과 제 2 그룹으로 더 세분화할 수 있다. 이에 따라, 제 c 그룹에 포함된 문자들 중, 조건 4를 만족하는 문자들은 제 1 그룹으로, 조건 4를 만족하지 않는 문자들은 제 2 그룹으로 그룹화될 수 있다. Further, the subgroups may be further subdivided according to predetermined criteria. Referring to FIG. 3, the characters included in the c-th group can be classified according to the condition 4, and the c-th group can be further subdivided into the first group and the second group. Accordingly, among the characters included in the c-th group, the characters satisfying the condition 4 can be grouped into the first group, and the characters that do not satisfy the condition 4 can be grouped into the second group.

일 실시예에 따라, 숫자 0 내지 9의 집합에 대하여 계층 구조를 생성하는 경우, 계층 구조는 숫자 0 내지 9 사이의 숫자들 중 형태가 유사한 숫자들을 상위 그룹들과 하위 그룹들의 복수의 그룹들로 계층적으로 그룹화할 수 있다. In accordance with one embodiment, when creating a hierarchy for a set of numbers 0 through 9, the hierarchy is a hierarchical structure in which the numbers of numerals 0 through 9 are similar in shape to a plurality of groups of higher groups and subgroups They can be hierarchically grouped.

먼저, 숫자 0 내지 9의 집합을 소정의 조건에 따라 숫자 1, 7을 포함하는 제 A 그룹과 숫자 0, 2, 3, 4, 5, 6, 8, 9을 포함하는 제 B 그룹으로 나눌 수 있다. 다음으로, 숫자 1, 7의 제 A 그룹과 숫자 0, 2, 3, 4, 5, 6, 8, 9의 제 B 그룹을 각각 하위 그룹들로 더 세분화하면, 제 A 그룹은 숫자 1을 포함하는 제 a 그룹과 숫자 7을 포함하는 제 b 그룹으로, 제 B 그룹은 숫자 2, 5, 6을 포함하는 제 c 그룹과 숫자 0, 3, 4, 8, 9를 포함하는 제 d 그룹으로 더 나눌 수 있다. 숫자 2, 5, 6의 제 c 그룹은 숫자 2를 포함하는 제 1 그룹과, 숫자 5, 6을 포함하는 제 2 그룹의 더 낮은 그룹들로 그룹화될 수 있다.First, a set of numbers 0 to 9 can be divided into a group A including numbers 1 and 7 and a group B including numbers 0, 2, 3, 4, 5, 6, 8, have. Next, when the group A of numbers 1 and 7 and the group B of numbers 0, 2, 3, 4, 5, 6, 8, and 9 are further subdivided into subgroups, group A includes the number 1 Group B containing the numbers a, b, c and d, the group B containing the numbers a, b, c, d, Can be divided. The c-th group of numbers 2, 5, and 6 may be grouped into a lower group of the second group including the first group including the number 2 and the numbers 5 and 6.

문자 결정부(220)는 이상에서와 같이 생성된 계층 구조를 이용하여 입력된 문자 이미지를 단계적으로 판독하여 문자를 결정한다. 도 3의 계층 구조에 따르면, 문자 결정부(220)는 입력된 문자 이미지에 제 1 템플릿을 적용하여, 입력된 문자 이미지가 조건 1을 만족하는지 여부를 판단한다. 입력된 문자이미지가 조건 1을 만족하면 제 A 그룹에, 조건 1을 만족하지 않으면 제 B 그룹에 해당하는 것으로 판단한다.The character determination unit 220 determines the character by stepwise reading the input character image using the hierarchical structure as described above. According to the hierarchical structure of FIG. 3, the character determination unit 220 determines whether the input character image satisfies the condition 1 by applying the first template to the input character image. If the inputted character image satisfies the condition 1, it is judged to belong to the group A, and if the character image does not satisfy the condition 1, it corresponds to the group B.

다음으로, 문자 이미지가 제 A 그룹에 해당하면, 문자 결정부(220)는 문자 이미지에 제 2 템플릿을 적용하여, 입력된 문자 이미지가 조건 2를 만족하는지 여부를 판단한다. 문자 이미지가 제 B 그룹에 해당하면, 문자 결정부(220)는 문자 이미지에 제 3 템플릿을 적용하여, 입력된 문자 이미지가 조건 3을 만족하는지 여부를 판단한다. Next, if the character image corresponds to the group A, the character determination unit 220 determines whether the input character image satisfies the condition 2 by applying the second template to the character image. If the character image corresponds to the B group, the character determination unit 220 determines whether the input character image satisfies the condition 3 by applying the third template to the character image.

도 3을 참조하여, 문자 이미지가 제 A 그룹에 해당하고, 조건 2를 만족하는 경우, 문자 이미지는 제 a 그룹에 해당하는 것으로 판단할 수 있다. 또는, 문자 이미지가 제 B 그룹에 해당하고, 조건 3을 만족하는 경우, 문자 결정부(220)는 문자 이미지에 템플릿 4를 적용하여, 문자 이미지가 조건 4를 만족하는지 여부를 판단한다. 이때, 문자 결정부(220)는 문자 이미지가 조건 4를 만족하면 제 1 그룹에 속하는 것으로, 조건 4를 만족하지 않으면, 제 2 그룹에 속하는 것으로 결정한다. Referring to FIG. 3, if the character image corresponds to the group A and the condition 2 is satisfied, it can be determined that the character image corresponds to the group a. Alternatively, when the character image corresponds to the B group and the condition 3 is satisfied, the character determination unit 220 applies the template 4 to the character image to determine whether the character image satisfies the condition 4. At this time, the character determination unit 220 determines that the character image belongs to the first group if the character image satisfies the condition 4, and belongs to the second group if the character image does not satisfy the condition 4.

이와 같이, 문자 결정부(220)는 계층 구조의 각 계층별로 템플릿을 적용하여, 입력된 문자 이미지를 계층 구조에 따라 계층적으로 판독하여 문자를 결정할 수 있다. 문자 결정부(220)는 계층 구조의 각 단계별로 문자 이미지의 소정의 위치의 문자 픽셀들의 수, 배경 픽셀들의 수, 또는 문자 픽셀들의 수와 배경 픽셀들의 수의 비율 중 어느 하나를 기준값과 비교하고, 비교 결과에 기초하여, 문자 이미지를 도 3에서와 같이 단계적으로 판독할 수 있다.In this way, the character determination unit 220 can apply the template to each layer of the hierarchical structure, and can determine the character by hierarchically reading the input character image according to the hierarchical structure. The character determination unit 220 compares the number of character pixels at a predetermined position of the character image, the number of background pixels, or the ratio of the number of character pixels and the number of background pixels to the reference value for each step of the hierarchical structure , And based on the comparison result, the character image can be read step by step as shown in Fig.

예를 들면, 조건 1 내지 조건 4는 소정의 위치에서 소정 범위 내에 문자 픽셀들의 수가 기준값 이상인지가 될 수 있다. 또는, 조건 1 내지 조건 4는 문자 픽셀들의 수와 배경 픽셀들의 수의 비율이 기준값 이상인지가 될 수 있다. For example, the condition 1 to the condition 4 may be whether or not the number of character pixels within a predetermined range at a predetermined position is equal to or greater than a reference value. Alternatively, the conditions 1 to 4 may be whether the ratio of the number of character pixels to the number of background pixels is equal to or greater than a reference value.

문자 결정부(220)는 도 3의 계층 구조를 이용하여 문자 이미지를 판독하고, 판독한 결과에 기초하여 도 3에 도시된 그룹들 중 문자 이미지가 속하는 그룹을 결정할 수 있다. 문자 결정부(220)는 문자 이미지의 문자를 결정된 그룹에 포함된 문자들 중에 하나로 결정할 수 있다. 일 실시예에 따라, 문자 결정부(220)는 해당 그룹 내에서 적어도 하나 이상의 템플릿을 이용하여 해당 문자를 하나의 문자로 결정할 수 있다. The character determination unit 220 can read the character image using the hierarchical structure of FIG. 3, and can determine the group to which the character image belongs among the groups shown in FIG. 3 based on the read result. The character determination unit 220 may determine the character of the character image as one of the characters included in the determined group. According to one embodiment, the character determination unit 220 can determine a character as a single character using at least one template in the group.

이에 따라, 문자 인식 장치(200)는 문자 이미지를 판독하여 문자를 결정하는 데 있어서, 각 개별적인 문자의 문자 이미지에 대해 모든 템플릿을 적용하여 비교함으로써 문자를 결정하지 않는다. 일 실시예에 따르면, 상위 그룹들 및 하위 그룹들로 구성된 계층 구조에 따라 각 계층마다 소정의 위치의 일부 영역의 픽셀들이 기 설정된 조건을 만족하는지 여부에 따라 문자가 속한 그룹을 하위 그룹으로 좁혀가면서 문자를 결정하므로, 각 문자를 결정하는 데 있어서 비교해야 하는 비교 대상을 크게 줄일 수 있어서, 문자 이미지의 문자를 빠르게 인식할 수 있다. Accordingly, the character recognition apparatus 200 does not determine the character by comparing all the templates applied to the character image of each individual character in determining the character by reading the character image. According to one embodiment, the group to which the character belongs is narrowed down to a lower group according to whether or not pixels of a partial region of a predetermined position satisfy predetermined conditions according to a hierarchical structure composed of upper groups and lower groups The character to be compared can be greatly reduced in determining each character, and the character of the character image can be quickly recognized.

도 4는 본 발명의 일 실시예에 따른 문자 이미지를 설명하기 위한 도면이다. 이하에서 기술되는 내용은 도 1 내지 도 2에 도시된 문자 인식 장치(200)에 적용될 수 있다. 4 is a diagram for explaining a character image according to an embodiment of the present invention. The contents described below can be applied to the character recognition apparatus 200 shown in FIGS. 1 and 2. FIG.

도 4를 참조하면, 개별 문자의 문자 이미지가 도시되어 있다. 도 4의 문자 이미지는 문자 부분과 문자를 제외한 나머지 배경 부분으로 구성된다. 즉, 문자 이미지는 문자 부분이 차지하는 문자 픽셀들과 배경 부분이 차지하는 배경 픽셀들로 구성된다. 배경 픽셀들은 문자 이미지를 구성하는 픽셀들 중 픽셀값이 소정의 픽셀값 이상인 픽셀들로 결정할 수 있고, 문자 픽셀들은 픽셀값이 소정의 픽셀값 이하인 픽셀들로 결정할 수 있다. 이때, 픽셀값은 픽셀의 밝기값 또는 그레이값이 될 수 있다. 일예로서, 배경 픽셀을 구분하는 소정의 픽셀값은 200이 될 수 있고, 문자 픽셀을 구분하는 소정의 픽셀값은 30이 될 수 있다.Referring to Figure 4, a character image of an individual character is shown. The character image in Fig. 4 is composed of background portions except for the character portion and the character. That is, the character image is composed of the character pixels occupied by the character portion and the background pixels occupied by the background portion. The background pixels may be determined by pixels having a pixel value equal to or greater than a predetermined pixel value among the pixels constituting the character image, and the character pixels may be determined as pixels having a pixel value equal to or less than a predetermined pixel value. At this time, the pixel value may be a brightness value or a gray value of the pixel. As an example, a predetermined pixel value for separating background pixels may be 200, and a predetermined pixel value for separating character pixels may be 30.

예를 들면, 문자 인식 장치(200)는 소정의 문자들의 집합에 포함된 문자들 각각의 문자 이미지에서 문자 픽셀들과 배경 픽셀들의 위치 및 구성의 유사도에 기초하여, 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 계층적으로 그룹화한 계층 구조를 이용하여 문자를 인식할 수 있다. 문자 인식 장치(200)는 이와 같은 계층 구조를 이용하여 문자 인식 장치(200)에 투입된 매체의 문자 이미지를 단계적으로 판독한다. For example, the character recognition apparatus 200 may classify a predetermined set of characters into a set of characters based on the similarity of the positions and configurations of the character pixels and the background pixels in the character image of each of the characters included in the predetermined character set, And a hierarchical grouping hierarchically grouped into subgroups. The character recognition apparatus 200 reads character images of the medium input to the character recognition apparatus 200 step by step using the hierarchical structure.

일 실시예에 따르면, 문자 인식 장치(200)는 다음과 같은 방법으로 문자 이미지를 획득할 수 있다.According to one embodiment, the character recognition apparatus 200 can acquire a character image in the following manner.

이미지 획득부(210)는 매체에 포함된 문자들 각각의 문자 이미지를 획득한다. 개별적 문자의 문자 이미지를 획득하기 위해서, 이미지 획득부(210)는 먼저 매체의 이미지를 획득한다. 이때, 이미지 획득부(210)는 매체의 전체 이미지가 아닌 특정 부분의 이미지만을 획득할 수 있다. The image obtaining unit 210 obtains a character image of each of the characters included in the medium. In order to obtain a character image of an individual character, the image obtaining section 210 first acquires an image of the medium. At this time, the image obtaining unit 210 may obtain only a specific portion of the image, rather than an entire image of the medium.

이미지 획득부(210)가 매체에서 획득하여야 할 매체의 이미지의 위치는 미리 결정되어 있을 수 있다. 예를 들면, 메모리(150)는 획득하여야 할 매체의 이미지의 위치에 관한 좌표 정보를 저장할 수 있다. 또한, 다양한 매체의 종류별로 매체의 크기가 달라지므로, 메모리(150)는 다양한 매체의 종류별로 좌표 정보를 저장할 수 있다. The position of the image of the medium that the image acquisition unit 210 should acquire from the medium may be predetermined. For example, the memory 150 may store coordinate information regarding the position of the image of the medium to be acquired. In addition, since the size of the medium varies according to the types of various media, the memory 150 may store coordinate information for various types of media.

이에 따라, 이미지 획득부(210)는 메모리(150)에 저장된 좌표 정보를 참조하여 매체의 이미지를 획득한다. Accordingly, the image obtaining unit 210 obtains the image of the medium with reference to the coordinate information stored in the memory 150. [

다음으로, 이미지 획득부(210)는 획득된 매체의 이미지로부터 문자열 이미지를 획득한다. 이미지 획득부(210)는 획득된 매체의 이미지로부터 문자열을 둘러싼 여백을 제거하는 이미지 처리를 수행하여 문자열 이미지를 획득할 수 있다. 문자열 이미지는 적어도 하나 이상의 문자를 포함한다. Next, the image obtaining unit 210 obtains a character string image from the image of the obtained medium. The image obtaining unit 210 may perform image processing to remove a margin surrounding the character string from the image of the obtained medium to obtain a character string image. The string image contains at least one character.

문자열 이미지를 획득한 후, 이미지 획득부(210)는 획득된 문자열 이미지에서 개별 문자들의 문자 이미지를 획득한다. 개별 문자들의 문자 이미지의 크기는 소정의 크기로 정해질 수 있다. 이때, 소정의 크기는 문자 인식 장치(200)가 인식하는 매체의 종류에 따라 달라질 수 있다. 예를 들면, 문자 인식 장치(200)가 한국 만원권 지폐의 일련 번호를 인식하는 경우, 문자 이미지의 크기는 한국 만원권 지폐의 일련 번호의 폰트의 크기로 결정될 수 있다. After obtaining the character string image, the image obtaining unit 210 obtains the character character image of the individual characters in the obtained character string image. The size of the character image of individual characters can be set to a predetermined size. At this time, the predetermined size may be changed according to the type of the medium recognized by the character recognition apparatus 200. For example, when the character recognition apparatus 200 recognizes the serial number of the Korean won bill, the size of the character image may be determined as the font size of the serial number of the Korean won bill.

이미지 획득부(210)는 문자와 문자 사이의 여백을 이용하여, 문자열 이미지를 각 문자 별로 소정의 크기의 문자 이미지로 분할할 수 있다. 그리고, 이미지 획득부(210)는 각 문자 이미지를 복수의 픽셀들로 구성되는 소정의 크기의 이미지로 나타낼 수 있다. 예를 들면, 이미지 획득부(210)는 개별 문자의 문자 이미지가 일정한 크기를 가지도록 확대, 축소하거나, 문자 이미지를 복수의 픽셀들로 분할하는 등의 이미지 처리를 수행할 수 있다. The image obtaining unit 210 may divide a character string image into character images of a predetermined size for each character using a margin between characters. The image obtaining unit 210 may display each character image as a predetermined size image composed of a plurality of pixels. For example, the image obtaining unit 210 may perform image processing such as enlarging or reducing a character image of an individual character to a predetermined size, or dividing a character image into a plurality of pixels.

이에 따라, 이미지 획득부(210)는 문자열 이미지에 포함된 문자들의 개수만큼의 문자 이미지를 획득할 수 있다, Accordingly, the image obtaining unit 210 can obtain a character image as many as the number of characters included in the character image.

도 5는 본 발명의 일 실시예에 따른 문자 인식 장치에서 계층 구조를 이용하여 매체의 문자를 결정하는 일례를 설명하기 위한 도면이다. 이하에서는, 문자 인식 장치(200)에서 도 5에 도시된 지폐의 일련 번호(10)를 인식하는 것을 예로 들어 설명한다. 5 is a diagram for explaining an example of determining a character of a medium using a hierarchical structure in a character recognition apparatus according to an embodiment of the present invention. Hereinafter, the character recognition apparatus 200 recognizes the serial number 10 of the banknote shown in FIG. 5 as an example.

문자 인식 장치(200)에 지폐가 투입되면, 이미지 획득부(210)는 지폐의 일련 번호(10)가 인쇄된 부분의 이미지를 획득한다. 이미지 획득부(210)는 지폐의 일련 번호(10)가 인쇄된 부분의 이미지를 획득한 후, 획득된 이미지에서 상하, 좌우 여백 부분을 잘라내어 일련 번호(10)의 문자열을 포함하는 문자열 이미지를 획득한다. When banknotes are inserted into the character recognition apparatus 200, the image obtaining unit 210 obtains the image of the portion where the serial number 10 of the banknote is printed. After obtaining the image of the printed portion of the serial number 10 of the banknote, the image obtaining unit 210 cuts up and down, left and right margin portions in the obtained image, and obtains a character string image including the character string of the serial number 10 do.

이미지 획득부(210)는 획득된 문자열 이미지에서 일련 번호(10)의 각 문자 별로 분할하여, 개별 문자의 문자 이미지를 획득한다. 도 5에 도시된 지폐의 경우, 총 10개의 문자 이미지가 획득된다. 이미지 획득부(210)에서 획득된 총 10개의 문자이미지는 순차적으로 문자 결정부(220)로 전달되어 판독된다. The image acquiring unit 210 acquires character images of individual characters by dividing each character of the serial number 10 in the acquired character image. In the case of the bill shown in Fig. 5, a total of ten character images are obtained. A total of 10 character images acquired by the image acquisition unit 210 are sequentially transmitted to the character determination unit 220 and read out.

지폐의 일련 번호(10)의 경우, 지폐의 종류 및 권종에 따라, 일련 번호(10)의 각 자리의 문자의 종류가 정해져 있다. 도 5에 도시된 지폐의 경우, 일련 번호(10)의 첫째 및 둘째 자리에는 알파벳이, 나머지 자리에는 숫자들이 위치한다. In the case of the serial number 10 of the banknote, the type of the character of each digit of the serial number 10 is determined according to the kind of the banknote and the denomination. In the case of the banknote shown in FIG. 5, the alphabet is placed in the first and second digits of the serial number 10, and the digits are placed in the remaining digits.

이에 따라, 문자 결정부(220)는 일련 번호(10)의 첫째 및 둘째 자리에는 알파벳 A 내지 Z의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 계층 구조를 이용하여 입력된 문자 이미지를 단계적으로 판독하고, 나머지 자리에는 숫자 0 내지 9의 집합을 복수의 그룹들로 계층적으로 분류한 계층 구조를 이용하여 입력된 문자 이미지를 단계적으로 판독한다. Accordingly, the character determination unit 220 determines that the first and second digits of the serial number 10 have a hierarchical structure in which a set of alphabets A through Z is hierarchically classified into a plurality of groups composed of upper groups and lower groups The input character image is read step by step and the input character image is read step by step using a hierarchical structure in which the groups of numbers 0 to 9 are hierarchically classified into a plurality of groups.

문자 인식 장치(200)에서 숫자의 문자 이미지를 인식할 때는, 숫자 집합의 계층 구조를 이용하고, 알파벳의 문자 이미지를 인식할 때는 알파벳 집합의 계층 구조를 이용하여 문자 이미지를 단계적으로 판독한다.When recognizing a character image of a number in the character recognition apparatus 200, a hierarchical structure of a set of numbers is used. When recognizing a character image of an alphabet, a character image is read stepwise using a hierarchical structure of an alphabet set.

만약, 문자 인식 장치(200)가 숫자 집합의 계층 구조를 이용하여, 알파벳의 문자 이미지를 판독하는 경우, 특정 알파벳의 문자 이미지를 판독하면 특정 숫자로 인식될 수 있다.If the character recognition apparatus 200 reads a character image of an alphabet using a hierarchical structure of a number set, it can be recognized as a specific number by reading a character image of a specific alphabet.

예를 들면, 문자 인식 장치(200)에서 숫자 집합의 계층 구조를 이용하여, 알파벳 E의 문자 이미지를 판독하면 숫자 2로 인식될 수 있다. 다른 예로, 숫자 집합의 계층 구조를 이용하여 알파벳 E, C, 또는 K의 문자 이미지들을 판독하면 숫자 5, 6, 2 중 어느 하나로 인식될 수 있다. 또 다른 예로, 숫자 집합의 계층 구조를 이용하여, 알파벳 A, B, D, H 또는 J의 문자 이미지를 판독하면 숫자 3, 4, 8 및 9를 포함하는 그룹으로 분류되어, 숫자 3, 4, 8 및 9 중 어느 하나의 숫자로 인식될 수 있다.For example, when the character recognition apparatus 200 reads the character image of the alphabet E using the hierarchical structure of the numeric set, it can be recognized as the number 2. As another example, if the character images of the alphabet E, C, or K are read using the hierarchical structure of the numeric set, it can be recognized as any of the numbers 5, 6, As another example, if a character image of the alphabet A, B, D, H, or J is read using the hierarchical structure of the numeric set, it is classified into groups including numbers 3, 4, 8, and 9, 8 and < RTI ID = 0.0 > 9, < / RTI >

반대로, 알파벳 집합의 계층 구조를 이용하여, 숫자 8의 문자 이미지를 단계적으로 판독하면 알파벳 B로 인식될 수 있다. Conversely, if the character image of the numeral 8 is read step by step using the hierarchical structure of the alphabet set, it can be recognized as the alphabet B.

일 실시예에 따라, 중국 지폐의 일련번호를 인식하는 문자 인식 장치(200)의 경우를 예로 들어 설명하면, 먼저, 문자 인식 장치(200)는 중국 지폐로부터 일련번호의 문자열 이미지를 획득한 후, 일련번호의 각 자리 별로 위치한 문자의 문자 이미지를 획득한다. According to one embodiment, the character recognition apparatus 200 that recognizes the serial number of the Chinese banknote will be described. First, the character recognition apparatus 200 acquires the character string image of the serial number from the Chinese banknote, Obtain a character image of the character located by each digit of the serial number.

문자 인식 장치(200)는 중국 지폐의 일련번호의 각 자리마다 할당된 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 계층 구조에 따라 문자 이미지를 단계적으로 판독하여 문자를 결정한다. The character recognition apparatus 200 recognizes a character image according to a hierarchical structure hierarchically classifying a set of predetermined characters assigned to each digit of the serial number of Chinese banknotes into a plurality of groups composed of upper groups and lower groups The characters are read out step by step.

중국 지폐의 경우 일련번호의 마지막 자리에는 0 내지 9의 숫자가 위치한다. 반면, 한국 지폐의 경우 일련번호의 마지막 자리에는 A 내지 Z의 알파벳이 위치한다. In the case of Chinese banknotes, the last digit of the serial number is a number from 0 to 9. On the other hand, in the case of Korean notes, the letters A to Z are located at the end of the serial number.

이에 따라, 중국 지폐의 일련번호 자리에 한국 지폐의 일련번호를 대체하여 편집된 중국 지폐를 중국 지폐를 인식하는 문자 인식 장치(200)에 인식시킨다면, 문자 인식 장치(200)는 편집된 중국 지폐의 일련번호의 마지막 자리의 문자를 알파벳이 아닌 숫자로 인식할 것이다.Accordingly, if the Chinese banknote edited by replacing the serial number of the Korean banknote with the serial number of the Chinese banknote is recognized by the character recognition apparatus 200 that recognizes the Chinese banknote, the character recognition apparatus 200 recognizes the Chinese banknote We will recognize the last digit of the serial number as a non-alphanumeric character.

이때, 중국 지폐의 일련번호를 인식하는 계층 구조를 이용하여 특정 알파벳의 문자 이미지를 판독하면 특정 숫자로 인식될 수 있다. 예를 들면, 중국 지폐의 일련번호의 마지막 자리의 문자가 알파벳 E인 경우에는, 숫자 2로 결정될 수 있을 것이다.At this time, if a character image of a specific alphabet is read using a hierarchical structure for recognizing the serial number of the Chinese banknote, it can be recognized as a specific number. For example, if the last digit of the serial number of the Chinese note is alphabet E, it may be determined to be the number 2.

전술한 실시예에서, 중국 지폐의 일련번호를 대체한 한국 지폐의 일련번호의 이미지는 예를 들어 전술한 도 4의 문자 이미지가 활용될 수 있다. 이때 문자 이미지 내에 일련번호의 폰트와 폰트 크기는 한국 지폐에 사용되는 폰트와 폰트 크기일 수 있다.In the above-described embodiment, the image of the serial number of the Korean banknote replacing the serial number of the Chinese banknote can be utilized, for example, the character image of FIG. 4 described above. In this case, the font and the font size of the serial number in the character image may be the font and the font size used in the Korean currency.

위 실시예에서는 중국 지폐의 일련번호의 숫자 문자 자리수에 한국 지폐의 일련번호의 영문 문자가 대체된 경우를 설명하였지만, 이에 한정되지 않으며, 제1국 지폐의 제1국 일련번호의 소정의 문자 자리수에 제2국 일련번호의 소정의 문자로 대체될 수 있다.In the above embodiment, the alphabetical character of the serial number of the Korean banknote is replaced with the numeric character of the serial number of the Chinese banknote. However, the present invention is not limited to this, Can be replaced with a predetermined character of the second station serial number.

이에 따라, 제1국 지폐의 제1국 일련번호의 숫자 문자 자리수에 제2국 일련번호의 영문 문자를 대체한 경우, 이미지 획득부(210)에 의해서 제1국 지폐로부터 개별적 문자의 문자 이미지를 획득한 후, 문자 결정부(220)에서 개별적 문자의 문자 이미지로부터 개별적 문자를 결정함에 있어서, 제2국 일련번호의 영문 문자를 0 내지 9를 포함하는 숫자의 집합에서 일부의 숫자 또는 숫자들을 포함하는 집합 내의 숫자로 결정할 수 있다.Accordingly, when the alphabetical character of the serial number of the second station is substituted for the digit number of the serial number of the first station of the first country banknote, the image obtaining unit 210 obtains the character image of the individual character from the first country banknote In determining the individual character from the character image of the individual character in the character determination unit 220, an alphabetical character of the second station serial number is included in the set of numbers including 0 to 9, Can be determined by the number in the set.

전술한 예들에서와 같이, 문자 결정부(220)는 서로 다른 매체에 대해 소정 회수 이상 문자의 결정을 수행할 수 있다, 서로 다른 매체에 대해 소정 회수 이상 문자의 결정을 수행하는 경우, 서로 다른 매체의 동일 자리수의 소정 영문 문자를 소정의 숫자 문자들의 집합 내에서 결정할 수 있다. 여기서, 소정의 숫자 문자들의 집합은 상위 그룹들 또는 하위 그룹들 중 어느 하나가 될 수 있다. As in the above-described examples, the character determination unit 220 can perform determination of a character more than a predetermined number of times for different media. In the case of performing determination of characters more than a predetermined number of times for different media, The predetermined number of alphabetic characters of the same number in the set of predetermined numeric characters can be determined. Here, the set of predetermined numeric characters may be any of upper groups or lower groups.

예를 들면, 서로 다른 매체의 동일 자리수는 일련번호의 마지막 자리수가 될 수 있고, 이때, 마지막 자리수의 소정 영문 문자가 영문 E, K 또는 C인 경우, 소정의 숫자 문자들의 집합은 5, 6 및 2가 될 수 있다. 다른 예로, 마지막 자리수의 소정 영문 문자가 영문 E인 경우, 소정의 문자들의 집합은 2인 문자가 될 수 있다. 또 다른 예로, 마지막 자리수의 소정 영문 문자가 영문 A, B, D, H 또는 J인 경우, 소정의 숫자 문자들의 집합은 3, 4, 8 및 9가 될 수 있다. 또 다른 예로, 마지막 자리수의 소정 영문 문자가 영문 L인 경우, 소정의 숫자 문자들의 집합은 1 및 7가 될 수 있다.For example, the same number of digits of different media can be the last digit of the serial number, and if the predetermined number of English characters of the last digit is English E, K or C, then the set of predetermined numeric characters is 5, 6, 2 < / RTI > As another example, if the predetermined alphabet of the last digit is English E, the predetermined set of characters may be two alphabets. As another example, if the predetermined alphabet of the last digit is English A, B, D, H, or J, the predetermined set of numeric characters may be 3, 4, 8, and 9. As another example, if the predetermined number of English characters in the last digit is L, the set of predetermined numeric characters may be 1 and 7.

이와 같이, 문자 인식 장치(200)는 매체의 종류, 권종 및 해당 문자의 자리수마다 미리 정해진 계층 구조를 적용하여 매체의 문자를 결정한다.In this way, the character recognition apparatus 200 determines the character of the medium by applying a predetermined hierarchical structure for each type of medium, the type of the character, and the number of digits of the character.

도 6은 본 발명의 일 실시예에 따라 매체의 문자를 결정하는 문자 인식 방법을 나타낸 흐름도이다. 도 6을 참조하면, 도 6에 기재된 방법은 도 1 내지 도 2에 도시된 문자 인식 장치(200)에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 하기에 생략된 내용이라 하더라도 도 1 내지 도 2에 도시된 문자 인식 장치(200)에 관하여 이상에서 기술된 내용은 도 6에 기재된 방법에도 적용됨을 알 수 있다. 6 is a flowchart illustrating a character recognition method for determining a character of a medium according to an embodiment of the present invention. Referring to FIG. 6, the method illustrated in FIG. 6 comprises steps that are processed in a time-series manner in the character recognition apparatus 200 shown in FIG. 1 to FIG. Therefore, even if the contents are omitted in the following description, it can be understood that the contents described above with respect to the character recognition apparatus 200 shown in Figs. 1 and 2 also apply to the method shown in Fig.

610단계에서 이미지 획득부(210)는 개별적 문자의 문자 이미지를 획득한다. 예를 들면, 이미지 획득부(210)는 광을 이용하여 문자 이미지를 획득할 수 있다. In operation 610, the image obtaining unit 210 obtains a character image of an individual character. For example, the image acquiring unit 210 may acquire a character image using light.

620단계에서 문자 결정부(220)는 계층 구조에 따라 문자 이미지를 단계적으로 판독하여 문자를 결정한다. 계층 구조는 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 것으로, 숫자 0 내지 9의 집합 또는 알파벳 A 내지 Z의 집합 등이 될 수 있다. 문자 결정부(220)는 소정의 문자들의 집합에 포함된 문자들의 종류에 따라 적어도 하나 이상의 템플릿을 이용하여 문자 이미지의 문자를 결정할 수 있다. In operation 620, the character determination unit 220 determines the character by reading the character image stepwise according to the hierarchical structure. The hierarchical structure is a hierarchical classification of a set of predetermined characters into a plurality of groups composed of upper groups and lower groups, and may be a set of numbers 0 to 9 or a set of alphabets A to Z, and the like. The character determination unit 220 may determine a character of a character image using at least one template according to the type of characters included in a predetermined set of characters.

도 7은 본 발명의 다른 실시예에 따라 매체의 문자를 결정하는 문자 인식 방법을 나타낸 흐름도이다. 도 7을 참조하면, 도 7에 기재된 방법은 도 1 내지 도 2에 도시된 문자 인식 장치(200)에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 하기에 생략된 내용이라 하더라도 도 1 내지 도 2에 도시된 문자 인식 장치(200)에 관하여 이상에서 기술된 내용은 도 7에 기재된 방법에도 적용됨을 알 수 있다. 7 is a flowchart illustrating a character recognition method for determining a character of a medium according to another embodiment of the present invention. Referring to FIG. 7, the method illustrated in FIG. 7 comprises steps that are processed in a time-series manner in the character recognition apparatus 200 shown in FIG. 1 to FIG. Therefore, even if the contents are omitted in the following description, it can be understood that the above-described contents of the character recognition apparatus 200 shown in Figs. 1 and 2 also apply to the method described in Fig.

710단계에서 문자 인식 장치(200)는 매체 입출부(110)를 통해 투입된 매체를 수신한다.In operation 710, the character recognition apparatus 200 receives the medium input through the medium input / output unit 110.

720단계에서 이미지 획득부(210)는 매체의 이미지를 획득한다. 이미지 획득부(210)는 매체의 전체 이미지가 아닌 특정 부분의 이미지만을 획득할 수 있다. In operation 720, the image obtaining unit 210 obtains an image of the medium. The image acquiring unit 210 may acquire only an image of a specific portion rather than an entire image of the medium.

730단계에서 이미지 획득부(210)는 문자열 이미지를 획득한다. 예를 들면, 이미지 획득부(210)는 여백을 제거하는 이미지 처리를 수행하여 적어도 하나 이상의 문자를 포함하는 문자열 이미지를 획득할 수 있다.In operation 730, the image acquisition unit 210 acquires a character string image. For example, the image obtaining unit 210 may perform image processing to remove margins to obtain a character string image including at least one character.

740단계에서 이미지 획득부(210)는 개별적 문자의 문자 이미지를 획득한다. 예를 들면, 이미지 획득부(210)는 이미지 처리를 통해 문자열 이미지를 각 문자 별로 소정의 크기의 문자 이미지로 분할할 수 있다. In operation 740, the image acquisition unit 210 acquires character images of individual characters. For example, the image obtaining unit 210 may divide a character image into character images of a predetermined size for each character through image processing.

750단계에서 문자 결정부(220)는 계층 구조에 따라 문자 이미지를 단계적으로 판독하여 문자를 결정한다. 예를 들면, 문자 결정부(220)는 판독 결과에 따라 복수의 그룹들 중 문자 이미지가 속하는 그룹이 결정되면, 문자 이미지의 문자를 결정된 그룹에 포함된 문자들 중에 하나로 결정할 수 있다. In step 750, the character determination unit 220 determines the character by reading the character image step by step according to the hierarchical structure. For example, if the group to which the character image belongs is determined among the plurality of groups according to the reading result, the character determining unit 220 can determine the character of the character image as one of the characters included in the determined group.

760단계에서 문자 결정부(220)는 입력된 문자 이미지의 문자가 인식되었는지 여부를 판단하여, 제어부(120)에 판단 결과를 전송한다. 750 단계에서 문자를 판독하고 문자를 결정한 결과에 따라, 문자 이미지의 문자가 소정의 집합의 문자들 중 하나로 결정되었으면 770단계로 진행하고, 문자 이미지의 문자가 결정되지 않았으면 780단계로 진행한다.In step 760, the character determination unit 220 determines whether or not the character of the input character image has been recognized, and transmits the determination result to the control unit 120. If the character of the character image is determined to be one of the predetermined set of characters according to the result of reading the character in step 750 and the character of the character image is not determined in step 770,

770 단계는 제어부(120)는 문자 인식 장치(200)의 인식된 결과에 따라, 투입된 매체를 처리한다. In operation 770, the control unit 120 processes the input medium according to the recognized result of the character recognition apparatus 200.

780 단계는 사용자 인터페이스부(140)는 투입된 매체에 문자 인식 오류가 발생하였음을 표시한다. In operation 780, the user interface unit 140 indicates that a character recognition error has occurred in the input medium.

본 발명의 실시예들에 따라, 문자 인식 장치(200)는 문자 이미지의 전체 픽셀들을 비교하지 않더라도, 상위 그룹들 및 하위 그룹들로 구성된 계층 구조를 이용하여 소정의 위치의 일부 픽셀들을 비교하여 문자 이미지의 문자를 빠르게 인식할 수 있다. According to the embodiments of the present invention, the character recognition apparatus 200 may compare some pixels at a predetermined position using a hierarchical structure composed of upper groups and lower groups, The character of the image can be quickly recognized.

이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.While the present invention has been described in connection with what is presently considered to be the most practical and preferred embodiment, it is to be understood that the invention is not limited to the disclosed embodiments. That is, within the scope of the present invention, all of the components may be selectively coupled to one or more of them. In addition, although all of the components may be implemented as one independent hardware, some or all of the components may be selectively combined to perform a part or all of the functions in one or a plurality of hardware. As shown in FIG. The codes and code segments constituting the computer program may be easily deduced by those skilled in the art. Such a computer program can be stored in a computer-readable storage medium, readable and executed by a computer, thereby realizing an embodiment of the present invention. As the storage medium of the computer program, a magnetic recording medium, an optical recording medium, a carrier wave medium, or the like may be included.

또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재할 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미가 있다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Furthermore, the terms "comprises", "comprising", or "having" described above mean that a component can be implanted unless otherwise specifically stated, But should be construed as including other elements. All terms, including technical and scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs, unless otherwise defined. Commonly used terms, such as predefined terms, should be interpreted to be consistent with the contextual meanings of the related art, and are not to be construed as ideal or overly formal, unless expressly defined to the contrary.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The foregoing description is merely illustrative of the technical idea of the present invention, and various changes and modifications may be made by those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments disclosed in the present invention are intended to illustrate rather than limit the scope of the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. The scope of protection of the present invention should be construed according to the following claims, and all technical ideas within the scope of equivalents should be construed as falling within the scope of the present invention.

200 ... 문자 인식 장치
210 ... 이미지 획득부
220 ... 문자 결정부
200 ... character recognition device
210 ... image acquisition unit
220 ... character determination section

Claims (18)

매체의 문자(character)를 인식하는 문자 인식 방법에 있어서,
상기 매체로부터 개별적 문자의 문자 이미지를 획득하는 단계; 및
소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 계층 구조에 따라, 각 계층별로 상기 문자 이미지 상의 소정의 영역의 문자 픽셀들의 수, 배경 픽셀들의 수, 및 문자 픽셀들의 수와 배경 픽셀들의 수의 비율 중 어느 하나를 기준값과 비교하여 상기 문자 이미지를 단계적으로 판독하여 문자를 결정하는 단계;를 포함하는 문자 인식 방법.
1. A character recognition method for recognizing a character of a medium,
Obtaining a character image of an individual character from the medium; And
The number of character pixels in a predetermined area on the character image, the number of background pixels in each layer, and the number of background pixels in a hierarchical structure hierarchically classified into a plurality of groups, And comparing the ratio of the number of character pixels to the number of background pixels with a reference value to stepwise read the character image to determine a character.
제 1 항에 있어서,
상기 결정하는 단계는
적어도 하나 이상의 템플릿을 소정의 위치에 위치시키고, 상기 템플릿 내에 포함되는 문자 픽셀들 사이의 인접성을 확인하여 문자를 결정하는 것을 특징으로 하는 문자 인식 방법.
The method according to claim 1,
The step of determining
Wherein at least one template is located at a predetermined position and a character is determined by confirming the proximity between the character pixels included in the template.
제 1 항에 있어서,
상기 계층 구조는 상기 소정의 문자들의 집합에 포함된 문자들 사이의 형태의 유사성에 기초하여 상기 소정의 문자들의 집합을 상기 복수의 그룹으로 분류한 것을 특징으로 하는 문자 인식 방법.
The method according to claim 1,
Wherein the hierarchical structure classifies the set of predetermined characters into the plurality of groups on the basis of a similarity of shapes among characters included in the set of predetermined characters.
제 1 항에 있어서,
상기 결정하는 단계는
상기 판독 결과에 기초하여, 상기 복수의 그룹들 중 상기 문자 이미지가 속하는 그룹을 결정하는 단계; 및
상기 문자 이미지의 문자를 상기 결정된 그룹에 포함된 문자들 중에 하나로 결정하는 단계;를 포함하는 것을 특징으로 하는 문자 인식 방법.
The method according to claim 1,
The step of determining
Determining a group to which the character image belongs among the plurality of groups based on the reading result; And
And determining the character of the character image as one of the characters included in the determined group.
제 1 항에 있어서,
상기 계층 구조는 숫자 0 내지 9를 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹으로 계층적으로 분류한 것이고,
상기 계층 구조를 이용하여 특정 알파벳의 문자 이미지를 판독하면 특정 숫자로 인식되는 것을 특징으로 하는 문자 인식 방법.
The method according to claim 1,
The hierarchical structure is a hierarchical classification of numbers 0 to 9 into a plurality of groups composed of upper groups and lower groups,
And recognizing the character image as a specific number when a character image of a specific alphabet is read using the hierarchical structure.
제 1 항에 있어서,
상기 계층 구조는 숫자 0 내지 9를 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹으로 계층적으로 분류한 것이고,
상기 계층 구조를 이용하여 알파벳 E를 판독하면 숫자 2로 결정되는 것을 특징으로 하는 문자 인식 방법.
The method according to claim 1,
The hierarchical structure is a hierarchical classification of numbers 0 to 9 into a plurality of groups composed of upper groups and lower groups,
And if the alphabet E is read using the hierarchical structure, a number 2 is determined.
제 1 항에 있어서,
상기 계층 구조는 숫자 0 내지 9를 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹으로 계층적으로 분류한 것이고,
상기 계층 구조를 이용하여 알파벳 E, C, 또는 K를 판독하면 숫자 5, 6, 2 중 어느 하나로 인식되는 것을 특징으로 하는 문자 인식 방법.
The method according to claim 1,
The hierarchical structure is a hierarchical classification of numbers 0 to 9 into a plurality of groups composed of upper groups and lower groups,
And if the alphabet E, C, or K is read using the hierarchical structure, it is recognized as any one of numbers 5, 6, and 2. [
제 1 항에 있어서,
상기 계층 구조는 알파벳 A 내지 Z를 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹으로 계층적으로 분류한 것이고,
상기 계층 구조를 이용하여 숫자 8을 판독하면 알파벳 B로 인식되는 것을 특징으로 하는 문자 인식 방법.
The method according to claim 1,
The hierarchical structure is a hierarchical classification of alphabets A through Z into a plurality of groups composed of upper groups and lower groups,
And if the number 8 is read using the hierarchical structure, it is recognized as an alphabet B.
제 1 항에 있어서,
상기 결정하는 단계는 상기 소정의 문자들의 집합에 포함된 문자들의 종류에 따라 적어도 하나 이상의 템플릿을 이용하여 상기 문자를 결정하는 것을 특징으로 하는 문자 인식 방법.
The method according to claim 1,
Wherein the determining step determines the character using at least one template according to a type of characters included in the predetermined set of characters.
제 1 항 내지 제 9 항 중에 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium storing a program for causing a computer to execute the method according to any one of claims 1 to 9. 매체로부터 개별적 문자의 문자 이미지를 획득하는 이미지 획득부; 및
상기 개별적 문자의 문자 이미지로부터 상기 개별적 문자를 결정하는 문자 결정부;를 포함하되,
상기 문자 결정부는 서로 다른 매체에 대해 소정 회수 이상 상기 개별적 문자의 결정을 수행하는 경우, 상기 서로 다른 매체의 동일 자리수의 소정 영문 문자를 소정의 숫자 문자들의 집합 내에서 결정하는 문자 인식 장치.
An image obtaining unit obtaining character images of individual characters from the medium; And
And a character determination unit for determining the individual character from a character image of the individual character,
Wherein the character determination unit determines a predetermined number of alphabetic characters of the same number of different media in a set of predetermined numeric characters when the determination of the individual characters is performed more than a predetermined number of times for different media.
제 11 항에 있어서,
상기 서로 다른 매체의 동일 자리수는 일련번호의 마지막 자리수이고 상기 소정 영문 문자가 영문 E, K 또는 C인 경우, 상기 소정의 숫자 문자들의 집합은 5, 6 및 2인 문자 인식 장치.
12. The method of claim 11,
Wherein when the same number of digits of the different media is the last digit of the serial number and the predetermined English character is English E, K or C, the set of predetermined numeric characters is 5, 6 and 2.
제11항에 있어서,
상기 서로 다른 매체의 동일 자리수는 일련번호의 마지막 자리수이고 상기 소정 영문 문자가 영문 E인 경우, 상기 소정의 문자들의 집합은 2인 문자 인식 장치.
12. The method of claim 11,
Wherein when the same number of digits of the different media is the last digit of the serial number and the predetermined English character is English E, the set of predetermined characters is a 2-character recognition device.
제 11 항에 있어서,
상기 서로 다른 매체의 동일 자리수는 일련번호의 마지막 자리수이고 상기 소정 영문 문자가 영문 A, B, D, H 또는 J인 경우, 상기 소정의 숫자 문자들의 집합은 3, 4, 8 및 9인 문자 인식 장치.
12. The method of claim 11,
If the same number of digits of the different mediums is the last digit of the serial number and the predetermined alphabet letter is A, B, D, H, or J, then the predetermined set of numeric characters is 3, 4, Device.
제 11 항에 있어서,
상기 서로 다른 매체의 동일 자리수는 일련번호의 마지막 자리수이고 상기 소정 영문 문자가 영문 L인 경우, 상기 소정의 숫자 문자들의 집합은 1 및 7인 문자 인식 장치.
12. The method of claim 11,
Wherein when the same number of digits of the different media is the last digit of the serial number and the predetermined English character is English L, the set of predetermined numeric characters is 1 and 7, respectively.
제1국 지폐로부터 개별적 문자의 문자 이미지를 획득하는 이미지 획득부; 및
개별적 문자의 문자 이미지로부터 개별적 문자를 결정하는 문자 결정부
를 포함하되,
상기 제1국 지폐의 제1국 일련번호의 숫자 문자 자리수에 제2국 일련번호의 영문 문자가 대체된 경우, 제2국 일련번호의 영문 문자는 0 내지 9를 포함하는 숫자의 집합에서 일부의 숫자 또는 숫자들을 포함하는 집합 내의 숫자로 결정되는 문자 인식 장치.
An image obtaining unit for obtaining a character image of individual characters from the first bank bill; And
A character determination unit for determining individual characters from character images of individual characters,
, ≪ / RTI &
When the alphabetical character of the second station serial number is replaced with the numeric character digit of the first station serial number of the first country banknote, the alphabetical character of the second station serial number is a set of numbers including 0 to 9 The number being determined by a number in the set that includes numbers or numbers.
제 16 항에 있어서,
상기 제1국 지폐의 제1국 일련번호의 숫자 문자 자리수에 대체된 상기 제2국 일련번호의 영문 문자의 문자 이미지는 픽셀값이 200 이상인 배경 픽셀 및 픽셀값이 30 이하인 문자 픽셀을 포함하는 것을 특징으로 하는 문자 인식 장치.
17. The method of claim 16,
The character image of the alphabetical character of the second station serial number replaced with the numeric character digit of the first station serial number of the first country banknote includes a background pixel having a pixel value of 200 or more and a character pixel having a pixel value of 30 or less The character recognition apparatus comprising:
문자들을 포함하는 매체를 인입하거나 인출하는 매체 입출부;
상기 매체로부터 개별적 문자의 문자 이미지를 획득하고 소정의 문자들의 집합을 상위 그룹들 및 하위 그룹들로 구성된 복수의 그룹들로 계층적으로 분류한 계층 구조에 따라 각 계층별로 상기 문자 이미지 상의 소정의 영역의 문자 픽셀들의 수, 배경 픽셀들의 수, 또는 문자 픽셀들의 수와 배경 픽셀들의 수의 비율 중 어느 하나를 기준값과 비교하여 상기 문자 이미지를 판독하여 문자를 결정하는 문자 인식 장치; 및
상기 매체 입출부와 상기 문자 인식 장치의 동작을 제어하는 제어부;를 포함하는 금융기기.
A medium input / output unit for inputting or outputting a medium including characters;
A character image of an individual character is obtained from the medium, and a predetermined character group is hierarchically classified into a plurality of groups composed of upper groups and lower groups, A character recognition device that compares one of the number of character pixels, the number of background pixels, or the ratio of the number of character pixels and the number of background pixels to a reference value to determine the character by reading the character image; And
And a controller for controlling operations of the media input / output unit and the character recognition apparatus.
KR1020130087482A 2012-07-31 2013-07-24 Character recognition method, character recognition apparatus and financial apparatus KR101470748B1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020130087482A KR101470748B1 (en) 2013-07-24 2013-07-24 Character recognition method, character recognition apparatus and financial apparatus
CN201310329263.2A CN103577820B (en) 2012-07-31 2013-07-31 Character identifying method, character recognition device and finance device
US13/955,782 US9563811B2 (en) 2012-07-31 2013-07-31 Character recognition method, character recognition apparatus and financial apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130087482A KR101470748B1 (en) 2013-07-24 2013-07-24 Character recognition method, character recognition apparatus and financial apparatus

Publications (1)

Publication Number Publication Date
KR101470748B1 true KR101470748B1 (en) 2014-12-08

Family

ID=52678213

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130087482A KR101470748B1 (en) 2012-07-31 2013-07-24 Character recognition method, character recognition apparatus and financial apparatus

Country Status (1)

Country Link
KR (1) KR101470748B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200736A (en) * 1993-12-29 1995-08-04 Canon Inc Method and device for character recognition
JP2002342288A (en) * 2001-05-21 2002-11-29 Casio Comput Co Ltd Authentication device, authentication system, authentication method, authentication program and recording medium
KR100893613B1 (en) * 2007-12-06 2009-04-20 주식회사 씨텍 Method and apparatus for recognizing and counting currency notes and securities having barcodes
KR20110038478A (en) * 2009-10-08 2011-04-14 주식회사 카스모아이티 Method for recognizing serial number of security paper money

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200736A (en) * 1993-12-29 1995-08-04 Canon Inc Method and device for character recognition
JP2002342288A (en) * 2001-05-21 2002-11-29 Casio Comput Co Ltd Authentication device, authentication system, authentication method, authentication program and recording medium
KR100893613B1 (en) * 2007-12-06 2009-04-20 주식회사 씨텍 Method and apparatus for recognizing and counting currency notes and securities having barcodes
KR20110038478A (en) * 2009-10-08 2011-04-14 주식회사 카스모아이티 Method for recognizing serial number of security paper money

Similar Documents

Publication Publication Date Title
US10846553B2 (en) Recognizing typewritten and handwritten characters using end-to-end deep learning
US11126892B2 (en) Dual stage neural network pipeline systems and methods
US9563811B2 (en) Character recognition method, character recognition apparatus and financial apparatus
EP3869385B1 (en) Method for extracting structural data from image, apparatus and device
US9262679B2 (en) System and method for identification and separation of form and feature elements from handwritten and other user supplied elements
JPWO2009040922A1 (en) Paper sheet processing equipment
EP2830024A1 (en) System for reading paper sheet serial number, and method for reading paper sheet serial number
JP2016048444A (en) Document identification program, document identification device, document identification system, and document identification method
CN103870823B (en) Character recognition device and method
US10706581B2 (en) Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor
CN113469005B (en) Bank receipt identification method, related device and storage medium
JP2009093305A (en) Business form recognition system
KR101470748B1 (en) Character recognition method, character recognition apparatus and financial apparatus
JP6302317B2 (en) Form format information registration method, system, and program
CN116030469A (en) Processing method, processing device, processing equipment and computer readable storage medium
JP2013073608A (en) Document processing device, document processing method, and program
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
US20210064815A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2008310531A (en) Business form identification method, business form identification program and optical character reading system using the business form identification method
TWM626292U (en) Business-oriented key item key-value identification system
WO2022026908A1 (en) Systems and methods for machine learning key-value extraction on documents
Kodirov et al. Music with harmony: chord separation and recognition in printed music score images
KR101655704B1 (en) Apparatus and method for recognizing media, financial device
TWI807467B (en) Key-item detection model building method, business-oriented key-value identification system and method
US20230206671A1 (en) Extracting structured information from document images

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20181203

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191202

Year of fee payment: 6