KR101900903B1 - 분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 추정방법 및 이를 이용한 문자 인식 장치와 문자 인식 방법 - Google Patents

분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 추정방법 및 이를 이용한 문자 인식 장치와 문자 인식 방법 Download PDF

Info

Publication number
KR101900903B1
KR101900903B1 KR1020170120530A KR20170120530A KR101900903B1 KR 101900903 B1 KR101900903 B1 KR 101900903B1 KR 1020170120530 A KR1020170120530 A KR 1020170120530A KR 20170120530 A KR20170120530 A KR 20170120530A KR 101900903 B1 KR101900903 B1 KR 101900903B1
Authority
KR
South Korea
Prior art keywords
image
character
orientation
center
reference character
Prior art date
Application number
KR1020170120530A
Other languages
English (en)
Inventor
예히아 아바스 모하메드
김형원
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR1020170120530A priority Critical patent/KR101900903B1/ko
Application granted granted Critical
Publication of KR101900903B1 publication Critical patent/KR101900903B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • G06K9/3283
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • G06K9/6201
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

본 발명은 문자 이미지를 분할하고 분할된 이미지의 무게중심에 기초하여 문자 이미지의 오리엔테이션을 추정함으로써, 문자 이미지의 오리엔테이션 추정에 소요되는 계산량을 감소시키며, 문자 이미지가 나타내는 문자를 인식하는 방법에 있어서 추정된 오리엔테이션만큼 문자 이미지를 보정한 후 기준 문자 이미지와 매칭시켜 문자 인식의 정확도를 높인다.

Description

분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 추정방법 및 이를 이용한 문자 인식 장치와 문자 인식 방법 {IMAGE ORIENTATION ESTIMATION METHOD BASED ON CENTER OF MASS OF PARTITIONED IMAGES, CHARACTER RECOGNITION APPARATUS AND METHOD USING THEREOF}
본 발명은 문자 인식 장치 및 문자 인식 방법에 관한 것으로서, 더 구체적으로는 분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 추정방법을 이용한 문자 인식 장치 및 문자 인식 방법에 관한 것이다.
문자인식 관련기술로서, 패턴매칭, 코릴레이션 계산기법, 특징점 추출 및 매칭, 뉴럴네트워크 기반 딥러닝 등 다양한 방법이 알려져 있다. 그러나, 위에 나열한 기술들은 기준 영상 대비 테스트 영상의 스케일 또는 오리엔테이션 변화에 따라 문자 인식 성능이 크게 좌우된다. 특히 오리엔테이션 보정은 문자 인식률 개선에 지대한 영향을 미친다.
한편, 종래에는 이미지 또는 문자의 오리엔테이션을 계산함에 있어서, 그레디언트 계산방법을 주로 사용하였다. 예를 들면, 수식 (1) 과 같이 2차원 영상의 각 좌표를 x방향 및 y방향으로 미분한 그레디언트 벡터를 이용하여 전체 영상의 오리엔테이션을 계산한다.
Figure 112017091287504-pat00001
수식 (1)
그러나, 그레디언트 벡터를 이용한 오리엔테이션 계산방법은 계산량이 많아서, IoT나 모바일 응용분야에 적용하기 위한 저전력 초소형 MCU 기반의 알고리즘에는 적합하지 않다.
또한, 그레디언트 벡터를 이용한 오리엔테이션 계산방법은 하나의 이미지내에 오리엔테이션이 서로 다른 많은 물체를 포함하고 있을 경우 각 물체의 오리엔테이션을 계산하는데는 효과적이지만, 하나의 이미지내에 포함된 하나의 문자의 오리엔테이션을 계산하기에는 계산량이 과다하여 효율적이지 않은 단점이 있다.
본 발명은 작은 계산량으로 문자 이미지의 오리엔테이션을 계산하고 계산된 오리엔테이션만큼 문자 이미지를 보정하여 표준화한 후 이를 기준 문자 이미지와 비교함으로써, 소형 디바이스에서 고속으로 문자 인식을 가능하게 하는 것을 목적으로 한다.
상기와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따르는 이미지 오리엔테이션 추정방법은, 촬상된 이미지의 중심을 지나는 세로축과 가로축을 각각 기준선과 분할선으로 하고, 기준선과 분할선을 각각 y축과 x축으로 설정하는 단계 (a), 분할선을 기준으로 한 이미지의 상반부의 무게중심과 하반부의 무게중심을 계산하는 단계 (b), 상반부의 무게중심과 하반부의 무게중심을 잇는 선을 갱신된 기준선으로 설정하고 갱신된 기준선과 갱신직전의 기준선이 이루는 각도의 크기와 방향을 결정하는 단계 (c), 각도의 크기와 소정값을 비교하는 단계 (d), 비교결과 각도의 크기가 소정값보다 크거나 같다면, 갱신된 기준선과 직각을 이루며 영점을 지나는 갱신된 분할선을 설정하고 갱신된 분할선을 기준으로 하여 단계 (b), (c), (d) 를 반복하며, 비교결과 각도의 크기가 소정값보다 작다면 갱신된 기준선과 y축이 이루는 각도를 이미지의 오리엔테이션으로 추정하는 단계 (e)를 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 이미지 오리엔테이션 추정방법은 추정하고자 하는 이미지가 문자 이미지인 것을 특징으로 한다.
본 발명의 일 실시예에 따른 문자 인식방법은 문자 이미지를 입력하는 단계, 본 발명의 일 실시예에 따라 문자 이미지의 오리엔테이션을 추정하는 단계, 문자 이미지의 오리엔테이션을 고려하여 문자 이미지와 복수의 기준 문자 이미지를 비교하는 단계, 및 비교 결과에 따라 문자 이미지의 문자를 인식하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 문자 인식 방법에서, 비교하는 단계는 추정된 문자 이미지 오리엔테이션의 반대방향으로 문자 이미지를 회전시켜 표준화하는 단계를 더 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 문자 인식 방법에서, 비교하는 단계는 본 발명의 일 실시예에 따른 문자 이미지의 오리엔테이션을 추정하는 방법을 사용하여 복수의 기준 문자 이미지의 오리엔테이션을 추정하는 단계와 추정된 각각의 기준 문자 이미지 오리엔테이션의 반대방향으로 각각의 기준 문자 이미지를 회전시켜 표준화하는 단계를 더 포함하며, 비교하는 단계는 표준화된 문자 이미지와 표준화된 복수의 기준 문자 이미지를 비교하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 이미지 오리엔테이션 추정 장치는 하나 이상의 프로세서를 포함하며, 이들 하나 이상의 프로세서는 촬상된 이미지의 중심을 지나는 세로축과 가로축을 각각 기준선과 분할선으로 하고, 기준선과 분할선을 각각 y축과 x축으로 설정하는 단계 (a), 분할선을 기준으로 한 이미지의 상반부의 무게중심과 하반부의 무게중심을 계산하는 단계 (b), 상반부의 무게중심과 하반부의 무게중심을 잇는 선을 갱신된 기준선으로 설정하고 갱신된 기준선과 갱신직전의 기준선이 이루는 각도의 크기와 방향을 결정하는 단계 (c), 각도의 크기와 소정값을 비교하는 단계 (d), 비교결과 각도의 크기가 소정값보다 크거나 같다면, 갱신된 기준선과 직각을 이루며 영점을 지나는 갱신된 분할선을 설정하고 갱신된 분할선을 기준으로 하여 단계 (b), (c), (d) 를 반복하며, 비교결과 각도의 크기가 소정값보다 작다면 갱신된 기준선과 y축이 이루는 각도를 이미지의 오리엔테이션으로 추정하는 단계 (e)를 수행하는 것을 특징으로 한다.
본 발명의 다른 실시예는 오리엔테이션을 추정하고자 하는 이미지가 문자 이미지인 것을 특징으로 한다.
본 발명의 일실시예에 따른 문자 인식 장치는 하나 이상의 프로세서를 포함하며, 이들 하나 이상의 프로세서는, 본 발명의 다른 실시예에 따른 문자 이미지의 오리엔테이션 추정방법에 따라 문자 이미지의 오리엔테이션을 추정하는 단계, 문자 이미지의 오리엔테이션을 고려하여 문자 이미지와 복수의 기준 문자 이미지를 비교하는 단계, 및 비교 결과에 따라 문자 이미지의 문자를 인식하는 단계를 수행하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 문자 인식 장치에서는, 하나 이상의 프로세서가 비교하는 단계를 수행함에 있어서 추정된 문자 이미지 오리엔테이션의 반대방향으로 문자 이미지를 회전시켜 표준화하는 단계를 더 수행하는 것을 특징으로 한다.
본 발명이 다른 실시예에 따른 문자 인식 장치에서는 하나 이상의 프로세서가 위에서 언급한 비교하는 단계를 수행함에 있어서, 복수의 기준 문자 이미지의 오리엔테이션을 추정하는 단계와 추정된 각각의 기준 문자 이미지 오리엔테이션의 반대방향으로 각각의 기준 문자 이미지를 회전시켜 표준화하는 단계를 더 수행하며, 비교하는 단계는 표준화된 문자 이미지와 표준화된 복수의 기준 문자 이미지를 비교하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 문자 인식 장치는 문자 이미지를 촬상하는 촬상장치를 더 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따르는 이미지 오리엔테이션 추정방법은, 촬상된 이미지의 중심을 지나는 세로축과 가로축을 각각 기준선과 분할선으로 하고, 기준선과 분할선을 각각 y축과 x축으로 설정하는 단계 (a); 분할선을 기준으로 한 이미지의 상반부의 무게중심과 하반부의 무게중심을 계산하는 단계 (b); 상기 상반부의 무게중심과 상기 하반부의 무게중심을 잇는 선을 갱신된 기준선으로 설정하고 갱신된 기준선과 갱신직전의 기준선이 이루는 각도의 크기와 방향을 결정하는 단계 (c); 상기 각도의 크기와 소정의 임계값을 비교하는 단계 (d); 비교결과 상기 각도의 크기가 상기 소정값보다 크거나 같다면, 갱신된 기준선과 직각을 이루며 영점을 지나는 선을 갱신된 분할선으로 설정하고 갱신된 분할선을 기준으로 하여 단계 (b), (c), (d) 를 반복하며, 비교결과 상기 각도의 크기가 상기 소정값보다 작다면 갱신된 기준선과 y축이 이루는 각도를 상기 이미지의 오리엔테이션으로 추정하는 단계 (e)를 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 이미지 오리엔테이션 추정방법은, 상기 이미지는, 문자 이미지로서 임의의 각도로 기울어진 손글씨 또는 활자의 문자 또는 숫자 이미지이며, 상기 추정된 오리엔테이션의 반대방향으로 상기 문자 이미지를 회전하여 상기 문자 이미지를 표준화하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 문자 인식방법은, 복수의 기준 문자 이미지를 입력하는 단계; 위(청구항 제1항)에 기재된 방법으로 상기 복수의 기준 문자 이미지의 오리엔테이션을 추정하는 단계; 상기 복수의 기준 문자 이미지의 각각의 추정된 오리엔테이션의 반대방향으로 상기 복수의 기준 문자 이미지를 회전시켜 표준화하는 단계; 상기 표준화된 복수의 기준 문자 이미지를 저장하는 기준 문자 이미지 데이터베이스를 생성하는 단계를 포함한다.
본 발명의 다른 실시예에 따른 문자 인식 방법은, 임의의 오리엔테이션으로 기울어진 테스트 문자를 촬영하여 위(청구항 제1항)의 방법으로 오리엔테이션을 추정하고 위(청구항 제2항)의 방법으로 표준화한 후 위(청구항 제3항)의 방법으로 기준 문자 이미지 데이터베이스에 미리 저장된 기준 문자와 비교하여 가장 높은 매칭율을 가지는 기준 문자를 선택하여 테스트 문자를 인식하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 하나 이상의 프로세서를 포함하는 이미지 오리엔테이션 추정 장치는, 상기 하나 이상의 프로세서는, 촬상된 이미지의 중심을 지나는 세로축과 가로축을 각각 기준선과 분할선으로 하고, 기준선과 분할선을 각각 y축과 x축으로 설정하는 단계 (a); 분할선을 기준으로 한 이미지의 상반부의 무게중심과 하반부의 무게중심을 계산하는 단계 (b); 상기 상반부의 무게중심과 상기 하반부의 무게중심을 잇는 선을 갱신된 기준선으로 설정하고 갱신된 기준선과 갱신직전의 기준선이 이루는 각도의 크기와 방향을 결정하는 단계 (c); 상기 각도의 크기와 소정의 임계값을 비교하는 단계 (d); 비교결과 상기 각도의 크기가 상기 소정값보다 크거나 같다면, 갱신된 기준선과 직각을 이루며 영점을 지나는 선을 갱신된 분할선으로 설정하고 갱신된 분할선을 기준으로 하여 단계 (b), (c), (d) 를 반복하며, 비교결과 상기 각도의 크기가 상기 소정값보다 작다면 갱신된 기준선과 y축이 이루는 각도를 상기 이미지의 오리엔테이션으로 추정하는 단계 (e)를 수행하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 이미지 오리엔테이션 추정장치는, 상기 이미지는, 문자 이미지로서 임의의 각도로 기울어진 손글씨 또는 활자의 문자 또는 숫자 이미지이며, 상기 추정된 오리엔테이션의 반대방향으로 상기 문자 이미지를 회전하여 상기 문자 이미지를 표준화한다.
본 발명의 일 실시예에 따른 하나 이상의 프로세서를 포함하는 문자 인식 장치는, 상기 하나 이상의 프로세서는, 복수의 기준 문자 이미지를 입력하는 단계; 위(청구항 제1항)에 기재된 방법으로 상기 복수의 기준 문자 이미지의 오리엔테이션을 추정하는 단계; 상기 복수의 기준 문자 이미지의 각각의 추정된 오리엔테이션의 반대방향으로 상기 복수의 기준 문자 이미지를 회전시켜 표준화하는 단계; 상기 표준화된 복수의 기준 문자 이미지를 저장하는 기준 문자 이미지 데이터베이스를 생성하는 단계를 수행하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 문자 인식 장치는, 상기 하나 이상의 프로세서는, 임의의 오리엔테이션으로 기울어진 테스트 문자를 촬영하여 위(청구항 제1항)의 방법으로 오리엔테이션을 추정하고 위(청구항 제2항)의 방법으로 표준화한 후 위(청구항 제3항)의 방법으로 기준 문자 이미지 데이터베이스에 미리 저장된 기준 문자와 비교하여 가장 높은 매칭율을 가지는 기준 문자를 선택하여 테스트 문자를 인식하는 과정을 수행하는 것을 특징으로 한다.
본 발명에서 제안한 다양한 실시예에 따라 본발명은 분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 계산방법을 이용함으로써, 소량의 계산으로 신속하게 문자 이미지의 오리엔테이션을 계산할 수 있으며, 계산된 문자 오리엔테이션의 역 방향으로 문자 이미지를 회전시켜 표준화하고, 표준화된 문자 이미지를 표준화된 기준 문자 이미지들과 비교함으로써, 다양한 문자 이미지의 오리엔테이션에도 불구하고 높은 정확도의 문자 인식률을 갖는 문자 인식 장치를 제공한다.
도 1은 본 발명의 일 실시예에 따른 문자 이미지 오리엔테이션 추정 방법을 도시한 흐름도이다.
도 2는 본 발명이 일 실시예에 따른 문자 이미지 오리엔테이션 추정방법을 설명하기 위한 기준 문자 이미지 및 테스트 문자 이미지를 도시한다.
도 3은 본 발명의 일 실시예에 따라 분할선을 기준으로 테스트 문자 이미지를 상반부와 하반부로 나누고, 분할된 문자 이미지의 무게중심을 서로 잇는 선으로 기준선을 갱신하고, 갱신된 기준선과 갱신직전이 기준선이 이루는 각도를 계산하는 과정을 설명하기 위한 그래프이다.
도 4는 본 발명의 일 실시예에 따라 갱신된 분할선을 기준으로 문자 이미지를 분할하고, 무게중심을 계산하고, 기준선을 갱신하고, 갱신된 기준선과 갱신직전이 기준선이 이루는 각도를 계산하는 과정을 설명하기 위한 그래프이다.
도 5는 본 발명의 일 실시예에 따른 문자 이미지 오리엔테이션 추정방법을 이용하여 데이터베이스에 저장되어 있는 복수의 기준 문자 이미지들을 표준화하는 과정을 도시한 흐름도이다.
도 6은 본 발명의 일 실시예에 따른 문자 인식 방법을 도시한 흐름도이다.
도 7은 본 발명의 일 실시예에 따른 문자 인식 장치를 도시한 블럭도이다.
본 명세서에서 개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 개시에서 제안하고자 하는 실시예는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 당해 기술분야에서 통상의 지식을 가진 자에게 실시예들의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시예에 대해 구체적으로 설명하기로 한다.
본 명세서에서 사용되는 용어는 개시된 실시예들의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 명세서의 상세한 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 명세서의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.
아래에서는 첨부한 도면을 참고하여 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략한다.
도1 내지 도4를 참조하여 본 발명의 일 실시예에 따라 문자 이미지 오리엔테이션을 추정하는 방법을 설명한다. 본 발명에서 문자 이미지는 임의의 각도로 기울어진 손글씨 또는 활자의 문자 또는 숫자 이미지를 포함한다. 우선, 도 2의 (b)에 도시된 바와 같은 테스트 문자 이미지를 캡쳐하여 이미지 프로세서로 읽어들인다 (100). 도 3의 (a)에 도시된 바와 같이, 읽어들인 테스트 문자 이미지의 중심을 지나는 세로축과 가로축을 각각 기준선 (R0) 과 분할선 (P0)으로 하고, 이를 각각 y축과 x축으로 설정한다 (110).
읽어들인 테스트 문자 이미지를 분할선 (P0) 을 기준으로 상반부 문자 이미지 (I0 U)와 하반부 문자 이미지 (I0 L)로 분할한다 (120).
상반부 문자 이미지 (I0 U)의 무게중심 (Xc U, Yc U)과 하반부 문자 이미지 (I0 L)의 무게중심 (Xc L, Yc L)을 아래의 수식 (2) 내지 수식 (5)로부터 계산한다 (130).
Figure 112017091287504-pat00002
수식 (2)
Figure 112017091287504-pat00003
수식 (3)
Figure 112017091287504-pat00004
수식 (4)
Figure 112017091287504-pat00005
수식 (5)
여기서, N은 상반부 및 하반부 문자 이미지의 세로길이를 나타내며, M은 상반부 및 하반부 문자 이미지의 가로길이를 나타내며, I i U ( x , y ) 은 상반부 이미지 픽셀 (x,y)의 강도를 나타내고, I i L ( x , y ) 은 하반부 이미지 픽셀 (x,y)의 강도를 나타낸다.
상술한 바와 같이, 분할선 (P0) 을 기준으로 분할된 상반부 문자 이미지의 무게중심 (x c U , y c U ) 및 하반부 문자 이미지의 무게중심 (x c L , y c L ) 을 계산한 후, 도 3의 (b)에 도시된 바와 같이 2 개의 무게중심을 잇는 선을 긋고 이를 갱신된 기준선 (R1) 으로 설정한다 (140).
갱신된 기준선 (R1) 과 갱신직전의 기준선 (R0) 이 이루는 각을 아래의 수식 (6)에 따라 계산한다 (150).
Figure 112017091287504-pat00006
수식 (6)
수식 (6)에 따라 계산한 각도 (θ0)를 소정의 임계값 (Vth)와 비교하고 (160), 비교결과 θ0가 Vth보다 작다면, θ0를 테스트 문자 이미지의 오리엔테이션으로 추정한다 (170).
한편, θ0가 Vth보다 크거나 같다면, 갱신된 기준선 (R1)과 직각을 이루며 영점을 지나는 선으로 분할선을 갱신 (P1) 한다 (180). 갱신된 분할선 (P1) 을 기준으로 하여 테스트 문자 이미지를 분할한다 (120).
도 4의 (a)에 도시된 바와 같이, 갱신된 분할선 (P1) 과 갱신된 분할선을 기준으로 분할된 상반부 테스트 문자 이미지 ( I 1 U ) 및 하반부 테스트 문자 이미지 ( I 1 L )는 수식 (7), 수식 (8), 및 수식 (9)에 따라 계산된다.
P 1 ( x ) = -[( y c u - y c l ) / ( x c u - x c l )] -1 × x 수식 (7)
I1 U = {I(x,y) | y >= Pi (x)} 수식 (8)
I1 L = {I(x,y) | y < Pi (x)} 수식 (9)
갱신된 분할선 (P1) 을 기준으로 분할된 각각의 이미지에 대한 무게중심을 수식 (7)~(9) 및 (2)~(5)에 따라 계산한다 (130). 도 4의 (b)에 도시된 바와 같이, 계산된 2개의 무게중심을 잇는 선을 긋고 갱신된 기준선 (R2) 를 설정한다. (140)
갱신된 기준선 (R2) 과 y축이 이루는 각은 수식 (6)과 유사하게 수식 (10)에 따라 구해진다 (150).
Figure 112017091287504-pat00007
수식 (10)
한편, 도 4의 (c)에 도시된 바와 같이, 갱신된 기준선 (R2) 과 갱신직전의 기준선 (R1) 이 이루는 각도 Δθ(θ1 - θ0)는 수식 (10)과 수식 (6) 으로부터 계산할 수 있다.
갱신된 기준선 (R2) 과 갱신직전의 기준선 (R1) 이 이루는 각도 Δθ(θ1 - θ0)가 Vth보다 크거나 같다면 상술한 바와 같이 분할선을 갱신하는 단계부터 각도를 비교하는 단계까지의 절차를 반복한다.
한편, 갱신된 기준선 (Ri +1) 과 갱신직전의 기준선 (Ri) 이 이루는 각도 Δθ(θi - θi-1) 는 상술한 절차를 반복함에 따라 빠르게 0에 접근한다. 본 발명에서는 상술한 각도와 비교되는 소정값 (Vth) 을 적절히 설정함으로써, 반복처리의 회수를 조절 또는 감소시킬 수 있으며, 그만큼 문자 이미지 오리엔테이션의 계산에 소요되는 시간과 에너지를 감소시킬 수 있다.
한편, 갱신된 기준선 (R2 또는 Ri +1) 과 갱신직전의 기준선 (R1 또는 Ri) 이 이루는 각도 Δθ(θ1 - θ0 또는 θi - θi-1)가 Vth보다 작다면, θ1 또는 θi 를 테스트 문자 이미지의 오리엔테이션으로 추정한다 (170).
이와 같은 본 발명의 이미지 오리엔테이션 추정 방법에 의하면, 간단한 선형 계산량을 갖는 이미지분할 무게중심 계산 방식을 활용하므로, 고계산량의 허프변환이나 엣지검출 등의 기존 기술 보다 훨씬 빠른 속도와 보다 높은 정확도로 이미지 오리엔테이션을 추정할 수 있게 된다.
도 5는 본 발명의 일 실시예에 따른 문자 이미지 오리엔테이션 추정방법을 이용하여 데이터베이스에 저장되어 있는 복수의 기준 문자 이미지들을 표준화하는 과정을 도시한 흐름도이며 이하에서는 도 5를 참조하여 표준화 과정을 설명한다.
본 발명에서 문자 이미지의 표준화는 "임의의 각도로 회전 되어진 카메라로 문자 이미지를 촬영할 경우 각 문자의 형태특성에 따라서 결정되는 기준선에 맞게 해당 문자 이미지의 회전각을 제거하여 카메라 회전각에 무관한 문자 이미지로 정형화(표준화)하는 것"을 의미한다. 본 발명의 문자 인식의 방법은 "기준 문자 이미지도 회전각을 제거하는 표준화 작업을 한 후 데이터베이스에 저장하고, 테스트 문자 이미지도 회전각을 제거하는 표준화 작업을 하여 데이터베이스 내 모든 기준 문자들과 매칭 작업을 함으로써 최대 매칭율의 기준 문자를 찾는 방법이다.
우선, 데이터베이스에 저장되어 있는 복수의 기준 문자 이미지중 하나의 기준 문자 이미지를 읽어들인다 (200). 본 발명에 따른 문자 이미지 오리엔테이션 추정방법에 따라 기준 문자 이미지의 오리엔테이션을 추정한다 (210).
추정된 오리엔테이션의 반대 방향으로 기준 문자 이미지를 회전시켜서 표준화 한다 (220). 회전된 기준 문자 이미지를 데이터베이스에 저장한다 (230). 데이터베이스에 저장되어 있는 모든 기준 문자 이미지에 대하여 상술한 과정을 반복한다 (240). 이상으로 표준화 과정을 종료한다.
도 6은 본 발명의 일 실시예에 따른 문자 인식 방법을 도시한 흐름도이며 도 7은 본 발명의 일 실시예에 따른 문자 인식 장치를 도시한 블럭도이다. 이하에서는 도 6 및 도 7을 참조하여 문자 인식 방법을 기술한다.
우선, 촬상장치 (400) 에 의하여 테스트 문자 이미지를 촬상한다 (300). 촬상된 테스트 문자 이미지를 프로세서 (500)가 읽어들인후 프로세서 (500)는 테스트 문자 이미지의 오리엔테이션을 추정한다 (310). 프로세서 (500) 는 추정된 오리엔테이션의 반대 방향으로 테스트 문자 이미지를 회전시켜서 표준화한다 (320). 프로세서 (500) 는 표준화된 테스트 문자 이미지와 데이터베이스 (600) 에 저장되어 있는 표준화된 기준 문자 이미지를 매칭한다. (330). 프로세서 (500)는 매칭 결과에 따라 테스트 문자 이미지가 나타내는 문자를 인식한다 (340).
이상 도 1 내지 도 6을 참조하여 본 발명의 여러 실시예를 설명하였으나, 본 발명은 이러한 실시예에 한정되지 않으며, 다양하게 변형될 수 있다.
400 촬상장치
500 프로세서
600 데이터베이스

Claims (8)

  1. 촬상된 이미지의 중심을 지나는 세로축과 가로축을 각각 기준선과 분할선으로 하고, 기준선과 분할선을 각각 y축과 x축으로 설정하는 단계 (a);
    분할선을 기준으로 한 이미지의 상반부의 무게중심과 하반부의 무게중심을 계산하는 단계 (b);
    상기 상반부의 무게중심과 상기 하반부의 무게중심을 잇는 선을 갱신된 기준선으로 설정하고 갱신된 기준선과 갱신직전의 기준선이 이루는 각도의 크기와 방향을 결정하는 단계 (c);
    상기 각도의 크기와 소정의 임계값을 비교하는 단계 (d);
    비교결과 상기 각도의 크기가 상기 소정의 임계값보다 크거나 같다면, 갱신된 기준선과 직각을 이루며 영점을 지나는 선을 갱신된 분할선으로 설정하고 갱신된 분할선을 기준으로 하여 단계 (b), (c), (d) 를 반복하며,
    비교결과 상기 각도의 크기가 상기 소정의 임계값보다 작다면 갱신된 기준선과 y축이 이루는 각도를 상기 이미지의 오리엔테이션으로 추정하는 단계 (e)를 포함하는 것을 특징으로 하는 이미지 오리엔테이션 추정방법.
  2. 제1항에 있어서,
    상기 이미지는, 문자 이미지로서 임의의 각도로 기울어진 손글씨 또는 활자의 문자 또는 숫자 이미지이며,
    상기 추정된 오리엔테이션의 반대방향으로 상기 문자 이미지를 회전하여 상기 문자 이미지를 표준화하는, 이미지 오리엔테이션 추정방법.
  3. 복수의 기준 문자 이미지를 입력하는 단계;
    제1항에 기재된 방법으로 상기 복수의 기준 문자 이미지의 오리엔테이션을 추정하는 단계;
    상기 복수의 기준 문자 이미지의 각각의 추정된 오리엔테이션의 반대방향으로 상기 복수의 기준 문자 이미지를 회전시켜 표준화하는 단계;
    상기 표준화된 복수의 기준 문자 이미지를 저장하는 기준 문자 이미지 데이터베이스를 생성하는 단계를 포함하는, 문자 인식 방법.
  4. 임의의 오리엔테이션으로 기울어진 테스트 문자를 촬영하여 제1항의 방법으로 오리엔테이션을 추정하고 제2항의 방법으로 표준화한 후 제3항의 방법으로 기준 문자 이미지 데이터베이스에 미리 저장된 기준 문자와 비교하여 가장 높은 매칭율을 가지는 기준 문자를 선택하여 테스트 문자를 인식하는, 문자 인식 방법.
  5. 하나 이상의 프로세서를 포함하는 이미지 오리엔테이션 추정 장치에 있어서,
    상기 하나 이상의 프로세서는,
    촬상된 이미지의 중심을 지나는 세로축과 가로축을 각각 기준선과 분할선으로 하고, 기준선과 분할선을 각각 y축과 x축으로 설정하는 단계 (a);
    분할선을 기준으로 한 이미지의 상반부의 무게중심과 하반부의 무게중심을 계산하는 단계 (b);
    상기 상반부의 무게중심과 상기 하반부의 무게중심을 잇는 선을 갱신된 기준선으로 설정하고 갱신된 기준선과 갱신직전의 기준선이 이루는 각도의 크기와 방향을 결정하는 단계 (c);
    상기 각도의 크기와 소정의 임계값을 비교하는 단계 (d);
    비교결과 상기 각도의 크기가 상기 소정의 임계값보다 크거나 같다면, 갱신된 기준선과 직각을 이루며 영점을 지나는 선을 갱신된 분할선으로 설정하고 갱신된 분할선을 기준으로 하여 단계 (b), (c), (d) 를 반복하며,
    비교결과 상기 각도의 크기가 상기 소정의 임계값보다 작다면 갱신된 기준선과 y축이 이루는 각도를 상기 이미지의 오리엔테이션으로 추정하는 단계 (e)를 수행하는 것을 특징으로 하는 이미지 오리엔테이션 추정장치.
  6. 제5항에 있어서,
    상기 이미지는, 문자 이미지로서 임의의 각도로 기울어진 손글씨 또는 활자의 문자 또는 숫자 이미지이며,
    상기 추정된 오리엔테이션의 반대방향으로 상기 문자 이미지를 회전하여 상기 문자 이미지를 표준화하는, 이미지 오리엔테이션 추정장치.
  7. 하나 이상의 프로세서를 포함하는 문자 인식 장치에 있어서,
    상기 하나 이상의 프로세서는,
    복수의 기준 문자 이미지를 입력하는 단계;
    제1항에 기재된 방법으로 상기 복수의 기준 문자 이미지의 오리엔테이션을 추정하는 단계;
    상기 복수의 기준 문자 이미지의 각각의 추정된 오리엔테이션의 반대방향으로 상기 복수의 기준 문자 이미지를 회전시켜 표준화하는 단계;
    상기 표준화된 복수의 기준 문자 이미지를 저장하는 기준 문자 이미지 데이터베이스를 생성하는 단계를 수행하는 것을 특징으로 하는 문자 인식 장치.
  8. 제7항에 있어서,
    상기 하나 이상의 프로세서는,
    임의의 오리엔테이션으로 기울어진 테스트 문자를 촬영하여 제1항의 방법으로 오리엔테이션을 추정하고 제2항의 방법으로 표준화한 후 제3항의 방법으로 기준 문자 이미지 데이터베이스에 미리 저장된 기준 문자와 비교하여 가장 높은 매칭율을 가지는 기준 문자를 선택하여 테스트 문자를 인식하는 과정을 수행하는 것을 특징으로 하는 문자 인식 장치.

KR1020170120530A 2017-09-19 2017-09-19 분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 추정방법 및 이를 이용한 문자 인식 장치와 문자 인식 방법 KR101900903B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170120530A KR101900903B1 (ko) 2017-09-19 2017-09-19 분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 추정방법 및 이를 이용한 문자 인식 장치와 문자 인식 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170120530A KR101900903B1 (ko) 2017-09-19 2017-09-19 분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 추정방법 및 이를 이용한 문자 인식 장치와 문자 인식 방법

Publications (1)

Publication Number Publication Date
KR101900903B1 true KR101900903B1 (ko) 2018-11-02

Family

ID=64328760

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170120530A KR101900903B1 (ko) 2017-09-19 2017-09-19 분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 추정방법 및 이를 이용한 문자 인식 장치와 문자 인식 방법

Country Status (1)

Country Link
KR (1) KR101900903B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102125056B1 (ko) 2019-03-26 2020-06-19 부산대학교 산학협력단 혼합문자 자동인식을 위한 문자 및 서적 생성 시스템 및 방법 그리고 이를 이용한 검색 시스템 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101725501B1 (ko) 2016-07-13 2017-04-13 한동대학교 산학협력단 문자 인식 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101725501B1 (ko) 2016-07-13 2017-04-13 한동대학교 산학협력단 문자 인식 방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102125056B1 (ko) 2019-03-26 2020-06-19 부산대학교 산학협력단 혼합문자 자동인식을 위한 문자 및 서적 생성 시스템 및 방법 그리고 이를 이용한 검색 시스템 및 방법

Similar Documents

Publication Publication Date Title
US9881204B2 (en) Method for determining authenticity of a three-dimensional object
CN108230383B (zh) 手部三维数据确定方法、装置及电子设备
CN111862296B (zh) 三维重建方法及装置、系统、模型训练方法、存储介质
CN106530347B (zh) 一种稳定的高性能圆特征检测方法
US20210342990A1 (en) Image coordinate system transformation method and apparatus, device, and storage medium
US10366307B2 (en) Coarse-to-fine search method, image processing device and recording medium
CN109410316B (zh) 物体的三维重建的方法、跟踪方法、相关装置及存储介质
CN108229475B (zh) 车辆跟踪方法、系统、计算机设备及可读存储介质
JP5166102B2 (ja) 画像処理装置及びその方法
JP4865517B2 (ja) 頭部の位置・姿勢検出装置
EP3502958B1 (en) Object recognition processing apparatus, object recognition processing method, and program
SE528068C2 (sv) Igenkänning av 3D föremål
CN108345821B (zh) 面部追踪方法及设备
KR102649930B1 (ko) 비전 시스템을 갖는 이미지에서 패턴을 찾고 분류하기 위한 시스템 및 방법
JP6071002B2 (ja) 信頼度取得装置、信頼度取得方法および信頼度取得プログラム
CN112200056B (zh) 人脸活体检测方法、装置、电子设备及存储介质
EP3198522A1 (en) A face pose rectification method and apparatus
WO2014112346A1 (ja) 特徴点位置検出装置、特徴点位置検出方法および特徴点位置検出プログラム
US9858471B2 (en) Identification apparatus and authentication system
Dey A contour based procedure for face detection and tracking from video
CN111539352A (zh) 一种判断人体关节运动方向的方法及系统
CN107292910B (zh) 一种基于像素建模的移动相机下运动目标检测方法
KR101900903B1 (ko) 분할된 이미지의 무게중심에 기반한 이미지 오리엔테이션 추정방법 및 이를 이용한 문자 인식 장치와 문자 인식 방법
KR100691855B1 (ko) 영상정보의 특징 추출장치 및 그 방법
CN106406507B (zh) 图像处理方法以及电子设备

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant