KR100822326B1 - 고속처리가 가능한 문자인식 장치 및 그 방법 - Google Patents

고속처리가 가능한 문자인식 장치 및 그 방법 Download PDF

Info

Publication number
KR100822326B1
KR100822326B1 KR1020060086598A KR20060086598A KR100822326B1 KR 100822326 B1 KR100822326 B1 KR 100822326B1 KR 1020060086598 A KR1020060086598 A KR 1020060086598A KR 20060086598 A KR20060086598 A KR 20060086598A KR 100822326 B1 KR100822326 B1 KR 100822326B1
Authority
KR
South Korea
Prior art keywords
character
histogram
unit
angle
character recognition
Prior art date
Application number
KR1020060086598A
Other languages
English (en)
Other versions
KR20080022854A (ko
Inventor
김종운
Original Assignee
김종운
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김종운 filed Critical 김종운
Priority to KR1020060086598A priority Critical patent/KR100822326B1/ko
Publication of KR20080022854A publication Critical patent/KR20080022854A/ko
Application granted granted Critical
Publication of KR100822326B1 publication Critical patent/KR100822326B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/203Drawing of straight lines or curves

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

본 발명은 고속처리가 가능한 문자인식 장치 및 그 방법에 관한 것이다.
이를 실현하기 위하여 본 발명은, 문자인식 장치에 있어서, 문자화상을 광학상으로 판독하여 바이너리 이미지로 전환하는 문자화상입력부; 상기 문자화상에 대한 히스토그램의 갯수 및 각도를 선택할 수 있는 메뉴 항목을 구비한 인터페이스부; 모든 문자에 대한 모든 각도의 히스토그램 정보를 제공하는 참조데이터부; 상기 바이너리 이미지의 수직방향 히스토그램을 참조하여 문자인식단위를 추출하는 문자추출유닛과, 상기 바이너리 이미지의 수평방향 히스토그램의 세로폭을 참조하여 상기 문자화상이 특정 위치로 고정되도록 조절하는 자동정렬유닛과, 상기 문자인식단위의 폰트를 조절하는 이미지스케일링 유닛과, 상기 인터페이스부를 통해 입력되는 히스토그램 갯수 및 각도 명령신호에 대응하여 상기 문자인식단위의 히스토그램을 작성하는 각도별분석유닛과, 상기 각도별분석유닛으로부터 전송된 상기 히스토그램과 상기 참조 데이터부의 히스토그램을 비교하여
Figure 112006064928784-pat00001
의 식으로 상기 비교결과값을 도출한 후 상기 비교결과값이 최소의 값으로 정해지는 문자를 결정하는 비교유닛을 포함하여 구성되는 제어부; 및 상기 비교유닛에 의해 결정된 비교결과값이 최소인 문자를 문자코드로 출력하는 출력부;로 구성되는 것을 특징으로 하는 문자인식 장치를 제공한다.
본 발명에 의하면, 문자인식 과정을 획기적으로 단순화시킴으로써 저속 프로세서 환경에서도 동작이 가능하고, 데이터를 고속으로 처리할 수 있는 문자인식 장치를 제공할 수 있는 효과가 있다.
문자인식, 히스토그램, 정밀도, 고속 처리

Description

고속처리가 가능한 문자인식 장치 및 그 방법{Apparatus and Method for High-speed Character Recognition }
도 1은 본 발명의 바람직한 실시예에 따른 문자인식 장치의 구성을 간략하게 나타낸 블럭도,
도 2는 본 발명에 적용되는 화상입력부의 동작을 설명하기 위한 도면,
도 3은 본 발명에 적용되는 문자추출유닛의 동작을 설명하기 위한 도면,
도 4는 본 발명에 적용되는 자동정렬유닛의 동작을 설명하기 위한 도면,
도 5는 본 발명에 적용되는 이미지스케일링유닛의 동작을 설명하기 위한 도면,
도 6은 본 발명에 적용되는 각도별분석유닛의 동작을 설명하기 위한 도면,
도 7a는 본 발명에 적용되는 참조데이터부의 히스토그램 저장 형태를 나타내는 예시도면,
도 7b는 도 7a의 참조데이터부에 저장된 히스토그램을 기준으로 보간법을 행하여 연속된 각도에서의 히스토그램을 산출한 데이터를 나타내는 예시도면,
도 7c는 도 7b의 데이터를 기준으로 3차원 공간의 참조데이터를 형성한 모습을 나타내는 예시도면,
도 8은 본 발명의 바람직한 실시예에 따라 고속으로 문자가 인식되는 과정을 설명하기 위한 순서도,
도 9a 및 도 9b는 본 발명인 문자인식 장치가 휴대폰에 적용된 경우의 예시 화면이다.
< 도면의 주요 부분에 대한 부호의 설명 >
1: 문자인식 장치 10: 화상입력부
20: 제어부 202: 문자추출유닛
204: 자동정렬유닛 206: 이미지스케일링유닛
208: 각도별분석유닛 210: 비교유닛
40: 출력부 50: 참조데이터부
본 발명은 고속처리가 가능한 문자인식 장치 및 그 방법에 관한 것이다. 더욱 상세하게는, 문자의 특징을 추출하고 참조데이터와 비교/분석하는 과정을 단순화시킴으로써 고속으로 문자인식 처리를 수행하고, 문자인식을 위한 처리 용량 및 제작 비용을 획기적으로 단순화시킨 문자인식 장치 및 그 방법에 관한 것이다.
패턴(Pattern)인식의 한 분야로 문자인식(Character Recognition)은 시각(Vision) 정보를 통하여 문자를 인식하고 의미를 이해(Understanding)하는 인간의 능력을 컴퓨터(Computer)로 실현하려는 것으로 광학 문자 인식(Optical Character Recognition), 우편물 자동 분류, 문서인식, 도면인식 등의 분야에서 부 분적으로 실용화가 이루어지고 있다.
또한, 최근에는 인공지능(Artificial Intelligence)의 최신 기법인 신경망(Neural Network), 퍼지(Fuzzy), 유전 알고리즘(Genetic Algorithm) 등의 응용과 자연어처리(Natural Language Processing), 심리학, 생리학, 인지과학(Cognitive Science) 등 관련 학문과의 접목에 의해 문자인식 기술은 새로운 단계에 접어들고 있다.
한편, 앞서 언급한 종래의 문자인식 방법들을 사용하여 만족할 만한 결과(높은 인식률)를 얻기 위해서는 복잡한 시스템 구성(즉, 통계, 미적분, 벡터분석, 인공지능과 관련된 사전 시스템 학습, 기타 등등)을 요구하게 된다.
그러나, 이러한 복잡한 시스템 구성은 문자인식 장치를 보편화하고, 소형화하는데 장애로 작용하는 문제점이 있었다.
또한, 그 복잡성에 의해 최종적으로 한 문자를 인식하기까지 많은 시간이 소요되게 되며, 그 시스템의 제작에 많은 비용이 투여될 수밖에 없는 근본적인 문제점이 있었다.
상기한 문제점을 해결하기 위해 본 발명은, 문자입력에서 최종 문자인식까지 소요되는 시간을 획기적으로 감소시키는 문자인식 장치 및 그 방법을 제공하는 것을 목적으로 한다.
또한, 휴대용 전자기기에 사용되는 저속 프로세서에 의해서도 문자인식이 가능하도록 하고, 이에 의해 제작비용을 감소시켜 대중화를 실현토록 하는 상용형 문 자 인식 장치 및 그 방법을 제공하는 것을 다른 목적으로 한다.
이러한 목적을 달성하기 위해 본 발명은, 문자인식 장치에 있어서,
문자화상을 광학상으로 판독하여 바이너리 이미지로 전환하는 문자화상입력부;
상기 문자화상에 대한 히스토그램의 갯수 및 각도를 선택할 수 있는 메뉴 항목을 구비한 인터페이스부;
모든 문자에 대한 모든 각도의 히스토그램 정보를 제공하는 참조데이터부;
상기 바이너리 이미지의 수직방향 히스토그램을 참조하여 문자인식단위를 추출하는 문자추출유닛과, 상기 바이너리 이미지의 수평방향 히스토그램의 세로폭을 참조하여 상기 문자화상이 특정 위치로 고정되도록 조절하는 자동정렬유닛과, 상기 문자인식단위의 폰트를 조절하는 이미지스케일링 유닛과, 상기 인터페이스부를 통해 입력되는 히스토그램 갯수 및 각도 명령신호에 대응하여 상기 문자인식단위의 히스토그램을 작성하는 각도별분석유닛과, 상기 각도별분석유닛으로부터 전송된 상기 히스토그램과 상기 참조 데이터부의 히스토그램을 비교하여
Figure 112006064928784-pat00002
의 식으로 상기 비교결과값을 도출한 후 상기 비교결과값이 최소의 값으로 정해지는 문자를 결정하는 비교유닛을 포함하여 구성되는 제어부; 및
상기 비교유닛에 의해 결정된 비교결과값이 최소인 문자를 문자코드로 출력 하는 출력부;로 구성되는 것을 특징으로 하는 문자인식 장치를 제공한다.
바람직한 실시예에 따라, 상기 인터페이스부는 상기
Figure 112006064928784-pat00003
식에서의 n값을 선택할 수 있는 메뉴항목을 더 포함하는 것으로 구성할 수 있다.
또한 발명의 제 2 목적을 달성하기 위해 본 발명은, 문자인식 방법에 있어서,
(a) 문자화상을 광학상으로 판독하여 바이너리 이미지로 전환하는 단계;
(b) 상기 바이너리 이미지에 대한 수평방향 및 수직방향의 히스토그램을 생성하는 단계;
(c) 상기 수평방향 히스토그램의 세로폭이 최소가 되는 위치로 상기 문자화상의 위치를 고정하는 단계;
(d) 상기 수직방향 히스토그램을 참조하여 문자인식단위를 추출하는 단계;
(e) 상기 문자인식단위의 폰트를 미리 지정한 특정 폰트 크기로 조정하는 단계;
(f) 상기 문자인식단위에 대해 특정 각도별로 히스토그램을 작성하는 단계;
(g) 상기 (f) 단계에서 작성된 히스토그램과 참조데이터로 제공되는 히스토그램을 비교하여
Figure 112006064928784-pat00004
의 식으로 상기 비교결과값을 도출하는 단계;
(h) 상기 비교결과값이 최소의 값으로 정해지는 문자를 상기 문자화상에 대 한 대응 문자로 결정하는 단계; 및
(i) 상기 대응 문자를 문자코드로 출력하는 단계;로 구성되는 것을 특징으로 하는 문자인식 방법을 제공한다.
바람직한 실시예에 따라, 상기 (f) 단계에서의 상기 특정 각도는 문서인식 장치에 미리 세팅(setting)된 특정 분석 각도이거나, 사용자 인터페이스를 통해 지정된 특정 분석 각도인 것으로 구성할 수 있다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1은 본 발명의 바람직한 실시예에 따른 문서인식 장치의 구성을 간략하게 나타낸 블럭도이다.
본 발명의 바람직한 실시예에 따른 문서인식 장치(1)는 크게 문자화상을 전기신호로 전환하는 화상입력부(10);와 상기 전기신호에 대한 히스토그램을 생성하고 참조데이터의 히스토그램과 비교 분석하는 절차를 수행함으로써, 상기 문자화상에 가장 근접한 대응문자를 결정하는 제어부(20);와 상기 제어부에 대한 각종 조건값을 설정하는 수단인 인터페이스부(30);와 상기 결정된 대응문자를 문자코드로 출력하는 출력부(40);로 구성된다.
또한, 본 발명의 문서인식 장치(1)에 적용되는 제어부(20)는 그 세부 구성요소로서, 상기 전기신호로 전환된 문자화상의 문자인식단위를 추출하는 문자추출유닛(202);과, 상기 문자화상이 특정 위치에 고정되도록 조절하는 자동정렬유닛(204);과, 상기 문자인식단위의 폰트를 조절하는 이미지스케일링유닛(206);과, 상기 인터페이스부를 통해 입력되는 히스토그램 갯수 및 각도 결정 명령신호에 대응하여 상기 문자인식단위의 히스토그램을 작성하는 각도별분석유닛(208);과, 상기 각도별분석유닛으로부터 전송된 상기 히스토그램과 상기 참조 데이터부의 히스토그램을 비교하여
Figure 112006064928784-pat00005
의 식으로 상기 비교결과값을 도출한 후 상기 비교결과값이 최소의 값으로 정해지는 문자를 결정하는 비교유닛(210);을 포함하여 구성한다.
화상입력부(10)는 문서에 기재되어 있는 문자화상을 화소(pixel) 단위로 판독하고, 전기신호로 변환시킨다. 바람직한 실시예로서, 상기 화상입력부(10)는 스캐너 또는 이동통신 단말기를 포함하는 각종 전자기기에 부착되는 CCD 카메라일 수 있다.
도 2를 참조하면, 여기서 전기신호로 변환한다는 것은 아날로그 데이터인 상기 문자화상을 디지털 데이터인 1과 0의 조합으로 바꾸는 것을 의미한다. 예컨대, 화상 입력부(10)는 입력된 문자화상에 대한 특정 화소(Pixel)값이 사용자가 정의한 특정 역치(Threshold) 이하이면 숫자 0으로 바꾸어주고, 특정 역치 이상이면 숫자 1로 바꾸어주는 동작을 수행한다.
한편, 본 발명에서는 상기 문자화상에 대한 전기신호로 나열된 1과 0의 조합을 바이너리 이미지(Binary Image)라고 정의한다.
도 3을 참조하면, 문자추출유닛(202)은 상기 바이너리 이미지 여백의 끝점과 시작점을 인식하는 방법으로 문자인식단위를 결정함으로써, 상기 문자화상에서 문자 부분만을 추출하는 동작을 수행한다.
이러한 동작에 의해 하나의 문자를 포함하는 최소의 영역을 찾아냄과 동시에 문자 주위에 있을 수 있는 노이즈(Noise)를 제거하게 된다.
자동정렬유닛(204)은 상기 바이너리 이미지로부터 생성된 수평방향 히스토그램의 세로폭을 참조하여 상기 세로폭이 최소가 되는 각도를 찾아내고, 상기 문자화상을 상기 최소가 되는 각도로 회전시켜 화상입력부(10)의 전면에 정렬시키는 기능을 수행한다.
도4를 참조하여 자동정렬유닛의 동작에 대해 구체적으로 설명한다.
인식 대상 문서와 화상입력부(10)간에 회전 성분없이 완전하게 정열되었을 때 수평방향 히스토그램의 세로폭은 최소가 된다(도4A). 즉, 완전한 정열에서의 수평방향 히스토그램은 회전 성분이 있는 문서 화상에서 얻어지는 히스토그램보다 세로폭이 더 작다.
따라서, 본 발명인 문서인식 장치(1)는 자동정렬유닛(204)을 이용하여, 불완전 정렬된 문서화상(도4B)의 회전성분(문서화상이 얼마의 각도로 회전되어 입력는지)을 자동으로 인식한 후, 상기 회전성분만큼 문서화상을 역방향 회전시키는 동작을 수행함으로써 문서화상과 화상입력부(10)가 완전한 정열(도4A) 형태로 대향되도 록 하는 동작을 수행한다.
도5를 참조하면, 이미지스케일링유닛(206)은 문자추출유닛(202)으로부터 추출된 문자인식단위의 폰트 크기가 참조데이터에 저장된 기준 문자의 폰트 크기와 차이가 나는지 여부를 판단하는 동작 및 상기 문자인식단위의 폰트 크기를 미리 정의된 상기 참조데이터의 폰트크기로 스케일 업(Scale Up) 또는 스케일 다운(Scale Down)하는 동작을 수행한다.
특히, 본 발명인 문자인식 장치(1)는 이미지스케일링유닛(206)을 적용함으로써 참조데이터에 저장되는 데이터의 양을 획기적으로 감소시키는 장점이 있다.
즉, 본 발명인 문자인식 장치(1)는 하나의 폰트 크기를 가진 각각의 기준 문자에 의해 참조데이터를 구성할 수 있으며, 이런 방식은 입력 문자와의 비교 대상이 되는 참조 데이터의 양을 감소시키기 때문에 문자입력에서 최종 문자의 인식까지 소요되는 시간을 획기적으로 줄이게 된다.
각도별분석유닛(208)은 문자추출유닛(202)으로부터 전송되는 문자인식단위에 대해 특정 각도별의 히스토그램을 만들어내는 동작을 수행한다.
히스토그램이란, 문자추출유닛(202)에 의해 결정된 문자인식단위의 세로폭과 가로폭의 범위내에서 각 화소열별로의 흑색 화소 수치(즉, 바이너리 이미지에서 각 방향의 합계)를 나타내는 그래프를 의미한다.
도6A 및 도6B는 각각 입력문자 "E"의 바이너리 이미지에 대한 가로합계(각도 0도)와 세로합계(각도 90도)를 히스토그램으로 표현한 예시도면이다.
이러한 가로분포와 세로분포는 문자 E만이 지닌 특징(The Uniqueness of Each Character)으로서, 도면에서는 단순히 수평방향과 수직방향의 히스토그램에 대해서만 나타내고 있으나, 다양한 각도에서 얻어지는 히스토그램에 의해 문자인식의 정확도를 높이는 실시예가 가능하다.
바람직한 실시예로서, 각도별분석유닛(208)은 미리 정해진 특정 각도에서의 히스토그램을 작성하거나, 인터페이스부(30)를 통해 사용자로부터 입력되는 각도 조건에 따라 히스토그램을 작성하는 것으로 구성할 수 있다.
예컨대, 각도별분석유닛(208)은 특정 바이너리 이미지에 대해, 가로합계(0도)의 히스토그램만을 작성하도록 지정되거나, 세로합계(90도)의 히스토그램만을 작성하도록 지정되거나 또는 대각선 방향(45도)의 히스토그램만을 작성하도록 지정될 수 있다. 또한, 상기 각각의 각도 중에 취합된 2개 이상의 각도에 대한 히스토그램만을 작성하도록 지정될 수 있다.
또한, 각도별분석유닛(208)은 사용자로부터 입력되는 각도 조건에 따라 히스토그램의 갯수를 증가 또는 감소시키는 동작을 수행한다. 즉, 고도의 정밀도를 필요로 하는 문자에 대해서는, 사용자가 인터페이스부(30)를 통해 다수 개수 각도의 히스토그램을 작성하도록 명령신호를 입력할 수 있다. 또한 정밀도를 필요로 하진 않지만 데이터의 고속 처리를 요구하는 문자에 대해서는, 사용자가 최소 개수 각도의 히스토그램을 작성하도록 명령신호를 입력할 수 있다. 따라서 본 발명인 문자인식 장치(1)에 의할 경우 문자인식의 정밀도와 데이터의 고속처리를 선택적으로 조절할 수 있는 장점이 있다.
비교유닛(210)은 각도별분석유닛(208)이 작성한 각도별 히스토그램 데이터와 참조데이터부(50)에 저장된 각 방향의 히스토그램 데이터를 비교 분석함으로써 입력된 문자화상과 가장 근접한 문자를 결정하는 동작을 수행한다.
[수학식1]
Figure 112006064928784-pat00006
m = 히스토그램 최대폭
n = 1,2,3.....
i = 히스토그램 인덱스
Ref = 참조데이터 히스토그램
Input = 입력문자(숫자) 히스토그램
본 발명에 적용되는 비교 분석 방법은 상기 [수학식1]을 적용하여 비교결과값을 도출한 후 상기 비교결과값이 최소의 값으로 정해지는 문자를 결정하는 방법을 사용한다.
상기 [수학식1]에 의해 상기 비교결과값을 계산하는 과정을 구체적으로 설명하면 다음과 같다.
먼저, 입력된 문자인식단위의 각도별 히스토그램을 참조데이터부(50)의 각도별 히스토그램과 뺄셈한다.
다음으로, 상기 뺄셈의 결과값에 n승을 해준다. 여기서 n값이 높을수록 비교결과값의 차이가 현저해 지면서 문자인식률이 높아지는 결과를 가져온다. 그러나 n 값이 너무 높게 지정되면 그만큼 계산되는 데이터 양이 많아지므로 처리속도가 감소되는 현상이 발생할 수 있다.
따라서, 사용자는 데이터 처리속도와 문자인식의 정밀도 특성을 고려하여 상기 n값을 적절한 값으로 지정할 필요가 있다.
다음으로, 비교유닛(210)은 히스토그램의 모든 인덱스에 따라 상기의 과정을 반복하여 그 합계(비교 결과값)를 계산한다.
다만, 전술한 과정은 하나의 각도(예컨대, 가로 방향 또는 세로 방향)에 대한 히스토그램을 비교 분석하여 비교 결과값을 산출하는 과정을 설명한 것이며, 사용자의 선택에 따라 또는 미리 정해진 조건에 따라, 각도별분석유닛(208)이 두개 방향(각도) 이상의 히스토그램을 작성한 경우에는 각 방향(각도)별 비교 결과값을 상기 [수학식1]을 이용하여 각각 계산한 후 그 결과값을 합산하는 과정이 더 추가된다.
각도별 정보를 증가시키면, 문자인식의 정밀도가 이에 비례하여 증가하는 대신에 데이터 처리속도가 떨어질 수 있음은 앞서 설명한 바와 같다.
비교유닛(210)은 비교결과값이 최소의 값으로 정해지는 문자를 인식된 문자로 결정한다.
본 발명의 비교유닛(210)에 적용되는, 문자의 특징을 비교 분석하기 위해 [수학식1]의 연산식을 이용하는 방법은 계산과정을 단순화시키면서, 적은 계산량으로 확률적으로 가장 근접한 문자를 찾아내도록 하는 방법이므로, 종래의 복잡한 문자 인식 방법과 비교하여 처리용량의 부담을 감소시키고, 비약적인 처리 속도의 개 선을 가져올 수 있다.
바람직할 실시예로서, 비교유닛(210)은 상기 [수학식1]의 연산식을 대체한 하기와 같은 연산식([수학식2], [수학식3]) 중 하나의 연산식을 사용하여 비교결과값을 도출하고, 그 비교결과값이 최소의 값으로 정해지는 문자를 인식된 문자로 결정하는 동작을 수행하는 것으로 구성할 수 있다.
[수학식2]
Figure 112006064928784-pat00007
[수학식3]
Figure 112006064928784-pat00008
다만, 상기 [수학식2,3]에 사용된 m, n, i, Ref, Input 변수는 상기 [수학식1]에서 정의한 변수와 동일하고, 그 계산 과정 또한 상기 [수학식1]과 동일하므로 이에 대한 자세한 설명은 생략하도록 한다.
한편, 제어부(20)에 포함되는 각 유닛(202, 204, 206, 208, 210)은 화상입력부(10), 참조데이터부(50) 및 출력부(40)의 동작을 제어하도록 구성된 프로그램이거나 상기 프로그램이 저장된 별도의 마이크로프로세서일 수 있다.
참조데이터부(50)는 일종의 데이터베이스로서, 인식을 요구하는 모든 종류의 문자 또는 숫자에 대한 모든 각도의 히스토그램을 제공한다.
참조데이터부(50)에 저장되는 히스토그램에 대해 도7a 및 도7b를 참조하여 상세히 설명한다.
먼저, 도7a를 참조하면, 본 발명에서 참조데이터부(50)는 각 문자에 대한 0도, 45도, 90도, 135도 각도에서의 히스토그램을 저장하고 있으며, 상기 저장된 히스토그램을 기준으로 하여 보간법(interpolation)을 실시함으로써 연속적인 모든 각도에서의 히스토그램을 참조데이터로 제공한다.
바람직한 실시예에 따라, 상기 보간법은 선형 보간법(Linear Interpolation) 또는 삼차 스플라인 보간법(Cubic Spline Interpolation)을 사용할 수 있다.
도7b는 임의의 특정문자에 대해 보간법을 적용함으로써 연속된 각도별로의 히스토그램을 도출한 자료의 예시도이다.
참조데이터부(50)는 상기 자료를 기준으로 상기 특정문자만의 고유 데이터인 3차원의 정보를 형성한다.
즉, 참조데이터부(50)는 제어부(20)로부터 출력 요청신호를 수신하기 전 상태에서 총4개의 히스토그램(0도, 45도, 90도, 135도 각도에서의 히스토그램)만을 메모리에 저장하고 있고(도7a), 상기 출력 요청신호를 수신한 경우 보간법을 통하여 연속된 각도별로의 히스토그램을 도출하며(도7b), 이에 의해 특정문자에 대한 고유 데이터인 3차원의 정보를 형성하므로(도7c), 많은 메모리 공간을 필요로 하지 않는다.
또한, 상기 히스토그램은 정수(Integer)들의 나열이기 때문에 공지 형태의 데이터 압축 기술을 적용할 경우, 참조데이터부가 필요로 하는 메모리 공간은 획기적으로 줄어들게 된다.
인터페이스부(30)는 제어부(20)에 대해 문자인식을 위한 각종 설정조건을 입력하기 위한 수단으로 제공되며, 출력부(40)는 비교유닛(210)이 상기 [수학식1]을 이용하여 계산 수행한 결과 결정한 문자(숫자를 포함)에 대응하는 문자코드(숫자코드를 포함)를 사용자가 요구하는 형태로 출력한다.
바람직한 실시예로서, 출력부(40)는 디스플레이장치이거나 자동화를 위한 시스템의 입력장치로 제공될 수 있다.
도8은 본 발명의 바람직한 실시예에 따라 [수학식1]을 이용하여 문자인식 처리하는 과정을 설명하기 위한 순서도이다.
본 발명의 실시예에 따라 간단한 계산과정으로 문자인식을 하기 위해서는 먼저, 참조데이터가 준비되어 있어야 한다(S802).
이를 위해 참조데이터부(50)는 모든 문자에 대한 총4개의 히스토그램(0도, 45도, 90도, 135도 각도에서의 히스토그램)을 저장하고 있으며, 제어부(20)로부터 출력 요청신호를 수신한 경우에는 보간법에 의해 연속된 각도별로의 히스토그램을 도출하여 문자인식을 위한 참조데이터로 제공한다.
다음, 사용자는 인터페이스부(30)가 제공하는 메뉴항목에 따라 문서인식 장치(1)의 정밀도를 조절한다(S804). 즉, 사용자는 인터페이스부(30)를 조작하여 히스토그램의 갯수 및 각도 그리고 [수학식1]에서의 n값을 지정한다. 이러한 방식에 의해 사용자는, 인식될 대상의 중요도 또는 문자의 특징에 따라, 정밀도 또는 데이 터 처리 속도를 효율적으로 조절할 수 있게 된다.
다음, 화상입력부(10)는 전면에 배치된 문자화상을 광학상으로 판독하여 바이너리 이미지로 전환시키고(S806), 제어부(20)는 상기 바이너리 이미지로부터 수평방향 및 수직방향의 히스토그램을 생성한다(S808).
다음, 자동정렬유닛(204)은 상기 수평방향 히스토그램의 세로폭이 최소가 되는 위치를 결정하여 상기 위치로 상기 문자화상을 재정렬시킨다(S810, S812). 이에 의해 상기 문자화상은 각도별분석유닛(208)이 상기 문자화상의 특징을 추출하기에 가장 적합한 배열에 위치된다.
다음, 문자추출유닛(202)은 상기 수직방향 히스토그램으로부터 문자인식단위를 추출한다(S814).
다음, 이미지스케일링유닛(206)은 상기 문자인식단위의 폰트를 참조데이터에 저장된 기준문자의 폰트 크기로 조정한다(S816, S818). 이에 의해 참조데이터부(50)는 하나의 폰트 크기의 기준문자만을 저장하면 되므로 메모리 용량을 줄일 수 있고, 또한 비교 대상 문자가 감소되어 데이터 처리 속도가 그만큼 향상된다.
다음, 각도별분석유닛(208)은 사용자로부터 설정조건으로 입력받은 갯수 및 각도에 대응하여 상기 문자인식단위에 대한 히스토그램을 생성한다(S820).
다음, 비교유닛(210)은 상기 각도별분석유닛(208)이 생성한 히스토그램 데이터 및 사용자로부터 설정조건으로 입력받은 n값을 적용하여 [수학식1]을 계산함으로써 최소의 비교결과값을 갖는 문자를 결정한다(S822).
다음, 출력부(40)는 상기 최소의 비교결과값으로 결정된 문자의 문자코드를 사용자가 요구하는 형태로 출력한다(S824).
도 9a 및 도 9b는 본 발명인 문자인식 장치가 휴대폰에 적용된 경우의 예시 화면이다.
도 9a의 A 영역은 입력된 문자화상이 디스플레이된 화면이고, B 영역은 상기 S802 내지 S808 단계 과정을 수행하여 상기 문자화상에 대한 수평방향 및 수직방향의 히스토그램이 생성된 화면이며, 상기 C 영역은 상기 S808 단계 후에, 상기 문자화상에 대한 문자인식단위를 추출하고(S814), 상기 문자인식단위에 대한 특정 방향의 히스토그램을 생성한 후(S820), 참조데이터와 비교/분석함으로써 각각의 문자를 인식한 상태를 보여주는 화면이다(S822, S824). 다만, 설명의 편의를 위해 상기 문자인식단위에 대한 스케일링 과정(S816, S818)은 생략하였다.
또한, 도 9b에서 보이는 메뉴 항목은 상기 S804 단계에서 설정되는 각도별분석유닛(208)의 설정 조건(히스토그램의 갯수 및 각도) 또는 [수학식1]에 대한 n값을 선택할 수 있는 메뉴항목이다.
즉, 사용자는 휴대폰의 키패드를 조정하여 메뉴2의 "Intensity Level Change" 항목을 선택함으로써 문자인식 장치의 정밀도를 선택할 수 있다. 예컨대, 상기 메뉴2는 각도별분석유닛(208)의 설정 조건을 "자동" 또는 "수동"으로 선택할 수 있는 메뉴 항목을 제공하고, 상기 "자동" 메뉴 항목은 그 하위 항목으로서 level1, level2...levelN 등의 둘 이상의 등급 분류로 정밀도를 선택할 수 있도록 하며, 상기 level1, level2...levelN 등의 등급 분류는 각도별분석유닛(208)의 조건(히스토그램의 갯수 및 각도) 또는 [수학식1]에 대한 n값을 적절히 조절하여 등 급이 높아질수록 정밀도도 이에 대응하여 높아지도록 설정하는 것으로 구성할 수 있다.
또한, 상기 "수동" 항목에 대한 하위 항목은, 상기 각도별분석유닛(208)이 분석하게 될 히스토그램의 갯수 및/또는 각도를 사용자가 직접 선택할 수 있는 메뉴 항목을 제공하는 것으로 구성할 수 있고, 또한, 상기 메뉴3의 "Recognition Process" 항목은 상기 메뉴2의 항목과 마찬가지로 상기 [수학식1]에 대한 n값에 따라 처리 속도를 선택할 수 있도록 등급 분류한 "자동" 항목 및 상기 n값을 직접 설정하여 처리속도를 조절하도록 하는 "수동" 항목으로 구성할 수 있다.
이상 살펴본 바와 같이 본 발명인 문자인식 장치 및 문자인식 방법은 단순한 계산방식에 의해 문자인식 절차를 수행하므로, 문자입력에서 최종 문자인식까지 소요되는 시간을 획기적으로 줄일 수 있다. 따라서, 본 발명인 문자인식 장치는 실시간으로 입력되는 정보(동영상, TV, CCTV, 라디오)에 대한 문자인식을 가능하게 한다.
또한, 본 발명에 적용되는 단순 계산 방식은 프로세서가 부담해야 하는 계산양을 획기적으로 감소시키므로, 휴대형 전자기기(휴대폰, PDA, 게임기 등) 등에 사용되는 저속 프로세서에 의해서도 충분히 문자인식 시스템을 구현할 수 있게 한다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아 니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
이상에서 설명한 바와 같이 본 발명에 의하면, 단순한 계산 방식에 의해 문자 인식 절차를 수행하므로, 저속 프로세서 및 저 용량 메모리 환경에서도 구현이 가능한 문자인식 장치를 제공할 수 있는 효과가 있다.
또한, 단순한 계산 방식에 의해 고속으로 데이터를 처리하는 것이 가능하므로 실시간 입력 문자를 처리할 수 있는 문자인식 장치를 제공할 수 있는 효과가 있다.
또한, 문자인식의 정밀도 또는 데이터 처리 속도를 문자의 특징에 따라 선택적으로 조절할 수 있는 문자인식 장치를 제공할 수 있는 효과가 있다.

Claims (5)

  1. 문자인식 장치에 있어서,
    문자화상을 광학상으로 판독하여 바이너리 이미지로 전환하는 문자화상입력부;
    상기 문자화상에 대한 히스토그램의 갯수 및 각도를 선택할 수 있는 메뉴 항목을 구비한 인터페이스부;
    임의의 문자에 대한 0도, 45도, 90도 및 135도 각도에서의 히스토그램 정보를 미리 저장하고 있고, 제어부로부터 참조데이터 출력 요청신호를 수신한 경우 보간법을 통해 상기 임의의 문자에 대한 연속된 각도별로의 히스토그램을 도출하여 제공하는 참조데이터부;
    상기 바이너리 이미지의 수직방향 히스토그램을 참조하여 문자인식단위를 추출하는 문자추출유닛과, 상기 바이너리 이미지의 수평방향 히스토그램의 세로폭을 참조하여 상기 문자화상이 특정 위치로 고정되도록 조절하는 자동정렬유닛과, 상기 문자인식단위의 폰트를 조절하는 이미지스케일링 유닛과, 상기 인터페이스부를 통해 입력되는 히스토그램 갯수 및 각도 명령신호에 대응하여 상기 문자인식단위의 히스토그램을 작성하는 각도별분석유닛과, 상기 각도별분석유닛으로부터 전송된 상기 히스토그램과 상기 참조 데이터부의 히스토그램을 비교하여
    Figure 112007085161495-pat00009
    의 식으로 상기 비교결과값을 도출한 후 상기 비교결과값이 최소의 값으로 정해지는 문자를 결정하는 비교유닛을 포함하여 구성되는 제어부; 및
    상기 비교유닛에 의해 결정된 비교결과값이 최소인 문자를 문자코드로 출력하는 출력부;
    로 구성되는 것을 특징으로 하는 문자인식 장치.
    (여기서, m = 히스토그램 최대폭, n = 1,2,3....., i = 히스토그램 인덱스, Ref = 참조데이터 히스토그램, Input = 입력문자(숫자) 히스토그램)
  2. 제 1 항에 있어서,
    상기 인터페이스부는 상기
    Figure 112006064928784-pat00010
    식에서의 상기 n값을 선택할 수 있는 메뉴항목을 더 포함하는 것을 특징으로 하는 문자인식 장치.
  3. 삭제
  4. 문자인식 방법에 있어서,
    (a) 문자화상을 광학상으로 판독하여 바이너리 이미지로 전환하는 단계;
    (b) 상기 바이너리 이미지에 대한 수평방향 및 수직방향의 히스토그램을 생 성하는 단계;
    (c) 상기 수평방향 히스토그램의 세로폭이 최소가 되는 위치로 상기 문자화상의 위치를 고정하는 단계;
    (d) 상기 수직방향 히스토그램을 참조하여 문자인식단위를 추출하는 단계;
    (e) 상기 문자인식단위의 폰트를 미리 지정한 특정 폰트 크기로 조정하는 단계;
    (f) 상기 문자인식단위에 대해 특정 각도별로 히스토그램을 작성하는 단계;
    (g) 상기 (f) 단계에서 작성된 히스토그램과 참조데이터로 제공되는 히스토그램을 비교하여
    Figure 112006064928784-pat00011
    의 식으로 상기 비교결과값을 도출하는 단계;
    (h) 상기 비교결과값이 최소의 값으로 정해지는 문자를 상기 문자화상에 대한 대응 문자로 결정하는 단계; 및
    (i) 상기 대응 문자를 문자코드로 출력하는 단계;
    로 구성되는 것을 특징으로 하는 문자인식 방법.
    (여기서, m = 히스토그램 최대폭, n = 1,2,3....., i = 히스토그램 인덱스, Ref = 참조데이터 히스토그램, Input = 입력문자(숫자) 히스토그램)
  5. 제 4 항에 있어서,
    상기 (f) 단계에서의 상기 특정 각도는 상기 문서인식 장치에 미리 세 팅(setting)된 각도이거나, 사용자 인터페이스를 통해 사용자로부터 입력되는 각도인 것을 특징으로 하는 문자인식 방법.
KR1020060086598A 2006-09-08 2006-09-08 고속처리가 가능한 문자인식 장치 및 그 방법 KR100822326B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060086598A KR100822326B1 (ko) 2006-09-08 2006-09-08 고속처리가 가능한 문자인식 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060086598A KR100822326B1 (ko) 2006-09-08 2006-09-08 고속처리가 가능한 문자인식 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20080022854A KR20080022854A (ko) 2008-03-12
KR100822326B1 true KR100822326B1 (ko) 2008-04-16

Family

ID=39396663

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060086598A KR100822326B1 (ko) 2006-09-08 2006-09-08 고속처리가 가능한 문자인식 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100822326B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102252286B1 (ko) * 2020-02-21 2021-05-14 주식회사 더방픽 이미지형 문서의 변화 감지 및 인식 장치 및 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2417558A4 (en) 2009-05-21 2012-12-05 Hewlett Packard Development Co GENERATING AN INDIVIDUAL GLYPHE, SYSTEM AND METHOD FOR INSPECTING INDIVIDUAL GLYPHIDS
KR102196110B1 (ko) * 2018-12-31 2020-12-29 주식회사 포스코아이씨티 광학 문자 판독 장치를 포함하는 로봇 프로세스 자동화 시스템
CN110516672A (zh) * 2019-08-29 2019-11-29 腾讯科技(深圳)有限公司 卡证信息识别方法、装置及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63106882A (ja) 1986-10-24 1988-05-11 Tokyo Keiki Co Ltd 活字文字認識装置の文字フオント決定方式
US4959870A (en) 1987-05-26 1990-09-25 Ricoh Company, Ltd. Character recognition apparatus having means for compressing feature data
JPH0894335A (ja) * 1994-09-22 1996-04-12 Kawasaki Steel Corp 画像処理検品装置
KR980000876A (ko) * 1996-06-13 1998-03-30 남일 생산성이 향상되는 공기입 타이어용 사이드월 조립체의 제조방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63106882A (ja) 1986-10-24 1988-05-11 Tokyo Keiki Co Ltd 活字文字認識装置の文字フオント決定方式
US4959870A (en) 1987-05-26 1990-09-25 Ricoh Company, Ltd. Character recognition apparatus having means for compressing feature data
JPH0894335A (ja) * 1994-09-22 1996-04-12 Kawasaki Steel Corp 画像処理検品装置
KR980000876A (ko) * 1996-06-13 1998-03-30 남일 생산성이 향상되는 공기입 타이어용 사이드월 조립체의 제조방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102252286B1 (ko) * 2020-02-21 2021-05-14 주식회사 더방픽 이미지형 문서의 변화 감지 및 인식 장치 및 방법

Also Published As

Publication number Publication date
KR20080022854A (ko) 2008-03-12

Similar Documents

Publication Publication Date Title
CN108681743B (zh) 图像对象识别方法和装置、存储介质
KR102385463B1 (ko) 얼굴 특징 추출 모델 학습 방법, 얼굴 특징 추출 방법, 장치, 디바이스 및 저장 매체
Lahiani et al. Real time hand gesture recognition system for android devices
US6347156B1 (en) Device, method and storage medium for recognizing a document image
KR100886407B1 (ko) 정보 처리 장치 및 그 제어방법
US8620024B2 (en) System and method for dynamic gesture recognition using geometric classification
US7787693B2 (en) Text detection on mobile communications devices
CN112784810B (zh) 手势识别方法、装置、计算机设备和存储介质
CN109815881A (zh) 行为识别模型的训练方法、行为识别方法、装置及设备
CN106648078B (zh) 应用于智能机器人的多模态交互方法及系统
CN109215131B (zh) 虚拟人脸的驱动方法及装置
JP5578816B2 (ja) 画像処理装置
KR102466394B1 (ko) 무배경 이미지의 생성 방법, 장치, 기기 및 매체
KR100822326B1 (ko) 고속처리가 가능한 문자인식 장치 및 그 방법
US12001613B2 (en) Methods and systems for hand gesture-based control of a device
JP7176616B2 (ja) 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム
EP0471472B1 (en) Image processing method and apparatus therefor
JP5051671B2 (ja) 情報処理装置、情報処理方法およびプログラム
EP1246129B1 (en) Method of and apparatus for searching corresponding points between images, and computer program
KR101515845B1 (ko) 동작 인식 방법 및 동작 인식 장치
CN111144374A (zh) 人脸表情识别方法及装置、存储介质和电子设备
CN114549809A (zh) 手势识别方法以及相关设备
KR20230076644A (ko) 경량화된 자세 추정 모델 제공 장치 및 방법
CN114399768A (zh) 基于Tesseract-OCR引擎的工件产品序列号识别方法、装置及系统
CN113808014A (zh) 基于动态能量调整的图像缩放方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120330

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130215

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee