KR20090058914A - 문자 인식 방법 - Google Patents

문자 인식 방법 Download PDF

Info

Publication number
KR20090058914A
KR20090058914A KR1020070125717A KR20070125717A KR20090058914A KR 20090058914 A KR20090058914 A KR 20090058914A KR 1020070125717 A KR1020070125717 A KR 1020070125717A KR 20070125717 A KR20070125717 A KR 20070125717A KR 20090058914 A KR20090058914 A KR 20090058914A
Authority
KR
South Korea
Prior art keywords
character
line
lines
word
area
Prior art date
Application number
KR1020070125717A
Other languages
English (en)
Other versions
KR100926823B1 (ko
Inventor
황병익
Original Assignee
황병익
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 황병익 filed Critical 황병익
Priority to KR1020070125717A priority Critical patent/KR100926823B1/ko
Publication of KR20090058914A publication Critical patent/KR20090058914A/ko
Application granted granted Critical
Publication of KR100926823B1 publication Critical patent/KR100926823B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/421Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)

Abstract

문자 인식 방법이 개시된다. 상기 문자 인식 방법은 문자가 포함된 인식 대상을 스캔하는 단계, 상기 인식 대상에서 상기 문자 영역을 추출하는 단계, 상기 문자 영역을 관통하는 임의의 복수개의 라인을 선정하는 단계, 상기 라인의 이미지 데이터를 획득하는 단계 및 데이터베이스에서 상기 이미지 데이터에 대응되는 문자정보를 검색하여 선택하는 단계를 포함한다. 따라서, 문자에 대한 인식을 위한 연산 알고리즘을 단순화하여 문자를 인식하기 위해 상대적으로 단순한 연산을 시행할 수 있는 효과가 있다.
문자 인식, 라인, 데이터 베이스

Description

문자 인식 방법{RECOGNITION METHOD OF CHARACTER}
본 발명은 문자 인식 방법에 관한 것으로, 보다 상세하게는 인식 대상이 되는 문자영역에 대해 상기 문자 영역을 관통하는 복수 개의 라인을 선정하여 이로부터 획득되는 이미지 데이터를 데이터 베이스와 비교하여 문자 정보를 선택하는 문자 인식 방법에 관한 것이다.
오늘날 휴대 단말기의 발달과 함께 휴대 단말기를 이용한 여러가지 정보 통신 기술들도 함께 발달해 왔다. 이러한 휴대 단말기의 기능은 카메라, MP3 플레이어, 만보기 등 여러 기능들을 구비하고 있으나, 이 중 교육과 관계된 문자 인식에 대한 관심이 증가하고 있다.
일반적으로 문자의 인식을 구현함에 있어서, 문자의 자획정보를 이용한 인식방법을 설계하기 위하여 문자의 자획의 특징을 추출해야 되는 것으로 문자인식의 접근방식에 따라서 통계적 방식과 구조적 방식으로 대별된다.
통계적 방식에 의한 문자 인식방법은 통상적으로 문자의 자소를 구성하는 특성이 각기 상이한 자획 성분을 추출하지 않고, 메쉬(mesh)라고 불리우는 격자모양의 방(window)을 인식한 문자에 씌우고, 각각의 메쉬내에 있는 문자의 흑화소의 수 를 계산하여 그 메쉬의 특징값으로 지역하며, 각각의 메쉬의 특징값을 그 문자의 특징량으로 하여 기준데이타와 비교 및 유사도가 가장 큰 문자를 입력문자로 인식하는 것이다.
구조적 방식에 의한 인식방법은 통상적으로 문자의 자획정보를 이용하여 인식하는 것으로서 문자의 자획정보를 추출하는 방법으로는 인식할 입력문자를 세선화하고, 세선화환 영상에서 미리 정의된 방향코드를 추출하여 특정방향의 방향 성분만을 선택하는 방법을 사용하고 있다.
이러한 일반적인 방법을 이용하지 않고 자획을 추출하는 방법 즉, 입력문자의 세선화 과정을 수행함이 없이 자획을 추출하는 방법으로는 런 랭스(run-length) 기법과, LAG(Line Adjacenct Graph) 기법을 이용한 런 랭스/LAG기법이 있다.
상기 런 랭스/LAG기법은 널리 알려진 런 랭스 기법을 이용하는 것으로서 영상을 주사하는 동안에 연속적으로 나타나는 흑화소를 런(run)이라고 하고, 런의 크기 즉, 흑화소의 수를 런 랭스라고 한다.
LAG기법은 런 랭스 기법에 의하여 추출된 수평선상의 각각의 런들에 대하여 이들의 수평선상에서 상하로 연결될 경우에 상기 런들을 연결된 하나의 그룹(group)으로 처리하는 것이다.
이러한 종래의 문자 인식 방법은 공통적으로 복잡한 연산 과정을 거치며, 언어나 문자의 폰트 구별없이 문자를 인식하기 위해 대규모 데이터 베이스를 구축하고, 스캔된 문자에 대한 인식 데이터 전체를 상기 데이터 베이스와 비교하여 문자를 인식해 왔다.
따라서, 종래의 문자 인식 방법은 몇 가지 문제점이 존재한다.
첫 번째로, 문자에 대한 인식을 위한 연산 알고리즘이 복잡하여 상기 문자 인식 방법의 시행을 위한 대규모 연산 기기가 필요한 문제점이 있다.
두 번째로, 문자를 인식하기 위하여 필요없는 부분까지 연산을 시행함으로써 시간의 낭비를 초래하는 문제점이 있다.
상술한 문제점을 해결하기 위한 본 발명의 일 목적은 문자에 대한 인식을 위한 연산 알고리즘을 단순화하여 문자 인식 방법의 시행을 위해 상대적으로 단순한 연산을 시행할 수 있는 문자 인식 방법을 제공함에 있다.
본 발명의 다른 목적을, 문자를 인식하기 위하여 필요한 최소의 영역에 대한 연산을 시행함으로써 시간의 낭비를 방지하는 문자 인식 방법을 제공함에 있다.
상술한 본 발명의 목적들을 달성하기 위한 본 발명의 바람직한 실시예에 따르면, 문자 인식 방법은 문자가 포함된 인식 대상을 스캔하는 단계, 상기 인식 대상에서 상기 문자에 인접한 구역을 문자 영역으로 추출하는 단계, 상기 문자 영역을 관통하는 임의의 1보다 큰 정수인 n개의 라인을 저장하는 단계, 상기 n개의 라인 중 언어별 및 폰트별로 기 설정된 m개의 라인을 선정하는 단계, 선정된 상기 라인의 이미지 데이터를 획득하는 단계 및 데이터베이스에서 상기 이미지 데이터에 대응되는 문자정보를 검색하여 선택하는 단계를 포함하고, 상기 m은 1보다 크거나 같고, 상기 n보다 작거나 같은 정수인 것이 바람직하다.
이 때, 상기 라인은 상기 문자영역의 중앙을 관통하는 중앙선, 상기 중앙선으로 분할된 상기 문자영역을 이등분하는 사분선 또는 l이 정수인 경우 상기 문자영역을 l등분하는 (l-1)등분선 중 적어도 하나로 구비되는 것이 바람직하다.
또한, 상기 라인 중 적어도 하나는 상기 문자영역의 가로 방향과 0도 초과 90도 이하의 각도를 이루는 것도 가능하며, 상기 복수 개의 라인은 상기 문자영역 내에서 서로 교차되도록 선정되는 것이 바람직하며, 그리고, 상기 라인은 2개 내지 10개 이하인 것이 더욱 바람직하다.
그리고, 상기 라인의 위치 및 개수는 사용자의 설정에 의해 선정되는 것도 가능하다. 또한, 상기 데이터 베이스는 언어별 및 폰트별 문자정보, 사용자의 수기(手記) 입력 또는 변형 폰트에 대한 상기 문자정보 중 적어도 하나를 축적하는 것이 더욱 바람직하다.
또한, 상술한 문제점을 해결하기 위한 본 발명의 다른 바람직한 실시예에 따르면 문자 인식 방법은, 문자로 형성된 단어가 포함된 인식 대상을 스캔하는 단계, 상기 인식 대상에서 상기 단어에 인접한 구역을 단어 영역으로 추출하는 단계, 상기 단어 영역을 관통하는 임의의 1보다 큰 정수인 n개의 라인을 선정하는 단계, 상기 n개의 라인 중 단어에 소속된 문자의 숫자별, 공백의 숫자별, 언어별 또는 폰트별 중 적어도 하나의 기준으로 기 설정된 m개의 라인을 선정하는 단계, 상기 라인의 이미지 데이터를 획득하는 단계 및 데이터베이스에서 상기 이미지 데이터에 대응되는 단어 정보를 검색하여 선택하는 단계를 포함하고, 상기 m은 1보다 크거나 같고, 상기 n보다 작거나 같은 정수인 것이 바람직하다.
문자로 형성된 단어가 포함된 인식 대상을 스캔하는 단계, 상기 인식 대상에서 상기 단어 영역을 추출하는 단계, 상기 단어 영역을 관통하는 임의의 복수개의 라인을 선정하는 단계, 상기 라인의 이미지 데이터를 획득하는 단계 및 데이터베이스에서 상기 이미지 데이터에 대응되는 단어 정보를 검색하여 선택하는 단계를 포 함한다.
이 때, 상기 라인은 상기 단어영역을 문자가 배열된 방향으로 배치되는 것이 바람직하다.
본 발명에 따르면, 문자에 대한 인식을 위한 연산 알고리즘을 단순화하여 문자를 인식하기 위해 상대적으로 단순한 연산을 시행할 수 있는 효과가 있다.
또한, 문자를 인식하기 위하여 필요한 최소의 영역을 선정하여 연산을 시행함으로써 시간을 낭비를 방지할 수 있는 이점이 있다.
또한, 데이터 베이스에 상기 최소의 영역에 대한 상대적으로 적은 양의 데이터를 저장한 경우에도 효율적으로 문자를 인식할 수 있는 이점이 있고, 이로 인해 상대적으로 소형의 문자 인식 기기를 제작할 수 있는 효과가 있다.
또한, 폰트 별로 상기 데이터 베이스를 선택할 수 있도록 하여, 문자 인식 시간을 절약할 수 있는 이점이 있다.
또한, 문자를 단어 형태로 인식할 수 있음에 따라 상대적으로 적은 양의 정보를 가지고 문자를 인식할 수 있는 효과가 있다.
이하 첨부된 도면들을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명하지만, 본 발명이 실시예에 의해 제한되거나 한정되는 것은 아니다. 참고로, 이하 설명에서는 구성 및 기능이 거의 동일하여 동일하게 취급될 수 있는 요소는 동일한 참조번호로 특정될 수 있다.
1실시예
본 발명의 바람직한 실시예에 따른 문자 인식 방법을 설명하면 다음과 같다. 도 1은 본 발명의 제 1실시예에 따른 문자 인식 방법을 순서대로 도시한 순서도이다.
이에 도시된 바와 같이, 상기 문자 인식 방법은 먼저, 문자가 포함된 인식 대상을 스캔하는 단계(P01)를 거친다. 이를 좀 더 상세히 설명하기 위하여 도 2를 제시한다. 도 2는 인식 대상을 설명하기 위하여 도시한 예시도이다.
이에 도시된 바와 같이, 상기 스캔하는 단계(P01)는 상기 문장 전체를 인식 대상(10)으로 하여 스캔하도록 한다. 상기 스캔하는 방법으로는 카메라를 이용하여 상기 인식대상의 영상신호를 수집하도록 하는 것이 바람직하나, 이에 한정되거나 제한되는 것은 아니며, 문자가 인쇄되거나 제시된 화면을 수집할 수 있는 형태이면 자유롭게 변형이 가능함은 물론이다.
다음, 상기 인식 대상(10)에서 상기 문자 인접 부위의 구역을 문자 영역(20)으로 추출하는 단계(P02)를 거친다. 참고로, 설명의 편의를 위하여 도 2에 도시된 바와 같이, 본 실시예에서는 밑이라는 글자를 예로 하여 설명하기로 한다. 상기 문자영역(20)은 상기 인식 대상(10) 중 인식하고자 하는 문자에 인접한 부분을 사각형의 형태로 공지의 문자 추출 방법에 의해 추출한다.
다음, 상기 문자 영역을 관통하는 임의의 n개의 라인을 저장한다(P03). 이 때, 상기 n은 0보다 큰 정수이다. 이를 좀 더 상세히 설명하기 위하여 도 3을 제 시한다. 도 3은 라인 저장 단계를 설명하기 위하여 도시한 예시도이다.
이에 도시된 바와 같이, 상기 라인(100)은 상기 문자 영역(20)을 관통하는 중앙선(101) 및 상기 중앙선으로 분할된 상기 문자영역(20)을 이등분하는 사분선(102)을 포함한다.
본 실시예에서는 상기 라인(100)을 상기 중앙선(101)과 상기 사분선(102)로 제시하였지만, 이에 한정되거나 제한되는 것은 아니며, 복수 개, 즉, l이 정수인 경우에 상기 문자영역(20)을 l등분하도록 (l-1)등분선으로 구비하는 것도 가능하다. 또한, 상기 문자 영역(20)에서 상기 문자의 특징을 추출하기 위해 상기 라인을 변형하여 배치하는 것도 가능하며, 이를 설명하기 위하여 도 4내지 도 5를 제시한다. 도 4 는 라인을 1차 변형하여 1차 변형 라인을 도시한 예시도이고, 도 5는 라인을 2차 변형하여 2차 변형 라인을 도시한 예시도이다.
먼저, 도 4에 도시된 바와 같이, 상기 1차 변형 라인(103)은 상기 문자영역(20)을 대각선으로 가로지르도록 선정된다. 한글을 대상으로 문자 인식을 시행하는 경우, 다양한 한글 자모를 분석하기 위하여 가로나 세로의 경우보다 대각선으로 상기 1차 변형 라인(103)을 선정하는 것이 바람직하나, 이에 한정되거나, 제한되는 것은 아니다.
즉, 상기 1차 변형 라인(103)은 상기 문자영역(20)의 가로 방향 또는 세로 방향 중 적어도 하나의 방향과 0도 초과 90도 이하의 각도를 이루는 것도 가능하다.
도 5에 제시된 바와 같이, 상기 2차 변형 라인(104)은 상기 문자 영역(20)을 가로 방향과 세로 방향으로 관통하는 복수 개의 직선을 포함한다.
즉, 상기 2차 변형 라인(104)은 상기 문자영역(20) 내에서 각각 서로 교차하도록 선정되어, 서로 다른 위치에서 상기 문자영역(20)에 대한 데이터를 추출할 수 있도록 구비된다.
다음, 상기 n개의 라인 중 언어별 및 폰트별로 기 설정된 m개의 라인을 선정하는 단계(P04)를 거친다. 이 때, 상기 m은 1보다 크거나 같고, 상기 n보다 작거나 같은 정수이다. 기 설정된 상기 m은 후술하는 데이터 베이스 축적 단계를 참조하여 후술하기로 한다.
상술한 바와 같이, 상기 라인(100), 상기 1차 변형 라인(103), 상기 2차 변형 라인(104)는 상기 문자 영역(20)에 포함된 상기 문자를 특징을 잘 표현하여 다른 문자와 구별되도록 기 설정된 2개 내지 10개 이하로 선정된다.
다음, 상기 라인의 이미지 데이터를 획득하는 단계(P05)를 거친다.
상기 이미지 데이터는 상기 문자영역(20, 도 3참조)에 대한 디지털 신호로 2진수로 표시되며, 상기 문자 영역(20)을 관통하는 상기 라인(100)의 길이를 기 설정된 기준 단위로 정의하여 각 기준 단위별로 공백(SPACE)으로 나타나는 부분은 0으로 상기 문자가 상기 라인(100)과 중첩되는 마커 부분(MARKER PORTION)은 1로 표시하여 상기 이미지 데이터를 획득하도록 구비된다.
본 실시예에서는 상기 이미지 데이터를 2진수로 표시하였지만, 이에 한정되거나 제한되는 것은 아니며, 예컨데, 상기 마커부분의 상기 라인(100)과 중첩되는 부분에 대한 길이를 상기 기준 단위로 표시한 정보를 상기 이미지 데이터로 획득하 도록 하는 것도 가능하다.
다음, 데이터 베이스에서 상기 이미지 데이터에 대응되는 문자정보를 검색하여 선택하는 단계(P06)를 거침으로써 문자 인식 방법의 시행이 완료된다.
여기서, 상기 데이터 베이스를 축적하는 단계를 좀 더 상세히 설명하면 다음과 같다. 도 6은 데이터 베이스를 축적하는 단계를 순서대로 도시한 순서도이다.
이에 도시된 바와 같이, 상기 데이터 베이스를 축적하는 단계는 먼저, 문자의 언어별 및 폰트별로 특정하는 코드를 선정하는 단계(P061)를 거친다. 여기서, 상기 데이터 베이스는 상기 문자의 언어별 및 폰트별로 상기 코드를 선정하는 것으로 제시하였지만, 이에 한정되거나 제한되는 것은 아니며, 예를 들면, 사용자의 수기 입력에 의한 문자 집합 또는 변형 폰트에 대한 문자정보를 축적하여 코드를 선정하도록 하는 것도 가능하다.
다음, 상기 선정된 언어별 및 폰트별 코드에 해당되는 상기 문자를 관통하는 n개의 라인을 선정하고, 저장하는 단계(P062)를 거친다. 이 때, 상기 n은 1보다 크거나 같은 정수로 선택된다.
다음, 상기 n개의 라인 중 상기 문자를 문자별로 구분할 수 있는 m개의 라인으로 선택하는 단계(P063)을 거친다. 이 때, 상기 m은 1보다 크거나 같고, 상기 n보다 작거나 같은 정수로 선택된다.
이 때, 상기 데이터 베이스에는 문자 집합을 형성하는 언어별, 폰트 별로 상기 문자 정보를 저장하도록 구비된다. 예컨데, 한글의 경우에 상기 m개의 라인은 3 내지 5로 선정되고, 상대적으로 복잡한 한문의 경우에는 그보다 많은 6 내지 10 으로 선정되는 것이 바람직하며, 영어의 경우에는 한글과 유사한 숫자가 선정되는 것이 바람직하나, 이에 한정되거나 제한되는 것은 아니며, 상기 문자를 구별할 수 있는 만큼의 숫자이면 자유로운 변경이 가능하며, 더욱 바람직하게는 각 문자별로 상기 문자를 구별할 수 있는 최소의 숫자로 상기 m이 선택되는 것이다.
또한, 상기 m은 폰트별 및 언어별로 상이하게 설정된 것으로 제시하였지만, 이에 한정되거나, 제한되는 것은 아니며, 상기 m은 상기 문자인식 방법을 사용하는 사용자의 설정에 의해 선정되는 것도 가능하며, 상기 m개의 라인의 위치 역시 사용자의 설정에 의해 선정되는 것이 가능하다.
다음, 상기 m개의 상기 라인에 대한 이미지 데이터를 획득하는 단계(P064)를 거친다.
다음, 상기 획득된 이미지 데이터를 문자별로 축적하는 단계(P065)를 거침으로써, 상기 데이터 베이스를 축적하는 단계를 완료한다.
이로 인해, 상기 데이터 베이스에 상기 이미지 데이터에 대한 문자 정보를 상대적으로 적은 양만 저장하면 되므로, 상대적으로 적은 양의 데이터만을 저장하면서도 효율적으로 문자를 인식할 수 있는 효과가 있고, 특히, 이로 인해 상대적으로 소형의 문자 인식 기기를 제작할 수 있는 이점이 있다.
또한, 상기 문자 인식 방법은 상기 언어별 및 상기 폰트별로 상기 이미지 데이터가 상이하므로, 상기 스캔하는 단계(P01)이전에 상기 인식대상에 대한 폰트를 검색하여 선택하는 단계를 거침으로써, 불필요한 연산 시간을 절약할 수 있도록 하는 것도 가능하다.
그리고, 상기 문자 인식 방법은 라인(100, 도 3참조)을 선정함에 있어, 상기 데이터 베이스에 축적된 상기 이미지 데이터와 유사하게, 상기 문자가 포함된 상기 폰트내에 포함된 문자를 구별하는 최소의 라인 수를 선정하고 이에 따라, 상기 라인(100, 도 3참조)의 위치 및 개수가 정해지도록 하고, 상기 문자를 인식함에 따라, 문자 전체를 대상으로 연산을 진행하는 낭비를 줄일 수 있으므로, 상대적으로 간단한 연산과 고속으로 상기 문자를 인식할 수 있는 이점이 있다.
즉, 문자에 대한 인식을 위한 연산 알고리즘을 선택된 라인에 대한 이미지 데이터만을 획득하여 비교하면 되는 단순한 알고리즘으로 단순화하여 문자를 인식하기 위해 상대적으로 단순한 연산을 시행할 수 있는 효과가 있다.
2실시예
본 발명의 제 2실시예에 따른 문자 인식 방법을 설명하면 다음과 같다. 도 7은 본 발명의 제 2실시예에 따른 문자 인식 방법을 도시한 순서도이다. 참고로, 설명의 편의를 위하여 제 1실시예와 유사하거나 동일한 구성에 대한 설명은 생략하기로 한다.
이에 도시된 바와 같이, 상기 문자 인식 방법은 먼저, 문자로 형성된 단어가 포함된 인식 대상을 스캔하는 단계(P11)를 거친다. 이를 좀 더 상세히 설명하기 위하여 도 8을 제시한다. 도 8은 인식 대상을 설명하기 위하여 도시한 예시도이다.
이에 도시된 바와 같이, 상기 스캔하는 단계(P11)에서 인식하고자 하는 상기 인식 대상(20)을 스캔한다.
다음, 상기 인식대상(20)에서 상기 단어에 인접된 구역을 단어 영역(30)으로 추출하는 단계(P12)를 거친다. 이를 좀 더 상세히 설명하기 위하여 도 9를 제시한다. 도 9는 단어 영역을 설명하기 위하여 도시한 예시도이다.
본 실시예에서는 '문자'라는 단어를 인식하는 예를 들어 설명하기로 한다. 상기 단어 영역(30)의 추출은 상기 단어와 단어 사이의 공백을 기준으로 상기 단어 영역(30)을 추출하도록 구비되며, 필요에 따라, 고유 명사 또는 관용어구 전체를 상기 단어 영역(30)으로 추출하도록 하는 것도 가능하다.
다음, 상기 단어 영역(30)을 관통하는 임의의 n개의 라인을 저장하는 단계(P13)를 거친다. 이 때, 상기 n은 1과 같거나 큰 정수로 선택되며, 상기 라인은 상기 단어 영역을 상기 문자가 배열된 방향으로 배치되는 것이 바람직하며, 이를 도시한 도 5를 제시한다. 도 5는 라인 저장 단계를 설명하기 위하여 도시한 예시도이다.
즉, 상기 단어 영역(30)에서 상기 단어영역(20)에 표시된 '문자'라는 단어가 가로 방향으로 배치되어 있으므로, 상기 라인(100)도 상기 가로 방향으로 선정된다.
다음, 상기 n개의 라인 중 단어에 소속된 문자의 숫자별, 공백의 숫자별, 언어별 또는 폰트별 중 적어도 하나의 기준으로 기 설정된 m개의 라인을 선정하는 단계(P14)를 거친다. 이 때, 상기 m은 1보다 크거나 같고, 상기 n보다 작거나 같은 정수로 선택된다.
다음, 상기 라인(100)의 이미지 데이터를 획득하는 단계(P15)를 거친다.
다음, 데이터 베이스에서 상기 이미지 데이터에 대응되는 단어 정보를 검색하여 선택하는 단계(P16)를 거침으로써 상기 문자 인식 방법이 완료된다.
여기서, 상기 데이터 베이스는 제 1실시예와 유사한 방법으로 상기 단어정보를 축적하도록 구비되며, 이 때, 상기 데이터 베이스에 축적된 상기 단어 정보는 일반적으로 고유 명사 또는 관용어구 전체에 대한 정보를 포함하고, 필요한 경우에는 한 가지 언어가 아닌 영어와 한글, 한글과 한자와 같은 다른 언어별 문자의 조합을 단어로 인식하도록 하는 것도 가능하다. 예컨데, 신문에 게재되는 기사의 제목이나 어구, 또는 책의 제목과 같은 문자의 조합을 단어로 인식하도록 하여 상기 단어 정보를 상기 데이터 베이스에 축적하도록 한다.
이 때, 상기 라인(100)은 제 1실시예에서와 유사하게 상기 단어를 구별하기 위해 최소의 개수만 선택되는 것이 바람직하며, 상기 단어 영역(30)에 포함된 문자의 개수에 따라 상기 라인(100)의 개수를 달리하여 선정하도록 하는 것도 가능하다.
따라서, 상기 문자 인식 방법은 문자를 단어 형태로 인식함에 따라, 상대적으로 적은 정보를 가지고 많은 문자를 인식할 수 있는 효과가 있다.
또한, 상기 데이터 베이스는 폰트별, 언어별로 상기 단어 정보를 축적하고, 상기 스캔하는 단계(P11) 이전에 상기 폰트와 상기 언어를 검색하여 선택하는 단계를 더 포함하여 고속으로 상기 문자 인식이 가능하도록 하는 것도 가능하다.
그리고, 본 실시예에서는 상기 데이터 베이스에서 상기 이미지 데이터에 대 응되는 단어 정보를 검색하여 선택하는 단계(P16)를 거침으로써 상기 문자 인식 방법이 완료되는 것으로 제시하였지만, 이에 한정되거나 제한되는 것은 아니며, 상기 선택하는 단계(P16) 이후에 상기 선택된 단어 정보에 대한 음성정보를 별도로 제공하여, 선택된 상기 단어 정보에 따라 음성으로 결과가 출력되도록 하는 것도 가능하다.
또한, 제 1실시예에서도 제 2실시예와 유사하게, 상기 문자정보에 대한 결과를 음성정보로 변환하여 출력되도록 구비되는 것도 가능하다.
상술한 바와 같이, 본 발명의 바람직한 실시예를 참조하여 설명하였지만 해당 기술분야의 숙련된 당업자라면 하기의 청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
도 1은 본 발명의 제 1실시예에 따른 문자 인식 방법을 순서대로 도시한 순서도이다.
도 2는 인식 대상을 설명하기 위하여 도시한 예시도이다.
도 3은 라인 저장 단계를 설명하기 위하여 도시한 예시도이다.
도 4 는 라인을 1차 변형하여 1차 변형 라인을 도시한 예시도이다.
도 5는 라인을 2차 변형하여 2차 변형 라인을 도시한 예시도이다.
도 6은 데이터 베이스를 축적하는 단계를 순서대로 도시한 순서도이다.
도 7은 본 발명의 제 2실시예에 따른 문자 인식 방법을 도시한 순서도이다.
도 8은 인식 대상을 설명하기 위하여 도시한 예시도이다.
도 9는 단어 영역을 설명하기 위하여 도시한 예시도이다.
<도면의 주요 부분에 대한 부호의 설명>
10:인식 대상 20:문자 영역
30:단어 영역 100:라인
101:중앙선 102:사분선
103:1차 변형 라인 104:2차 변형 라인

Claims (9)

  1. 문자가 포함된 인식 대상을 스캔하는 단계;
    상기 인식 대상에서 상기 문자에 인접한 구역을 문자 영역으로 추출하는 단계;
    상기 문자 영역을 관통하는 임의의 1보다 큰 정수인 n개의 라인을 저장하는 단계;
    상기 n개의 라인 중 언어별 및 폰트별로 기 설정된 m개의 라인을 선정하는 단계;
    선정된 상기 라인의 이미지 데이터를 획득하는 단계; 및
    데이터베이스에서 상기 이미지 데이터에 대응되는 문자정보를 검색하여 선택하는 단계;
    를 포함하되, 상기 m은 1보다 크거나 같고, 상기 n보다 작거나 같은 정수인 것을 특징으로 하는 문자 인식 방법.
  2. 제 1항에 있어서,
    상기 라인은 상기 문자영역의 중앙을 관통하는 중앙선, 상기 중앙선으로 분할된 상기 문자영역을 이등분하는 사분선 또는 l이 정수인 경우 상기 문자영역을 l등분하는 (l-1)등분선 중 적어도 하나로 구비되는 것을 특징으로 하는 문자 인식 방법.
  3. 제 1항에 있어서,
    상기 라인 중 적어도 하나는 상기 문자영역의 가로 방향과 0도 초과 90도 이하의 각도를 이루는 것을 특징으로 하는 문자 인식 방법.
  4. 제 1항에 있어서,
    상기 복수 개의 라인은 상기 문자영역 내에서 서로 교차되도록 선정되는 것을 특징으로 하는 문자 인식 방법.
  5. 제 1항에 있어서,
    상기 라인은 2개 내지 10개 이하인 것을 특징으로 하는 문자 인식 방법.
  6. 제 1항에 있어서,
    상기 라인의 위치 및 개수는 사용자의 설정에 의해 선정되는 것을 특징으로 하는 문자 인식 방법.
  7. 제 1항에 있어서,
    상기 데이터 베이스는 언어별 및 폰트별 문자정보, 사용자의 수기(手記) 입력 또는 변형 폰트에 대한 상기 문자정보 중 적어도 하나를 축적하는 것을 특징으로 하는 문자 인식 방법.
  8. 문자로 형성된 단어가 포함된 인식 대상을 스캔하는 단계;
    상기 인식 대상에서 상기 단어에 인접한 구역을 단어 영역으로 추출하는 단계;
    상기 단어 영역을 관통하는 임의의 1보다 큰 정수인 n개의 라인을 선정하는 단계;
    상기 n개의 라인 중 단어에 소속된 문자의 숫자별, 공백의 숫자별, 언어별 또는 폰트별 중 적어도 하나의 기준으로 기 설정된 m개의 라인을 선정하는 단계;
    상기 라인의 이미지 데이터를 획득하는 단계; 및
    데이터베이스에서 상기 이미지 데이터에 대응되는 단어 정보를 검색하여 선택하는 단계;
    를 포함하고, 상기 m은 1보다 크거나 같고, 상기 n보다 작거나 같은 정수인 것을 특징으로 하는 문자 인식 방법.
  9. 제 8항에 있어서,
    상기 라인은 상기 단어영역을 문자가 배열된 방향으로 배치되는 것을 특징으로 하는 문자 인식 방법.
KR1020070125717A 2007-12-05 2007-12-05 문자 인식 방법 KR100926823B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070125717A KR100926823B1 (ko) 2007-12-05 2007-12-05 문자 인식 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070125717A KR100926823B1 (ko) 2007-12-05 2007-12-05 문자 인식 방법

Publications (2)

Publication Number Publication Date
KR20090058914A true KR20090058914A (ko) 2009-06-10
KR100926823B1 KR100926823B1 (ko) 2009-11-12

Family

ID=40989217

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070125717A KR100926823B1 (ko) 2007-12-05 2007-12-05 문자 인식 방법

Country Status (1)

Country Link
KR (1) KR100926823B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015183015A1 (ko) * 2014-05-30 2015-12-03 삼성에스디에스 주식회사 문자 인식 방법 및 그 장치
CN111832555A (zh) * 2019-04-19 2020-10-27 泰州腾翔信息科技有限公司 基于导航数据的编号识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2615153B2 (ja) * 1988-08-24 1997-05-28 富士通株式会社 切断分離を伴う文字認識方法
JP2000181993A (ja) 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
KR100408082B1 (ko) 2001-07-30 2003-12-03 (주)유라비젼 인식률 및 가독성이 높은 한글 필기용 광학적 문자인식입력 방법
KR100834602B1 (ko) * 2005-08-22 2008-06-02 가부시끼가이샤 도시바 문자 인식 장치 및 문자 인식 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015183015A1 (ko) * 2014-05-30 2015-12-03 삼성에스디에스 주식회사 문자 인식 방법 및 그 장치
KR20150137752A (ko) * 2014-05-30 2015-12-09 삼성에스디에스 주식회사 문자 인식 방법 및 그 장치
CN111832555A (zh) * 2019-04-19 2020-10-27 泰州腾翔信息科技有限公司 基于导航数据的编号识别方法

Also Published As

Publication number Publication date
KR100926823B1 (ko) 2009-11-12

Similar Documents

Publication Publication Date Title
US8208765B2 (en) Search and retrieval of documents indexed by optical character recognition
US6047251A (en) Automatic language identification system for multilingual optical character recognition
JP2009026287A (ja) 文字画像抽出装置および文字画像抽出方法
EP2144189A2 (en) Method for recognizing and translating characters in camera-based image
KR101606469B1 (ko) 이미지 분석방법, 특히 이동 단말기용 이미지 분석방법
JPH11120293A (ja) 文字認識/修正方式
KR101078086B1 (ko) 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법
US20090030882A1 (en) Document image processing apparatus and document image processing method
JP2004046315A (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
US10417516B2 (en) System and method for preprocessing images to improve OCR efficacy
KR20200020305A (ko) 문자 인식을 위한 방법 및 장치
Halima et al. Nf-savo: Neuro-fuzzy system for arabic video ocr
KR20150091948A (ko) 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법
KR100926823B1 (ko) 문자 인식 방법
Lakshmi et al. An optical character recognition system for printed Telugu text
CN106777061B (zh) 基于网页文本和图像的信息隐藏系统、方法及提取方法
KR20120103436A (ko) 화상 처리 장치, 비일시적인 컴퓨터 판독 가능한 매체, 및 화상 처리 방법
JP5857634B2 (ja) 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム
JP6310155B2 (ja) 文字認識装置、文字認識方法及び文字認識プログラム
EP0997839A2 (en) Word recognizing apparatus and method for dynamically generating feature amount of word
US11210564B2 (en) Information processing apparatus for character recognition and non-transitory computer readable medium
CN102855291A (zh) 一种向输入法词库中添加词条的方法及装置
US20190318190A1 (en) Information processing apparatus, and non-transitory computer readable medium
JP3763262B2 (ja) 手書文字認識装置
KR100241447B1 (ko) 윤곽선 정보를 이용한 영문/숫자 인식방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee