KR19980058361A - 한글 문자 인식 방법 및 시스템 - Google Patents

한글 문자 인식 방법 및 시스템 Download PDF

Info

Publication number
KR19980058361A
KR19980058361A KR1019960077685A KR19960077685A KR19980058361A KR 19980058361 A KR19980058361 A KR 19980058361A KR 1019960077685 A KR1019960077685 A KR 1019960077685A KR 19960077685 A KR19960077685 A KR 19960077685A KR 19980058361 A KR19980058361 A KR 19980058361A
Authority
KR
South Korea
Prior art keywords
horizontal
vowel
value
vertical coordinate
stroke
Prior art date
Application number
KR1019960077685A
Other languages
English (en)
Inventor
이상일
Original Assignee
구자홍
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, 엘지전자 주식회사 filed Critical 구자홍
Priority to KR1019960077685A priority Critical patent/KR19980058361A/ko
Publication of KR19980058361A publication Critical patent/KR19980058361A/ko

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

본 발명은 자소 분리를 이용한 한글 인식에 관한 것으로, 수평 모음을 구성하는 획의 시작점의 수직 좌표값과 최종점의 수직 좌표값으로부터 기울기 및 획의 크기를 검출하여 수평 모음인지 여부를 판단하는 단계, 및 검출된 수평획에 대한 돌기를 검출하는 단계에 의해서 수평 문자를 인식하여, 인식에 있어서, 수평획의 수직 좌표값과 이로부터 위쪽으로 처음 백화소가 나오는 지점의 수직 좌표값간의 절대치 ab를 구하는 단계, 아래쪽으로 처음 백화소가 나오는 지점의 수직 좌표값간의 절대치 ca를 구하는 단계, 및 상기 ab와 ca의 값의 차가 소정의 임계치 이내일 경우 수평 모음인 것으로 판단하는 단계와, 상기 검출된 기울기가 일정 크기 이내일 경우 수평 모음인 것으로 판단하는 단계에 의하며, 이는 초성, 종성 분리 단계에 적용된다. 본 방법은 스캐너 및 디지털 처리 프로세서(DSP)를 갖는 시스템에서 DSP에 구현될 수도 있다.

Description

한글 문자 인식 방법 및 시스템
제1도는 한글 문자 유형을 분류한 도면.
제2도는 종래의 자소 분리를 이용한 한글 문자 인식 과정을 보인 개략적인 흐름도.
제3도는 제2도에서 모음 검출 및 제1도의 문자 유형 분류 과정을 보인 개략적인 흐름도.
제4도 본 발명의 방법을 구현하는 하드웨어 구성을 개략적으로 보인 블록도.
제5도는 본 발명의 한글 문자인식 방법에 적용된 수평모음 검출과정을 구체적으로 보인 흐름도.
도면의 주요부분에 대한 부호의 설명
41 : 스캐너 43 : 호스트 컴퓨터
45 : DSP 47 : DRAM 콘트롤러
48 : 프로그램 메모리 50 : 화상 메모리
본 발명은 자소 분리를 이용한 한글 문자 인식 방법 및 시스템에 관한 것으로, 특히 한글 문자 인식에 있어 수평 모음 검출과 초성 및 종성 분리 방법, 시스템에 관한 것이다.
데이터 처리 장치에 데이터를 입력함에 있어서는 소정의 입력 장치를 통해 행해지는 것이 일반적이지만, 보다 편리하고 신속한 처리를 위해서 이미 인쇄되어 있거나, 또는 손으로 작성된 문서를 이를테면 키보드를 통하지 않고 데이터 처리 장치 스스로 인식할 수 있는 문자 인식 시스템에 대한 연구 개발이 진행되고 있다.
이러한 목적하에 개발된 한글 문자 인식 방법 중에서 자소 분리를 이용하여 한글 문자를 인식하는 방법이 있으며, 이는 한글의 문자를 구성하는 자음, 모음의 위치 관계를 체계적으로 분류하여, 인식할 문자를 이 중 어느 하나에 속하는가를 분석하여 인식하는 것이다. 한글 글자는 6가지 유형으로 분류될 수 있고, 특히 이들 유형은 모음을 기준으로 하여 자음이 배치된 형태이기 때문에, 모음의 검출이 매우 중요한 위치를 점하고 있다.
그러나, 종래의 자소 분리를 이용한 한글 문자 인식 방법에 있어서는 중요한 모음 검출에 있어 특히 수평획을 갖는 수평 모음의 형태를 제한하고 있어 적용성에 문제가 있었다. 즉, 종래의 수평 모음 검출 방법은 단순히 우측으로 연속되는 획을 구성하는 흑화소 개수를 구하여 이 값이 임계치를 넘을 경우 이를 수평 모음으로 간주하는 방법이었다. 그러나, 이 방법은 기울기를 가지고 있는 이를 테면 명조체나 다른 글꼴에 적용하기에는 한계가 있으며, 잘못된 수평 모음 검출은 문자 인식 시스템에서의 인식율 저하의 직접적인 원인인 것이었다.
본 발명은 이러한 종래의 문제점을 해결하기 위한 것으로서, 본 발명의 목적은 자소 분리를 이용한 한글 문자 인식에 있어 적어도 기울기를 갖고 있는 수평 모음을 검출할 수 있는 한글 문자 인식 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 자소 분리를 이용한 한글 문자 인식에 있어 수평 모음 검출에 더하여 본 방법을 적용하여 초, 종성 분리를 행할 수 있는 한글 문자 인식 방법을 제공하는 것이다.
본 발명의 목적은 한글 문자의 수직 모음 검출에 따라 수평 모음 검출에 의해서 한글 문자 유형을 판별한 후, 초성 및 종성 분리를 통해 한글 문자를 인식하는 한글 문자 인식 방법의 상기 수평 모음 검출 방법에 있어서, 수평 모음을 구성하는 획의 시작점의 수직 좌표값과 최종점의 수직 좌표값으로부터 기울기 및 획의 크기를 검출하여 수평 모음인지 여부를 판단하는 단계; 및 상기 검출된 수평획에 대한 돌기를 검출하는 단계를 포함하는 것을 특징으로 하는 한글 문자의 수평 모음 검출 방법에 의해서 달성된다.
이러한 방법을 구성하는 단계 중에서 기울기 검출을 위한 판단 단계가 초성, 종성 분리 단계에 적용될 수 있어, 이로부터 본 발명의 또 다른 목적을 달성하고 있다.
본 발명은 다양한 글꼴의 한글 문자를 인식할 수 있어 종래보다 유용한 처리 방법을 제공한다.
다음에 본 발명에 대해 보다 상세한 것을 첨부한 도면을 사용하여 설명한다. 본 발명을 설명하기에 앞서, 본 발명에 적용된 종래의 기술에 대해 자소 분리를 이용한 한글 인식 시스템의 수평 모음 검출 및 초성 종성 분리 방법에 대해 설명하도록 한다.
한글은 하나의 글자를 형성함에 있어, 그 유형을 분류해 볼 때, 제1도에 도시한 바와 같이 6가지 형태의 유형으로 분류될 수 있다. 자음과 모음이 적절하게 결합되어 하나의 글자를 형성하는데, 이와 같이 한글 글자의 유형이 주어지기 때문에 한글 글자 인식에 있어서는 각 글자를 구성하는 자음과 모음을 각각 분리하여 인식하고 6가지 유형 중 어느 하나에 속하는지를 파악하면 글자 인식이 가능해 진다.
제2도는 종래의 자소 분리를 이용한 한글 인식 방법에 대한 처리 과정을 개략적으로 나타낸 흐름도이다. 도시된 바와 같이, 스텝 21에서 인식하고자 할 선택된 문자열을 먼저 추출한 후에, 스텝 22와 같이 모음 인식 및 한글 유형을 분류한다. 이어서, 스텝 23 내지 25와 같이, 초성 및 종성 분리, 초성, 종성의 인식 및 인식된 결과를 저장함으로써, 글자 인식 과정을 완료할 수 있다.
종래의 기술에서 6가지 유형에 대한 인식은 모음이 어디에 위치하는가에 따라 명확히 분류될 수 있으므로, 스텝 22와 같이 모음 인식 과정이 선행되고 있다. 이를 위해서 종래의 자소 분리를 이용한 한글 인식 시스템에서는 모음 인식을 위한 처리를 위해서 다음에 설명하는 바와 같이 하여 처리하고 있으며, 그 구체적인 과정을 살펴보면 다음과 같다.
제3도에 도시한 개략적인 흐름도는 종래의 모음 인식 및 글자 유형 인식 과정을 나타낸 것이다.
제3도에 도시한 바와 같이, 모음 인식을 통한 한글 글자 유형 분류 과정은 비교적 검출이 용이한 수직 모음부터 시작한다. 여기서 수직 모음이란 한글의 모음 중 세로 획이 포함된 자소를 의미하며, 예를 들면, “ㅏ, ㅑ, ㅓ, ㅕ, ㅣ ...”등을 나타낸다. 이러한 수직 모음은 스텝 301에서 행해진다. 스텝 301에서 만약 수직 모음이 검출되지 않으면, 수직 모음은 없고 수평 모음 즉 예를 들면 “ㅗ, ㅛ, ㅜ, ㅠ ...”과 같은 모음이 포함된 글자인 것이므로, 이것은 제1도의 한글 글자가 현재 제2형태이거나 제5형태임을 암시하는 것이다. 따라서, 스텝 301은 스텝 305로 진행하여, 여기서 제2형태나 제5형태 분류를 위해서 종성성분이 유무를 검출하고, 이에 따라 제2형태인지 제5형태가 분류될 수 있다. 종성 성분이 없으면 스텝 308 및 스텝 309와 같이 하단 지점 수평 모음 검출을 행하여 제2형태임을 결정하고, 종성 성분이 있으면, 스텝 306 및 스텝 307과 같이 중간 지점 수평 모음 검출을 행하여 제5형태임을 결정한다.
한편, 스텝 301에서 수직 모음이 검출되면, 이는 한글 글자가 제1형태, 제3형태, 제4형태 및 제6형태 중 어느 하나임을 암시하는 것이다. 간단히 설명하면, 스텝 302에서 종성 성분의 검출 유무에 따라 한글 글자를 제1형태, 제3형태와 제4 및 제6형태로 각각 분류하며, 이를 다시 수평 모음의 존재 유무에 따라 제1형태, 제3형태, 제4형태 그리고 제6형태로 분류한다.
이러한 과정을 통해서 한글의 모음이 인식되며, 이에 따라서 한글 글자의 유형 분류가 행해질 수 있다. 그리고, 이 결과는 각 유형에 근거하여, 제2도의 초성, 종성 분리 과정으로 진행하게 된다.
모음이 수직 모음인지 수평 모음인지 여부를 판단하는 것이 이와 같이 글자 인식에 있어서 매우 중요한 위치에 있는 것이다. 이러한 일련의 과정을 실현하기 위해서는 받아들인 글자의 획이 존재하는 흑화소 및 획이 없는 백화소(blank)의 좌표 인식을 동반한다. 즉 모음을 구성하는 흑화소의 분포로부터 그 형태를 인식하는 것으로, 특히 본 발명과 관계된 수평 모음 검출 과정에 대한 구체적인 과정을 다음에 살펴본다.
(1) 먼저, 수평 모음이 존재할 수 있는 후보 영역에 대해서 X 좌표가 1인 점의 Y 좌표값을 구한다.
(2) 이어서, 상기 (1)에서 구한 첫 번째 Y 좌표에 대해 오른쪽으로 연결된 길이를 구한다.
(3) 이러한 과정을 반복하여 누적된, 현재 수평 모음의 획을 구성하고 있는 흑화소의 값을 임계값과 비교하여 임계값보다 클 경우 이를 수평획으로 간주하고, 누적 흑화소 값을 수평획의 길이로 간주한 후 후술되는 (5)의 과정을 진행한다.
(4) 상기 (1)에서 구한 다른 Y 좌표값이 있을 경우 오른쪽으로 누적 흑화소 값을 구한 후, 상기 (3)의 과정으로 진행하고, 다른 Y 좌표값이 없을 경우에는 수평 모음이 존재하지 않는 것으로 간주하고 수평 모음 검출 과정을 종료한다.
(5) 상기 (3)에서 구한 수평획의 길이로부터 중간 지점에서 돌기의 유무와 돌기의 방향, 그리고 돌기의 수에 따라 수평 모음 “ㅗ, ㅛ, ㅡ, ㅜ, ㅠ”를 판단한 후 검출된 수평 모음의 정보를 취한 후, 수평 모음 검출 과정을 종료한다.
이러한 종래의 수평 모음 검출에 있어서, 상기 설명한 (2)의 과정에 따르면, 문자열에서 오른쪽으로 연속된 누적 흑화소 값에 의하여 한글 수평획의 존재 유무를 판단하고 있음을 알 수 있다. 이 값에 근거하여 돌기를 검출하고 수평 모음을 인식하게 되는 데, 이러한 처리 과정에 기인하여, 인식 대상의 한글 글자 형태에 제한이 수반된다. 이 처리 과정에 의하면, 고딕체이거나, 한글 유형이 제2형태, 제5형태일 경우 유효한 것으로 그 외의 경우에는 적용되기 곤란한 처리 과정이다.
그러나, 한글의 글꼴이 상당히 다양하며 제2형태, 제5형태 외에도 한글 글자는 제3형태, 제6형태일 경우처럼 수평 모음 자체가 기울기를 가진 획이므로, 종래의 경우와 같이 단지 오른쪽으로 누적된 흑화소 값만으로 정확히 검출하기가 용이하지 않으며, 혹 검출되더라도 정확한 수평획의 길이를 구하기가 어려워 돌기가 존재 가능한 후보점을 검출할 때에서도 에러가 발생하기 쉬운 문제가 있는 것이다. 이러한 처리 과정만으로는 현재의 한글 글꼴이나 앞으로 개발될 여러 가지 형태의 글꼴들에 대해서 높은 인식률을 기대하기가 어려운 것이다.
본 발명은 이를 해결하기 위한 것이며, 본 발명에 따라 제1도에 도시한 각각의 형태에 적용될 수 있고, 다양한 글꼴이라도 글자 인식에 있어 중요한 모음의 수평획을 확실하게 검출할 수 있는 처리 방법이 제공된다.
본 발명의 방법이 실현될 수 있는 시스템은 문자 인식을 위한 데이터 처리 장치와 이에 인식할 글자를 입력하기 위한 문자 입력 장치를 포함한다. 이에 대한 하나의 전형적인 예를 제4도에 도시하였으나, 이는 하나의 예임의 유념한다. 이에 대해 다음에 간단히 설명한다.
제4도의 하드웨어 구성도는 본 발명이 적용되어 문자 인식을 실현할 수 있는 시스템 구성도로서, 문자 인식 시스템(40)의 전반적인 동작을 제어하는 데이터 처리 장치인 호스트 컴퓨터(43)를 포함한다. 그리고 문자 입력 장치는 일반적으로 스캐너(41)가 채택된다. 이 스캐너는 문서로부터 2진 화상을 발생시켜 출력한다. 스캐너는 디지털 신호 프로세서(DSP; 45)에 스캐너 인터페이스(42)를 거쳐 결합되어 있고, DSP(45)는 스캐너로부터 입력된 2진 화상을 처리한다. DSP(45)는 DSP(45)와 호스트 컴퓨터(43)간의 정보를 전달하기 위한 호스트 인터페이스(44)에 의해서 호스트 컴퓨터와(43)와 접속된다. 그리고, DSP(45)에는 DSP로부터 처리된 결과 및 DSP(45)에서 수행되는 프로그램을 저장하기 위한 프로그램 메모리(48) 및 데이터 메모리(49)가 접속된다. 호스트 컴퓨터(43)에는 DRAM 콘트롤러(47)를 통해 화상 메모리(50)가 접속되는데, 이 화상 메모리(50)는 스캐너(41)에서 입력되는 입력 화상 정보를 저장하기 위한 것이며, 이를 제어하는 부분이 DRAM 콘트롤러(47)이다. 그리고, DSP(45)와 DRAM 콘트롤러(47) 간의 데이터 전송을 매개하기 위해 버퍼(46)가 개재된다.
이와 같이 구성되는 문자 인식 시스템에서 본 발명의 방법에 따라 문자 인식을 처리하는 부분은 DSP(45)이며, 이것은 반도체 칩으로 실현되는 것으로서, 이에 제3도의 일련의 과정이 포함되며, 이때 본 발명의 방법은 제3도에서 스텝 303과 스텝 310에 대응한다. 그리고 제3도에서의 스텝 303과 스텝 310을 더 상세히 나타내면 제5도에 도시된 흐름도와 같이 된다. 본 발명은 한글 글꼴을 인식함에 있어 모음의 검출을 통한 한글 유형 분류 과정을 채용하며, 모음의 검출에 있어서 특히 수평 모음에 특징적인 처리 과정을 포함한다. 다음에, 제5도에 도시된 흐름도에 따라 본 발명에 따른 수평 모음 검출 과정에 대해서 설명한다.
(1) 스캐너(41)를 통해 입력된 화상 데이터로부터 문자로서 인식하기 위해서, 처리할 문자에서 수평 모음이 존재할 가능성이 있는 지점에 존재하는 최하단의 후보 수평 모음 시작점 Y 좌표값을 검출하여 a[1]에 할당한다. a[1]은 최하단의 후보 수평 모음 시작점의 Y 좌표값을 갖는 기억 장치내의 일부 영역이 될 수 있으며, 기호는 이를 표시하는 것이다.
(2) 상기 (1)의 과정에서 만약 후보 수평 모음 시작점이 검출되지 않을 경우 수평 모음이 존재하지 않은 것으로 간주한다. 이것은 제3도의 과정으로부터 이 경우에 해당되는 글자 유형은 제1 또는 제4형태임을 암시하는 것이다.
(3) 상기 (1)의 과정에서 n을 임의의 정수라 할 때, a[n]으로부터 Y 좌표값이 증가하는 방향으로 처음 백화소가 나오는 지점에서의 Y 좌표값을 구하여 이를 a[n]과 구별되는 b[n]에 저장하여 둔다. 그리고 이때, 즉 n의 값에서의 a[n]과 b[n]의 2개의 Y 좌표값간의 차이값의 절대치를 구하여 이를 ab[n]으로 나타낸 기억 장소에 저장하여 둔다.
(4) 상기(3)의 과정과 같이, 이번에는 a[n]으로부터 이를 기준으로 Y 좌표값이 감소하는 방향으로 처음 백화소가 나오는 지점에서의 Y 좌표값을 구하여 이를 a[n] 및 b[n]과 구별되는 c[n]에 저장하여 둔다. 그리고 이때, 즉 n의 값에서의 a[n]과 c[n]의 2개의 Y 좌표값간의 차이값의 절대치를 구하여 이를 ca[n]으로 나타낸 기억 장소에 저장하여 둔다.
(5) 한글에서 수평획은 모음을 구성하는 획일 수도 있으나, 예를 들면 “ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅌ”등과 같이 수평획을 가지면서도, 모음이 아닌 경우도 있다. 이를 위해서 임계치에 의한 비교로 이들을 비교한다. 즉, 시작점부터 일정 앞부분까지의 범위내에서 ab[n]의 값과 ca[n]의 값의 차가 임계치보다 클 경우 수평 모음이 아닌 자음으로 처리한다. 이것은 자음 검출을 의미하는 것을 또한 말해준다.
(6) 다음에, a[n+1]의 값, 즉 n에서 한 샘플링을 더 진행한 위치에서의 Y 좌표값을 구한다. 이 때, 우측 방향, 즉 X 좌표값이 증가하는 방향을 우선으로, 우측 방향이 검출되지 않을 수 있다. 이때에는 이 위치에서 X, Y 좌표값이 동시에 증가하는 방향, 환언하여 대각선으로 진행하는 방향과, 상기 위치에서 Y 좌표값이 증가하는 방향으로 진행한 위치에서 검색을 진행한다. 이것은 수평 모음이 기울기를 갖고 획을 이루고 있는 경우에 적합한 처리 과정이 된다. 그러나, 연속하여 2번 이상 이러한 기울기 검출을 위한 방향으로 진행하여 검출하는 것은 무효하므로 2번 이상은 처리 과정을 행하지 않는다. 또한, 스캐너의 처리상 도트 정보 하나가 손실될 가능성을 고려하여 우측으로 2번 계속하여 검색하는 과정을 포함할 수도 있다.
(7) 후보 수평획이 소정의 검출 범위를 넘어 계속 검출되거나, 새로운 a[n]의 탐색이 중단된 경우에는 a[n]의 최종점과 시작점 a[1]의 기울기를 구해 이 값이 일정 크기를 넘으면 수평 모음이 없는 것으로 처리하고, 그렇지 않으면 수평 모음으로 간주한다. 이때까지의 n의 값은 수평 획의 크기를 뜻하는 것이므로, 이 값을 수평획의 길이로 설정한 후 후술되는 돌기 검출 과정인 (10)의 처리 과정으로 진행한다.
(8) 상기 (7)의 처리 과정에서 a[1]부터 새로운 a[n]의 시작점과의 기울기를 구해 일정 크기를 넘으면 수평 모음이 아닌 것으로 간주한다. 이 과정은 현재 처리 대상의 획을 갖는 자소가 “ㅅ, ㅈ, ㅊ, ㅋ”일 수 있음을 말해준다.
(9) 이와 같은 일련의 과정을 처리하여 수평 모음을 검출하는데, 상기(8)의 과정에서 수평 모음인 것이 유효하면, 상기 (3)의 과정으로 진행하여 그 이하의 과정을 반복한다.
(10) 본 처리 과정은 상기 (7)의 과정에서 수평 모음으로 간주된 경우에 돌기 검출을 위해 진행되는 과정이다.
이를 위해서 제3도의 스텝 301에서 검출된 수직 모음 정보로부터 다음의 표1과 같이 수평 모음 판별이 가능한 경우에는 표1의 정보를 이용한다. 그렇지 않은 경우에는 상기의 일련의 과정으로부터 검출된 수평획 정보로부터 ab[n]값과 ca[n]값을 이용하여 돌기가 존재할 가능성이 있는 지점의 ab[n], ca[n] 각각의 표준편차를 구한다. 이 표준편차가 임계치보다 클 경우 돌기가 존재하는 것으로 간주하고, ab[n], ca[n]으로부터 구한 표준편차의 상대적인 크기를 이용하여 “ㅗ”, “ㅜ”의 모음 판별을 한다.
[표 1]
이러한 돌기의 검출에 있어서, 수평 모음을 검출할 때 추출하는 ab[n], ca[n]의 값을 이용하여 수평 모음의 정확한 인식이 가능하다.
이러한 본 발명의 수평 모음 과정은 이에 이어지는 초, 종성 분리 과정에도 또한 적용될 수 있다. 즉 b[n]과 c[n]이 값에 의해서 모음과의 경계값으로서 자, 모음 판단을 위한 기준값으로서 활용될 수 있기 때문에, 문자 인식 시스템의 인식율을 대폭적으로 향상시키는 것이다.
본 발명에 따르면 일정 기울기의 수평 모음을 갖고 있는 한글 문자에서도 적용 가능한 수평 모음 검출 방법을 제공하고 있어 문자 인식 시스템의 인식율을 높이고 있으며, 또한, 본 발명은 자소 분리를 이용한 다중 인쇄체 및 필기체 문자 인식 시스템에서도 수평 모음 검출에 적용될 수 있다. 더욱이 자소 분리를 이용하지 않는 다른 방식의 문자 인식 방법은 통문자 인식 시스템에서도 소분류 과정에 적용될 수 있다.
본 발명은 지금까지 설명한 실시예에 한정되는 것이 아니라 발명의 기술 사상을 일탈하지 않는 범위에서 다양한 변형 및 수정이 가능함을 이해하여야 한다. 따라서 본 발명은 다음의 특허청구의 범위에 기재된 사항에 의해서만 정하여져야 할 것이다.

Claims (6)

  1. 한글 문자의 수직 모음 및 수평 모음의 검출에 의해 한글 문자 유형을 판별한 후, 초성 및 종성 분리를 통해 한글 문자를 인식하는 한글 문자 인식 방법의 상기 수평 모음 검출 방법에 있어서, 수평 모음을 구성하는 획의 시작점의 수직 좌표값과 최종점의 수직좌표값으로부터 기울기 및 획의 크기를 검출하여 수평 모음인지 여부를 판단하는 단계, 상기 획의 수직 좌표값과 이로부터 위쪽으로 처음 백화소가 나오는 지점의 수직 좌표값간의 절대치 ab를 구하는 단계, 아래쪽으로 처음 백화소가 나오는 지점의 수직 좌표값간의 절대치 ca를 구하는 단계, 상기 ab와 ca의 값의 차가 소정의 임계치 이내일 경우 수평 모음인 것으로 판단하는 단계, 및 상기 검출된 수평획에 대한 돌기를 검출하는 단계를 포함하는 것을 특징으로 하는 한글 문자의 수평 모음 검출 방법.
  2. 제1항에 있어서, 상기 검출된 기울기가 일정 크기 이내일 경우 수평 모음인 것으로 판단하는 단계를 더 포함하는 것을 특징으로 하는 한글 문자의 수평 모음 검출 방법.
  3. 제1항에 있어서, 상기 돌기 검출 단계는 상기 ab 및 ca 각각의 표준편차를 구하는 단계, 및 상기 표준편차가 소정의 임계치보다 클 경우 돌기가 존재하는 것으로 판단하는 단계를 더 포함하는 것을 특징으로 하는 한글 문자의 수평 모음 검출 방법.
  4. 제3항에 있어서, 상기 초성 및 종성 분리는 상기 ab의 값과 ca의 값의 차가 상기 소정의 임계치보다 클 경우 상기 초성 및 종성 중 어느 한쪽의 자소에 대응하는 것으로 판단하는 단계와, 상기 기울기가 소정의 일정 크기 이상일 경우 초성 및 종성 중 어느 한 쪽의 자소에 대응하는 것으로 판단하는 단계를 포함하는 것을 특징으로 하는 한글 문자의 수평 모음 검출 방법.
  5. 문자의 수직 모음을 검출하는 단계, 수평 모음을 구성하는 획의 시작점의 수직 좌표값과 최종점의 수직 좌표값으로부터 기울기를 검출하여 상기 검출된 기울기가 일정크기 이내일 경우 수평 모음인 것으로 판단하는 단계, 상기 획의 수직 좌표값과 이로부터 위쪽으로 처음 백화소가 나오는 지점의 수직 좌표값간의 절대치 ab를 구하는 단계, 아래쪽으로 처음 백화소가 나오는 지점의 수직 좌표값간의 절대치 ca를 구하는 단계, 상기 ab와 ca의 값의 차가 소정의 임계치 이내일 경우 수평 모음인 것으로 판단하는 단계, 상기 ab 및 ca 각각의 표준편차를 구하고, 상기 표준편차가 소정의 임계치보다 클 경우 돌기가 존재하는 것으로 판단하는 단계, 및 상기 ab의 값과 ca의 값의 차가 상기 소정의 임계치보다 클 경우 상기 초성 또는 종성의 자소에 대응하는 것으로 판단하고, 상기 기울기가 소정의 일정 크기 이상일 경우 초성 또는 종성의 자소에 대응하는 것으로 판단하는 단계를 포함하는 것을 특징으로 하는 한글 문자 인식 방법.
  6. 한글 문자를 받아 2진 화상 정보를 생성하는 수단, 상기 화상 정보에 대해 자소 분리를 통한 한글 문자 인식 처리를 행하는 데이터 처리 수단, 데이터, 화상 정보 및 프로그램을 저장하기 위한 저장 수단, 및 시스템의 동작을 제어하는 중앙 제어부를 포함하는 한글 문자 인식 시스템에 있어서, 상기 데이터 처리 수단은 상기 문자의 수직 모음을 검출하는 수단, 수평 모음을 구성하는 획의 시작점의 수직 좌표값과 최종점의 수직 좌표값으로부터 기울기 및 획의 크기를 검출하여 수평 모음인지 여부를 판단하는 수단, 상기 검출된 수평획에 대한 돌기를 검출하는 수단, 및 초성, 종성 분리하여 검출하는 수단을 포함하며, 상기 수평 모음 판단 수단은 상기 획의 수직 좌표값과 이로부터 위쪽으로 처음 백화소가 나오는 지점의 수직 좌표값간의 절대치 ab를 구하고, 아래쪽으로 처음 백화소가 나오는 지점의 수직 좌표값간의 절대치 ca를 구하고, 상기 ab와 ca의 값의 차가 소정의 임계치 이내일 경우 수평 모음인 것으로 판단하며, 상기 검출된 기울기가 일정 크기 이내일 경우 수평 모음인 것으로 판단하며, 상기 돌기 검출 수단은 상기 ab 및 ca 각각의 표준편차를 구하고, 상기 표준편차가 소정의 임계치보다 클 경우 돌기가 존재하는 것으로 판단하며, 상기 초성, 종성 분리 수단은 상기 ab의 값과 ca의 값의 차가 상기 소정의 임계치보다 클 경우 상기 초성 또는 종성의 자소에 대응하는 것으로 판단하며 또한 상기 기울기가 소정의 일정 크기 이상일 경우 초성 또는 종성의 자소에 대응하는 것으로 판단하는 하도록 된 것을 특징으로 하는 한글 문자 인식 시스템.
KR1019960077685A 1996-12-30 1996-12-30 한글 문자 인식 방법 및 시스템 KR19980058361A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960077685A KR19980058361A (ko) 1996-12-30 1996-12-30 한글 문자 인식 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960077685A KR19980058361A (ko) 1996-12-30 1996-12-30 한글 문자 인식 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR19980058361A true KR19980058361A (ko) 1998-09-25

Family

ID=66395521

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960077685A KR19980058361A (ko) 1996-12-30 1996-12-30 한글 문자 인식 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR19980058361A (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030090381A (ko) * 2002-05-23 2003-11-28 퍼셉컴(주) 문자 인식방법 및 문자 인식장치
KR100456620B1 (ko) * 2001-12-20 2004-11-10 한국전자통신연구원 한글문자 인식 방법
KR100473660B1 (ko) * 2001-07-11 2005-03-10 가부시끼가이샤 도시바 단어인식방법
KR100479349B1 (ko) * 2002-12-12 2005-03-31 한국전자통신연구원 자소기반 문자인식기 성능 향상방법
KR100718139B1 (ko) * 2005-11-04 2007-05-14 삼성전자주식회사 영상에 포함된 문자 인식장치 및 방법
WO2007070489A1 (en) * 2005-12-12 2007-06-21 Microsoft Corporation Logical structure and layout based offline character recognition
KR100919497B1 (ko) * 2008-07-22 2009-09-28 엔에이치엔(주) 이미지에 포함되는 한글 문자를 인식하기 위하여 자소분할하는 방법 및 컴퓨터 판독 가능한 기록 매체

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100473660B1 (ko) * 2001-07-11 2005-03-10 가부시끼가이샤 도시바 단어인식방법
KR100456620B1 (ko) * 2001-12-20 2004-11-10 한국전자통신연구원 한글문자 인식 방법
KR20030090381A (ko) * 2002-05-23 2003-11-28 퍼셉컴(주) 문자 인식방법 및 문자 인식장치
KR100479349B1 (ko) * 2002-12-12 2005-03-31 한국전자통신연구원 자소기반 문자인식기 성능 향상방법
KR100718139B1 (ko) * 2005-11-04 2007-05-14 삼성전자주식회사 영상에 포함된 문자 인식장치 및 방법
WO2007070489A1 (en) * 2005-12-12 2007-06-21 Microsoft Corporation Logical structure and layout based offline character recognition
KR100919497B1 (ko) * 2008-07-22 2009-09-28 엔에이치엔(주) 이미지에 포함되는 한글 문자를 인식하기 위하여 자소분할하는 방법 및 컴퓨터 판독 가능한 기록 매체

Similar Documents

Publication Publication Date Title
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US5533147A (en) Segmentation of handwritten patterns using stroke and jump vectors
US7162086B2 (en) Character recognition apparatus and method
JP2651009B2 (ja) 情報認識装置
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JP2013033416A (ja) 文字認識装置、文字認識方法及びプログラム
US5621818A (en) Document recognition apparatus
KR19980058361A (ko) 한글 문자 인식 방법 및 시스템
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US6208756B1 (en) Hand-written character recognition device with noise removal
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JP3466894B2 (ja) 楽譜認識方法及びその装置並びに楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体
KR19990049667A (ko) 한글 문자체 인식 방법
Airphaiboon et al. Recognition of handprinted Thai characters using loop structures
US9047535B2 (en) Image processing apparatus, image processing method, and computer readable medium
KR100332752B1 (ko) 문자인식방법
JP2010039615A (ja) 文字認識方法及び文字認識装置
KR910007032B1 (ko) 한글 문서 인식장치의 문자열과 개별문자 절출방법
JPH0436432B2 (ko)
JP2520174B2 (ja) 文字自動抽出装置
JPH07168911A (ja) 文書認識装置
KR100204618B1 (ko) 문자 또는 도형의 인식 방법 및 시스템
KR930012139B1 (ko) 문자인식을 위한 자획추출방법
KR910005390B1 (ko) 자동문서처리 및 영문자 인식방법
KR950001060B1 (ko) 데이터 인식장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application