KR20000061110A - 자소 조합형 한글 필기인식 방법 - Google Patents

자소 조합형 한글 필기인식 방법 Download PDF

Info

Publication number
KR20000061110A
KR20000061110A KR1019990009923A KR19990009923A KR20000061110A KR 20000061110 A KR20000061110 A KR 20000061110A KR 1019990009923 A KR1019990009923 A KR 1019990009923A KR 19990009923 A KR19990009923 A KR 19990009923A KR 20000061110 A KR20000061110 A KR 20000061110A
Authority
KR
South Korea
Prior art keywords
stroke
strokes
database
initial
hangul
Prior art date
Application number
KR1019990009923A
Other languages
English (en)
Inventor
지대훈
Original Assignee
지대훈
주식회사 오픈와이즈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지대훈, 주식회사 오픈와이즈 filed Critical 지대훈
Priority to KR1019990009923A priority Critical patent/KR20000061110A/ko
Publication of KR20000061110A publication Critical patent/KR20000061110A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 한글 필기인식방식에 있어서 흘림체로 입력된 글자를 획수에 맞게 재 분리하고, 그 초성을 정확히 인식하는 조합형 한글 필기인식방법에 관한 것으로, 본 발명은 한글 필기 시 펜이 움직인 방향 중 상·하의 수직선 방향을 0o와 180o라 할 때, 30o와 60o사이의 한 각과 210o와 240o사이의 한 각을 취하여 두 각 사이의 원의 좌측상부영역을‘이음선 영역’으로 정의하고 원의 우측하부영역을‘획 구성 영역’으로 정의하는 단계와; 펜의 이동정보 중 그 이동방향이 상기 ‘획 구성 영역’에 속하는 성분은 '획 성분'으로 구분하고 상기‘이음선 영역’에 속하는 성분은 '이음선 성분'으로 구분하여, '획 성분' 사이의 '이음선 성분'을 분리하여 냄으로써 연속적으로 쓰여진 글자의 획을 분리해 내는 단계와;

Description

자소 조합형 한글 필기인식 방법{A method of recognizing Hangl cursive script}
본 발명은 온라인 필기인식 시스템에 사용되는 조합형 한글 필기인식방법에 관한 것으로, 더욱 상세하게는 단말기의 테블릿에 펜을 이용하여 연속으로 이어 쓴 한글 필기체의 획을 분리하고, 한글의 초성부분을 정확히 인식하는 방법에 관한 것이다.
일반적으로 인간의 필기를 인식하고자 하는 방법은 필기가 진행되고 있는 동안에 필기를 인식하는 온라인(on-line)인식과 필기가 끝난 후 인식을 하는 오프라인(off-line)인식으로 나누어진다.
상기 오프라인 인식은 카메라(Camera)나 스캐너(Scanner) 등의 입력장치를 이용하여 이미 쓰여지거나 인쇄되어 있는 문자들을 인식하기 위한 것으로 대량의 정보를 빠르게 컴퓨터에 입력시킬 수 있다는 장점이 있다.
반면, 온라인인식은 필기 중에 인식을 수행하게 됨으로 필기자의 필기 속도 이상의 인식 속도를 얻기 어렵다는 단점이 있지만, 키보드를 대신하는 정보 입력의 수단으로 PDA(Personal Digital Assistant)등의 입력수단으로 유용하다.
일반적으로, 필기인식의 난이도는 필기의 제약정도와 필기변형의 정도에 따라 구분될 수 있으며, 정자(正字)체의 경우 획수의 변형이 적고, 필기의 제약이 가능하기에 인식이 비교적 용이하다. 그러나 온라인 필기 인식 대상 중 흘려 쓴 필기의 인식은 필기인식 시스템에서 그 획을 정확히 초성, 중성, 종성으로 인식하기란 사실상 어려운 일이다.
왜냐하면, 첫째는 필기의 변형이 크다는 점이고, 둘째는 그러한 변형으로 인하여 필기 문자를 자소별로 분리하기가 용이하지 않다는 것이다.
도 1은 일반적인 한글 조합인식장치의 한글인식단계를 나타낸 개략적인 블록도로서 일반적으로 테블릿(tablet)을 통해 입력된 글자를 획 단위(stroke) 즉, 펜 다운(pen-down)에서 펜업(pen-up)까지 펜이 지나간 궤적을 하나의 단위로 하여 분리하고, 도시한 바와 같이 전처리부(10)에서 거리필터링과 후크(hook)의 제거를 통해 의미 없는 점을 제거하고 잡음으로 입력된 점을 삭제하는 과정을 거친다.
상기 전처리부(10)를 거친 입력점들은 도시한 특징추출부(11)에서 정해진 특징으로 표현하게 되는데 이때는 자소 인식부(13)에서 필요한 특성 값 예를 들어 입력 점 들 간의 이동방향과 길이를 특징으로 삼기도 하고, 전체 획을 특징화하기 위해 시작각과 끝 각, 획을 포함할 수 있는 최소의 사각형, 시작점과 끝점과의 거리, 획의 총 길이 등을 특징으로 삼기도 한다.
다음으로 특징추출부에서(11)의 특징추출이 끝나면 입력 획을 기준 획으로 인식하는 자소인식부(13)로 넘어가게 된다.
자소인식부(13)에서는 입력 획 들을 초성 중성 종성으로 분류하고, 분류된 각 자소를 소정의 데이터베이스와 비교하여, 그 중 가장 유사성이 높은 자소의 문자값을 선택하여 초성, 중성, 종성의 값을 산출하게 된다.
이때, 입력된 획 중 오인식된 부분은 오인식보정부(15)에서 보정이 된 후 각 자소의 값을 조합하여 결과를 출력하게 된다.
그러나 상기와 같은 종래의 기술을 사용한 자소 조합형 한글 필기인식시스템은 획을 구분하지 않은 흘림체로 쓴 경우에는 글자 전체를 하나의 획으로 인식하게 되어 오인식 또는 미인식이 발생하게 된다.
또한, 획을 구분하여 쓴 필기체의 경우에도, ‘긔’와‘키’, ‘지’와‘거’,‘더’와 ‘티’같은 글자들은 중간 부분의 획을 초성으로 분류하는가, 중성으로 분류하는가에 따라 인식된 결과 값이 달라지게 된다.
따라서, 본 발명에 따른 한글 필기체 인식방법은 한글 필기체의 획들을 본래의 획수에 맞게 재 분리하고, 분리된 획 들을 초성, 중성, 종성으로 재분류하고 그 초성 부분을 정확히 인식할 수 있는 자소 조합형 필기 인식 방법을 제시하고자 하는데 그 목적이 있다.
도 1은 종래의 한글 필기인식방법을 개략적으로 도시한 블럭도이고,
도 2는 본 발명에 따른 한글 필기인식방법을 개략적으로 도시한 블럭도이고,
도 3은 글자를 이루는 획 구성 요소 들의 방향성분을 나타낸 단면도이고
도 4a는 본 발명에 따른 한글 필기체의 획 분리를 위해 획 성분영역과 이음선영역의 설정방법을 설명하기 위한 단면도이고,
도 4b는 본 발명에 따른 획성분영역과 이음선영역의 설정방법에 따라 임의의 획성분영역과 이음선영역을 설정한 예를 나타낸 단면도이고,
도 5는 글자를 이루는 점들을 연결하여 동일한 방향성을 갖는 선분들로 나눈 임의의 흘림체를 표현한 개략도이고,
도 6은 본 발명에 따른 초성 인식단계를 개략적으로 도시한 흐름도이다.
전술한 바와 같은 목적을 달성하기 위해 본 발명에 따른 한글 필기인식방법은 단자음 14자의 자소에 대한 필기모양을 모아 제 1 데이터베이스를 구축하는 단계와; 초성을 기준 하여 초성의 우측과 하측에 각각 위치 할 수 있는 모음 자소의 필기모양을 모아 제 2 데이타베이스와 제 3 데이타베이스를 각각 구축하는 단계와; 여러 획으로 나누어진 한글의 필기모양 중 자음과 모음의 분류위치에 따라 그 인식된 값이 달라질 수 있는 필기모양과 한글의 초성에 쓰일 수 있는 복자음의 필기모양을 보아, 제 4 데이타베이스를 구축하는 단계와; 입력된 획 중 순차적으로 획을 취하고 상기 제 1 데이터베이스와 비교하여 초성을 설정하는 단계와; 상기 설정된 초성과 근접한 일부 획들을 조합한 모양이 미리 정의된 상기 제 4 데이터베이스에 포함된 필기모양 중 하나에 해당 될 경우에는 초·중성의 분리상의 오류를 보정하여 초성을 재 설정하는 단계와; 상기 인식된 초성의 획을 제외한 한글 필기체의 일부 획을 취하여 상기 제 3 데이터베이스와 제 4 데이터베이스와 비교하여 중성을 인식하는 단계와; 상기 초성과 중성의 획을 제외한 나머지 획이 1획 이상일 경우에는 그 획들을 조합하여 종성으로 인식하는 단계와; 상기 인식된 초성, 중성, 종성을 조합하여 문자 값을 완성하는 단계를 포함한다.
바람직하게는 상기 초성 값을 재 설정하는 단계에서 검출된 초성의 필기모양이 획을 추가하거나 마지막 획을 삭제함으로써 다른 자음으로 변화될 수 있는 경우에만 초·중성 분리 오류 보정 단계를 수행하는 것을 특징으로 한다.
바람직하게는 상기 중성인식 방법은 상기 인식된 초성을 포함하는 최소한의 사각형의 영역을 설정하고 모음 중 그 첫 획의 중심점이 설정된 사각형의 우변의 중심점에 가까우면 상기 '우변모음 데이터베이스'로부터 그 모음의 값을 인식하고, 모음중 첫획의 중심점이 설정된 사각형의 하변의 중심점에 가까우면 상기 '하변모음 데이터베이스'로부터 그 모음의 값을 인식하는 단계를 더욱 포함하는 것을 특징으로 한다.
본 발명의 다른 특징에 따른 한글 흘림체의 획 분리방법은 필기시 펜의 이동방향 중, 상·하 수직선 방향을 00, 1800라 하고, 그 값이 시계방향으로 증가한다고 할 때, 30o와 60o사이의 임의의 값을 취하여 각 A라 정의하고, 2100와 240o사이의 임의의 값을 취하여 각 B라 정의하는 단계와; 각 A와 각 B로 나누어진 우측하부의 영역을 '획 성분 영역'이라 정의하고, 그 나머지 영역을 '이음선 영역'이라고 정의하는 단계와; 상기 필기 시 펜의 이동정보 중 그 이동방향이 상기 정의된 "획 성분 영역"에 속하는 성분은 "획 성분"으로 구분하고, 그 이동방향이 이음선 영역에 속하는 것은 "이음선 성분"으로 구분하는 단계와; "획 성분"과 "획 성분" 사이에 위치한 "이음선 성분"을 분리함으로로써 획을 분리해 내는 단계를 포함한다.
바람직하게는 획 선분과 이음 선을 분리해 내는 단계에서 분리된 이음선 성분과 그 전의 획 성분을 합한 모양이 '??'과 일치하는 경우에는 이음선 성분을 그 전 획에 포함시키는 단계를 더욱 포함하는 것을 특징으로 한다.
이하 첨부한 도면을 참조하여 본 발명의 바람직한 실시 예를 설명하도록 한다.
- 실시 예-
도 2는 본 발명에 따른 조합형 한글 필기 인식방법을 개략적으로 도시한 블록 도로서, 도시한 바와 같이 획은 전처리부(110)에서 테블릿을 통하여 입력된 펜의 이동좌표 중, 일정거리 사이의 점들을 제거하는 거리 필터링, 일정각 이내의 두 선분을 합병하는 각 필터링, 펜의 미끄러짐 때문에 발생하는 훅 제거등을 수행하여 잡선을 제거하고 펜의 이동정보를 간략화 한다.
다음으로 상기 전처리부(110)에서 간략화된 획은 도시한 바와 같이 특징추출부(111)를 거치면서 입력된 글자의 연결된 획을 소정의 방법에 의해 분리하는 과정을 거치게 된다. 다음으로 상기 특징추출부(111)를 거쳐 인식된 획들은 자소인식부(113)로 넘어가게 된다.
자소인식부(113)에서는 한글 필기체의 시작부분의 획들을 취하여 단자음 데이터베이스(115)에 저장된 필기모양들과 비교 판별함으로써 초성을 인식하고,초성과 그 연접한 획들을 미리 구축한 "초·중성 분리 오류 보정용 데이터베이스"(117)와 비교 판단하여 인식 오류를 보정하게 된다.
전술한 방법으로 초성을 인식하게 되고, 인식된 초성을 중심으로 그 첫획이 초성의 우변에 가까운 모음을 우변모음으로 구별하고 초성의 하변과 가까운 거리에 있는 모음을 하변모음으로 구별하여 각각 우변모음 데이터베이스(119), 하변모음 데이터베이스(121)로부터 해당 중성을 인식하는 중성인식 단계를 거치고, 다음으로 종성인식단계를 거치면서 문자가 조합되고 이때 조합된 문자에 오인식이 발생하였을 경우 오인식보정부(125)를 거쳐 보정됨으로서 문자를 출력하게 된다.
이하 본 발명에 대해 세부적으로 설명하면, 한글필기 인식을 위해서는 먼저 한 획으로 이어쓴 한글을 여러 획으로 다시 분리하는 과정을 거치게 된다.
한글의 자음과 모음의 각 획은 ‘ㅡ’,‘ㅣ’,‘/’,‘\’,‘??’의 5가지 요소의 조합으로 이루어져 있다. 도 3은 ‘ㅇ’를 제외한 요소들을 그 직선의 기울기에 따른 방향 표시를 개략적으로 도시한 것으로‘ㅡ’,‘ㅣ’,‘/’,‘\’ 각 요소는 90o(200), 180o(211), 225o(213), 135o(215)방향의 선분과 거의 유사하며, 원의 좌 상부의 영역에 속하는 방향을 가진 성분이 전혀 없다는 것을 알 수 있다.
따라서, 도 4a에 도시한 바와 같이, 30o와 60o사이의 임의의 값을 취하여 각 A라 하고, 210O와 240O사이의 임의의 값을 취하여 각 B라 할 때, 상기 각 A와 각 B에 의해 구분되는 원의 좌측상부를 "이음선 영역"으로 정의하고, 원의 우측하부를 "획성분 영역"으로 정의한 뒤, 펜의 이동정보 중 그 이동방향이 상기 ‘획 성분 영역’에 속하는 성분은 '획 성분'으로 구분하고 상기‘이음선 영역’에 속하는 성분은 '이음선 성분'으로 구분하여, '획 성분' 사이의 '이음선 성분'을 분리하여 냄으로써 연속적으로 쓰여진 글자의 획을 분리해낼 수 있다.
단, 상기 방식은 상기‘ ㅇ’요소를 가진 자소를 다른 자소와 연이어 썼을 경우엔 그 획의 분리 시 오류가 발생 할 수 있으나, 분리된 이음 선과 그 전의 획을 합한 모양이 ‘ ㅇ’과 유사한 경우에는 그 전 획에 이음선 부분까지도 포함시킴으로써 그 오류를 방지할 수 있다.
도 4b는, 위의 방법에 따라 "획 성분영역"과 "이음선 영역"을 설정한 예시도로서, 30O와 60O사이의 값 중 45O를 취하고 210O와 240O사이의 값 중 225O를 취하여 두 각에 의하여 나누어진 45O와 225O사이의 영역을 "획 성분 영역"으로 구분하고 그 나머지를 "이음선 영역"으로 구분한 단면도이다.
예를 들어 상세히 설명하면, 도 5에 도시한 바와 같이 흘림체로 쓰인 "그"는 "ㄱ"과 "ㅡ"를 잇는 불필요한 이음 선을 삭제해 줄 필요가 있다.
도시한 바와 같이 "그"라는 글자가 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j'의 성분으로 나누어진다고 가정할 때, 'e'와 'f'는 그 방향이 도 4b의 이음선영역(C)에 속하는 '이음선 성분'임을 판별할 수 있다.
또한 "e"와 "f"의 양단에 위치한 "d"와 "g"는 그 방향이 획성분영역(D)에 속하는 '획 성분'이므로, 결과적으로 인식프로세서는 흘림체로 입력된 "그"자에서 "d"와 "g"의 두 개의 '획 성분' 사이에 위치한 "e"와 "f"의 '이음선 성분'을 제거함으로써 "ㄱ"과 "ㅡ"를 분리하게 된다.
다음으로, 한글필기체의 초성을 인식하는 과정을 위해 먼저, 표 1에 도시한 바와 같이 한글의 자음 중 그 필기 시 획을 추가하거나 그 마지막 획을 삭제하여 다른 자음으로 변환시킬 수 있는 자음들을 모아 가변 자음 표를 구성한다.
[표 1]
가변자음
표 다음으로, 단자음 14자에 대하여 그 필기모양을 모아‘단자음 데이터베이스’를 구축하고 각 항목마다 해당 자음 값을 함께 저장한다.
다음은 표 2 에 도시한 바와 같이, 한글 필기체의 자음과 모음의 분류 위치에 따라 그 인식된 문자 값이 달라질 수 있는 필기모양들과 초성에 사용될 수 있는 복자음의 필기모양을 모아 "초·중성 분리오류 보정 용 데이터베이스"를 구축하고, 각 항목마다 해당 필기모양 중 초성의 값과 초성의 획수를 산출하여 함께 저장한다. 예를 들어, '그'는 초성의 값이 'ㄱ'이고, 초성의 획수는 1이다.
[표 2]
초성 복자음
자음과 모음의 분류위치에 따라 그 문자값이 달라 지는 필기법
다음으로 중성인식 단계를 위해 초성의 위치를 중심으로 그 첫 획이 초성의 우측에 위치하는 모음을‘우변모음’, 초성의 하측에 위치하는 모음을‘하변모음’으로 분류하고, 우변모음, 즉,‘ㅏ’,‘ㅑ’,‘ㅓ’,‘ㅕ’,‘ㅐ’,‘ㅒ’,‘ㅔ’,‘ㅖ’, ‘ㅣ' 의 자소에 대한 필기모양을 모아 "우변모음데이터베이스"를 구축하고 각 항목마다 해당 모음값을 함께 저장하고, 하변모음, 즉,‘ㅗ’,‘ㅛ’,‘ㅜ’,‘ㅠ’,‘ㅡ’,‘ㅘ’‘ㅙ’‘ㅚ’‘ㅝ’‘ㅞ’‘ㅟ’의 자소에 대한 필기모양과 "하변모음데이터베이스"를 구축하고 각 항목마다 해당 모음값을 함께 저장한다.
전술한 바와 같이 초성, 중성, 종성을 인식하기 위한 준비단계가 끝나면 먼저 초성인식 단계에 들어가게 되는데 초성인식 단계는 도 6을 참조하여 설명하도록 한다.
도 6은 조합형 한글 필기 인식방법에서 초성인식 단계를 위한 개략적인 흐름도로서, 입력된 글자가 "끄"자라고 가정할 때, 제 1 단계(400st)는 입력된 글자의 획 중 첫 획의 시작점부터 n번째 획의 끝점까지를 초성영역으로 구분하는 단계로서, "끄"의 첫획부터 n=1번째 획까지를 포함하는 영역, 즉 , "끄"의 'ㄱ'부분의 획을 초성영역으로 설정하게 된다.
제 2 단계(413st)는 '단자음 데이터베이스'에서 초성영역의 필기모양과 일치하는 필기모양을 가진 항목을 검색하여 그 문자 값을 판별하는 단계로서, 상기 "끄"의 경우 그 첫획이 단자음 'ㄱ'과 같기 때문에 그 결과 값으로 'ㄱ'을 얻게되므로, 제 3 단계(415st)에서는 'ㄱ'이 초성으로 설정되고, 초성의 획수는 n=1 로 설정된다.
다음으로 제 4 단계(417st)는 인식된 자음이 가변자음이며, n의 값과 초성의 획수가 같은가를 판단하여 초·중성의 분리오류 보정의 수행 여부를 결정하는 단계이다.
상기 '끄'의 경우, 상기 제 4 단계(417st)에서 설정된 초성의 값 'ㄱ'이 가변자음이고 현재 초성의 획수=1, n=1 의 값이 서로 같으므로 제 5 단계(421st) 즉, 초·중성의 분리오류 보정부(123)로 넘어가게 된다.
제 5 단계(421st)에서는 초성과 중성의 분리 오류를 보정하기 위하여 검사해야 하는 보정영역의 '마지막 검사획'을 구한다. 이 때, 전술한 '초·중성 분리오류 보정용 데이터 베이스'(121)에 포함된 필기모양 중 가변자음의 획을 제외한 최대획수, 즉 'ㅃ'8획 중 전반부의 'ㅂ'의 획수를 뺀 4획을 초성의 획수에 더한 값과 입력된 글자의 전체획수와 비교하여 그 최소값을 '마지막 검사획'의 값으로 설정한다.
상기 "끄"의 경우에는 n=1이므로 (n+4)의 값이 5이고 전체획수는 3획이므로 두 값의 최소값인 3이 '마지막 검사획'의 값이 된다.
다음으로 제 6 단계(423st)에서는 보정영역에 한 획을 더 추가하는 과정이다. 상기 "끄"의 경우, 현재 n의 값이 1이므로, 1을 더하게 되면 n=2의 값이 된다.
다음으로 제 7 단계(425st)에서는 제 5단계에서 구한 '마지막 검사획'의 값과 n의 값을 비교하여 n의 값이 '마지막 검사획'의 값보다 크면 초·중성 분리오류 보정단계를 끝내고, 중성인식단계로 전환한다.
"ㄲ"의 경우, n=2의 값은 마지막 검사획=3 보다 작으므로 제 8 단계(427st)를 수행하게 되는데, 제 8단계(427st)에서는 보정영역의 필기 모양과 전술한 '초·중성 분리오류 보정용 데이터 베이스'(121)에 포함된 필기모양을 서로 비교하여 그 모양이 유사한 항목을 검출하는 단계이다.
만약 일치되는 항목의 검출에 성공하게 되면 제 9단계(427st)에서 해당 항목의 초성 값을 취해 초성의 값을 재 설정하고, 해당 항목의 초성획수를 취해 초성획수를 재 설정하게 된다.
즉 상기 "끄"의 "ㄲ"은 '초·중성 분리오류 보정용 데이터 베이스'(121)에 포함되어 있으므로 "ㄲ"이 초성으로 재 설정되고, 초성의 획수는 2로 재 설정되며,제 4단계(417st)를 재 수행하게 되나, "ㄲ"은 가변자음이 아니므로 초·중성의 분리오류 보정부(123)의 수행을 마치고 중성 인식 단계(419st)로 넘어가게 된다.
이 후, 중성을 인식하는 단계에서는 먼저 초성영역을 포함하는 가장 작은 사각형을 구하고, 중성의 첫 번째 획의 중심점이 사각형의 우변의 중심점에 더 가까이 있으면 '우변모음'으로 분류하고, 중성의 첫 번째 획의 중심점이 상기 사각형의 하변의 중심점에 가까우면 '하변모음'으로 분류하여 각각 전술한 "우변모음 데이터베이스"와 "하변모음 데이터베이스"를 검색하여 그와 일치되는 모음을 찾아내어 가장 많은 획수를 취하여 얻어진 모음의 값을 중성으로 설정한다.
다음으로 초성과 중성을 제외한 나머지 획이 1획 이상일 경우에는 그 획들을 조합하여 종성으로 인식하게 된다.
전술한 바와 같이 인식된 초성, 중성, 종성을 조합하여 입력된 문자 값을 완성하게 된다.
본 발명에 따른 자소 조합형 한글 필기 인식방법은 인식된 글자의 방위에 따라 소정의 위치에서 획과 획을 잇는 이음영역을 분리해 내는 방법을 통해 쉽게 획을 분리할 수 있고, 또한 가변자음표를 만들고 가변자음의 여러 변형 예를 "초·중성 분리보정용 데이터베이스"를 이용하여 비교 판단하도록 하고 이를 바탕으로 초·중성 오류를 보정하는 형식을 사용함으로써, 온라인 필기인식중 특히 초성의 인식과정 중 발생하는 오인식이나 미인식을 방지하여 정확한 한글필기 인식을 가능하도록 하는 효과가 있다.

Claims (5)

  1. 단자음 14자의 자소에 대한 필기모양을 모아 제 1 데이터베이스를 구축하는 단계와;
    초성을 기준 하여 초성의 우측과 하측에 각각 위치 할 수 있는 모음 자소의 필기모양을 모아 제 2 데이타베이스와 제 3 데이타베이스를 각각 구축하는 단계와;
    여러 획으로 나누어진 한글의 필기모양 중 자음과 모음의 분류위치에 따라 그 인식된 값이 달라질 수 있는 필기모양과 한글의 초성에 쓰일 수 있는 복자음의 필기모양을 보아, 제 4 데이타베이스를 구축하는 단계와;
    입력된 획 중 순차적으로 획을 취하고 상기 제 1 데이터베이스와 비교하여 초성을 설정하는 단계와;
    상기 설정된 초성과 근접한 일부 획들을 조합한 모양이 미리 정의된 상기 제 4 데이터베이스에 포함된 필기모양 중 하나에 해당 될 경우에는 초·중성의 분리상의 오류를 보정하여 초성을 재 설정하는 단계와 ;
    상기 인식된 초성의 획을 제외한 한글 필기체의 일부 획을 취하여 상기 제 3 데이터베이스와 제 4 데이터베이스와 비교하여 중성을 인식하는 단계와;
    상기 초성과 중성의 획을 제외한 나머지 획이 1획 이상일 경우에는 그 획을을 조합하여 종성으로 인식하는 단계와;
    상기 인식된 초성, 중성, 종성을 조합하여 문자 값을 완성하는 단계
    를 포함하는 조합형 한글 인식방법.
  2. 제 1 항에 있어서,
    상기 초성 값을 재 설정하는 단계에서 검출된 초성의 필기모양이 획을 추가함으로써 다른 자음으로 변화될 수 있는 경우에만 초·중성 분리 오류 보정단계를 수행하는 조합형 한글 필기인식방법.
  3. 제 1 항에 있어서,
    상기 중성인식 방법은 상기 인식된 초성을 포함하는 최소한의 사각형의 영역을 설정하고 모음 중 그 첫 획의 중심점이 설정된 사각형의 우변의 중심점에 가까우면 상기 '우변모음 데이터베이스'로부터 그 모음의 값을 인식하고, 모음 중 그 첫 획의 중심점이 설정된 사각형의 하변의 중심점에 가까우면 상기 '하변모음 데이터베이스'로부터 그 모음의 값을 인식하는 단계를 더욱 포함하는 조합형 한글 인식방법.
  4. 한글 흘림체의 필기시 그 펜의 이동방향 중, 상·하 수직선 방향을 00, 1800라 하고, 그 값이 시계방향으로 증가한다고 할 때, 30o와 60o사이의 임의의 값을 취하여 각 A라 정의하고, 2100와 240o사이의 임의의 값을 취하여 각 B라 정의하는 단계와;
    상기 각 A와 상기 각 B로 나누어진 우측하부의 영역을 '획 성분 영역'이라 정의하고, 그 나머지 영역을 '이음선 영역'이라고 정의하는 단계와;
    상기 필기 시 펜의 이동정보 중 그 이동방향이 상기 정의된 "획 성분 영역"에 속하는 성분은 "획 성분"으로 구분하고, 그 이동방향이 이음선 영역에 속하는 것은 "이음선 성분"으로 구분하는 단계와;
    "획 성분"과 "획 성분" 사이에 위치한 "이음선 성분"을 분리함으로로써 획을 분리해 내는 단계
    를 포함하는 한글 흘림체 획 분리방법.
  5. 제 4 항에 있어서,
    획 선분과 이음선을 분리해 내는 단계에서 이음선 성분과 그 전의 획 성분을 합한 모양이 'ㅇ'과 일치하는 경우에는 이음선 성분을 그 전 획에 포함시키는 단계
    를 더욱 포함하는 한글 흘림체 획 분리방법.
KR1019990009923A 1999-03-23 1999-03-23 자소 조합형 한글 필기인식 방법 KR20000061110A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990009923A KR20000061110A (ko) 1999-03-23 1999-03-23 자소 조합형 한글 필기인식 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990009923A KR20000061110A (ko) 1999-03-23 1999-03-23 자소 조합형 한글 필기인식 방법

Publications (1)

Publication Number Publication Date
KR20000061110A true KR20000061110A (ko) 2000-10-16

Family

ID=19577461

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990009923A KR20000061110A (ko) 1999-03-23 1999-03-23 자소 조합형 한글 필기인식 방법

Country Status (1)

Country Link
KR (1) KR20000061110A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190046582A (ko) * 2017-10-26 2019-05-07 주식회사 매직핑거 필기 문서의 문자 판정 장치 및 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190046582A (ko) * 2017-10-26 2019-05-07 주식회사 매직핑거 필기 문서의 문자 판정 장치 및 방법

Similar Documents

Publication Publication Date Title
KR100249055B1 (ko) 문자인식장치및방법
EP2943911B1 (en) Process of handwriting recognition and related apparatus
EP1564675B1 (en) Apparatus and method for searching for digital ink query
Lu et al. A background-thinning-based approach for separating and recognizing connected handwritten digit strings
EP0564827B1 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
JPH0844826A (ja) 手書き入力照合方法
Davis et al. Recognition of handwritten characters—a review
Lehal et al. Feature extraction and classification for OCR of Gurmukhi script
Bhattacharya et al. An end-to-end system for Bangla online handwriting recognition
Arani et al. Handwritten Farsi word recognition using NN-based fusion of HMM classifiers with different types of features
US5659633A (en) Character recognition method utilizing compass directions and torsion points as features
KR101546429B1 (ko) 필기체 인식 시스템 및 인식방법
KR20000061110A (ko) 자소 조합형 한글 필기인식 방법
US6175651B1 (en) On line-character recognition method and device
JP3675511B2 (ja) 手書き文字認識方法及び装置
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
JP2677271B2 (ja) 文字認識装置
JP2671985B2 (ja) 情報認識方法
KR100301216B1 (ko) 온라인문자인식장치
KR970000276B1 (ko) 필기체 문자인식방법
KR960013818B1 (ko) 다중획인식을 이용한 한글조합인식장치
Suen et al. Farsi script recognition: a survey
JPH07107698B2 (ja) 文字認識方法
Moradi et al. A trainless recognition of handwritten Persian/Arabic letters using primitive elements

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
N231 Notification of change of applicant
E902 Notification of reason for refusal
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
NORF Unpaid initial registration fee