KR940003828B1 - 온라인 필기체 한글인식 방법 - Google Patents

온라인 필기체 한글인식 방법 Download PDF

Info

Publication number
KR940003828B1
KR940003828B1 KR1019910024905A KR910024905A KR940003828B1 KR 940003828 B1 KR940003828 B1 KR 940003828B1 KR 1019910024905 A KR1019910024905 A KR 1019910024905A KR 910024905 A KR910024905 A KR 910024905A KR 940003828 B1 KR940003828 B1 KR 940003828B1
Authority
KR
South Korea
Prior art keywords
recognition
stroke
strokes
initial
recognizing
Prior art date
Application number
KR1019910024905A
Other languages
English (en)
Other versions
KR930014164A (ko
Inventor
강민석
Original Assignee
주식회사 금성사
이헌조
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 금성사, 이헌조 filed Critical 주식회사 금성사
Priority to KR1019910024905A priority Critical patent/KR940003828B1/ko
Publication of KR930014164A publication Critical patent/KR930014164A/ko
Application granted granted Critical
Publication of KR940003828B1 publication Critical patent/KR940003828B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)

Abstract

내용 없음.

Description

온라인 필기체 한글인식 방법
제1도는 종래의 한글 인식 처리 흐름도.
제2도는 본 발명의 온라인 필기체 한글인식방법에 대한 처리 흐름도.
제3도는 확장된 획의 굴곡 방향에 의한 분류표.
제4도는 본 발명에 의해 정의된 스트로크 및 그 인식 코드표.
제5도는 본 발명 초성 인식시의 스트로크 및 그 초성종류 트리.
제6도는 본 발명 중성인식시의 처리 흐름도.
제7도는 제6도에 의한 중성인식시의 모음 약자표.
제8도는 기본 스트로크 인식루틴을 도시한 것으로, a도 내지 e도는 스트로크 수에 의한 인식루틴.
제9도는 본 발명 종성인식시의 인식되는 자음 도표.
제10도는 본 발명 오인식 보정시의 설명도.
본 발명은 스트로크 인식을 통한 온라인 한글인식과 흘려쓰는 경우의 인식 및 틀리게 입력되는 획순을 조정하여 한글을 인식하도록 한 온라인 필기체 한글인식에 관한것으로 특히 자모를 인식하도록 하여 인식률을 향상시키도록 한 온라인 필기체 한글인식 방법에 관한 것이다.
종래의 한글인식처리 흐름도는 제1도에 도시된 바와 같이 입력되는 스트로크 정보중 인식시에 필요없는 테이타를 제거하는 전처리단계와, 이 단계에서 전처리된 데이타에 대해 특징점을 추출하는 특징점추출단계와, 이 단계에서 추출된 특징점에 따라 스트로크를 인식하는 스트로크인식단계와, 이 단계에서 인식된 스트로크수에 의한 1차분류와, 스트로크 매칭에 의한 2차분류 및 퍼지추론에 의한 3차분류하여 문자를 인식하고 그 인식결과를 출력하는 스트로크 분류 및 출력단계로 구성된다.
이와 같이 구성된 종래의 한글인식에 있어서 태블릿(tablet)에 사용자가 어떤 정보를 입력하면 그 정보를 기억하게 되는데, 이 입력된 정보에는 실제로 한글을 인식하는데 필요하지 않은 정보들이 많이 존재하므로 그 불필요한 정보를 제거하기 위하여 태블릿 위에 필기할 때 펜의 시작점과 끝점에서 발생하는 훅(hook) 및 필기시 잘못하여 찍힌 점들을 제거하기 위하여 샘플포인트가 2개 이하인 스트로크를 제거하는 전처리를 행하고, 이 전처리를 거치고 나온 정보를 이용하여 스트로크를 인식하는데 필요한 스트로크의 길이, 시작점과 끝점간의 거리등을 구하여 특징값을 추출하며, 이 추출된 특징들을 이용하여 각각 정의된 스트로크(Stroke)를 인식하게 되고, 인식된 스트로크를 통하여 한글을 인식한다.
상기 한글인식을 인식대상 문자 수를 줄이기 위하여 표준한글 2350자를 데이타 베이스로 만들어 놓아 한글에 대해 스트로크 매칭을 하면 시간이 많이 소요되므로 스트로크 수에 의해 스트로크 수가 같은 후보문자들만 분류하는 1차분류를 행한 다음 1차분류 과정에서 선택된 후보문자중에서 스트로크 매칭을 하는 2차분류를 통해 기본 스트로크 코드열이 같은 문자를 추출한다.
상기에서 2차분류를 하면 대강 3개∼15개 정도의 한글 후보문자가 추출되면 3차분류 과정에서 최종적으로 인식결과를 얻어내기 위하여 2차분류에서 추출된 후보문자중에서 스트로크 간의 상대적 위치정보를 이용하연 최종인식 결과를 얻어내게 되는데, 여기에서는 퍼지추론이 이용된다.
그러나, 이와 같은 한글인식에 있어서 자모를 분리하여 인식하는 것이 아니라 스트로크의 매칭으로 인식하므로써 인식되어져야할 문자가 저장되어 있어야 하므로 메모리를 많이 차지하고, 스트로크 매칭에 많은 시간이 소요되는 점과 한 스트로크만 잘못 인식하여도 그 문자를 인식할 수 없는 치명적인 문제점을 가지고 있다.
상기와 같은 종래의 결함을 해결하기 위하여 본 발명은 자모를 분리 인식하여 인식률을 향상시킴과 아울러 자음과 모음의 각 흘림체에 대해서도 어느정도 수용할 수 있도록 한 온라인 필기체 한글인식방법을 창안한 것으로 이하 첨부된 도면을 참조하여 설명하면 다음과 같다.
제2도는 본 발명의 한글인식 처리 흐름도로서 입력되는 스트로크 정보를 거리필터링, 각 필터링, 후크제거등을 수행하여 인식시에 필요없는 데이타를 제거하는 전처리단계와, 상기 단계에서 전처리된 데이타에 대해 특징점을 추출하는 특징점 추출단계와, 상기 단계에서 추출된 특징점에 의한 스트로크를 회전방향에 따라 분류하는 스트로크 분류단계와, 상기 단계에서 분류된 스트로크를 특징값에 의해 인식하도륵 하는 스트로크 인식단계와, 상기 단계에서 인식되는 시작스트로크에 따라서 나올 수 있는 초성의 종류를 트리로 만든 후 각 시퀀스에 따라서 초성을 인식하는 초성인식단계와, 상기 단계에서 초성을 인식하고 남은 스트로크의 갯수에 따라서 나올 수 있는 중성의 종류를 트리로 만든 후 각 시퀀스에 따라 중성을 인식하는 중성인식단계와, 상기 초성인식단계에서 사용한 트리를 다시 사용하여 종성을 인식하는 종성인식단계와, 상기 단계를 통해 인식된 스트로크가 오인식된 경우 이를 보정하는 오인식보정단계와, 상기 단계를 통해 보정되어 인식된 결과를 출력하는 출력단계로 이루어진다.
이와 같은 단계로 이루어진 본 발명의 작용 및 효과를 상세히 설명하면 다음과 같다.
태블릿(tablet)을 통해 사용자가 어떤 정보를 입력시키면 각 스트로크 별로 샘플링하여 디지타이저로 인가하면 펜의 궤적의 샘플점등은 그대로 스트로크 인식에 사용할 경우 다음과 같은 문제점이 발생하는데 이를 제거하기 위하여 일정 거리사이의 샘플점등을 제거하는 거리필터링과 각 필터링을 행하는 것은 다음과 같다.
거리필터링은 글씨를 천천히 쓸경우 같은 점이 반복되어 입력되므로 일정한 거리 사이의 샘플 포인트를 제거하는 것이고, 각 필터링은 스트로크 인식을 위해 스트로크의 방향 변화를 알기 위하여 시작점에서 다음 샘플 포인트간의 각이 45°이상인 점은 제거하고 45°가 넘는 최초의 점을 다음 샘플점으로 한다.
이와 같이하여 전처리를 하고, 전처리를 거치고 나온 정보를 이용하여 스트로크를 인식하는데 필요한 특징을 추출하며, 이 추출된 특징들을 이용하여 각각 정의된 스트로크를 인식한다.
특징점 추출된 스트로크는 제3도에 도시한 바와 같이 시계방향(-) 및 반시계방향(+)에 따라 기능 스트로크는 23개이고 이를 2-24까지 고유번호를 갖도록 하여 스트로크 분류코드를 8가지로 분류하고, 그 분류된 스트로크를 시작각, 끝각, 축적각, 특성값을 이용하여 제4도에서와 같이 23개의 스트로크를 인식해 낸다. 여기서 시작각은 시작점과 두번째점을 연결한 벡터의 방향이고, 끝각은 끝에서 두번째점과 끝점을 연결한 벡터의 방향이며, 축적각은 필터링이 끝난 점들을 연결한 벡터들사이의 차이각을 모두 더한 각이다.
이와 같이 분류된 스트로크들을 다시 세분하는데 사용되는 처리루틴은 다음과 같다.
-- 클래스 1 --
이 루틴은 직선으로 분류된 스트로크를 시작점과 끝점의 각에 따라 8가지 종류(360도를 8등분)로 나눈다.
-- 클래스 2 --
스트로크가 3점이고 Cff1이 한계값 보다 작으면 직선, 그렇지 않고 시작각이 위에서 아래로 떨어지면 13, 그렇지 않고 축적각이 500도 보다 크거나, 250도 보다 크면서 Cff2가 한계값 보다 크면 2, 그렇지 않으면 3.
-- 클래스 3 --
스트로크가 3점이고 Cff1이 한계값 보다 작으면 직선, 그렇지 않고 축적각이 500도 보다 크거나 250도 보다 크면서 Cff2가 한계값 보다 크면 2, 그렇지 않고 끝각이 45도 보다 크고 135도 보다 작으면 2.
-- 클래스 4 --
끝각이 밑에서 위로 을라가면 10, 그렇지 않고 시작각이 위에서 아래로 내러오면 22, 그렇지 않으면 9.
-- 클래스 5 --
축적각이 100도 이상이면 21, 그렇지 않고 끝각이 45도 보다 크고, 135도 보다 작으면 23, 그렇지 않으면 20.
-- 클래스 6 --
축적각이 50보다 크면 24, 그렇지 않으면 19.
-- 클래스 7 --
시작점이 위에서 아래로 내려오면 14, 그렇지 않으면 정의되지 않은 스트로크.
-- 클래스 8 --
끝각이 밑에서 위로 올라가지 않으면 12, 그렇지 않으면 11.
상기에서와 같이 각 필터링을 하고 나면 방향이 바뀔때 마다 한점씩만 남기므로 이 점들을 이용하여 각 스트로크가 시계방향으로 변하는지 반시계방향으로 변하는지를 알 수 있으므로 제3도와 같이 방향정보로 분류하고, 이 분류가 끝나면 특성값을 이용하여 제4도와 같은 스트로크들을 인식해 낸다.
상기와 같이 스트로크 인식이 끝나면 초성인식을 하게 되는데 초성인식의 순서는 제5도에 도시한 것과 같이 시작 스트로크에 따라서 나올 수 있는 초성의 종류를 트리(tree)로 만든 후 각 시퀀스에 따라서 초성을 인식하여 주어진 스트로크의 열 중에서 초성에 사용된 스트로크의 갯수를 중성인식부로 넘겨주면, 상기 중성인식부에서는 초성인식에서 인식하고 남은 스트로크열을 받아서 제6도에서와 같이 스트로크의 갯수에 따라서 각 시퀀스를 수행하여 중성을 인식하고 이 중성인식 후에 다시 종성인식을 하게 되는데 종성인식은 초성인식시에 사용된 트리를 다시 사용하여 인식되는 종성의 종류는 제9도에 도시한 바와 같다.
초성, 중성, 종성 인식이 끝나고 그 인식결과를 출력하고자 할때 제10도에서와 같이 받침 ㄹ의 마지막 스트로크가 ↘으로 오인식된 경우 ㄴ으로 보정해 주어 ㄹ을 제대로 쓰지 않은 경우에도 인식이 되도록 하는데, ↘을 ㄴ으로 바꾸어 주어 조건은 인식이 실패되고 스트로크 수가 3개가 남고 앞의 스트로크가 ㄱ↘인 경우이다.
지금까지 설명한 동작설명을 "금"이란 글자를 예를 들어 설명하면 다음과 같다.
태블릿을 통해 "금"이란 글자를 쓰게되면 스트로크 및 인식이 끝난 뒤 3(ㄱ), 8(ㅡ), 6(ㅣ). 3(ㄱ), 8(ㅡ)의 스트로크 열이 발생된다.
이와 같은 스트로크 열을 초성인식에 넣으면 제5도에서 3시퀸스를 거쳐 ㄱ을 인식하고, 이 인식된 ㄱ(3)을 제외한 8, 6, 3, 8을 제6도에서와 같은 중성인식 루틴에 인가시키면 남은 스트로크 수가 4개이므로, F4 rec 루틴으로 들어가 제8d도에서 보듯이 F3 rec 루틴으로 들어간다.
상기 F3 rec 루틴은 제8c도에서 보듯이 F2 rec 루틴으로 들어가고, 상기 F2 rec 루틴은 제8b도에서 보듯이 F1 rec 루틴으로 들어간다.
Fl rec 루틴은 제8a도에서 보듯이 →(8)를 Eu(-)로 인식을 하고 돌려준다.
그러면 Eu(-)는 다시 F2 rec, F3 rec를 거쳐 F4 rec로 돌아와 Eu(-)로 인식을 하고 중성인식 루틴을 끝낸다.
남은 스트로크인 6, 3, 8이 종성인식 루틴으로 들어오면 이 스트로크 열을 초성인식 루틴으로 보내게 된다.
그러면 제5도에서 보듯이 이 스트로크 열은 6시퀀스를 거쳐 ㅁ으로 인식한다.
ㅁ으로 인식하면서 6, 3, 8을 다 사용했으므로 남은 스트로크 열이 없어서 인식을 끝낸다.
이와 같이 인식결과 "금"이라는 글자를 출력한다.
이상에서 상세히 설명한 바와 같이 본 발명은 자모를 분리 인식하므로써 인식률을 향상시키고 자음과 모음의 각 흘림체에 대해서도 어느정도 수용할 수 있고, 특히 완전한 흘림체 인식으로 가기위한 교두보 역할을 할 수 있도록 함과 아울러 앞으로 펜 컴퓨터나 입력장치로서 사용될 수 있고, 전자레인지처럼 한글화된 입력이 필요한 제품에 키보드나 복잡한 버튼없이 간단히 입력할 수 있도록 한 효과가 있다.

Claims (3)

  1. 입력되는 스트로크 정보를 거리 필터링, 각 필터링 및 후크 제거등을 수행하여 인식시에 필요없는 데이타를 제거하는 전처리단계와, 상기 전처리단계에서 전처리된 데이타에 대해 특징점을 추출하는 특징점추출단계와, 상기 특징점추출단계에서 추출된 특징점에 의한 스트로크가 시계방향으로 변하든지 반시계방향으로 변하는지에 따른 정보를 이용하여 스트로크를 분류하는 스트로크 분류단계와, 상기 스트로크 분류단계에서 분류된 스트로크를 특성값을 이용하여 스트로크를 각각 인식하도록 하는 스트로크 인식단계와, 상기 스트로크 인식단계에서 인식된 시작스트로크에 따라 트리(tree)를 이용하여 초성을 인식하는 초성인식단계와, 상기 초성인식단계에서 초성을 인식하고 남은 스트로크의 갯수에 따라서 나올 수 있는 중성의 종류를 트리로 만든 후 각 시퀀스에 따라 중성을 인식하는 중성인식단계와, 상기 초성인식단계에서 초성인식시에 사용한 트리를 다시 이용하여 종성을 인식하는 종성인식단계와, 상기 종성인식단계를 통해 오인식된 스트로크를 보정하는 오인식 보정단계와, 상기 오인식 보정단계에서 보정된 인식결과를 출력하는 출력단계로 이루어짐을 특징으로 하는 온라인 필기체 한글인식 방법.
  2. 제1항에 있어서, 상기 스트로크분류는 시작각, 끝각, 축적각, 특성값을 이용하여 23개의 스트로크를 인식하도록 함을 특징으로 하는 온라인 필기체 한글인식 방법.
  3. 제1항에 있어서, 상기 초성인식은 시작 스트로크에 따라서 나올 수 있는 초성의 종류를 트리로 만든후 각 시퀀스에 따라 인식하도록 진행됨을 특징으로 하는 온라인 필기체 한글인식 방법.
KR1019910024905A 1991-12-28 1991-12-28 온라인 필기체 한글인식 방법 KR940003828B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019910024905A KR940003828B1 (ko) 1991-12-28 1991-12-28 온라인 필기체 한글인식 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019910024905A KR940003828B1 (ko) 1991-12-28 1991-12-28 온라인 필기체 한글인식 방법

Publications (2)

Publication Number Publication Date
KR930014164A KR930014164A (ko) 1993-07-22
KR940003828B1 true KR940003828B1 (ko) 1994-05-03

Family

ID=19326464

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910024905A KR940003828B1 (ko) 1991-12-28 1991-12-28 온라인 필기체 한글인식 방법

Country Status (1)

Country Link
KR (1) KR940003828B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100484128B1 (ko) * 1997-11-19 2005-09-30 삼성전자주식회사 단획필기체한글입력장치

Also Published As

Publication number Publication date
KR930014164A (ko) 1993-07-22

Similar Documents

Publication Publication Date Title
Parvez et al. Offline Arabic handwritten text recognition: a survey
KR100297482B1 (ko) 수기입력의문자인식방법및장치
EP0564827A2 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
Davis et al. Recognition of handwritten characters—a review
Yamada et al. Cursive handwritten word recognition using multiple segmentation determined by contour analysis
Elanwar et al. Simultaneous segmentation and recognition of Arabic characters in an unconstrained on-line cursive handwritten document
AU3141793A (en) Character recognition method
KR940003828B1 (ko) 온라인 필기체 한글인식 방법
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
Duneau et al. On-line cursive script recognition: A user-adaptive system for word identification
JP2903779B2 (ja) 文字列認識方法及びその装置
KR950005533B1 (ko) 온라인 문자인식 시스템
KR940001739B1 (ko) 스트로크인식을 통한 온라인 필기체 문자인식방법
JP2671985B2 (ja) 情報認識方法
Javed Investigation into a segmentation based OCR for the Nastaleeq writing system
KR100301216B1 (ko) 온라인문자인식장치
Prasad Handwritten character recognition: a review
KR960013818B1 (ko) 다중획인식을 이용한 한글조합인식장치
JP3066530B2 (ja) オンライン手書文字認識装置
KR970000276B1 (ko) 필기체 문자인식방법
KR100290606B1 (ko) 온라인 한글 필기체 문자 인식방법
KR930012140B1 (ko) 자소 오토마타를 이용한 온라인 필기체 문자인식 방법
Lincy Handwritten recognition for Tamil language: overview, challenges and future
KR100414051B1 (ko) 문자의획인식방법
Eldhose et al. Disambiguated archieve rectification

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070418

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee