KR930012141B1 - 온라인 필기체 문자인식방법 - Google Patents

온라인 필기체 문자인식방법 Download PDF

Info

Publication number
KR930012141B1
KR930012141B1 KR1019910022345A KR910022345A KR930012141B1 KR 930012141 B1 KR930012141 B1 KR 930012141B1 KR 1019910022345 A KR1019910022345 A KR 1019910022345A KR 910022345 A KR910022345 A KR 910022345A KR 930012141 B1 KR930012141 B1 KR 930012141B1
Authority
KR
South Korea
Prior art keywords
neutral
stroke
recognized
recognition
neutrality
Prior art date
Application number
KR1019910022345A
Other languages
English (en)
Other versions
KR930014174A (ko
Inventor
강민석
Original Assignee
주식회사 금성사
이헌조
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 금성사, 이헌조 filed Critical 주식회사 금성사
Priority to KR1019910022345A priority Critical patent/KR930012141B1/ko
Publication of KR930014174A publication Critical patent/KR930014174A/ko
Application granted granted Critical
Publication of KR930012141B1 publication Critical patent/KR930012141B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)

Abstract

내용 없음.

Description

온라인 필기체 문자인식방법
제1도는 종래의 한글인식 처리흐름도.
제2도는 본 발명의 한글인식 처리흐름도.
제3도는 확장된 획의 굴곡 방향에 의한 분류코드 및 방향변화도표.
제4도는 본 발명에 의해 정의된 스트로크 및 그 코드표.
제5도는 본 발명 중종성 인식 및 분리의 판단영역 설명도.
본 발명은 온라인 필기체 문자인식방법에 관한 것으로, 특히 초성+중성 또는 중성+종성의 필기체에 대하여 인식할 수 있도록 하여 한글을 인식하는데 인식속도를 향상시키도록 한 온라인 필기체 문자인식방법에 관한 것이다.
종래에는 제1도에 도시된 바와 같이, 입력 문자를 거리필터링, 각 필터링, 후크제거등의 과정을 거쳐 필요없는 데이터를 제거하는 전처리단계와, 전처리된 데이터에 대해 특징점 추출하는 단계와, 추출된 특징점에 따라 스트로크를 분류하는 스트로크 분류단계와, 이 스트로크 분류 단계에서 분류된 스트로크를 특징점을 이용하여 정의된 스트로크를 인식하는 스트로크 인식단계와, 이 스트로크 인식단계의 스트로크 입력에 따라 초성, 중성, 종성에 대해 자소를 인식하는 자소인식단계와, 이 자소인식단계를 통해 잘못 인식된 한글을 보정하여 출력하는 오인식 보정단계로 구성된다.
이와 같은 종래 기술의 동작 과정을 설명하면 다음과 같다.
사용자가 어떤 정보를 태블릿(Tablet)으로 입력시키면 그 정보를 기억하게 되는데, 이 입력된 정보에는 한글을 인식하는데 필요하지 않는 정보들이 존재하게 된다.
이때, 불필요한 정보를 제거하기 위하여 태블릿(Tablet) 위에 필기할 때 펜의 시작점과 끝점에서 발생하는 훅(hook) 및 필기할 때 잘못하여 찍힌 점들을 제거하기 위하여 샘플점 2개 이하인 스트로크를 제거하는 거리 필터링, 각 필터링 및 후크 제거등의 전처리 과정을 수행하고 이 전처리 과정을 거친 정보에서 인식에 필요한 특정값-길이, 시작점과 끝점간의 거리등-을 추출한다.
이에 따라, 추출된 특정값을 이용하여 스트로크를 몇 개의 그룹으로 분류한 후 특징값에 의해 정의된 스트로크를 인식하고, 이 인식된 스트로크에서 초성, 중성, 종성을 인식함에 따라 자소를 인식한 후 오인식된 글자가 없는지 판별하여 잘못된 한글을 보정함으로써 한글 인식과정을 종료하게 된다.
그러나, 이와 같은 종래의 한글 인식은 초성, 중성, 종성이 분리된 입력 한글에 대해서만 인식하게 되므로 각 자소를 붙여서 흘림체로 쓰는 경우에는 하나의 스트로크로 인식하여 오인식에 의해 문자 인식이 되지 않음은 물론 오인식 방지를 위하여 한글을 초성, 중성, 종성으로 분리해서 입력시킴으로써 같은 글자라도 입력 스트로크가 많아져서 인식 속도가 느려지게 되는 문제점이 있었다.
이와 같은 종래의 결함을 감안하여 본 발명은 입력 정보를 특정값에 따라 스트로크로 분류 인식한 후 인식된 스트로크가 초성+중성 또는 중성,종성의 흘림체인지 판별하고, 초성+중성 또는 중성+종성의 흘림체인 경우 초성, 중성 또는 중성+종성을 분리하여 인식함으로써 문자 입력의 불편함을 제거함은 물론 흘림체의 경우에 입력 스트로크가 줄어 인식 속도를 향상시키도록 한 온라인 필기체 문자인식방법을 창안한 것으로, 이를 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다.
본 발명은 종래와 동일하게 입력 문자를 거리필터링, 각 필터링, 후크제거등의 과정을 거쳐 필요없는 데이터를 제거하는 전처리단계와, 전처리된 데이터에 대해 특징점 추출하는 단계와, 추출된 특징점에 따라 스트로크를 분류하는 스트로크 분류단계와, 이 스트로크 분류 단계에서 분류된 스트로크를 특징점을 이용하여 정의된 스트로크로 인식하는 스트로크 인식단계와, 이 스트로크 인식단계의 스트로크 입력에 따라 초성, 중성, 종성에 대해 자소를 인식하는 자소인식단계와, 이 자소인식단계를 통해 잘못 인식된 한글을 보정하여 출력하는 오인식 보정단계로 구성된다.
이와 같은 단계에서 사용자가 어떤 정보를 입력시키면 입력된 정보에서 한글을 인식하는데 불필요한 정보를 제거하기 위하여 태블릿(Tablet) 위에 필기할 때 펜의 시작점과 끝점에서 발생하는 훅(hook) 및 잘못하여 찍힌 점들을 제거하기 위하여 샘플점 2개 이하인 스트로크를 제거하는 전처리를 행하고, 이 전처리를 거치고 나온 정보로 스트로크를 인식하는데 필요한 특징을 추출하며, 추출된 특징을 이용하여 스트로크를 몇 개의 그룹으로 분류한 후 정의된 스트로크를 인식하여 자소를 인식하게 된다.
제2도는 본 발명의 한글 인식 처리흐름도로서, 입력되는 스트로크를 체크하여 스트로크가 있으면, 초,중성을 인식하여 초성+중성인지 판별하는 제1단계와, 제1단계에서 초성+중성이 아니면 초성을 인식하고 중성을 인식한 후 중,종성을 인식하여 중성+종성인지 판별하는 제2단계와, 제1단계에서 초성+중성이라고 판단하면 초,중성을 분리하고 중성이 끝났는지 판별하는 제3단계와, 제3단계에서 중성이 끝났으면 종성을 인식하고 오인식을 교정하는 제4단계와, 제3단계에서 중성이 끝나지 않았으면 중성을 인식한 후 중,종성을 인식하여 중성+종성인지 판별하는 제5단계와, 제2, 제5단계에서 중성+종성이면 중,종성을 분리한 후 오인식을 교정하고 중성+종성이 아니면 종성을 인식한 후 오인식을 교정하는 제6단계로 구성한다.
이와 같은 단계로 이루어진 본 발명의 작용, 효과를 설명하면 다음과 같다.
종래의 스트로크 인식은 2가지 이상의 자소가 합쳐져서 입력되는 것을 허용하지 않아 그 만큼 정의된 스트로크가 적었으나 본 발명에서는 제3도에 도시한 바와 같이 시계방향(-) 및 반시계방향(+)에 따라 스트로크 분류코드를 13가지로 확장 분류하여 다양하고 많은 수의 스트로크를 인식하도록 한다.
이와 같이 스트로크 분류에서 1차적으로 스트로크의 굴곡점에 따라 분류된 스트로크 집합을 정의된 스트로크의 모양에 따른 스트로크 인식코드를 가지고 입력 스트로크를 인식하여 해당 코드를 발생시켜 주는데 그 모양에 따른 각 스트로크는 초,중성 또는 중,종성이 합쳐진 모양으로 존재하며 각 코드는 제4도에 도시한 바와 같다.
즉, 입력된 문자는 스트로크의 방향에 따라 제3도에 도시한 바와 같이 13가지의 그룹별로 분류한 후 각 스트로크의 시작각, 끝각, 특징점들을 이용하여 제4도에 도시한 바와 같은 스트로크 모양을 인식하게 된다.
태블릿으로 입력된 정보를 스트로크별로 분류하여 인식한 후 그 인식된 스트로크가 입력되면, 초,중성 인식을 수행하는데 제4도에서와 같은 인식 스트로크 코드를 보고 초,중성이 합쳐진 스트로크가 입력되었는가를 판단한다.
예를들면, 스트로크 코드가 14가 인식되면 이 스트로크는 "ㅁ"을 흘려쓴 경우일 수도 있고 "나"를 흘려쓴 경우일 수도 있으므로 이럴 경우엔 스트로크를 방향 및 위치정보를 가지고 "ㅁ"인지 "나"인지를 구분해서 해당하는 문자 코드를 다음단계로 넘겨준다.
이때, 초성과 중성이 합쳐지지 않았다고 판단하면 초성을 인식하는데 예를들어, 입력 스트로크가 제14번 스트로크의 경우 초성 "ㅁ"을 인식한 후 입력된 중성을 점검하여 중성이 중성+종성인지 제4도의 인식 스트로크를 참조하여 판별하게 된다.
그리고, 초성+중성이라고 판단되면 초,중성을 분리하는데 예를들어 제14번 스트로크 코드의 경우 초성 "ㄴ"과 중성 "ㅏ"을 분리한 후 분리된 중성이 완성된 중성인지 미완성 중성인가를 판별하게 된다.
여기서 예를들어 49번 코드의 경우 초성, 중성의 분리에 의해 "라"임으로 더 이상 중성이 종성과 합쳐진 상태일 가능성이 없음으로 중성이 끝난 것으로 판별하고, 39번 코드일 경우 "_"가 입력되어 "노" 또는 계속적인 중성 입력에 의해 "뇌"나 "놔"가 될 수 있음으로 중성이 끝나지 않은 것으로 판별하게 된다.
이에따라, 중성이 끝났다고 판단하면 종성을 인식하고 중성이 끝나지 않았다고 판단하면 입력되는 중성을 인식하여 중성+종성의 형태인지 판별하게 된다.
여기서, 중성이 끝나지 않아 중성인식을 계속해서 수행할 때 초중성 인식 단계에서 중성의 일부를 인식하였음으로 시작 모음부터를 인식을 하는데, 예를들어 제4도의 39번 스트로크를 인식했다면 "ㄴ"과 "1"를 인식하였음으로 "1"부터 중성 인식을 수행한다.
상기에 기술된 초,중성 인식에 따라 문자를 인식하는 동작을 예를들어 설명하면 다음과 같다.
초중성 인식 과정에서 제14번 스트로크를 인식하여 "ㅁ"과 "나"를 분류, 인식하였을 때 초성 "ㅁ" 인식후 종성이 들어온다면 입력 문자는 "나"로 판별하며, 초,중성 분리후 중성이 입력된다면 중성 "ㅏ"의 판별에 의해 더 이상 중성의 입력 가능성이 없음으로 입력문자는 "ㅁ"으로 판별하게 된다.
한편, 상기에서 초성 인식 경우 또는 초,중성 분리에 의한 중성이 끝나지 않은 경우 중성인식이 끝나면 다시 중성+종성의 형태인지 판단하는데 그 판단은 인식된 스트로크 코드와 중,종성의 글자내에서의 위치로 판단을 한다.
예를들면, 스트로크 코드 24가 들어오면 "ㅕ"가 될 수도 있고 ""를 흘려쓴 것일 수도 있는데 제5b도에서 보면 초성을 둘러싼 사각형을 기준으로 영역을 4개로 나누어 그 영역을 기준으로 "ㅕ"인지 ""인지를 구분한다. 즉, 제24번 스트로크의 경우 첫점이 영역 1에 들어오면 "ㅕ"이고 영역3에 들어오면 ""로 판단하는데 제5b도의 경우 ""으로 판단한다.
이에따라, "ㅕ"로 판별하여 종성을 인식한 후 오인식을 교정하게 되고, ""으로 판별하면 중,종성을 분리한 후 오인식을 교정하게 된다.
상기에 기술한 중성+종성 판별에 따른 문자 인식 동작을 설명하면 다음과 같다.
예를들면 흘림체인 "강"이 입력된 경우 초성 "ㄱ"를 인식한 후 제28번 스트로크 코드가 중,종성으로 인식이 되어 넘어왔다면 그 스트로크는 중성 "ㅏ", 종성 "ㅇ"일 수도 있고, 중성 "ㅗ", 종성 "ㅇ"일 수도 있다.
이것은 스트로크 28인 "ㅎ"이 모양만 보면 위의 두가지 경우가 모두 될 수 있기 때문이다.
따라서, "ㅏ", "ㅇ"인지 "ㅗ", "ㅇ"인지는 중,종성인식시에 사용된 위치영역정보를 이용하게 된다. 즉, 제5a도에서와 같이 "강"을 입력했는데 "ㅎ" 스트로크의 시작점이 영역 1에 속해 있음으로 이 스트로크는 "ㅏ", "ㅇ"임을 알 수 있다.
상기와 같이 동작하여 인식을 종료한 문자는 다양한 한글체에 의해 오인식이 발생할 수 있으므로 잘못 인식한 경우를 점검하여 오인식의 경우는 교정을 통해 제대로 인식하게 해 주어야 한다.
예를 들어, 흘림체인 "새"가 입력된 경우 "씨"로 잘못 인식될 수 있는데 1번째 스트로크와 2번째 스트로크의 방향이 "시"와 "ㅐ"의 어느 쪽에 더 비슷한가를 비교하여 교정을 해준다.
또한, 다른 예로서 흘림체인 "간"이 입력되었을 때 "ㄴ"이 제4번 스트로크로 인식되지 않고 제7번 스트로크로 인식된 경우 종성이 인식되지 않았으면 종성에서 제7번 스트로크 하나만 나타나는 경우는 없음으로 제4번 스트로크가 잘못 인식되어 제7번 스트로크로 인식된 것으로 판별하여 "ㄴ"으로 교정하게 된다.
이상에서 상세히 설명한 바와 같이 본 발명은 초성, 중성, 종성으로 인식할 때 종래의 기술과는 달리 초성+중성 또는 중성+종성의 흘림체에 대해서도 인식할 수 있어서 인식율과 인식속도를 향상시켜 보다 편리하도록 한 효과가 있다.

Claims (4)

  1. 입력되는 스트로크를 체크하여 스트로크가 있으면, 초,중성을 인식하여 초성+중성인지 판별하는 제1단계와, 제1단계에서 초성+중성이 아니면 초성을 인식한 후 중성을 인식하여 중성+종성인지 판별하는 제2단계와, 제1단계에서 초성+중성이라고 판단하면 초,중성을 분리하고 중성이 끝났는지 판별하는 제3단계와, 제3단계에서 중성이 끝났으면 종성을 인식하고 오인식을 교정하는 제4단계와, 제3단계에서 중성이 끝나지 않았으면 중성을 인식한 후 중성+종성인지 판별하는 제5단계와, 제2, 제5단계에서 중성+종성이면 중,종성을 분리한 후 오인식을 교정하고 중성+종성이 아니면 종성을 인식한 후 오인식을 교정하는 제6단계로 이루어짐을 특징으로 하는 온라인 필기체 문자인식방법.
  2. 제1항에 있어서, 상기 초,중성 인식시에 모양이 비슷한 두개의 스트로크가 인식되면 스트로크의 방향, 위치정보를 이용하여 구분한 후 다음에 입력되는 중성 또는 종성에 따라 초성 또는 초성+중성을 인식하도록 함을 특징으로 하는 온라인 필기체 문자인식방법.
  3. 제1항에 있어서, 상기 스트로크는 획의 굴곡방향(시계방향, 반시계방향)에 따라 인식 스트로크를 분류함을 특징으로 하는 온라인 필기체 문자인식방법.
  4. 제1항에 있어서, 중성,종성 인식시 초성을 기준 영역으로 4개의 영역을 분할하여 시작점이 기준 영역의 우측 영역 또는 하측 영역에 있는지에 따라 해당 스트로크를 인식함을 특징으로 하는 온라인 필기체 문자인식방법.
KR1019910022345A 1991-12-06 1991-12-06 온라인 필기체 문자인식방법 KR930012141B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019910022345A KR930012141B1 (ko) 1991-12-06 1991-12-06 온라인 필기체 문자인식방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019910022345A KR930012141B1 (ko) 1991-12-06 1991-12-06 온라인 필기체 문자인식방법

Publications (2)

Publication Number Publication Date
KR930014174A KR930014174A (ko) 1993-07-22
KR930012141B1 true KR930012141B1 (ko) 1993-12-24

Family

ID=19324312

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910022345A KR930012141B1 (ko) 1991-12-06 1991-12-06 온라인 필기체 문자인식방법

Country Status (1)

Country Link
KR (1) KR930012141B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100477125B1 (ko) * 1997-10-16 2005-08-17 삼성전자주식회사 전자펜을이용한문자입력장치및그제어방법

Also Published As

Publication number Publication date
KR930014174A (ko) 1993-07-22

Similar Documents

Publication Publication Date Title
US5854855A (en) Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
US5802205A (en) Method and system for lexical processing
US5038382A (en) Multi-scale recognizer for hand drawn strokes
Yamada et al. Cursive handwritten word recognition using multiple segmentation determined by contour analysis
KR930012141B1 (ko) 온라인 필기체 문자인식방법
Elnagar et al. A multi-agent approach to arabic handwritten text segmentation
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
KR940003828B1 (ko) 온라인 필기체 한글인식 방법
KR950005533B1 (ko) 온라인 문자인식 시스템
KR100301216B1 (ko) 온라인문자인식장치
KR940001739B1 (ko) 스트로크인식을 통한 온라인 필기체 문자인식방법
KR960013818B1 (ko) 다중획인식을 이용한 한글조합인식장치
KR100290606B1 (ko) 온라인 한글 필기체 문자 인식방법
JPS63269267A (ja) 文字認識方法
KR930012140B1 (ko) 자소 오토마타를 이용한 온라인 필기체 문자인식 방법
JP3151866B2 (ja) 英文字認識方法
JPS63109592A (ja) 文字認識方式
JPH07107698B2 (ja) 文字認識方法
JPH0290384A (ja) 文字認識装置の後処理方式
JPH07117995B2 (ja) 文字認識装置
JPS5899888A (ja) 手書文字認識装置
KR20000061110A (ko) 자소 조합형 한글 필기인식 방법
JPH02292691A (ja) 文字認識装置
JPH02105281A (ja) 文字認識装置
KR950012279A (ko) 영역분할에 의한 확률적인 획 인식 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20060912

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee