KR950005533B1 - 온라인 문자인식 시스템 - Google Patents

온라인 문자인식 시스템 Download PDF

Info

Publication number
KR950005533B1
KR950005533B1 KR1019930002796A KR930002796A KR950005533B1 KR 950005533 B1 KR950005533 B1 KR 950005533B1 KR 1019930002796 A KR1019930002796 A KR 1019930002796A KR 930002796 A KR930002796 A KR 930002796A KR 950005533 B1 KR950005533 B1 KR 950005533B1
Authority
KR
South Korea
Prior art keywords
point
stroke
points
character
recognition system
Prior art date
Application number
KR1019930002796A
Other languages
English (en)
Other versions
KR940020258A (ko
Inventor
이헌주
Original Assignee
주식회사금성사
이헌조
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사금성사, 이헌조 filed Critical 주식회사금성사
Priority to KR1019930002796A priority Critical patent/KR950005533B1/ko
Publication of KR940020258A publication Critical patent/KR940020258A/ko
Application granted granted Critical
Publication of KR950005533B1 publication Critical patent/KR950005533B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K3/00Methods or arrangements for printing of data in the shape of alphanumeric or other characters from a record carrier, e.g. interpreting, printing-out from a magnetic tape

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

내용 없음.

Description

온라인 문자인식 시스템
제1도는 종래 온라인 문자인식 시스템 구성도.
제2도는 제1도의 전처리부에 대한 상세도.
제3도는 본 발명 온라인 문자인식 시스템 구성도.
제4도는 제3도의 전처리부에 대한 상세 구성도.
제5도는 제4도의 대표점추출의 최소각을 이용하여 대표점추출을 보인 설명도.
제6도는 제4도에 바로세우기부의 문자교정을 위한 16방향체인코드 변화를 보인 설명도.
* 도면의 주요부분에 대한 부호의 설명
1 : 테블렛입력부 2 : 전처리부
3 : 특징추출부 4 : 스트로크인식부
5 : 문자인식부 6 : 문자보정부
7 : 문자코드변환부
본 발명은 펜컴퓨터, 필기체 입력 전자수첩, 필기체 입력 문서 편집기등에 있어서의 온라인 필기체 문자인식에 관한 것으로, 특히 필기자의 속기 또는 미숙에 의해 발생되는 샘플점의 누락을 보상하고, 개인적인 필기습관에 의해 변형되어 입력되는 글자를 바르게 수정하여 필기체의 문자를 효율적으로 인식 하도록 하는 온라인 문자인식 시스템에 관한 것이다.
일반적으로 문자 자동인식 시스템에서 테블렛과 같은 입력수단을 통해 입력되는 수서(手書)문자를 자동으로 인식하기 위해서는 테블렛을 통해 사용자가 글씨를 쓰면 획이 지나가면서 생긴 좌표의 열을 입력으로 받고 X좌표의 열과 Y좌표의 열을 이용하여 문자의 특징을 구하게 된다.
상기에서 구한 특징을 미리 저장되어 있는 기준문자의 특징과 비교하여 가장 비슷한 필기체를 인식하게 된다.
이와같은 종래 온라인 문자인식 시스템은 첨부된 도면 제1도에 도시된 바와같이, 테블렛입력부(100)를 통해 입력된 글자의 X좌표, Y좌표의 점들중에서 서로 근접한 거리에 있는 점과 중복점 및 필기 시작, 종료에서 발생되는 삐침을 필터링하여 제거하고 입력점들의 크기의 변화와 속기의 시간차에 대한 입력점들의 일정한 크기 및 거리로 정규화하는 전처리부(101)와, 기본 획(stroke)을 인식하기 위해 상기 전처리부(101)를 통해 일정한 점의 크기 및 일정한 점의 갯수를 갖는 좌표점을 X, Y축으로 하여 회의 전체 길이, 획의 시작점과 끝점의 길이등을 계산하는 특징추출부(102)와, 상기 특징추출 부(102)에서 계산된 획을 1차로 각도의 변환형태에 따라 대분류하여 정의된 획을 최종 인식하는 스트로크인식부(103)와, 상기 스트로크인식부(103)에서 인식된 획으로 부터 자소를 분리하고 그 분리한 자소로 부터 초성, 중성, 종성을 인식하는 문자인식부(104)와, 상기 문자인식부(104)에서 인식한 초성, 중성 및 종성을 오인식하였거나 미인식 하였을 경우 이를 보정하여 정인식 시키는 문자보정부(105)와 상기 문자보정부(105)를 통해 보정되어 입력되는 초성, 중성 및 종성을 문자코드로 변환하여 출력하는 문자코드변환부(106)로 구성되어 있다.
상기에서 전처리부(101)는 제2도에 도시한 바와같이, 테블렛입력부(100)를 통해 입력된 글자의 X좌표와 Y좌표의 점들에 대해 이웃 두점들간의 거리가 전체획의 1/50인 이하인 경우 서로 근접한 거리에 있는 점 및 중복되는 점을 제거하는 거리필터부(101a)와, 글자획의 인식을 위해 상기 거리필터부(101a)를 통해 입력되는 글자획의 연속 3점에 대해 이웃하는 두선분이 이루는 각이 45°이하인 경우 중간점을 삭제하고 45°이상인 최초의 점을 샘플링하는 각필터부(101b)와, 상기 각필터부(10b)로 부터 글자획의 입력시 그 글자획의 시작점과 끝점에서 발생되는 삐침을 필터링하여 제거하는 훅제거부(101c)로 구성되어 있다.
이와같이 구성된 종래 온라인 문자인식 시스템은 테블렛입력부(100)를 통하여 글자의 점들이 입력되면 전처리부(101)는 입력된 점들중에서 서로 근접한 거리에 있는 점을 필터링하여 제거하고 입력점들의 크기의 변화에 관계없이 인식하기 위해 입력점들의 크기를 정규화하게 된다.
즉, 제2도에서와 같이, 테블렛입력부(100)를 통해 글자의 점들이 입력되면 전처리부(110)의 거리필터부(101a)는 느린 속도의 필기에서 오는 글자의 X좌표, Y좌표의 점들에 대해 이웃 두점들간의 거리가 전체획의 길이의 1/50 이하인 경우 서로 근접한 거리에 있는 점과 중복점을 제거하여 각필터부(101b)에 입력하게 된다.
상기 각필터부(101b)는 거리펄터부(101a)에서 입력된 글자획의 연속 3점에 대해 이웃하는 두선분이 이루는 각이 45°이하인 경우 중간점을 삭제하고 45°이상인 최초의 점을 샘플링하여 훅제거부(101c)에 입력하게 된다.
상기 훅제거부(101c)는 각필터부(101b)로 부터 글자획이 입력되면 그 글자획의 시작 및 종료에서 발생되는 즉, 펜의 누름과 펜을 든 시점에서 발생되는 비침을 제거하여 특징추출부(102)에 입력하게 된다.
상기 특징추출부(102)는 전처리부(101)를 통해 일정한 점의 크기 및 일정한 점의 갯수를 갖는 좌표점을 X축, Y축으로 하여 획의 전체길이와 획의 시작점과 끝점의 길이등을 계산하여 스트로크인식부(103)에 입력하게 된다.
상기 스크로크인식부(103)는 특징추출부(102)에서 입력된 글자의 획을 1차로 각도의 변화형태에 따라 대분류를 한 다음 상기 특징추출부(102)로 부터 계산된 특징값을 이용하여 정의된 획을 최종인식하게 된다.
이와같이, 인식된 회인 일반적으로 복합자소로써, 초성, 중성이 결합된 형태, 또는 중성, 종성이 결합된 형태이거나 또는 초성, 중성, 종성이 모두 결합된 형태로 인식되어 문자인식부(104)에 입력되므로써, 상기 문자인식부(104)는 상기와 같이, 결합된 형태로 입력되는 글자획으로 부터 자소를, 즉 초성, 중성, 종성으로 분리하여 인식한 후 이를 다시 조합해서 하나의 글자를 형성하여 문자보정부(105)에 입력하게 된다.
상기 문자보정부(105)는 상기 문자인식부(104)의 오인식 및 미인식에 의해 그릇된 글자가 입력되면 이를 바로잡아 문자코드변환부(106)에 입력하게 된다.
상기 문자코드변환부(106)는 문자보정부(105)를 통해 보정되어 입력되는 글자를 한글조합형 또는 완성형 코드로 변환하여 출력하게 된다.
그러나 이와같은 종래의 온라인 문장인식 시스템에 있어서, 전처리부는 입력점에 대한 거리필터링시 완만한 필기시에 발생되는 근접 거리의 점들과 중첩점 및 과도한 꼬아돌림에 의해 발생하는 꽈돌림점은 전처리부의 거리필터를 통해 제거가 가능하게 되나, 필기자의 속기에 의해서 글자가 빠르게 입력될시에 발생되는 샘플점의 누락을 추가 또는 보정하지 못하게 된다.
이로인하여 문자의 정보에 대한 손실을 가져올 뿐 아니라 문자를 오인식하게 되고, 또한 필기자가 테블렛입력부를 통해 글자를 뉘어 쓸 경우에는 전처리부에서 이를 처리하지 못한 상태로 특징추출부, 스트로크인식부를 통해 문자인식부로 전달함으로써, 글자의 오인식 및 미인식 결과를 초래하게 되는 문제점이 있었다.
따라서 본 발명의 목적은 필기자의 속기 또는 필기 미숙에 의해 발생되는 샘플점의 누락을 보상하고, 개인적인 필기습관에 의해 변형되어 입력되는 글자 또는 뉘어져 입력되는 글자를 바르게 수정하여 필기체의 문자를 효율적으로 인식 하도록 하는 온라인 문자인식 시스템을 제공함에 있다.
이와같은 본 발명의 목적을 달성하기 위한 수단은 테블렛입력수단을 통해 입력된 글자의 X좌표, Y좌표의 점들중에서 중첩점 및 속기의 시간차에 의한 누락점을 보상하고 입력된 문자의 형태를 조사하여 바른위치로 교정처리하는 전처리수단과, 상기 전처리수단을 통해 교정된 일정한 점의 크기 및 일정한 점의 개수를 갖는 좌표점을 X, Y축으로 하여 획의 전체 길이, 획의 시작점과 끝점의 길이등을 계산하는 특징추출수단과, 상기 특징추출수단과, 상기 특징추출수단에서 얻어진 글자획을 인식하고 그 인식된 글자획에 따라 코드로 변환하여 문자인식수단에 전달하는 스트로크인식수단으로 이루어짐으로써, 달성되는 것이다.
본 발명의 또다른 목적은 상기 전처리수단에 구비되어 테블렛입력수단을 통해 입력된 글자의 X좌표, Y좌표의 점들중에서 일정거리이상 또는 이하의 점들간의 거리를 일정한 거리로 샘플링하여 중복점 및 근접점을 제거하는 재샘플링수단과, 상기 재샘플링수단을 통해 얻어진 글자를 평활화시켜 그 글자에 포함된 잡음을 제거하는 평활화수단과, 상기 평활화수단으로 부터 얻어진 점들중에서 자신점을 중심으로 앞뒤점의 방향을 고려하여 입력 데이타량을 최소화시키는 세점필터링수단과, 상기 세점필터링수단으로 부터 글자획의 입력시 그 글자획의 전체 길이와 비교하여 시작점 또는 마지막 두점 사이의 거리가 짧고 필기변화가 심한 부
분을 판별하여 제거하는 삐침제거수단과, 상기 비침제거수단으로 부터의 문자형태를 보존하는 최소한의 대표점을 최소각 또는 선분열의 길이를 이용하여 획단위로 추출하는 대표점추출수단과, 상기 대표점추출수단으로 부터의 기울어진 문자 입력시 개별문자 또는 단어에 적용하여 기울기를 조사한 후 이를 바른위치로 정정하여 특징추출수단에 입력하는 바로세우기수단으로 이루어짐으로써, 달성되는 것으로 이하 본 발명을 첨부한 도면에 의거 상세히 설명하면 다음과 같다.
제3도는 본 발명 온라인 문자인식 시스템 구성도로서, 이에 도시한 바와같이, 테블렛입력부(1)를 통해 입력된 글자의 X좌표, Y좌표의 점들중에서 중첩점 및 속기의 시간차에 의한 누락점을 보상하고 입력된 문자의 형태를 조사하여 문자를 인식할 수 있도록 바른위치로 교정 처리한 전처리부(2)와, 기본 획을 인식하기 위해 상기 전처리부(2)를 통해 교정된 일정한 점의 크기 및 일정한 점의 갯수를 갖는 좌표점을 X, Y축으로 하여 회의 전체길이, 획의 시작점과 끝점의 길이등을 계산하는 특징추출부(3)와, 상기 특징추출부(3)에서 계산된 획을 1차로 각도의 변환형태에 따라 대분류하여 정의된 획을 최종 인식하는 스트로크인식부(4)와 상기 스트로크인식부(4)에서 인식된 획으로 부터 자소를 분리하고 그 분리한 자소로 부터 초성, 중성, 종성을 인식하는 문자인식부(5)와 상기 문자인식부(5)에서 인식한 초성, 중성 및 종성을 오인식하였거나 미인식 하였을 경우 이를 보정하여 정인식 시키는 문자보정부(6)와, 상기 문자 보정부(6)를 통해 보정되어 입력하는 초성, 중성 및 종성을 한글조합형 또는 완성형코드로 변환하여 출력하는 문자코드변환부(7)로 구성한다.
상기 전처리부(2)는 제4도에 도시된 바와같이, 테블렛입력부(1)를 통해 입력된 글자의 X좌표, Y좌표의 점들중에서 일정거리이상 또는 이하의 점들간의 거리를 일정한 거리로 샘플링하여 중복점 및 근접점을 제거하는 재샘플링부(2a)와, 상기 재샘플링부 (2a)를 통해 얻어진 글자를 평활화시켜 그 글자에 포함된 잡음을 제거하는 평활부(2b)와, 상기 평활화부(2b)로 부터 얻어진 점들중에서 자신점을 중심으로 앞뒤점의 방향을 고려하여 입력 데이타량을 최소화시키는 세점필터부(2c)와, 상기 세점필터부(2c)로 부터 글자획의 입력시 그 글자획의 전체 길이와 비교하여 시작점 또는 마지막 두점 사이의 거리가 짧고 필기변화가 심한 부분을 판별하여 제거하는 삐침제거부(26)와, 상기 삐침제거부(26)로부터의 문자형태를 보존하는 최소한의 대표점을 최소각 또는 선분열의 길이를 이용하여 획단위로 추출하는 대표점추출부(2e)와, 상기 대표점추출부(2e)로 부터의 기울어진 문자 입력시 개별분자 또는 단어에 적용하여 기울기를 조사한 후 이를 바른위치로 교정하여 특징추출부(3)에 입력하는 바로세우기부(2f)로 구성한다.
이와같이 구성된 본 발명의 작용, 효과를 제3도 내지 제6도를 참조하여 상세히 설명하면 다음과 같다.
먼저 전자펜과 디지타이져로 부터 X, Y좌표 점들로 구성된 글자의 획이 입력되면 테블렛입력부(1)는 사용가 필기한 글자를 각기 획(stroke)별로 1차 샘플링하여 전처리부(2)에 입력하게 된다.
상기 전처리부(2)는 테블렛입력부(1)를 통해 1차 샘플링되어 입력된 글자의 X좌표, Y좌표의 점들중에서 중첩점과 두점들간의 근접점 및 속기의 시간차에 의한 누락점을 보상하고 입력된 문자의 형태를 조사한 후 이를 바른위치로 정정하여 출력하게 된다.
즉, 제4도에 도시한 바와같이, 테블렛입력부(1)를 통해 글자의 점들이 샘플링되어 입력되면 전처리부(2)의 재샘플링부(2a)는, 느린 속도의 필기 또는 필기도중 잠시 멈춤에 의해 발생되는 작은점들이 어느 일정위치에 밀집하여 입력 되거나 또는 점사이의 간격이 일정거리 이상으로 떨어진 상태로 입력되므로써, 그 입력 글자의 X좌표, Y좌표의 점들중에서 일정거리 이상 또는 이하의 점들간의 거리를 일정한 거리로 재샘플링하여 상기 중복점 및 근접점을 제거하게 된다.
일예로써, 1번째 입력된 점의 X좌표를 Xi, Y좌표를 Yi라 하면 재샘플링부(2a)는 다음과 같이 정의 된다.
상기 식을 만족한 점들은 입력으로 받아들이고 만족하지 못하는 점들, 즉 중복점 및 근접점들은 제거하게된다.
상기에서 m은 표본화 최소치이고, M은 표본화 최대치이다.
이후 상기 재샘플링부(2a)를 통해 샘플링된 X좌표, Y좌표의 점들중에 포함한 잡음을 제거하기 위하여 평활부(2b)에서 이를 평활화시키게 되는데, 이는 테블렛에서 전자펜을 사용하여 필기하는 과정중에서 발생할 수 있는 잡음으로 다음과 같은 식에 따라 평활화하여 제거하게 된다.
상기에서 Xi는 i번째 입력되는 현재 평활하고자 하는 X좌표점 값으로서, 상기식을 풀이하면 먼저 이전에 입력되어 저장된 두번째 점(Xi-2)에 가중치 "3"을 곱하고 이를 이전에 입력되어 저장된 세번째 점(Xi-3)과를 가산하여 그 가산된 값과 이전에 입력되어 저장된 첫번째 점(Xi-1)에 가중치 "6"을 곱합값과를 가산하게 된다.
이후 상기에서 구한 값과 현재 평활하고자 하여 저장된 X좌표 점(Xi), 즉 자신점에 가중치 "7"을 곱하여 구한값과를 가산하고 그 가산된 값과 평활하고자 하는 즉, 자신점 이후에 입력되어 저장된 첫번째, 두번째, 점(Xi+1) (Xi+2)에 각각 가중치 "6", "3"을 곱하여 구한값과를 가산한 후 그 가산된 값과 자신점(Xi) 이후에 입력되어 저장된 세번째 점(Xi+3)과를 가산하게 된다.
이와같이, 평활화하고자 하는 자신점(Xi)과 그 자신점(Xi) 이전의 3점(Xi-1)(Xi-2)(Xi-3) 및 그리고 자신점(Xi) 이후의 3점(Xi+1)(Xi+2)(Xi+3)을 이용하여 구한값을 "27"로 평균화하여 현재 X좌표 점에 대한 잡음을 제거하게 된다.
이후 상기 평활부(2b)를 통해 잡음이 제거된 글자의 점들이 세점필터부(2c)에 입력되면 상기 세점필터부(2c)는 그 입력된 점들중에서 자신점을 중심으로 앞뒤점의 방향을 조사하여 앞뒤점의 방향이 변화되면 이를 감소시켜 입력데이타량을 최소화하게 된다.
일예로써, 상기 평활화부(2b)로부터 "0001001000"라는 한 획에 대한 점들이 입력되면 세점필터부(2c)는 전술한 바와같이, 그 한 획에 대한 점들중에서 자신점을 중심으로 앞뒤점의 변화가 생기게 되면 그 변화된 부분을 제거하여 그 제거된 결과값, 즉 "0000000000"삐침제거부(26)에 입력하게 된다.
상기 삐침제거부(26)는 세점필터부(2c)로 부터 점들로 구성된 글자획이 입력될시 그 글자획의 전체 길이와 비교하여 시작점 또는 마지막 두점 사이의 거리가 짧고 필기변화가 심한 부분을 삐침으로 판단하여 이를 제거한 후 대표점추출부(2e)에 입력하게 된다.
상기 대표점추출부(2e)는 삐침제거부(26)로부터의 문자형태를 보존하는 최소한의 대표점을 최소각 또는 선부열의 길이를 이용하여 획단위로 추출하는 단계로서, 이는 문자인식시의 데이타량을 줄여 인식속도와 인식율을 향상시키기 위해 획단위로 대표점을 추출하게 된다.
상기 대표점을 추출하기 위한 방법으로는 최소각을 이용하여 추출하는 방법과 선분열의 길이를 이용하여 추출하는 방법이 있는데, 먼저 최소각을 이용하여 대표점을 추출하는 방법을 설명하면 다음과 같다.
상기에서 대표점은 획을 이루는 많은 좌표가운데서 이들을 대표하여 획해석에 이용될 수 있는 그 획의 특징을 포함한 좌표로서, 획의 시작점(St)과 끝점(Sp) 및 획을 이루는 좌표열들이 시작점(St)과 끝점(Sp)을 연결하는 직선상에 있지않고 굴곡이 있는 경우 시작점(St)과 끝점(Sp)에서 획내의 각점에 제5도와 같이, 직선을 그어 그 사이가 최소인, 즉 최대 굴곡부의 좌표를 굴곡점(Bp)이라 정의 하고 대표점에 포함한다.
그리고 상기 시작점(St)과 끝점(Sp)을 변화시켜 획을 주획, 전획, 후획으로 구분하여 계속 굴곡점(Bp)을 추출하게 된다.
상기에서 굴곡점(Bp)의 정의는 하기의 식과 같고, 대표점은 제5도에 도시된 바와 같다.
굴곡점(Bp) 검색을 위한 처리시 획내에 잡음 및 필기 시작과 끝점에서 흔히 펜사용 미숙으로 발생하는 획의 변형에 의한 오판정을 막기 위하여 처리 대상을 한정하게 된다.
상기에 따른 굴곡점(Bp)의 정의는 다음과 같다.
된다.
따라서이고, 여기서 임의 변수점(j)은 ni/6<j<5ni/6를 만족해야 한다.
상기에서이루는 각도를 말한다.
그리고 상기 ni는 i번째의 획에 대한 점의 갯수이고, Pi1은 i번째의 획에 대한 첫번째 점이고, Pij는 i번째의 획에 대한 임의의 변수점이며, Pini는 i번째의 획에 대한 마지막점을 나타낸다.
일예로써, 제5도와 같은 글자가 입력되면 그 글자획에 대한 대표점을 추출하기 위해서 먼저 i번째 입력되는 획에 대한 첫번째 시작점(St=Pi1)에서 부터 시작하여 끝점(Sp=Pini)까지 각점에 직선을 그어 그 사이의 각이 가장 최소인점을 임의의 굴곡점(Bp=Pij)으로 하여 이를 대표점으로 추출하게 된다.
또다른 방법으로서, 선분열의 길이를 이용하는 방법은 먼저 추출된 대표점열을 차례로 연결한 선분열의 길이가 입력문자의 샘플점들을 연결한 선분의 길이에 가까우면 가까울수록 샘플점열에 의한 형태를 잘 보존하고 있는 것으로, 대표점의 수가 최소이며, 선분열의 길이가 본래의 샘플점 사이의 선분의 일정비율 이상의 길이가 되는 최적점열을 하기식에 의해 추출하게 된다.
즉,
로 추출한다.
상기식에서 P1, P2,…Pn은 획의 첫번째, 두번째 ‥‥마지막점이고, Pt는 임의 점이며, B1, B2,‥‥Bm은 획에대한 첫번째, 두번째‥‥마지막 대표점이고, Bi는 i번째획의 임의 대표점이다.
그리고 상기 S는 대표점의 수이고, L(Bi, Bi+1)은 대표점 Bi와 Bi+1을 잇는 선분길이 이며, L(Pt, Pt+1)은 인접 샘플점을 잇는 선분길이 이고, Cr은 압축율로서, 0≤Cr≤1의 조건을 갖는다.
상기 (식 4)에서 압축율(Cr)은 샘플점열을 차례로 이은 선분열의 길이에 대한 대표점열을 이은 길이의 압축율로서, 대표점은 선분점열을 이은 선분열의 길이에 압축율을 곱한 값보다 크면서 대표점수(S)가 가장작도록 대표점을 구한다.
그리고 상기 압축율(Cr)이 "1"일때 원래의 샘플점열을 이은 선분열이 완전히 보전되고, 다양한 형태의 자형을 포함하는 흘림체 한글에 대하여 상기 알고리즘을 행한 결과 압축율(Cr)이 0.95일때 추출된 대표점열에 의한 패턴이 인식처리에 가장 적합한 결과로 나타난다.
상기 대표점추출후의 입력 패턴은 대표점중에서 이웃하는 점들을 연결한 벡터의 시계열(A)이 된다.
즉, A=a1, a2‥‥ai,‥‥‥ am이다.
그리고 ai=(Di, Li, Pi)가 된다.
여기서 Di : 점간을 잇는 선분의 방향코드.
Li : 점간을 잇는 선분길이.
Pi : 점간에 있어서의 펜끝의 온/오프 표시이다.
이와같이, 대표점추출부(2e)로 부터 최소각 또는 선분열의 길이를 이용하여 추출한 대표점값이 전처리부(2)의 바로세우기부(21)에 입력되면 상기 바로세우기부(21)는 상기 대표점추출부(2e)로 부터의 기울어진 문자 입력시 이를 개별문자 또는 단어에 적용하여 기울기를 조사한 후 이를 바른위치로 정정하여 특징추출부(3)에 입력하는 것으로서, 이를 구체적으로 설명하면 다음과 같다.
일반적으로 한글을 표준필법(즉, 위에서 아래로, 좌에서 우로, 자모를 이루는 획들을 구분하여 필기)에 의하여 필기한 경우는 "16방향 성분",형태의 획들의 조합에 의하여 모든 한글이 이루어진다.
따라서 바로세우기부(2f)는 이러한 한글의 특성을 이용하여 대표점추출부(2e)에서 입력된 글자의 기울기를, 대표점간의 방향성분중 같은 성질의 성분을 합한 값중에서 가장큰 방향성분값(N)을 조사하여 기울기를 조사하게 된다.
이후 기울어진 방향성분값(N)을 구하고 그 구한 방향성분값(N)에 따라 바른위치로 돌리게 되는데 기울어진 방향은 초성 19개중 "ㄱ, ㄲ, ㄷ, ㄸ, ㄹ, ㅈ, ㅉ, ㅋ, ㅌ, ㅍ"은 "→"방향, "ㄴ, ㅁ, ㅂ, ㅃ" 은 "↓"방향으로 시작됨으로 이를 이용하여 방향성분값(N)을 구하게 된다.
그리고 "ㅅ, ㅆ, ㅇ, ㅊ,"등은 예외처리를 한다.
이를 하기의 알고리즘 및 제6도를 통해 일예로써 설명하면 다음과 같다.
대표점추출부(2e)로부터 대표점값이 입력되면 먼저 바로세우기부(21)는 먼저 입력된 대표점간의 방향성분중 같은성질의 성분을 합한 값중에서 가장 큰 방향성분값(N)을 구하게 된다.
상기에서 구한 방향성분값(N)이 제6도의 (a)에서와 같이, "0"과 "4"이면, 즉 3시방향과 12시방향이면 이는 바른위치로 글자가 입력되므로써 수평, 또는 수직방향으로 교정할 필요없이 바로 특징추출부(3)로 전달하고, 만약 대표점추출부(2e)로 부터 입력된 첫번째 획의 첫방향성분(D)이 제6도의 (b)에서과 같이, "1", "2", "3"("1"성분)이면, 즉 3시방향과 12시방향 사이에 존재하면 상기한 글자획을 시계방향으로 회전시켜 수평으로 수정하게 되는데, 이는 "ㄱ, ㄲ, ㄷ, ㄸ, ㄹ, ㅈ, ㅉ, ㅌ, ㅍ"과 같은 글자획을 좌에서부터 시작하여 우로 쓰는 경우이므로 상기와 같은 글자획을 수평으로 수정하여 특징추출부(3)에 전달하게 된다.
그리고, 대표점추출부(2e)로 입력된 첫번째획의 첫방향성분(D)이 제6도의 (c)에서와 같이, "9", "10", "11"("↓"성분)이면, 즉 6시방향과 9시방향 사이에 존재하면 상기한 글자획을 반시계방향으로 회전시켜 수직으로 수정하게 되는데, 이는 "ㄴ, ㅁ, ㅂ, ㅃ,"과 같은 글자획을 우에서 부터 시작하여 아래로 쓰는 경우므로 상기와 같은 글자획을 수직으로 수정하여 특징추출부(3)에 전달하게 된다.
또한 대표점추출부(2e)로 부터 입력된 첫번째획의 첫방향성분(D) 이 제6도의 (d)에서와 같이, "13", "14", "15"이면, 즉 3시방향과 6시방향 사이에 존재하면 이는 자모를 이루는 획들로써, 첫번째 획의 첫방향 성분이 "↓"방향인지 또는 "→"방향인지를 정확하게 구별하기 위해서 다음에 입력되는 대표점의 방향을 조사하여 그 조사된 방향에 따라 반시계방향 또는 시계방향으로 회전시켜 글자획을 수평 또는 수직으로 수정한 후 이를 특징추출부(3)에 입력하게 된다.
그리고 상기에서 구한 방향성분값(N)이 "0-7"이면, 즉 1, 2, 3, 5, 6, 7이면 상기 과정 이외의 조건으로 처리하여 "ㅅ, ㅆ, ㅇ, ㅊ, ㅎ,"을 바로잡아 특징추출부(3)에 입력하게 된다.
이와같은 과정으로 전처리부(2)의 바로세우기부(21)를 통해 수정된 일정한 점의 크기 및 일정한 점의 갯수를 갖는 좌표점이 입력되면 특징추출부(3)는 이를 X축, Y축으로 하여 회의 전체길이와 회의 시작점과 끝점의 길이등을 계산하고 스트로크인식부(4)에 입력하게 된다.
상기 스트로크인식부(4)는 특징추출부(3)에서 입력된 글자의 획을 1차로 각도의 변화형태에 따라 대분류를 한 다음 상기 특징추출부(3)로 부터 계산된 특징값을 이용하여 정의된 획을 최종인식하게 된다.
이와같이, 인식된 획은 일반적으로 복합자소로써, 초성, 중성이 결합된 형태, 또는 중성, 종성이 결합된 형태이거나 또는 초성, 중성, 종성이 모두 결합된 형태로 인식되어 문자인식부(5)에 입력되므로써, 상기 문자인식부(5)는 상기와 같이, 결합된 형태로 입력되는 글자획으로 부터 자소를, 즉 초성, 중성, 종성으로 분리하여 인식한 후 이를 다시 조합해서 하나의 글자를 형성하여 문자보정부(6)에 입력하게 된다.
상기 문자정보부(6)는 상기 문자인식부(5)의 오인식 및 미인식에 의해 그릇된 글자가 입력되면 이를 바로 잡아 문자코드변환부(7)에 입력하게 된다.
상기 문자코드변환부(7)는 문자보정부(6)를 통해 보정되어 입력되는 글자를 한글조합형 또는 완성형코드로 변환하여 출력하게 된다.
이상에서 상세히 설명한 바와같이, 본 발명은 필기자의 속기 또는 미숙에 의해 발생되는 샘플점의 누락을 보상하고, 개인적인 필기습관에 의해 변형되어 입력되는 글자 또는 뉘어져 입력되는 글자를 바르게 수정하여 인식하므로써, 미인식 또는 오인식 방지는 물론 필기체의 문자를 빠른 시간내에 효율적으로 인식할 수 있는 효과가 있다.

Claims (20)

  1. 테블렛입력수단을 통해 입력된 글자의 X좌표, Y좌표의 점들중에서 중첩점 및 속기의 시간차에 의한 누락점을 보상하고 입력된 문자의 형태를 조사하여 문자를 인식할 수 있도록 교정처리하는 전처리수단과, 상기 전처리수단을 통해 교정된 일정한 점의 크기 및 일정한 점의 갯수를 갖는 좌표점을 X, Y축으로 하여 획의 전체 길이, 회의 시작점과 끝점의 길이등을 계산하는 특징추출수단과, 상기 특징추출수단에서 얻어진 글자획을 인식하고 그 인식된 글자획에 따라 코드로 변환하여 문자인식수단에 전달하는 스트로크인식 수단을 포함하여 된 온라인 문자인식 시스템.
  2. 제1항에 있어서, 전처리수단은 상기 테블렛입력수단을 통해 입력된 글자의 X좌표, Y좌표의 점들중에서 일정거리 이상 또는 이하의 점들간의 거리를 일정한 거리로 재샘플링하여 중복점 및 근접점을 제거하는 재샘플링수단과, 상기 재샘플링수단을 통해 얻어진 글자를 평활화시켜 그 글자에 포함된 잡음을 제거하는 평활화수단과, 상기 평활화수단으로 부터 얻어진 점들중에서 3점의 방향을 고려하여 입력 데이타량를 최소화시키는 세점필터링수단과, 상기 세점필터링수단으로 부터 글자획의 입력시 그 글자획의 전체 길이와 비교하여 시작점 또는 마지막 두점 사이의 거리가 짧고 필기변화가 심한 부분을 판별하여 제거하는 비침제거수단과, 상기 삐침제거수단으로 부터의 문자형태를 보존하는 최소한의 대표점을 획단위로 추출하는 대표점추출수단과, 상기 대표점추출수단으로 부터의 기울어진 문자 입력시 개별문자 또는 단어에 적용하여 대표점의 방향성분에 따라 기울기를 조사한 후 이를 바른위치로 정정하여 특징추출수단에 입력하는 바로세우기수단으로 구성함을 특징으로 한 온라인 문자인식 시스템.
  3. 제2항에 있어서, 재샘플링수단의 점들간 샘플링 정의는 (m)2≤(Xi-Xi+l)2+(Yi-Yi+1)2≤(M)2로 하여 이 식을 만족한 점들은 받아들이고, 만족하지 못하는 점들은 제거함을 특징으로 한 온라인 문자인식 시스템 : 여기서 m : 표본화 최소치 M : 표본화 최대치 Xi, Yi : i번째 입력점의 X좌표, Y좌표.
  4. 제2항에 있어서, 평활화수단의 잡음제거 정의는 평활화하고자 하는 자신점과 그 자신점 이전의 3점 및 자신점 이후의 3점에 각각 가중치를 곱하고 그 곱하연 구해진값을 다시 가산한 후 이를 "27"로 평균화시켜 잡음을 제거시키는 것을 특징으로 한 온라인 문자인식 시스템.
  5. 제4항에 있어서, 가중치는 현재 자신점과의 거리가 가까울수록 비례되게 부가함을 특징으로 한 온라인 문자인식 시스템.
  6. 제4항 또는 5항에 있어서, 자신점의 가중치는 "7"로 함을 특징으로 하는 한 온라인 문자인식 시스템.
  7. 제2항에 있어서, 세점필터링수단의 정의는 한 획에 대한 점들중에서 자신점을 중심으로 앞뒤점의 방향변화가 생기면 그 변화된 부분을 제거하여 데이타를 최소화함을 특징으로 한 온라인 문자인식 시스템.
  8. 제2항에 있어서, 대표점추출수단의 정의는 문자형태를 보존하는 최소한의 대표점을 최소각 또는 선분열의 길이를 이용하여 획단위로 추출함을 특징으로 한 온라인 문자인식 시스템.
  9. 제8항에 있어서, 최소각을 이용한 대표점추출을 획단위의 시작점과 끝점에서 획내의 각점에 직선을 그어 그 사이가 최소인점을 굴곡점으로 하여 대표점을 추출하는 것을 특징으로 하는 한 온라인 문자인식 시스템.
  10. 제9항에 있어서, 최소각의 굴곡점 정의는 Bp={Pij| aij<125°} aij==Min θijθij=∠Pi1PijPini함을 특징으로 한 온라인 문자인식 시스템 : 여기서 J : 한 획에 대한 임의 변수점 ;와이루는 각도.
    ni : i번째 획에 대한 첫번째 점.
    Pij: i번째 획에 대한 임의의 변수점.
    Pini: i번째 획에 대한 마지막점.
  11. 제10항에 있어서, 임의 변수점(j)은 ni/6 보다 크고 5ni/6보다 작게 함을 특징으로 한 온라인 문자인식 시스템.
  12. 제8항에 있어서, 선분열을 이용한 대표추출 정의는로 하여 대표점을 추출하는 것을 특징으로 한 온라인 문자인식 시스템 : 여기서 P1, P2‥‥Pn: 샘플점 , B1, B2‥‥Bm : 대표점, S : 대표점의 수, L(Pt, Pt+1) : 인접 샘플점을 잇는 선분길이. L(B1, Bi+1) : 임의 대표점 B1와 대표점 Bi+1을 잇는 선분길이. Cr: 압축율.
  13. 제12항에 있어서, 상기 압축율(Cr)은 0≤Cr≤1의 조건을 갖는 것을 특징으로 한 온라인 문자인식 시스템.
  14. 제13항에 있어서, 상기 압축율은 0.95로 함을 특징으로 한 온라인 문자인식 시스템.
  15. 제2항에 있어서, 바로세우기수단의 정의는 입력된 대표점간의 방향성분중 같은 성질의 성분을 합한 값중에서 가장큰 방향성분값(N)을 구하여 그 방향성분값(N)에 따라 기울어짐을 교정하는 것을 특징으로 한 온라인 문자인식 시스템.
  16. 제15항에 있어서, 방향성분값(N)이 3시방향과 6시방향이면 바른위치로 판단하여 특징추출수단으로 바로 전달함을 특징으로 한 온라인 문자인식 시스템.
  17. 제15항에 있어서, 대표점추출수단으로 부터 얻어진 첫번째획의 첫방향성분이 3시방향과 12시방향 사이에 존재하면 글자획을 시계방향으로 회전시켜 수평으로 교정함을 특징으로 하는 온라인 문자인식 시스템.
  18. 제15항에 있어서, 대표점추출수단에서 얻어진 첫번째획의 첫방향성분이 6시방향과 9시방향 사이에 존재하면 글자획을 반시계방향으로 회전시켜 수직으로 교정함을 특징으로 한 온라인 문자인식 시스템.
  19. 제15항에 있어서, 대표점추출수단에서 얻어진 첫번째획의 첫방향성분이 3시방향과 6시방향 사이에 존재하면 다음에 입력되는 대표점의 방향에 따라 반시계방향 또는 시계방향으로 회전시켜 글자획을 수평 또는 수직으로 교정함을 특징으로 한 온라인 문자인식 시스템.
  20. 제15항에 있어서, 방향성분값이 3시방향과 12시방향을 제외한 3시방향과 9시방향 사이에 존재하면 제16항 내지 제18항 이외의 조건으로 글자획을 교정함을 특징으로 한 온라인 문자인식 시스템.
KR1019930002796A 1993-02-26 1993-02-26 온라인 문자인식 시스템 KR950005533B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019930002796A KR950005533B1 (ko) 1993-02-26 1993-02-26 온라인 문자인식 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019930002796A KR950005533B1 (ko) 1993-02-26 1993-02-26 온라인 문자인식 시스템

Publications (2)

Publication Number Publication Date
KR940020258A KR940020258A (ko) 1994-09-15
KR950005533B1 true KR950005533B1 (ko) 1995-05-25

Family

ID=19351335

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019930002796A KR950005533B1 (ko) 1993-02-26 1993-02-26 온라인 문자인식 시스템

Country Status (1)

Country Link
KR (1) KR950005533B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11030473B2 (en) * 2017-10-16 2021-06-08 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing information processing program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100414051B1 (ko) * 1995-12-20 2004-03-18 엘지전자 주식회사 문자의획인식방법
KR102570007B1 (ko) 2019-11-04 2023-08-23 삼성전자주식회사 필기 입력을 보정하는 방법 및 전자 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11030473B2 (en) * 2017-10-16 2021-06-08 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing information processing program

Also Published As

Publication number Publication date
KR940020258A (ko) 1994-09-15

Similar Documents

Publication Publication Date Title
US5742705A (en) Method and apparatus for character recognition of handwritten input
Hu et al. Writer independent on-line handwriting recognition using an HMM approach
EP1564675B1 (en) Apparatus and method for searching for digital ink query
AU737039B2 (en) Methods and apparatuses for handwriting recognition
US5802205A (en) Method and system for lexical processing
US5854855A (en) Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
US7885464B2 (en) Apparatus, method, and program for handwriting recognition
KR940001047B1 (ko) 온라인 필기체 인식시스템 및 방법.
US20060050962A1 (en) System, process and software arrangement for recognizing handwritten characters
JP3155616B2 (ja) 文字認識方法及び装置
Manke et al. A connectionist recognizer for on-line cursive handwriting recognition
KR950005533B1 (ko) 온라인 문자인식 시스템
Hu et al. Combining high-level features with sequential local features for on-line handwriting recognition
KR0126800B1 (ko) 한글필기체 온라인 문자인식 장치 및 방법
JPS62287387A (ja) 手書き文字のオンライン認識方式
KR940001739B1 (ko) 스트로크인식을 통한 온라인 필기체 문자인식방법
WO1992005517A1 (en) Audio-augmented handwriting recognition
KR100301216B1 (ko) 온라인문자인식장치
JP3338575B2 (ja) オンライン手書き文字認識装置
Maarouf et al. Correcting optical character recognition result via a novel approach
KR960013818B1 (ko) 다중획인식을 이용한 한글조합인식장치
KR940003828B1 (ko) 온라인 필기체 한글인식 방법
JP3115369B2 (ja) 局所的字形変動を考慮したオンライン走り書き文字認識装置
Rhee et al. On-line recognition of cursive hangul by DP matching with structural information
KR970000276B1 (ko) 필기체 문자인식방법

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20020326

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee