KR940001739B1 - 스트로크인식을 통한 온라인 필기체 문자인식방법 - Google Patents
스트로크인식을 통한 온라인 필기체 문자인식방법 Download PDFInfo
- Publication number
- KR940001739B1 KR940001739B1 KR1019910023678A KR910023678A KR940001739B1 KR 940001739 B1 KR940001739 B1 KR 940001739B1 KR 1019910023678 A KR1019910023678 A KR 1019910023678A KR 910023678 A KR910023678 A KR 910023678A KR 940001739 B1 KR940001739 B1 KR 940001739B1
- Authority
- KR
- South Korea
- Prior art keywords
- stroke
- recognition
- character
- point
- classification
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
Abstract
내용 없음.
Description
제1도는 본 발명의 온라인 필기체 문자인식 시스템 구성도.
제2도는 제1도에 따른 문자인식 처리 흐름도.
제3a도 및 제3b도는 특징점 추출시의 설명도.
제4도는 본 발명에 따른 문자인식 순서도.
제5a도 및 제5b도는 본 발명에 따른 구분인식시의 방향코드설정 설명도.
제6a도 내지 제6d도는 ㅌ 및 ㅂ의 획순조정 설명도.
제7도는 스트로크의 분류표.
제8a도 및 제8b도는 스트로크의 방향각 설명도.
제9도는 퍼지 데이타 분류표.
제10도는 입력문자 및 기준문자 패턴도.
제11도 내지 제16a도 내지 제16f도는 입력문자와 기준문자의 비교 설명도.
* 도면의 주요부분에 대한 부호의 설명
1 : 태블릿입력부 2, 6, 9 : 메모리
3 : 전처리부 4 : 특징점 추출부
5 : 스트로크인식부 7 : 문자인식부
8 : 표준문자저장부 10 : 출력부
본 발명은 스트로크인식을 통한 온라인 문자인식과 흘려쓰는 경우의 인식 및 틀리게 입력되는 획순을 조정하여 문자을 인식하도록 하는 온라인(on-line) 필기체 인식 시스템에 관한 것으로, 특히 기본 스트로크를 분류하여 인식하는데 필요한 특징점만을 추출하고 다시 대, 중, 소 분류하여 입력된 문자데이타와 가장 가까운 문자를 추출하여 인식하도록 한 스트로크인식을 통한 온라인 필기체 문자인식방법에 관한 것이다.
온라인 문자인식은 현재 영문이나 한자의 경우와, 한글 온라인인식의 한가지 방법(산업연구원 21호 "OCR의 기술동향인식기술"-Ⅵ. 온라인문자인식)에 대해 알려진 기술이 있으나 한글의 경우는 공지된 기술이 거의 없는 상태이다.
따라서 본 발명의 목적은 흘려쓴 문자나 틀리게 입력된 획순을 정정하여 올바르게 문자를 인식할 수 있도록 함에 있다.
제1도는 본 발명의 온라인 문자인식 시스템 구성도로서 태블릿입력부(1)를 통해 입력되는 데이타(정보)를 저장하는 메모리(2)와, 상기 메모리(2)에 기억된 정보에서 실제 인식시에 불필요한 정보를 제거하고 필요한 정보만 선택하는 전처리부(3)와, 상기 전처리부(3)의 출력데이타에 대해 스트로크인식에 사용되는 6가지 특징점에 의거한 특징점들을 추출하는 특징점 추출부(4)와, 상기 특징점 추출부(4)에서 추출된 특징점에 따라 스트로크를 인식하는 스트로크인식부(5)와, 상기 스트로크인식부(5)를 통해 인식된 정보는 메모리(6)를 통한 후 표준문자저장부(8)의 표준문자 2350자와 비교하여 가장 비슷한 문자코드를 메모리(9)를 통해 출력부(10)로 출력하는 문자인식부(7)로 구성한다.
이와 같이 구성된 본 발명 온라인 필기체 문자인식 시스템의 작용 및 효과를 첨부한 도면에 의하여 상세히 설명하면 다음과 같다.
사용자가 태블릿(Tablet)에 종이 위에 필기하듯이 글씨를 쓰게 되면 태블릿입력부(1)에서 펜-다운(down)에서 펜-업(up)까지 쓰여진 데이타, 즉 스트로크(stroke)의 정보가 메모리(2)에 기억이 된다. 이 메모리(2)에 기억된 정보에는 실제로 인식되는데 필요하지 않는 많은 정보가 들어 있으므로 인식시엔 필요한 정보만 선택하는 전처리부(3)를 통해 전처리를 하게 되는데, 전처리과정을 설명하면 다음과 같다.
첫째, 전처리부(3)에서는 필기시 펜의 시작점과 끝점에서 발생하는 훅(hook) 및 필기시 잘못하여 찍힌 오인식의 원인이 되는 점들을 제거하기 위하여 같은 샘플점(sample point)에서 계속해서 입력이 들어오면 첫 샘플점을 제외하고 나머지는 모두 제거하는 3가지 처리를 하여 필요없는 정보의 입력을 제거한다. 여기서, 훅이란 태블릿(Tablet)이 약간 미끄러우므로 "기"라는 글자를 쓰고자 할 경우와 같이 펜-다운시나 업시에 첫점과 끝점이 약간 구부러지는 것을 말한다.
즉, 스트로크인식에 주로 사용되는 방향성특징에 필요한 스트로크의 처음과 마지막 그리고 꺽이는 부분의 특징점들을 추출하는데 적합하도록 구현한 것으로, 그 과정은 거리필타링, 각필타링, 훅제거의 3가지 전처리를 행하는데 거리필타링은 중복되는 샘플점을 제거하기 위하여 3픽셀(pixel)당 1개의 샘플점만을 선택한다. 그리고 각필타링은 첫점부타 시작하여 이전점과 현재점을 잇는 선분과 현재점과 다음점을 잇는 선분사이의 각이 45도 이상인 점만을 선택하고, 훅제거는 시작점과 두 번째점과의 거리를 d1, 두 번째와 세 번째점 사이의 거리를 d2, 세 번째와 네 번째점 사이의 거리를 d3라고 했을 때 다음식을 만족하면 시작점 및 두 번째점을 제거한다.
d1×4<d2 : 시작점제거
(d1×4<d3)와 (d2×4<d3) : 시작점, 두 번째점제거
이와 같이 전처리부(3)에서 실제 인식에 필요한 데이타만 남겨놓고 나머지 데이타는 제거하여 인식하기 위한 기본데이타 수집이 끝나면, 이 수집된 기본데이타는 인식시에 필요한 특징점 추출을 특징점 추출부(4)에서 하는 되는데, 이는 아래에서와 같다.
1. 스트로크 정의 : ㅇ, ㄱ, ㄴ, /, ㅣ, \, ㅡ, ㄹ
본 인식시스템에서는 상기 8개의 스트로크를 정의하여 사용하며, 여기서 스트로크란 펜다운에서 펜업까지의 일련의 샘플점들의 모임을 말한다.
2. 스트로크인식에 사용되는 특징이란 본 발명에서 스트로크인식에 이용하기 위하여 다음의 6가지 특징점을 정의한 것이다.
① 시작점과 끝점과의 거리 : es-d(제3a도에 도시)
② 스트로크의 총길이 : 1-1
③ 스트로크의 첫점과 끝점을 연결한 선분에서 스트로크까지 (+)방향으로 가장 긴 선분의 길이 : 1d-max, 스트로크의 첫점과 끝점을 연결한 선분에서 스트로크까지 (-)방향으로 가장 긴 선분의 길이 : 1d-min(제3b도에 도시)
④ 1d-max와 1d-min의 절대값중에서 큰값 : 1d-max-min
⑤ 직선분리에 이용하기 위하여 1d-max-min값에서 es-d로 나눈값 eff1=1d-max-min/es-d
⑥ ㄱ, ㄴ 분리에 이용하기 위하여 es-d값에서 1-1로 나눈값 eff2=es-d/1-1
이와 같은 특징점들은 스트로크를 인식하는데 필요한 부분으로서, 상기 과정을 거쳐 특징점 추출부(4)에서 추출된 특징점들은 스트로크인식부(5)를 입력되는데, 상기 스트로크인식부(5)에서는 인식 순서는 제4도에 도시한 바와 같다.
1. 흘려쓴 인식 2. 직선인식
3. /, ㅣ, \, ㅡ 구분인식 4. ㄱ, ㄴ 분리인식
5. ㅁ 인식 6. ㄹ, ㅁ 인식
7. 스트로크분리 8. ㅌ, ㅂ 획순조정
과 같은 과정을 거쳐 스트로크를 인식하는데, 이는 다음과 같다.
먼저 입력되는 샘플데이타가 es-d>4.0, 1d-max≥7.0, -1d min≥7.0의 조건을 동시에 만족하면 인식 알고리즘에 의해 흘려쓴 로 인식하고 다음 ㄹ, ㅁ을 인식하기 위한 단계로 넘어가고, 흘려쓴 을 인식하지 못하면 eff1>0.2이며 "샘플점이 3개이하 2개이상"의 조건을 만족하는 것을 체크하여 그 조건을 만족하면 직선으로 인식하고, ㅣ,\, /, ㅡ중 어느것인지를 판별하는데 그 구분은 다음과 같다.
제5(a)도에서와 같이 1, 4분면의 선분의 기울기를 다음과 같이 나누어 /, ㅣ, \, ㅡ을 인식한다.
① : 67°이상∼90°이하 또는 -67°이상∼-90°이하이면 "ㅣ"으로 인식하고, ② : 23°이상∼67°이하이면 "/"으로 인식하며, ③ : 0°이상∼23°이하 또는 -23°이상∼0°이하이면 "ㅡ"으로 인식하고, ④ : -23°이상∼-67°이하이면 "\"로 나누어 구분인식을 한다.
그리고 상기 과정에서 직선을 인식하지 못하면 ㄱ, ㄴ 분리인식 단계로 넘어가는데, 이는 다음 조건을 만족하면 ㄱ, ㄴ으로 인식한다. 또한 제5b도에서와 같이 스트로크의 증간점이 왼쪽에 있으면 "ㄴ"으로 인식하고, 오른쪽에 있으면 "ㄱ"을 인식하며, 바로전의 스트로크가 \, ㅣ, /이면서 "ㄱ"이 입력되면 "ㅁ"으로 인식(예)한다.
위의 모든 과정에서 인식되지 않는 스트로크는 "0"으로 인식하고 또한 상기 과정에서 흘려쓴 을 인식하면 그 다음 ㄹ, ㅁ 구분인식으로 넘어가는데, 이는 다음과 같다.
흘려쓴 의 경우 ㄹ로도 인식이 가능하며 또한 ㅁ으로도 인식이 가능하다.
그래서 현재의 스트로크가 흘려쓴 이면 ㄹ과 ㅁ으로 구분해 주어야 한다. 따라서 현재의 스트로크가 흘려쓴 일 경우 바로 전 스크로크가 /, ㅣ, \이면서 현 스트로크의 끝점 X좌표가 전 스트로크의 끝점 X좌표보다 크고, 전 스트로크의 시작점 X좌표가 현 스트로크의 시작점 X좌표와 충분히 가까울 때 ㅁ으로 인식하고, 그 이외의 경우는 ㄹ로 인식하게 된다.
흘려쓴 과 의 획수는 일정하여야 하는데 흘려쓴 과 의 경우는 각각 1획과 2획이 된다. 그러나 정자로 쓸 경우에는 각각 3획이므로 흘려쓴 은 1획에서 3획(ㄹ)으로, 흘려쓴 은 2획에서 3획(ㅁ)으로 분리해 주어야 하는데, 그 분리방법은 흘려쓴 의 경우는 ㄱ, ㅡ, ㄴ으로 분리하고 ㅁ의 경우는 ㅣ, ㄱ, ㅡ로 분리한다.
이상에서와 ㄱ, ㄴ, ㅇ, /, ㅣ, \, ㅡ을 인식한 후에 "ㅌ"와 "ㅂ"의 경우 사람마다 필기하는 순서가 다르므로 각각의 필순을 조정해 주어야 하는데, 그 획순의 조정은 다음과 같다.
"ㅌ"의 획순은 제6(a)도 및 제6(b)도에 도시한 바와 같이
그러나, 데이타베이스에 들어있는 획순은 제6(b)도와 같기 때문에 제6(a)도와 같은 순서로 스트로크가 태블릿으로 입력되면 인식이 불가능하게 되므로 제6(a)도와 같은 순서로 입력되더라도 획순을 조정하여 제6a도의 ③획과 ②획의 순서를 바꾸어서 제6(b)도와 같이 획순을 조정하여 인식하므로써 두 종류의 획순 모두 인식을 가능하게 한다.
또한 "ㅂ"의 획순은 제6c도 및 제6d도에 도시한 바와 같이
그러나, 데이타베이스에는 제6d도에서와 같은 획순이 저장되어 있으므로 제6c도와 같은 순으로 입력되더라도 "ㅌ"의 경우와 같이 제6d도의 순서대로 조정을 하여 인식가능하게 한다.
이와 같은 방법에 의해서 인식된 기본스트로크(ㅇ, ㄱ, ㄴ, /, ㅣ, \, ㅡ, ㄹ)는 메모리(6)에 기억되고, 다시 문자인식부(7)에서는 문자을 인식하게 되는데 그 방식은 다음과 같다.
상기 문자인식부(7)에서는 인식속도의 향상 및 인식률을 향상시키기 위하여 스트로크수에 의한 대분류, 입력문자가 8개의 기본스트로크중 어느것으로 구성되어 있는가를 판별하여 1차인식을 행하는 중분류, 그리고 중분류에 의해 감소된 인식대상문자를 상대로 최종인식을 하게되는 소분류과정으로 구성되어 있다.
대분류는 인식대상의 수를 줄이기 위하여 스트로크수에 의해 차분류.
중분류는 입력문자의 기본스트로크 구성에 의한 분류 즉, 입력문자가 8개의 기본스트로크중 어느것으로 구성되어 있는가를 판별하여 1차인식을 행함으로써 소분류에 들어가기 전에 인식대상문자의 감소를 꾀한다. 인식방법은 스트로크매칭법으로서 입력문자의 스트로크 코드열과 기준문자의 스트로크 코드열을 비교하여 코드가 같은 문자를 분류해낸다. 또한 입력문자가 필시습관에 인한 필체의 변동으로 오분류되는 것을 막기 위해 허용도에 따라 대상문자를 증가 혹은 감소시킨다. 즉, 허용도를 증가시키면 인식대상문자가 많아져 오분류로 문자를 오인식할 확률은 적어지나 그만큼 속도가 저하되고, 대상문자가 많아지므로 오히려 오인식을 야기할 수도 있으므로 허용되는 적절하게 조절해 주어야 한다.
소분류는 중분류에서 후보문자를 대상으로 스트로크간의 상대적 위치정보인 Head-Head, Tail-Head를 구하여 인식시 애매성을 극복하기 위하여 퍼지(fuzzy)추론을 도입하였다. 여기서 Head-Head(이하 HH라 칭함)은 첫 번째 스트로크의 시작점에서 다음 스트로크의 시작점과 방향각을 나타낸 것으로 이 예로는 제8a도와 같고, Tail-Head(이하 HH라 칭함)은 첫 번째 스트로크의 끝점에서 다음 스트로크의 첫 번째점까지의 방향각을 나타낸 것으로 이는 제8b도에 도시한 바와 같다.
이때 방향각은 +90도에서 -90도까지의 값을 10도 간격으로 18등분 하여 그 각각에 대하여 퍼지값을 할당하였는데 이는 제9도에 도시한 것과 같다.
이상에서와 같은 분류과정에 대하여 상세히 살펴보면 다음과 같다.
문자인식부(7)에서는 먼저 스트로크의 수에 의해 스트로크수가 같은 후보문자들만 분류하는 제1차분류(대분류)를 하고 그 다음에 대분류 과정에서 선택된 후보문자 중에서 제7도에 도시한 분류표에서와 같이 8개의 스트로크에 각 코드를 부여한 것에서 스트로크 매칭을 행하는데, 가령「계」인 경우 기본스트로크 코드는 "38866"이다.
그러나 기본스트로크 코드가 "38866"인 문자는「계」뿐만 아니라「케, 퀴, 큐」도 같은 기본스트로크 코드를 가지므로, 이 기본스트로크 코드열이 갖은 문자를 추출하여 소분류 과정에서 최종적으로 인식결과를 얻어내기 위하여 최소한의 후보문자를 만들어 낸다.
상기 중분류 과정에서 추출된 후보문자를 대상으로 스트로크간의 상대적 위치정보를 이용하여 소분류를 행하는데, 이 상대적 위치정보는 HH(Head-Head), Th(Tail-Head)로 구한다.
HH TH
① → 7 ① → 4
② → 8 ② → 17
③ → 16 ③ → 3
이와 같은 값을 갖게되고 방향각의 값은 항상(스트로크의 수 -1)개를 갖는다.
예를들어, "뉜"이라는 입력문자가 입력되었다고 하면 입력문자의 상대적 위치정보는 퍼지값을 갖는 멤버쉽 함수로 변환된 다음 변환된 입력문자의 멤버쉽 함수와의 유사도를 계산하여 전술한 바와 같은 중분류 과정을 거치게 되면 스트로크 코드가 "864"인 3개의 기본문자「뉜, 넌, 눈」을 얻게되는데, 이렇게 기준문자가 결정되면 입력문자와 각 기준문자와의 유사도를 퍼지추론을 통해서 구해서 입력문자와 기준문자가 동일한 지에 대한 확신도를 얻어내서 가장 큰 확신도를 갖는 기준문자를 출력문자로 결정하게 된다.
즉, 데이타베이스에 저장되어 있는 기준문자의 HH값 및 TH값과 입력문자의 HH, TH값을 퍼지추론에 의하여 그 유사도를 결정한 후 최소값을 확신도로 결정하게 된다.
제10도에서 입력문자「뉜」과 기준문자1「뉜」의 HH퍼지멤버쉽펑션(Fuzzy Membership Function)은 제11a도는 입력문자「뉜」과 기준문자1「뉜」의 첫 번째 스트로크「ㄴ」을 퍼지데이타값에 따라 나타낸 것으로 이때 겹치지는 멤버쉽펑션값은 제11b도에서와 같인 0.8이 되며, 이 값은 입력문자「ㄴ」과 기준문자1「ㄴ」의 가장 유사한 값임을 의미하는 것이다. 그리고 제11c도는 입력문자「뉜」중 두 번째 스트로크인「ㅡ」와 기준문자1「뉜」중 두 번째 스트로크의「ㅡ」을 퍼지데이타값으로 나타낸 것으로 두 데이타가 겹쳐지는 멤버쉽펑션값은 제11d도에서와 같은 0.9를, 다음으로 세 번쩨 스트로크인「ㅣ」을 퍼지데이타값에 나타내고 구한 멤버쉽펑션값이 제11f도에서와 같이 1.0을 나타낸다.
이상에서 설명한 바와 같이 입력문자와 기준문자 1의 HH퍼지멤버쉽펑션값에 의한 제11도의 제11b도, 제11d도, 제11f도에서 기준문자와 입력문자의 유사도는 0.8, 0.9, 1.0이므로 이렇게 결정된 값중 최소값을 확신도로 결정하게 되므로 입력문자「뉜」가 기준문자1「뉜」의 HH확신도는 0.8이다.
그리고, TH퍼지멤버쉽펑션은 제11도에서 설명한 같은 방법으로 제12도에 의거하여 살펴보면 제12b도, 제12d도, 제12f도에서 입력문자「뉜」가 기준문자1「뉜」의 유사도는 1.0, 0.9, 0.9이므로 TH확신도는 0.9가 된다.
따라서 최종확신도는, 최종확신도=(HH확신도+TH확신도)/2=(0.8+0.9)/2=0.85이다.
상기와 같은 방법으로 제10도에서 입력문자「뉜」과 기준문자2「넌」의 비교는 다음과 같다.
-제13도의 제13b도, 제13d도, 제13f도에서 입력문자와 기준문자의 HH유사도 : 0.3, 0.9, 0.8
입력문자「뉜」과 기준문자「넌」의 HH확신도 : 0.3
-제14도의 제14b도, 제14d도, 제14f도에서 입력문자와 기준문자의 TH유사도 : 0.2, 0.9, 0.9
입력문자「뉜」과 기준문자「넌」의 TH확신도 : 0.2
-최종확신도 : (0.3+0.2)/2=0.25
또한 제10도에서 입력문자「뉜」과 기본문자3「눈」의 비교는 다음과 같다.
-제15도의 제15b도, 제15d도, 제15f도에서 입력문자와 기준문자의 HH유사도 : 0.9, 0.4, 0.8
입력문자「뉜」과 기준문자「눈」의 HH확신도 : 0.4
-제16도의 제16b도, 제16d도, 제16f에서 입력문자와 기준문자의 TH유사도 : 0.9, 0.4, 0.7
입력문자「뉜」과 기준문자「눈」의 TH확신도 : 0.4
-최종확신도 : (0.4+0.4)/2=0.4
이상에서 입력문자「뉜」과 기준문자1「뉜」, 2「넌」, 3「눈」을 비교하여 얻은 최종확신도중 그 값이 가장 큰 기준문자1의 '뉜'이 출력문자로 결정되게 된다.
그리고 인식대상문자는 제1도의 표준문자저장부(8)에서 표준문자 2350자를 기준으로 획수순으로 데이타 베이스를 구성하는데 그 구조는 획수 스트로크 코드(N) HH(N-1) TH(N-1) 문자코드1(byte) N(byte) N-1(byte) N-1(byte) 2(byte)이고, 상기에서와 같이 문자인식부(7)에서 인식된 문자은 KS코드로 메모리(9)에 기억되고, 인식된 결과는 출력부(10)에 나타나게 된다.
지금까지 설명한 바와 같이 제2도에서 태블릿을 통해 입력되는 데이타정보를 전처리 및 특징점을 추출하면, 이 추출된 특징점은 다시 8가지 기본스트로크로 인식하고, 스트로크인식후에 스트로크수가 같은 후보문자를 분류하는 1차분류(대분류) 과정을 거치고, 다시 기본스트로크 코드와 매칭되는 문자를 선택하는 2차분류(중분류) 과정을 거친 다음 2차분류 과정에서 추출된 후보문자를 대상으로 스트로크간의 상대적 위치정보를 이용한 퍼지추론에 의해 3차분류(소분류)를 한 뒤 표준문자 2350자와 비교하여 가장 비슷한 문자 KS코드를 출력하도록 한다.
이상에서 상세히 설명한 바와 같이 본 발명은 키보드에 익숙해 있지 않은 사람이 컴퓨타를 대하는데 좀더 편리하게 대할 수 있도록 펜에 의해서 입력하는 방식으로 여러 가지 응용분야에 응용할 수 있는 효과가 있다.
Claims (8)
- 입력되는 정보중 인식시에 필요없는 훅(hook)이나 필기시 잘못하여 찍힌점들에 대한 정보를 제거하는 전처리단계와, 상기 전처리단계에서 전처리된 데이타에 대해 스트로크인식시 이용하기 위해 정의된 특징점을 추출하는 특징점 추출단계와, 상기 특징점 추출단계에서 추출된 특징점에 따라 스트로크를 인식하는 스트로크인식단계와, 상기 스트로크인식단계에서 스트로크 인식으로 인식된 데이타를 스트로크수에 의한 대분류와 스트로크 매창에 의한 중분류 및 퍼지추론에 의한 소분류를 통하여 표준문자와 가장 비슷한 문자를 인식하는 문자인식단계와, 상기 문자인식단계에서 인식된 문자인식결과의 문자를 입력문자와 유사도를 체크한 후 유사성이 가장놓은 문자를 출력하는 출력단계로 이루어지는 스트로크인식을 통한 온라인 필기체 문자인식방법.
- 제1항에 있어서, 상기 전처리단계는 같은 샘플점에서 계속해서 입력이 들어오면 첫 샘플점을 제외하고 나머지는 제거함과 함께 필기시 펜의 시작점과 끝점에서 발생하는 훅(hook) 및 필기시 잘못하여 찍힌점들을 제거함을 특징으로 하는 스트로크인식을 통한 온라인 필기체 문자인식방법.
- 제1항에 있어서, 상기 특징점 추출단계는 문자인식에 필요한 최소한의 8개 스트로크인 ㅇ, ㄱ, ㄷ, /, ㅣ, \, ㅡ, ㄹ와, 스트로크인식에 이용하기 위하여 정의한 다음의 6가지 특징점.① 시작점과 끝점과의 거리 : es-d② 스트로크의 총길이 : 1-1③ 스트로크의 첫점과 끝점을 연결한 선분에서 스트로크까지 (+)방향으로 가장 긴 선분의 길이 : 1d-max, 스트로크의 첫점과 끝점을 연결한 선분에서 스트로크까지 (-)방향으로 가장 긴 선분의 길이 : 1d-min④ 1d-max와 1d-max-min의 절대값중에서 큰값 : 1d-max-min⑤ 직선분리에 이용하여 위하기 1d-max-min값에서 es-d로 나눈값 eff1=1d-max-min/es-d⑥ ㄱ, ㄴ 분리에 이용하기 위하여 es-d값에서 1-1로 나눈값 eff2=es-d/1-1들을 이용하여 추출하도록 함을 특징으로 하는 스트로크인식을 통한 온라인 필기체 문자인식방법.
- 제1항에 있어서, 상기 스트로크인식단계는 ① 흘려쓴 인식, ② 직선인식, ③ /, ㅣ, \, ㅡ 구분인식, ④ ㄱ, ㄴ 분리인식, ⑤ 인식, ⑥ ㄹ, ㅁ, ⑦ 스트로크 분리, ⑧ ㅌ, ㅂ 획순조정 인식과 같은 과정을 거쳐 스트로크를 인식하도록 함을 특징으로 하는 스트로크인식을 통한 온라인 필기체 문자인식방법.
- 제4항에 있어서, 상기 ㄹ, ㅁ 인식은 입력된 스트로크가 ㄹ일 경우 바로 전 스트로크가 /, ㅣ, \이면서 현 스트로크의 끝점의 X좌표가 전 스트로크의 끝점의 X좌표보다 크고, 전 스트로크의 시작점 X좌표가 현 스트로크의 시작점 X좌표와 충분히 가까울 때 ㅁ을 인식하고 그외의 경우는 ㄹ로 인식함을 특징으로 하는 스트로크를 통한 온라인 필기체 문자인식방법.
- 제4항에 있어서, 상기 ㄱ, ㄴ 인식은 직선인식에서 직선이 아닌 경우 스트로크의 중간점이 오른쪽에 있으면 ㄱ으로 인식하고 왼쪽에 있으면 ㄴ으로 인식하도록 함을 특징으로 하는 스트로크를 통한 온라인 필기체 문자인식방법.
- 제1항에 있어서, 상기 문자인식단계는 인식대상문자의 수를 줄이기 위하여 스트로크의 수에의해 스트로크수가 같은 후보문자들만 분류하는 대분류를 하고, 이 대분류를 행한다음 스트로크 매칭법으로 입력문자의 스트로크 코드열과 기준문자의 스트로크 코드열을 비교하여 코드가 같은 문자를 분류해내는 중분류를 하며, 상기 중분류에서의 후보문자를 대상으로 스트로크간의 상대적 위치정보인 H-H(Head-Head), T-H(Tail-Head)를 구하여 인식시 애매성을 극복하기 위하여 퍼지추론을 위한 기준문자와의 유사도를 계산하여 해당문자를 인식하도록 하는 소분류를 행하는 인식함으로 특징으로 하는 스트로크를 통한 온라인 필기체 문자인식방법.
- 제1항에 있어서, 상기 출력단계는 입력문자와 기존문자와의 유사도를 퍼지추론을 통해 구한 뒤 입력문자가 기준문자와 동일한지에 대한 확신도를 구하여 가장 큰 확신도를 갖는 기준문자를 출력문자로 결정함을 특징으로 하는 스트로크를 통한 온라인 필기체 문자인식방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019910023678A KR940001739B1 (ko) | 1991-12-20 | 1991-12-20 | 스트로크인식을 통한 온라인 필기체 문자인식방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019910023678A KR940001739B1 (ko) | 1991-12-20 | 1991-12-20 | 스트로크인식을 통한 온라인 필기체 문자인식방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR930014176A KR930014176A (ko) | 1993-07-22 |
KR940001739B1 true KR940001739B1 (ko) | 1994-03-05 |
Family
ID=19325372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019910023678A KR940001739B1 (ko) | 1991-12-20 | 1991-12-20 | 스트로크인식을 통한 온라인 필기체 문자인식방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR940001739B1 (ko) |
-
1991
- 1991-12-20 KR KR1019910023678A patent/KR940001739B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR930014176A (ko) | 1993-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5854855A (en) | Method and system using meta-classes and polynomial discriminant functions for handwriting recognition | |
US5768417A (en) | Method and system for velocity-based handwriting recognition | |
KR940001047B1 (ko) | 온라인 필기체 인식시스템 및 방법. | |
KR100297482B1 (ko) | 수기입력의문자인식방법및장치 | |
US5802205A (en) | Method and system for lexical processing | |
KR100249055B1 (ko) | 문자인식장치및방법 | |
Kavallieratou et al. | An unconstrained handwriting recognition system | |
EP0889433A2 (en) | Method and apparatus for on-line handwritten input character recognition and recording medium for executing the method | |
Elanwar et al. | Simultaneous segmentation and recognition of Arabic characters in an unconstrained on-line cursive handwritten document | |
Manke et al. | A connectionist recognizer for on-line cursive handwriting recognition | |
Murthy et al. | Choice of Classifiers in Hierarchical Recognition of Online Handwritten Kannada and Tamil Aksharas. | |
US5659633A (en) | Character recognition method utilizing compass directions and torsion points as features | |
Singh et al. | Online handwritten Gurmukhi words recognition: An inclusive study | |
Elaiwat | Holistic word descriptor for lexicon reduction in handwritten arabic documents | |
Ahmad et al. | Recognition of on-line handwritten Arabic digits using structural features and transition network | |
KR940001739B1 (ko) | 스트로크인식을 통한 온라인 필기체 문자인식방법 | |
KR0126800B1 (ko) | 한글필기체 온라인 문자인식 장치 및 방법 | |
KR950005533B1 (ko) | 온라인 문자인식 시스템 | |
KR100301216B1 (ko) | 온라인문자인식장치 | |
Hurst et al. | Error repair in human handwriting: an intelligent user interface for automatic online handwriting recognition | |
Kaur et al. | Printed text recognition system for multi-script image | |
KR960013818B1 (ko) | 다중획인식을 이용한 한글조합인식장치 | |
KR940003828B1 (ko) | 온라인 필기체 한글인식 방법 | |
KR940001048B1 (ko) | 온라인 필기체문자인식방법 | |
Flann | Recognition-based segmentation of on-line cursive handwriting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 19961230 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |