KR100290606B1 - Method for recognizing cursive of hangul in online system - Google Patents
Method for recognizing cursive of hangul in online system Download PDFInfo
- Publication number
- KR100290606B1 KR100290606B1 KR1019970076001A KR19970076001A KR100290606B1 KR 100290606 B1 KR100290606 B1 KR 100290606B1 KR 1019970076001 A KR1019970076001 A KR 1019970076001A KR 19970076001 A KR19970076001 A KR 19970076001A KR 100290606 B1 KR100290606 B1 KR 100290606B1
- Authority
- KR
- South Korea
- Prior art keywords
- segment
- neutral
- type
- change
- determining
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
Description
본 발명은 필기체 문자를 인식하는 방법에 관한 것으로, 특히 온라인(on-line) 한글 필기체 문자를 인식하는 방법에 관한 것이다.The present invention relates to a method for recognizing handwritten characters, and more particularly, to a method for recognizing on-line Hangul handwritten characters.
최근, PDA(Personal Digital Assistant 또는 Personal Digital Accessory), HPC(Hand-held Personal Computer)등과 같은 개인 정보단말장치의 이용이 급증하고 있다. 이들 개인 정보단말장치는 기존의 데스크 탑(desktop) PC(Personal Computer), 랩탑(laptop) PC 등에 비해 크기가 아주 작다. 이에따라 작은 크기의 PC에 적합한 입력 방법인 필기를 통한 입력방법이 중요하게 대두되고 있다.In recent years, the use of personal information terminal devices such as PDA (Personal Digital Assistant or Personal Digital Accessory), HPC (Hand-held Personal Computer), and the like are increasing rapidly. These personal digital assistants are very small compared to existing desktop PCs and laptop PCs. Accordingly, an input method through handwriting, which is an input method suitable for a small PC, has emerged as an important method.
이와 같이 필기를 통한 입력방법에 있어서 보다 자유로운 필기 입력을 가능하게 하기 위해서 연결형 온라인 한글 필기체 문자인식에 대한 많은 방법들이 연구되고 있다. 그러나 연결형 한글 인식은 분리형 한글 인식에 비해 많은 메모리 영역과 인식 시간이 요구된다.As described above, in order to enable free handwriting input in the input method through handwriting, many methods for connected online Hangul handwritten character recognition have been studied. However, connected Hangul recognition requires more memory area and recognition time than separate Hangul recognition.
상기한 바와 같이 온라인 한글 필기체 문자인식에 있어서 연결형은 분리형에 비해 많은 메모리 영역이 필요하며 인식 시간이 많이 소요됨에 따라 적용하기 곤란한 문제점이 있었다.As described above, in the on-line Korean handwritten character recognition, the connection type requires more memory area than the separate type and has a problem that it is difficult to apply as the recognition time is required.
따라서 본 발명의 목적은 적은 메모리를 사용함과 아울러 빠른 시간내 연결형 온라인 한글 필기체 문자를 인식할 수 있는 방법을 제공함에 있다.Accordingly, an object of the present invention is to provide a method for recognizing on-line Hangul handwritten characters connected in a short time while using less memory.
도 1은 본 발명의 실시예에 따라 한글 필기체 문자를 인식하기 위한 장치의 블록구성도,1 is a block diagram of an apparatus for recognizing a Korean handwritten character according to an embodiment of the present invention;
도 2는 본 발명의 실시예에 따른 한글 필기체 문자 인식 처리 흐름도,2 is a flowchart illustrating a Hangul handwritten character recognition process according to an embodiment of the present invention;
도 3은 도 2의 전처리과정의 처리 흐름도,3 is a processing flowchart of the preprocessing process of FIG. 2;
도 4는 도 2의 수직,수평 세그먼트 결정과정의 처리 흐름도,4 is a flowchart illustrating a process of determining vertical and horizontal segments in FIG.
도 5는 도 2의 중성 타입별 후보영역 결정과정의 일예를 보인 처리 흐름도,5 is a flowchart illustrating an example of determining a candidate region for each neutral type of FIG. 2;
도 6a 내지 도 6d는 본 발명의 실시예에 따라 한글 문자 ″국″을 입력하여 진행되는 과정에 따른 형태를 도시한 것으로, 도 6a는 입력 형태를 보인 것이고, 도 6b는 전처리 형태를 보인 것이며, 도 6c는 영역 구분과 수평,수직 세그먼트를 결정한 형태를 보인 것이며, 도 6d는 중성 ″ㅜ″ 영역을 결정한 형태를 보인 것이다.6A to 6D illustrate a form according to a process of inputting a Hangul character ″ station ″ according to an embodiment of the present invention. FIG. 6A illustrates an input form, and FIG. 6B illustrates a preprocessing form. FIG. 6C illustrates a form in which regions are divided and horizontal and vertical segments are determined, and FIG. 6D illustrates a form in which neutral ″ TT ″ regions are determined.
상술한 목적을 달성하기 위한 본 발명은 한글 문자를 필기된 궤적에 따라 입력하고 전처리하여 세그먼트(segment) 집합을 출력하는 과정과, 전처리된 세그먼트 집합을 필기 순서대로 추적하면서 세그먼트들로부터 수직 세그먼트 집합과 수평 세그먼트 집합을 구하여 결정하는 과정과, 한글 문자가 가지는 각 중성의 특징을 이용하여 시작점 및 끝점의 위치 및 끝 세그먼트의 방향을 기준으로 구분한 각 중성 타입별 후보영역으로 결정하는 과정과, 중성 타입별 후보영역 각각에 대해 중성을 인식하는 과정과, 인식된 중성의 영역을 기준으로 초성과 종성의 영역에 대해 각각 초성과 종성을 인식하는 과정과, 인식된 초성,중성,종성의 조합에 의해 한글 문자를 인식하는 과정을 구비함을 특징으로 한다.The present invention for achieving the above object is a process of inputting and preprocessing the Hangul characters according to the written trajectory and outputting a segment set, and tracking the preprocessed segment set in writing order, while vertically vertical segment set and horizontal The process of determining and determining the segment set, and the process of determining the candidate area for each neutral type based on the position of the start point and the end point and the direction of the end segment by using the characteristics of each neutral of the Hangul characters, and for each neutral type. Hangul characters by the process of recognizing neutrality for each candidate area, recognizing initial and finality for the initial and final areas based on the recognized neutral area, and combining recognized initial, neutral, and finality Characterized in that it comprises a process of recognizing.
이하 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명 및 첨부 도면에서 구체적인 문자 인식을 위한 처리과정의 예시나 처리 흐름과 같은 많은 특정 상세들이 본 발명의 보다 전반적인 이해를 제공하기 위해 나타나 있다. 이들 특정 상세들없이 본 발명이 실시될 수 있다는 것은 이 기술분야에서 통상의 지식을 가진 자에게 자명할 것이다. 그리고 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description and the annexed drawings, numerous specific details are set forth in order to provide a more thorough understanding of the present invention, such as examples of processing for specific character recognition or processing flow. It will be apparent to those skilled in the art that the present invention may be practiced without these specific details. And a detailed description of known functions and configurations that may unnecessarily obscure the subject matter of the present invention will be omitted.
우선 본 발명은 전술한 바와 같이 연결형 온라인 한글 필기체 문자인식에 있어서 나타나는 문제점을 해결하기 위해 한글의 특성을 이용하여 문자내에서 중성영역을 분리하여 인식함으로써 적은 메모리 사용으로 빠른 시간내에 온라인 연결형 한글 필기체 문자 인식이 가능한 방법을 제시한다. 한글은 초성, 중성으로 이루어진 문자와 초성, 중성, 종성으로 이루어진 문자로 구성된다. 그러므로 문자내에서 중성영역이 제대로 구분되어진다면, 각각의 자소 인식과 조합만으로 문자 인식이 가능해질 수 있다. 특히 중성은 그 형태가 초성, 종성과 달리 필기의 진행 방향이나 문자내에서의 위치가 고정적이므로 이러한 정보를 이용해서 효율적인 중성 분리가 가능하다. 이러한 점에 착안하여 본 발명은 각각의 중성을 그 시작위치와 끝위치를 중심으로 경계를 구분짓고, 그 중성을 이루기 위한 세그먼트(segment) 조합을 그 경계내에서 찾는다. 이에따라 간단하지만 효율적인 중성영역 구분이 가능하게 된다. 이와 같이 구분된 중성영역을 이용하여 자소를 인식하는데, 먼저 중성영역에 대해 중성을 인식한후, 인식된 중성을 기준으로 초성과 종성을 인식한다. 이와 같이 중성 분리를 이용하여 연결형 온라인 한글 필기체 문자 인식을 함으로써 종래에 비해 메모리를 적게 사용하게 될 뿐만아니라 인식에 소요되는 시간을 단축시킬 수 있게 된다.First, in order to solve the problem in the connected type of Korean Hangul handwriting character recognition as described above, the present invention uses the characteristics of the Hangul to recognize the neutral region in the character by separating the online connected Hangul handwriting characters in a short time using less memory. It suggests ways to be recognized. Hangeul is composed of letters consisting of initial and neutral characters, and letters consisting of initial and neutral characters. Therefore, if the neutral region is properly distinguished in the character, the character recognition may be possible only by the respective phoneme recognition and combination. In particular, since neutrality is fixed in the direction of handwriting or the position in the letter, unlike the initiality and the finality, the neutrality can be efficiently separated using this information. With this in mind, the present invention divides each neutral boundary around its start and end positions, and finds a segment combination within the boundary to achieve the neutrality. Accordingly, it is possible to distinguish a simple but efficient neutral region. The phoneme is recognized using the divided neutral regions. First, neutrality is recognized for the neutral region, and then initiality and species are recognized based on the recognized neutrality. In this way, by using the connected on-line Hangul handwritten character recognition using the neutral separation, as well as using less memory than the conventional it is possible to shorten the time required for recognition.
도 1은 본 발명의 실시예에 따라 연결형 온라인 한글 필기체 문자를 인식하기 위한 장치의 블록구성도를 보인 것으로, 하드웨어(hardware)는 통상적인 문자 인식시스템과 마찬가지로 입력장치(100)와 마이크로 프로세서(microprocessor)(102)와 메모리(104)와 출력장치(106)를 구비한다. 입력장치(100)는 전자 펜(108)을 구비하며, 사용자가 전자 펜(108)을 이용하여 필기하는 궤적에 따른 점들에 대해 2차원 좌표계에 의한 x,y좌표점 열(stream)을 발생한다. 이러한 입력장치(100)로서는 통상적으로 타블렛(tablet)이나 TSP(Touch-sensitive Screen Panel) 등이 사용된다. 본 발명에 있어서 입력장치(100)를 통해 입력하는 문자는 연결형 온라인 한글 필기쳬 문자를 대상으로 한다. 마이크로 프로세서(102)는 입력장치(100)의 출력을 입력받아 후술하는 바와 같은 본 발명의 실시예에 따른 문자 인식 처리에 의해 연결형 온라인 한글 필기체 문자를 인식하고 인식 결과를 출력장치(106)로 출력한다. 메모리(104)는 롬(ROM: Read Only Memory)과 램(RAM: Random Access Memory)을 구비한다. 롬에는 본 발명의 실시예에 따른 마이크로 프로세서(102)의 문자 인식 처리 프로그램과 문자 인식 처리를 위한 각종 참조 데이터가 저장된다. 램에는 마이크로 프로세서(102)의 문자 인식 처리에 따른 데이터가 일시 저장된다. 출력장치(106)는 예를 들어 액정 디스플레이장치가 될 수 있으며, 마이크로 프로세서(102)에 의한 문자 인식결과를 사용자가 식별할 수 있도록 출력한다.1 is a block diagram of an apparatus for recognizing connected online Hangul handwritten characters according to an embodiment of the present invention. The hardware is an
도 2는 본 발명의 실시예에 따른 한글 필기체 문자 인식 처리 흐름도를 보인 것으로, 상기한 도 1의 마이크로 프로세서(102)에서 수행되는 처리과정을 (200)∼(212)단계로 보인 것이다. 먼저 사용자가 입력장치(100)의 전자 펜(108)를 사용하여 한글 문자를 필기하면, 마이크로 프로세서(102)는 (200)단계에서 입력장치(100)로부터 한글 문자를 필기된 궤적에 따라 입력한다. 이때 입력장치(100)는 사용자가 전자 펜(102)을 이용하여 필기하는 궤적에 따른 점들에 대해 2차원 좌표계에 의한 x,y좌표점 열을 발생하여 마이크로 프로세서(102)에 인가하며, 마이크로 프로세서(102)는 입력장치(100)의 출력을 샘플링(sampling)하여 입력한다. 이때 입력장치(100)에 필기되어 입력되는 문자의 예를 보이면, 도 6a와 같다. 상기 도 6a는 예를들어 ″국″자를 입력하는 경우의 입력 형태를 보인 것이다.2 is a flowchart illustrating a Hangul handwritten character recognition process according to an exemplary embodiment of the present invention. The process performed by the
다음에 마이크로 프로세서(102)는 입력한 한글 문자를 (202)단계에서 전처리한다. 이러한 전처리과정은 기본적으로는 통상적인 문자 인식를 하기 전에 필수적으로 수행되는 전처리과정과 동일하다.Next, the
도 3은 상기한 (202)단계에서 수행되는 전처리과정의 처리 흐름도를 (300)∼(302)단계로 보인 것이다. 먼저 마이크로 프로세서(102)는 (300)단계에서 입력 문자에 대해 가로 크기×세로 크기를, 예를들어 72×72로 정규화하고, (302)단계에서 두 점간의 거리가 일정한 간격 이상이 되게, 예를들어 9이상이 되도록 재샘플링(resampling)한다. 이때 두 점으로 이루어진 구간을 ″세그먼트″라 한다. 그러므로 이러한 전처리과정에 의해 도 6b에 보인 바와 같이 두점으로 이루어지는 세그먼트 집합이 얻어진다. 상기 도 6b에서 참조번호 600은 재샘플링된 점들중 하나를 나타내고, 602는 세그먼트들중 하나를 나타낸다.3 shows a process flow diagram of the preprocessing process performed in
상기한 바와 같은 전처리과정을 상기 (202)단계에서 수행한후 마이크로 프로세서(100)는 (204)단계의 수직,수평 세그먼트 결정과정을 수행하는데, 전처리된 세그먼트 집합을 필기 순서대로 추적하면서 조건을 만족하는 세그먼트들을 각각 수직 세그먼트와 수평 세그먼트중에 한가지로 분류하여 결정한다. 즉, 후술하는 바와 같이 중성 영역 결정에 사용될 수직,수평 세그먼트를 결정한다.After performing the preprocessing process as described above in
도 4는 상기한 (204)단계에서 수행되는 수직,수평 세그먼트 결정과정의 처리 흐름도를 (400)∼(408)단계로 보인 것으로, 1개의 세그먼트에 대한 처리예로서 세그먼크들 각각에 대해 반복적으로 처리된다. 먼저 마이크로 프로세서(102)는 (400)단계에서 세그먼트를 입력하고, (402)∼(404)단계에서 세그먼트를 이루는 두 점간의 x좌표값 변화와 y좌표값 변화를 비교한다. 이때 x좌표값 변화가 y좌표값 변화보다 일정값 이상으로 크면, (408)단계에서 해당 세그먼트를 수평 세그먼트로 결정하여 등록한다. 이와 달리 y좌표값 변화가 x좌표값 변화보다 일정값 이상으로 크면, (406)단계에서 해당 세그먼트를 수직 세그먼트로 결정하여 등록한다. 만일 x좌표값 변화와 y좌표값 변화간에 상기 일정값 이상의 차이가 없으면, 해당 세그먼트를 무시하고 종료한다. 이때 일정값은 예를 들어 2로 설정한다. 이에따라 획의 진행방향이 ″아래로″ 진행되는 방향의 세그먼트는 수직 세그먼트로 결정되고, 획의 진행방향이 ″오른쪽으로″ 진행되는 방향의 세그먼트는 수평 세그먼트로 결정된다. 이러한 수직,수평 세그먼트 결정과정에 의해 도 6c와 같이 수직,수평 세그먼트 집합이 얻어진다. 도 6c에서 도면 부호 V를 기입한 세그먼트들은 수직 세그먼트를 나타내고, 도면 부호 H를 기입한 세그먼트들은 수평 세그먼트를 나타낸다. 그러므로 이하의 설명에서 편의상 수직 세그먼트는 ″V″로 칭하고, 수평 세그먼트는 ″H″로 칭한다.4 is a flowchart illustrating the vertical and horizontal segment determination process performed in
이후 마이크로 프로세서(100)는 (206)단계에서 미리 정의된 중성 타입별로 H,V 집합에 대한 중성영역을 찾아 각 중성 타입별 후보영역으로 결정한다. 상기 중성 타입은 한글 문자가 가지는 각 중성에 대해 한 문자의 영역을 2차원 좌표계의 x,y축방향으로 균등 분할한 단위영역들에 속하는 시작점 및 끝점의 위치와 시작 및 끝 세그먼트의 방향을 기준으로 구분한다. 이를 보다 상세히 설명한다.Thereafter, the
한글은 초성, 중성으로 이루어지거나 초성, 중성, 종성으로 이루어지므로 반드시 중성을 포함하는데, 이때 중성의 시작과 끝의 위치는 문자내에서 고정적인 위치를 갖는다. 이를 감안하여 도 6c에 보인 바와 같이 한 문자의 영역을 x축 방향과 y축 방향으로 각각 3등분하여 x축방향으로는 왼쪽, 중앙, 오른쪽으로 구분하고, y축으로는 위, 중앙, 아래로 구분하여 전체 영역을 9등분으로 구분한다. 또 각 중성은 시작과 끝부분의 세그먼트는 일관성있는 필기 방향을 갖는다. 이에따라 본 발명에서는 필기 방향이 오른쪽이면 ″H″로, 아래쪽이면 ″V″로 구분한다. 또한 각각의 위치에 따라 하기 표 1에 보인 바와 같이 ″H1″,″H2″와 ″V1″,″V2″로 구분한다. 이처럼 각각의 중성을 시작점의 위치와 시작세그먼트의 방향과 끝점의 위치와 세그먼트의 방향을 기준으로 하기 표 1에 보인 바와 같이 9가지의 중성 타입으로 구분한다.Hangul is composed of initial, neutral, or first, neutral, and final, so it must include neutral, where the beginning and end of neutral has a fixed position within the character. In consideration of this, as shown in FIG. 6C, an area of a character is divided into three portions in the x-axis direction and the y-axis direction, respectively, and divided into left, center, and right in the x-axis direction, and up, center, and down in the y-axis. The whole area is divided into 9 equal parts. In addition, each neutral segment has a consistent writing direction at the beginning and end segments. Accordingly, in the present invention, the writing direction is divided into ″ H ″ and the lower side, ″ V ″. In addition, according to each position, as shown in Table 1, it is divided into ″ H1 ″, ″ H2 ″ and ″ V1 ″, ″ V2 ″. Thus, each neutral is divided into nine neutral types as shown in Table 1 on the basis of the position of the start point, the direction of the start segment, the position of the end point, and the direction of the segment.
상기 표 1에서 시작부분은 시작점의 위치와 시작 세그먼트의 방향을 나타낸다. 예를 들어 ″오른쪽 위, 아래로″에서 ″오른쪽 위″는 시작점의 위치가 도 6c에 보인 9개의 영역들중에 ″오른쪽 위″임을 나타내고, ″아래로″는 그로부터 시작되는 시작 세그먼트의 방향을 나타낸다. 그리고 시작부분에서 ″오른쪽 위, 아래로″인 경우는 ″V1″로 구분하며, 끝부분에서 ″오른쪽 아래, 아래로″인 경우에도 ″V1″으로 구분한다. 나머지 경우도 이와 마찬가지이다. 마찬가지로 끝부분은 끝점의 위치와 끝 세그먼트의 방향을 나타낸다.In Table 1, the starting part indicates the position of the starting point and the direction of the starting segment. For example, ″ upper right, down ″ to ″ upper right ″ indicate that the position of the starting point is ″ upper right ″ among the nine areas shown in FIG. 6c, and ″ down ″ indicates the direction of the starting segment starting therefrom. . In case of ″ upper right and down ″ at the beginning, it is classified as ″ V1 ″, and in case of ″ lower right and down ″ at the end, it is classified as ″ V1 ″. The same holds true for the remaining cases. Similarly, the end points indicate the position of the end point and the direction of the end segment.
그러므로 상기 표 1에서 빈칸을 제외하고 실제 분류되는 중성의 자소를 가지는 중성 타입들은 ″V1V1″, ″V1H1″, ″V2V1″, ″V2H1″, ″V2H2″, ″H1V1″, ″H2V1″, ″H2V2″, ″H2H2″의 9가지가 된다. 여기서 ″V1V1″으로 나타낸 형태를 예를 들어 살펴보면, 앞의 ″V1″은 시작부분에 해당되고 뒤의 ″H1″은 끝부분에 해당된다.Therefore, the neutral types having neutral phonemes that are actually classified except the blank in Table 1 are ″ V1V1 ″, ″ V1H1 ″, ″ V2V1 ″, ″ V2H1 ″, ″ V2H2 ″, ″ H1V1 ″, ″ H2V1 ″, and ″ H2V2. 9 kinds of ″, ″ H2H2 ″. Here, for example, the form ″ V1V1 ″ refers to the first ″ V1 ″ at the beginning and the second ″ H1 ″ to the end.
상기 표 1을 참조하면, ″V1V1″은 시작점의 위치가 ″오른쪽 위″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로, ″ㅣ,ㅐ,ㅒ″가 해당된다. ″V1H1″은 시작점의 위치가 ″오른쪽 위″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 중앙″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입으로, ″ㅏ,ㅑ″가 해당된다. ″V2V1″은 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로 ″ㅚ,ㅙ″가 해당된다. ″V2H1″은 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 중앙″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입으로, ″ㅘ″가 해당된다. ″V2H2″는 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 모든 영역″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입으로, ″ㅗ,ㅛ″가 해당된다. ″H1V1″은 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로, ″ㅓ,ㅕ,ㅔ,ㅖ″가 해당된다. ″H2V1″은 시작점의 위치가 ″왼쪽″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로, ″ㅢ,ㅞ,ㅟ,ㅝ″가 해당된다. ″H2V2″는 시작점의 위치가 ″왼쪽″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″중앙 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로, ″ㅜ,ㅠ″가 해당된다. ″H2H2″는 시작점의 위치가 ″왼쪽″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″오른쪽 모든 영역″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입으로, ″ㅡ″가 해당된다.Referring to Table 1 above, ″ V1V1 ″ has the start point position ″ upper right ″, the start segment direction ″ down ″, the end point position ″ lower right ″ and the end segment direction ″ down ″ The type corresponds to ″ ㅣ, ㅐ, ㅒ ″. ″ V1H1 ″ is the type where the starting point is ″ upper right ″, the starting segment is ″ down ″, the ending point is ″ right center ″, and the ending segment is ″ right ″. ″ Is applicable. ″ V2V1 ″ is a type where the start point is ″ center ″, the start segment is ″ down ″, the end point is ″ lower right ″, and the end segment is ″ down ″. Yes. ″ V2H1 ″ is the type where the start point is ″ center ″, the start segment is ″ down ″, the end point is ″ right center ″, and the end segment is ″ right ″. do. ″ V2H2 ″ is the type where the start point is ″ center ″, the start segment is ″ down ″, the end point is ″ all right area ″, and the end segment is ″ right ″. ″ Is applicable. ″ H1V1 ″ is the type where the start point is ″ center ″, the start segment is ″ right ″, the end point is ″ bottom right ″, and the end segment is ″ down ″. ㅔ, ㅖ ″ is applicable. ″ H2V1 ″ is the type where the start point is ″ left ″, the start segment is ″ right ″, the end point is ″ bottom right ″, and the end segment is ″ down ″. ㅟ, ㅝ ″ is applicable. ″ H2V2 ″ is the type where the start point is ″ left ″, the start segment is ″ right ″, the end point is ″ down the center ″, and the end segment is ″ down ″. Is applicable. ″ H2H2 ″ is the type where the starting point is ″ left ″, the starting segment is ″ right ″, the ending point is ″ all right area ″, and the ending segment is ″ right ″, where ″ ㅡ ″ is Yes.
한글의 중성은 상기 표 1에 보인 ″H″,″V″의 조합만으로 각각의 특징을 나타낼 수 있다. 즉, 초성, 종성과 달리 중성은 그 변형의 정도가 약하고 획의 진행방향에 일관성을 가진다. 그러므로 각각의 중성을 하기 표 2와 같은 ″H″,″V″의 조합으로 나타낼 수 있다. 하기 표 2에서 ″S″는 임의의 세그먼트를 나타낸다.The neutrality of Hangul can represent each characteristic only by the combination of ″ H ″, ″ V ″ shown in Table 1 above. In other words, unlike initial and final, neutrality is weak in the degree of deformation and consistent in the direction of stroke. Therefore, each neutral may be represented by a combination of ″ H ″ and ″ V ″ as shown in Table 2 below. In Table 2 below, ″ S ″ represents any segment.
각 중성을 시작과 끝의 위치와 시작 세그먼트, 끝 세그먼트로 전체 영역을 결정한 후, 영역내에서 상기 표 2와 같이 명시된 세그먼트의 조합을 찾으므로써 해당하는 중성의 영역을 문자내에서 찾을 수 있다. 이와 같이 문자내에서 중성의 영역이 결정되면 중성을 기준으로 이전 영역은 초성이 되고, 이후 영역은 종성이 되므로 자소의 세그먼테이션(segmentation)이 자동적으로 이루어지게 된다. 이와 같이 자소간의 영역이 구분되면 각각의 자소를 인식한 후, 그 조합을 이용하여 인식 문자의 코드를 얻을 수 있다.After determining the total area by starting and ending positions, starting segments, and ending segments of each neutral, a corresponding neutral region can be found in a character by finding a combination of the specified segments as shown in Table 2 above. In this way, when the neutral region is determined in the character, the previous region becomes the initial, and the subsequent region becomes the final based on the neutral, so that the segmentation of the phoneme is automatically performed. When the regions between the phonemes are divided as described above, after each phoneme is recognized, a code of the recognized character can be obtained using the combination.
도 5는 상기한 (206)단계에서 수행되는 중성 타입별 후보영역 결정과정의 일예를 보인 처리 흐름도로서, 예를 들어 중성이 상기 표 1에 보인 중성 타입들중에 ″V2H1″에 포함되는 ″ㅘ″인 경우를 (500)∼(522)단계로 보인 것이다. 이때 ″ㅘ″는 상기 표 2에 보인 바와 같이 ″V2V*H+V+H*H1″의 세그먼트 조합을 가진다. 먼저 마이크로 프로세서(100)는 (500)단계에서 V,H 집합을 입력하여 (502)단계에서 중성 타입별 중간 구간을 선택한다. 다음에 (504)단계에서 세그먼트를 추적하면서 중성 타입별로 정의된 시작 세그먼트를 찾는다. 이때 현재 처리하는 중성타입이 ″V2H1″인 경우이므로 세그먼트의 시작점이 ″V2″인가를 확인한다. 만일 세그먼트의 시작점이 ″V2″가 아니라면, ″V2H1″ 후보영역 결정과정을 종료한다.FIG. 5 is a flowchart showing an example of determining a candidate region for each neutral type performed in step 206. For example, ″ ㅘ ″ in which neutrality is included in ″ V2H1 ″ among the neutral types shown in Table 1 above. In the case of (500) to (522) is shown. ″ ㅘ ″ has a segment combination of ″ V2V * H + V + H * H1 ″ as shown in Table 2 above. First, the
상기 (504)단계에서 중성 타입별로 정의된 시작 세그먼트, 즉 ″V2″를 발견하면, (506)∼(518)단계에서 해당 타입의 중성을 이루기 위한 V,H 세그먼트로 이루어지는 정의된 조합을 찾는다. 이때 상기 (506)단계에서는 다음 세그먼트가 ″V″가 아닐때까지 진행하고, ″Va″가 끝나면 다음에 오는 ″Ha″를 찾는다. 이때 ″Va″는 연속된 ″V″ 집합의 마지막 ″V″를 의미하고, ″Ha″는 연속된 ″H″ 집합의 첫 번째 ″H″를 의미한다. 다음에 (508)단계에서는 ″Va″의 끝점과 ″Ha″의 시작점의 위치 관계가 상기 세그먼트 조합 ″V2V*H+V+H*H1″의 조건에 만족하는가를 확인한다. 만일 조건을 만족하지 않으면, ″V2H1″ 후보영역 결정과정을 종료한다.If a start segment defined for each neutral type, that is, ″ V2 ″ is found in
상기 (508)단계에서 조건을 만족하면 (510)단계에서 다음 세그먼트가 ″H″가 아닐때까지 진행하고, ″Hb″가 끝나면 다음에 오는 ″Vb″를 찾는다. 이때 ″Vb″는 두 번째 연속된 ″V″ 집합의 첫 번째 ″V″를 의미하고, ″Hb″는 첫 번째 연속된 ″H″ 집합의 마지막 ″H″를 의미한다. 다음에 (512)단계에서는 ″Hb″의 끝점과 ″Vb″의 시작점의 위치 관계가 상기 세그먼트 조합 ″V2V*H+V+H*H1″의 조건에 만족하는가를 확인한다. 만일 조건을 만족하지 않으면, ″V2H1″ 후보영역 결정과정을 종료한다.If the condition is satisfied in
상기 (512)단계에서 조건을 만족하면 (514)단계에서 다음 세그먼트가 ″V″가 아닐때까지 진행하고, ″Vc″가 끝나면 다음에 오는 ″Hc″를 찾는다. 이때 ″Vc″는 두 번째 연속된 ″V″ 집합의 마지막 ″V″를 의미하고, ″Hc″는 두 번째 연속된 ″H″ 집합의 첫 번째 ″H″를 의미한다. 다음에 (516)단계에서는 ″Hc″의 끝점과 ″Vc″의 시작점의 위치 관계가 상기 세그먼트 조합 ″V2V*H+V+H*H1″의 조건에 만족하는가를 확인한다. 만일 조건을 만족하지 않으면, ″V2H1″ 후보영역 결정과정을 종료한다.If the condition is satisfied in
상기 (516)단계에서 조건을 만족하면 (518)단계에서 다음 세그먼트가 ″H″가 아닐때까지 진행한후, (520)단계에서 마지막 ″H″가 ″H1″인지를 확인한다. 즉, 정의된 조합의 세그먼트가 발견되면 끝 세그먼트를 확인한다. 이때 끝 세그먼트가 해당 타입인 ″H1″이면, (522)단계에서 시작 세그먼트부터 끝 세그먼트까지의 영역을 해당 타입인 ″V2H1″의 중성 후보영역으로 결정하여 등록한다. 예를들어 상기한 도 6a 내지 도 6c와 같이 ″국″자인 경우 도 6d와 같이 중성 ″ㅜ″ 영역이 결정된다. 도 6d에서 ″。″로 표시한 점들 간의 세그먼트들이 중성영역이다.If the condition is satisfied in
상기한 바와 같이 중성 타입별 후보영역 결정과정을 각각의 중성 타입마다 대응되게 처리하여 각 중성 타입별 후보영역을 결정한다. 즉, 상기한 표 1의 보인 9가지 중성 타입 각각에 대해 도 5에 보인 바와 같은 처리를 해당 중성 타입의 세그먼트 조합에 대응되게 수행한다.As described above, the process of determining the candidate region for each neutral type is processed corresponding to each neutral type to determine the candidate region for each neutral type. That is, for each of the nine neutral types shown in Table 1, the processing as shown in FIG. 5 is performed corresponding to the segment combination of the corresponding neutral type.
상기한 바와 같이 각 타입별로 중성영역을 구한 후, 마이크로 프로세서(100)는 구해진 중성영역에 대해 (208)단계에서 중성 인식을 시도하는데, 이는 통상적인 자소 인식과정과 동일하다. 자소 인식은 일래스틱(elastic) 매칭을 이용하여 미리 등록된 자소 모델과의 비교를 통해 입력 자소와 가장 가까운 자소 모델을 후보로 선택한다. 이때 후보 모델중 정의된 자소 타입인 모델만을 후보로 선택하는데, 예를들어 인식 점수 순서로 최대 30개의 후보 영역을 선택한다.As described above, after obtaining the neutral region for each type, the
다음에 마이크로 프로세서(100)는 (210)단계에서 상기와 같이 인식된 중성의 영역을 기준으로 초성과 종성의 영역에 대해 각각 초성과 종성을 인식한다. 이때 초성,종성 인식 역시 통상적인 자소 인식과 동일하다. 그리고 예를 들어 각각 최대 3개씩의 후보를 갖는다.Next, the
상기와 같은 과정에 의해 초성,중성,종성이 모두 인식되면, (212)단계에서 초성,중성,종성의 조합에 의해 한글 문자를 인식한다. 이때 문자 인식 역시 통상적인 문자 인식과 동일하다. 즉, 자소 인식이 끝나면 조합 후 완성형의 코드가 생성되는 조합의 경우 각각의 자소에 대한 크기 페널티를 가한 후, 문자에 대한 인식 점수를 산출한다. 최종적으로 최고 인식 점수를 갖는 자소 조합으로 생성된 문자코드를 인식결과로 출력하여 출력장치(106)를 통해 알린다.When all of the initial, neutral, and final characters are recognized by the above process, the Hangul character is recognized by the combination of the initial, neutral, and final characters in
상술한 본 발명은 온라인 한글 필기체 문자 인식중에서도 연결형의 경우 특히 높은 인식률을 보인다. 이러한 본 발명을 연결형 한글을 인식하기 위해 초성, 중성, 종성과 연결된 형태의 자소를 등록하여 인식하는 기존의 방법과 비교하여 인식 시험을 하였다. 그 결과 에러률이 50%이상 감소되었고, 90MHz 펜티엄(Pentium) PC에서 초당 2000자를 인식하여 빠른 인식결과를 얻을 수 있었다.The present invention described above shows a particularly high recognition rate in the case of the connected type even during online Hangul handwritten character recognition. In order to recognize the present invention, the recognition test was performed in comparison with the existing method of registering and recognizing the phoneme connected with the initial, neutral, and final forms. As a result, the error rate was reduced by more than 50% and fast recognition result was obtained by recognizing 2000 characters per second on a 90MHz Pentium PC.
따라서 한글 문자내에서 중성의 시작점과 끝점의 위치를 미리 정한 후, 그 영역을 중심으로 중성의 경계를 추출하며, 추출된 중성영역을 중심으로 초성과 종성의 영역이 자동으로 결정되면 각각의 영역에 대해 자소 인식을 함으로써 적은 메모리를 사용하면서도 빠르게 연결형 온라인 필기체 한글 문자 인식을 할 수 있다.Therefore, after determining the start and end positions of the neutral in the Hangul characters in advance, the neutral boundary is extracted around the region, and if the regions of the initial and final species are automatically determined based on the extracted neutral region, By using the phoneme recognition, it is possible to use fast on-line handwritten Hangul character recognition while using less memory.
한편 상술한 본 발명의 설명에서는 구체적인 실시예에 관해 설명하였으나, 여러가지 변형이 본 발명의 범위에서 벗어나지 않고 실시할 수 있다. 특히 본 발명의 실시예에서는 문자영역을 9등분하는 예를 들었으나, 필요에 따라 달리 분할하여 이용할 수도 있다. 또한 전처리과정에서의 정규화 크기나 재샘플링 간격도 얼마든지 다르게 할 수 있을 것이다. 따라서 발명의 범위는 설명된 실시예에 의하여 정할 것이 아니고 특허청구범위와 특허청구범위의 균등한 것에 의해 정하여져야 한다.Meanwhile, in the above description of the present invention, specific embodiments have been described, but various modifications can be made without departing from the scope of the present invention. Particularly, in the embodiment of the present invention, an example of dividing the character area into nine is given, but may be divided and used as necessary. In addition, the normalization size and resampling interval in the preprocessing may vary. Therefore, the scope of the invention should not be defined by the described embodiments, but should be defined by the equivalent of claims and claims.
상술한 바와 같이 본 발명은 메모리를 적게 사용하면서도 연결형 온라인 한글 필기체 문자를 빠른 시간내 인식할 수 있어 PDA나 HPC와 같은 개인 정보단말장치에서 효율적으로 이용될 수 있는 잇점이 있다.As described above, the present invention can recognize the connected online Hangul handwritten characters in a short time while using less memory, and thus can be efficiently used in personal information terminal devices such as PDAs and HPCs.
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970076001A KR100290606B1 (en) | 1997-12-29 | 1997-12-29 | Method for recognizing cursive of hangul in online system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970076001A KR100290606B1 (en) | 1997-12-29 | 1997-12-29 | Method for recognizing cursive of hangul in online system |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19990056025A KR19990056025A (en) | 1999-07-15 |
KR100290606B1 true KR100290606B1 (en) | 2001-06-01 |
Family
ID=37525798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970076001A KR100290606B1 (en) | 1997-12-29 | 1997-12-29 | Method for recognizing cursive of hangul in online system |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100290606B1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030090381A (en) * | 2002-05-23 | 2003-11-28 | 퍼셉컴(주) | Letters recognition method and letters recognition apparatus |
KR101389866B1 (en) * | 2012-08-20 | 2014-04-29 | 주식회사 펀진 | Handwriting characters input device and method using the touch pad |
-
1997
- 1997-12-29 KR KR1019970076001A patent/KR100290606B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR19990056025A (en) | 1999-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7437001B2 (en) | Method and device for recognition of a handwritten pattern | |
JP4274941B2 (en) | Method and apparatus for decoding handwritten characters | |
EP1564675B1 (en) | Apparatus and method for searching for digital ink query | |
El Abed et al. | Comparison of different preprocessing and feature extraction methods for offline recognition of handwritten arabicwords | |
WO2006091156A1 (en) | Recognition graph | |
WO1995008158A1 (en) | Universal symbolic handwriting recognition system | |
Bhattacharya et al. | An end-to-end system for Bangla online handwriting recognition | |
JPH02266485A (en) | Information recognizing device | |
Manke et al. | A connectionist recognizer for on-line cursive handwriting recognition | |
US6035062A (en) | Character recognition method and apparatus | |
JP2015099566A (en) | Feature calculation device, method and program | |
KR100290606B1 (en) | Method for recognizing cursive of hangul in online system | |
CN107912062B (en) | System and method for overlaying handwriting | |
JP2002175498A (en) | Character recognizing method and its device and character recognizing program and computer readable recording medium with the program recorded | |
JPH11184971A (en) | Device and method for character input with handwritten character recognition function | |
JP4128325B2 (en) | Character recognition device and character recognition method | |
KR940007345B1 (en) | On-line recognitin method of hand-written korean character | |
JP2671985B2 (en) | Information recognition method | |
Liang et al. | Character-position-free on-line handwritten Japanese text recognition | |
KR100297815B1 (en) | System for recognizing korean written characters | |
JP3128357B2 (en) | Character recognition processor | |
JPH096920A (en) | Method and device for handwritten character recognition | |
JP3075808B2 (en) | Document processing device | |
WO2024110354A1 (en) | Setting font size in an unconstrained canvas | |
KR940001048B1 (en) | On-line hand written character recognition method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20080228 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |