KR100290606B1 - Method for recognizing cursive of hangul in online system - Google Patents

Method for recognizing cursive of hangul in online system Download PDF

Info

Publication number
KR100290606B1
KR100290606B1 KR1019970076001A KR19970076001A KR100290606B1 KR 100290606 B1 KR100290606 B1 KR 100290606B1 KR 1019970076001 A KR1019970076001 A KR 1019970076001A KR 19970076001 A KR19970076001 A KR 19970076001A KR 100290606 B1 KR100290606 B1 KR 100290606B1
Authority
KR
South Korea
Prior art keywords
segment
neutral
type
change
determining
Prior art date
Application number
KR1019970076001A
Other languages
Korean (ko)
Other versions
KR19990056025A (en
Inventor
김경희
Original Assignee
윤종용
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자주식회사 filed Critical 윤종용
Priority to KR1019970076001A priority Critical patent/KR100290606B1/en
Publication of KR19990056025A publication Critical patent/KR19990056025A/en
Application granted granted Critical
Publication of KR100290606B1 publication Critical patent/KR100290606B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE: An online Hangul cursive recognition method is provided to designate a start and final point of a vowel in a Hangul character in advance, to extract a boundary of the vowel from the designated area, and to automatically determine an area of an initial consonant and a final consonant based on the extracted area so that it can enhance a recognition speed and efficiency in a PDA or a Hand Held PC. CONSTITUTION: The method comprises steps of a microprocessor inputting 2 dimensional coordinate points along a written trajectory of a Hangul character input via an input device(200), the microprocessor preprocessing the input Hangul character(202), the microprocessor determining a vertical or horizontal segment by tracking preprocessed segment sets in written order, and classifying segments satisfying a condition into a vertical or horizontal segment(204), the microprocessor determining candidate vowel areas from the vertical or horizontal segments according to the vowel type defined in advance(206), the microprocessor recognizing the vowel from the candidate vowel areas by using an elastic matching method(208), the microprocessor recognizing an initial and a final consonant on a basis of the recognized vowel area(210), and the microprocessor recognizing a character by combining the initial consonant, the vowel and the final consonant(212).

Description

온라인 한글 필기체 문자 인식방법Online Hangul Handwritten Character Recognition Method

본 발명은 필기체 문자를 인식하는 방법에 관한 것으로, 특히 온라인(on-line) 한글 필기체 문자를 인식하는 방법에 관한 것이다.The present invention relates to a method for recognizing handwritten characters, and more particularly, to a method for recognizing on-line Hangul handwritten characters.

최근, PDA(Personal Digital Assistant 또는 Personal Digital Accessory), HPC(Hand-held Personal Computer)등과 같은 개인 정보단말장치의 이용이 급증하고 있다. 이들 개인 정보단말장치는 기존의 데스크 탑(desktop) PC(Personal Computer), 랩탑(laptop) PC 등에 비해 크기가 아주 작다. 이에따라 작은 크기의 PC에 적합한 입력 방법인 필기를 통한 입력방법이 중요하게 대두되고 있다.In recent years, the use of personal information terminal devices such as PDA (Personal Digital Assistant or Personal Digital Accessory), HPC (Hand-held Personal Computer), and the like are increasing rapidly. These personal digital assistants are very small compared to existing desktop PCs and laptop PCs. Accordingly, an input method through handwriting, which is an input method suitable for a small PC, has emerged as an important method.

이와 같이 필기를 통한 입력방법에 있어서 보다 자유로운 필기 입력을 가능하게 하기 위해서 연결형 온라인 한글 필기체 문자인식에 대한 많은 방법들이 연구되고 있다. 그러나 연결형 한글 인식은 분리형 한글 인식에 비해 많은 메모리 영역과 인식 시간이 요구된다.As described above, in order to enable free handwriting input in the input method through handwriting, many methods for connected online Hangul handwritten character recognition have been studied. However, connected Hangul recognition requires more memory area and recognition time than separate Hangul recognition.

상기한 바와 같이 온라인 한글 필기체 문자인식에 있어서 연결형은 분리형에 비해 많은 메모리 영역이 필요하며 인식 시간이 많이 소요됨에 따라 적용하기 곤란한 문제점이 있었다.As described above, in the on-line Korean handwritten character recognition, the connection type requires more memory area than the separate type and has a problem that it is difficult to apply as the recognition time is required.

따라서 본 발명의 목적은 적은 메모리를 사용함과 아울러 빠른 시간내 연결형 온라인 한글 필기체 문자를 인식할 수 있는 방법을 제공함에 있다.Accordingly, an object of the present invention is to provide a method for recognizing on-line Hangul handwritten characters connected in a short time while using less memory.

도 1은 본 발명의 실시예에 따라 한글 필기체 문자를 인식하기 위한 장치의 블록구성도,1 is a block diagram of an apparatus for recognizing a Korean handwritten character according to an embodiment of the present invention;

도 2는 본 발명의 실시예에 따른 한글 필기체 문자 인식 처리 흐름도,2 is a flowchart illustrating a Hangul handwritten character recognition process according to an embodiment of the present invention;

도 3은 도 2의 전처리과정의 처리 흐름도,3 is a processing flowchart of the preprocessing process of FIG. 2;

도 4는 도 2의 수직,수평 세그먼트 결정과정의 처리 흐름도,4 is a flowchart illustrating a process of determining vertical and horizontal segments in FIG.

도 5는 도 2의 중성 타입별 후보영역 결정과정의 일예를 보인 처리 흐름도,5 is a flowchart illustrating an example of determining a candidate region for each neutral type of FIG. 2;

도 6a 내지 도 6d는 본 발명의 실시예에 따라 한글 문자 ″국″을 입력하여 진행되는 과정에 따른 형태를 도시한 것으로, 도 6a는 입력 형태를 보인 것이고, 도 6b는 전처리 형태를 보인 것이며, 도 6c는 영역 구분과 수평,수직 세그먼트를 결정한 형태를 보인 것이며, 도 6d는 중성 ″ㅜ″ 영역을 결정한 형태를 보인 것이다.6A to 6D illustrate a form according to a process of inputting a Hangul character ″ station ″ according to an embodiment of the present invention. FIG. 6A illustrates an input form, and FIG. 6B illustrates a preprocessing form. FIG. 6C illustrates a form in which regions are divided and horizontal and vertical segments are determined, and FIG. 6D illustrates a form in which neutral ″ TT ″ regions are determined.

상술한 목적을 달성하기 위한 본 발명은 한글 문자를 필기된 궤적에 따라 입력하고 전처리하여 세그먼트(segment) 집합을 출력하는 과정과, 전처리된 세그먼트 집합을 필기 순서대로 추적하면서 세그먼트들로부터 수직 세그먼트 집합과 수평 세그먼트 집합을 구하여 결정하는 과정과, 한글 문자가 가지는 각 중성의 특징을 이용하여 시작점 및 끝점의 위치 및 끝 세그먼트의 방향을 기준으로 구분한 각 중성 타입별 후보영역으로 결정하는 과정과, 중성 타입별 후보영역 각각에 대해 중성을 인식하는 과정과, 인식된 중성의 영역을 기준으로 초성과 종성의 영역에 대해 각각 초성과 종성을 인식하는 과정과, 인식된 초성,중성,종성의 조합에 의해 한글 문자를 인식하는 과정을 구비함을 특징으로 한다.The present invention for achieving the above object is a process of inputting and preprocessing the Hangul characters according to the written trajectory and outputting a segment set, and tracking the preprocessed segment set in writing order, while vertically vertical segment set and horizontal The process of determining and determining the segment set, and the process of determining the candidate area for each neutral type based on the position of the start point and the end point and the direction of the end segment by using the characteristics of each neutral of the Hangul characters, and for each neutral type. Hangul characters by the process of recognizing neutrality for each candidate area, recognizing initial and finality for the initial and final areas based on the recognized neutral area, and combining recognized initial, neutral, and finality Characterized in that it comprises a process of recognizing.

이하 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명 및 첨부 도면에서 구체적인 문자 인식을 위한 처리과정의 예시나 처리 흐름과 같은 많은 특정 상세들이 본 발명의 보다 전반적인 이해를 제공하기 위해 나타나 있다. 이들 특정 상세들없이 본 발명이 실시될 수 있다는 것은 이 기술분야에서 통상의 지식을 가진 자에게 자명할 것이다. 그리고 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description and the annexed drawings, numerous specific details are set forth in order to provide a more thorough understanding of the present invention, such as examples of processing for specific character recognition or processing flow. It will be apparent to those skilled in the art that the present invention may be practiced without these specific details. And a detailed description of known functions and configurations that may unnecessarily obscure the subject matter of the present invention will be omitted.

우선 본 발명은 전술한 바와 같이 연결형 온라인 한글 필기체 문자인식에 있어서 나타나는 문제점을 해결하기 위해 한글의 특성을 이용하여 문자내에서 중성영역을 분리하여 인식함으로써 적은 메모리 사용으로 빠른 시간내에 온라인 연결형 한글 필기체 문자 인식이 가능한 방법을 제시한다. 한글은 초성, 중성으로 이루어진 문자와 초성, 중성, 종성으로 이루어진 문자로 구성된다. 그러므로 문자내에서 중성영역이 제대로 구분되어진다면, 각각의 자소 인식과 조합만으로 문자 인식이 가능해질 수 있다. 특히 중성은 그 형태가 초성, 종성과 달리 필기의 진행 방향이나 문자내에서의 위치가 고정적이므로 이러한 정보를 이용해서 효율적인 중성 분리가 가능하다. 이러한 점에 착안하여 본 발명은 각각의 중성을 그 시작위치와 끝위치를 중심으로 경계를 구분짓고, 그 중성을 이루기 위한 세그먼트(segment) 조합을 그 경계내에서 찾는다. 이에따라 간단하지만 효율적인 중성영역 구분이 가능하게 된다. 이와 같이 구분된 중성영역을 이용하여 자소를 인식하는데, 먼저 중성영역에 대해 중성을 인식한후, 인식된 중성을 기준으로 초성과 종성을 인식한다. 이와 같이 중성 분리를 이용하여 연결형 온라인 한글 필기체 문자 인식을 함으로써 종래에 비해 메모리를 적게 사용하게 될 뿐만아니라 인식에 소요되는 시간을 단축시킬 수 있게 된다.First, in order to solve the problem in the connected type of Korean Hangul handwriting character recognition as described above, the present invention uses the characteristics of the Hangul to recognize the neutral region in the character by separating the online connected Hangul handwriting characters in a short time using less memory. It suggests ways to be recognized. Hangeul is composed of letters consisting of initial and neutral characters, and letters consisting of initial and neutral characters. Therefore, if the neutral region is properly distinguished in the character, the character recognition may be possible only by the respective phoneme recognition and combination. In particular, since neutrality is fixed in the direction of handwriting or the position in the letter, unlike the initiality and the finality, the neutrality can be efficiently separated using this information. With this in mind, the present invention divides each neutral boundary around its start and end positions, and finds a segment combination within the boundary to achieve the neutrality. Accordingly, it is possible to distinguish a simple but efficient neutral region. The phoneme is recognized using the divided neutral regions. First, neutrality is recognized for the neutral region, and then initiality and species are recognized based on the recognized neutrality. In this way, by using the connected on-line Hangul handwritten character recognition using the neutral separation, as well as using less memory than the conventional it is possible to shorten the time required for recognition.

도 1은 본 발명의 실시예에 따라 연결형 온라인 한글 필기체 문자를 인식하기 위한 장치의 블록구성도를 보인 것으로, 하드웨어(hardware)는 통상적인 문자 인식시스템과 마찬가지로 입력장치(100)와 마이크로 프로세서(microprocessor)(102)와 메모리(104)와 출력장치(106)를 구비한다. 입력장치(100)는 전자 펜(108)을 구비하며, 사용자가 전자 펜(108)을 이용하여 필기하는 궤적에 따른 점들에 대해 2차원 좌표계에 의한 x,y좌표점 열(stream)을 발생한다. 이러한 입력장치(100)로서는 통상적으로 타블렛(tablet)이나 TSP(Touch-sensitive Screen Panel) 등이 사용된다. 본 발명에 있어서 입력장치(100)를 통해 입력하는 문자는 연결형 온라인 한글 필기쳬 문자를 대상으로 한다. 마이크로 프로세서(102)는 입력장치(100)의 출력을 입력받아 후술하는 바와 같은 본 발명의 실시예에 따른 문자 인식 처리에 의해 연결형 온라인 한글 필기체 문자를 인식하고 인식 결과를 출력장치(106)로 출력한다. 메모리(104)는 롬(ROM: Read Only Memory)과 램(RAM: Random Access Memory)을 구비한다. 롬에는 본 발명의 실시예에 따른 마이크로 프로세서(102)의 문자 인식 처리 프로그램과 문자 인식 처리를 위한 각종 참조 데이터가 저장된다. 램에는 마이크로 프로세서(102)의 문자 인식 처리에 따른 데이터가 일시 저장된다. 출력장치(106)는 예를 들어 액정 디스플레이장치가 될 수 있으며, 마이크로 프로세서(102)에 의한 문자 인식결과를 사용자가 식별할 수 있도록 출력한다.1 is a block diagram of an apparatus for recognizing connected online Hangul handwritten characters according to an embodiment of the present invention. The hardware is an input device 100 and a microprocessor like a conventional character recognition system. 102, a memory 104 and an output device (106). The input device 100 includes an electronic pen 108, and generates a stream of x, y coordinate points by a two-dimensional coordinate system for points along a trajectory that a user writes using the electronic pen 108. . As such an input device 100, a tablet, a touch-sensitive screen panel (TSP), or the like is usually used. In the present invention, the characters input through the input device 100 are targeted for the connected online Hangul handwritten characters. The microprocessor 102 receives the output of the input device 100 and recognizes the connected online Hangul handwritten characters by the character recognition process according to an embodiment of the present invention as described below and outputs the recognition result to the output device 106. do. The memory 104 includes a read only memory (ROM) and a random access memory (RAM). The ROM stores a character recognition program of the microprocessor 102 and various reference data for character recognition processing according to an embodiment of the present invention. The RAM temporarily stores data according to the character recognition process of the microprocessor 102. The output device 106 may be, for example, a liquid crystal display device, and outputs a character recognition result by the microprocessor 102 so that a user can identify it.

도 2는 본 발명의 실시예에 따른 한글 필기체 문자 인식 처리 흐름도를 보인 것으로, 상기한 도 1의 마이크로 프로세서(102)에서 수행되는 처리과정을 (200)∼(212)단계로 보인 것이다. 먼저 사용자가 입력장치(100)의 전자 펜(108)를 사용하여 한글 문자를 필기하면, 마이크로 프로세서(102)는 (200)단계에서 입력장치(100)로부터 한글 문자를 필기된 궤적에 따라 입력한다. 이때 입력장치(100)는 사용자가 전자 펜(102)을 이용하여 필기하는 궤적에 따른 점들에 대해 2차원 좌표계에 의한 x,y좌표점 열을 발생하여 마이크로 프로세서(102)에 인가하며, 마이크로 프로세서(102)는 입력장치(100)의 출력을 샘플링(sampling)하여 입력한다. 이때 입력장치(100)에 필기되어 입력되는 문자의 예를 보이면, 도 6a와 같다. 상기 도 6a는 예를들어 ″국″자를 입력하는 경우의 입력 형태를 보인 것이다.2 is a flowchart illustrating a Hangul handwritten character recognition process according to an exemplary embodiment of the present invention. The process performed by the microprocessor 102 of FIG. 1 is shown in steps 200 through 212. First, when the user writes Hangul characters using the electronic pen 108 of the input device 100, the microprocessor 102 inputs the Hangul characters from the input device 100 according to the written trajectory in step 200. . At this time, the input device 100 generates a series of x, y coordinate points by a two-dimensional coordinate system and applies them to the microprocessor 102 for the points along the trajectory that the user writes using the electronic pen 102. Reference numeral 102 samples and outputs an output of the input apparatus 100. 6A illustrates an example of a character that is handwritten and input to the input apparatus 100. FIG. 6A shows an input form when, for example, a ″ national ″ character is input.

다음에 마이크로 프로세서(102)는 입력한 한글 문자를 (202)단계에서 전처리한다. 이러한 전처리과정은 기본적으로는 통상적인 문자 인식를 하기 전에 필수적으로 수행되는 전처리과정과 동일하다.Next, the microprocessor 102 preprocesses the input Hangul character in step 202. This preprocessing process is basically the same as the preprocessing process performed essentially before general character recognition.

도 3은 상기한 (202)단계에서 수행되는 전처리과정의 처리 흐름도를 (300)∼(302)단계로 보인 것이다. 먼저 마이크로 프로세서(102)는 (300)단계에서 입력 문자에 대해 가로 크기×세로 크기를, 예를들어 72×72로 정규화하고, (302)단계에서 두 점간의 거리가 일정한 간격 이상이 되게, 예를들어 9이상이 되도록 재샘플링(resampling)한다. 이때 두 점으로 이루어진 구간을 ″세그먼트″라 한다. 그러므로 이러한 전처리과정에 의해 도 6b에 보인 바와 같이 두점으로 이루어지는 세그먼트 집합이 얻어진다. 상기 도 6b에서 참조번호 600은 재샘플링된 점들중 하나를 나타내고, 602는 세그먼트들중 하나를 나타낸다.3 shows a process flow diagram of the preprocessing process performed in step 202 described above in steps 300 to 302. First, the microprocessor 102 normalizes the horizontal size × vertical size, for example, 72 × 72, with respect to the input character in step 300, and in step 302, the distance between the two points is greater than or equal to a predetermined interval. For example, resampling to 9 or more. A section consisting of two points is called a `` segment ''. Therefore, this preprocessing results in a segment set consisting of two points as shown in FIG. 6B. In FIG. 6B, reference numeral 600 denotes one of the resampled points, and 602 denotes one of the segments.

상기한 바와 같은 전처리과정을 상기 (202)단계에서 수행한후 마이크로 프로세서(100)는 (204)단계의 수직,수평 세그먼트 결정과정을 수행하는데, 전처리된 세그먼트 집합을 필기 순서대로 추적하면서 조건을 만족하는 세그먼트들을 각각 수직 세그먼트와 수평 세그먼트중에 한가지로 분류하여 결정한다. 즉, 후술하는 바와 같이 중성 영역 결정에 사용될 수직,수평 세그먼트를 결정한다.After performing the preprocessing process as described above in step 202, the microprocessor 100 performs the vertical and horizontal segment determination process in step 204. The condition is satisfied while tracking the preprocessed segment set in writing order. The segments are classified into one of the vertical segment and the horizontal segment, respectively. That is, as described later, vertical and horizontal segments to be used for determining neutral regions are determined.

도 4는 상기한 (204)단계에서 수행되는 수직,수평 세그먼트 결정과정의 처리 흐름도를 (400)∼(408)단계로 보인 것으로, 1개의 세그먼트에 대한 처리예로서 세그먼크들 각각에 대해 반복적으로 처리된다. 먼저 마이크로 프로세서(102)는 (400)단계에서 세그먼트를 입력하고, (402)∼(404)단계에서 세그먼트를 이루는 두 점간의 x좌표값 변화와 y좌표값 변화를 비교한다. 이때 x좌표값 변화가 y좌표값 변화보다 일정값 이상으로 크면, (408)단계에서 해당 세그먼트를 수평 세그먼트로 결정하여 등록한다. 이와 달리 y좌표값 변화가 x좌표값 변화보다 일정값 이상으로 크면, (406)단계에서 해당 세그먼트를 수직 세그먼트로 결정하여 등록한다. 만일 x좌표값 변화와 y좌표값 변화간에 상기 일정값 이상의 차이가 없으면, 해당 세그먼트를 무시하고 종료한다. 이때 일정값은 예를 들어 2로 설정한다. 이에따라 획의 진행방향이 ″아래로″ 진행되는 방향의 세그먼트는 수직 세그먼트로 결정되고, 획의 진행방향이 ″오른쪽으로″ 진행되는 방향의 세그먼트는 수평 세그먼트로 결정된다. 이러한 수직,수평 세그먼트 결정과정에 의해 도 6c와 같이 수직,수평 세그먼트 집합이 얻어진다. 도 6c에서 도면 부호 V를 기입한 세그먼트들은 수직 세그먼트를 나타내고, 도면 부호 H를 기입한 세그먼트들은 수평 세그먼트를 나타낸다. 그러므로 이하의 설명에서 편의상 수직 세그먼트는 ″V″로 칭하고, 수평 세그먼트는 ″H″로 칭한다.4 is a flowchart illustrating the vertical and horizontal segment determination process performed in step 204 as shown in steps 400 and 408, and is repeated for each segment as an example of processing for one segment. Is processed. First, the microprocessor 102 inputs a segment in operation 400 and compares a change in x-coordinate value and a change in y-coordinate value between two points constituting the segment in operation 402 to 404. At this time, if the change in the x-coordinate value is larger than the change in the y-coordinate value by a predetermined value or more, in step 408, the corresponding segment is determined and registered as the horizontal segment. On the contrary, if the change in the y-coordinate value is larger than the change in the x-coordinate value by more than a predetermined value, the corresponding segment is determined as a vertical segment and registered in step 406. If there is no difference more than the predetermined value between the change of the x coordinate value and the change of the y coordinate value, the segment is ignored and ends. At this time, the constant value is set to 2, for example. As a result, the segment in the direction in which the stroke travels ″ down ″ is determined as the vertical segment, and the segment in the direction in which the stroke travels ″ right ″ is determined as the horizontal segment. By the vertical and horizontal segment determination process, a vertical and horizontal segment set is obtained as shown in FIG. 6C. In FIG. 6C, segments denoted by V represent vertical segments and segments denoted by H denote horizontal segments. Therefore, in the following description, the vertical segment is referred to as ″ V ″ and the horizontal segment is referred to as ″ H ″ for convenience.

이후 마이크로 프로세서(100)는 (206)단계에서 미리 정의된 중성 타입별로 H,V 집합에 대한 중성영역을 찾아 각 중성 타입별 후보영역으로 결정한다. 상기 중성 타입은 한글 문자가 가지는 각 중성에 대해 한 문자의 영역을 2차원 좌표계의 x,y축방향으로 균등 분할한 단위영역들에 속하는 시작점 및 끝점의 위치와 시작 및 끝 세그먼트의 방향을 기준으로 구분한다. 이를 보다 상세히 설명한다.Thereafter, the microprocessor 100 finds a neutral region for the H and V sets for each neutral type defined in operation 206 and determines it as a candidate region for each neutral type. The neutral type is based on the position of the start point and the end point and the direction of the start and end segments belonging to the unit areas in which one character area is equally divided in the x and y axis directions of the two-dimensional coordinate system for each neutral character of the Hangul character. Separate. This will be described in more detail.

한글은 초성, 중성으로 이루어지거나 초성, 중성, 종성으로 이루어지므로 반드시 중성을 포함하는데, 이때 중성의 시작과 끝의 위치는 문자내에서 고정적인 위치를 갖는다. 이를 감안하여 도 6c에 보인 바와 같이 한 문자의 영역을 x축 방향과 y축 방향으로 각각 3등분하여 x축방향으로는 왼쪽, 중앙, 오른쪽으로 구분하고, y축으로는 위, 중앙, 아래로 구분하여 전체 영역을 9등분으로 구분한다. 또 각 중성은 시작과 끝부분의 세그먼트는 일관성있는 필기 방향을 갖는다. 이에따라 본 발명에서는 필기 방향이 오른쪽이면 ″H″로, 아래쪽이면 ″V″로 구분한다. 또한 각각의 위치에 따라 하기 표 1에 보인 바와 같이 ″H1″,″H2″와 ″V1″,″V2″로 구분한다. 이처럼 각각의 중성을 시작점의 위치와 시작세그먼트의 방향과 끝점의 위치와 세그먼트의 방향을 기준으로 하기 표 1에 보인 바와 같이 9가지의 중성 타입으로 구분한다.Hangul is composed of initial, neutral, or first, neutral, and final, so it must include neutral, where the beginning and end of neutral has a fixed position within the character. In consideration of this, as shown in FIG. 6C, an area of a character is divided into three portions in the x-axis direction and the y-axis direction, respectively, and divided into left, center, and right in the x-axis direction, and up, center, and down in the y-axis. The whole area is divided into 9 equal parts. In addition, each neutral segment has a consistent writing direction at the beginning and end segments. Accordingly, in the present invention, the writing direction is divided into ″ H ″ and the lower side, ″ V ″. In addition, according to each position, as shown in Table 1, it is divided into ″ H1 ″, ″ H2 ″ and ″ V1 ″, ″ V2 ″. Thus, each neutral is divided into nine neutral types as shown in Table 1 on the basis of the position of the start point, the direction of the start segment, the position of the end point, and the direction of the segment.

시작 부분Beginning 끝 부분End 오른쪽 아래,아래로(VI)Bottom right, down (VI) 중앙 아래,아래로(V2)Center down, down (V2) 오른쪽 중앙,오른쪽으로(H1)Right center, right (H1) 오른쪽 모든 영역,오른쪽으로 (H2)Right area, right (H2) 오른쪽 위,아래로(V1)Right upper and lower (V1) ㅣ,ㅐ,ㅒㅣ, ㅐ, ㅒ ㅏ,ㅑㅏ, ㅑ 중앙,아래로(V2)Center, Down (V2) ㅚ,ㅙㅚ, ㅙ ㅗ,ㅛㅗ, ㅛ 중앙,오른쪽으로(H1)Center, right (H1) ㅓ,ㅕ,ㅔ,ㅖㅓ, ㅕ, ㅔ, ㅖ 왼쪽,오른쪽으로(H2)Left, right (H2) ㅢ,ㅞ,ㅟ,ㅝㅢ, ㅞ, ㅟ, ㅝ ㅜ,ㅠㅜ, ㅠ

상기 표 1에서 시작부분은 시작점의 위치와 시작 세그먼트의 방향을 나타낸다. 예를 들어 ″오른쪽 위, 아래로″에서 ″오른쪽 위″는 시작점의 위치가 도 6c에 보인 9개의 영역들중에 ″오른쪽 위″임을 나타내고, ″아래로″는 그로부터 시작되는 시작 세그먼트의 방향을 나타낸다. 그리고 시작부분에서 ″오른쪽 위, 아래로″인 경우는 ″V1″로 구분하며, 끝부분에서 ″오른쪽 아래, 아래로″인 경우에도 ″V1″으로 구분한다. 나머지 경우도 이와 마찬가지이다. 마찬가지로 끝부분은 끝점의 위치와 끝 세그먼트의 방향을 나타낸다.In Table 1, the starting part indicates the position of the starting point and the direction of the starting segment. For example, ″ upper right, down ″ to ″ upper right ″ indicate that the position of the starting point is ″ upper right ″ among the nine areas shown in FIG. 6c, and ″ down ″ indicates the direction of the starting segment starting therefrom. . In case of ″ upper right and down ″ at the beginning, it is classified as ″ V1 ″, and in case of ″ lower right and down ″ at the end, it is classified as ″ V1 ″. The same holds true for the remaining cases. Similarly, the end points indicate the position of the end point and the direction of the end segment.

그러므로 상기 표 1에서 빈칸을 제외하고 실제 분류되는 중성의 자소를 가지는 중성 타입들은 ″V1V1″, ″V1H1″, ″V2V1″, ″V2H1″, ″V2H2″, ″H1V1″, ″H2V1″, ″H2V2″, ″H2H2″의 9가지가 된다. 여기서 ″V1V1″으로 나타낸 형태를 예를 들어 살펴보면, 앞의 ″V1″은 시작부분에 해당되고 뒤의 ″H1″은 끝부분에 해당된다.Therefore, the neutral types having neutral phonemes that are actually classified except the blank in Table 1 are ″ V1V1 ″, ″ V1H1 ″, ″ V2V1 ″, ″ V2H1 ″, ″ V2H2 ″, ″ H1V1 ″, ″ H2V1 ″, and ″ H2V2. 9 kinds of ″, ″ H2H2 ″. Here, for example, the form ″ V1V1 ″ refers to the first ″ V1 ″ at the beginning and the second ″ H1 ″ to the end.

상기 표 1을 참조하면, ″V1V1″은 시작점의 위치가 ″오른쪽 위″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로, ″ㅣ,ㅐ,ㅒ″가 해당된다. ″V1H1″은 시작점의 위치가 ″오른쪽 위″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 중앙″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입으로, ″ㅏ,ㅑ″가 해당된다. ″V2V1″은 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로 ″ㅚ,ㅙ″가 해당된다. ″V2H1″은 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 중앙″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입으로, ″ㅘ″가 해당된다. ″V2H2″는 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 모든 영역″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입으로, ″ㅗ,ㅛ″가 해당된다. ″H1V1″은 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로, ″ㅓ,ㅕ,ㅔ,ㅖ″가 해당된다. ″H2V1″은 시작점의 위치가 ″왼쪽″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로, ″ㅢ,ㅞ,ㅟ,ㅝ″가 해당된다. ″H2V2″는 시작점의 위치가 ″왼쪽″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″중앙 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입으로, ″ㅜ,ㅠ″가 해당된다. ″H2H2″는 시작점의 위치가 ″왼쪽″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″오른쪽 모든 영역″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입으로, ″ㅡ″가 해당된다.Referring to Table 1 above, ″ V1V1 ″ has the start point position ″ upper right ″, the start segment direction ″ down ″, the end point position ″ lower right ″ and the end segment direction ″ down ″ The type corresponds to ″ ㅣ, ㅐ, ㅒ ″. ″ V1H1 ″ is the type where the starting point is ″ upper right ″, the starting segment is ″ down ″, the ending point is ″ right center ″, and the ending segment is ″ right ″. ″ Is applicable. ″ V2V1 ″ is a type where the start point is ″ center ″, the start segment is ″ down ″, the end point is ″ lower right ″, and the end segment is ″ down ″. Yes. ″ V2H1 ″ is the type where the start point is ″ center ″, the start segment is ″ down ″, the end point is ″ right center ″, and the end segment is ″ right ″. do. ″ V2H2 ″ is the type where the start point is ″ center ″, the start segment is ″ down ″, the end point is ″ all right area ″, and the end segment is ″ right ″. ″ Is applicable. ″ H1V1 ″ is the type where the start point is ″ center ″, the start segment is ″ right ″, the end point is ″ bottom right ″, and the end segment is ″ down ″. ㅔ, ㅖ ″ is applicable. ″ H2V1 ″ is the type where the start point is ″ left ″, the start segment is ″ right ″, the end point is ″ bottom right ″, and the end segment is ″ down ″. ㅟ, ㅝ ″ is applicable. ″ H2V2 ″ is the type where the start point is ″ left ″, the start segment is ″ right ″, the end point is ″ down the center ″, and the end segment is ″ down ″. Is applicable. ″ H2H2 ″ is the type where the starting point is ″ left ″, the starting segment is ″ right ″, the ending point is ″ all right area ″, and the ending segment is ″ right ″, where ″ ㅡ ″ is Yes.

한글의 중성은 상기 표 1에 보인 ″H″,″V″의 조합만으로 각각의 특징을 나타낼 수 있다. 즉, 초성, 종성과 달리 중성은 그 변형의 정도가 약하고 획의 진행방향에 일관성을 가진다. 그러므로 각각의 중성을 하기 표 2와 같은 ″H″,″V″의 조합으로 나타낼 수 있다. 하기 표 2에서 ″S″는 임의의 세그먼트를 나타낸다.The neutrality of Hangul can represent each characteristic only by the combination of ″ H ″, ″ V ″ shown in Table 1 above. In other words, unlike initial and final, neutrality is weak in the degree of deformation and consistent in the direction of stroke. Therefore, each neutral may be represented by a combination of ″ H ″ and ″ V ″ as shown in Table 2 below. In Table 2 below, ″ S ″ represents any segment.

중성neutrality H,V 조합H, V combination V1V*V1V1V * V1 H2H*H2H2H * H2 ㅏ, ㅑㅏ, ㅑ V1V*H*H1V1V * H * H1 ㅗ, ㅛㅗ, ㅛ V2V*H*H2V2V * H * H2 ㅐ, ㅒㅐ, ㅒ V1V*H+V*V1V1V * H + V * V1 ㅓ, ㅕㅓ, ㅕ H1H*V*V1H1H * V * V1 ㅔ, ㅖㅔ, ㅖ H1H*V+V*V1H1H * V + V * V1 ㅜ, ㅠㅜ, ㅠ H2H*V*V2H2H * V * V2 V2V*H+V*V1V2V * H + V * V1 V2V*H+V+V*V1V2V * H + V + V * V1 V2V*H+V+H*H1V2V * H + V + H * H1 ㅢ,ㅟ,ㅝ,ㅞㅢ, ㅟ, ㅝ, ㅞ H2H*SV*V1H2H * SV * V1

각 중성을 시작과 끝의 위치와 시작 세그먼트, 끝 세그먼트로 전체 영역을 결정한 후, 영역내에서 상기 표 2와 같이 명시된 세그먼트의 조합을 찾으므로써 해당하는 중성의 영역을 문자내에서 찾을 수 있다. 이와 같이 문자내에서 중성의 영역이 결정되면 중성을 기준으로 이전 영역은 초성이 되고, 이후 영역은 종성이 되므로 자소의 세그먼테이션(segmentation)이 자동적으로 이루어지게 된다. 이와 같이 자소간의 영역이 구분되면 각각의 자소를 인식한 후, 그 조합을 이용하여 인식 문자의 코드를 얻을 수 있다.After determining the total area by starting and ending positions, starting segments, and ending segments of each neutral, a corresponding neutral region can be found in a character by finding a combination of the specified segments as shown in Table 2 above. In this way, when the neutral region is determined in the character, the previous region becomes the initial, and the subsequent region becomes the final based on the neutral, so that the segmentation of the phoneme is automatically performed. When the regions between the phonemes are divided as described above, after each phoneme is recognized, a code of the recognized character can be obtained using the combination.

도 5는 상기한 (206)단계에서 수행되는 중성 타입별 후보영역 결정과정의 일예를 보인 처리 흐름도로서, 예를 들어 중성이 상기 표 1에 보인 중성 타입들중에 ″V2H1″에 포함되는 ″ㅘ″인 경우를 (500)∼(522)단계로 보인 것이다. 이때 ″ㅘ″는 상기 표 2에 보인 바와 같이 ″V2V*H+V+H*H1″의 세그먼트 조합을 가진다. 먼저 마이크로 프로세서(100)는 (500)단계에서 V,H 집합을 입력하여 (502)단계에서 중성 타입별 중간 구간을 선택한다. 다음에 (504)단계에서 세그먼트를 추적하면서 중성 타입별로 정의된 시작 세그먼트를 찾는다. 이때 현재 처리하는 중성타입이 ″V2H1″인 경우이므로 세그먼트의 시작점이 ″V2″인가를 확인한다. 만일 세그먼트의 시작점이 ″V2″가 아니라면, ″V2H1″ 후보영역 결정과정을 종료한다.FIG. 5 is a flowchart showing an example of determining a candidate region for each neutral type performed in step 206. For example, ″ ㅘ ″ in which neutrality is included in ″ V2H1 ″ among the neutral types shown in Table 1 above. In the case of (500) to (522) is shown. ″ ㅘ ″ has a segment combination of ″ V2V * H + V + H * H1 ″ as shown in Table 2 above. First, the microprocessor 100 inputs a set of V and H in operation 500 to select an intermediate section for each neutral type in operation 502. Next, in step 504, the segment is tracked to find a start segment defined for each neutral type. At this time, since the neutral type currently being processed is ″ V2H1 ″, check whether the starting point of the segment is ″ V2 ″. If the start point of the segment is not ″ V2 ″, the process of determining the ″ V2H1 ″ candidate area is terminated.

상기 (504)단계에서 중성 타입별로 정의된 시작 세그먼트, 즉 ″V2″를 발견하면, (506)∼(518)단계에서 해당 타입의 중성을 이루기 위한 V,H 세그먼트로 이루어지는 정의된 조합을 찾는다. 이때 상기 (506)단계에서는 다음 세그먼트가 ″V″가 아닐때까지 진행하고, ″Va″가 끝나면 다음에 오는 ″Ha″를 찾는다. 이때 ″Va″는 연속된 ″V″ 집합의 마지막 ″V″를 의미하고, ″Ha″는 연속된 ″H″ 집합의 첫 번째 ″H″를 의미한다. 다음에 (508)단계에서는 ″Va″의 끝점과 ″Ha″의 시작점의 위치 관계가 상기 세그먼트 조합 ″V2V*H+V+H*H1″의 조건에 만족하는가를 확인한다. 만일 조건을 만족하지 않으면, ″V2H1″ 후보영역 결정과정을 종료한다.If a start segment defined for each neutral type, that is, ″ V2 ″ is found in step 504, in step 506 to 518, a defined combination consisting of V and H segments for achieving a neutral of the type is found. At this time, in step 506, the process proceeds until the next segment is not ″ V ″, and when ″ Va ″ ends, the next ″ Ha ″ is found. Where ″ Va ″ means the last ″ V ″ in a series of ″ V ″ s, and ″ Ha ″ means the first ″ H ″ in a series of ″ H ″ s. In step 508, it is checked whether the positional relationship between the end point of ″ Va ″ and the start point of ″ Ha ″ satisfies the condition of the segment combination ″ V2V * H + V + H * H1 ″. If the condition is not satisfied, the ″ V2H1 ″ candidate area determination process is terminated.

상기 (508)단계에서 조건을 만족하면 (510)단계에서 다음 세그먼트가 ″H″가 아닐때까지 진행하고, ″Hb″가 끝나면 다음에 오는 ″Vb″를 찾는다. 이때 ″Vb″는 두 번째 연속된 ″V″ 집합의 첫 번째 ″V″를 의미하고, ″Hb″는 첫 번째 연속된 ″H″ 집합의 마지막 ″H″를 의미한다. 다음에 (512)단계에서는 ″Hb″의 끝점과 ″Vb″의 시작점의 위치 관계가 상기 세그먼트 조합 ″V2V*H+V+H*H1″의 조건에 만족하는가를 확인한다. 만일 조건을 만족하지 않으면, ″V2H1″ 후보영역 결정과정을 종료한다.If the condition is satisfied in step 508, the process proceeds until the next segment is not ″ H ″ in step 510. When ″ Hb ″ ends, the next ″ Vb ″ is found. Where ″ Vb ″ means the first ″ V ″ in the second consecutive ″ V ″ set, and ″ Hb ″ means the last ″ H ″ in the first consecutive ″ H ″ set. In step 512, it is checked whether the positional relationship between the end point of ″ Hb ″ and the start point of ″ Vb ″ satisfies the condition of the segment combination ″ V2V * H + V + H * H1 ″. If the condition is not satisfied, the ″ V2H1 ″ candidate area determination process is terminated.

상기 (512)단계에서 조건을 만족하면 (514)단계에서 다음 세그먼트가 ″V″가 아닐때까지 진행하고, ″Vc″가 끝나면 다음에 오는 ″Hc″를 찾는다. 이때 ″Vc″는 두 번째 연속된 ″V″ 집합의 마지막 ″V″를 의미하고, ″Hc″는 두 번째 연속된 ″H″ 집합의 첫 번째 ″H″를 의미한다. 다음에 (516)단계에서는 ″Hc″의 끝점과 ″Vc″의 시작점의 위치 관계가 상기 세그먼트 조합 ″V2V*H+V+H*H1″의 조건에 만족하는가를 확인한다. 만일 조건을 만족하지 않으면, ″V2H1″ 후보영역 결정과정을 종료한다.If the condition is satisfied in step 512, the process proceeds until the next segment is not ″ V ″ in step 514. When ″ Vc ″ ends, the next ″ Hc ″ is searched for. Where ″ Vc ″ means the last ″ V ″ in the second consecutive ″ V ″ set, and ″ Hc ″ means the first ″ H ″ in the second consecutive ″ H ″ set. In step 516, it is checked whether the positional relationship between the end point of ″ Hc ″ and the start point of ″ Vc ″ satisfies the condition of the segment combination ″ V2V * H + V + H * H1 ″. If the condition is not satisfied, the ″ V2H1 ″ candidate area determination process is terminated.

상기 (516)단계에서 조건을 만족하면 (518)단계에서 다음 세그먼트가 ″H″가 아닐때까지 진행한후, (520)단계에서 마지막 ″H″가 ″H1″인지를 확인한다. 즉, 정의된 조합의 세그먼트가 발견되면 끝 세그먼트를 확인한다. 이때 끝 세그먼트가 해당 타입인 ″H1″이면, (522)단계에서 시작 세그먼트부터 끝 세그먼트까지의 영역을 해당 타입인 ″V2H1″의 중성 후보영역으로 결정하여 등록한다. 예를들어 상기한 도 6a 내지 도 6c와 같이 ″국″자인 경우 도 6d와 같이 중성 ″ㅜ″ 영역이 결정된다. 도 6d에서 ″″로 표시한 점들 간의 세그먼트들이 중성영역이다.If the condition is satisfied in step 516, the process proceeds until the next segment is not ″ H ″ in step 518, and then checks whether the last ″ H ″ is ″ H1 ″ in step 520. In other words, if a segment of the defined combination is found, the end segment is checked. At this time, if the end segment is ″ H1 ″ of the corresponding type, in step 522, the area from the start segment to the end segment is determined as a neutral candidate area of the ″ V2H1 ″ of the type and registered. For example, in the case of the ″ station ″ as shown in Figs. 6A to 6C, the neutral ″ TT ″ area is determined as shown in Fig. 6D. The segments between the points marked with ″ . ″ In FIG. 6D are neutral regions.

상기한 바와 같이 중성 타입별 후보영역 결정과정을 각각의 중성 타입마다 대응되게 처리하여 각 중성 타입별 후보영역을 결정한다. 즉, 상기한 표 1의 보인 9가지 중성 타입 각각에 대해 도 5에 보인 바와 같은 처리를 해당 중성 타입의 세그먼트 조합에 대응되게 수행한다.As described above, the process of determining the candidate region for each neutral type is processed corresponding to each neutral type to determine the candidate region for each neutral type. That is, for each of the nine neutral types shown in Table 1, the processing as shown in FIG. 5 is performed corresponding to the segment combination of the corresponding neutral type.

상기한 바와 같이 각 타입별로 중성영역을 구한 후, 마이크로 프로세서(100)는 구해진 중성영역에 대해 (208)단계에서 중성 인식을 시도하는데, 이는 통상적인 자소 인식과정과 동일하다. 자소 인식은 일래스틱(elastic) 매칭을 이용하여 미리 등록된 자소 모델과의 비교를 통해 입력 자소와 가장 가까운 자소 모델을 후보로 선택한다. 이때 후보 모델중 정의된 자소 타입인 모델만을 후보로 선택하는데, 예를들어 인식 점수 순서로 최대 30개의 후보 영역을 선택한다.As described above, after obtaining the neutral region for each type, the microprocessor 100 attempts the neutral recognition on the obtained neutral region in step 208, which is the same as a normal phoneme recognition process. The phoneme recognition selects a phoneme model closest to the input phoneme as a candidate through comparison with a phoneme model registered in advance using elastic matching. At this time, only models having a defined phoneme type among the candidate models are selected as candidates. For example, up to 30 candidate regions are selected in order of recognition scores.

다음에 마이크로 프로세서(100)는 (210)단계에서 상기와 같이 인식된 중성의 영역을 기준으로 초성과 종성의 영역에 대해 각각 초성과 종성을 인식한다. 이때 초성,종성 인식 역시 통상적인 자소 인식과 동일하다. 그리고 예를 들어 각각 최대 3개씩의 후보를 갖는다.Next, the microprocessor 100 recognizes the initial and finality of the initial and final regions based on the neutral region recognized as described above at step 210. In this case, the initial and final recognition is also the same as the conventional phonemic recognition. And, for example, each has a maximum of three candidates.

상기와 같은 과정에 의해 초성,중성,종성이 모두 인식되면, (212)단계에서 초성,중성,종성의 조합에 의해 한글 문자를 인식한다. 이때 문자 인식 역시 통상적인 문자 인식과 동일하다. 즉, 자소 인식이 끝나면 조합 후 완성형의 코드가 생성되는 조합의 경우 각각의 자소에 대한 크기 페널티를 가한 후, 문자에 대한 인식 점수를 산출한다. 최종적으로 최고 인식 점수를 갖는 자소 조합으로 생성된 문자코드를 인식결과로 출력하여 출력장치(106)를 통해 알린다.When all of the initial, neutral, and final characters are recognized by the above process, the Hangul character is recognized by the combination of the initial, neutral, and final characters in step 212. The character recognition is also the same as the conventional character recognition. That is, after the recognition of the phoneme is completed, in the case of the combination where the code of the completed type is generated after the combination, a size penalty is applied to each phoneme, and then a recognition score for the character is calculated. Finally, the character code generated by the phoneme combination having the highest recognition score is output as a recognition result and notified through the output device 106.

상술한 본 발명은 온라인 한글 필기체 문자 인식중에서도 연결형의 경우 특히 높은 인식률을 보인다. 이러한 본 발명을 연결형 한글을 인식하기 위해 초성, 중성, 종성과 연결된 형태의 자소를 등록하여 인식하는 기존의 방법과 비교하여 인식 시험을 하였다. 그 결과 에러률이 50%이상 감소되었고, 90MHz 펜티엄(Pentium) PC에서 초당 2000자를 인식하여 빠른 인식결과를 얻을 수 있었다.The present invention described above shows a particularly high recognition rate in the case of the connected type even during online Hangul handwritten character recognition. In order to recognize the present invention, the recognition test was performed in comparison with the existing method of registering and recognizing the phoneme connected with the initial, neutral, and final forms. As a result, the error rate was reduced by more than 50% and fast recognition result was obtained by recognizing 2000 characters per second on a 90MHz Pentium PC.

따라서 한글 문자내에서 중성의 시작점과 끝점의 위치를 미리 정한 후, 그 영역을 중심으로 중성의 경계를 추출하며, 추출된 중성영역을 중심으로 초성과 종성의 영역이 자동으로 결정되면 각각의 영역에 대해 자소 인식을 함으로써 적은 메모리를 사용하면서도 빠르게 연결형 온라인 필기체 한글 문자 인식을 할 수 있다.Therefore, after determining the start and end positions of the neutral in the Hangul characters in advance, the neutral boundary is extracted around the region, and if the regions of the initial and final species are automatically determined based on the extracted neutral region, By using the phoneme recognition, it is possible to use fast on-line handwritten Hangul character recognition while using less memory.

한편 상술한 본 발명의 설명에서는 구체적인 실시예에 관해 설명하였으나, 여러가지 변형이 본 발명의 범위에서 벗어나지 않고 실시할 수 있다. 특히 본 발명의 실시예에서는 문자영역을 9등분하는 예를 들었으나, 필요에 따라 달리 분할하여 이용할 수도 있다. 또한 전처리과정에서의 정규화 크기나 재샘플링 간격도 얼마든지 다르게 할 수 있을 것이다. 따라서 발명의 범위는 설명된 실시예에 의하여 정할 것이 아니고 특허청구범위와 특허청구범위의 균등한 것에 의해 정하여져야 한다.Meanwhile, in the above description of the present invention, specific embodiments have been described, but various modifications can be made without departing from the scope of the present invention. Particularly, in the embodiment of the present invention, an example of dividing the character area into nine is given, but may be divided and used as necessary. In addition, the normalization size and resampling interval in the preprocessing may vary. Therefore, the scope of the invention should not be defined by the described embodiments, but should be defined by the equivalent of claims and claims.

상술한 바와 같이 본 발명은 메모리를 적게 사용하면서도 연결형 온라인 한글 필기체 문자를 빠른 시간내 인식할 수 있어 PDA나 HPC와 같은 개인 정보단말장치에서 효율적으로 이용될 수 있는 잇점이 있다.As described above, the present invention can recognize the connected online Hangul handwritten characters in a short time while using less memory, and thus can be efficiently used in personal information terminal devices such as PDAs and HPCs.

Claims (10)

연결형 온라인 한글 필기체 문자를 인식하는 방법에 있어서,In the method of recognizing connected online Hangul cursive characters, 상기 한글 문자를 필기된 궤적에 따라 입력하고 전처리하는 과정과,Inputting and preprocessing the Hangul characters according to a written trajectory; 상기 전처리된 세그먼트 집합을 필기 순서대로 추적하면서 세그먼트들로부터 수직 세그먼트 집합과 수평 세그먼트 집합을 구하여 결정하는 과정과,Determining a vertical segment set and a horizontal segment set from the segments while tracking the preprocessed segment set in writing order; 상기 한글 문자가 가지는 각 중성의 특징을 이용하여 시작점 및 끝점의 위치 및 끝 세그먼트의 방향을 기준으로 구분한 각 중성 타입별 후보영역으로 결정하는 과정과,Determining the candidate region for each neutral type based on the position of the start point and the end point and the direction of the end segment using the characteristics of the neutrals of the Hangul characters; 상기 중성 타입별 후보영역 각각에 대해 중성을 인식하는 과정과,Recognizing neutrality for each candidate region for each neutral type; 상기 인식된 중성의 영역을 기준으로 초성과 종성의 영역에 대해 각각 초성과 종성을 인식하는 과정과,Recognizing the initial and finality of the initial and final regions based on the recognized neutral regions; 상기 입력된 한글 문자를 상기 인식된 초성,중성,종성의 조합에 의해 인식하는 과정을 구비함을 특징으로 하는 온라인 한글 필기체 문자 인식방법.On-line Hangul handwritten character recognition method characterized in that it comprises the step of recognizing the input Hangul characters by the combination of the recognized initial, neutral, and final. 제1항에 있어서, 상기 수직 세그먼트가 획의 진행방향이 ″아래로″ 진행되는 방향의 세그먼트이고, 상기 수평 세그먼트가 획의 진행방향이 ″오른쪽으로″ 진행되는 방향의 세그먼트임을 특징으로 하는 온라인 한글 필기체 문자 인식방법.The on-line Korean character according to claim 1, wherein the vertical segment is a segment in a direction in which the stroke travels ″ down ″, and the horizontal segment is a segment in a direction in which the stroke progresses ″ right ″. Handwritten character recognition method. 제2항에 있어서, 상기 수직,수평 세그먼트 결정과정이,The method of claim 2, wherein the vertical and horizontal segment determination process, 상기 세그먼트를 이루는 두 점간의 x좌표값 변화와 y좌표값 변화를 비교하는 과정과,Comparing the change of the x coordinate value and the change of the y coordinate value between two points forming the segment; 상기 x좌표값 변화가 y좌표값 변화보다 일정값 이상으로 크면 해당 세그먼트를 수평 세그먼트로 결정하여 등록하는 과정과,If the change in the x coordinate value is greater than a predetermined value than the change in the y coordinate value, determining and registering the corresponding segment as a horizontal segment; 상기 y좌표값 변화가 x좌표값 변화보다 상기 일정값 이상으로 크면 해당 세그먼트를 수직 세그먼트로 결정하여 등록하는 과정과,Determining and registering the corresponding segment as a vertical segment when the y coordinate value change is greater than the predetermined value than the x coordinate value change, and 상기 x좌표값 변화와 y좌표값 변화간에 상기 일정값 이상의 차이가 없으면 해당 세그먼트를 무시하는 과정을 구비함을 특징으로 하는 온라인 한글 필기체 문자 인식방법.And a step of ignoring the corresponding segment if there is no difference over the predetermined value between the change of the x coordinate and the change of the y coordinate. 제2항에 있어서, 상기 중성 타입별 후보영역 결정과정이, 각각의 중성 타입에 대해,The method of claim 2, wherein the process of determining the candidate region for each neutral type comprises: for each neutral type; 상기 세그먼트 집합을 입력하여 상기 중성 타입별 중간 구간을 선택하는 과정과,Selecting an intermediate section for each neutral type by inputting the segment set; 상기 세그먼트를 추적하면서 상기 중성 타입별로 정의된 시작 세그먼트를 찾는 과정과,Finding a starting segment defined for each neutral type while tracking the segment; 상기 중성 타입별로 정의된 시작 세그먼트를 발견하면 해당 타입의 중성을 이루기 위한 상기 수직,수평 세그먼트로 이루어지는 정의된 조합을 찾는 과정과,Finding a starting segment defined for each neutral type and finding a defined combination consisting of the vertical and horizontal segments for achieving a neutral of the type; 상기 정의된 조합의 세그먼트가 발견되면 끝 세그먼트를 확인하는 과정과,If the segment of the combination defined above is found, checking the end segment; 상기 끝 세그먼트가 해당 타입이면 상기 시작 세그먼트부터 끝 세그먼트까지의 영역을 해당 타입별 후보영역으로 결정하는 과정을 구비함을 특징으로 하는 온라인 한글 필기체 문자 인식방법.And if the end segment is a corresponding type, determining a region from the start segment to an end segment as a candidate region for each type. 연결형 온라인 한글 필기체 문자를 인식하는 방법에 있어서,In the method of recognizing connected online Hangul cursive characters, 상기 한글 문자를 필기된 궤적에 따라 입력하고 전처리하는 과정과,Inputting and preprocessing the Hangul characters according to a written trajectory; 상기 전처리된 세그먼트 집합을 필기 순서대로 추적하면서 세그먼트들로부터 수직 세그먼트 집합과 수평 세그먼트 집합을 구하여 결정하는 과정과,Determining a vertical segment set and a horizontal segment set from the segments while tracking the preprocessed segment set in writing order; 상기 한글 문자가 가지는 각 중성에 대해 한 문자의 영역을 2차원 좌표계의 x,y축 방향으로 분할한 단위영역들에 속하는 시작점 및 끝점의 위치와 시작 및 끝 세그먼트의 방향을 기준으로 구분한 중성 타입별로 상기 수직,수평 세그먼트 집합에 대한 중성영역을 찾아 각 중성 타입별 후보영역으로 결정하는 과정과,Neutral type that divides one character area for each neutral of the Hangul characters based on the position of start and end points belonging to the unit areas divided in x, y axis direction of the 2D coordinate system and the direction of start and end segments Determining neutral regions for the vertical and horizontal segment sets for each candidate and determining candidate regions for each neutral type; 상기 중성 타입별 후보영역 각각에 대해 중성을 인식하는 과정과,Recognizing neutrality for each candidate region for each neutral type; 상기 인식된 중성의 영역을 기준으로 초성과 종성의 영역에 대해 각각 초성과 종성을 인식하는 과정과,Recognizing the initial and finality of the initial and final regions based on the recognized neutral regions; 상기 입력된 한글 문자를 상기 인식된 초성,중성,종성의 조합에 의해 인식하는 과정을 구비함을 특징으로 하는 온라인 한글 필기체 문자 인식방법.On-line Hangul handwritten character recognition method characterized in that it comprises the step of recognizing the input Hangul characters by the combination of the recognized initial, neutral, and final. 제5항에 있어서, 상기 수직 세그먼트가 획의 진행방향이 ″아래로″ 진행되는 방향의 세그먼트이고, 상기 수평 세그먼트가 획의 진행방향이 ″오른쪽으로″ 진행되는 방향의 세그먼트임을 특징으로 하는 온라인 한글 필기체 문자 인식방법.The method of claim 5, wherein the vertical segment is a segment in a direction in which a stroke travels ″ down ″, and the horizontal segment is a segment in a direction in which a stroke progresses ″ right ″. Handwritten character recognition method. 제6항에 있어서, 상기 수직,수평 세그먼트 결정과정이,The method of claim 6, wherein the vertical and horizontal segment determination process, 상기 세그먼트를 이루는 두 점간의 x좌표값 변화와 y좌표값 변화를 비교하는 과정과,Comparing the change of the x coordinate value and the change of the y coordinate value between two points forming the segment; 상기 x좌표값 변화가 y좌표값 변화보다 일정값 이상으로 크면 해당 세그먼트를 수평 세그먼트로 결정하여 등록하는 과정과,If the change in the x coordinate value is greater than a predetermined value than the change in the y coordinate value, determining and registering the corresponding segment as a horizontal segment; 상기 y좌표값 변화가 x좌표값 변화보다 상기 일정값 이상으로 크면 해당 세그먼트를 수직 세그먼트로 결정하여 등록하는 과정과,Determining and registering the corresponding segment as a vertical segment when the y coordinate value change is greater than the predetermined value than the x coordinate value change, and 상기 x좌표값 변화와 y좌표값 변화간에 상기 일정값 이상의 차이가 없으면 해당 세그먼트를 무시하는 과정을 구비함을 특징으로 하는 온라인 한글 필기체 문자 인식방법.And a step of ignoring the corresponding segment if there is no difference over the predetermined value between the change of the x coordinate and the change of the y coordinate. 제5항 또는 제7항에 있어서, 상기 중성 타입별 후보영역 결정과정의 단위영역들이, 한 문자의 영역을 2차원 좌표계의 x축 방향으로는 ″왼쪽″, ″중앙″, ″오른쪽″으로 구분하고 y축 방향으로는 ″위″, ″중앙″, ″아래″로 구분하여 9등분한 영역들임을 특징으로 하는 온라인 한글 필기체 문자 인식방법.The method of claim 5 or 7, wherein the unit areas of the candidate type determination process for each neutral type are divided into ″ left ″, ″ center ″, and ″ right ″ in the x-axis direction of the two-dimensional coordinate system. And a 9-divided area divided into ″ up ″, ″ center ″, and ″ down ″ in the y-axis direction. 제8항에 있어서, 상기 중성 타입별 후보영역 결정과정의 중성 타입들이,The method of claim 8, wherein the neutral types of the candidate region determination process for each neutral type include: 상기 시작점의 위치가 ″오른쪽 위″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입과,The start point is ″ upright ″, the start segment is ″ down ″, the end point is ″ bottom right ″, and the end segment is ″ down ″, 상기 시작점의 위치가 ″오른쪽 위″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 중앙″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입과,The start point is ″ upper right ″, the start segment is ″ down ″, the end point is ″ right center ″ and the end segment is ″ right ″, 상기 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입과,The start point is ″ center ″ and the start segment is ″ down ″, the end point is ″ bottom right ″ and the end segment is ″ down ″, 상기 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 중앙″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입과,The start point is ″ center ″ and the start segment is ″ down ″, the end point is ″ right center ″ and the end segment is ″ right ″, 상기 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″아래로″이며, 끝점의 위치가 ″오른쪽 모든 영역″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입과,The start point is ″ center ″, the start segment is ″ down ″, the end point is ″ all right area ″ and the end segment is ″ right ″, 상기 시작점의 위치가 ″중앙″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입과,The start point is ″ center ″ and the start segment is ″ right ″, the end point is ″ bottom right ″ and the end segment is ″ down ″, 상기 시작점의 위치가 ″왼쪽″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″오른쪽 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입과,The start point is ″ left ″ and the start segment is ″ right ″, the end point is ″ bottom right ″ and the end segment is ″ down ″, 상기 시작점의 위치가 ″왼쪽″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″중앙 아래″이고 끝 세그먼트의 방향이 ″아래로″인 타입과,The start point is ″ left ″ and the start segment is ″ right ″, the end point is ″ bottom center ″ and the end segment is ″ down ″, 상기 시작점의 위치가 ″왼쪽″이고 시작 세그먼트의 방향이 ″오른쪽으로″이며, 끝점의 위치가 ″오른쪽 모든 영역″이고 끝 세그먼트의 방향이 ″오른쪽으로″인 타입으로 구분됨을 특징으로 하는 온라인 한글 필기체 문자 인식방법.An online Korean cursive, characterized in that the starting point is ″ left ″ and the starting segment is ″ right ″, the ending point is ″ all right area ″ and the ending segment is ″ right ″. Character recognition method. 제9항에 있어서, 상기 중성 타입별 후보영역 결정과정이, 각각의 중성 타입에 대해,The method of claim 9, wherein the process of determining candidate regions for each neutral type comprises, for each neutral type, 상기 세그먼트 집합을 입력하여 상기 중성 타입별 중간 구간을 선택하는 과정과,Selecting an intermediate section for each neutral type by inputting the segment set; 상기 세그먼트를 추적하면서 상기 중성 타입별로 정의된 시작 세그먼트를 찾는 과정과,Finding a starting segment defined for each neutral type while tracking the segment; 상기 중성 타입별로 정의된 시작 세그먼트를 발견하면 해당 타입의 중성을 이루기 위한 상기 수직,수평 세그먼트로 이루어지는 정의된 조합을 찾는 과정과,Finding a starting segment defined for each neutral type and finding a defined combination consisting of the vertical and horizontal segments for achieving a neutral of the type; 상기 정의된 조합의 세그먼트가 발견되면 끝 세그먼트를 확인하는 과정과,If the segment of the combination defined above is found, checking the end segment; 상기 끝 세그먼트가 해당 타입이면 상기 시작 세그먼트부터 끝 세그먼트까지의 영역을 해당 타입별 후보영역으로 결정하는 과정을 구비함을 특징으로 하는 온라인 한글 필기체 문자 인식방법.And if the end segment is a corresponding type, determining a region from the start segment to an end segment as a candidate region for each type.
KR1019970076001A 1997-12-29 1997-12-29 Method for recognizing cursive of hangul in online system KR100290606B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970076001A KR100290606B1 (en) 1997-12-29 1997-12-29 Method for recognizing cursive of hangul in online system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970076001A KR100290606B1 (en) 1997-12-29 1997-12-29 Method for recognizing cursive of hangul in online system

Publications (2)

Publication Number Publication Date
KR19990056025A KR19990056025A (en) 1999-07-15
KR100290606B1 true KR100290606B1 (en) 2001-06-01

Family

ID=37525798

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970076001A KR100290606B1 (en) 1997-12-29 1997-12-29 Method for recognizing cursive of hangul in online system

Country Status (1)

Country Link
KR (1) KR100290606B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030090381A (en) * 2002-05-23 2003-11-28 퍼셉컴(주) Letters recognition method and letters recognition apparatus
KR101389866B1 (en) * 2012-08-20 2014-04-29 주식회사 펀진 Handwriting characters input device and method using the touch pad

Also Published As

Publication number Publication date
KR19990056025A (en) 1999-07-15

Similar Documents

Publication Publication Date Title
US7437001B2 (en) Method and device for recognition of a handwritten pattern
JP4274941B2 (en) Method and apparatus for decoding handwritten characters
EP1564675B1 (en) Apparatus and method for searching for digital ink query
El Abed et al. Comparison of different preprocessing and feature extraction methods for offline recognition of handwritten arabicwords
WO2006091156A1 (en) Recognition graph
WO1995008158A1 (en) Universal symbolic handwriting recognition system
Bhattacharya et al. An end-to-end system for Bangla online handwriting recognition
JPH02266485A (en) Information recognizing device
Manke et al. A connectionist recognizer for on-line cursive handwriting recognition
US6035062A (en) Character recognition method and apparatus
JP2015099566A (en) Feature calculation device, method and program
KR100290606B1 (en) Method for recognizing cursive of hangul in online system
CN107912062B (en) System and method for overlaying handwriting
JP2002175498A (en) Character recognizing method and its device and character recognizing program and computer readable recording medium with the program recorded
JPH11184971A (en) Device and method for character input with handwritten character recognition function
JP4128325B2 (en) Character recognition device and character recognition method
KR940007345B1 (en) On-line recognitin method of hand-written korean character
JP2671985B2 (en) Information recognition method
Liang et al. Character-position-free on-line handwritten Japanese text recognition
KR100297815B1 (en) System for recognizing korean written characters
JP3128357B2 (en) Character recognition processor
JPH096920A (en) Method and device for handwritten character recognition
JP3075808B2 (en) Document processing device
WO2024110354A1 (en) Setting font size in an unconstrained canvas
KR940001048B1 (en) On-line hand written character recognition method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080228

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee