KR100297815B1 - System for recognizing korean written characters - Google Patents

System for recognizing korean written characters Download PDF

Info

Publication number
KR100297815B1
KR100297815B1 KR1019970075990A KR19970075990A KR100297815B1 KR 100297815 B1 KR100297815 B1 KR 100297815B1 KR 1019970075990 A KR1019970075990 A KR 1019970075990A KR 19970075990 A KR19970075990 A KR 19970075990A KR 100297815 B1 KR100297815 B1 KR 100297815B1
Authority
KR
South Korea
Prior art keywords
character
hangul
recognizing
stroke
written
Prior art date
Application number
KR1019970075990A
Other languages
Korean (ko)
Other versions
KR19990056014A (en
Inventor
권재욱
도정인
Original Assignee
윤종용
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자 주식회사 filed Critical 윤종용
Priority to KR1019970075990A priority Critical patent/KR100297815B1/en
Publication of KR19990056014A publication Critical patent/KR19990056014A/en
Application granted granted Critical
Publication of KR100297815B1 publication Critical patent/KR100297815B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/041Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
    • G06F3/0412Digitisers structurally integrated in a display

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE: A system for recognizing the Korean written characters is provided to rapidly and accurately recognize the Korean written characters by limiting a format of written characters corresponding to the characteristic of Korean. CONSTITUTION: An input device(100) is equipped with an electronic pen, and a user generates a stream of X-Y coordinates according to the locus written by the electronic pen. A microprocessor(104) receives the output of input device, recognizes the inputted Korean characters, and outputs the result as a character code to an output device(112). The microprocessor loads a character combination auto motor(106) and a stroke recognizer(108) in order to recognize the Korean characters. A ROM stores a character recognition process program and various reference data for character recognition process. A RAM temporary stores the data according to the character recognition process. The output device outputs the result of character recognition process by enabling the user to see the result.

Description

한글 필기체 문자 인식 시스템Hangul Cursive Character Recognition System

본 발명은 필기체 문자를 인식하기 위한 시스템에 관한 것으로, 특히 한글 필기체 문자를 인식하기 위한 시스템에 관한 것이다.The present invention relates to a system for recognizing handwritten characters, and more particularly to a system for recognizing Hangul handwritten characters.

최근, PDA(Personal Digital Assistant 또는 Personal Digital Accessory), HPC(Hand-held Personal Computer)등과 같은 개인 정보단말장치의 이용이 급증하고 있다. 이들 개인 정보단말장치는 개인용 컴퓨터가 소형화, 경량화되어 가는 추세이다. 이에따라 부피가 큰 키보드(keyboard)를 대치하는 입력방법으로 필기 입력방법의 필요성이 중요하게 대두되고 있다. 그러나 필기 입력방법은 정확도의 문제가 실용화의 걸림돌로 작용하고 있으며, 사용자의 입력 속도 등에 불편을 끼친다.In recent years, the use of personal information terminal devices such as PDA (Personal Digital Assistant or Personal Digital Accessory), HPC (Hand-held Personal Computer), and the like are increasing rapidly. These personal information terminal devices have tended to become smaller and lighter in personal computers. Accordingly, the necessity of a handwriting input method has emerged as an input method that replaces a bulky keyboard. However, in the handwriting input method, a problem of accuracy acts as an obstacle to practical use, and inconveniences to a user's input speed.

특히 한글 필기체 문자 인식방법의 문제점은 자소 간의 경계를 찾기가 어려웠다는 것이다. 즉, 1획 또는 2획부터 때로는 열 개가 넘는 획이 입력되면, 이로부터 생성할 수 있는 모든 조합을 고려하여 인식해야 함에 따라 인식 속도가 늦어짐으로써 자연적으로 필기 속도가 저하된다. 또한 이러한 경우 판별이 모호한 문자가 자주 발생하여 정확도 저하의 원인이 되어 왔었다.In particular, the problem with the Korean handwritten character recognition method is that it is difficult to find the boundary between the phonemes. That is, when more than ten strokes are input from one stroke or two strokes, the recognition speed is naturally slowed down, and the writing speed is naturally lowered as the recognition must be considered in consideration of all possible combinations generated therefrom. In addition, in this case, ambiguous characters frequently occur, which causes a drop in accuracy.

따라서 인식의 정확도 및 속도를 개선하기 위해 사용자 필기 형태를 제한하는 방법의 필요성이 거론되고 있다. 이러한 예로서 영어권에서는 유니스트로크(unistroke)라는 이름으로 모든 영문 알파벳(alphabet)을 각각 1획에 필기하도록 함으로써 인식의 정확도 및 필기 속도를 획기적으로 높이는 기술이 제안되었다. 이는 David Goldberg에 의해 발명되어 1997년 1월 21일자로 발행된 미합중국 특허번호 제5,596,656호 "UNISTROKES FOR COMPUTERIZED INTERPRETATION OF HANDWRITING"이다. 현재 이 방법은 PDA에서 많이 활용되고 있다.Therefore, the necessity of a method of limiting a user's handwriting form has been discussed to improve the accuracy and speed of recognition. For example, in the English-speaking world, a technique for dramatically increasing the accuracy of recognition and the writing speed is proposed by writing all the alphabets (alphabet) in one stroke under the name of unistroke. This is US Patent No. 5,596,656, published by David Goldberg, issued January 21, 1997, "UNISTROKES FOR COMPUTERIZED INTERPRETATION OF HANDWRITING." This method is now widely used in PDAs.

도 1은 상기한 특허번호 제5,596,656호에서 제안한 유니스트로크 알파벳 심볼(symbol)들의 형태 및 필기 순서를 보인 것으로, 숫자나 기호까지도 포함한다. 상기 도 1은 유니스트로크 심볼들 각각을 고유의 형태를 가지는 화살표로 보였는데, 필기 순서는 화살표의 시작점부터 끝점으로 진행된다. 이와 같이 1획이 하나의 알파벳을 나타내므로 획의 조합과정없이 사용자가 1획을 필기한 직후 인식 결과를 화면에 출력하게 된다. 따라서 알파벳 상호간에 각도에 의한 구분이 확실하게 이루어지도록 형태를 설계하였으므로, 정확하게 인식할 수 있다.FIG. 1 illustrates the form and handwriting order of the unistroke alphabet symbols proposed in Patent No. 5,596,656, including numbers and symbols. 1 shows each of the unistroke symbols as arrows having a unique shape, the writing sequence proceeds from the start point to the end point of the arrow. In this way, since one stroke represents one alphabet, the recognition result is output on the screen immediately after the user writes one stroke without combining strokes. Therefore, since the shape is designed so that the distinction by angle between the alphabets can be made reliably, it can be recognized accurately.

그러나 상기한 바와 같은 영어권에서 개발된 유니스트로크 시스템은 문자 특성상 풀어쓰기를 하는 알파벳에는 적합하지만 한글 필기체 문자를 인식하는데 그대로 적용할 수 없었다. 즉, 한글은 자소의 종류가 많고 형태가 복잡하며 모아쓰기를 하므로 양자간에 상이한 점이 많아서 그대로 적용할 수가 없었다.However, the unistroke system developed in the English-speaking language as described above is suitable for the alphabet to be interpreted due to the characteristics of the character, but it cannot be applied to recognize Korean handwritten characters. That is, because Hangul has many kinds of phonemes, complicated forms, and writing together, there are many differences between the two, so it could not be applied as it is.

상술한 바와 같이 한글 필기체 문자는 자소 간의 경계를 찾기가 어렵기 때문에 인식의 정확도 및 속도가 저하되었었다. 이에 대해 비록 인식의 정확도 및 필기 속도를 향상시킬 수 있는 유니스트로크 시스템이 있으나, 이는 영어권 문자에 적합할뿐 이와 상이한 문자 특성을 가지는 한글에 적용할 수 없는 문제점이 있었다.As described above, the Hangul handwritten characters have difficulty in finding the boundary between the phonemes, thereby reducing the accuracy and speed of recognition. On the other hand, although there is a unistroke system that can improve the accuracy and writing speed of recognition, this is not only suitable for English-speaking characters, but also has a problem that can not be applied to Hangul having different character characteristics.

따라서 본 발명의 목적은 한글의 특성에 맞게 필기 형태를 제약함으로써 한글 필기체 문자를 정확하고 신속하게 인식할 수 있는 시스템을 제공함에 있다.Accordingly, an object of the present invention is to provide a system that can accurately and quickly recognize Hangul handwritten characters by restricting the handwriting form according to the characteristics of Hangul.

도 1은 유니스트로크 알파벳 심볼의 형태 및 필기 순서를 보인 도면,1 is a view showing the form and the writing order of the unistroke alphabet symbols,

도 2는 본 발명의 실시예에 따라 정의된 기본 자소들과 반복 부호의 형태 및 필기 순서를 보인 도면,2 is a view showing the form and the writing order of the basic phonemes and repeating codes defined according to an embodiment of the present invention;

도 3은 본 발명의 실시예에 따라 한글 필기체 문자를 인식하기 위한 시스템의 블록구성도,3 is a block diagram of a system for recognizing a Korean handwritten character according to an embodiment of the present invention;

도 4는 도 3의 문자 조합 오토머터의 상태 전이도.4 is a state transition diagram of the character combination automer of FIG.

상술한 목적을 달성하기 위한 본 발명은 단자음과 수직,수평 모음이 포함되는 기본 자소 각각은 고유의 형태 및 필기 순서를 정의한 한글 유니스트로크 심볼로 1획에 필기하도록 하고, 나머지 복합 자소는 한글 유니스트로크 심볼들을 조합하여 각각 2획에 필기하도록 함을 특징으로 한다.According to the present invention for achieving the above object, each basic phoneme including a terminal sound and a vertical and horizontal vowels is written in one stroke with a Hangul Unistroke symbol defining a unique form and a writing order, and the remaining compound phonemes are Hangul Unistroke. Combining the symbols are characterized in that the writing on each of two strokes.

이하 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명 및 첨부 도면에서 구체적인 자소 또는 부호의 형태나 필기 순서, 처리 과정과 같은 많은 특정 상세들이 본 발명의 보다 전반적인 이해를 제공하기 위해 나타나 있다. 이들 특정 상세들없이 본 발명이 실시될 수 있다는 것은 이 기술분야에서 통상의 지식을 가진 자에게 자명할 것이다. 그리고 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description and the annexed drawings, numerous specific details are set forth in order to provide a more thorough understanding of the present invention, such as the form, writing order, and processing details thereof. It will be apparent to those skilled in the art that the present invention may be practiced without these specific details. And a detailed description of known functions and configurations that may unnecessarily obscure the subject matter of the present invention will be omitted.

우선 본 발명은 전술한 바와 같은 유니스트로크의 개념을 한글 필기체 문자 인식 시스템에도 적용할 수 있도록 한 것으로, 사용자가 큰 불편없이 보다 정확하게 디지타이저(digitizer)나 터치 스크린 패널(touch-sensitive screen panel)을 이용하여 필기 입력할 수 있는 한글 필기 형태 및 이를 이용한 인식 시스템이다.First of all, the present invention allows the concept of unistroke as described above to be applied to a Korean handwritten character recognition system, and a user can more accurately use a digitizer or a touch-sensitive screen panel without any inconvenience. Hangul handwriting form that can be input by hand and a recognition system using the same.

도 2는 본 발명의 실시예에 따라 정의된 기본 자소들과 반복 부호의 형태 및 필기 순서를 보인 도면이다. 상기 도 2에서 "о"는 획의 시작점 위치를 나타낸다. 전술한 바와 같이 한글은 영문에 비하여 문자를 구성하는 자소의 수가 많고 그 형태가 복잡하기 때문에 영문 유니스트로크 시스템을 그대로 적용하면, 사용자가 이를 암기하여 필기하는 것이 어렵다. 따라서 한글에 적합하도록 유니스트로크의 개념을 재정립하는 것이 필요하다. 본 발명에서는 하기와 같은 원칙하에 도 2와 같이 한글 자소의 형태를 정의하였다.2 is a diagram illustrating the form and the writing order of basic phonemes and repetitive codes defined according to an exemplary embodiment of the present invention. In FIG. 2, "o" represents a starting point position of a stroke. As described above, since Hangul has a larger number of phonemes and complicated forms than English, it is difficult for a user to memorize and write the English Unistroke system as it is. Therefore, it is necessary to redefine the concept of unistroke to suit Hangul. In the present invention, the shape of the Hangul phoneme is defined as shown in FIG. 2 under the following principle.

먼저 본 발명에서는 하기 표 1에 보인 바와 같이 한글 자소를 크게 기본 자소와 복합 자소로 구분하였다. 본 발명에 있어서 하기 표 1에 보인 기본 자소는 1획에 필기하고, 복합 자소는 기본 자소의 합으로 2획에 필기하도록 정의하였다.First, in the present invention, as shown in Table 1, Korean phonemes are divided into basic phonemes and compound phonemes. In the present invention, the basic phoneme shown in Table 1 is defined to be written in one stroke, and the composite phoneme is written in two strokes as the sum of the basic phonemes.

자소의 종류Kind of 자소Jaso 기본 자소Basic phoneme 자음Consonant ㄱ ㄴ ㄷ ㄹ ㅁ ㅂ ㅅ ㅇ ㅈ ㅊ ㅋ ㅌ ㅍ ㅎㄱ ㄴ ㄷ ㄹ ㅁ ㅂ ㅇ ㅋ ㅋ ㅋ ㅋ ㅋ 모음collection ㅏ ㅐ ㅑ ㅒ ㅓ ㅔ ㅕ ㅖ ㅗ ㅛ ㅜ ㅠ ㅡ ㅣㅜ ㅐ ㅑ ㅒ ㅓ ㅔ ㅕ ㅖ ㅗ ㅗ ㅠ ㅡ ㅣ 복합 자소Compound 겹자음A double consonant ㄲ ㄸ ㅃ ㅆ ㅉㄲ ㄸ ㅃ ㅆ ㅉ 복자음Lucky consonants ㄳ ㄵ ㄶ ㄺ ㄻ ㄼ ㄽ ㄾ ㄿ ㅀ ㅄㄳ ㄵ ㄶ ㄺ ㄻ ㄼ ㄽ ㄾ ㄿ ㅀ ㅄ 복모음Double Vowels ㅘ ㅙ ㅚ ㅝ ㅞ ㅟ ㅢㅘ ㅙ ㅚ ㅝ ㅞ ㅟ ㅢ

여기서 기본 자소란 ㄲ,ㄸ,ㅆ,ㅉ ㅃ 등의 겹자음을 제외한 컴퓨터용 한글 2벌식 자판에 표기되어 있는 모든 자소를 의미한다. 각 기본 자소는 영문 유니스트로크 알파벳과 같은 개념으로 대응되어 하나의 획으로 표현된다. 이를 본 발명에 있어서 "한글 유니스트로크"라 칭한다. 복합 자소는 자음의 경우는 두 자음의 합이고, 모음의 경우는 수평 모음과 수직 모음의 합으로 정의된다. 따라서 모든 복합 자소는 2획에 필기하도록 하였다. 단, 겹자음의 경우에는기본 자소의 합으로 표현하면 'ㄱㅏㄱㄱㅏ'를 필기한 경우, '각각' 이나 '가까' 모두로 해석할 수 있는 모호함이 발생하므로, 기본 자소와 반복 심볼로 표현하였다. 이와 같이 정의한 원칙은 자소의 형태를 단순하게 하여 자소의 원형에 근접한 필기 자소 형태를 설계할 수 있게 하고, 따라서 사용자가 필기 자소의 형태를 암기하기 쉽게 한다. 또한 기존의 자판에 익숙한 상용자가 자판을 두드리는 것과 같은 조합으로 문자를 입력할 수 있다는 장점을 갖는다. 이러한 장점을 유지하기 위하여 한글 문자 조합 오토머터(automata)를 일부 수정한 도 4에 보인 바와 같은 문자 조합 오토머터를 이용한다.Here, basic phoneme means any phoneme written on the Korean Hangul keyboard for computer except double consonants such as ㄲ, ㄸ, ㅆ, ㅉ ㅃ. Each basic phoneme corresponds to the same concept as the English unstroke alphabet and is represented by one stroke. This is called "Hangul Unistroke" in the present invention. A compound phoneme is defined as the sum of two consonants in the case of consonants and the sum of the horizontal and vertical vowels in the case of vowels. Therefore, all compound phonemes should be written in two strokes. However, in the case of double consonants, when the sum of the basic phonemes is expressed, the ambiguity that can be interpreted as 'each' or 'near' occurs when the 'ㄱㅏ ㄱㄱㅏ' is written. The principles defined in this way simplify the shape of the phoneme, making it possible to design a handwritten phoneme shape close to the original shape of the phoneme, thus making it easier for a user to memorize the shape of the handwritten phoneme. It also has the advantage that a character who is familiar with the existing keyboard can input characters in the same combination as tapping the keyboard. In order to maintain this advantage, a character combination automer is used as shown in FIG. 4, in which the Hangul character combination automata is partially modified.

그리고 도 2의 기본 자소 형태를 정의함에 있어서 한글 자소의 원형을 최대한 유지하면서 인식할때의 구분이 용이하도록 고려하였다. 한글은 자음 30 개와 모음 21개로 도합 51개의 자소로 구성되며, 이는 기본 형태 24개로부터 조합된다. 또한 한글 필기자는 기본 형태를 조합하여 다른 자소를 필기하는데 익숙하다. 따라서 조합된 자소를 기본 형태로부터 쉽게 연상할 수 있도록 자소 형태를 정의하였다. 본 발명에서는 사용자가 정의된 자소 형태에 따라 연속하여 모아쓰기 또는 풀어쓰기를 자유로이 할 수 있도록 허용한다. 이러한 원칙에 입각하여 설계한 자소가 제 1 도에 나타나 있다.In defining the basic phoneme shape of FIG. 2, it is considered to make it easy to distinguish when recognizing while maintaining the original form of the Hangul phoneme. Hangul consists of 51 consonants with 30 consonants and 21 vowels, which are combined from 24 basic forms. Hangul scribes are also used to writing different phonemes by combining basic forms. Therefore, the phoneme shape is defined so that the combined phonemes can be easily associated with the basic form. The present invention allows the user to freely write or write continuously in accordance with the defined phoneme shape. Phoneme designed based on this principle is shown in FIG.

상기 도 2에서 설계한 필기 자소 형태는 자음의 경우 실제 자소와 유사한 형태를 유지하였으므로 실제 자소 형태로부터 연상하기 쉽다. 모음의 경우에는 'ㅏ', 'ㅓ', 'ㅗ', 'ㅜ'와 'ㅑ', 'ㅕ', 'ㅛ', 'ㅠ'는 같은 형태를 대칭 및 회전시켜 설계하였고, 'ㅐ', 'ㅒ'와 'ㅔ', 'ㅖ'를 연관시켜 사용자가 암기하기 쉽도록 설계하였다.The handwritten phoneme shape designed in FIG. 2 maintains a shape similar to the real phoneme in the case of consonants, and is easily associated with the actual phoneme shape. In the case of vowels, 'ㅏ', 'ㅓ', 'ㅗ', 'TT' and 'ㅑ', 'ㅕ', 'ㅛ' and 'ㅠ' are designed by symmetrical and rotating the same shape. It is designed to be easy for users to memorize by linking 'ㅒ', 'ㅔ' and 'ㅖ'.

도 3은 본 발명의 실시예에 따라 한글 필기체 문자를 인식하기 위한 시스템의 블록구성도를 보인 것이다. 입력장치(100)는 전자 펜(102)을 구비하며, 사용자가 전자 펜(102)을 이용하여 필기하는 궤적에 따른 2차원 좌표계에 의한 x,y좌표점 열(stream)을 발생한다. 이러한 입력장치(100)로서는 상기한 바와 같이 디지타이저나 터치 스크린 패널을 사용한다. 마이크로 프로세서(microprocessor)(104)는 입력장치(100)의 출력을 입력하여 상기한 도 2와 같은 형태로 입력된 한글 필기체 문자를 인식하고 인식 결과를 문자코드로 출력장치(112)로 출력한다. 이러한 마이크로 프로세서에(104)는 한글 필기체 문자 인식을 위해 문자 조합 오토머터(106)와 획 인식부(108)가 로딩(loading)된다. 메모리(110)는 롬(ROM: Read Only Memory)과 램(RAM: Random Access Memory)을 구비한다. 롬에는 본 발명의 실시예에 따른 마이크로 프로세서(104)의 문자 인식 처리 프로그램과 문자 인식 처리를 위한 각종 참조 데이터가 저장된다. 램에는 마이크로 프로세서(104)의 문자 인식 처리에 따른 데이터가 일시 저장된다. 출력장치(112)는 예를 들어 액정 디스플레이장치가 될 수 있으며, 마이크로 프로세서(104)에 의한 문자 인식결과를 사용자가 리드할 수 있도록 출력한다.Figure 3 shows a block diagram of a system for recognizing Hangul handwritten characters in accordance with an embodiment of the present invention. The input device 100 includes an electronic pen 102, and generates a stream of x, y coordinate points by a two-dimensional coordinate system according to a trajectory of a user writing using the electronic pen 102. As the input device 100, a digitizer or a touch screen panel is used as described above. The microprocessor 104 inputs the output of the input apparatus 100 to recognize the Korean handwritten characters inputted as shown in FIG. 2 and outputs the recognition results to the output apparatus 112 as character codes. In the microprocessor 104, a letter combination automerter 106 and a stroke recognition unit 108 are loaded for Korean handwritten character recognition. The memory 110 includes a read only memory (ROM) and a random access memory (RAM). The ROM stores a character recognition program of the microprocessor 104 and various reference data for character recognition processing according to an embodiment of the present invention. The RAM temporarily stores data according to the character recognition process of the microprocessor 104. The output device 112 may be, for example, a liquid crystal display device, and outputs a character recognition result by the microprocessor 104 so that a user can read it.

상기한 도 3의 시스템에서 문자 조합 오토머터(106)는 사용자가 입력장치(100)를 이용하여 필기할 때마다 사용자가 필기한 문자 패턴의 좌표점 열을 입력받는다. 문자 패턴은 획의 집합으로 이루어지고, 1획은 전자 펜(102)이 입력장치(100)의 표면에 접촉된 순간부터 표면에서 떨어질 때까지 움직인 궤적을 표현한 일련의 순서화된 좌표점 열이다. 입력장치(100)에서는 사용자의 필기를 연속적으로 추적하여 1획의 필기가 끝나면 좌표점 열을 문자 조합 오토머터(106)로 전달하고 계속 입력을 받는다.In the system of FIG. 3, the character combination automerter 106 receives a coordinate point sequence of a character pattern written by the user whenever the user writes using the input device 100. The character pattern is made up of a set of strokes, and one stroke is a sequence of ordered coordinate points representing a trajectory of movement of the electronic pen 102 from its contact with the surface of the input device 100 to its fall from the surface. The input apparatus 100 continuously tracks the user's handwriting and transmits the coordinate point sequence to the character combination automerter 106 after receiving one handwriting, and continuously receives the input.

상기한 문자 조합 오토머터(106)는 도 4의 상태전이도에 의하여 표현된다. 즉, 입력장치(100)로부터 하나의 획이 입력될 때마다 획 인식부(108)를 호출하여 획 인식 결과를 전달받아 문자 코드를 생성하는 역할을 한다. 도 4에 보인 바와 같은 문자 조합 오토머터(106)에 의하여 한 문자는 최소 2획에서 최대 6획으로 구성된다. 이러한 문자 조합 오토머터(106)를 이용하여 설계한 필기 형태의 자소를 입력할 때 사용자는 모아쓰기나 풀어쓰기에 관계없이 연속적으로 문자를 입력할 수 있다. 즉, 기존의 한글 인식에서는 하나의 문자만을 입력 받아 인식하거나 문자를 임의의 방법으로 분리한후 인식하였으나, 본 발명에서는 자판을 치는 것과 마찬가지로 자소의 연속적인 입력이 가능하다.The letter combination automerter 106 is represented by the state transition diagram of FIG. That is, whenever a stroke is input from the input device 100, the stroke recognition unit 108 is called to receive a stroke recognition result to generate a character code. One character is composed of a minimum of two strokes and a maximum of six strokes by the character combination automer 106 as shown in FIG. When inputting a writing type phoneme designed using the letter combination automerter 106, the user can continuously input characters regardless of the writing or the writing. That is, in the conventional Korean recognition, only one character is input or recognized, or the character is separated and recognized by an arbitrary method. However, in the present invention, the phoneme can be continuously input like the keyboard.

상기한 획 인식부(108)은 사용자가 필기한 하나의 획을 자소중의 하나로 대응시키는 과정이다. 본 발명의 획 인식부(108)에는 기존에 널리 알려진 어떠한 문자 인식방법을 사용하여도 무방하다. 즉, 본 발명은 획을 인식하는 방법과는 무관하다. 그러나 자소 간의 구분이 용이하도록 형태를 정의하였으므로 간단한 방법을 사용하더라도 빠르고 정확하게 획을 인식할 수 있게 된다. 이에따라 본 발명에서는 획을 인식하는 방법과는 관계없이 인식하려는 자소의 형태를 정의하고 이를 조합하여 문자를 생성하는 시스템이 정의된다. 이러한 획 인식부(108)에서 획이 인식되면 획 인식 결과가 다시 문자 조합 오토머터(106)로 전달되고 하나의 문자가 완성되었으면 문자 코드를 출력장치(112)로 출력하여 한 문자에 대한 인식이 끝나게 된다. 이러한 과정은 사용자가 필기를 중단할 때까지 반복된다.The stroke recognition unit 108 is a process of mapping a stroke written by a user to one of phonemes. The stroke recognition unit 108 of the present invention may use any conventionally known character recognition method. In other words, the present invention is independent of the method for recognizing stroke. However, since the form is defined to make it easy to distinguish between elements, it is possible to recognize strokes quickly and accurately even with a simple method. Accordingly, in the present invention, regardless of the method of recognizing a stroke, a system for defining a form of a phoneme to be recognized and combining the same to generate a character is defined. When the stroke is recognized by the stroke recognition unit 108, the stroke recognition result is transmitted to the character combination automer 106 again, and when one character is completed, the character code is output to the output device 112 to recognize the character. It is over. This process is repeated until the user stops writing.

따라서 한글에서도 유니스트로크 개념을 적용하여 한글 필기체 문자를 인식함에 따라 사용자가 필기한 문자가 거의 완벽하게 인식될 수 있고, 연속적으로 빠른 필기를 가능하게 한다. 또한 인식기가 사용하는 기억장치의 양이 작아지므로 초소형 컴퓨터의 기억 장치 부담을 줄일 수 있다.Therefore, as the Korean handwriting character is recognized by applying the concept of unistroke in Hangul, the handwritten character can be almost completely recognized, and it is possible to continuously write fast. In addition, since the amount of memory used by the recognizer is reduced, the burden on the storage of a small computer can be reduced.

한편 상술한 본 발명의 설명에서는 구체적인 실시예에 관해 설명하였으나, 여러가지 변형이 본 발명의 범위에서 벗어나지 않고 실시할 수 있다. 특히 본 발명의 실시예에서와 달리 두 획으로 필기하는 자소의 종류 및 필기 방법을 필요에 따라 변형할 수 있다. 이러한 예로서 겹자음의 표현 시에 반복 심볼을 사용하는 대신 겹자음을 하나의 획으로 표현할 수 있으며, 모음 'ㅐ', 'ㅒ', 'ㅔ', 'ㅖ'를 두 획에 필기하도록 수정할 수 있다. 또한 본 발명의 실시예에서 정의한 자소 형태의 일부 또는 전부에 얼마든지 변형을 가하거나 변화시킬 수 있다. 따라서 발명의 범위는 설명된 실시예에 의하여 정할 것이 아니고 특허청구범위와 특허청구범위의 균등한 것에 의해 정하여져야 한다.Meanwhile, in the above description of the present invention, specific embodiments have been described, but various modifications can be made without departing from the scope of the present invention. In particular, unlike in the embodiment of the present invention, the type and writing method of the phoneme to be written in two strokes may be modified as necessary. For example, instead of using a repetition symbol in the expression of the double consonants, the double consonants can be expressed in a single stroke, and the vowels 'ㅐ', 'ㅒ', 'ㅔ', and 'ㅖ' can be modified to be written in two strokes. In addition, any number of modifications or changes may be made to some or all of the phoneme forms defined in the embodiments of the present invention. Therefore, the scope of the invention should not be defined by the described embodiments, but should be defined by the equivalent of claims and claims.

상술한 바와 같이 본 발명은 한글에서도 유니스트로크 개념을 적용하여 한글 필기체 문자를 인식함에 따라 인식의 정확도 및 속도를 획기적으로 향상시킬 수 있으며 연속적으로 빠른 필기를 가능하게 한다. 또한 인식기가 사용하는 기억장치의 양이 작아지므로 초소형 컴퓨터의 기억 장치 부담을 줄여 가격 경쟁에 도움을 줄 수 있다.As described above, the present invention can remarkably improve the accuracy and speed of recognition by applying the concept of unistroke in Korean as well and enable fast writing continuously. In addition, the smaller amount of memory used by the recognizer reduces the burden on the memory of microcomputers, helping to compete in price.

Claims (6)

한글 필기체 문자를 인식하기 위한 시스템에 있어서,In the system for recognizing Hangul handwritten characters, 단자음과 수직,수평 모음이 포함되는 기본 자소 각각에 대해 1획에 필기하도록 고유의 형태 및 필기 순서를 정의한 한글 유니스트로크 심볼과, 상기 한글 유니스트로크 심볼들을 조합하여 각각 2획에 필기하도록 정의한 복합 자소가, 사용자에 의해 선택적으로 조합되어 필기되는 궤적에 따른 2차원 좌표계에 의한 좌표점 열을 발생하는 입력장치와,A compound phoneme defined to write on two strokes by combining the Hangul unistroke symbol that defines its own form and handwriting order to write in one stroke for each basic phoneme including terminal sound and vertical and horizontal vowels. An input device for generating a coordinate point sequence by a two-dimensional coordinate system according to a trajectory that is selectively combined and written by a user, 상기 좌표점 열을 입력하여 상기 필기되는 심볼들 각각의 획을 자소들중 어느 하나로 대응시켜 인식하는 획 인식부와,A stroke recognizing unit for recognizing a stroke of each of the written symbols by corresponding to one of phonemes by inputting the coordinate point sequence; 상기 인식된 자소들을 상기 필기 형태에 따른 문자 조합에 의해 상기 필기된 한글 문자를 인식하고 그에 대응하는 문자코드를 발생하는 문자 조합 오토머터를 구비함을 특징으로 하는 한글 필기체 문자 인식 시스템.And a character combination automator for recognizing the written Hangul characters and generating a character code corresponding to the recognized phonemes by the character combinations according to the handwriting type. 제1항에 있어서, 상기 문자 조합 오토머터가, 한 문자를 최소 2획에서 최대 6획으로 구성함을 특징으로 하는 한글 필기체 문자 인식 시스템.The Hangul handwritten character recognition system according to claim 1, wherein the character combination automator comprises one character in a minimum of two strokes and a maximum of six strokes. 제1항에 있어서, 상기 입력장치가, 디지타이저 또는 터치 스크린 패널임을 특징으로 하는 한글 필기체 문자 인식 시스템.The Hangul handwritten character recognition system according to claim 1, wherein the input device is a digitizer or a touch screen panel. 한글 필기체 문자를 인식하기 위한 시스템에 있어서,In the system for recognizing Hangul handwritten characters, 단자음과 수직,수평 모음이 포함되는 기본 자소 각각에 대해 1획에 필기하도록 고유의 형태 및 필기 순서를 정의한 한글 유니스트로크 심볼과, 상기 한글 유니스트로크 심볼들을 조합하여 각각 2획에 필기하도록 정의한 복합 자소중의 복자음들 및 복모음들과, 상기 복합 자소중에 겹자음들 각각에 대해 상기 한글 유니스트로크 심볼과 조합하여 2획에 필기하도록 고유의 형태 및 필기 순서를 정의한 반복 심볼이, 사용자에 의해 선택적으로 조합되어 필기되는 궤적에 따른 2차원 좌표계에 의한 좌표점 열을 발생하는 입력장치와,Hangul Unistroke symbol that defines its own shape and handwriting order to write in one stroke for each basic phoneme including terminal sound and vertical and horizontal vowels, and a compound character defined to write in two strokes by combining the Hangul Unistroke symbols Selected by the user is a combination of the small consonants and the double consonants and the repetitive symbols defining a unique shape and writing order to write in two strokes in combination with the Hangul unistroke symbol for each of the compound consonants in the compound phoneme An input device for generating a coordinate point sequence by a two-dimensional coordinate system according to the written trajectory; 상기 좌표점 열을 입력하여 상기 필기되는 심볼들 각각의 획을 자소들중 어느 하나로 대응시켜 인식하는 획 인식부와,A stroke recognizing unit for recognizing a stroke of each of the written symbols by corresponding to one of phonemes by inputting the coordinate point sequence; 상기 인식된 자소들을 상기 필기 형태에 따른 문자 조합에 의해 상기 필기된 한글 문자를 인식하고 그에 대응하는 문자코드를 발생하는 문자 조합 오토머터를 구비함을 특징으로 하는 한글 필기체 문자 인식 시스템.And a character combination automator for recognizing the written Hangul characters and generating a character code corresponding to the recognized phonemes by the character combinations according to the handwriting type. 제4항에 있어서, 상기 문자 조합 오토머터가, 한 문자를 최소 2획에서 최대 6획으로 구성함을 특징으로 하는 한글 필기체 문자 인식 시스템.5. The Hangul handwritten character recognition system according to claim 4, wherein the character combination automator comprises one character from at least two to at most six. 제4항에 있어서, 상기 입력장치가, 디지타이저 또는 터치 스크린 패널임을 특징으로 하는 한글 필기체 문자 인식 시스템.The Hangul handwritten character recognition system according to claim 4, wherein the input device is a digitizer or a touch screen panel.
KR1019970075990A 1997-12-29 1997-12-29 System for recognizing korean written characters KR100297815B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970075990A KR100297815B1 (en) 1997-12-29 1997-12-29 System for recognizing korean written characters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970075990A KR100297815B1 (en) 1997-12-29 1997-12-29 System for recognizing korean written characters

Publications (2)

Publication Number Publication Date
KR19990056014A KR19990056014A (en) 1999-07-15
KR100297815B1 true KR100297815B1 (en) 2001-08-07

Family

ID=37528255

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970075990A KR100297815B1 (en) 1997-12-29 1997-12-29 System for recognizing korean written characters

Country Status (1)

Country Link
KR (1) KR100297815B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030090381A (en) * 2002-05-23 2003-11-28 퍼셉컴(주) Letters recognition method and letters recognition apparatus
KR101422274B1 (en) * 2012-05-12 2014-07-22 봉래 박 Apparatus and method for inputting hanguel character

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030090381A (en) * 2002-05-23 2003-11-28 퍼셉컴(주) Letters recognition method and letters recognition apparatus
KR101422274B1 (en) * 2012-05-12 2014-07-22 봉래 박 Apparatus and method for inputting hanguel character

Also Published As

Publication number Publication date
KR19990056014A (en) 1999-07-15

Similar Documents

Publication Publication Date Title
US6493464B1 (en) Multiple pen stroke character set and handwriting recognition system with immediate response
US6567072B2 (en) Character input device and method
CN108700996B (en) System and method for multiple input management
Schomaker From handwriting analysis to pen-computer applications
EP1530122A2 (en) Apparatus and method for character recognition
JPH07200155A (en) Detection of nonobjective result of pen-type computer system
EP1513053A2 (en) Apparatus and method for character recognition
US7406662B2 (en) Data input panel character conversion
US6731803B1 (en) Points based handwriting recognition system
EP3491580B1 (en) System and method for beautifying superimposed digital ink
US7979795B2 (en) System and method for inputting syllables of a phonetic script into a computer
KR100297815B1 (en) System for recognizing korean written characters
Tappert et al. English language handwriting recognition interfaces
KR100374339B1 (en) Character recognition apparatus and method for use in a communication terminal having touch-sensitive screen
JP2003196007A (en) Character input device
KR20010073976A (en) Handwriting Recognition System and the Method for Information Unit
KR100484128B1 (en) Apparatus for inputting unistroke korean language
Seni Treadmill ink-Enabling continuous pen input on small devices
KR100356037B1 (en) Apparatus And Method For Recognition Of Multiple Character In Handwriting Recognition
WO2024110354A1 (en) Setting font size in an unconstrained canvas
WO2006090404A1 (en) System, method, and apparatus for accomodating variability in chunking the sub-word units of online handwriting
KR20030090381A (en) Letters recognition method and letters recognition apparatus
JPH0677252B2 (en) Japanese data input processor
JPS5914081A (en) Device for recognizing on-line hand-writing character
JPH06208660A (en) On-line character recognizing device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080429

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee