KR20240006915A - Method for Decomposition of Phonemes Based on Number of Strokes - Google Patents

Method for Decomposition of Phonemes Based on Number of Strokes Download PDF

Info

Publication number
KR20240006915A
KR20240006915A KR1020220083778A KR20220083778A KR20240006915A KR 20240006915 A KR20240006915 A KR 20240006915A KR 1020220083778 A KR1020220083778 A KR 1020220083778A KR 20220083778 A KR20220083778 A KR 20220083778A KR 20240006915 A KR20240006915 A KR 20240006915A
Authority
KR
South Korea
Prior art keywords
phoneme
hangul
handwriting data
module
learner
Prior art date
Application number
KR1020220083778A
Other languages
Korean (ko)
Inventor
김대은
김우현
홍창기
Original Assignee
주식회사 에이치투케이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에이치투케이 filed Critical 주식회사 에이치투케이
Priority to KR1020220083778A priority Critical patent/KR20240006915A/en
Publication of KR20240006915A publication Critical patent/KR20240006915A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명의 일 목적은 한글 필기 데이터의 음소 분해를 효과적으로 수행하는 동시에 각 음소가 정확한 순서로 입력되었는지 여부를 판정하는 것에 있다.
이를 위해, 본 발명의 일 실시예에 따른 획수 기반 음소 분해 방법은, 학습자가 입력한 한글 필기 데이터에 대한 대응 한글 글자의 각 음소별 획수를 결정하는 단계 - 상기 한글 필기 데이터는 상기 학습자가 입력한 시계열적인 2차원 좌표 기반 데이터를 포함함 - 와, 각 음소별 획수에 기초하여, 상기 한글 필기 데이터의 어느 입력이 초성, 중성 및 종성 중 어느 하나에 해당하는지 여부를 판별하는 단계와, 상기 판별에 기초하여 상기 한글 필기 데이터의 음소를 분해하는 단계와, 상기 한글 필기 데이터의 각 음소별 획수 및 판별된 상기 한글 필기 데이터의 음소의 위치에 기초하여 상기 학습자가 한글 글자를 정해진 획순에 기초하여 입력하는지 여부를 판정하는 단계를 포함한다.
One purpose of the present invention is to effectively perform phoneme decomposition of Hangul handwriting data and at the same time determine whether each phoneme has been entered in the correct order.
To this end, the stroke number-based phoneme decomposition method according to an embodiment of the present invention includes the step of determining the number of strokes for each phoneme of the corresponding Hangul character for Hangul handwriting data input by the learner - the Hangul handwriting data is input by the learner. Contains time-series two-dimensional coordinate-based data - determining, based on the number of strokes for each phoneme, whether any input of the Hangul handwriting data corresponds to one of the initial consonants, middle consonants, and final consonants, and the determination A step of decomposing phonemes of the Hangul handwriting data based on the number of strokes for each phoneme of the Hangul handwriting data and the location of the determined phoneme of the Hangul handwriting data to determine whether the learner inputs Hangul letters based on a determined stroke order. It includes a step of determining whether or not.

Description

획수 기반 음소 분해 방법{Method for Decomposition of Phonemes Based on Number of Strokes}Method for Decomposition of Phonemes Based on Number of Strokes}

본 발명은 획수 기반 음소 분해 방법에 관한 것이며, 보다 구체적으로는, 한글 필기 데이터의 대응 한글 글자의 획수에 기초하여 한글 필기 데이터의 음소를 분해하기 위한 방법에 관한 것이다. The present invention relates to a method for decomposing phonemes based on the number of strokes, and more specifically, to a method for decomposing phonemes in Hangul handwriting data based on the number of strokes of corresponding Hangul letters in the Hangul handwriting data.

한글, 영어, 일어, 중국어 등 각종 언어들에 대한 교육열이 과열되면서, 최근의 학부모들은 빠르면 4세부터 한글, 영어 등 다양한 언어를 교육하기 시작하였다. 특히, 조기교육의 핵심인 한글의 경우, 한국교육과정평가원의 통계에 따르면, 입학 전 한글 교육 비율은 91.6%에 달하는 것으로 나타났다.As enthusiasm for education in various languages such as Korean, English, Japanese, and Chinese heats up, parents recently began teaching children in various languages, such as Korean and English, from as early as age 4. In particular, in the case of Hangul, which is the core of early education, according to statistics from the Korea Institute for Curriculum and Evaluation, the rate of Hangul education before entering school reached 91.6%.

기존의 한글 교육 방식은 학부모 또는 돌보미의 돌봄 시간에 한글 학습지 등의 자료를 이용하여 교육하는 방식이 대세를 이루었고, 점차 온라인 혹은 오프라인에서 스마트폰이나 태블릿 등의 애플리케이션을 통해 교육하는 방식으로 전환되고 있었다. 그러나, 이러한 한글 교육 방식은 유아의 한글 수준과 관련 없는 기설정된 커리큘럼에 따른 저가의 일방향 한글 교육 방식이거나 학습지 교사의 지도가 포함된 고가의 양방향 한글 교육 방식이었다.The existing method of teaching Korean using materials such as Korean workbooks during the care time of parents or caregivers became the mainstream, and was gradually transitioning to teaching online or offline through applications such as smartphones or tablets. . However, these Hangul education methods were either a low-cost, one-way Hangul education method based on a preset curriculum that was not related to the child's Hangul level, or an expensive, two-way Hangul education method that included guidance from a workbook teacher.

이러한 점 때문에 저가로 유아의 한글 교육을 수행하여야 하는 경우, 애플리케이션을 이용하여 한글 교육을 진행하더라도 난이도가 너무 높거나 너무 낮아 유아의 흥미를 유발하는 데에 어려움이 있었으며, 유아의 흥미 유발을 위해 학부모 또는 돌보미가 유아의 한글 교육에 많은 교육 시간을 할애하여야 하는 문제가 있었다. 또한, 학부모와 돌보미의 입장에서는, 시중에 판매되는 4,000개 이상의 한글 교육 학습지와 수많은 한글 교육 애플리케이션이라는 지나치게 많은 선택지 중에서 어떤 것이 가장 적절할지 선택해야 한다는 매우 어려운 문제가 있었다.For this reason, when it was necessary to provide children's Hangul education at a low cost, even if Hangul education was conducted using an application, it was difficult to arouse children's interest because the level of difficulty was too high or too low. Alternatively, there was a problem in which caregivers had to devote a lot of teaching time to children's Korean language education. Additionally, from the perspective of parents and caregivers, there was a very difficult problem of having to choose which one was most appropriate among the plethora of options, including more than 4,000 Hangul education worksheets and numerous Hangul education applications available on the market.

또한, 학습지 교사가 방문하여 지도하는 고가의 양방향 한글 교육 방식을 취하더라도, 학습지 교사는 일주일에 15분 교육하는 경우가 대부분이며, 나머지 시간에는 학부모가 직접 한글 교육을 책임져야 하는 문제가 있었다.In addition, even if an expensive two-way Hangul education method was used in which a workbook teacher visits and provides guidance, the workbook teacher usually only provides 15 minutes of education per week, and there was a problem in that parents had to take responsibility for Hangul education themselves for the remaining time.

본 발명의 일 목적은 한글 필기 데이터의 음소 분해를 효과적으로 수행하는 동시에 각 음소가 정확한 순서로 입력되었는지 여부를 판정하는 것에 있다. One purpose of the present invention is to effectively perform phoneme decomposition of Hangul handwriting data and at the same time determine whether each phoneme has been entered in the correct order.

다만, 본 발명이 해결하고자 하는 과제는 이상에서 언급한 바로 제한되지 않으며, 언급되지는 않았으나 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있는 목적을 포함할 수 있다.However, the problem to be solved by the present invention is not limited to the above-mentioned, and includes purposes that are not mentioned but can be clearly understood by those skilled in the art from the description below. can do.

이하 본 발명의 목적을 달성하기 위한 구체적 수단에 대하여 설명한다.Hereinafter, specific means for achieving the purpose of the present invention will be described.

본 발명의 일 실시예에 따른 획수 기반 음소 분해 방법은, 학습자가 입력한 한글 필기 데이터에 대한 대응 한글 글자의 각 음소별 획수를 결정하는 단계 - 상기 한글 필기 데이터는 상기 학습자가 입력한 시계열적인 2차원 좌표 기반 데이터를 포함함 - 와, 각 음소별 획수에 기초하여, 상기 한글 필기 데이터의 어느 입력이 초성, 중성 및 종성 중 어느 하나에 해당하는지 여부를 판별하는 단계와, 상기 판별에 기초하여 상기 한글 필기 데이터의 음소를 분해하는 단계와, 상기 한글 필기 데이터의 각 음소별 획수 및 판별된 상기 한글 필기 데이터의 음소의 위치에 기초하여 상기 학습자가 한글 글자를 정해진 획순에 기초하여 입력하는지 여부를 판정하는 단계를 포함한다. The stroke number-based phoneme decomposition method according to an embodiment of the present invention includes the step of determining the number of strokes for each phoneme of the corresponding Hangul character for Hangul handwriting data input by the learner - the Hangul handwriting data is a time-series 2 input by the learner. Containing dimensional coordinate-based data - determining, based on the number of strokes for each phoneme, whether any input of the Hangul handwriting data corresponds to any one of initial consonants, middle consonants, and final consonants; and based on the determination, Decomposing phonemes of the Hangul handwriting data, and determining whether the learner inputs Hangul letters based on a determined stroke order based on the number of strokes for each phoneme of the Hangul handwriting data and the determined location of the phoneme in the Hangul handwriting data. It includes steps to:

상기한 바와 같이, 본 발명에 의하면 이하와 같은 효과가 있다.As described above, according to the present invention, the following effects are achieved.

본 발명의 일 실시예에 따르면, 낮은 연산 리소스를 활용하는 것만으로도 효율적으로 한글 필기 데이터의 음소 분해를 수행할 수 있을 뿐만 아니라 각 음소가 정확한 순서로 입력되었는지까지 판정하여 만약 음소 입력 순서가 틀리다면 프로세스를 조기에 종료할 수 있으므로, 전체적인 획수 인식 장치의 효율성을 제고할 수 있는 효과가 발생한다. According to one embodiment of the present invention, not only can phoneme decomposition of Hangul handwriting data be efficiently performed just by utilizing low computational resources, but it is also determined whether each phoneme is input in the correct order, so that if the phoneme input order is incorrect, it is possible to efficiently decompose Korean handwriting data. Since the multifaceted process can be terminated early, the overall efficiency of the stroke recognition device can be improved.

다만, 본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.However, the effects that can be obtained from the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the description below. You will be able to.

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.
도 1은 본 발명의 일 실시예에 따른 유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 장치를 도시한 모식도이다.
도 2는 본 발명의 일 실시예에 따른 인공지능 기반의 필기 인식 모듈에 대한 예시적인 도면이다.
도 3은 본 발명의 일 실시예에 따른 획수 기반 음소 분해 모듈의 동작 원리를 설명하기 위한 예시적인 도면이다.
도 4는 본 발명의 다른 일 실시예에 따른 인공지능 기반 음소 분해 모듈의 동작 원리를 설명하기 위한 예시적인 도면이다.
도 5는 본 발명의 일 실시예에 따른 인공지능 기반의 획순 식별 모듈의 동작 원리를 설명하는 도면이다.
도 6은 본 발명의 일 실시예에 따라 음소 정보에 대해 수행되는 전처리를 예시적으로 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 획순 식별 모듈의 인공 신경망의 사전 학습 세션에 대해 개략적으로 설명하는 도면이다.
도 8은 본 발명의 일 실시예에 따른 유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 방법에 대한 흐름도이다.
The following drawings attached to this specification illustrate preferred embodiments of the present invention and serve to further understand the technical idea of the present invention along with the detailed description of the invention, so the present invention is limited only to the matters described in such drawings. It should not be interpreted as such.
Figure 1 is a schematic diagram showing an artificial intelligence-based stroke order recognition device for a young learner's Korean handwriting according to an embodiment of the present invention.
Figure 2 is an exemplary diagram of an artificial intelligence-based handwriting recognition module according to an embodiment of the present invention.
Figure 3 is an exemplary diagram for explaining the operating principle of the stroke number-based phoneme decomposition module according to an embodiment of the present invention.
Figure 4 is an exemplary diagram for explaining the operating principle of an artificial intelligence-based phoneme decomposition module according to another embodiment of the present invention.
Figure 5 is a diagram explaining the operating principle of an artificial intelligence-based stroke order identification module according to an embodiment of the present invention.
Figure 6 is a diagram illustrating preprocessing performed on phoneme information according to an embodiment of the present invention.
Figure 7 is a diagram schematically explaining a pre-learning session of the artificial neural network of the stroke order identification module according to an embodiment of the present invention.
Figure 8 is a flowchart of an artificial intelligence-based stroke order recognition method for an infant learner's Korean handwriting according to an embodiment of the present invention.

이하 첨부된 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명을 쉽게 실시할 수 있는 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 예에 한정되지 않는다. 또한, 본 발명의 바람직한 실시예에 대한 동작원리를 상세하게 설명함에 있어서 관련된 공지기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. Hereinafter, with reference to the attached drawings, an embodiment by which a person skilled in the art can easily carry out the present invention will be described in detail. However, the present invention may be implemented in many different forms and is not limited to the examples described herein. Additionally, in explaining in detail the operating principle of a preferred embodiment of the present invention, if a detailed description of a related known function or configuration is judged to unnecessarily obscure the gist of the present invention, the detailed description will be omitted.

또한, 도면 전체에 걸쳐 유사한 기능 및 작용을 하는 부분에 대해서는 동일한 도면 부호를 사용한다. 명세서 전체에서, 특정 부분이 다른 부분과 연결되어 있거나 위/아래에 있다고 할 때, 이는 직접적으로 연결되어 있거나, 위/아래에 있는 경우뿐만 아니라, 그 중간에 다른 구성요소를 사이에 두고, 간접적으로 연결되거나 위/아래에 있는 경우도 포함한다. In addition, the same reference numerals are used for parts that perform similar functions and actions throughout the drawings. Throughout the specification, when a specific part is said to be connected to or above/below another part, this means not only directly connected or above/below, but also indirectly through other components in between. Also includes cases where it is connected or above/below.

나아가, 명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.Furthermore, when it is said that a part "includes" a certain element throughout the specification, this does not mean excluding other elements, but may further include other elements, unless specifically stated to the contrary.

"제1", "제2" 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이러한 구성요소들은 해당 용어들에 의해 한정되어서는 안 된다. 즉, 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. "및/또는" 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.Terms such as “first” and “second” may be used to describe various components, but these components should not be limited by these terms. That is, terms are used only for the purpose of distinguishing one component from another. For example, a first component may be named a second component, and similarly, the second component may also be named a first component without departing from the scope of the present invention. The term “and/or” includes any of a plurality of related stated items or a combination of a plurality of related stated items.

또한, 달리 구체적으로 명시하지 않는 한, "단수"의 표현은 본 명세서에서 하나 이상의 개체를 포함하는 것으로 사용된다. 마지막으로, 본 명세서에서 사용된 바와 같이, "또는"은 달리 구체적으로 명시하지 않는 한, 비-배타적인 "또는"을 의미한다. Additionally, unless specifically stated otherwise, the expression “singular” is used herein to include one or more entities. Finally, as used herein, “or” means “or” non-exclusively, unless specifically stated otherwise.

또한, 본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.In addition, the terms used in the present invention are general terms that are currently widely used as much as possible while considering the functions in the present invention, but this may vary depending on the intention or precedent of a person working in the art, the emergence of new technology, etc. In addition, in certain cases, there are terms arbitrarily selected by the applicant, and in this case, the meaning will be described in detail in the description of the relevant invention. Therefore, the terms used in the present invention should be defined based on the meaning of the term and the overall content of the present invention, rather than simply the name of the term.

이하 발명의 설명에서, 한글은 낱소리(음소) 문자로서 자음(닿소리)과 모음(홑소리)으로 구성되며, 음절(소리마디)은 첫소리(초성), 가운뎃소리(중성), 끝소리(종성)의 낱소리(음소) 세 벌로 이루어지는데, 첫소리(초성)와 끝소리(종성)에는 닿소리(자음)를 쓰고 가운뎃소리(중성)에는 홀소리(모음)를 쓴다.In the description of the invention below, Hangul is a single sound (phoneme) character composed of consonants (taeksho) and vowels (singles), and syllables (sounds) are composed of an initial sound (initial sound), a middle sound (medial sound), and a final sound (final sound). It consists of three sets of single sounds (phonemes), with consonant sounds (consonants) used for the first sound (initial consonant) and final sounds (final consonants), and single sounds (vowels) used for the middle sound (neutral voice).

현대 한글에서 단음을 내는 닿소리(자음)에는 ㄱ,ㄴ,ㄷ,ㄹ,ㅁ 등 14자가 있고, 홑소리(모음)에는 ㅏ,ㅑ, ㅓ, ㅕ 등 10자가 있다. 복음을 내는 겹닿소리(쌍자음)에는 ㄲ, ㄸ, ㅃ, ㅆ, ㅉ 의 5자가 있고, 겹홑소리(쌍모음)에는 ㅐ, ㅒ, ㅔ, ㅖ 등 11자가 있다. 또한, 현대 한글에서 끝소리(종성)가 있을 때 활용되는 받침은 홑받침 또는 곁받침이 있고, 홑받침에는 모든 닿소리(자음)가 쓰이며, 곁받침에는 ㄲ,ㅆ,ㄳ,ㄵ 등 13자가 있다. In modern Hangul, there are 14 consonants that make single sounds, including ㄱ, ㄴ, ㄷ, ㄹ, and ㅁ, and single sounds (vowels) include 10 characters, including ㅏ, ㅑ, ㅓ, and ㅕ. There are five double consonants (double consonants) that make gospel sounds, including ㄲ, ㄸ, ㅃ, ㅆ, and ㅉ, and double single sounds (double vowels) include 11 letters, including ㅐ, ㅒ, ㅔ, and ㅖ. In addition, in modern Hangul, the consonants used when there is a final sound (jongson) are single consonants or side consonants. All consonants (consonants) are used in single consonants, and there are 13 consonants including ㄲ, ㅆ, ㄳ, and ㄵ.

현대 한글은 낱자를 엮어 11,172(첫소리 19 × 가운뎃소리 21 × (끝소리 27 + 끝소리 없음 1))글자 마디를 쓸 수 있다. 11,172자 중 399자는 무받침 글자이며 10,773자는 받침 글자이다.Modern Hangul is able to write 11,172 letters (19 initial sounds × 21 middle sounds × (27 final sounds + 1 no final sound)) by stringing together letters. Of the 11,172 characters, 399 are non-consonant letters and 10,773 are consonant letters.

어문 규정에 의하여, 현대 한국어 표준어에서 실제 사용하는 음절은 이보다 적다. 한국어의 소리는 첫소리+가운뎃소리(+끝소리)로 이루어지는데, 표준어에서 첫소리에는 19가지 닿소리가 모두 쓰이되 첫소리에 놓인 ㅇ은 소리 나지 않는다. 끝소리는 7종성법에 따라 7갈래로 모이며 끝소리가 없는 것까지 더하여 모두 8갈래이므로 현대 한국어의 발음은 첫소리 19 × 가운뎃소리 21 × 끝소리 8 = 3,192가지 소리가 된다. 표준 발음법을 따르면 구개음 ㅈ, ㅉ, ㅊ 뒤의 이중 모음 ㅑ, ㅒ, ㅕ, ㅖ, ㅛ, ㅠ는 단모음 ㅏ, ㅐ, ㅓ, ㅔ, ㅗ, ㅜ로 소리나므로 첫소리 3 × 가운뎃소리 6 × 끝소리 8 = 144소리가 빠지고, 아울러 소리나는 첫소리 (ㅇ이 아닌 첫소리 뒤에 오는)를 얹은 가운뎃소리 [ㅢ]는 ㄴ을 제외하면(ㄴ의 경우는 구개음화에 따른 다른 음소로 인정하고 있다.) [ㅣ]로 소리나므로(한글 맞춤법 제9항 및 표준 발음법 제5항 단서 3) 첫소리 17 × 가운뎃소리 1 × 끝소리 8 = 136 소리가 다시 빠진다. 따라서, 현재 한국어 표준어에서 실제 사용하는 소리마디는 3192 - 144 - 136 = 2,912가지가 된다.Due to grammar regulations, there are fewer syllables actually used in modern Korean standard language. The sounds of Korean are made up of the first sound + the middle sound (+ the final sound). In standard language, all 19 consonants are used for the first sound, but the ㅇ placed at the first sound is not made. The final sounds are grouped into 7 types according to the hexaphonological law, and there are a total of 8, including those without final sounds, so the pronunciation of modern Korean is 19 initial sounds × 21 middle sounds × 8 final sounds = 3,192 sounds. According to the standard pronunciation method, the double vowels ㅑ, ㅒ, ㅕ, ㅖ, ㅛ, ㅠ after the palatal sounds ㅈ, ㅉ, ㅊ are sounded as the single vowels ㅏ, ㅐ, ㅓ, ㅔ, ㅗ, ㅜ, so the initial sound is 3 × the middle sound is 6 × the final sound. 8 = 144 sounds are omitted, and the middle sound [ㅢ] with the initial sound (following the initial sound, not ㅇ) is excluded, except for ㄴ (in the case of ㄴ, it is recognized as a different phoneme according to palatalization) [ㅣ] (Korean orthography Article 9 and Standard Pronunciation Article 5 Proviso 3) 17 initial sounds × 1 middle sound × 8 final sounds = 136 sounds are missing again. Therefore, the number of sound nodes actually used in the current standard Korean language is 3192 - 144 - 136 = 2,912.

인공지능 기반의 획순 인식 장치의 개요Overview of artificial intelligence-based stroke order recognition device

도 1은 본 발명의 일 실시예에 따른 유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 장치를 도시한 모식도이다. 도 1을 참조하면, 본 발명의 일 실시예에 따른 유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 장치(l00)는, 필기 인식 모듈(1), 음소 분해 모듈(2), 및 획순 식별 모듈(3)을 포함할 수 있다. Figure 1 is a schematic diagram showing an artificial intelligence-based stroke order recognition device for a young learner's Korean handwriting according to an embodiment of the present invention. Referring to Figure 1, the artificial intelligence-based stroke order recognition device (l00) for the Korean language handwriting of an infant learner according to an embodiment of the present invention includes a handwriting recognition module (1), a phoneme decomposition module (2), and a stroke order identification. It may include module (3).

본 발명의 일 실시예에 따르면, 유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 장치(100)의 필기 인식 모듈(1)은 학습자 클라이언트(4)의 애플리케이션 모듈(5)로부터 학습자가 입력한 한글 필기 데이터를 수신할 수 있다. 학습자의 한글 필기 데이터는 시계열적인 2차원 좌표 기반 필기체 데이터로서, 예를 들어, 한글 필기 데이터는 학습자의 터치 입력의 2차원 좌표를 시간 순서대로 기록한 데이터일 수 있다. 이러한 한글 필기 데이터는 학습 클라이언트(4)의 터치 스크린을 통한 학습자의 손가락 또는 스타일러스의 터치에 의해 입력되거나 마우스 등 다른 방식을 통해 입력될 수 있으며, 그 입력 방식에 대해 제한하지는 않는다.According to one embodiment of the present invention, the handwriting recognition module 1 of the artificial intelligence-based stroke order recognition device 100 for the Korean language handwriting of an infant learner is configured to recognize the input by the learner from the application module 5 of the learner client 4. You can receive Hangul handwriting data. The learner's Hangul handwriting data is time-series two-dimensional coordinate-based handwriting data. For example, the Hangul handwriting data may be data that records the two-dimensional coordinates of the learner's touch input in time order. Such Hangul handwriting data may be input by touching the learner's finger or stylus through the touch screen of the learning client 4, or through other methods such as a mouse, and there is no limitation on the input method.

일 실시예예 따르면, 필기 인식 모듈(1)은 인공 신경망 모듈을 이용한 딥 러닝을 통해 한글 필기 데이터가 어떠한 글자에 해당하는지를 글자 인식할 수 있다. 필기 인식 모듈(1)에 사용되는 인공 신경망 모듈은 예를 들어, CNN(Convolution Neural Network) 기반 인공 신경망으로, GoogLenet 신경망, Lenet 신경망 등을 이용한 것일 수 있다. 필기 인식 모듈(1)의 구체적인 구성에 대해서는 자세히 후술하도록 한다. According to one embodiment, the handwriting recognition module 1 can recognize which letter the Korean handwriting data corresponds to through deep learning using an artificial neural network module. The artificial neural network module used in the handwriting recognition module 1 may be, for example, a CNN (Convolution Neural Network)-based artificial neural network using a GoogLenet neural network, a Lenet neural network, or the like. The specific configuration of the handwriting recognition module 1 will be described in detail later.

일 실시예에 따르면, 음소 분해 모듈(2)은 인공 신경망 모듈을 이용한 딥 러닝을 통해, 필기 인식 모듈(1)을 통해 글자 인식된 한글 필기 데이터가 나타내는 글자의 각 음소, 예를 들어, 초성, 중성 및 종성을 분해할 수 있다. 음소 분해 모듈(2)에 포함되는 인공 신경망 모듈은 예를 들어, YOLO, DPM, R-CNN 등일 수 있으며, 이에 대해서도 자세히 후술하도록 한다. According to one embodiment, the phoneme decomposition module 2 uses deep learning using an artificial neural network module to identify each phoneme of the letter represented by the Korean handwriting data recognized through the handwriting recognition module 1, for example, initial consonant, Neutral and final consonants can be decomposed. The artificial neural network module included in the phoneme decomposition module 2 may be, for example, YOLO, DPM, R-CNN, etc., which will be described in detail later.

또한, 다른 일 실시예에 따르면, 음소 분해 모듈(2)은 필기 인식 모듈(1)을 통해 글자 인식된 한글 필기 데이터가 나타내는 글자가 무엇인지에 기반하여, 획수에 기초하여 한글 필기 데이터 내 어떤 입력이 초성인지, 중성인지 또는 종성인지 여부를 판별함으로써 음소를 분해할 수도 있다. 예를 들어, "램"이라는 글자를 쓰는 경우, "ㄹ"은 3획, "ㅐ"은 3획, "ㅁ"은 3획의 총 9획으로 필기하도록 구성되어 있으므로, "램"이라는 한글 필기의 첫 3획은 초성, 그 다음 3획은 중성, 그리고 마지막 3획은 종성에 해당한다는 점에 착안하여 음소를 분해할 수도 있다. In addition, according to another embodiment, the phoneme decomposition module 2 determines what input in the Hangul handwriting data is based on the number of strokes, based on what letter the Hangul handwriting data recognized through the handwriting recognition module 1 represents. Phonemes can also be decomposed by determining whether they are initial, medial, or final consonants. For example, when writing the letter “Ram,” “ㄹ” is written with 3 strokes, “ㅐ” with 3 strokes, and “ㅁ” with 3 strokes, so it is written with a total of 9 strokes, so the Korean writing “Ram” The phoneme can be decomposed by considering that the first three strokes correspond to the initial consonant, the next three strokes correspond to the middle consonant, and the last three strokes correspond to the final consonant.

일 실시예에 따르면, 획순 식별 모듈(3)은 인공 신경망 모듈에 분해된 음소에 대응하는 시계열적인 2차원 좌표 기반 필기체 데이터베이스를 입력하여 해당 음소의 각 획이 정해진 순서로 입력되었는지 여부를 판별하는 획순 인식 정보를 출력할 수 있다. 여기서, 음소의 2차원 좌표 필기체 데이터베이스는 입력된 한글 필기 데이터의 형태에 대한 정보 뿐만 아니라 좌표를 순차적으로 표현한 정보를 포함할 수 있다. 획순 식별 모듈(3)에 사용되는 인공 신경망 모듈은 예를 들어 LSTM(Long Short Term Memory), RNN(Recurrent Neural Network) 등일 수 있으며, 이에 대해서도 자세히 후술하도록 한다. According to one embodiment, the stroke order identification module 3 inputs a time-series, two-dimensional coordinate-based cursive database corresponding to the decomposed phoneme into the artificial neural network module, and determines whether each stroke of the corresponding phoneme is input in a certain order. Recognition information can be output. Here, the two-dimensional coordinate cursive database of phonemes may include information about the form of the input Hangul handwriting data as well as information sequentially expressing the coordinates. The artificial neural network module used in the stroke order identification module 3 may be, for example, Long Short Term Memory (LSTM), Recurrent Neural Network (RNN), etc., which will be described in detail later.

또한, 일 실시예에 따르면, 획순 식별 모듈(3)은 출력된 획순 인식 정보에 기초하여 학습자 클라이언트(4)의 애플리케이션 모듈(5)에 피드백을 전송할 수 있다. 이러한 피드백은 학습자에게 잘못된 획순에 대한 정보(예를 들어, 학습자가 입력한 한글 필기의 몇번째 획이 틀렸는지)를 학습자에게 알리기 위한 것일 수 있으며, 정보의 구체적인 예에 대해서 한정하지는 않는다.Additionally, according to one embodiment, the stroke order identification module 3 may transmit feedback to the application module 5 of the learner client 4 based on the output stroke order recognition information. This feedback may be intended to inform the learner of information about the incorrect stroke order (for example, which stroke number of the Korean handwriting entered by the learner was incorrect), and is not limited to specific examples of the information.

본 발명의 일 실시예에 따른 유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 장치(100)는 특정 웹서버, 클라우드 서버와 같은 가상 서버, 스마트폰, 태블릿 PC, 데스크탑 PC 등의 컴퓨팅 장치의 처리모듈에 의해 처리되고, 각 컴퓨팅 장치의 메모리 모듈에 저장되도록 구성될 수 있다. 다만, 이러한 장치(100)가 둘 이상의 컴퓨팅 디바이스의 처리모듈에 의해 분산 처리되고, 둘 이상의 컴퓨팅 디바이스의 메모리 모듈에 분산되어 저장될 수도 있으며, 이러한 점은 유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 장치(100)의 구체적인 구현 방법에 따라 다양하게 설계될 수 있다.The artificial intelligence-based stroke order recognition device 100 for an early childhood learner's Hangul handwriting according to an embodiment of the present invention is a specific web server, a virtual server such as a cloud server, a computing device such as a smartphone, a tablet PC, or a desktop PC. It may be configured to be processed by a processing module and stored in a memory module of each computing device. However, this device 100 may be distributedly processed by the processing modules of two or more computing devices and distributedly stored in the memory modules of two or more computing devices, and this is due to the fact that the artificial intelligence-based The stroke order recognition device 100 may be designed in various ways depending on the specific implementation method.

본 발명의 일 실시예에 따르면, 유아 학습자가 한글 필기를 적절한 형태로 작성하였는지에 대해 판별할 뿐만 아니라, 한글 필기의 획순이 올바른 순서로 입력되었는지도 파악할 수 있으므로, 유아 학습자의 쓰기 교육을 보다 체계적으로 수행할 수 있는 효과가 발생한다. According to one embodiment of the present invention, it is possible to not only determine whether the early childhood learner wrote the Hangul handwriting in an appropriate form, but also determine whether the stroke order of the Hangul handwriting was entered in the correct order, thereby improving the writing education of the early childhood learner more systematically. There are effects that can be performed.

다만, 본 명세서에서는 학습자의 한글 필기 데이터, 즉, 한글 입력을 중심으로 설명하였지만, 동일하거나 유사한 원리가 영어, 중국어, 일본어, 불어 등과 같은 다른 언어에도 적용될 수 있다는 점을 본 기술 분야의 통상의 지식을 갖춘 자라면 용이하게 이해할 수 있을 것이다.However, in this specification, the explanation is focused on the learner's Hangul handwriting data, that is, Hangul input, but it is common knowledge in the field of technology that the same or similar principles can be applied to other languages such as English, Chinese, Japanese, French, etc. Anyone equipped with this will be able to understand it easily.

인공지능 기반의 필기 인식 모듈Artificial intelligence-based handwriting recognition module

도 2는 본 발명의 일 실시예에 따른 인공지능 기반의 필기 인식 모듈에 대한 예시적인 도면이다. Figure 2 is an exemplary diagram of an artificial intelligence-based handwriting recognition module according to an embodiment of the present invention.

도 2를 참조하면, 인공지능 기반의 필기 인식 모듈(1)은 학습자의 한글 필기 데이터를 입력 받아, 한글 필기 데이터에 대응하는 한글 글자를 인식하고 출력할 수 있다. 도 2의 예에서는 "냇"이라는 한글 글자가 포함된 2차원 이미지(즉, 한글 필기 데이터)가 필기 인식 모듈(1)에 입력되게 되고, 그 출력으로서 한글 글자 "냇"을 필기 인식 모듈(1)이 글자 인식하여 출력하게 된다. Referring to Figure 2, the artificial intelligence-based handwriting recognition module 1 can receive the learner's Hangul handwriting data as input, recognize and output Hangul letters corresponding to the Hangul handwriting data. In the example of Figure 2, a two-dimensional image (i.e., Korean handwriting data) containing the Korean character "Nat" is input to the handwriting recognition module (1), and the Korean character "Nat" is input as an output to the handwriting recognition module (1). ) is recognized and printed.

도 2를 참조하여 인공지능 기반의 필기 인식 모듈(1)의 구조 및 동작 원리에 대해 설명하도록 한다. 필기 인식 모듈(1)은 정규화 모듈, 인코딩 모듈, 복수의 inception 모듈, 풀링 및 FC(Fully Connected) 레이어를 포함할 수 있다. The structure and operating principle of the artificial intelligence-based handwriting recognition module 1 will be described with reference to FIG. 2. The handwriting recognition module 1 may include a normalization module, an encoding module, a plurality of inception modules, pooling, and a fully connected (FC) layer.

먼저, 유아 학습자의 한글 필기 데이터(예를 들어, 한글 필기의 2차원 이미지)의 그리드 크기를 정규화 모듈을 통해 정규화(normalize)할 수 있다. 예를 들어, 정규화 모듈은 상이한 그리드 크기를 갖는 한글 필기 데이터를 60×60의 그리드 크기의 데이터로 변환할 수 있는데, 이를 위해 선형 보간법과 같은 이미지 전처리 기술을 사용할 수 있다. First, the grid size of the early childhood learner's Hangul handwriting data (for example, a two-dimensional image of Hangul handwriting) can be normalized through a normalization module. For example, the normalization module can convert Hangul handwriting data with different grid sizes into data with a grid size of 60×60, and for this purpose, image preprocessing techniques such as linear interpolation can be used.

정규화된 한글 필기 데이터는, 컨볼루션 레이어(convolution), Pooling 레이어 (max_pool), 활성화 레이어(ReLU), BN(batch_normalization) 레이어를 포함하는 인코딩 모듈에 입력될 수 있다. 그리고 이들 레이어로부터 특징 추출을 수행하여 인코딩된 한글 필기 데이터가 인코딩 모듈로부터 출력될 수 있다. Normalized Hangul handwriting data can be input to an encoding module that includes a convolution layer (convolution), a pooling layer (max_pool), an activation layer (ReLU), and a BN (batch_normalization) layer. And by performing feature extraction from these layers, the encoded Hangul handwriting data can be output from the encoding module.

그 다음, 인코딩된 한글 필기 데이터가 복수의 inception 모듈에 입력될 수 있다. 이때, 복수의 inception 모듈은 기본적으로 같은 채널을 유지하며, 이 중에서 적어도 하나의 inception 모듈은 기본 inception 모듈에 대해 Factorization을 하여 연산량을 줄인 개선된 inception 모듈일 수 있다. 일 예에 따르면, inception 모듈의 연산을 통해 7×7 그리드의 512개의 채널이 만들어질 수 있으며 7×7의 데이터의 평균을 구한 뒤 FC 레이어를 통해 분류할 수 있도록 1×1×512의 노드로 변형할 수 있다. Next, the encoded Hangul handwriting data can be input into a plurality of inception modules. At this time, a plurality of inception modules basically maintain the same channel, and among them, at least one inception module may be an improved inception module that reduces the amount of computation by factorizing the basic inception module. According to one example, 512 channels in a 7×7 grid can be created through the operation of the inception module, and the 7×7 data is averaged and then divided into 1×1×512 nodes for classification through the FC layer. It can be transformed.

마지막으로, FC 레이어를 통해 한글 필기 데이터의 분류를 수행하여 유아 학습자기 입력한 한글 필기 데이터가 어떤 한글 글자에 대응하는지를 결정할 수 있다. Finally, classification of Hangul handwriting data can be performed through the FC layer to determine which Hangul character the Hangul handwriting data entered by the infant learner corresponds to.

이러한 인공지능 기반의 필기 인식 모듈(1)의 사전 학습 세션에서 MSE(Mean Square Error)를 사용하는 경우 오차 함수는 가 될 수 있으며, 이 때 X는 모델을 통한 예측 값, Y는 실제 정답이다. MSE는 예측 값과 실제 값의 L2 distance를 오류 값으로 사용한다. When using MSE (Mean Square Error) in the pre-training session of this artificial intelligence-based handwriting recognition module (1), the error function is It can be , where X is the predicted value through the model and Y is the actual correct answer. MSE uses the L2 distance between the predicted value and the actual value as the error value.

다른 예로써는, CE(Cross Entropy)를 사용하며 의 오차 함수를 사용할 수도 있다. 여기서 X는 모델을 통한 예측 값이고, Y는 실제 정답이며 log(X)가 무한대로 발산하는 것을 막기 위해 ε라는 아주 작은 값을 더해줄 수 있다. As another example, CE (Cross Entropy) is used. You can also use the error function of Here, X is the predicted value through the model, Y is the actual answer, and a very small value called ε can be added to prevent log(

다만, 전술한 것과 같은 필기 인식 모듈(1)은 예시적인 것일 뿐이고, 다양한 인공 신경망 모듈이나 다른 모듈들이 사용될 수 있으며, 이에 대해 제한하지는 않는다. However, the handwriting recognition module 1 as described above is only an example, and various artificial neural network modules or other modules may be used, but there is no limitation thereto.

획순 기반 음소 분해 모듈Stroke order-based phoneme decomposition module

도 3은 본 발명의 일 실시예에 따른 획수 기반 음소 분해 모듈의 동작 원리를 설명하기 위한 예시적인 도면이다. Figure 3 is an exemplary diagram for explaining the operating principle of the stroke number-based phoneme decomposition module according to an embodiment of the present invention.

도 3을 참조하면, 일 실시예에 따르면, 음소 분해 모듈(2)은 유아 학습자가 입력한 한글 필기 데이터 및 필기 인식 모듈(1)을 통해 판별된 한글 필기 데이터의 대응 한글 글자에 기초하여, 획수에 기반하여 한글 필기 데이터 내 어떤 입력이 초성인지, 중성인지 또는 종성인지 여부를 판별함으로써 음소를 분해하여 음소 정보를 생성하여 출력할 수 있다. Referring to FIG. 3, according to one embodiment, the phoneme decomposition module 2 determines the number of strokes based on the Hangul handwriting data input by the infant learner and the corresponding Hangul characters of the Hangul handwriting data determined through the handwriting recognition module 1. Based on this, phoneme information can be generated and output by decomposing phonemes by determining whether any input in the Hangul handwriting data is an initial, medial, or final consonant.

예를 들어, "램"이라는 글자를 쓰는 경우, "ㄹ"은 3획, "ㅐ"은 3획, "ㅁ"은 3획의 총 9획으로 필기하도록 구성되어 있으므로, "램"이라는 한글 필기의 첫 3획은 초성, 그 다음 3획은 중성, 그리고 마지막 3획은 종성에 해당한다는 점에 착안하여 음소를 분해하여, (초성, 중성) 또는 (초성, 중성 및 종성)에 해당하는 음소 정보를 출력할 수 있다. For example, when writing the letter “Ram,” “ㄹ” is written with 3 strokes, “ㅐ” with 3 strokes, and “ㅁ” with 3 strokes, so it is written with a total of 9 strokes, so the Korean writing “Ram” Considering that the first 3 strokes correspond to the initial consonant, the next 3 strokes correspond to the middle consonant, and the last 3 strokes correspond to the final consonant, the phoneme is decomposed into phoneme information corresponding to (initial consonant, middle consonant) or (initial consonant, middle consonant, and final consonant). can be output.

비제한적인 일 예로써, 음소 분해 모듈(2)은 글자의 음소를 분해하는 경우, 한글 필기 데이터 중에서 획순에 기반하여 구분한 각 음소의 필기 데이터의 좌표 중 가장 상측, 좌측, 우측 및 하측에 있는 좌표(또는 가장 상측, 좌측, 우측 및 하측에 있는 좌표 보다 소정의 픽셀을 더 여유를 둔 좌표)에 기초하여 각 음소에 대한 바운딩 박스(41, 42, 43)를 생성하고, 각 바운딩 박스 내 데이터를 음소 정보로 출력할 수 있다. As a non-limiting example, when the phoneme decomposition module 2 decomposes the phonemes of a letter, the coordinates of the handwriting data of each phoneme classified based on the stroke order among the Hangul handwriting data are located at the top, left, right, and bottom. Bounding boxes 41, 42, and 43 for each phoneme are created based on the coordinates (or coordinates with a predetermined pixel margin more than the coordinates at the top, left, right, and bottom), and the data within each bounding box is generated. can be output as phoneme information.

한편, 이와 같은 획수 기반 음소 분해 모듈(2)의 음소 분해 메커니즘은 유아 학습자가 한글 글자를 정해진 획순에 기초하여 정확히 입력하였다는 것을 전제로 한다. 그러나, 예를 들어, 한글 글자에 대한 한글 필기 데이터에서 획수가 정해진 획수와 다른 경우(일례로 "램"이라는 글자의 획수가 9개가 아니라 10개로 입력된 경우), 또는 유아 학습자가 한글 필기 데이터의 각 음소를 초성, 중성, 종성 순으로 입력하지 않고 다른 순서로 입력한 경우 등이 발생할 수 있다. 이처럼 유아 학습자가 한글 글자를 정해진 음소 입력 순서에 기초하여 입력하지 않은 경우, 획수 기반 음소 분해 모듈은 한글 필기 데이터의 음소 분해에 실패하거나 에러가 발생할 수 있다. Meanwhile, the phoneme decomposition mechanism of the stroke number-based phoneme decomposition module (2) is premised on the fact that the early childhood learner has accurately entered Hangul letters based on the designated stroke order. However, for example, in the case where the number of strokes in the Hangul handwriting data for Hangul letters is different from the designated number of strokes (for example, the number of strokes for the letter “Ram” was entered as 10 instead of 9), or when an infant learner uses the Korean handwriting data This may occur when each phoneme is entered in a different order than the initial, middle, and final consonants. In this way, if the early childhood learner does not input Hangul letters based on the designated phoneme input order, the stroke number-based phoneme decomposition module may fail to decompose the phonemes of Hangul handwriting data or an error may occur.

따라서, 획수 기반 음소 분해 모듈(2)은 각 음소의 입력 순서가 정해진 순서에 부합하는지를 식별하는 과정을 거칠 수 있다. 구체적으로는, 한글 글자의 초성은 주로 왼쪽 상단이나 중간에 위치하고, 중성은 가로 길이의 중간 또는 우측이나 세로 길이의 중간 또는 아래 위치에 위치하며, 종성은 하단부에 위치하는 경우가 대부분이다. 따라서, 이러한 점에 착안하여, 획수 기반 음소 분해 모듈(2)은 한글 필기 데이터의 좌표의 시계열 데이터를 통해 초성, 중성, 종성의 정해진 위치에 부합되지 않는 위치에 데이터 입력이 이루어지는 경우를 식별하는 과정을 추가적으로 진행할 수 있다. 비제한적인 일 예로써, 한글 필기 데이터의 특정 음소의 좌표 데이터를 수신하고, 수신한 좌표 데이터가 해당 음소의 정해진 위치의 좌표 데이터와 어느 정도 정합되는지 여부를 수치화하고, 수치화된 정합도가 임계치 미만인 경우 해당 음소가 정해진 순서로 입력되지 않았다고 판단할 수 있다. 획수 기반 음소 분해 모듈(2)은 이러한 과정을 통해 한글 필기 데이터의 각 음소가 정해진 순서로 입력되었는지 여부를 판정할 수 있다. Accordingly, the stroke number-based phoneme decomposition module 2 may go through a process of identifying whether the input order of each phoneme conforms to the specified order. Specifically, the initial consonant of Hangul letters is usually located at the top or middle of the left, the middle consonant is located at the middle or right of the horizontal length, or the middle or bottom of the vertical length, and the final consonant is usually located at the bottom. Therefore, with this in mind, the stroke-based phoneme decomposition module (2) is a process of identifying cases where data is input at positions that do not correspond to the designated positions of the initial, middle, and final consonants through time series data of the coordinates of Hangul handwriting data. can proceed additionally. As a non-limiting example, coordinate data of a specific phoneme of Hangul handwriting data is received, the degree to which the received coordinate data matches the coordinate data of a given location of the phoneme is quantified, and the quantified degree of match is less than a threshold. In this case, it may be determined that the phoneme in question was not entered in a given order. Through this process, the stroke number-based phoneme decomposition module 2 can determine whether each phoneme of the Korean handwriting data has been entered in a given order.

그리고 판정 결과, 한글 필기 데이터의 각 음소가 정해진 순서로 입력되지 않아 획수에 기반한 음소 분해에 실패하거나 에러가 발생하는 경우, 획수 기반 음소 분해 모듈(2)은 학습자 애플리케이션(4)의 애플리케이션 모듈(5)에 학습자가 입력한 한글 필기 데이터의 획순 입력이 잘못되었음을 알리는 메시지가 출력되도록 할 수 있다. 또한, 이 경우, 획순 식별 모듈(3)로 음소 정보가 전송되지 않고 그대로 프로세스가 종료될 수 있다. And, as a result of the determination, if phoneme decomposition based on stroke number fails or an error occurs because each phoneme of the Korean handwriting data is not entered in the specified order, the stroke number-based phoneme decomposition module (2) is used in the application module (5) of the learner application (4). ), a message notifying that the stroke order of the Hangul handwriting data entered by the learner is incorrect can be output. Additionally, in this case, the process may be terminated without phoneme information being transmitted to the stroke order identification module 3.

이러한 획수 기반 음소 분해 모듈을 통해, 낮은 연산 리소스를 활용하는 것만으로도 효율적으로 한글 필기 데이터의 음소 분해를 수행할 수 있을 뿐만 아니라 각 음소가 정확한 순서로 입력되었는지까지 판정하여 만약 음소 입력 순서가 틀리다면 프로세스를 조기에 종료할 수 있으므로, 전체적인 획수 인식 장치의 효율성을 제고할 수 있는 효과가 발생한다. Through this stroke-based phoneme decomposition module, not only can phoneme decomposition of Hangul handwriting data be performed efficiently just by utilizing low computational resources, but it is also possible to determine whether each phoneme has been entered in the correct order, so if the phoneme input order is incorrect, Since the multifaceted process can be terminated early, the overall efficiency of the stroke recognition device can be improved.

인공지능 기반 음소 분해 모듈Artificial intelligence-based phoneme decomposition module

도 4는 본 발명의 다른 일 실시예에 따른 인공지능 기반 음소 분해 모듈의 동작 원리를 설명하기 위한 예시적인 도면이다. Figure 4 is an exemplary diagram for explaining the operating principle of an artificial intelligence-based phoneme decomposition module according to another embodiment of the present invention.

도 4를 참조하면, 일 실시예에 따르면, 인공지능 기반의 음소 분해 모듈(2)은 인공 신경망 모듈을 이용한 딥 러닝을 통해, 필기 인식 모듈(1)을 통해 인식된 한글 필기 데이터가 나타내는 한글 글자의 각 음소, 예를 들어, 초성, 중성 및 종성을 분해하는 작용을 할 수 있다. Referring to FIG. 4, according to one embodiment, the artificial intelligence-based phoneme decomposition module 2 uses deep learning using an artificial neural network module to identify Hangul characters represented by Hangul handwriting data recognized through the handwriting recognition module 1. It can act to decompose each phoneme, for example, initial consonant, middle consonant, and final consonant.

이와 같은 인공지능 기반 음소 분해 모듈(2)에 포함되는 인공 신경망 모듈은 예를 들어, YOLO, DPM, R-CNN 중 적어도 하나일 수 있다. 비제한적인 일 예에 따르면, 인공지능 기반 음소 분해 모듈(2)은 인공 신경망 모듈로서 YOLO를 사용할 수 있는데, YOLO의 객체 탐지(object detection) 또는 이미지 세그멘테이션(segmentation) 시스템은 R-CNN과는 달리 Convolution(합성곱) 신경망을 단 한 번 통과시키기 때문에 속도가 빨라서 실시간 객체 탐지가 가능하다는 장점을 가진다. The artificial neural network module included in this artificial intelligence-based phoneme decomposition module 2 may be, for example, at least one of YOLO, DPM, and R-CNN. According to a non-limiting example, the artificial intelligence-based phoneme decomposition module 2 may use YOLO as an artificial neural network module, where YOLO's object detection or image segmentation system is different from R-CNN. Since it passes through the convolution neural network only once, it has the advantage of being fast and enabling real-time object detection.

이러한 인공지능 기반 음소 분해 모듈(2)은 글자 인식된 한글 필기 데이터를 입력받아 그 출력으로서 음소 정보를 출력할 수 있다. 출력되는 음소 정보는 각 음소의 바운딩 박스(41, 42, 43) 내 데이터로서, 학습자의 한글 필기 데이터의 입력 순서에 따른 시계열적인 2차원 좌표 기반 데이터를 포함할 수 있다. 이에 더하여, 선택적으로, 음소 정보는 해당 음소가 어떠한 글자(예를 들어, 한글의 자음 또는 모음 중 어느 글자)인지에 대한 데이터 및/또는 각 음소의 입력 순서를 나타내는 음소 입력 순서 데이터를 포함할 수 있다. This artificial intelligence-based phoneme decomposition module (2) can receive character-recognized Hangul handwriting data as input and output phoneme information as its output. The output phoneme information is data within the bounding boxes 41, 42, and 43 of each phoneme, and may include time-series two-dimensional coordinate-based data according to the input order of the learner's Hangul handwriting data. In addition, optionally, the phoneme information may include data on which letter the corresponding phoneme is (e.g., which letter of the Korean consonant or vowel) and/or phoneme input order data indicating the input order of each phoneme. there is.

일 실시예에 따르면, 인공지능 기반 음소 분해 모듈(2)은 학습자가 입력한 한글 필기 데이터의 각 음소의 음소 입력 순서 데이터에 기반하여 각 음소의 입력 순서가 대응하는 한글 글자의 음소의 정해진 순서(예를 들어, 도 4에 예시된 "램"의 경우 41 -> 42 -> 43의 순서)와 달리 입력되었다고 판정한 경우, 음소 분해 모듈(2)은 학습자 애플리케이션(4)의 애플리케이션 모듈(5)에 학습자가 입력한 한글 필기 데이터의 획순 입력이 잘못되었음을 알리는 메시지가 출력되도록 할 수 있다. 이 경우, 인공지능 기반 음소 분해 모듈(2)은 획순 식별 모듈(3)로 음소 정보를 전송하지 않고 그대로 프로세스가 종료시킬 수 있다. According to one embodiment, the artificial intelligence-based phoneme decomposition module 2 is based on the phoneme input order data of each phoneme of the Hangul handwriting data input by the learner, and the input order of each phoneme is a predetermined order of the phonemes of the corresponding Hangul letter ( For example, in the case of "RAM" illustrated in FIG. 4, if it is determined that the input is different from the order (41 -> 42 -> 43), the phoneme decomposition module (2) is the application module (5) of the learner application (4) A message notifying that the stroke order of the Hangul handwriting data entered by the learner is incorrect can be displayed. In this case, the artificial intelligence-based phoneme decomposition module 2 can terminate the process as is without transmitting phoneme information to the stroke order identification module 3.

이러한 인공지능 기반 음소 분해 모듈을 통해, 한글 필기 데이터에 대한 정확도 높은 음소 분해를 수행할 수 있을 뿐만 아니라 각 음소가 정확한 순서로 입력되었는지까지 판정할 수 있고, 만약 음소 입력 순서가 틀리다면 프로세스를 조기에 종료할 수 있으므로, 전체적인 획수 인식 장치의 효율성을 제고할 수 있는 효과가 발생한다. Through this artificial intelligence-based phoneme decomposition module, not only can high-accuracy phoneme decomposition of Hangul handwriting data be performed, but it can also be determined whether each phoneme has been entered in the correct order. If the phoneme input order is incorrect, the process can be started early. Since it can be terminated at , the effect of improving the overall efficiency of the stroke recognition device occurs.

인공지능 기반의 획순 식별 모듈Artificial intelligence-based stroke order identification module

도 5는 본 발명의 일 실시예에 따른 인공지능 기반의 획순 식별 모듈의 동작 원리를 설명하는 도면이다. Figure 5 is a diagram explaining the operating principle of an artificial intelligence-based stroke order identification module according to an embodiment of the present invention.

도 5의 인공지능 기반의 획순 식별 모듈(3)은 사전 학습된 인공 신경망 모듈을 활용한 추론 세션에서, 음소 분해 모듈(2)로부터 한글 필기 데이터의 음소 정보를 수신하고, 각 음소 정보를 처리하여 획순 인식 정보를 출력할 수 있다. The artificial intelligence-based stroke order identification module (3) in Figure 5 receives phoneme information of Hangul handwriting data from the phoneme decomposition module (2) in an inference session using a pre-trained artificial neural network module, and processes each phoneme information. Stroke order recognition information can be output.

인공지능 기반의 획순 식별 모듈(3)의 동작 과정을 설명하면, 먼저 획순 식별 모듈(3)은 수신한 각각의 음소 정보에 대해 전처리를 수행할 수 있는데, 이러한 전처리는 업샘플링(upsampling) 또는 다운샘플링(downsampling)을 포함할 수 있다. To explain the operation process of the artificial intelligence-based stroke order identification module 3, first, the stroke order identification module 3 can perform preprocessing on each received phoneme information, and this preprocessing involves upsampling or downsampling. May include downsampling.

그리고, 전처리된 음소 정보는 인공 신경망 모듈, 예를 들어, LSTM 네트워크 및 FC(Fully Connected) 레이어(내지는 Dense 레이어)에 입력되어 최종적으로 획순 인식 정보가 출력될 수 있다. 다만, 여기서의 LSTM 모듈 및 FC 레이어는 예시일 뿐이며, RNN 모듈, CNN 모듈 등이 활용될 수도 있으며, 이에 대해 한정하지는 않는다. In addition, the preprocessed phoneme information may be input to an artificial neural network module, for example, an LSTM network and a Fully Connected (FC) layer (or Dense layer), and finally stroke order recognition information may be output. However, the LSTM module and FC layer here are only examples, and RNN modules, CNN modules, etc. may be used, but are not limited thereto.

그리고, 획순 식별 모듈은 인공 신경망 모듈로부터 출력된 획순 인식 정보의 획순이 정해진 순서로 입력되었는지 여부에 대한 판별, 즉, 획순 정오 판별을 수행한다. Additionally, the stroke order identification module determines whether the stroke order of the stroke order recognition information output from the artificial neural network module is input in a given order, that is, performs stroke order correctness determination.

그리고 획순 정오 판별의 결과에 따라 학습자 클라이언트(4)에게 피드백을 전송할 수 있다. 이러한 피드백은 잘못된 획순에 대한 정보를 학습자에게 알리기 위한 것일 수 있으며, 피드백의 구체적인 내용에 대해서 한정하지는 않는다. 일례로, 획순 식별 모듈(2)은 학습자 애플리케이션(4)의 애플리케이션 모듈(5)에 학습자가 입력한 한글 필기 데이터의 어느 획순 입력이 잘못되었는지를 알려주는 메시지가 출력되도록 할 수 있다.And feedback can be sent to the learner client (4) according to the result of the stroke order correctness determination. This feedback may be intended to provide learners with information about incorrect stroke order, and is not limited to the specific content of the feedback. For example, the stroke order identification module 2 can output a message to the application module 5 of the learner application 4 that informs which stroke order of the Korean handwriting data entered by the learner is incorrect.

도 6은 본 발명의 일 실시예에 따라 음소 정보에 대해 수행되는 전처리를 예시적으로 나타낸 도면이다. Figure 6 is a diagram illustrating preprocessing performed on phoneme information according to an embodiment of the present invention.

음소 정보에 대한 전처리는 한글 자모음 필기체의 인식률을 개선하기 위한 것으로서, 글자 종류 또는 디바이스의 입력 인터페이스에 따라 입력되는 데이터의 길이가 달라지는 문제에 대해 대처하기 위한 것이다. 음소 정보에 대한 전처리로써 업샘플링(upsampling)/다운샘플링(downsampling), Zero-Padding, Windowing 중 적어도 하나의 기법을 사용할 수 있다. 도 6은 비제한적인 일 예로써 음소 정보에 대한 전처리로 업샘플링(upsampling)/다운샘플링(downsampling)을 수행한 것인데, 도 6의 위에 도시된 예에서와 같이 음소 "ㄱ"에 대해 데이터 개수가 25개로 기준치(30개)보다 적은 경우, 업샘플링을 통해 데이터 개수가 30개가 되도록 픽셀 데이터를 추가할 수 있다. 또한, 도 6의 아래에 도시된 예에서와 같이 음소 "ㅂ"에 대해 데이터 개수가 40개로 기준치보다 많은 경우, 일부 픽셀 데이터를 제거하여 데이터 개수가 30개가 되도록 할 수 있다. 다만, 업샘플링/다운샘플링을 비롯한 음소 정보에 대한 전처리의 구체적인 방식은 다양하게 변형될 수 있으며, 이에 대해 한정하지는 않는다. Preprocessing of phonemic information is intended to improve the recognition rate of Korean consonant and vowel cursive, and to deal with the problem that the length of input data varies depending on the type of character or the input interface of the device. As preprocessing for phoneme information, at least one of upsampling/downsampling, zero-padding, and windowing techniques can be used. Figure 6 is a non-limiting example in which upsampling/downsampling is performed as preprocessing for phoneme information. As in the example shown above in Figure 6, the number of data for phoneme "ㄱ" is If 25 pixels are less than the standard value (30), pixel data can be added to bring the number of data to 30 through upsampling. In addition, as in the example shown below in FIG. 6, if the number of data for the phoneme “ㅂ” is 40, which is more than the standard value, some pixel data can be removed to bring the number of data to 30. However, the specific method of preprocessing phoneme information, including upsampling/downsampling, may be modified in various ways and is not limited thereto.

도 7은 본 발명의 일 실시예에 따른 획순 식별 모듈(3)의 인공 신경망의 사전 학습 세션에 대해 개략적으로 설명하는 도면이다. Figure 7 is a diagram schematically explaining a pre-learning session of the artificial neural network of the stroke order identification module 3 according to an embodiment of the present invention.

도 7을 참조하면, 획순 식별 모듈(3)의 인공 신경망의 사전 학습 세션에서는 먼저, 복수의 사전 학습용 음소 정보가 인공 신경망에 입력될 수 있다. 이러한 복수의 사전 학습용 음소 정보는 기존에 복수의 학습자로부터 수집된 한글 필기체 데이터베이스로부터 획득될 수 있으며, 한글 필기체 데이터베이스는 복수의 학습자의 한글 필기 데이터의 입력 순서에 따른 시계열적인 2차원 좌표 기반 데이터베이스를 포함할 수 있다. 이러한 복수의 사전 학습용 음소 정보를 데이터의 시계열적 처리에 적합한 LSTM 모듈 및 FC 레이어의 조합을 통해 처리함으로써 획순 식별 모듈(3)의 인공 신경망은 획순 인식 정보를 출력할 수 있다. Referring to FIG. 7, in the dictionary learning session of the artificial neural network of the stroke order identification module 3, first, a plurality of phoneme information for dictionary learning may be input to the artificial neural network. Such plural phoneme information for prior learning can be obtained from a Korean cursive database previously collected from multiple learners, and the Korean cursive database includes a time-series two-dimensional coordinate-based database according to the input order of the Korean handwriting data of multiple learners. can do. By processing a plurality of phoneme information for dictionary learning through a combination of an LSTM module and an FC layer suitable for time-series processing of data, the artificial neural network of the stroke order identification module 3 can output stroke order recognition information.

획순 식별 모듈(3)의 인공 신경망 모듈이 사전 학습 세션에서 출력한 획순 인식 정보(즉, 음소의 획이 입력된 순서에 대한 인식 정보)는, 실제로 사전 학습용 음소의 획이 입력된 순서에 대한 정보인 실제 획순 정보와 비교될 수 있다. 그리고, 획순 인식 정보 및 실제 획순 정보 사이의 에러(-∑y ilogp i)가 최소화되도록 인공 신경망 모듈은 사전 학습될 수 있다. 일례로, 인공 신경망 모듈은 획순 인식 정보와 실제 획순 정보 사이의 에러(error)를 기초로 hidden layer의 weight를 업데이트하는 방식을 채용할 수 있다. 다수의 사전 학습용 음소 정보는 LSTM 모듈의 x1, x2, x3와 같은 input layer의 각 노드에 입력되고, w1과 같은 weight을 기반으로 h1, h2, h3와 같은 hidden layer를 지나 softmax 등의 cost function 기반으로 예측된 판단 예측 정보가 y1인 output layer로 출력되게 된다. 그리고 획순 인식 정보와 실제 획순 정보 사이와의 에러(-∑y ilogp i)를 기반으로 인공 신경망 모듈의 weight가 back propagation으로 업데이트될 수 있다. 이처럼 사전 학습된 획순 식별 모듈(3)의 인공 신경망을 이용해, 도 5의 획순 식별 모듈(3)의 추론 세션이 구현될 수 있다. The stroke order recognition information (i.e., recognition information about the order in which phoneme strokes are input) output by the artificial neural network module of the stroke order identification module 3 in the dictionary learning session is information about the order in which the strokes of phonemes for dictionary learning were actually input. It can be compared with the actual stroke order information. In addition, the artificial neural network module may be pre-trained so that the error (-∑ y i log p i ) between the stroke order recognition information and the actual stroke order information is minimized. For example, the artificial neural network module may adopt a method of updating the weight of the hidden layer based on the error between stroke order recognition information and actual stroke order information. A large number of phoneme information for pre-learning is input to each node of the input layer such as x1, x2, x3 of the LSTM module, and based on the weight such as w1, passes through hidden layers such as h1, h2, and h3 and is based on a cost function such as softmax. The judgment prediction information predicted by is output to the output layer called y1. And the weight of the artificial neural network module can be updated through back propagation based on the error (-∑ y i log p i ) between the stroke order recognition information and the actual stroke order information. In this way, the inference session of the stroke order identification module 3 of FIG. 5 can be implemented using the artificial neural network of the pre-trained stroke order identification module 3.

유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 방법Artificial intelligence-based stroke order recognition method for early childhood learners’ Hangul handwriting

도 8은 본 발명의 일 실시예에 따른 유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 방법에 대한 흐름도이다. Figure 8 is a flowchart of an artificial intelligence-based stroke order recognition method for an infant learner's Korean handwriting according to an embodiment of the present invention.

도 8을 참조하면, 먼저 단계 S810에서, 학습 클라이언트로부터 수신한 학습자의 한글 필기 데이터의 글자를 인식할 수 있다. 학습자의 한글 필기 데이터는 시계열적인 2차원 좌표 기반 데이터일 수 있으며, 학습 클라이언트의 터치 스크린을 통한 손가락 또는 스타일러스의 터치에 의해 입력되거나 마우스 등 다른 방식을 통해 입력될 수 있다. Referring to FIG. 8, first, in step S810, characters of the learner's Hangul handwriting data received from the learning client can be recognized. The learner's Hangul handwriting data may be time-series two-dimensional coordinate-based data, and may be input by touching a finger or stylus through the touch screen of the learning client, or through other methods such as a mouse.

단계 S820에서는, 글자 인식된 한글 필기 데이터의 음소를 분해하여 음소 정보를 생성할 수 있다. 이러한 음소의 분해는, 전술한 것처럼, 획수 기반으로 이루어질 수도 있고, 인공지능 기반으로 이루어질 수도 있다. 또한, 이 때 생성된 음소 정보는 학습자가 입력한 한글 필기 데이터의 각 음소의 입력 순서를 나타내는 음소 입력 순서 데이터를 포함할 수 있다.In step S820, phoneme information can be generated by decomposing the phonemes of the recognized Korean handwriting data. As described above, this decomposition of phonemes may be based on stroke numbers or may be based on artificial intelligence. Additionally, the phoneme information generated at this time may include phoneme input order data indicating the input order of each phoneme in the Hangul handwriting data entered by the learner.

단계 S830에서는, 음소 정보(또는 음소 입력 순서 데이터)에 기초하여, 한글 필기 데이터의 각 음소가 정해진 순서에 의해 입력되었는지 여부를 판정할 수 있다. 만약 각 음소가 정해진 순서에 의해 입력되지 않았다고 판정되는 경우, 학습자가 입력한 한글 필기 데이터의 획순 입력이 잘못되었음을 알리는 메시지가 학습자 클라이언트에 출력되도록 할 수 있다. 또한, 이 경우, 그 다음 단계로 넘어가지 않고 그대로 프로세스가 종료될 수 있다. In step S830, it can be determined whether each phoneme of the Hangul handwriting data has been input in a predetermined order based on phoneme information (or phoneme input order data). If it is determined that each phoneme has not been entered in the prescribed order, a message notifying that the stroke order of the Korean handwriting data entered by the learner is incorrect can be output to the learner's client. Also, in this case, the process may be terminated without moving to the next step.

단계 S840에서는, 인공 신경망 모듈에 음소 정보를 입력하여 음소의 각 획이 학습자에 의해 입력된 순서인 획순 인식 정보를 출력할 수 있다. 또한, 단계 S840에서는 음소 정보를 인공 신경망 모듈에 입력하기 전에 음소 정보에 대해 전처리를 수행할 수 있는데, 이러한 전처리는 업샘플링(upsampling) 또는 다운샘플링(downsampling)을 포함할 수 있다. 그리고, 전처리된 음소 정보는 인공 신경망 모듈, 예를 들어, LSTM 네트워크 및 FC(Fully Connected) 레이어(내지는 Dense 레이어)에 입력되어 최종적으로 획순 인식 정보가 출력될 수 있다. 그리고, 획순 식별 모듈은 인공 신경망 모듈로부터 출력된 각 음소의 획순 인식 정보의 획순이 정해진 순서로 입력되었는지 여부에 대한 판별, 즉, 획순 정오 판별을 수행할 수 있다.In step S840, phoneme information can be input into the artificial neural network module to output stroke order recognition information, which is the order in which each stroke of the phoneme is input by the learner. Additionally, in step S840, preprocessing may be performed on the phoneme information before inputting the phoneme information to the artificial neural network module, and this preprocessing may include upsampling or downsampling. In addition, the preprocessed phoneme information may be input to an artificial neural network module, for example, an LSTM network and a Fully Connected (FC) layer (or Dense layer), and finally stroke order recognition information may be output. Additionally, the stroke order identification module may determine whether the stroke order of the stroke order recognition information for each phoneme output from the artificial neural network module is input in a predetermined order, that is, perform stroke order error determination.

단계 S850에서는, 획순 인식 정보에 기초하여 학습자 클라이언트에게 피드백을 전송할 수 있다. 즉, 획순 인식 정보에 기초한 획순 정오 판별을 수행한 결과, 학습자기 입력한 한글 필기 데이터의 획순이 잘못되었다고 판정되는 경우 이에 대해 학습자에게 피드백을 제공할 수 있다. In step S850, feedback may be transmitted to the learner client based on the stroke order recognition information. In other words, if it is determined that the stroke order of the Korean handwriting data entered by the learner is incorrect as a result of performing stroke order error determination based on stroke order recognition information, feedback on this can be provided to the learner.

본 발명의 일 실시예에 따르면, 유아 학습자가 한글 필기를 적절한 형태로 작성하였는지에 대해 판별할 수 있을 뿐만 아니라, 한글 필기의 획순이 올바른 순서로 입력되었는지도 파악할 수 있으므로, 유아 학습자의 쓰기 교육을 보다 체계적으로 수행할 수 있는 효과가 발생한다. According to one embodiment of the present invention, not only can it be determined whether the early childhood learner has written the Hangul handwriting in an appropriate form, but it is also possible to determine whether the stroke order of the Hangul handwriting has been entered in the correct order, thereby improving the writing education of the early childhood learner. It has an effect that can be carried out systematically.

컴퓨터 판독 가능한 기록매체computer-readable recording medium

본 발명의 실시예들에 따른 각 단계들이나 동작들은, 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램의 실행에 따라 하나 이상의 프로세서를 포함하는 컴퓨터에 의해 수행될 수 있음은 자명하다.It is obvious that each step or operation according to the embodiments of the present invention can be performed by a computer including one or more processors by executing a computer program stored in a computer-readable recording medium.

전술한 기록매체에 저장된 각 명령어(instruction)는, 해당하는 각 단계를 수행하도록 프로그램된 컴퓨터 프로그램을 통해 구현 가능하되, 이러한 컴퓨터 프로그램은 컴퓨터 판독 가능한 기록매체에 저장될 수 있고, 프로세서에 의해 실행 가능하다. 컴퓨터 판독 가능한 기록매체는 비일시적 판독 가능 매체(non-transitory readable medium)일 수 있다. 이 때, 비일시적 판독 가능 매체란 레지스터, 캐시, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 방법을 수행하기 위한 프로그램들은 소거가능 프로그래머블 판독 전용 메모리(EPROM), 전기적 소거가능 프로그래머블 판독 전용 메모리(EEPROM), 및 플래시 메모리 디바이스와 같은 반도체 메모리 디바이스, 내부 하드 디스크 및 이동식 디스크와 같은 자기 디스크, 광학-자기 디스크, 및 CD-ROM 및 DVD-ROM 디스크를 포함하는 비휘발성 메모리 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.Each instruction stored in the above-described recording medium can be implemented through a computer program programmed to perform each corresponding step, and such computer program may be stored in a computer-readable recording medium and can be executed by a processor. do. A computer-readable recording medium may be a non-transitory readable medium. At this time, a non-transitory readable medium refers to a medium that stores data semi-permanently and can be read by a device, rather than a medium that stores data for a short period of time, such as registers, caches, and memories. Specifically, programs for performing the various methods described above include semiconductor memory devices such as erasable programmable read only memory (EPROM), electrically erasable programmable read only memory (EEPROM), and flash memory devices, internal hard disks, and removable memory devices. It may be provided and stored in non-transitory readable media such as magnetic disks such as disks, optical-magnetic disks, and non-volatile memory including CD-ROM and DVD-ROM disks.

본 문서에 개시된 다양한 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 온라인으로 배포될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.Methods according to various examples disclosed in this document may be provided and included in a computer program product. The computer program product may be distributed in the form of a machine-readable storage medium (e.g. compact disc read only memory (CD-ROM)) or online through an application store (e.g. Play Store ). In the case of online distribution, at least a portion of the computer program product may be at least temporarily stored or created temporarily in a storage medium such as the memory of a manufacturer's server, an application store's server, or a relay server.

이상에서 설명한 바와 같이, 본 발명이 속하는 기술 분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 상술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함하는 것으로 해석되어야 한다.As described above, a person skilled in the art to which the present invention pertains will understand that the present invention can be implemented in other specific forms without changing its technical idea or essential features. Therefore, the above-described embodiments should be understood in all respects as illustrative and not restrictive. The scope of the present invention is indicated by the claims described later rather than the detailed description, and all changes or modified forms derived from the meaning and scope of the claims and the equivalent concept should be construed as being included in the scope of the present invention.

본 명세서 내에 기술된 특징들 및 장점들은 모두를 포함하지 않으며, 특히 많은 추가적인 특징들 및 장점들이 도면들, 명세서, 및 청구항들을 고려하여 당업자에게 명백해질 것이다. 더욱이, 본 명세서에 사용된 언어는 주로 읽기 쉽도록 그리고 교시의 목적으로 선택되었고, 본 발명의 주제를 묘사하거나 제한하기 위해 선택되지 않을 수도 있다는 것을 주의해야 한다.The features and advantages described herein are not all-inclusive, and many additional features and advantages will become apparent to those skilled in the art upon consideration of the drawings, specification, and claims. Moreover, it should be noted that the language used herein has been selected primarily for readability and teaching purposes and may not be selected to describe or limit the subject matter of the invention.

본 발명의 실시예들의 상기한 설명은 예시의 목적으로 제시되었다. 이는 개시된 정확한 형태로 본 발명을 제한하거나, 빠뜨리는 것 없이 만들려고 의도한 것이 아니다. 당업자는 상기한 개시에 비추어 많은 수정 및 변형이 가능하다는 것을 이해할 수 있다.The foregoing description of embodiments of the invention has been presented for purposes of illustration. It is not intended to be exhaustive or to limit the invention to the precise form disclosed. Those skilled in the art will appreciate that many modifications and variations are possible in light of the above disclosure.

그러므로 본 발명의 범위는 상세한 설명에 의해 한정되지 않고, 이를 기반으로 하는 출원의 임의의 청구항들에 의해 한정된다. 따라서, 본 발명의 실시예들의 개시는 예시적인 것이며, 이하의 청구항에 기재된 본 발명의 범위를 제한하는 것은 아니다.Therefore, the scope of the present invention is not limited by the detailed description, but by any claims of the application based thereon. Accordingly, the disclosure of embodiments of the invention is illustrative and does not limit the scope of the invention as set forth in the claims below.

100: 유아 학습자의 한글 필기에 대한 인공지능 기반의 획순 인식 장치
1: 필기 인식 모듈
2: 음소 분해 모듈
3: 획순 식별 모듈
4: 학습자 클라이언트
5: 애플리케이션 모듈
100: Artificial intelligence-based stroke order recognition device for early childhood learners’ Hangul handwriting
1: Handwriting recognition module
2: Phoneme decomposition module
3: Stroke order identification module
4: Learner Client
5: Application module

Claims (1)

획수 기반 음소 분해 방법으로서,
학습자가 입력한 한글 필기 데이터에 대한 대응 한글 글자의 각 음소별 획수를 결정하는 단계 - 상기 한글 필기 데이터는 상기 학습자가 입력한 시계열적인 2차원 좌표 기반 데이터를 포함함 - 와,
각 음소별 획수에 기초하여, 상기 한글 필기 데이터의 어느 입력이 초성, 중성 및 종성 중 어느 하나에 해당하는지 여부를 판별하는 단계와,
상기 판별에 기초하여 상기 한글 필기 데이터의 음소를 분해하는 단계와,
상기 한글 필기 데이터의 각 음소별 획수 및 판별된 상기 한글 필기 데이터의 음소의 위치에 기초하여 상기 학습자가 한글 글자를 정해진 획순에 기초하여 입력하는지 여부를 판정하는 단계
를 포함하는 획수 기반 음소 분해 방법.
As a stroke number-based phoneme decomposition method,
A step of determining the number of strokes for each phoneme of a Hangul character corresponding to the Hangul handwriting data input by the learner - the Hangul handwriting data includes time-series two-dimensional coordinate-based data input by the learner - and
Based on the number of strokes for each phoneme, determining whether any input of the Hangul handwriting data corresponds to any one of the initial consonant, middle consonant, and final consonant;
Decomposing phonemes of the Hangul handwriting data based on the determination;
A step of determining whether the learner inputs Hangul letters based on a determined stroke order based on the number of strokes for each phoneme of the Hangul handwriting data and the determined location of the phoneme in the Hangul handwriting data.
A stroke number-based phoneme decomposition method including.
KR1020220083778A 2022-07-07 2022-07-07 Method for Decomposition of Phonemes Based on Number of Strokes KR20240006915A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220083778A KR20240006915A (en) 2022-07-07 2022-07-07 Method for Decomposition of Phonemes Based on Number of Strokes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220083778A KR20240006915A (en) 2022-07-07 2022-07-07 Method for Decomposition of Phonemes Based on Number of Strokes

Publications (1)

Publication Number Publication Date
KR20240006915A true KR20240006915A (en) 2024-01-16

Family

ID=89719599

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220083778A KR20240006915A (en) 2022-07-07 2022-07-07 Method for Decomposition of Phonemes Based on Number of Strokes

Country Status (1)

Country Link
KR (1) KR20240006915A (en)

Similar Documents

Publication Publication Date Title
Al-Ayyoub et al. Deep learning for Arabic NLP: A survey
US11250252B2 (en) Simulated handwriting image generator
Sommerschield et al. Machine learning for ancient languages: A survey
Zhang et al. An improved approach based on CNN-RNNs for mathematical expression recognition
Alheraki et al. Handwritten Arabic character recognition for children writing using convolutional neural network and stroke identification
US20240296603A1 (en) Systems and methods for digital ink generation and editing
Le et al. A human-inspired recognition system for pre-modern Japanese historical documents
CN114881006A (en) Medical text error correction method and device, storage medium and electronic equipment
CN113704393A (en) Keyword extraction method, device, equipment and medium
KR102468713B1 (en) AI- based Device and Method for Stroke Order Recognition of Korean Handwriting of Student
Nogra et al. Baybáyin character recognition using convolutional neural network
US11869130B2 (en) Generating visual feedback
Li et al. AI-based visual speech recognition towards realistic avatars and lip-reading applications in the metaverse
KR20240006915A (en) Method for Decomposition of Phonemes Based on Number of Strokes
KR20240006916A (en) Method for Recognition of Stroke Order Within Phonemes
KR20240006914A (en) AI-based Method for Recognition of Korean Handwriting
Huang et al. Adversarial feature enhancing network for end-to-end handwritten paragraph recognition
Mondal et al. Textual description for mathematical equations
Perez et al. Recognition of Japanese handwritten characters with Machine learning techniques
Shirnin et al. Analyzing the Robustness of Vision & Language Models
Zubarieva et al. Space Balancing in Online Handwriting Recognition Postprocessing using Deep Bidirectional LSTM
Nasi et al. Offline handwritten mathematical expression recognition using CNN and Xception
KR102509107B1 (en) AI-Based Device and Method for Evaluating Status of Student
Sevilla et al. Automatic signwriting recognition: Combining machine learning and expert knowledge to solve a novel problem
Kudaibergen et al. Application of Deep Convolutional Generative Adversarial Network for Russian Handwritten Text Recognition.