KR102264988B1 - Traditional Korean character Hanja Recognition System and method using thereof - Google Patents

Traditional Korean character Hanja Recognition System and method using thereof Download PDF

Info

Publication number
KR102264988B1
KR102264988B1 KR1020190098004A KR20190098004A KR102264988B1 KR 102264988 B1 KR102264988 B1 KR 102264988B1 KR 1020190098004 A KR1020190098004 A KR 1020190098004A KR 20190098004 A KR20190098004 A KR 20190098004A KR 102264988 B1 KR102264988 B1 KR 102264988B1
Authority
KR
South Korea
Prior art keywords
chinese character
image
identified
reliability
unit
Prior art date
Application number
KR1020190098004A
Other languages
Korean (ko)
Other versions
KR20210001817A (en
Inventor
이민호
박종훈
아민 잘랄리
Original Assignee
경북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경북대학교 산학협력단 filed Critical 경북대학교 산학협력단
Publication of KR20210001817A publication Critical patent/KR20210001817A/en
Application granted granted Critical
Publication of KR102264988B1 publication Critical patent/KR102264988B1/en

Links

Images

Classifications

    • G06K9/3258
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
    • G06K2209/011

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 한자인식시스템 및 이를 이용한 한자인식방법에 관한 것으로, 본 발명에 따르면, 식별대상인 한자의 이미지인 한자이미지를 입력받는 입력부; 한자이미지로부터 이미지특징을 추출하기 위한 딥러닝모델이 적용된 이미지인식기를 다수 포함하는 특징추출부; 다수의 상기 이미지특징 각각에 대하여 신뢰도를 도출하고, 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정부; 및 식별한자를 상기 식별한자선정부로부터 전달받아서 출력하는 출력부; 를 포함하므로 알아보기 곤란하거나 초서체 또는 흘림체와 같이 다양한 필체 또는 크기, 한자기록물의 품질이 저하되었더라도 한자 인식의 정확성을 증대시켜 줄 수 있는 기술이 개시된다.The present invention relates to a Chinese character recognition system and a Chinese character recognition method using the same, and according to the present invention, an input unit for receiving a Chinese character image, which is an image of a Chinese character to be identified; a feature extraction unit including a plurality of image recognizers to which a deep learning model for extracting image features from a Chinese character image is applied; an identified Chinese character selection unit that derives reliability for each of the plurality of image features and selects an identified Chinese character corresponding to a Chinese character to be identified; and an output unit for receiving and outputting the identified Chinese characters from the identified Chinese character selection unit; Disclosed is a technology capable of increasing the accuracy of recognizing Chinese characters even though it is difficult to recognize, or the quality of various handwriting or sizes, such as cursive or cursive type, or the quality of Chinese character records is deteriorated.

Description

한자인식시스템 및 이를 이용한 한자인식방법{Traditional Korean character Hanja Recognition System and method using thereof}Traditional Korean character Hanja Recognition System and method using thereof

본 발명은 전통기록물과 같은 고문서에서 주로 사용되는 초서체 또는 흘림체로 작성된 한자를 정확하게 식별하여 사용자가 한자를 인식할 수 있도록 식별결과를 제공할 수 있는 한자인식 시스템 및 이를 이용한 한자인식방법에 관한 것이다. The present invention relates to a Chinese character recognition system capable of providing an identification result so that a user can recognize Chinese characters by accurately identifying Chinese characters written in cursive or cursive fonts mainly used in ancient documents such as traditional records, and a Chinese character recognition method using the same.

근래에 전 세계적으로 문화 컨텐츠 발굴에 대한 관심이 증가하고 있으며, 문화컨텐츠를 다양화하기 위한 여러 노력이 다방면에 걸쳐 진행되고 있다. 그 중에서 서지학(Bilblography) 분야에서는 주로 사용되는 고전사료를 분석하고, 분석된 내용을 토대로 하여 전통문화 또는 역사적 사건이나 배경 등을 탐구하는 연구활동이 이루어지고 있는데, 이를 위해서는 사료에 대한 정확한 파악과 분석이 수행되어야 한다.In recent years, interest in discovering cultural contents is increasing worldwide, and various efforts are being made to diversify cultural contents. Among them, in the field of bibliography, research activities are being carried out to analyze classical historical materials that are mainly used, and to explore traditional culture or historical events or backgrounds based on the analyzed contents. For this purpose, accurate identification and analysis of historical materials is conducted. This should be done.

그러나, 대부분의 사료는 현 시대에 잘 사용하지 않는 고어(古語)로 작성되어 있으므로 사료의 분석이 쉽지 않은데, 그 중에서도 한자의 서체 중 일부인 초서체 또는 흘림체로 작성된 문자의 경우에는 정확한 문자의 파악과 식별이 쉽지 않다. 따라서, 이러한 초서체 또는 흘림체로 작성된 문자를 정확하게 파악할 수 있는 발전된 인식기술이 요청되고 있다.However, most of the historical materials are written in an ancient language that is not often used in the present era, so it is difficult to analyze the historical documents. Among them, in the case of characters written in cursive or cursive fonts, which are part of Chinese characters, accurate identification and identification of characters This is not easy. Accordingly, there is a demand for an advanced recognition technology capable of accurately identifying characters written in such cursive or cursive fonts.

대한민국 공개특허 제10-1996-0008529호Republic of Korea Patent Publication No. 10-1996-0008529 대한민국 공개특허 제10-2002-0088124호Republic of Korea Patent Publication No. 10-2002-0088124

본 발명의 목적은 상기한 바와 같은 종래의 문제점을 해결하기 위한 것으로, 전통기록물과 같은 고문서에서 주로 사용되는 초서체 또는 흘림체로 작성된 한자를 정확하게 식별할 수 있는 한자인식시스템 및 이를 이용한 한자인식방법을 제공함에 있다.An object of the present invention is to solve the conventional problems as described above, and to provide a Chinese character recognition system that can accurately identify Chinese characters written in cursive or cursive fonts mainly used in ancient documents such as traditional records, and a Chinese character recognition method using the same. is in

상기와 같은 목적을 달성하기 위한 본 발명의 실시 예에 따른 한자인식시스템은 식별대상인 한자의 이미지인 한자이미지를 입력받는 입력부; 상기 입력부로부터 전달받은 상기 한자이미지로부터 이미지특징을 추출하기 위한 딥러닝모델(deep learning model)이 적용된 이미지인식기를 다수 포함하는 특징추출부; 상기 특징추출부로부터 전달받은 다수의 상기 이미지특징 각각에 대하여 신뢰도를 도출하고, 상기 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정부; 및 상기 식별한자선정부에서 선정된 상기 식별한자를 상기 식별한자선정부로부터 전달받아서 출력하는 출력부; 를 포함하는 것을 하나의 특징으로 할 수도 있다.A Chinese character recognition system according to an embodiment of the present invention for achieving the above object includes an input unit for receiving a Chinese character image that is an image of a Chinese character to be identified; a feature extracting unit including a plurality of image recognizers to which a deep learning model for extracting image features from the Chinese character image received from the input unit is applied; an identified Chinese character selection unit for deriving reliability for each of the plurality of image features received from the feature extraction unit, and selecting an identified Chinese character corresponding to the Chinese character to be identified; and an output unit for receiving and outputting the identified Chinese character selected by the identified Chinese character selecting unit from the identified Chinese character selecting unit; It may be characterized as one of including.

여기서, 상기 입력부에서 상기 특징추출부로 전달되는 상기 한자이미지는 다채널의 이미지행렬의 형태를 갖추고 있으며, 다채널의 이미지행렬의 형태를 갖춘 상기 한자이미지를 전달받은 다수의 상기 이미지인식기는 각기 행벡터의 형태를 갖춘 이미지특징을 추출하는 것을 또 하나의 특징으로 할 수도 있다.Here, the Chinese character image transmitted from the input unit to the feature extraction unit has the form of a multi-channel image matrix, and a plurality of the image recognizers that have received the Chinese character image having the form of a multi-channel image matrix are each of a row vector. Extracting an image feature having a shape may be another feature.

여기서, 딥러닝모델이 적용된 다수의 상기 이미지인식기 중에는, 민감도 정규화 방법을 통해 학습이 이루어진 상기 이미지인식기가 있는 것을 또 하나의 특징으로 할 수도 있다.Here, among the plurality of image recognizers to which the deep learning model is applied, it may be further characterized that there is the image recognizer that has been trained through a sensitivity normalization method.

여기서, 딥러닝모델이 적용된 다수의 상기 이미지인식기 중에는, 강건성(Robustness) 정규화 방법을 통해 학습이 이루어진 상기 이미지인식기가 있는 것을 또 하나의 특징으로 할 수도 있다.Here, among the plurality of image recognizers to which the deep learning model is applied, another feature may be that there is the image recognizer that has been trained through a robustness normalization method.

여기서, 딥러닝모델이 적용된 다수의 상기 이미지인식기 중에는, 민감도 및 강건성 정규화 방법을 통해 학습이 이루어진 상기 이미지인식기가 있는 것을 또 하나의 특징으로 할 수도 있다.Here, among the plurality of image recognizers to which the deep learning model is applied, another feature may be that there is the image recognizer that has been trained through a sensitivity and robustness normalization method.

여기서, 상기 식별한자선정부는, 상기 특징추출부로부터 전달받은 다수의 상기 이미지특징에 각각에 대하여 활성화함수를 이용하여 신뢰도 점수로 구성된 신뢰도 행렬을 산출하는 것을 또 하나의 특징으로 할 수도 있다.Here, another feature may be that the identified character selection unit calculates a reliability matrix composed of reliability scores by using an activation function for each of the plurality of image features received from the feature extraction unit.

여기서, 상기 식별한자선정부는, 산출된 상기 신뢰도행렬의 각 열에서 최대값을 선택하여 신뢰도점수-행벡터를 생성하고, 생성된 상기 신뢰도점수-행벡터 내에서 상기 신뢰도점수가 가장 큰 최대신뢰도점수에 대응되는 한자를 상기 식별대상인 한자에 해당되는 상기 식별한자로서 선정하는 것을 또 하나의 특징으로 할 수도 있다.Here, the identified character selection unit selects a maximum value from each column of the calculated reliability matrix to generate a reliability score-row vector, and the confidence score corresponds to the maximum reliability score with the largest reliability score in the generated reliability score-row vector Another feature may be to select a Chinese character to be identified as the identified Chinese character corresponding to the Chinese character to be identified.

상기와 같은 목적을 달성하기 위한 본 발명의 실시 예에 따른 한자인식방법은, 본 발명에 따른 한자인식시스템이 식별대상인 한자의 이미지인 한자이미지를 입력받는 입력단계; 상기 입력단계에서 입력받은 상기 한자이미지로부터 다수의 이미지특징을 추출하는 추출단계; 상기 추출단계에서 추출된 다수의 상기 이미지특징으로부터 신뢰도점수를 도출하는 신뢰도도출단계; 및 상기 신뢰도도출단계에서 도출된 다수의 상기 신뢰도점수로부터 상기 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정단계;를 포함하는 것을 하나의 특징으로 할 수도 있다.Chinese character recognition method according to an embodiment of the present invention for achieving the above object, the Chinese character recognition system according to the present invention, the input step of receiving a Chinese character image that is an image of a Chinese character to be identified; an extraction step of extracting a plurality of image features from the Chinese character image received in the input step; a reliability derivation step of deriving a reliability score from the plurality of image features extracted in the extraction step; and an identified Chinese character selection step of selecting an identified Chinese character corresponding to the Chinese character to be identified from a plurality of the reliability scores derived in the reliability deriving step.

여기서, 상기 식별한자선정단계 이후에 이루어지는 단계로서, 상기 식별한자선정단계에서 선정된 상기 식별한자를 외부에서 인식할 수 있도록 출력하는 출력단계;를 더 포함하는 것을 또 하나의 특징으로 할 수도 있다. Here, as a step performed after the identified Chinese character selecting step, an output step of outputting the identified Chinese character selected in the identified Chinese character selecting step so that it can be recognized from the outside may be further included.

여기서, 상기 식별한자선정단계에서 이루어지는 상기 식별한자의 선정은, 다수의 상기 신뢰도점수 중에서 가장 큰 값인 최대신뢰도점수에 대응되는 한자를 상기 식별한자로서 선정함으로써 이루어지는 것을 또 하나의 특징으로 할 수도 있다.Here, the selection of the identified Chinese character in the identified Chinese character selection step may be performed by selecting a Chinese character corresponding to the maximum reliability score, which is the largest value among a plurality of the reliability scores, as the identified Chinese character.

본 발명에 따른 한자인식시스템 및 이를 이용한 한자인식방법은, 한자가 오랜 시간의 경과로 인하여 알아보기 곤란하거나 초서체 또는 흘림체와 같이 다양한 필체 또는 크기, 문자들 간의 높은 유사도, 한자기록물의 품질이 저하되었더라도 한자 인식의 정확성을 증대시켜준다. 따라서 종래에 인식하기 어려웠었던 전통기록물의 한자를 인식하는데 기여하는 효과가 있다. 또한, 전통기록물을 디지털화 하여 보존하는 고문헌기록 작업의 능률 향상에 기여하는 효과도 있다.The Chinese character recognition system and the Chinese character recognition method using the same according to the present invention are difficult to recognize due to the passage of a long time, or various handwriting or sizes such as cursive or cursive fonts, high similarity between characters, and the quality of Chinese character records It increases the accuracy of Chinese character recognition. Therefore, it has the effect of contributing to recognizing the Chinese characters of traditional records, which were difficult to recognize in the past. In addition, it has the effect of contributing to the improvement of the efficiency of archival records that digitize and preserve traditional records.

도 1은 본 발명의 실시 예에 따른 한자인식시스템을 개략적으로 나타낸 블록도이다.
도 2는 본 발명의 실시 예에 따른 한자인식시스템을 이용한 한자인식방법을 개략적으로 나타낸 순서도이다.
1 is a block diagram schematically showing a Chinese character recognition system according to an embodiment of the present invention.
2 is a flowchart schematically illustrating a Chinese character recognition method using a Chinese character recognition system according to an embodiment of the present invention.

이하에서는 본 발명에 대하여 보다 구체적으로 이해할 수 있도록 첨부된 도면을 참조한 바람직한 실시 예를 들어 설명하기로 한다. Hereinafter, a preferred embodiment will be described with reference to the accompanying drawings so that the present invention can be understood in more detail.

도 1을 참조하여 본 발명의 실시 예에 따른 한자인식시스템에 대하여 설명한 후 도 2를 더 참조하여 본 발명의 실시 예에 따른 한자인식방법에 대하여 설명하기로 한다.After a description of the Chinese character recognition system according to an embodiment of the present invention with reference to FIG. 1, a Chinese character recognition method according to an embodiment of the present invention will be described with further reference to FIG. 2 .

참고로 본 발명의 실시 예에 대한 설명 및 이해의 편의를 위하여, '식별대상이 되는 한자'는 사용자가 파악하고자 하는 대상이 되는 한자를 말하며, '식별한자'는 본 발명의 실시 예에 따른 한자인식시스템 또는 한자인식방법을 통해 '식별대상이 되는 한자'를 식별하여 얻어진 식별결과를 말한다. For reference, for convenience of explanation and understanding of the embodiment of the present invention, 'Chinese character to be identified' refers to a Chinese character to be identified by the user, and 'Chinese character to be identified' is a Chinese character according to an embodiment of the present invention. It refers to the identification result obtained by identifying 'the Chinese character to be identified' through a recognition system or a Chinese character recognition method.

도 1은 본 발명의 실시 예에 따른 한자인식시스템을 개략적으로 나타낸 블록도이다. 1 is a block diagram schematically showing a Chinese character recognition system according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 실시 예에 따른 한자인식시스템(100)은 입력부(110), 특징추출부(120), 식별한자선정부(130) 및 출력부(140)를 포함하여 이루어질 수 있다.Referring to FIG. 1 , the Chinese character recognition system 100 according to an embodiment of the present invention may include an input unit 110 , a feature extraction unit 120 , an identified Chinese character selection unit 130 , and an output unit 140 . have.

입력부(110)는 식별대상인 한자의 이미지인 한자이미지를 입력받는다.The input unit 110 receives a Chinese character image that is an image of a Chinese character to be identified.

이러한 입력부(110)의 예로서 카메라와 같은 장치를 들을 수 있다. An example of such an input unit 110 may be a device such as a camera.

입력부(110)에서 특징추출부(120)로 전달되는 한자이미지는 다채널의 이미지행렬의 형태를 갖추게 된다. 입력부(110)는 한자이미지를 (W*H*3)의 크기의 RGB 3채널의 이미지행렬의 형태로 만든다. 여기서, W는 이미지의 너비이고, H는 이미지의 높이에 해당된다. The Chinese character image transmitted from the input unit 110 to the feature extraction unit 120 has the form of a multi-channel image matrix. The input unit 110 makes the Chinese character image in the form of an image matrix of 3 RGB channels with a size of (W*H*3). Here, W is the width of the image, and H is the height of the image.

이와 같이 행렬의 형태로 된 한자이미지가 입력부(110)에서 특징추출부(120)의 이미지인식기(121, 122, 123, 124, 125) 로 전달된다. As described above, the Chinese character image in the form of a matrix is transmitted from the input unit 110 to the image recognizers 121 , 122 , 123 , 124 , and 125 of the feature extraction unit 120 .

특징추출부(120)는 입력부(110)로부터 전달받은 한자이미지로부터 이미지특징을 추출하는 이미지인식기(121, 122, 123, 124, 125) 를 다수 포함하고 있다. 즉, 특징추출부(120)는 다수의 이미지인식기(121, 122, 123, 124, 125) 를 포함하는 집합체라고 할 수 있다.The feature extraction unit 120 includes a plurality of image recognizers 121 , 122 , 123 , 124 , and 125 for extracting image features from the Chinese character image received from the input unit 110 . That is, the feature extraction unit 120 can be said to be an aggregate including a plurality of image recognizers (121, 122, 123, 124, 125).

이미지인식기(121, 122, 123, 124, 125) 는 특정 수의 합성곱 연산 및 풀링 연산을 수행하여 한자이미지에서 이미지특징을 추출한다.The image recognizers 121 , 122 , 123 , 124 , and 125 perform a specific number of convolution and pooling operations to extract image features from a Chinese character image.

(W*H*3)의 크기의 RGB 3채널의 이미지행렬과 같이, 다채널의 이미지행렬의 형태를 갖춘 한자이미지를 전달받은 다수의 이미지인식기(121, 122, 123, 124, 125) 는 각기 행벡터의 형태를 갖춘 이미지특징을 추출한다.Multiple image recognizers (121, 122, 123, 124, 125) that received a Chinese character image in the form of a multi-channel image matrix like an RGB 3-channel image matrix of (W*H*3) Extract image features in the form of row vectors.

식별대상인 한자에 해당되는 것으로 판단될 식별한자로 선정될 가능성이 있는 x개의 한자글자가 있다면, 추출된 이미지특징은 (1*x)의 행벡터의 형태를 가지게 된다.If there are x number of Chinese characters that are likely to be selected as the Chinese characters to be identified as corresponding to the Chinese characters to be identified, the extracted image feature has the form of a row vector of (1*x).

이와 같이 다수의 이미지인식기(121, 122, 123, 124, 125) 각각이 입력부(110)으로부터 전달받은 한자이미지로부터 각기 이미지특징을 추출한다. As described above, each of the plurality of image recognizers 121 , 122 , 123 , 124 , and 125 extracts image features from the Chinese character image received from the input unit 110 .

다수의 이미지인식기(121, 122, 123, 124, 125) 각각은 이미지특징을 추출하기 위한 딥러닝모델(deep learning model)이 적용되어 있다. A deep learning model for extracting image features is applied to each of the plurality of image recognizers 121 , 122 , 123 , 124 , and 125 .

여기서 딥러닝모델은 CNN(convolution neural network), DenseNet(Densely connected convolutional network) 또는 ResNet(residual network) 등의 다양한 딥러닝모델이 가능하며, 딥러닝모델로서 VGGNet(Visual Geometry Group Network) 또한 바람직하다.Here, as the deep learning model, various deep learning models such as a convolution neural network (CNN), a densely connected convolutional network (DenseNet), or a residual network (ResNet) are possible, and a Visual Geometry Group Network (VGGNet) is also preferable as a deep learning model.

이와 같은 딥러닝모델이 적용된 이미지인식기(121, 122, 123, 124, 125)에 다음과 같은 정규화를 통한 학습이 이루어진 것이 바람직하다.It is preferable that the image recognizers 121, 122, 123, 124, and 125 to which such a deep learning model is applied are trained through the following normalization.

민감도(sensitivity) 정규화(regularization)는 비슷해보이지만 서로 다른 한자이미지인 비트윈-클라스(between-class) 이미지들을 더 잘 구분하게 만든다.Sensitivity regularization makes it better to distinguish between-class images, which look similar but are different Chinese character images.

그리고 강건성(Robustness) 정규화(regularization)는 다르게 보이지만 실제로는 같은 한자이미지인 위드인-클라스(within-class) 이미지들을 더 잘 구분하게 만든다. And robustness regularization makes it better to distinguish between-class images, which look different but are actually the same Chinese character image.

이와 같은 정규화를 통해 같은 종류의 한자이미지(within-class)는 같은 것으로, 다른 종류의 한자이미지(between-class)는 더 다른 것으로 구분이 잘 이루어질 수 있다. Through such normalization, the same kind of Chinese character images (within-class) can be distinguished as the same, and different kinds of Chinese character images (between-class) can be distinguished as more different.

따라서, 딥러닝모델이 적용된 다수의 이미지인식기(121, 122, 123, 124, 125) 중에는 민감도 정규화 방법을 통해 학습이 이루어진 이미지인식기(121)가 있는 것도 바람직하다. Therefore, among the plurality of image recognizers 121 , 122 , 123 , 124 , and 125 to which the deep learning model is applied, it is also preferable that the image recognizer 121 is trained through the sensitivity normalization method.

아울러, 딥러닝모델이 적용된 다수의 이미지인식기(121, 122, 123, 124, 125) 중에는 강건성(Robustness) 정규화 방법을 통해 학습이 이루어진 이미지인식기(122)가 있는 것 또한 바람직하다. In addition, among the plurality of image recognizers 121, 122, 123, 124, and 125 to which the deep learning model is applied, it is also preferable that there is an image recognizer 122 that has been trained through a robustness normalization method.

또한, 딥러닝모델이 적용된 다수의 이미지인식기(121, 122, 123, 124, 125) 중에는 민감도 및 강건성 정규화 방법을 통해 학습이 이루어진 이미지인식기(123, 124, 125)가 있는 것도 바람직하다.In addition, among the plurality of image recognizers 121, 122, 123, 124, and 125 to which the deep learning model is applied, it is also preferable that there are image recognizers 123, 124, 125 that have been trained through the sensitivity and robustness normalization method.

딥러닝모델이 적용된 다수의 이미지인식기(121, 122, 123, 124, 125) 중에서 일부의 이미지인식기(121)는 민감도 정규화 방법을 통해 학습이 이루어진 것이고, 다른 일부의 이미지인식기(122)는 강건성 정규화 방법을 통해 학습이 이루어진 것이며, 나머지 다른 일부의 이미지인식기(123, 124, 125)는 민감도 및 강건성 정규화 방법을 통해 학습이 이루어진 것도 바람직하다.Among the plurality of image recognizers 121, 122, 123, 124, and 125 to which the deep learning model is applied, some image recognizers 121 are trained through the sensitivity normalization method, and other image recognizers 122 are robustness normalized. Learning is made through the method, and it is also preferable that the remaining image recognizers 123, 124, and 125 are trained through the sensitivity and robustness normalization method.

이와 같이 다수의 인식기(121, 122, 123, 124, 125) 각각이 모두 정규화 방법을 통한 학습이 된 상태인 것이 바람직하다.As described above, it is preferable that each of the plurality of recognizers 121 , 122 , 123 , 124 , and 125 is in a state that has been learned through the normalization method.

가중치 갱신 방법은 아래와 같은 일반적인 방법을 따른다. 이 때

Figure 112019082261249-pat00001
은 가중치 갱신을 위한 학습률(learning rate)이며,
Figure 112019082261249-pat00002
은 각
Figure 112019082261249-pat00003
층에 해당하는 가중치의 미분값이다. 본 발명에서는 가중치의 미분값을 구할 수 있는 손실함수에 민감도 혹은 강건성 정규화를 적용한다. The weight update method follows the general method below. At this time
Figure 112019082261249-pat00001
is the learning rate for weight update,
Figure 112019082261249-pat00002
silver angle
Figure 112019082261249-pat00003
It is the derivative of the weight corresponding to the layer. In the present invention, sensitivity or robustness normalization is applied to a loss function that can obtain a differential value of a weight.

Figure 112019082261249-pat00004
Figure 112019082261249-pat00004

정규화 방법이 적용된 손실함수는 다음과 같이 정의될 수 있다. The loss function to which the normalization method is applied can be defined as follows.

즉, 민감도 및 강건성 정규화를 위해 이미지인식기(123, 124, 125) 마지막 층의 미분값을 평균을 계산하여, 레귤러라이저(regularizer)인 R을 계산한다.That is, the average of the differential values of the last layers of the image recognizers 123, 124, and 125 is calculated for normalization of sensitivity and robustness, and R, which is a regularizer, is calculated.

Figure 112019082261249-pat00005
Figure 112019082261249-pat00005

민감도 정규화의 손실값 경우, 레귤러라이저 R과 마진(margin)값인 m을 더한 값으로 CNN(convolution neural network)의 손실값인

Figure 112019082261249-pat00006
을 나누어 준다. In the case of the loss value of the sensitivity normalization, it is the value obtained by adding the regularizer R and the margin value m, which is the loss value of the CNN (convolution neural network).
Figure 112019082261249-pat00006
share the

여기서 마진값은

Figure 112019082261249-pat00007
가 0으로 나누어져 무한대가 되는 경우를 방지하기 위하여 필요하다. Here the margin is
Figure 112019082261249-pat00007
This is necessary to prevent the case where is divided by 0 to become infinity.

민감도 정규화의 손실값 :

Figure 112019082261249-pat00008
Loss of sensitivity normalization:
Figure 112019082261249-pat00008

이와 같이 새롭게 정의된 손실값

Figure 112019082261249-pat00009
을 바탕으로 이미지인식기(121)를 구성하는 가중치를 갱신하기 위한 값은 다음의 식과 같이 구해진다. This newly defined loss value
Figure 112019082261249-pat00009
A value for updating the weight constituting the image recognizer 121 based on

Figure 112019082261249-pat00010
Figure 112019082261249-pat00010

여기서

Figure 112019082261249-pat00011
는 l번째 층의 입력 특징맵이며,
Figure 112019082261249-pat00012
은 l번째 층으로 전파되는 에러값이다.here
Figure 112019082261249-pat00011
is the input feature map of the l-th layer,
Figure 112019082261249-pat00012
is the error value propagated to the l-th layer.

강건성 정규화의 손실값 경우, CNN의 손실값인

Figure 112019082261249-pat00013
에 레귤라이저 R을 더해줌으로써 정의된다. In the case of the loss value of robustness normalization, the loss value of CNN is
Figure 112019082261249-pat00013
It is defined by adding a regulator R to

강건성 정규화의 손실값 :

Figure 112019082261249-pat00014
Loss of robustness normalization:
Figure 112019082261249-pat00014

강건성 정규화를 바탕으로 이미지인식기의 가중치를 갱신하기 위한 값은 다음과 같이 구해진다. The value for updating the weight of the image recognizer based on robustness normalization is obtained as follows.

Figure 112019082261249-pat00015
Figure 112019082261249-pat00015

이러한 손실값들을 통합하기 위하여 CNN 손실값인

Figure 112019082261249-pat00016
에 앞서 정의한 민감도 및 강건성 손실값을
Figure 112019082261249-pat00017
,
Figure 112019082261249-pat00018
계수로 가중치 합을 구해서 더해준다.In order to integrate these loss values, the CNN loss
Figure 112019082261249-pat00016
The sensitivity and robustness loss values defined previously in
Figure 112019082261249-pat00017
,
Figure 112019082261249-pat00018
Calculate the weighted sum of the coefficients and add them.

Figure 112019082261249-pat00019
Figure 112019082261249-pat00019

이에 추가로

Figure 112019082261249-pat00020
계수를 적용하여
Figure 112019082261249-pat00021
와 정규화 항 사이의 계수를 정의하여 얼마나 각 항을 반영할지 정하여, 최종적으로 총 에러값인
Figure 112019082261249-pat00022
를 구한다. in addition to this
Figure 112019082261249-pat00020
by applying a coefficient
Figure 112019082261249-pat00021
Determine how much each term is to be reflected by defining the coefficient between and the regularization term, and finally the total error value
Figure 112019082261249-pat00022
save

Figure 112019082261249-pat00023
Figure 112019082261249-pat00023

새로 정의된 오류값으로 이미지인식기의 가중치를 갱신할 때에는 다음과 같은 경사도 값을 갖는다. When the weight of the image recognizer is updated with the newly defined error value, it has the following gradient value.

Figure 112019082261249-pat00024
Figure 112019082261249-pat00024

이때 학습과정 중 민감도 및 강건성 오류값 간의 비율도 학습될 수 있도록, 총 에러값

Figure 112019082261249-pat00025
을 각 계수인
Figure 112019082261249-pat00026
,
Figure 112019082261249-pat00027
에 대해 편미분을 하여 경사도 값을 구한다. 그리고, 경사도 값을 바탕으로
Figure 112019082261249-pat00028
,
Figure 112019082261249-pat00029
값을 갱신한다. At this time, the total error value so that the ratio between the sensitivity and robustness error values can also be learned during the learning process.
Figure 112019082261249-pat00025
is each coefficient
Figure 112019082261249-pat00026
,
Figure 112019082261249-pat00027
The slope value is obtained by performing partial differentiation with respect to . And, based on the slope value
Figure 112019082261249-pat00028
,
Figure 112019082261249-pat00029
update the value

이때 계수들의 학습률(learning rate)

Figure 112019082261249-pat00030
를 적용하여 학습시킬 수 있다.At this time, the learning rate of the coefficients
Figure 112019082261249-pat00030
can be learned by applying

Figure 112019082261249-pat00031
Figure 112019082261249-pat00031

Figure 112019082261249-pat00032
Figure 112019082261249-pat00032

이와 같은 방법으로 적응형 민감도 및 강건성 정규화를 구현한 후 이와 같은 정규화에 맞추어 각 이미지인식기(121, 122, 123, 124, 125)들을 학습시킨 것이 바람직하다.After implementing the adaptive sensitivity and robustness normalization in this way, it is preferable to train each of the image recognizers 121 , 122 , 123 , 124 , and 125 according to the normalization.

이와 같은 다수의 서로 다른 이미지인식기(121, 122, 123, 124, 125)들이 추출한 결과들을 앙상블(Ensemble)방법을 이용하여 종합한다. The results extracted by a plurality of different image recognizers 121, 122, 123, 124, and 125 are synthesized using the ensemble method.

이미지도출부(120)의 다수의 이미지인식기(121, 122, 123, 124, 125)에는 민감도 정규화가 적용된 이미지인식기(121), 강건성 정규화가 적용된 이미지인식기(122) 그리고 민감도 및 강건성 정규화 모두 적용된 이미지인식기(123)가 있다.A plurality of image recognizers 121, 122, 123, 124, 125 of the image extractor 120 includes an image recognizer 121 to which sensitivity normalization is applied, an image recognizer 122 to which robustness normalization is applied, and an image to which both sensitivity and robustness normalization are applied. There is a recognizer 123 .

예를 들어, 민감도 정규화가 적용된 이미지인식기(121) 1개, 강건성 정규화를 적용한 이미지인식기(122) 1개 그리고 민감도 및 강건성을 모두 적용한 이미지인식기(123, 124, 125) 3개가 이미지도출부(120) 내에 마련된 형태가 있을 수 있다. 이미지인식기(121, 122, 123, 124, 125)들은 앞서 정의된 손실값 식 및 경사도 식의 정의에 따라 미리 학습된 것이 바람직하다.For example, one image recognizer 121 to which sensitivity normalization is applied, one image recognizer 122 to which robustness normalization is applied, and three image recognizers 123, 124, 125 to which both sensitivity and robustness are applied are image extractors 120 ) may have a form provided within. The image recognizers 121 , 122 , 123 , 124 , and 125 are preferably trained in advance according to the definition of the loss value equation and the gradient equation previously defined.

민감도 정규화가 적용된 이미지인식기(121)는 앞서 언급한 민감도 손실값을 이용하여 학습된 것이 바람직하다. The image recognizer 121 to which the sensitivity normalization is applied is preferably learned using the aforementioned sensitivity loss value.

강건성 정규화가 적용된 이미지인식기(122)는 앞서 설명한 강건성 손실값만 이용하여 학습된 것이 바람직하다. It is preferable that the image recognizer 122 to which the robustness normalization is applied is learned using only the aforementioned robustness loss value.

민감도 및 강건성을 모두 적용한 이미지인식기(123)의 경우, 총 손실값인

Figure 112019082261249-pat00033
을 바탕으로 하여 학습될 수 있다. In the case of the image recognizer 123 to which both sensitivity and robustness are applied, the total loss value is
Figure 112019082261249-pat00033
can be learned based on

각 이미지인식기(121, 122, 123, 124, 125)별로 각기 다른 이미지특징을 추출할 수 있도록 하기 위하여

Figure 112019082261249-pat00034
,
Figure 112019082261249-pat00035
계수,
Figure 112019082261249-pat00036
계수, 가중치 갱신을 위한 학습률(
Figure 112019082261249-pat00037
), 계수들의 학습률(
Figure 112019082261249-pat00038
)을 서로 다른 값으로 설정된 것이 바람직하다. In order to be able to extract different image features for each image recognizer (121, 122, 123, 124, 125)
Figure 112019082261249-pat00034
,
Figure 112019082261249-pat00035
Coefficient,
Figure 112019082261249-pat00036
Learning rate for updating coefficients and weights (
Figure 112019082261249-pat00037
), the learning rate of the coefficients (
Figure 112019082261249-pat00038
) is preferably set to different values.

이에 따라 각 이미지인식기(121, 122, 123, 124, 125)는 학습과정 중 서로 다른 이미지인식기(121, 122, 123, 124, 125)로 학습이 되어 간다. Accordingly, each of the image recognizers 121, 122, 123, 124, and 125 is learned with different image recognizers 121, 122, 123, 124, and 125 during the learning process.

앞서 언급한 바와 같이 입력부(110)로부터 전달받은 한자이미지는 각 이미지인식기(121, 122, 123, 124, 125)에 3차원 행렬의 형태로 전달된다. 그리고 학습된 각 이미지인식기(121, 122, 123, 124, 125)들은 서로 다른 이미지특징들을 추출해 낸다. As mentioned above, the Chinese character image received from the input unit 110 is transmitted to each image recognizer 121 , 122 , 123 , 124 , and 125 in the form of a three-dimensional matrix. And each learned image recognizer (121, 122, 123, 124, 125) extracts different image features.

x개의 가능한 한자글자종류가 있을 때, 이미지인식기(121, 122, 123, 124, 125)는 (1*x)의 이미지특징 벡터를 출력하게 된다. When there are x possible types of Chinese characters, the image recognizers 121, 122, 123, 124, and 125 output an image feature vector of (1*x).

그리고 출력된 이미지특징벡터는 식별한자선정부(130)로 전달된다.Then, the output image feature vector is transmitted to the identified character selection unit 130 .

이처럼 민감도 정규화를 통해 입력된 한자이미지 내의 미세한 변동 및 고주파 성분을 고려하여 비슷하게 보이지만 실제로는 다른 한자를 구분해낸다. In this way, by taking into account the minute fluctuations and high-frequency components in the inputted Chinese character image through sensitivity normalization, they look similar but actually distinguish different Chinese characters.

그리고 강건성 정규화는 잉크얼룩, 저해상도 또는 복잡한 배경을 가진 이미지에서도 이미지특징을 추출할 수 있으므로 외견상 다르게 보이지만 실제로는 동일한 한자들을 구분해 낼 수 있다. And robustness normalization can extract image features even from images with ink stains, low resolution, or complex backgrounds, so it can distinguish between seemingly different but actually identical Chinese characters.

그리고, 민감도 정규화와 강건성 정규화에 대한 비율을 학습을 통해 스스로 정할 수도 있다. In addition, the ratio of the sensitivity normalization and the robustness normalization may be determined by oneself through learning.

식별한자선정부(130)는 특징추출부(120)의 각 이미지인식기(121, 122, 123, 124, 125)들로부터 전달받은 다수의 이미지특징 각각에 대하여 신뢰도를 도출한다. 그리고 도출된 신뢰도를 토대로 하여 식별대상인 한자에 해당되는 식별한자를 선정한다. The identified character selection unit 130 derives reliability for each of a plurality of image features received from each of the image recognizers 121 , 122 , 123 , 124 , and 125 of the feature extraction unit 120 . And based on the derived reliability, the identified Chinese characters corresponding to the Chinese characters to be identified are selected.

식별한자선정부(130)에서 여러 이미지인식기(121, 122, 123, 124, 125)로부터 얻어지는 다수의 이미지특징들에 대하여 앙상블 방법을 적용하여 고려하므로 식별대상인 한자에 대하여 높은 정확도로 인식할 수 있게 된다. Since the identified Chinese character selection unit 130 applies the ensemble method to a number of image features obtained from several image recognizers 121, 122, 123, 124, and 125, it is possible to recognize the Chinese character, which is the target of identification, with high accuracy. do.

식별한자선정부(130)는, 특징추출부(120)로부터 전달받은 다수의 이미지특징 각각에 대하여 활성화함수를 이용하여 신뢰도 점수로 구성된 신뢰도 행렬을 산출한다. 여기서 활성화함수(activation function)으로서, 소프트맥스(softmax)함수가 이용되는 것도 바람직하다.The identified character selection unit 130 calculates a reliability matrix composed of reliability scores by using an activation function for each of the plurality of image features received from the feature extraction unit 120 . Here, as the activation function, it is also preferable that a softmax function is used.

이미지특징에 소프트맥스함수를 적용하여 신뢰도 점수를 얻고 이 중 최고의 점수에 해당되는 한자를 한자인식시스템이 예측한 한자로 선정한다.A reliability score is obtained by applying the Softmax function to image features, and the Chinese character corresponding to the highest score is selected as the Chinese character predicted by the Chinese character recognition system.

소프트맥스함수는 다음과 같이 추출된 이미지특징의 값들을 확률값으로 바꾸어 각 열의 합이 1이 되도록 한다. 이때 이미지특징벡터의 크기는 유지된다. The softmax function converts the extracted image feature values into probability values so that the sum of each column becomes 1. At this time, the size of the image feature vector is maintained.

Figure 112019082261249-pat00039
Figure 112019082261249-pat00039

그리고 식별한자선정부(130)는, 산출된 신뢰도행렬의 각 열에서 최대값을 선택하여 신뢰도점수-행벡터를 생성하고, 생성된 신뢰도점수-행벡터 내에서 신뢰도점수가 가장 큰 최대신뢰도점수에 대응되는 한자를 식별대상인 한자에 해당되는 식별한자로서 선정한다.And the identified character selector 130 selects a maximum value from each column of the calculated reliability matrix to generate a reliability score-row vector, and the confidence score corresponds to the maximum reliability score with the largest reliability score in the generated reliability score-row vector. Chinese characters are selected as identifiable Chinese characters corresponding to the Chinese characters to be identified.

각 이미지인식기(121, 122, 123, 124, 125)들로부터 출력된 이미지특징 벡터를 바탕으로 하여 한자글자종류의 확률값을 구하기 위하여 각 이미지특징 벡터별로 활성화함수인 소프트맥스함수를 적용한다. Based on the image feature vectors output from the image recognizers 121, 122, 123, 124, and 125, a softmax function, which is an activation function, is applied to each image feature vector to obtain a probability value of the type of Chinese character.

소프트맥스함수 적용 후 각 이미지특징벡터들은 (1*x)의 크기는 유지되지만, 각 열의 값들 합이 1이 되는 신뢰도 점수를 갖게 된다. After applying the softmax function, each image feature vector maintains the size of (1*x), but has a reliability score in which the sum of the values in each column becomes 1.

y개의 이미지인식기가 있을 때, (1*x)의 신뢰도 벡터가 y개가 있으므로 (y*x) 크기의 신뢰도 행렬을 구성할 수 있다. When there are y image recognizers, since there are y reliability vectors of (1*x), a reliability matrix of size (y*x) can be constructed.

i번째 행에 j 번째 열의 신뢰도 점수는 i번째 이미지인식기가 예측한 j번째 한자글자의 신뢰도점수가 된다.The confidence score of the j-th column in the i-th row becomes the confidence score of the j-th Chinese character predicted by the i-th image recognizer.

각 이미지인식기(121, 122, 123, 124, 125) 별 한자글자 신뢰도점수로 구성된 신뢰도 행렬로부터 최종적으로 입력부에 입력된 한자를 인식한 최종결과인 식별한자를 결정하기 위하여 신뢰도점수의 최대값을 선택한다.The maximum value of the reliability score is selected to determine the final result of recognizing the Chinese character input to the input unit from the reliability matrix composed of the reliability scores for each Chinese character for each image recognizer (121, 122, 123, 124, 125) do.

신뢰도 행렬의 각 열에서 최대값을 선택한다. j번째 열에서 선택된 신뢰도 점수는 각 이미지인식기에서 j번째 한자 글자에 대해 예측한 신뢰도 점수들의 최대값을 취한다. Select the maximum value in each column of the confidence matrix. The confidence score selected in the j-th column takes the maximum value of the confidence scores predicted for the j-th Chinese character by each image recognizer.

x개의 한자 글자 종류가 있다면, 각 열에 대해 최대값을 선택한 후 (1*x) 신뢰도 벡터가 만들어진다. If there are x types of Chinese characters, a (1*x) confidence vector is created after selecting the maximum value for each column.

생성된 신뢰도 벡터에서 최종적으로 식별대상인 한자가 어떤 한자글자인지 결정하기 위하여 각 신뢰도 점수들 중에서 다시 최대값을 선택한다.In order to determine which Chinese character the final identification target is from the generated confidence vector, the maximum value is selected again from among the reliability scores.

그리고 선정된 최대값에 해당되는 한자를 식별한자로 선정하고, 이를 출력부(140)로 전달한다.Then, a Chinese character corresponding to the selected maximum value is selected as an identifiable Chinese character, and this is transmitted to the output unit 140 .

필요에 따라서는 신뢰도벡터의 각 행과 열에 대응되는 한자들이 저장된 데이터베이스가 별도로 마련되어 있는 형태도 가능하며 이 또한 바람직하다.If necessary, a database in which Chinese characters corresponding to each row and column of the reliability vector are stored may be separately provided, and this is also preferable.

출력부(140)는 식별한자선정부(130)에서 선정된 식별한자를 식별한자선정부(130)로부터 전달받아서 출력한다.The output unit 140 receives and outputs the identified Chinese character selected by the identified character selection unit 130 from the identified character selection unit 130 .

출력부(140)로서, 이용자가 식별한자를 시각적으로 인식할 수 있도록 전시시켜줄 수 있는 모니터와 같은 디스플레이장치도 바람직하다. As the output unit 140 , a display device such as a monitor capable of displaying the identified character to be visually recognized by the user is also preferable.

이와 같이, 출력부(140)를 통해 식별대상인 한자를 인식한 결과인 식별한자를 사용자에게 제공함으로써 사용자는 식별대상인 한자가 식별한자라는 것을 알 수 있게 된다.In this way, by providing the user with the identified Chinese character, which is the result of recognizing the Chinese character as the identification target through the output unit 140 , the user can know that the Chinese character as the identification target is the identified character.

이상에서 설명한 바와 같은 한자인식시스템(100)을 이용한 한자인식방법에 대하여 도 2를 더 참조하여 설명한다. 도 2는 본 발명의 실시 예에 따른 한자인식시스템(100)을 이용한 한자인식방법을 개략적으로 나타낸 순서도이다. A Chinese character recognition method using the Chinese character recognition system 100 as described above will be further described with reference to FIG. 2 . 2 is a flowchart schematically illustrating a Chinese character recognition method using the Chinese character recognition system 100 according to an embodiment of the present invention.

도 2를 더 참조하면 본 발명의 실시 예에 따른 한자인식시스템을 이용한 한자인식방법은 입력단계(S110), 추출단계(S120), 신뢰도도출단계(S130) 및 식별한자선정단계(S140)를 포함하여 이루어지며, 좀 더 바람직하게는 출력단계(S300)를 더 포함하여 이루어질 수도 있다.2, the Chinese character recognition method using the Chinese character recognition system according to an embodiment of the present invention includes an input step (S110), an extraction step (S120), a reliability derivation step (S130) and an identified Chinese character selection step (S140) This is done, and more preferably, the output step (S300) may be further included.

<< S110 >><< S110 >>

입력단계(S110)는 한자인식시스템(100)이 식별대상인 한자의 이미지인 한자이미지를 입력받는 단계이다.The input step S110 is a step in which the Chinese character recognition system 100 receives a Chinese character image that is an image of a Chinese character to be identified.

입력부(110)을 통해 식별하고자하는 한자의 이미지가 입력된다. 그리고 입력부(110)는 이미지행렬의 형태로 된 한자이미지를 특징추출부(120)로 전달한다. An image of Chinese characters to be identified is input through the input unit 110 . And the input unit 110 transmits the Chinese character image in the form of an image matrix to the feature extraction unit 120 .

한자이미지는 특징추출부(120)의 다수의 이미지인식기(121, 122, 123, 124, 125) 로 전달된다.The Chinese character image is transmitted to a plurality of image recognizers 121 , 122 , 123 , 124 , 125 of the feature extraction unit 120 .

<< S120 >><< S120 >>

추출단계(S120)는 입력단계(S110)에서 입력받은 한자이미지로부터 특징추출부(120)가 다수의 이미지특징을 추출하는 단계이다.The extraction step (S120) is a step in which the feature extraction unit 120 extracts a plurality of image features from the Chinese character image input in the input step (S110).

특징추출부(120)의 다수의 이미지인식기(121,122,123,124)는 입력부(12)로부터 전달받은 한자이미지로부터 각기 이미지특징을 추출한다. A plurality of image recognizers 121 , 122 , 123 , and 124 of the feature extraction unit 120 extracts image features from the Chinese character image received from the input unit 12 .

여기서 다수의 이미지인식기(121,122, 123, 124, 125) 각각은 앞서 설명한 바와 같이 딥러닝모델이 적용되어 있는 것이 바람직하다. Here, it is preferable that a deep learning model is applied to each of the plurality of image recognizers 121, 122, 123, 124, and 125 as described above.

<< S130 >><< S130 >>

신뢰도도출단계(S130)는 추출단계(S120)에서 추출된 다수의 이미지특징으로부터 신뢰도점수를 도출하는 단계이다. The reliability deriving step (S130) is a step of deriving a reliability score from a plurality of image features extracted in the extraction step (S120).

다수의 이미지인식기(121, 122, 123, 124, 125) 각각으로부터 추출된 이미지특징을 식별한자선정부(130)가 전달받는다. 그리고 신뢰도점수를 도출한다.The self-selection unit 130 that identifies the image features extracted from each of the plurality of image recognizers 121 , 122 , 123 , 124 and 125 is delivered. And a reliability score is derived.

식별한자선정부(130)는, 특징추출부(120)로부터 전달받은 다수의 이미지특징 각각에 대하여 활성화함수를 이용하여 신뢰도 점수로 구성된 신뢰도 행렬을 산출한다. 여기서 활성화함수(activation function)으로서, 앞서 설명한 바와 같이 소프트맥스(softmax)함수가 이용되는 것도 바람직하다.The identified character selection unit 130 calculates a reliability matrix composed of reliability scores by using an activation function for each of the plurality of image features received from the feature extraction unit 120 . Here, as the activation function, it is also preferable to use a softmax function as described above.

<< S140 >><< S140 >>

식별한자선정단계(S140)는 신뢰도도출단계(S130)에서 도출된 다수의 신뢰도점수로부터 식별대상인 한자에 해당되는 식별한자를 선정하는 단계이다.The identified Chinese character selection step (S140) is a step of selecting an identified Chinese character corresponding to the Chinese character to be identified from a plurality of reliability scores derived in the reliability derivation step (S130).

식별한자선정단계(S140)에서 이루어지는 식별한자의 선정은, 식별한자선정부(130)가 다수의 상기 신뢰도점수 중에서 가장 큰 값인 최대신뢰도점수에 대응되는 한자를 식별한자로서 선정함으로써 이루어지는 것이 바람직하다. The selection of the identified Chinese character in the identified Chinese character selection step (S140) is preferably performed by the identified Chinese character selecting unit 130 selecting the Chinese character corresponding to the maximum reliability score, which is the largest value among the plurality of reliability scores, as the identified character.

이미지특징에 소프트맥스함수를 적용하여 신뢰도 점수를 얻고 이 중 최고의 점수에 해당되는 한자를 한자인식시스템이 예측한 식별한자로 선정한다.A reliability score is obtained by applying the Softmax function to image features, and the Chinese character corresponding to the highest score is selected as the identified Chinese character predicted by the Chinese character recognition system.

식별한자선정부(130)는 선정된 식별한자를 사용자가 알 수 있도록 출력부로 전달할 수 있다. The identified Chinese character selection unit 130 may transmit the selected Chinese character to the output unit so that the user can know it.

<< S150 >><< S150 >>

식별한자선정단계(S140) 이후에 이루어지는 단계로서, 출력단계(S150)는 식별한자선정단계(S140)에서 선정된 식별한자를 외부에서 인식할 수 있도록 출력하는 단계이다. As a step performed after the identified Chinese character selection step (S140), the output step (S150) is a step of outputting the identified Chinese character selected in the identified Chinese character selection step (S140) so that it can be recognized from the outside.

식별한자선정부(130)에서 선정된 식별한자를 사용자가 인식할 수 있도록 모니터와 같은 출력부(140)를 통해 출력된다. 따라서 사용자는 출력부(140)를 통해 출력된 식별한자를 보고 식별대상인 한자를 알 수 있게 된다.The identified Chinese character selected by the Chinese character selection unit 130 is output through the output unit 140 such as a monitor so that the user can recognize it. Accordingly, the user can see the Chinese characters output through the output unit 140 and know the Chinese characters to be identified.

입력단계 이전에 이루어질 수 있는 단계로서, 한자이미지로부터 다수의 이미지특징을 추출할 수 있도록 한자인식시스템(100)의 이미지인식기(121, 122, 123, 124, 125)에 앞서 설명한 바와 같이 딥러닝모델을 적용시키고 정규화하여 학습시켜 놓은 것도 바람직하다. 도 2에 도시되지는 않았으나 이러한 단계를 사전러닝단계 라고 하고 사전에 다수의 이미지인식기(121, 122, 123, 124, 125) 들을 학습시켜놓는 것 또한 바람직하다.As a step that can be made before the input step, the deep learning model as described above for the image recognizers 121, 122, 123, 124, and 125 of the Chinese character recognition system 100 to extract a number of image features from the Chinese character image It is also desirable to apply and normalize the training. Although not shown in FIG. 2, this step is called a pre-learning step, and it is also preferable to train a plurality of image recognizers 121, 122, 123, 124, and 125 in advance.

이상에서 설명한 바와 같은 본 발명에 따른 한자인식시스템 및 이를 이용한 한자인식방법은 이미지인식기의 민감도 정규화와 강건성 정규화를 적용하여 앙상블방법을 통해 한자를 인식하므로 혼동되기 쉬운 초서체와 같은 한자이미지에 대한 인식률이 증대된다. As described above, the Chinese character recognition system and the Chinese character recognition method using the same according to the present invention recognize Chinese characters through the ensemble method by applying the sensitivity normalization and robustness normalization of the image recognizer. is increased

즉, 민감도 정규화를 통해 입력된 한자이미지 내의 미세한 변동 및 고주파 성분을 고려하여 비슷하게 보이지만 실제로는 다른 한자를 구분해낸다. 그리고 강건성 정규화는 잉크얼룩, 저해상도 또는 복잡한 배경을 가진 이미지에서도 이미지특징을 추출할 수 있으므로 외견상 다르게 보이지만 실제로는 동일한 한자들을 구분해 낼 수 있다. In other words, considering the minute fluctuations and high-frequency components in the inputted Chinese character image through sensitivity normalization, they look similar but actually distinguish different Chinese characters. And robustness normalization can extract image features from images with ink stains, low resolution, or complex backgrounds, so it can distinguish between seemingly different Chinese characters, but actually the same.

그리고, 민감도 정규화와 강건성 정규화에 대한 비율을 학습을 통해 스스로 정할 수도 있다. 이와 같이 구성된 여러 이미지인식기를 앙상블 방법을 적용하여 여러 이미지인식기의 결과들을 함께 고려하므로 식별대상인 한자에 대하여 높은 정확도로 인식할 수 있다. In addition, the ratio of the sensitivity normalization and the robustness normalization may be determined by oneself through learning. Since the results of several image recognizers are considered together by applying the ensemble method to several image recognizers configured as described above, it is possible to recognize Chinese characters as identification objects with high accuracy.

이와 같이, 본 발명에 따른 한자인식시스템 및 한자인식방법은 한자가 오랜 시간의 경과로 인하여 알아보기 곤란하거나 다양한 필체 또는 크기, 문자들 간의 높은 유사도, 한자기록물의 품질이 저하되었더라도 한자 인식의 정확성을 증대시켜준다. 따라서 종래에 인식하기 어려웠었던 전통 기록물의 한자를 인식하는데 기여하는 장점이 있다. 또한, 전통기록물을 디지털화 하여 보존하는 고문헌기록 작업의 능률 향상에 기여하는 장점도 있다.In this way, the Chinese character recognition system and the Chinese character recognition method according to the present invention are difficult to recognize due to the passage of a long time, or the accuracy of the Chinese character recognition is improved even if the high similarity between various handwriting or sizes and characters, and the quality of the Chinese character records are deteriorated. it increases Therefore, there is an advantage of contributing to recognizing the Chinese characters of traditional records that were difficult to recognize in the past. In addition, there is an advantage that contributes to the improvement of the efficiency of archival records that digitize and preserve traditional records.

이상에서 설명된 바와 같이, 본 발명에 대한 구체적인 설명은 첨부된 도면을 참조한 실시 예들에 의해서 이루어졌지만, 상술한 실시 예들은 본 발명의 바람직한 실시 예를 들어 설명하였을 뿐이기 때문에, 본 발명이 상기의 실시 예에만 국한되는 것으로 이해되어져서는 아니되며, 본 발명의 권리범위는 후술하는 청구범위 및 그 등가개념으로 이해되어져야 할 것이다. As described above, the detailed description of the present invention has been made by the embodiments with reference to the accompanying drawings, but since the above-described embodiments have only been described with reference to the preferred embodiments of the present invention, the present invention It should not be construed as being limited only to the embodiments, and the scope of the present invention should be understood as the following claims and their equivalents.

100 : 한자인식시스템
110 : 서버 120 : 특징추출부
121, 122, 123, 124, 125 : 이미지인식기
130 : 식별한자선정부 140 : 출력부
100: Chinese character recognition system
110: server 120: feature extraction unit
121, 122, 123, 124, 125: image recognizer
130: identified character selection unit 140: output unit

Claims (10)

식별대상인 한자의 이미지인 한자이미지를 입력받는 입력부;
상기 입력부로부터 전달받은 상기 한자이미지로부터 이미지특징을 추출하기 위한 딥러닝모델(deep learning model)이 적용된 이미지인식기를 다수 포함하는 특징추출부;
상기 특징추출부로부터 전달받은 다수의 상기 이미지특징 각각에 대하여 신뢰도를 도출하고, 상기 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정부; 및
상기 식별한자선정부에서 선정된 상기 식별한자를 상기 식별한자선정부로부터 전달받아서 출력하는 출력부; 를 포함하며,
상기 이미지인식기는,
민감도 및 강건성 정규화 방법 중 적어도 하나의 방법을 통해 학습이 이루어진 것이고,
상기 민감도 정규화 방법은 서로 다른 한자이미지인 비트윈-클라스(between-class) 이미지를 구분하는 것이며,
상기 강건성 정규화 방법은 동일한 한자이미지인 위드인-클라스(within-class) 이미지를 구분하는 것이며,
상기 식별한자선정부는 상기 이미지인식기로부터 추출된 결과를 앙상블(Ensemble)방법으로 수집하는 한자인식시스템.
an input unit for receiving a Chinese character image that is an image of a Chinese character to be identified;
a feature extracting unit including a plurality of image recognizers to which a deep learning model for extracting image features from the Chinese character image received from the input unit is applied;
an identified Chinese character selection unit for deriving reliability for each of the plurality of image features received from the feature extraction unit, and selecting an identified Chinese character corresponding to the Chinese character to be identified; and
an output unit for receiving and outputting the identified Chinese character selected by the identified Chinese character selecting unit from the identified Chinese character selecting unit; includes,
The image recognizer,
Learning was made through at least one of the sensitivity and robustness regularization methods,
The sensitivity normalization method is to distinguish between-class images, which are different Chinese character images,
The robustness normalization method is to distinguish the same Chinese character image, without-class (within-class) image,
The Chinese character recognition system that the identified Chinese character selection unit collects the results extracted from the image recognizer by an ensemble method.
제 1항에 있어서,
상기 입력부에서 상기 특징추출부로 전달되는 상기 한자이미지는 다채널의 이미지행렬의 형태를 갖추고 있으며,
다채널의 이미지행렬의 형태를 갖춘 상기 한자이미지를 전달받은 다수의 상기 이미지인식기는 각기 행벡터의 형태를 갖춘 이미지특징을 추출하는 것을 특징으로 하는 한자인식시스템.
The method of claim 1,
The Chinese character image transmitted from the input unit to the feature extraction unit has the form of a multi-channel image matrix,
A Chinese character recognition system, characterized in that the plurality of image recognizers that have received the Chinese character image having the form of a multi-channel image matrix extract image features each having the form of a row vector.
삭제delete 삭제delete 삭제delete 제 1항에 있어서,
상기 식별한자선정부는,
상기 특징추출부로부터 전달받은 다수의 상기 이미지특징에 각각에 대하여 활성화함수를 이용하여 신뢰도 점수로 구성된 신뢰도 행렬을 산출하는 것을 특징으로 하는 한자인식시스템.
The method of claim 1,
The identified character selection unit,
A Chinese character recognition system, characterized in that for each of the plurality of image features received from the feature extraction unit, a reliability matrix composed of reliability scores is calculated by using an activation function.
제 6항에 있어서,
상기 식별한자선정부는,
산출된 상기 신뢰도행렬의 각 열에서 최대값을 선택하여 신뢰도점수-행벡터를 생성하고,
생성된 상기 신뢰도점수-행벡터 내에서 상기 신뢰도점수가 가장 큰 최대신뢰도점수에 대응되는 한자를 상기 식별대상인 한자에 해당되는 상기 식별한자로서 선정하는 것을 특징으로 하는 한자인식시스템.
7. The method of claim 6,
The identified character selection unit,
Selecting a maximum value in each column of the calculated reliability matrix to generate a confidence score-row vector,
A Chinese character recognition system, characterized in that, in the generated confidence score-row vector, a Chinese character corresponding to a maximum reliability score having the highest reliability score is selected as the identified Chinese character corresponding to the Chinese character to be identified.
한자인식시스템이 식별대상인 한자의 이미지인 한자이미지를 입력받는 입력단계;
상기 입력단계에서 입력받은 상기 한자이미지로부터 다수의 이미지특징을 추출하는 추출단계;
상기 추출단계에서 추출된 다수의 상기 이미지특징으로부터 신뢰도점수를 도출하는 신뢰도도출단계; 및
상기 신뢰도도출단계에서 도출된 다수의 상기 신뢰도점수로부터 상기 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정단계;를 포함하며,
상기 입력단계에서 입력받은 상기 한자이미지로부터 다수의 이미지특징을 추출하는 추출단계;는,
상기 한자이미지로부터 이미지특징을 추출하기 위한 딥러닝모델(deep learning model)이 적용된 다수의 이미지인식기에 의해 수행되고,
상기 이미지인식기는,
민감도 및 강건성 정규화 방법 중 적어도 하나의 방법을 통해 학습이 이루어진 것이고,
상기 민감도 정규화 방법은 서로 다른 한자이미지인 비트윈-클라스(between-class) 이미지를 구분하는 것이며,
상기 강건성 정규화 방법은 동일한 한자이미지인 위드인-클라스(within-class) 이미지를 구분하는 것이며,
상기 추출단계에서 추출된 다수의 상기 이미지특징으로부터 신뢰도점수를 도출하는 신뢰도도출단계;는,
상기 이미지인식기로부터 추출된 결과를 앙상블(Ensemble)방법으로 수집하는 단계를 포함하는 한자인식시스템을 이용한 한자인식방법.
An input step of receiving a Chinese character image that is an image of a Chinese character to be identified by the Chinese character recognition system;
an extraction step of extracting a plurality of image features from the Chinese character image received in the input step;
a reliability derivation step of deriving a reliability score from the plurality of image features extracted in the extraction step; and
An identified Chinese character selection step of selecting an identified Chinese character corresponding to the Chinese character to be identified from a plurality of the reliability scores derived in the reliability deriving step;
An extraction step of extracting a plurality of image features from the Chinese character image input in the input step;
It is performed by a plurality of image recognizers to which a deep learning model for extracting image features from the Chinese character image is applied,
The image recognizer,
Learning was made through at least one of the sensitivity and robustness regularization methods,
The sensitivity normalization method is to distinguish between-class images, which are different Chinese character images,
The robustness normalization method is to distinguish the same Chinese character image, without-class (within-class) image,
Reliability derivation step of deriving a reliability score from the plurality of image features extracted in the extraction step;
A Chinese character recognition method using a Chinese character recognition system, comprising the step of collecting the results extracted from the image recognizer by an ensemble method.
제 8항에 있어서,
상기 식별한자선정단계 이후에 이루어지는 단계로서,
상기 식별한자선정단계에서 선정된 상기 식별한자를 외부에서 인식할 수 있도록 출력하는 출력단계;를 더 포함하는 것을 특징으로 하는 한자인식시스템을 이용한 한자인식방법.
9. The method of claim 8,
As a step made after the identified Chinese character selection step,
The Chinese character recognition method using the Chinese character recognition system, characterized in that it further comprises; an output step of outputting the identified Chinese character selected in the identified Chinese character selection step so that it can be recognized from the outside.
제 9항에 있어서,
상기 식별한자선정단계에서 이루어지는 상기 식별한자의 선정은,
다수의 상기 신뢰도점수 중에서 가장 큰 값인 최대신뢰도점수에 대응되는 한자를 상기 식별한자로서 선정함으로써 이루어지는 것을 특징으로 하는 한자인식시스템을 이용한 한자인식방법.
10. The method of claim 9,
The selection of the identified Chinese character made in the identified Chinese character selection step is
A Chinese character recognition method using a Chinese character recognition system, characterized in that it is made by selecting a Chinese character corresponding to the maximum reliability score, which is the largest value among the plurality of reliability scores, as the identified Chinese character.
KR1020190098004A 2019-06-27 2019-08-12 Traditional Korean character Hanja Recognition System and method using thereof KR102264988B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190077336 2019-06-27
KR20190077336 2019-06-27

Publications (2)

Publication Number Publication Date
KR20210001817A KR20210001817A (en) 2021-01-06
KR102264988B1 true KR102264988B1 (en) 2021-06-16

Family

ID=74128846

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190098004A KR102264988B1 (en) 2019-06-27 2019-08-12 Traditional Korean character Hanja Recognition System and method using thereof

Country Status (1)

Country Link
KR (1) KR102264988B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102636135B1 (en) * 2021-01-29 2024-02-14 경북대학교 산학협력단 Method for low-shot transfer with attention for highly imbalanced cursive character recognition, recording medium and device for performing the method
KR102619368B1 (en) * 2021-02-01 2024-01-02 (주)메인라인 Apparatus, method and user device for recognizing optimal text using ocr ai algorithm of a different kind based on deep learning

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014232533A (en) * 2013-05-28 2014-12-11 ゼロックス コーポレイションXerox Corporation System and method for ocr output verification
KR101777601B1 (en) * 2016-01-11 2017-09-13 경북대학교 산학협력단 Distinction method and system for characters written in caoshu characters or cursive characters
KR101979654B1 (en) * 2018-01-15 2019-05-17 주식회사 비엔인더스트리 License plate recognition apparatus and the method thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100389004B1 (en) 2001-05-17 2003-06-25 삼성전자주식회사 Apparatus for recognizing image by using neural network and method thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014232533A (en) * 2013-05-28 2014-12-11 ゼロックス コーポレイションXerox Corporation System and method for ocr output verification
KR101777601B1 (en) * 2016-01-11 2017-09-13 경북대학교 산학협력단 Distinction method and system for characters written in caoshu characters or cursive characters
KR101979654B1 (en) * 2018-01-15 2019-05-17 주식회사 비엔인더스트리 License plate recognition apparatus and the method thereof

Also Published As

Publication number Publication date
KR20210001817A (en) 2021-01-06

Similar Documents

Publication Publication Date Title
CN111259930B (en) General target detection method of self-adaptive attention guidance mechanism
CN110399905B (en) Method for detecting and describing wearing condition of safety helmet in construction scene
KR20200098379A (en) Method, apparatus, device and readable storage medium for image-based data processing
WO2017016240A1 (en) Banknote serial number identification method
CN107122375A (en) The recognition methods of image subject based on characteristics of image
US8730157B2 (en) Hand pose recognition
CN106529499A (en) Fourier descriptor and gait energy image fusion feature-based gait identification method
CN111783505A (en) Method and device for identifying forged faces and computer-readable storage medium
WO2012132418A1 (en) Characteristic estimation device
KR20060097074A (en) Apparatus and method of generating shape model of object and apparatus and method of automatically searching feature points of object employing the same
CN111461213B (en) Training method of target detection model and target rapid detection method
WO2021042505A1 (en) Note generation method and apparatus based on character recognition technology, and computer device
JP5207870B2 (en) Dimension reduction method, pattern recognition dictionary generation device, and pattern recognition device
CN111738048B (en) Pedestrian re-identification method
KR102264988B1 (en) Traditional Korean character Hanja Recognition System and method using thereof
CN114038037B (en) Expression label correction and identification method based on separable residual error attention network
CN109657567B (en) Weak supervision characteristic analysis method and system based on 3D fingerprint image
CN109033321B (en) Image and natural language feature extraction and keyword-based language indication image segmentation method
CN109983473A (en) Flexible integrated identification and semantic processes
CN109886281A (en) One kind is transfinited learning machine color image recognition method based on quaternary number
CN114419151A (en) Multi-target tracking method based on contrast learning
CN114842343A (en) ViT-based aerial image identification method
CN110503090B (en) Character detection network training method based on limited attention model, character detection method and character detector
CN114722892A (en) Continuous learning method and device based on machine learning
CN117576079A (en) Industrial product surface abnormality detection method, device and system

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant