KR102264988B1 - Traditional Korean character Hanja Recognition System and method using thereof - Google Patents
Traditional Korean character Hanja Recognition System and method using thereof Download PDFInfo
- Publication number
- KR102264988B1 KR102264988B1 KR1020190098004A KR20190098004A KR102264988B1 KR 102264988 B1 KR102264988 B1 KR 102264988B1 KR 1020190098004 A KR1020190098004 A KR 1020190098004A KR 20190098004 A KR20190098004 A KR 20190098004A KR 102264988 B1 KR102264988 B1 KR 102264988B1
- Authority
- KR
- South Korea
- Prior art keywords
- chinese character
- image
- identified
- reliability
- unit
- Prior art date
Links
Images
Classifications
-
- G06K9/3258—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
-
- G06K2209/011—
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
Abstract
본 발명은 한자인식시스템 및 이를 이용한 한자인식방법에 관한 것으로, 본 발명에 따르면, 식별대상인 한자의 이미지인 한자이미지를 입력받는 입력부; 한자이미지로부터 이미지특징을 추출하기 위한 딥러닝모델이 적용된 이미지인식기를 다수 포함하는 특징추출부; 다수의 상기 이미지특징 각각에 대하여 신뢰도를 도출하고, 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정부; 및 식별한자를 상기 식별한자선정부로부터 전달받아서 출력하는 출력부; 를 포함하므로 알아보기 곤란하거나 초서체 또는 흘림체와 같이 다양한 필체 또는 크기, 한자기록물의 품질이 저하되었더라도 한자 인식의 정확성을 증대시켜 줄 수 있는 기술이 개시된다.The present invention relates to a Chinese character recognition system and a Chinese character recognition method using the same, and according to the present invention, an input unit for receiving a Chinese character image, which is an image of a Chinese character to be identified; a feature extraction unit including a plurality of image recognizers to which a deep learning model for extracting image features from a Chinese character image is applied; an identified Chinese character selection unit that derives reliability for each of the plurality of image features and selects an identified Chinese character corresponding to a Chinese character to be identified; and an output unit for receiving and outputting the identified Chinese characters from the identified Chinese character selection unit; Disclosed is a technology capable of increasing the accuracy of recognizing Chinese characters even though it is difficult to recognize, or the quality of various handwriting or sizes, such as cursive or cursive type, or the quality of Chinese character records is deteriorated.
Description
본 발명은 전통기록물과 같은 고문서에서 주로 사용되는 초서체 또는 흘림체로 작성된 한자를 정확하게 식별하여 사용자가 한자를 인식할 수 있도록 식별결과를 제공할 수 있는 한자인식 시스템 및 이를 이용한 한자인식방법에 관한 것이다. The present invention relates to a Chinese character recognition system capable of providing an identification result so that a user can recognize Chinese characters by accurately identifying Chinese characters written in cursive or cursive fonts mainly used in ancient documents such as traditional records, and a Chinese character recognition method using the same.
근래에 전 세계적으로 문화 컨텐츠 발굴에 대한 관심이 증가하고 있으며, 문화컨텐츠를 다양화하기 위한 여러 노력이 다방면에 걸쳐 진행되고 있다. 그 중에서 서지학(Bilblography) 분야에서는 주로 사용되는 고전사료를 분석하고, 분석된 내용을 토대로 하여 전통문화 또는 역사적 사건이나 배경 등을 탐구하는 연구활동이 이루어지고 있는데, 이를 위해서는 사료에 대한 정확한 파악과 분석이 수행되어야 한다.In recent years, interest in discovering cultural contents is increasing worldwide, and various efforts are being made to diversify cultural contents. Among them, in the field of bibliography, research activities are being carried out to analyze classical historical materials that are mainly used, and to explore traditional culture or historical events or backgrounds based on the analyzed contents. For this purpose, accurate identification and analysis of historical materials is conducted. This should be done.
그러나, 대부분의 사료는 현 시대에 잘 사용하지 않는 고어(古語)로 작성되어 있으므로 사료의 분석이 쉽지 않은데, 그 중에서도 한자의 서체 중 일부인 초서체 또는 흘림체로 작성된 문자의 경우에는 정확한 문자의 파악과 식별이 쉽지 않다. 따라서, 이러한 초서체 또는 흘림체로 작성된 문자를 정확하게 파악할 수 있는 발전된 인식기술이 요청되고 있다.However, most of the historical materials are written in an ancient language that is not often used in the present era, so it is difficult to analyze the historical documents. Among them, in the case of characters written in cursive or cursive fonts, which are part of Chinese characters, accurate identification and identification of characters This is not easy. Accordingly, there is a demand for an advanced recognition technology capable of accurately identifying characters written in such cursive or cursive fonts.
본 발명의 목적은 상기한 바와 같은 종래의 문제점을 해결하기 위한 것으로, 전통기록물과 같은 고문서에서 주로 사용되는 초서체 또는 흘림체로 작성된 한자를 정확하게 식별할 수 있는 한자인식시스템 및 이를 이용한 한자인식방법을 제공함에 있다.An object of the present invention is to solve the conventional problems as described above, and to provide a Chinese character recognition system that can accurately identify Chinese characters written in cursive or cursive fonts mainly used in ancient documents such as traditional records, and a Chinese character recognition method using the same. is in
상기와 같은 목적을 달성하기 위한 본 발명의 실시 예에 따른 한자인식시스템은 식별대상인 한자의 이미지인 한자이미지를 입력받는 입력부; 상기 입력부로부터 전달받은 상기 한자이미지로부터 이미지특징을 추출하기 위한 딥러닝모델(deep learning model)이 적용된 이미지인식기를 다수 포함하는 특징추출부; 상기 특징추출부로부터 전달받은 다수의 상기 이미지특징 각각에 대하여 신뢰도를 도출하고, 상기 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정부; 및 상기 식별한자선정부에서 선정된 상기 식별한자를 상기 식별한자선정부로부터 전달받아서 출력하는 출력부; 를 포함하는 것을 하나의 특징으로 할 수도 있다.A Chinese character recognition system according to an embodiment of the present invention for achieving the above object includes an input unit for receiving a Chinese character image that is an image of a Chinese character to be identified; a feature extracting unit including a plurality of image recognizers to which a deep learning model for extracting image features from the Chinese character image received from the input unit is applied; an identified Chinese character selection unit for deriving reliability for each of the plurality of image features received from the feature extraction unit, and selecting an identified Chinese character corresponding to the Chinese character to be identified; and an output unit for receiving and outputting the identified Chinese character selected by the identified Chinese character selecting unit from the identified Chinese character selecting unit; It may be characterized as one of including.
여기서, 상기 입력부에서 상기 특징추출부로 전달되는 상기 한자이미지는 다채널의 이미지행렬의 형태를 갖추고 있으며, 다채널의 이미지행렬의 형태를 갖춘 상기 한자이미지를 전달받은 다수의 상기 이미지인식기는 각기 행벡터의 형태를 갖춘 이미지특징을 추출하는 것을 또 하나의 특징으로 할 수도 있다.Here, the Chinese character image transmitted from the input unit to the feature extraction unit has the form of a multi-channel image matrix, and a plurality of the image recognizers that have received the Chinese character image having the form of a multi-channel image matrix are each of a row vector. Extracting an image feature having a shape may be another feature.
여기서, 딥러닝모델이 적용된 다수의 상기 이미지인식기 중에는, 민감도 정규화 방법을 통해 학습이 이루어진 상기 이미지인식기가 있는 것을 또 하나의 특징으로 할 수도 있다.Here, among the plurality of image recognizers to which the deep learning model is applied, it may be further characterized that there is the image recognizer that has been trained through a sensitivity normalization method.
여기서, 딥러닝모델이 적용된 다수의 상기 이미지인식기 중에는, 강건성(Robustness) 정규화 방법을 통해 학습이 이루어진 상기 이미지인식기가 있는 것을 또 하나의 특징으로 할 수도 있다.Here, among the plurality of image recognizers to which the deep learning model is applied, another feature may be that there is the image recognizer that has been trained through a robustness normalization method.
여기서, 딥러닝모델이 적용된 다수의 상기 이미지인식기 중에는, 민감도 및 강건성 정규화 방법을 통해 학습이 이루어진 상기 이미지인식기가 있는 것을 또 하나의 특징으로 할 수도 있다.Here, among the plurality of image recognizers to which the deep learning model is applied, another feature may be that there is the image recognizer that has been trained through a sensitivity and robustness normalization method.
여기서, 상기 식별한자선정부는, 상기 특징추출부로부터 전달받은 다수의 상기 이미지특징에 각각에 대하여 활성화함수를 이용하여 신뢰도 점수로 구성된 신뢰도 행렬을 산출하는 것을 또 하나의 특징으로 할 수도 있다.Here, another feature may be that the identified character selection unit calculates a reliability matrix composed of reliability scores by using an activation function for each of the plurality of image features received from the feature extraction unit.
여기서, 상기 식별한자선정부는, 산출된 상기 신뢰도행렬의 각 열에서 최대값을 선택하여 신뢰도점수-행벡터를 생성하고, 생성된 상기 신뢰도점수-행벡터 내에서 상기 신뢰도점수가 가장 큰 최대신뢰도점수에 대응되는 한자를 상기 식별대상인 한자에 해당되는 상기 식별한자로서 선정하는 것을 또 하나의 특징으로 할 수도 있다.Here, the identified character selection unit selects a maximum value from each column of the calculated reliability matrix to generate a reliability score-row vector, and the confidence score corresponds to the maximum reliability score with the largest reliability score in the generated reliability score-row vector Another feature may be to select a Chinese character to be identified as the identified Chinese character corresponding to the Chinese character to be identified.
상기와 같은 목적을 달성하기 위한 본 발명의 실시 예에 따른 한자인식방법은, 본 발명에 따른 한자인식시스템이 식별대상인 한자의 이미지인 한자이미지를 입력받는 입력단계; 상기 입력단계에서 입력받은 상기 한자이미지로부터 다수의 이미지특징을 추출하는 추출단계; 상기 추출단계에서 추출된 다수의 상기 이미지특징으로부터 신뢰도점수를 도출하는 신뢰도도출단계; 및 상기 신뢰도도출단계에서 도출된 다수의 상기 신뢰도점수로부터 상기 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정단계;를 포함하는 것을 하나의 특징으로 할 수도 있다.Chinese character recognition method according to an embodiment of the present invention for achieving the above object, the Chinese character recognition system according to the present invention, the input step of receiving a Chinese character image that is an image of a Chinese character to be identified; an extraction step of extracting a plurality of image features from the Chinese character image received in the input step; a reliability derivation step of deriving a reliability score from the plurality of image features extracted in the extraction step; and an identified Chinese character selection step of selecting an identified Chinese character corresponding to the Chinese character to be identified from a plurality of the reliability scores derived in the reliability deriving step.
여기서, 상기 식별한자선정단계 이후에 이루어지는 단계로서, 상기 식별한자선정단계에서 선정된 상기 식별한자를 외부에서 인식할 수 있도록 출력하는 출력단계;를 더 포함하는 것을 또 하나의 특징으로 할 수도 있다. Here, as a step performed after the identified Chinese character selecting step, an output step of outputting the identified Chinese character selected in the identified Chinese character selecting step so that it can be recognized from the outside may be further included.
여기서, 상기 식별한자선정단계에서 이루어지는 상기 식별한자의 선정은, 다수의 상기 신뢰도점수 중에서 가장 큰 값인 최대신뢰도점수에 대응되는 한자를 상기 식별한자로서 선정함으로써 이루어지는 것을 또 하나의 특징으로 할 수도 있다.Here, the selection of the identified Chinese character in the identified Chinese character selection step may be performed by selecting a Chinese character corresponding to the maximum reliability score, which is the largest value among a plurality of the reliability scores, as the identified Chinese character.
본 발명에 따른 한자인식시스템 및 이를 이용한 한자인식방법은, 한자가 오랜 시간의 경과로 인하여 알아보기 곤란하거나 초서체 또는 흘림체와 같이 다양한 필체 또는 크기, 문자들 간의 높은 유사도, 한자기록물의 품질이 저하되었더라도 한자 인식의 정확성을 증대시켜준다. 따라서 종래에 인식하기 어려웠었던 전통기록물의 한자를 인식하는데 기여하는 효과가 있다. 또한, 전통기록물을 디지털화 하여 보존하는 고문헌기록 작업의 능률 향상에 기여하는 효과도 있다.The Chinese character recognition system and the Chinese character recognition method using the same according to the present invention are difficult to recognize due to the passage of a long time, or various handwriting or sizes such as cursive or cursive fonts, high similarity between characters, and the quality of Chinese character records It increases the accuracy of Chinese character recognition. Therefore, it has the effect of contributing to recognizing the Chinese characters of traditional records, which were difficult to recognize in the past. In addition, it has the effect of contributing to the improvement of the efficiency of archival records that digitize and preserve traditional records.
도 1은 본 발명의 실시 예에 따른 한자인식시스템을 개략적으로 나타낸 블록도이다.
도 2는 본 발명의 실시 예에 따른 한자인식시스템을 이용한 한자인식방법을 개략적으로 나타낸 순서도이다. 1 is a block diagram schematically showing a Chinese character recognition system according to an embodiment of the present invention.
2 is a flowchart schematically illustrating a Chinese character recognition method using a Chinese character recognition system according to an embodiment of the present invention.
이하에서는 본 발명에 대하여 보다 구체적으로 이해할 수 있도록 첨부된 도면을 참조한 바람직한 실시 예를 들어 설명하기로 한다. Hereinafter, a preferred embodiment will be described with reference to the accompanying drawings so that the present invention can be understood in more detail.
도 1을 참조하여 본 발명의 실시 예에 따른 한자인식시스템에 대하여 설명한 후 도 2를 더 참조하여 본 발명의 실시 예에 따른 한자인식방법에 대하여 설명하기로 한다.After a description of the Chinese character recognition system according to an embodiment of the present invention with reference to FIG. 1, a Chinese character recognition method according to an embodiment of the present invention will be described with further reference to FIG. 2 .
참고로 본 발명의 실시 예에 대한 설명 및 이해의 편의를 위하여, '식별대상이 되는 한자'는 사용자가 파악하고자 하는 대상이 되는 한자를 말하며, '식별한자'는 본 발명의 실시 예에 따른 한자인식시스템 또는 한자인식방법을 통해 '식별대상이 되는 한자'를 식별하여 얻어진 식별결과를 말한다. For reference, for convenience of explanation and understanding of the embodiment of the present invention, 'Chinese character to be identified' refers to a Chinese character to be identified by the user, and 'Chinese character to be identified' is a Chinese character according to an embodiment of the present invention. It refers to the identification result obtained by identifying 'the Chinese character to be identified' through a recognition system or a Chinese character recognition method.
도 1은 본 발명의 실시 예에 따른 한자인식시스템을 개략적으로 나타낸 블록도이다. 1 is a block diagram schematically showing a Chinese character recognition system according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 실시 예에 따른 한자인식시스템(100)은 입력부(110), 특징추출부(120), 식별한자선정부(130) 및 출력부(140)를 포함하여 이루어질 수 있다.Referring to FIG. 1 , the Chinese
입력부(110)는 식별대상인 한자의 이미지인 한자이미지를 입력받는다.The
이러한 입력부(110)의 예로서 카메라와 같은 장치를 들을 수 있다. An example of such an
입력부(110)에서 특징추출부(120)로 전달되는 한자이미지는 다채널의 이미지행렬의 형태를 갖추게 된다. 입력부(110)는 한자이미지를 (W*H*3)의 크기의 RGB 3채널의 이미지행렬의 형태로 만든다. 여기서, W는 이미지의 너비이고, H는 이미지의 높이에 해당된다. The Chinese character image transmitted from the
이와 같이 행렬의 형태로 된 한자이미지가 입력부(110)에서 특징추출부(120)의 이미지인식기(121, 122, 123, 124, 125) 로 전달된다. As described above, the Chinese character image in the form of a matrix is transmitted from the
특징추출부(120)는 입력부(110)로부터 전달받은 한자이미지로부터 이미지특징을 추출하는 이미지인식기(121, 122, 123, 124, 125) 를 다수 포함하고 있다. 즉, 특징추출부(120)는 다수의 이미지인식기(121, 122, 123, 124, 125) 를 포함하는 집합체라고 할 수 있다.The
이미지인식기(121, 122, 123, 124, 125) 는 특정 수의 합성곱 연산 및 풀링 연산을 수행하여 한자이미지에서 이미지특징을 추출한다.The image recognizers 121 , 122 , 123 , 124 , and 125 perform a specific number of convolution and pooling operations to extract image features from a Chinese character image.
(W*H*3)의 크기의 RGB 3채널의 이미지행렬과 같이, 다채널의 이미지행렬의 형태를 갖춘 한자이미지를 전달받은 다수의 이미지인식기(121, 122, 123, 124, 125) 는 각기 행벡터의 형태를 갖춘 이미지특징을 추출한다.Multiple image recognizers (121, 122, 123, 124, 125) that received a Chinese character image in the form of a multi-channel image matrix like an RGB 3-channel image matrix of (W*H*3) Extract image features in the form of row vectors.
식별대상인 한자에 해당되는 것으로 판단될 식별한자로 선정될 가능성이 있는 x개의 한자글자가 있다면, 추출된 이미지특징은 (1*x)의 행벡터의 형태를 가지게 된다.If there are x number of Chinese characters that are likely to be selected as the Chinese characters to be identified as corresponding to the Chinese characters to be identified, the extracted image feature has the form of a row vector of (1*x).
이와 같이 다수의 이미지인식기(121, 122, 123, 124, 125) 각각이 입력부(110)으로부터 전달받은 한자이미지로부터 각기 이미지특징을 추출한다. As described above, each of the plurality of
다수의 이미지인식기(121, 122, 123, 124, 125) 각각은 이미지특징을 추출하기 위한 딥러닝모델(deep learning model)이 적용되어 있다. A deep learning model for extracting image features is applied to each of the plurality of
여기서 딥러닝모델은 CNN(convolution neural network), DenseNet(Densely connected convolutional network) 또는 ResNet(residual network) 등의 다양한 딥러닝모델이 가능하며, 딥러닝모델로서 VGGNet(Visual Geometry Group Network) 또한 바람직하다.Here, as the deep learning model, various deep learning models such as a convolution neural network (CNN), a densely connected convolutional network (DenseNet), or a residual network (ResNet) are possible, and a Visual Geometry Group Network (VGGNet) is also preferable as a deep learning model.
이와 같은 딥러닝모델이 적용된 이미지인식기(121, 122, 123, 124, 125)에 다음과 같은 정규화를 통한 학습이 이루어진 것이 바람직하다.It is preferable that the
민감도(sensitivity) 정규화(regularization)는 비슷해보이지만 서로 다른 한자이미지인 비트윈-클라스(between-class) 이미지들을 더 잘 구분하게 만든다.Sensitivity regularization makes it better to distinguish between-class images, which look similar but are different Chinese character images.
그리고 강건성(Robustness) 정규화(regularization)는 다르게 보이지만 실제로는 같은 한자이미지인 위드인-클라스(within-class) 이미지들을 더 잘 구분하게 만든다. And robustness regularization makes it better to distinguish between-class images, which look different but are actually the same Chinese character image.
이와 같은 정규화를 통해 같은 종류의 한자이미지(within-class)는 같은 것으로, 다른 종류의 한자이미지(between-class)는 더 다른 것으로 구분이 잘 이루어질 수 있다. Through such normalization, the same kind of Chinese character images (within-class) can be distinguished as the same, and different kinds of Chinese character images (between-class) can be distinguished as more different.
따라서, 딥러닝모델이 적용된 다수의 이미지인식기(121, 122, 123, 124, 125) 중에는 민감도 정규화 방법을 통해 학습이 이루어진 이미지인식기(121)가 있는 것도 바람직하다. Therefore, among the plurality of
아울러, 딥러닝모델이 적용된 다수의 이미지인식기(121, 122, 123, 124, 125) 중에는 강건성(Robustness) 정규화 방법을 통해 학습이 이루어진 이미지인식기(122)가 있는 것 또한 바람직하다. In addition, among the plurality of
또한, 딥러닝모델이 적용된 다수의 이미지인식기(121, 122, 123, 124, 125) 중에는 민감도 및 강건성 정규화 방법을 통해 학습이 이루어진 이미지인식기(123, 124, 125)가 있는 것도 바람직하다.In addition, among the plurality of
딥러닝모델이 적용된 다수의 이미지인식기(121, 122, 123, 124, 125) 중에서 일부의 이미지인식기(121)는 민감도 정규화 방법을 통해 학습이 이루어진 것이고, 다른 일부의 이미지인식기(122)는 강건성 정규화 방법을 통해 학습이 이루어진 것이며, 나머지 다른 일부의 이미지인식기(123, 124, 125)는 민감도 및 강건성 정규화 방법을 통해 학습이 이루어진 것도 바람직하다.Among the plurality of
이와 같이 다수의 인식기(121, 122, 123, 124, 125) 각각이 모두 정규화 방법을 통한 학습이 된 상태인 것이 바람직하다.As described above, it is preferable that each of the plurality of
가중치 갱신 방법은 아래와 같은 일반적인 방법을 따른다. 이 때 은 가중치 갱신을 위한 학습률(learning rate)이며, 은 각 층에 해당하는 가중치의 미분값이다. 본 발명에서는 가중치의 미분값을 구할 수 있는 손실함수에 민감도 혹은 강건성 정규화를 적용한다. The weight update method follows the general method below. At this time is the learning rate for weight update, silver angle It is the derivative of the weight corresponding to the layer. In the present invention, sensitivity or robustness normalization is applied to a loss function that can obtain a differential value of a weight.
정규화 방법이 적용된 손실함수는 다음과 같이 정의될 수 있다. The loss function to which the normalization method is applied can be defined as follows.
즉, 민감도 및 강건성 정규화를 위해 이미지인식기(123, 124, 125) 마지막 층의 미분값을 평균을 계산하여, 레귤러라이저(regularizer)인 R을 계산한다.That is, the average of the differential values of the last layers of the
민감도 정규화의 손실값 경우, 레귤러라이저 R과 마진(margin)값인 m을 더한 값으로 CNN(convolution neural network)의 손실값인 을 나누어 준다. In the case of the loss value of the sensitivity normalization, it is the value obtained by adding the regularizer R and the margin value m, which is the loss value of the CNN (convolution neural network). share the
여기서 마진값은 가 0으로 나누어져 무한대가 되는 경우를 방지하기 위하여 필요하다. Here the margin is This is necessary to prevent the case where is divided by 0 to become infinity.
민감도 정규화의 손실값 : Loss of sensitivity normalization:
이와 같이 새롭게 정의된 손실값을 바탕으로 이미지인식기(121)를 구성하는 가중치를 갱신하기 위한 값은 다음의 식과 같이 구해진다. This newly defined loss value A value for updating the weight constituting the
여기서 는 l번째 층의 입력 특징맵이며, 은 l번째 층으로 전파되는 에러값이다.here is the input feature map of the l-th layer, is the error value propagated to the l-th layer.
강건성 정규화의 손실값 경우, CNN의 손실값인 에 레귤라이저 R을 더해줌으로써 정의된다. In the case of the loss value of robustness normalization, the loss value of CNN is It is defined by adding a regulator R to
강건성 정규화의 손실값 : Loss of robustness normalization:
강건성 정규화를 바탕으로 이미지인식기의 가중치를 갱신하기 위한 값은 다음과 같이 구해진다. The value for updating the weight of the image recognizer based on robustness normalization is obtained as follows.
이러한 손실값들을 통합하기 위하여 CNN 손실값인 에 앞서 정의한 민감도 및 강건성 손실값을 , 계수로 가중치 합을 구해서 더해준다.In order to integrate these loss values, the CNN loss The sensitivity and robustness loss values defined previously in , Calculate the weighted sum of the coefficients and add them.
이에 추가로 계수를 적용하여 와 정규화 항 사이의 계수를 정의하여 얼마나 각 항을 반영할지 정하여, 최종적으로 총 에러값인 를 구한다. in addition to this by applying a coefficient Determine how much each term is to be reflected by defining the coefficient between and the regularization term, and finally the total error value save
새로 정의된 오류값으로 이미지인식기의 가중치를 갱신할 때에는 다음과 같은 경사도 값을 갖는다. When the weight of the image recognizer is updated with the newly defined error value, it has the following gradient value.
이때 학습과정 중 민감도 및 강건성 오류값 간의 비율도 학습될 수 있도록, 총 에러값 을 각 계수인 , 에 대해 편미분을 하여 경사도 값을 구한다. 그리고, 경사도 값을 바탕으로 , 값을 갱신한다. At this time, the total error value so that the ratio between the sensitivity and robustness error values can also be learned during the learning process. is each coefficient , The slope value is obtained by performing partial differentiation with respect to . And, based on the slope value , update the value
이때 계수들의 학습률(learning rate) 를 적용하여 학습시킬 수 있다.At this time, the learning rate of the coefficients can be learned by applying
이와 같은 방법으로 적응형 민감도 및 강건성 정규화를 구현한 후 이와 같은 정규화에 맞추어 각 이미지인식기(121, 122, 123, 124, 125)들을 학습시킨 것이 바람직하다.After implementing the adaptive sensitivity and robustness normalization in this way, it is preferable to train each of the
이와 같은 다수의 서로 다른 이미지인식기(121, 122, 123, 124, 125)들이 추출한 결과들을 앙상블(Ensemble)방법을 이용하여 종합한다. The results extracted by a plurality of
이미지도출부(120)의 다수의 이미지인식기(121, 122, 123, 124, 125)에는 민감도 정규화가 적용된 이미지인식기(121), 강건성 정규화가 적용된 이미지인식기(122) 그리고 민감도 및 강건성 정규화 모두 적용된 이미지인식기(123)가 있다.A plurality of
예를 들어, 민감도 정규화가 적용된 이미지인식기(121) 1개, 강건성 정규화를 적용한 이미지인식기(122) 1개 그리고 민감도 및 강건성을 모두 적용한 이미지인식기(123, 124, 125) 3개가 이미지도출부(120) 내에 마련된 형태가 있을 수 있다. 이미지인식기(121, 122, 123, 124, 125)들은 앞서 정의된 손실값 식 및 경사도 식의 정의에 따라 미리 학습된 것이 바람직하다.For example, one
민감도 정규화가 적용된 이미지인식기(121)는 앞서 언급한 민감도 손실값을 이용하여 학습된 것이 바람직하다. The
강건성 정규화가 적용된 이미지인식기(122)는 앞서 설명한 강건성 손실값만 이용하여 학습된 것이 바람직하다. It is preferable that the
민감도 및 강건성을 모두 적용한 이미지인식기(123)의 경우, 총 손실값인 을 바탕으로 하여 학습될 수 있다. In the case of the
각 이미지인식기(121, 122, 123, 124, 125)별로 각기 다른 이미지특징을 추출할 수 있도록 하기 위하여 , 계수, 계수, 가중치 갱신을 위한 학습률(), 계수들의 학습률()을 서로 다른 값으로 설정된 것이 바람직하다. In order to be able to extract different image features for each image recognizer (121, 122, 123, 124, 125) , Coefficient, Learning rate for updating coefficients and weights ( ), the learning rate of the coefficients ( ) is preferably set to different values.
이에 따라 각 이미지인식기(121, 122, 123, 124, 125)는 학습과정 중 서로 다른 이미지인식기(121, 122, 123, 124, 125)로 학습이 되어 간다. Accordingly, each of the
앞서 언급한 바와 같이 입력부(110)로부터 전달받은 한자이미지는 각 이미지인식기(121, 122, 123, 124, 125)에 3차원 행렬의 형태로 전달된다. 그리고 학습된 각 이미지인식기(121, 122, 123, 124, 125)들은 서로 다른 이미지특징들을 추출해 낸다. As mentioned above, the Chinese character image received from the
x개의 가능한 한자글자종류가 있을 때, 이미지인식기(121, 122, 123, 124, 125)는 (1*x)의 이미지특징 벡터를 출력하게 된다. When there are x possible types of Chinese characters, the
그리고 출력된 이미지특징벡터는 식별한자선정부(130)로 전달된다.Then, the output image feature vector is transmitted to the identified
이처럼 민감도 정규화를 통해 입력된 한자이미지 내의 미세한 변동 및 고주파 성분을 고려하여 비슷하게 보이지만 실제로는 다른 한자를 구분해낸다. In this way, by taking into account the minute fluctuations and high-frequency components in the inputted Chinese character image through sensitivity normalization, they look similar but actually distinguish different Chinese characters.
그리고 강건성 정규화는 잉크얼룩, 저해상도 또는 복잡한 배경을 가진 이미지에서도 이미지특징을 추출할 수 있으므로 외견상 다르게 보이지만 실제로는 동일한 한자들을 구분해 낼 수 있다. And robustness normalization can extract image features even from images with ink stains, low resolution, or complex backgrounds, so it can distinguish between seemingly different but actually identical Chinese characters.
그리고, 민감도 정규화와 강건성 정규화에 대한 비율을 학습을 통해 스스로 정할 수도 있다. In addition, the ratio of the sensitivity normalization and the robustness normalization may be determined by oneself through learning.
식별한자선정부(130)는 특징추출부(120)의 각 이미지인식기(121, 122, 123, 124, 125)들로부터 전달받은 다수의 이미지특징 각각에 대하여 신뢰도를 도출한다. 그리고 도출된 신뢰도를 토대로 하여 식별대상인 한자에 해당되는 식별한자를 선정한다. The identified
식별한자선정부(130)에서 여러 이미지인식기(121, 122, 123, 124, 125)로부터 얻어지는 다수의 이미지특징들에 대하여 앙상블 방법을 적용하여 고려하므로 식별대상인 한자에 대하여 높은 정확도로 인식할 수 있게 된다. Since the identified Chinese
식별한자선정부(130)는, 특징추출부(120)로부터 전달받은 다수의 이미지특징 각각에 대하여 활성화함수를 이용하여 신뢰도 점수로 구성된 신뢰도 행렬을 산출한다. 여기서 활성화함수(activation function)으로서, 소프트맥스(softmax)함수가 이용되는 것도 바람직하다.The identified
이미지특징에 소프트맥스함수를 적용하여 신뢰도 점수를 얻고 이 중 최고의 점수에 해당되는 한자를 한자인식시스템이 예측한 한자로 선정한다.A reliability score is obtained by applying the Softmax function to image features, and the Chinese character corresponding to the highest score is selected as the Chinese character predicted by the Chinese character recognition system.
소프트맥스함수는 다음과 같이 추출된 이미지특징의 값들을 확률값으로 바꾸어 각 열의 합이 1이 되도록 한다. 이때 이미지특징벡터의 크기는 유지된다. The softmax function converts the extracted image feature values into probability values so that the sum of each column becomes 1. At this time, the size of the image feature vector is maintained.
그리고 식별한자선정부(130)는, 산출된 신뢰도행렬의 각 열에서 최대값을 선택하여 신뢰도점수-행벡터를 생성하고, 생성된 신뢰도점수-행벡터 내에서 신뢰도점수가 가장 큰 최대신뢰도점수에 대응되는 한자를 식별대상인 한자에 해당되는 식별한자로서 선정한다.And the identified
각 이미지인식기(121, 122, 123, 124, 125)들로부터 출력된 이미지특징 벡터를 바탕으로 하여 한자글자종류의 확률값을 구하기 위하여 각 이미지특징 벡터별로 활성화함수인 소프트맥스함수를 적용한다. Based on the image feature vectors output from the
소프트맥스함수 적용 후 각 이미지특징벡터들은 (1*x)의 크기는 유지되지만, 각 열의 값들 합이 1이 되는 신뢰도 점수를 갖게 된다. After applying the softmax function, each image feature vector maintains the size of (1*x), but has a reliability score in which the sum of the values in each column becomes 1.
y개의 이미지인식기가 있을 때, (1*x)의 신뢰도 벡터가 y개가 있으므로 (y*x) 크기의 신뢰도 행렬을 구성할 수 있다. When there are y image recognizers, since there are y reliability vectors of (1*x), a reliability matrix of size (y*x) can be constructed.
i번째 행에 j 번째 열의 신뢰도 점수는 i번째 이미지인식기가 예측한 j번째 한자글자의 신뢰도점수가 된다.The confidence score of the j-th column in the i-th row becomes the confidence score of the j-th Chinese character predicted by the i-th image recognizer.
각 이미지인식기(121, 122, 123, 124, 125) 별 한자글자 신뢰도점수로 구성된 신뢰도 행렬로부터 최종적으로 입력부에 입력된 한자를 인식한 최종결과인 식별한자를 결정하기 위하여 신뢰도점수의 최대값을 선택한다.The maximum value of the reliability score is selected to determine the final result of recognizing the Chinese character input to the input unit from the reliability matrix composed of the reliability scores for each Chinese character for each image recognizer (121, 122, 123, 124, 125) do.
신뢰도 행렬의 각 열에서 최대값을 선택한다. j번째 열에서 선택된 신뢰도 점수는 각 이미지인식기에서 j번째 한자 글자에 대해 예측한 신뢰도 점수들의 최대값을 취한다. Select the maximum value in each column of the confidence matrix. The confidence score selected in the j-th column takes the maximum value of the confidence scores predicted for the j-th Chinese character by each image recognizer.
x개의 한자 글자 종류가 있다면, 각 열에 대해 최대값을 선택한 후 (1*x) 신뢰도 벡터가 만들어진다. If there are x types of Chinese characters, a (1*x) confidence vector is created after selecting the maximum value for each column.
생성된 신뢰도 벡터에서 최종적으로 식별대상인 한자가 어떤 한자글자인지 결정하기 위하여 각 신뢰도 점수들 중에서 다시 최대값을 선택한다.In order to determine which Chinese character the final identification target is from the generated confidence vector, the maximum value is selected again from among the reliability scores.
그리고 선정된 최대값에 해당되는 한자를 식별한자로 선정하고, 이를 출력부(140)로 전달한다.Then, a Chinese character corresponding to the selected maximum value is selected as an identifiable Chinese character, and this is transmitted to the
필요에 따라서는 신뢰도벡터의 각 행과 열에 대응되는 한자들이 저장된 데이터베이스가 별도로 마련되어 있는 형태도 가능하며 이 또한 바람직하다.If necessary, a database in which Chinese characters corresponding to each row and column of the reliability vector are stored may be separately provided, and this is also preferable.
출력부(140)는 식별한자선정부(130)에서 선정된 식별한자를 식별한자선정부(130)로부터 전달받아서 출력한다.The
출력부(140)로서, 이용자가 식별한자를 시각적으로 인식할 수 있도록 전시시켜줄 수 있는 모니터와 같은 디스플레이장치도 바람직하다. As the
이와 같이, 출력부(140)를 통해 식별대상인 한자를 인식한 결과인 식별한자를 사용자에게 제공함으로써 사용자는 식별대상인 한자가 식별한자라는 것을 알 수 있게 된다.In this way, by providing the user with the identified Chinese character, which is the result of recognizing the Chinese character as the identification target through the
이상에서 설명한 바와 같은 한자인식시스템(100)을 이용한 한자인식방법에 대하여 도 2를 더 참조하여 설명한다. 도 2는 본 발명의 실시 예에 따른 한자인식시스템(100)을 이용한 한자인식방법을 개략적으로 나타낸 순서도이다. A Chinese character recognition method using the Chinese
도 2를 더 참조하면 본 발명의 실시 예에 따른 한자인식시스템을 이용한 한자인식방법은 입력단계(S110), 추출단계(S120), 신뢰도도출단계(S130) 및 식별한자선정단계(S140)를 포함하여 이루어지며, 좀 더 바람직하게는 출력단계(S300)를 더 포함하여 이루어질 수도 있다.2, the Chinese character recognition method using the Chinese character recognition system according to an embodiment of the present invention includes an input step (S110), an extraction step (S120), a reliability derivation step (S130) and an identified Chinese character selection step (S140) This is done, and more preferably, the output step (S300) may be further included.
<< S110 >><< S110 >>
입력단계(S110)는 한자인식시스템(100)이 식별대상인 한자의 이미지인 한자이미지를 입력받는 단계이다.The input step S110 is a step in which the Chinese
입력부(110)을 통해 식별하고자하는 한자의 이미지가 입력된다. 그리고 입력부(110)는 이미지행렬의 형태로 된 한자이미지를 특징추출부(120)로 전달한다. An image of Chinese characters to be identified is input through the
한자이미지는 특징추출부(120)의 다수의 이미지인식기(121, 122, 123, 124, 125) 로 전달된다.The Chinese character image is transmitted to a plurality of
<< S120 >><< S120 >>
추출단계(S120)는 입력단계(S110)에서 입력받은 한자이미지로부터 특징추출부(120)가 다수의 이미지특징을 추출하는 단계이다.The extraction step (S120) is a step in which the
특징추출부(120)의 다수의 이미지인식기(121,122,123,124)는 입력부(12)로부터 전달받은 한자이미지로부터 각기 이미지특징을 추출한다. A plurality of
여기서 다수의 이미지인식기(121,122, 123, 124, 125) 각각은 앞서 설명한 바와 같이 딥러닝모델이 적용되어 있는 것이 바람직하다. Here, it is preferable that a deep learning model is applied to each of the plurality of
<< S130 >><< S130 >>
신뢰도도출단계(S130)는 추출단계(S120)에서 추출된 다수의 이미지특징으로부터 신뢰도점수를 도출하는 단계이다. The reliability deriving step (S130) is a step of deriving a reliability score from a plurality of image features extracted in the extraction step (S120).
다수의 이미지인식기(121, 122, 123, 124, 125) 각각으로부터 추출된 이미지특징을 식별한자선정부(130)가 전달받는다. 그리고 신뢰도점수를 도출한다.The self-
식별한자선정부(130)는, 특징추출부(120)로부터 전달받은 다수의 이미지특징 각각에 대하여 활성화함수를 이용하여 신뢰도 점수로 구성된 신뢰도 행렬을 산출한다. 여기서 활성화함수(activation function)으로서, 앞서 설명한 바와 같이 소프트맥스(softmax)함수가 이용되는 것도 바람직하다.The identified
<< S140 >><< S140 >>
식별한자선정단계(S140)는 신뢰도도출단계(S130)에서 도출된 다수의 신뢰도점수로부터 식별대상인 한자에 해당되는 식별한자를 선정하는 단계이다.The identified Chinese character selection step (S140) is a step of selecting an identified Chinese character corresponding to the Chinese character to be identified from a plurality of reliability scores derived in the reliability derivation step (S130).
식별한자선정단계(S140)에서 이루어지는 식별한자의 선정은, 식별한자선정부(130)가 다수의 상기 신뢰도점수 중에서 가장 큰 값인 최대신뢰도점수에 대응되는 한자를 식별한자로서 선정함으로써 이루어지는 것이 바람직하다. The selection of the identified Chinese character in the identified Chinese character selection step (S140) is preferably performed by the identified Chinese
이미지특징에 소프트맥스함수를 적용하여 신뢰도 점수를 얻고 이 중 최고의 점수에 해당되는 한자를 한자인식시스템이 예측한 식별한자로 선정한다.A reliability score is obtained by applying the Softmax function to image features, and the Chinese character corresponding to the highest score is selected as the identified Chinese character predicted by the Chinese character recognition system.
식별한자선정부(130)는 선정된 식별한자를 사용자가 알 수 있도록 출력부로 전달할 수 있다. The identified Chinese
<< S150 >><< S150 >>
식별한자선정단계(S140) 이후에 이루어지는 단계로서, 출력단계(S150)는 식별한자선정단계(S140)에서 선정된 식별한자를 외부에서 인식할 수 있도록 출력하는 단계이다. As a step performed after the identified Chinese character selection step (S140), the output step (S150) is a step of outputting the identified Chinese character selected in the identified Chinese character selection step (S140) so that it can be recognized from the outside.
식별한자선정부(130)에서 선정된 식별한자를 사용자가 인식할 수 있도록 모니터와 같은 출력부(140)를 통해 출력된다. 따라서 사용자는 출력부(140)를 통해 출력된 식별한자를 보고 식별대상인 한자를 알 수 있게 된다.The identified Chinese character selected by the Chinese
입력단계 이전에 이루어질 수 있는 단계로서, 한자이미지로부터 다수의 이미지특징을 추출할 수 있도록 한자인식시스템(100)의 이미지인식기(121, 122, 123, 124, 125)에 앞서 설명한 바와 같이 딥러닝모델을 적용시키고 정규화하여 학습시켜 놓은 것도 바람직하다. 도 2에 도시되지는 않았으나 이러한 단계를 사전러닝단계 라고 하고 사전에 다수의 이미지인식기(121, 122, 123, 124, 125) 들을 학습시켜놓는 것 또한 바람직하다.As a step that can be made before the input step, the deep learning model as described above for the
이상에서 설명한 바와 같은 본 발명에 따른 한자인식시스템 및 이를 이용한 한자인식방법은 이미지인식기의 민감도 정규화와 강건성 정규화를 적용하여 앙상블방법을 통해 한자를 인식하므로 혼동되기 쉬운 초서체와 같은 한자이미지에 대한 인식률이 증대된다. As described above, the Chinese character recognition system and the Chinese character recognition method using the same according to the present invention recognize Chinese characters through the ensemble method by applying the sensitivity normalization and robustness normalization of the image recognizer. is increased
즉, 민감도 정규화를 통해 입력된 한자이미지 내의 미세한 변동 및 고주파 성분을 고려하여 비슷하게 보이지만 실제로는 다른 한자를 구분해낸다. 그리고 강건성 정규화는 잉크얼룩, 저해상도 또는 복잡한 배경을 가진 이미지에서도 이미지특징을 추출할 수 있으므로 외견상 다르게 보이지만 실제로는 동일한 한자들을 구분해 낼 수 있다. In other words, considering the minute fluctuations and high-frequency components in the inputted Chinese character image through sensitivity normalization, they look similar but actually distinguish different Chinese characters. And robustness normalization can extract image features from images with ink stains, low resolution, or complex backgrounds, so it can distinguish between seemingly different Chinese characters, but actually the same.
그리고, 민감도 정규화와 강건성 정규화에 대한 비율을 학습을 통해 스스로 정할 수도 있다. 이와 같이 구성된 여러 이미지인식기를 앙상블 방법을 적용하여 여러 이미지인식기의 결과들을 함께 고려하므로 식별대상인 한자에 대하여 높은 정확도로 인식할 수 있다. In addition, the ratio of the sensitivity normalization and the robustness normalization may be determined by oneself through learning. Since the results of several image recognizers are considered together by applying the ensemble method to several image recognizers configured as described above, it is possible to recognize Chinese characters as identification objects with high accuracy.
이와 같이, 본 발명에 따른 한자인식시스템 및 한자인식방법은 한자가 오랜 시간의 경과로 인하여 알아보기 곤란하거나 다양한 필체 또는 크기, 문자들 간의 높은 유사도, 한자기록물의 품질이 저하되었더라도 한자 인식의 정확성을 증대시켜준다. 따라서 종래에 인식하기 어려웠었던 전통 기록물의 한자를 인식하는데 기여하는 장점이 있다. 또한, 전통기록물을 디지털화 하여 보존하는 고문헌기록 작업의 능률 향상에 기여하는 장점도 있다.In this way, the Chinese character recognition system and the Chinese character recognition method according to the present invention are difficult to recognize due to the passage of a long time, or the accuracy of the Chinese character recognition is improved even if the high similarity between various handwriting or sizes and characters, and the quality of the Chinese character records are deteriorated. it increases Therefore, there is an advantage of contributing to recognizing the Chinese characters of traditional records that were difficult to recognize in the past. In addition, there is an advantage that contributes to the improvement of the efficiency of archival records that digitize and preserve traditional records.
이상에서 설명된 바와 같이, 본 발명에 대한 구체적인 설명은 첨부된 도면을 참조한 실시 예들에 의해서 이루어졌지만, 상술한 실시 예들은 본 발명의 바람직한 실시 예를 들어 설명하였을 뿐이기 때문에, 본 발명이 상기의 실시 예에만 국한되는 것으로 이해되어져서는 아니되며, 본 발명의 권리범위는 후술하는 청구범위 및 그 등가개념으로 이해되어져야 할 것이다. As described above, the detailed description of the present invention has been made by the embodiments with reference to the accompanying drawings, but since the above-described embodiments have only been described with reference to the preferred embodiments of the present invention, the present invention It should not be construed as being limited only to the embodiments, and the scope of the present invention should be understood as the following claims and their equivalents.
100 : 한자인식시스템
110 : 서버 120 : 특징추출부
121, 122, 123, 124, 125 : 이미지인식기
130 : 식별한자선정부 140 : 출력부 100: Chinese character recognition system
110: server 120: feature extraction unit
121, 122, 123, 124, 125: image recognizer
130: identified character selection unit 140: output unit
Claims (10)
상기 입력부로부터 전달받은 상기 한자이미지로부터 이미지특징을 추출하기 위한 딥러닝모델(deep learning model)이 적용된 이미지인식기를 다수 포함하는 특징추출부;
상기 특징추출부로부터 전달받은 다수의 상기 이미지특징 각각에 대하여 신뢰도를 도출하고, 상기 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정부; 및
상기 식별한자선정부에서 선정된 상기 식별한자를 상기 식별한자선정부로부터 전달받아서 출력하는 출력부; 를 포함하며,
상기 이미지인식기는,
민감도 및 강건성 정규화 방법 중 적어도 하나의 방법을 통해 학습이 이루어진 것이고,
상기 민감도 정규화 방법은 서로 다른 한자이미지인 비트윈-클라스(between-class) 이미지를 구분하는 것이며,
상기 강건성 정규화 방법은 동일한 한자이미지인 위드인-클라스(within-class) 이미지를 구분하는 것이며,
상기 식별한자선정부는 상기 이미지인식기로부터 추출된 결과를 앙상블(Ensemble)방법으로 수집하는 한자인식시스템.
an input unit for receiving a Chinese character image that is an image of a Chinese character to be identified;
a feature extracting unit including a plurality of image recognizers to which a deep learning model for extracting image features from the Chinese character image received from the input unit is applied;
an identified Chinese character selection unit for deriving reliability for each of the plurality of image features received from the feature extraction unit, and selecting an identified Chinese character corresponding to the Chinese character to be identified; and
an output unit for receiving and outputting the identified Chinese character selected by the identified Chinese character selecting unit from the identified Chinese character selecting unit; includes,
The image recognizer,
Learning was made through at least one of the sensitivity and robustness regularization methods,
The sensitivity normalization method is to distinguish between-class images, which are different Chinese character images,
The robustness normalization method is to distinguish the same Chinese character image, without-class (within-class) image,
The Chinese character recognition system that the identified Chinese character selection unit collects the results extracted from the image recognizer by an ensemble method.
상기 입력부에서 상기 특징추출부로 전달되는 상기 한자이미지는 다채널의 이미지행렬의 형태를 갖추고 있으며,
다채널의 이미지행렬의 형태를 갖춘 상기 한자이미지를 전달받은 다수의 상기 이미지인식기는 각기 행벡터의 형태를 갖춘 이미지특징을 추출하는 것을 특징으로 하는 한자인식시스템.
The method of claim 1,
The Chinese character image transmitted from the input unit to the feature extraction unit has the form of a multi-channel image matrix,
A Chinese character recognition system, characterized in that the plurality of image recognizers that have received the Chinese character image having the form of a multi-channel image matrix extract image features each having the form of a row vector.
상기 식별한자선정부는,
상기 특징추출부로부터 전달받은 다수의 상기 이미지특징에 각각에 대하여 활성화함수를 이용하여 신뢰도 점수로 구성된 신뢰도 행렬을 산출하는 것을 특징으로 하는 한자인식시스템.
The method of claim 1,
The identified character selection unit,
A Chinese character recognition system, characterized in that for each of the plurality of image features received from the feature extraction unit, a reliability matrix composed of reliability scores is calculated by using an activation function.
상기 식별한자선정부는,
산출된 상기 신뢰도행렬의 각 열에서 최대값을 선택하여 신뢰도점수-행벡터를 생성하고,
생성된 상기 신뢰도점수-행벡터 내에서 상기 신뢰도점수가 가장 큰 최대신뢰도점수에 대응되는 한자를 상기 식별대상인 한자에 해당되는 상기 식별한자로서 선정하는 것을 특징으로 하는 한자인식시스템.
7. The method of claim 6,
The identified character selection unit,
Selecting a maximum value in each column of the calculated reliability matrix to generate a confidence score-row vector,
A Chinese character recognition system, characterized in that, in the generated confidence score-row vector, a Chinese character corresponding to a maximum reliability score having the highest reliability score is selected as the identified Chinese character corresponding to the Chinese character to be identified.
상기 입력단계에서 입력받은 상기 한자이미지로부터 다수의 이미지특징을 추출하는 추출단계;
상기 추출단계에서 추출된 다수의 상기 이미지특징으로부터 신뢰도점수를 도출하는 신뢰도도출단계; 및
상기 신뢰도도출단계에서 도출된 다수의 상기 신뢰도점수로부터 상기 식별대상인 한자에 해당되는 식별한자를 선정하는 식별한자선정단계;를 포함하며,
상기 입력단계에서 입력받은 상기 한자이미지로부터 다수의 이미지특징을 추출하는 추출단계;는,
상기 한자이미지로부터 이미지특징을 추출하기 위한 딥러닝모델(deep learning model)이 적용된 다수의 이미지인식기에 의해 수행되고,
상기 이미지인식기는,
민감도 및 강건성 정규화 방법 중 적어도 하나의 방법을 통해 학습이 이루어진 것이고,
상기 민감도 정규화 방법은 서로 다른 한자이미지인 비트윈-클라스(between-class) 이미지를 구분하는 것이며,
상기 강건성 정규화 방법은 동일한 한자이미지인 위드인-클라스(within-class) 이미지를 구분하는 것이며,
상기 추출단계에서 추출된 다수의 상기 이미지특징으로부터 신뢰도점수를 도출하는 신뢰도도출단계;는,
상기 이미지인식기로부터 추출된 결과를 앙상블(Ensemble)방법으로 수집하는 단계를 포함하는 한자인식시스템을 이용한 한자인식방법.
An input step of receiving a Chinese character image that is an image of a Chinese character to be identified by the Chinese character recognition system;
an extraction step of extracting a plurality of image features from the Chinese character image received in the input step;
a reliability derivation step of deriving a reliability score from the plurality of image features extracted in the extraction step; and
An identified Chinese character selection step of selecting an identified Chinese character corresponding to the Chinese character to be identified from a plurality of the reliability scores derived in the reliability deriving step;
An extraction step of extracting a plurality of image features from the Chinese character image input in the input step;
It is performed by a plurality of image recognizers to which a deep learning model for extracting image features from the Chinese character image is applied,
The image recognizer,
Learning was made through at least one of the sensitivity and robustness regularization methods,
The sensitivity normalization method is to distinguish between-class images, which are different Chinese character images,
The robustness normalization method is to distinguish the same Chinese character image, without-class (within-class) image,
Reliability derivation step of deriving a reliability score from the plurality of image features extracted in the extraction step;
A Chinese character recognition method using a Chinese character recognition system, comprising the step of collecting the results extracted from the image recognizer by an ensemble method.
상기 식별한자선정단계 이후에 이루어지는 단계로서,
상기 식별한자선정단계에서 선정된 상기 식별한자를 외부에서 인식할 수 있도록 출력하는 출력단계;를 더 포함하는 것을 특징으로 하는 한자인식시스템을 이용한 한자인식방법.
9. The method of claim 8,
As a step made after the identified Chinese character selection step,
The Chinese character recognition method using the Chinese character recognition system, characterized in that it further comprises; an output step of outputting the identified Chinese character selected in the identified Chinese character selection step so that it can be recognized from the outside.
상기 식별한자선정단계에서 이루어지는 상기 식별한자의 선정은,
다수의 상기 신뢰도점수 중에서 가장 큰 값인 최대신뢰도점수에 대응되는 한자를 상기 식별한자로서 선정함으로써 이루어지는 것을 특징으로 하는 한자인식시스템을 이용한 한자인식방법.
10. The method of claim 9,
The selection of the identified Chinese character made in the identified Chinese character selection step is
A Chinese character recognition method using a Chinese character recognition system, characterized in that it is made by selecting a Chinese character corresponding to the maximum reliability score, which is the largest value among the plurality of reliability scores, as the identified Chinese character.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190077336 | 2019-06-27 | ||
KR20190077336 | 2019-06-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210001817A KR20210001817A (en) | 2021-01-06 |
KR102264988B1 true KR102264988B1 (en) | 2021-06-16 |
Family
ID=74128846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190098004A KR102264988B1 (en) | 2019-06-27 | 2019-08-12 | Traditional Korean character Hanja Recognition System and method using thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102264988B1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102636135B1 (en) * | 2021-01-29 | 2024-02-14 | 경북대학교 산학협력단 | Method for low-shot transfer with attention for highly imbalanced cursive character recognition, recording medium and device for performing the method |
KR102619368B1 (en) * | 2021-02-01 | 2024-01-02 | (주)메인라인 | Apparatus, method and user device for recognizing optimal text using ocr ai algorithm of a different kind based on deep learning |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014232533A (en) * | 2013-05-28 | 2014-12-11 | ゼロックス コーポレイションXerox Corporation | System and method for ocr output verification |
KR101777601B1 (en) * | 2016-01-11 | 2017-09-13 | 경북대학교 산학협력단 | Distinction method and system for characters written in caoshu characters or cursive characters |
KR101979654B1 (en) * | 2018-01-15 | 2019-05-17 | 주식회사 비엔인더스트리 | License plate recognition apparatus and the method thereof |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100389004B1 (en) | 2001-05-17 | 2003-06-25 | 삼성전자주식회사 | Apparatus for recognizing image by using neural network and method thereof |
-
2019
- 2019-08-12 KR KR1020190098004A patent/KR102264988B1/en active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014232533A (en) * | 2013-05-28 | 2014-12-11 | ゼロックス コーポレイションXerox Corporation | System and method for ocr output verification |
KR101777601B1 (en) * | 2016-01-11 | 2017-09-13 | 경북대학교 산학협력단 | Distinction method and system for characters written in caoshu characters or cursive characters |
KR101979654B1 (en) * | 2018-01-15 | 2019-05-17 | 주식회사 비엔인더스트리 | License plate recognition apparatus and the method thereof |
Also Published As
Publication number | Publication date |
---|---|
KR20210001817A (en) | 2021-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111259930B (en) | General target detection method of self-adaptive attention guidance mechanism | |
CN110399905B (en) | Method for detecting and describing wearing condition of safety helmet in construction scene | |
KR20200098379A (en) | Method, apparatus, device and readable storage medium for image-based data processing | |
WO2017016240A1 (en) | Banknote serial number identification method | |
CN107122375A (en) | The recognition methods of image subject based on characteristics of image | |
US8730157B2 (en) | Hand pose recognition | |
CN106529499A (en) | Fourier descriptor and gait energy image fusion feature-based gait identification method | |
CN111783505A (en) | Method and device for identifying forged faces and computer-readable storage medium | |
WO2012132418A1 (en) | Characteristic estimation device | |
KR20060097074A (en) | Apparatus and method of generating shape model of object and apparatus and method of automatically searching feature points of object employing the same | |
CN111461213B (en) | Training method of target detection model and target rapid detection method | |
WO2021042505A1 (en) | Note generation method and apparatus based on character recognition technology, and computer device | |
JP5207870B2 (en) | Dimension reduction method, pattern recognition dictionary generation device, and pattern recognition device | |
CN111738048B (en) | Pedestrian re-identification method | |
KR102264988B1 (en) | Traditional Korean character Hanja Recognition System and method using thereof | |
CN114038037B (en) | Expression label correction and identification method based on separable residual error attention network | |
CN109657567B (en) | Weak supervision characteristic analysis method and system based on 3D fingerprint image | |
CN109033321B (en) | Image and natural language feature extraction and keyword-based language indication image segmentation method | |
CN109983473A (en) | Flexible integrated identification and semantic processes | |
CN109886281A (en) | One kind is transfinited learning machine color image recognition method based on quaternary number | |
CN114419151A (en) | Multi-target tracking method based on contrast learning | |
CN114842343A (en) | ViT-based aerial image identification method | |
CN110503090B (en) | Character detection network training method based on limited attention model, character detection method and character detector | |
CN114722892A (en) | Continuous learning method and device based on machine learning | |
CN117576079A (en) | Industrial product surface abnormality detection method, device and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |