KR102515359B1 - 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치 - Google Patents

인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치 Download PDF

Info

Publication number
KR102515359B1
KR102515359B1 KR1020220155707A KR20220155707A KR102515359B1 KR 102515359 B1 KR102515359 B1 KR 102515359B1 KR 1020220155707 A KR1020220155707 A KR 1020220155707A KR 20220155707 A KR20220155707 A KR 20220155707A KR 102515359 B1 KR102515359 B1 KR 102515359B1
Authority
KR
South Korea
Prior art keywords
image
padding
character
inverted
reversed
Prior art date
Application number
KR1020220155707A
Other languages
English (en)
Inventor
손정훈
김기웅
이애진
Original Assignee
써큘러스리더(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 써큘러스리더(주) filed Critical 써큘러스리더(주)
Priority to KR1020220155707A priority Critical patent/KR102515359B1/ko
Application granted granted Critical
Publication of KR102515359B1 publication Critical patent/KR102515359B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Character Input (AREA)

Abstract

인공지능을 이용한 반전 글자 인식 장치는 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하기 위한 반전 글자 이미지 생성부, 반전 글자 이미지들의 크기가 조절되도록 반전 글자 이미지들에 리사이징 이미지들을 결합하기 위한 반전 글자 크기 조절부, 반전 글자 데이터 셋을 증강하는 반전 글자 증강부, 및 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 인공지능 학습 수행부를 포함한다.

Description

인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치{DEVICE OF LEARNING REVERSED CHARACTER USING ARTIFICIAL INTELLIGENCE AND DEVICE OF GENERATING REVERSED CHARACTER}
본 개시는 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치에 관한 것이다.
난독 현상(예를 들어, 난독증, 경계선 지능, 다문화, ADHD 등)을 겪고 있는 사람들이 지속적으로 증가하고 있다. 일반적으로 난독 현상의 진단 및 치료는 전문가와 대면하여 이뤄진다. 따라서 난독 현상의 치료엔 비용적, 시간적, 또는 공간적 제약이 존재할 수 있다.
최근 난독 현상의 진단 및 치료를 위한 컴퓨터 프로그램을 이용한 컨텐츠들이 개발되고 있다. 상기 컨텐츠는 난독 현상의 특징들을 파악할 수 있는 기능을 필요로 한다. 난독현상을 겪는 사람이 나타내는 특징들 중 하나로 자음의 좌우가 뒤집힌 반전 글자를 작성하는 것이 있다. 따라서, 반전 글자를 인식할 수 있는 장치의 개발이 요구된다.
해결하고자 하는 과제는 대량의 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 반전 글자 인식 장치를 제공하는 것에 있다.
해결하고자 하는 과제는 대량의 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하는 반전 글자 생성 장치를 제공하는 것에 있다.
다만, 해결하고자 하는 과제는 상기 개시에 한정되지 않는다.
일 측면에 있어서, 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하기 위한 반전 글자 이미지 생성부; 상기 반전 글자 이미지들의 크기가 조절되도록 상기 반전 글자 이미지들에 리사이징 이미지들을 결합하기 위한 반전 글자 크기 조절부; 상기 반전 글자 데이터 셋을 증강하는 반전 글자 증강부; 및 상기 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 인공지능 학습 수행부;를 포함하는, 인공지능을 이용한 반전 글자 인식 장치가 제공될 수 있다.
상기 반전 글자 이미지 생성부는, 자소 이미지 처리부를 포함하되, 상기 자소 이미지 처리부는: 자음 이미지를 반전시켜 제1 예비 반전 자음 이미지를 생성하고, 상기 제1 예비 반전 자음 이미지에 증강 기법을 적용하여 제2 예비 반전 자음 이미지를 생성하기 위한 자음 이미지 변환부; 모음 이미지에 증강 기법을 적용하여 제1 예비 수정 모음 이미지를 생성하기 위한 모음 이미지 변환부; 상기 제2 예비 반전 자음 이미지 및 상기 제1 예비 수정 모음 이미지로부터 글자 영역 이미지들을 추출하여 제3 예비 반전 자음 이미지 및 제2 예비 수정 모음 이미지를 생성하기 위한 글자 영역 추출부; 및 상기 제3 예비 반전 자음 이미지 및 상기 제2 예비 수정 모음 이미지의 크기를 요구되는 정도로 조절하여 반전 자음 이미지 및 수정 모음 이미지를 생성하기 위한 글자 크기 변환부;를 포함할 수 있다.
상기 글자 크기 변환부는, 상기 제3 예비 반전 자음 이미지 및 상기 제2 예비 수정 모음 이미지의 각각의 가로 길이 및 세로 길이 중 긴 어느 하나가 요구되는 값을 갖도록 조절하고, 다른 하나는 상기 어느 하나의 변화 비율과 동일한 비율로 조절할 수 있다.
상기 반전 글자 이미지 생성부는, 자소 이미지 결합부를 더 포함하되, 상기 자소 이미지 결합부는, 상기 반전 자음 이미지를 포함하는 초성 이미지, 상기 수정 모음 이미지를 포함하는 중성 이미지, 및 제1 패딩 이미지를 결합하여 상기 반전 글자 이미지를 생성하되, 상기 제1 패딩 이미지는, 상기 초성 이미지와 상기 중성 이미지 중, 상기 초성 이미지와 상기 중성 이미지의 배열 방향과 수직한 방향을 따라 상대적으로 짧은 길이를 갖는 어느 하나에 결합되고, 상기 초성 이미지와 상기 중성 이미지 중 상기 어느 하나와 상기 제1 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 배열 방향에 수직한 방향을 따라 배열될 수 있다.
상기 초성 이미지와 상기 중성 이미지 중 상기 어느 하나의 길이와 상기 제1 패딩 이미지의 길이의 합은 상기 초성 이미지와 상기 중성 이미지 중 다른 하나의 길이와 동일할 수 있다.
상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지에 제2 패딩 이미지를 더 결합하여 상기 반전 글자 이미지를 생성하되, 상기 제2 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 간격이 확보되도록 상기 초성 이미지와 상기 중성 이미지 사이에 배치될 수 있다.
상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지에 상기 반전 자음 이미지를 포함하는 종성 이미지 및 제3 패딩 이미지를 더 결합하되, 상기 제3 패딩 이미지는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중, 상기 초성 이미지와 상기 중성 이미지의 배열 방향을 따라 상대적으로 짧은 길이를 갖는 어느 하나에 결합되고, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 상기 어느 하나와 상기 제3 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 배열 방향을 따라 배열될 수 있다.
상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 상기 어느 하나의 길이와 상기 제3 패딩 이미지의 길이의 합은 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 다른 하나의 길이와 동일할 수 있다.
상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 상기 종성 이미지, 상기 제1 패딩 이미지, 및 상기 제3 패딩 이미지에 제4 패딩 이미지를 더 결합하여 상기 반전 글자 이미지를 생성하되, 상기 제4 패딩 이미지는 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지의 간격이 확보되도록 상기 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 중성 이미지 사이에 배치될 수 있다.
일 측면에 있어서, 자소 이미지 처리부를 포함하되, 상기 자소 이미지 처리부는: 자음 이미지를 반전시켜 제1 예비 반전 자음 이미지를 생성하고, 상기 제1 예비 반전 자음 이미지에 증강 기법을 적용하여 제2 예비 반전 자음 이미지를 생성하기 위한 자음 이미지 변환부; 모음 이미지에 증강 기법을 적용하여 제1 예비 수정 모음 이미지를 생성하기 위한 모음 이미지 변환부; 상기 제2 예비 반전 자음 이미지 및 상기 제1 예비 수정 모음 이미지로부터 글자 영역 이미지들을 추출하여 제3 예비 반전 자음 이미지 및 제2 예비 수정 모음 이미지를 생성하기 위한 글자 영역 추출부; 및 상기 제3 예비 반전 자음 이미지 및 상기 제2 예비 수정 모음 이미지의 크기를 요구되는 정도로 조절하여 반전 자음 이미지 및 수정 모음 이미지를 생성하기 위한 글자 크기 변환부;를 포함하는 반전 글자 생성 장치가 제공될 수 있다.
본 개시는 대량의 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 반전 글자 인식 장치를 제공할 수 있다.
본 개시는 대량의 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하는 반전 글자 생성 장치를 제공할 수 있다.
다만, 발명의 효과는 상기 개시에 한정되지 않는다.
도 1은 예시적인 실시예에 따른 반전 글자 생성 장치의 블록도이다.
도 2는 도 1의 자소 이미지 처리부의 예시적인 블록도이다.
도 3은 예시적인 실시예에 따른 초성 및 중성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다.
도 4는 도 3의 반전 자음 이미지를 생성하는 방법을 설명하는 순서도이다.
도 5 내지 도 8은 도 3의 반전 자음 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 9는 수정 모음 이미지를 생성하는 방법을 설명하는 순서도이다.
도 10 내지 도 12는 수정 모음 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 13은 반전 자음 이미지, 수정 모음 이미지, 및 제1 패딩 이미지를 결합하는 방법을 설명하기 위한 도면이다.
도 14는 예시적인 실시예에 따른 초성 및 중성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다.
도 15는 반전 자음 이미지, 수정 모음 이미지, 제1 패딩 이미지, 및 제2 패딩 이미지를 결합하는 방법을 설명하기 위한 도면이다.
도 16은 예시적인 실시예에 따른 초성, 중성, 및 종성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하기 위한 순서도이다.
도 17은 도 16의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면이다.
도 18은 예시적인 실시예에 따른 초성, 중성, 및 종성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하기 위한 순서도이다.
도 19는 도 18의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면이다.
도 20는 예시적인 실시예에 따른 반전 글자 학습 장치의 블록도이다.
도 21은 도 20의 인공지능 학습부의 블록도이다.
도 22는 예시적인 실시예에 따른 반전 글자 이미지를 학습하는 방법을 설명하기 위한 순서도이다.
도 23은 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다.
도 24는 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다.
도 25는 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다.
도 26은 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다.
도 27은 도 1의 자소 이미지 처리부의 예시적인 블록도이다.
도 28은 예시적인 실시예에 따른 영어 알파벳을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다.
도 29 및 도 30은 도 28의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 31은 예시적인 실시예에 따른 반전 글자 학습 장치의 블록도이다.
도 32는 도 22의 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다.
도 33은 도 22의 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다.
도 34는 도 22의 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다.
도 35는 도 22의 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다.
도 36은 도 1의 자소 이미지 처리부의 예시적인 블록도이다.
도 37은 예시적인 실시예에 따른 숫자를 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다.
도 38 및 도 39는 도 37의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 40은 도 22의 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다.
도 41은 도 22의 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다.
도 42는 도 22의 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다.
도 43은 도 22의 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다.
이하에서, 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있을 정도로, 본 발명의 실시 예들이 명확하고 상세하게 기재될 것이다.
본 명세서에서, '반전'이란 좌우 반전, 즉, 왼쪽과 오른쪽을 서로 바꾸는 것을 지칭할 수 있다.
도 1은 예시적인 실시예에 따른 반전 글자 생성 장치의 블록도이다. 도 2는 도 1의 자소 이미지 처리부의 예시적인 블록도이다.
도 1을 참조하면, 반전 글자 생성 장치(10)는 자소 이미지 처리부(20) 및 자소 이미지 결합부(30)를 포함할 수 있다. 반전 글자 생성 장치(10)는 올바른 자음 이미지와 모음 이미지를 이용하여 반전 글자 이미지를 생성할 수 있다. 반전 글자는 좌우 반전된 자음을 초성 및 종성 중 적어도 하나에 포함할 수 있다.
도 2를 참조하면, 자소 이미지 처리부(20)는 자음 이미지 변환부(21), 모음 이미지 변환부(22), 글자 영역 추출부(23), 및 글자 크기 변환부(24)를 포함할 수 있다. 자음 이미지 변환부(21)는 자음 이미지를 이용하여 반전 자음 이미지를 생성할 수 있다. 모음 이미지 변환부(22)는 모음 이미지를 이용하여 수정 모음 이미지를 생성할 수 있다. 글자 영역 추출부(23)는 반전 자음 이미지 및 수정 모음 이미지에서 글자가 적힌 글자 영역을 추출할 수 있다. 글자 크기 변환부(24)는 글자 영역의 크기를 조정할 수 있다.
도 3은 예시적인 실시예에 따른 초성 및 중성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다. 도 4는 도 3의 반전 자음 이미지를 생성하는 방법을 설명하는 순서도이다. 도 5 내지 도 8은 도 3의 반전 자음 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 3을 참조하면, 반전 글자 이미지의 생성 방법은 반전 자음 이미지 및 수정 모음 이미지를 생성하는 것(S100) 및 반전 자음 이미지, 수정 모음 이미지, 및 제1 패딩 이미지를 결합하는 것(S200)을 포함할 수 있다. 이하에서, 반전 자음 이미지를 생성하는 방법이 설명된다.
도 2, 도 4, 및 도 5를 참조하면, 자음 이미지 변환부(21)는 자음 이미지(111)를 반전시켜 제1 예비 반전 자음 이미지(112)를 생성할 수 있다.(S111) 자음 이미지(111)는 저장부(40)에 미리 저장된 것일 수 있다. 예를 들어, 자음 이미지(111)는 반전 글자 생성 장치(10) 외부의 입력 장치를 통해 입력된 손글씨 이미지일 수 있다. 자음 이미지(111)는 좌우 반전시 본래의 의미로 인식되지 않는 자음의 이미지일 수 있다. 예를 들어, 자음 이미지(111)는 기억(ㄱ), 니은(ㄴ), 디귿(ㄷ), 리을(ㄹ), 시옷(ㅅ), 지읒(ㅈ), 치읓(ㅊ), 키읔(ㅋ), 및 티읕(ㅌ) 중 어느 하나의 이미지일 수 있다. 설명의 간결함을 위해, 자음 이미지(111)가 기억(ㄱ) 이미지인 경우가 예시적으로 설명된다. 자음 이미지(111)는 배경 부분과 자소 부분을 포함할 수 있다. 예를 들어, 자음 이미지(111)에서 자소 부분을 제외한 나머지가 배경 부분일 수 있다. 후술되는 모든 이미지들도 배경 부분과 자소 부분을 포함할 수 있다.
도 2, 도 4, 및 도 6을 참조하면, 자음 이미지 변환부(21)는 제1 예비 반전 자음 이미지(112)에 증강 기법(augmentation method)을 적용하여 제2 예비 반전 자음 이미지(113)를 생성할 수 있다.(S112) 증강 기법은, 예를 들어, 이미지 회전, 이미지 확대 또는 축소, 이미지 밝기 조절 등일 수 있다. 설명의 간결함을 위해, 증강 기법이 이미지 회전인 경우가 예시적으로 설명된다. 제1 예비 반전 자음 이미지(112)의 회전은 반전된 기억(ㄱ)으로 인식될 수 있을 정도로 수행될 수 있다. 예를 들어, 이미지 회전은 오른쪽 또는 왼쪽으로 45 범위에서 수행될 수 있다. 이에 따라, 제1 예비 반전 자음 이미지(112)가 지나치게 회전되어 니은(ㄴ)이나 올바른 기억(ㄱ)으로 인식되는 것이 방지될 수 있다.
도 2, 도 4, 및 도 7을 참조하면, 글자 영역 추출부(23)는 제2 예비 반전 자음 이미지(113)로부터 글자 영역(113a)을 추출하여 제3 예비 반전 자음 이미지(114)를 생성할 수 있다.(S113) 글자 영역(113a)은 자소 부분의 상하좌우 끝부분을 지나는 사각형 영역일 수 있다. 예를 들어, 글자 영역(113a)은 제2 예비 반전 자음 이미지(113)의 자소 부분과 배경 부분의 일부를 포함할 수 있다.
도 2, 도 4, 및 도 8을 참조하면, 글자 크기 변환부(24)는 제3 예비 반전 자음 이미지(114)의 가로 크기 및 세로 크기를 조정하여 반전 자음 이미지(115)를 생성할 수 있다.(S114) 제3 예비 반전 자음 이미지(114)의 크기 조정은 반전 자음 이미지(115)와 후술되는 수정 모음 이미지가 용이하게 결합되도록 수행될 수 있다. 예를 들어, 글자 크기 변환부(24)는 제3 예비 반전 자음 이미지(114)의 가로 길이 및 세로 길이를 비교하여 더 긴 어느 하나를 선택한 후, 상기 어느 하나를 요구되는 길이로 조절하되 나머지 하나도 상기 어느 하나의 조절 비율만큼 조정할 수 있다. 따라서, 반전 자음 이미지(115)의 가로 길이 및 세로 길이의 비율은 제3 예비 반전 자음 이미지(114)의 가로 길이 및 세로 길이의 비율과 실질적으로 동일할 수 있다.
도 9는 수정 모음 이미지를 생성하는 방법을 설명하는 순서도이다. 도 10 내지 도 12는 수정 모음 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 2, 도 9, 및 도 10을 참조하면, 모음 이미지 변환부(22)는 모음 이미지(211)에 증강 기법을 적용하여 제1 예비 수정 모음 이미지(212)를 생성할 수 있다.(S121) 모음 이미지(211)는 저장부(40)에 미리 저장된 것일 수 있다. 모음 이미지(211)는 초성의 오른쪽에 배치되는 모음(예를 들어, ㅏ, ㅐ, ㅑ, ㅓ, ㅔ, ㅕ, ㅣ)의 이미지 또는 초성의 아래쪽에 배치되는 모음(예를 들어, ㅗ, ㅛ, ㅜ, ㅠ, ㅡ)의 이미지일 수 있다. 예를 들어, 모음 이미지(211)는 제1 반전 글자 생성 장치(10) 외부의 입력 장치를 통해 입력된 손글씨 이미지일 수 있다. 설명의 간결함을 위해, 증강 기법이 이미지 회전인 경우가 예시적으로 설명된다. 모음 이미지(211)의 회전은 본래의 모음 이미지로 인식될 수 있을 정도로 수행될 수 있다. 예를 들어, 이미지 회전은 오른쪽 또는 왼쪽으로 15 범위에서 수행될 수 있다. 이에 따라, 제1 예비 수정 모음 이미지(212)가 지나치게 회전되어 다른 모음으로 인식되는 것이 방지될 수 있다. 예시적으로, 도 10의 (a) 및 (b)에는 각각 'ㅏ', 'ㅗ'의 이미지가 회전된 것이 도시되었다.
도 2, 도 9, 도 11을 참조하면, 글자 영역 추출부(23)는 제1 예비 수정 모음 이미지(212)로부터 글자 영역(212a)을 추출하여 제2 예비 수정 모음 이미지(213)를 생성할 수 있다.(S122) 글자 영역(212a)은 자소 부분의 상하좌우 끝부분을 지나는 사각형 영역일 수 있다. 예를 들어, 글자 영역(212a)은 제2 예비 수정 모음 이미지(213)의 자소 부분과 배경 부분의 일부를 포함할 수 있다. 도 11의 (a) 및 (b)에는 각각 'ㅏ', 'ㅗ'의 글자 영역(212a)이 도시되었다.
도 2, 도 9, 및 도 12를 참조하면, 글자 크기 변환부(24)는 제2 예비 수정 모음 이미지(213)의 가로 크기 및 세로 크기를 조정하여 수정 모음 이미지(214)를 생성할 수 있다.(S123) 제2 예비 수정 모음 이미지(213)의 크기 조정은 반전 자음 이미지(115)와 수정 모음 이미지(214)가 용이하게 결합되도록 수행될 수 있다. 예를 들어, 글자 크기 변환부(24)는 제2 예비 수정 모음 이미지(213)의 가로 길이 및 세로 길이를 비교하여 더 긴 어느 하나를 선택한 후, 상기 어느 하나를 요구되는 길이로 조절하되 나머지 하나도 상기 어느 하나의 조절 비율만큼 조정할 수 있다. 따라서, 수정 모음 이미지(214)의 가로 길이 및 세로 길이의 비율은 제2 예비 수정 모음 이미지(213)의 가로 길이 및 세로 길이의 비율과 실질적으로 동일할 수 있다.
도 13은 반전 자음 이미지, 수정 모음 이미지, 및 제1 패딩 이미지를 결합하는 방법을 설명하기 위한 도면이다.
도 1, 도 3, 및 도 13을 참조하면, 반전 자음 이미지(115), 수정 모음 이미지(214), 및 제1 패딩 이미지(311)가 결합되어 반전 글자 이미지(400)를 생성할 수 있다.(S200) 자소 이미지 결합부(30)는 반전 자음 이미지(115)와 수정 모음 이미지(214)가 결합하는 방향에 수직한 방향을 따라 반전 자음 이미지(115)와 수정 모음 이미지(214)의 길이를 비교하여, 상대적으로 짧은 길이를 갖는 이미지를 선택할 수 있다. 반전 자음 이미지(115)와 수정 모음 이미지(214)가 결합하는 방향은 좌우 방향일 수 있고, 그에 수직한 방향은 상하 방향일 수 있다. 예시적으로, 반전 자음 이미지(115)의 상하 방향 길이가 더 짧은 것으로 도시되었다. 다른 예에서, 수정 모음 이미지(214)의 상하 방향 길이가 더 짧을 수 있다. 자소 이미지 결합부(30)는 상대적으로 짧은 길이를 갖는 반전 자음 이미지(115)의 상부 및 하부에 제1 패딩 이미지(311)를 결합할 수 있다. 다만, 제1 패딩 이미지(311)가 반전 자음 이미지(115)의 상부 및 하부에 결합되는 것은 예시적인 것이다. 다른 예에서, 제1 패딩 이미지(311)는 반전 자음 이미지(115)의 상부 또는 하부에만 결합될 수 있다. 제1 패딩 이미지(311)의 가로 길이는 반전 자음 이미지(115)의 가로 길이와 실질적으로 동일할 수 있다. 상하 방향을 따라 연장하는 제1 패딩 이미지(311)의 중심축(미도시)은 상하 방향을 따라 연장하는 반전 자음 이미지(115)의 중심축(미도시)에 정렬될 수 있다. 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지의 세로 길이는 수정 모음 이미지(214)의 세로 길이와 실질적으로 동일할 수 있다. 자소 이미지 결합부(30)는 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지와 수정 모음 이미지(214)를 결합할 수 있다. 일 예에서, 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지의 좌우 방향을 따라 연장하는 중심축과 수정 모음 이미지(214)의 중심축은 서로 정렬될 수 있다.
본 개시는 올바르게 작성된 소량의 손글씨 이미지 데이터(예를 들어, 기억(ㄱ), 니은(ㄴ), 디귿(ㄷ) 등의 자음 이미지와 ㅏ, ㅑ, ㅓ 등의 모음 이미지)로부터 대량의 반전 글자 이미지 데이터(예를 들어, '가'의 제1 반전 글자 이미지, '나'의 제1 반전 글자 이미지, '다'의 제1 반전 글자 이미지 등)를 획득할 수 있는 반전 글자 이미지 생성 방법을 제공할 수 있다.
도 14는 예시적인 실시예에 따른 초성 및 중성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다. 도 15는 반전 자음 이미지, 수정 모음 이미지, 제1 패딩 이미지, 및 제2 패딩 이미지를 결합하는 방법을 설명하기 위한 도면이다. 설명의 간결함을 위해, 도 3 및 도 13을 참조하여 설명된 것과의 차이점이 중점적으로 설명된다.
도 14 및 도 15를 참조하면, 도 3 및 도 13을 참조하여 설명된 것과 달리, 반전 자음 이미지(115), 수정 모음 이미지(214), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합되어 반전 글자 이미지를 생성할 수 있다.(S201) 반전 자음 이미지(115), 수정 모음 이미지(214), 및 제1 패딩 이미지(311)가 결합되는 것은 도 3 및 도 13을 참조하여 설명된 것과 실질적으로 동일할 수 있다.
자소 이미지 결합부(30)는 반전 자음 이미지(115) 또는 수정 모음 이미지(214) 중 적어도 하나에 제2 패딩 이미지(312)를 결합할 수 있다. 제2 패딩 이미지(312)가 반전 자음 이미지(115)에 결합된 것으로 도시되었으나, 이는 예시적인 것이다. 다른 예에서, 제2 패딩 이미지(312)는 수정 모음 이미지(214)에만 결합되거나, 반전 자음 이미지(115) 및 수정 모음 이미지(214) 전부에 결합될 수 있다. 일 예에서, 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지의 좌우 방향을 따라 연장하는 중심축과 제2 패딩 이미지(312)의 중심축은 서로 정렬될 수 있다. 제2 패딩 이미지(312)는 반전 자음 이미지(115)와 수정 모음 이미지(214) 사이에 제공될 수 있다. 제2 패딩 이미지(312)는 반전 자음 이미지(115)와 수정 모음 이미지(214) 사이의 간격을 제공할 수 있다. 제2 패딩 이미지(312)의 세로 길이는 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지의 세로 길이 및 수정 모음 이미지(214)의 세로 길이와 실질적으로 동일할 수 있다.
도 16은 예시적인 실시예에 따른 초성, 중성, 및 종성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하기 위한 순서도이다. 도 17은 도 16의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면이다.
도 16을 참조하면, 초성 이미지(411), 중성 이미지(412), 및 종성 이미지(413)가 생성될 수 있다.(S101) 초성 이미지(411) 및 종성 이미지(413) 중 적어도 하나는 반전 자음 이미지를 포함할 수 있다. 예시적으로, 초성 이미지(411)는 자음 이미지이고, 종성 이미지(413)는 반전 자음 이미지인 경우가 설명된다. 일 예에서, 자음 이미지는 도 3 내지 도 8을 참조하여 설명된 반전 자음 이미지 생성 방법에서 자음 이미지를 반전하는 것을 제외한 나머지 단계를 거쳐 생성될 수 있다. 일 예에서, 반전 자음 이미지는 도 3 내지 도 8을 참조하여 설명된 반전 자음 이미지 생성 방법에 의해 생성될 수 있다. 중성 이미지(412)는 모음 이미지일 수 있다. 일 예에서, 모음 이미지는 도 9 내지 도 12를 참조하여 설명된 수정 모음 이미지 생성 방법에 의해 생성된 수정 모음 이미지일 수 있다.
도 16 및 도 17을 참조하면, 초성 이미지(411), 중성 이미지(412), 종성 이미지(413), 제1 패딩 이미지(311), 제2 패딩 이미지(312), 및 제3 패딩 이미지(313)가 결합되어 반전 글자 이미지(400)를 생성할 수 있다.(S202) 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합되는 것은 도 14 및 도 15를 참조하여 설명된 반전 자음 이미지, 수정 모음 이미지, 제1 패딩 이미지, 및 제2 패딩 이미지의 결합 방법과 실질적으로 동일할 수 있다.
자소 이미지 결합부(30)는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지와 종성 이미지(413)의 가로 길이를 비교하여, 짧은 길이를 갖는 이미지를 선택할 수 있다. 예시적으로, 종성 이미지(413)의 가로 길이가 더 짧은 것으로 도시되었다. 다른 예에서, 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지의 가로 길이가 더 짧을 수 있다. 자소 이미지 결합부(30)는 상대적으로 짧은 길이를 갖는 종성 이미지(413)의 좌측 및 우측에 제3 패딩 이미지(313)를 결합할 수 있다. 다만, 제3 패딩 이미지(313)가 종성 이미지(413)의 좌측 및 우측에 결합되는 것은 예시적인 것이다. 다른 예에서, 제3 패딩 이미지(313)는 종성 이미지(413)의 좌측 또는 우측에만 결합될 수 있다. 제3 패딩 이미지(313)의 세로 길이는 종성 이미지(413)의 세로 길이와 실질적으로 동일할 수 있다. 좌우 방향을 따라 연장하는 제3 패딩 이미지(313)의 중심축(미도시)은 좌우 방향을 따라 연장하는 종성 이미지(413)의 중심축(미도시)에 정렬될 수 있다. 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지의 가로 길이는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지의 가로 길이와 실질적으로 동일할 수 있다. 자소 이미지 결합부(30)는 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지와 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지를 결합할 수 있다. 예를 들어, 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지의 상하 방향을 따라 연장하는 중심축은 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지의 상하 방향을 따라 연장하는 중심축과 정렬될 수 있다.
본 개시는 올바르게 작성된 소량의 손글씨 이미지 데이터(예를 들어, 기억(ㄱ), 니은(ㄴ), 디귿(ㄷ) 등의 자음 이미지와 아(ㅏ), 야(ㅑ), 어(ㅓ) 등의 모음 이미지)로부터 대량의 반전 글자 이미지 데이터(예를 들어, '각'의 반전 글자 이미지, '난'의 반전 글자 이미지, '닫'의 반전 글자 이미지 등)를 획득할 수 있는 반전 글자 이미지 생성 방법을 제공할 수 있다.
도 18은 예시적인 실시예에 따른 초성, 중성, 및 종성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하기 위한 순서도이다. 도 19는 도 18의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면이다. 설명의 간결함을 위해, 도 16 및 도 17을 참조하여 설명된 것과의 차이점이 중점적으로 설명된다.
도 18 및 도 19를 참조하면, 도 16 및 도 17을 참조하여 설명된 것과 달리, 초성 이미지(411), 중성 이미지(412), 종성 이미지(413), 제1 패딩 이미지(311), 제2 패딩 이미지(312), 제3 패딩 이미지(313), 및 제4 패딩 이미지(314)가 결합될 수 있다. 초성 이미지(411), 중성 이미지(412), 종성 이미지(413), 제1 패딩 이미지(311), 제2 패딩 이미지(312), 및 제3 패딩 이미지(313)가 결합되는 것은 도 16 및 도 17을 참조하여 설명된 것과 실질적으로 동일할 수 있다.
자소 이미지 결합부(30)는 제4 패딩 이미지(314)를 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지 및 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지 중 적어도 하나에 결합할 수 있다. 제4 패딩 이미지(314)가 종성 이미지(413)에 결합되는 것으로 도시되었으나, 이는 예시적인 것이다. 다른 예에서, 제4 패딩 이미지(314)는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지에만 결합되거나, 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지 및 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지 전부에 결합될 수 있다. 제4 패딩 이미지(314)는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지 및 종성 이미지(413) 사이에 제공될 수 있다. 제4 패딩 이미지(314)는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지 및 종성 이미지(413) 사이의 간격을 제공할 수 있다. 제4 패딩 이미지(314)의 가로 길이는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지의 가로 길이 및 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지의 가로 길이와 실질적으로 동일할 수 있다.
도 20는 예시적인 실시예에 따른 반전 글자 학습 장치의 블록도이다. 도 21은 도 20의 인공지능 학습부의 블록도이다.
도 20을 참조하면, 반전 글자 학습 장치(1000)가 제공될 수 있다. 반전 글자 학습 장치(1000)는 자소 이미지 처리부(20), 자소 이미지 결합부(30), 저장부(40), 및 인공지능 학습부(50)를 포함할 수 있다. 자소 이미지 처리부(20) 및 자소 이미지 결합부(30)는 반전 글자 이미지 생성부로 지칭될 수 있다. 자소 이미지 처리부(20) 및 자소 이미지 결합부(30)는 도 1 및 도 2를 참조하여 설명된 것과 실질적으로 동일할 수 있다.
도 21을 참조하면, 인공지능 학습부(50)는 반전 글자 크기 조절부(51), 반전 글자 증강부(52), 및 인공지능 학습 수행부(53)를 포함할 수 있다. 반전 글자 크기 조절부(51)는 반전 글자 이미지가 인공지능 학습에 적합한 크기를 갖도록 반전 글자 이미지의 크기를 조절할 수 있다. 반전 글자 증강부(52)는 크기가 조절된 반전 글자 이미지에 증강 기법을 적용하여, 인공지능 학습용 데이터를 늘릴 수 있다. 인공지능 학습 수행부(53)는 증강된 인공지능 학습용 데이터를 이용하여 반전 글자 이미지 인식 모델을 학습할 수 있다.
도 22는 예시적인 실시예에 따른 반전 글자 이미지를 학습하는 방법을 설명하기 위한 순서도이다. 도 23은 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다. 도 24는 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다. 도 25는 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다. 도 26은 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다.
도 22 및 도 23을 참조하면, 반전 글자 이미지들(401)을 포함하는 반전 글자 데이터 셋(500)이 생성될 수 있다.(S301) 반전 글자 이미지들(401)은 앞서 설명된 반전 글자 생성 방법들에 의해 생성될 수 있다. 예시적으로, '각'의 종성이 반전된 이미지(401) 및 '돈'의 초성이 반전된 이미지(401)가 반전 글자 데이터 셋(500)에 포함되는 것으로 도시되었다. 반전 글자 데이터 셋(500)은 저장부(40)에 저장될 수 있다.
도 22 및 도 24를 참조하면, 반전 글자 이미지들(401)의 크기가 조절될 수 있다.(S302) 반전 글자 이미지들(401)의 크기 조절은 반전 글자 크기 조절부(51)에 의해 수행될 수 있다. 반전 글자 이미지들(401)의 크기는 인공지능 학습에 적합하도록 조절될 수 있다. 예를 들어, 반전 글자 이미지들(401)이 요구되는 크기를 갖도록 반전 글자 이미지들(401) 각각에 패딩 이미지들(402)이 결합될 수 있다. 예를 들어, 요구되는 크기는 64x64 픽셀의 크기일 수 있다.
도 22 및 도 25를 참조하면, 반전 글자 이미지들(401)에 증강 기법이 적용되어, 반전 글자 데이터 셋(500)을 증강할 수 있다.(S303) 예를 들어, 반전 글자 이미지들에 증강 기법을 적용하는 것은 반전 글자 증강부(52)에 의해 수행될 수 있다. 증강 기법은, 예를 들어, 이미지 회전, 이미지 확대 또는 축소, 이미지 밝기 조절 등일 수 있다.
도 22 및 도 26을 참조하면, 반전 글자 데이터 셋(500)을 이용하여 반전 글자 인식 모델(53a)이 학습될 수 있다.(S304) 반전 글자 인식 모델(53a)은 인공지능 기반의 반전된 한글 이미지 인식 모델일 수 있다. 예를 들어, 반전 글자 인식 모델(53a)은 합성곱 신경망(CNN), 순환 신경망(RN), 서포트 벡터 머신(SVM), 어텐션 매커니즘(Attention Mechanism) 등을 포함할 수 있다. 반전 글자 인식 모델(53a)의 학습은 인공지능 학습 수행부(53)에 의해 수행될 수 있다. 반전 글자 인식 모델(53a)은 같은 종류의 반전 글자 이미지들의 특징을 학습할 수 있다. 예를 들어, 반전 글자 인식 모델(53a)은 '각'의 종성이 반전된 이미지들을 학습하여 '각'의 종성이 반전된 이미지들의 특징들에 제1 코드(예: 도 26의 00111000)를 부여하는 제1 결과(RD1)를 얻을 수 있고, '돈'의 초성이 반전된 이미지들을 학습하여 '돈'의 초성이 반전된 이미지들의 특징들에 제2 코드(예: 도 26의 10001001)를 부여하는 제2 결과(RD2)를 얻을 수 있다. 학습 후의 반전 글자 인식 모델(53a)은 제1 결과(RD1) 및 제2 결과(RD2)와 같은 학습 결과를 이용하여, 반전 글자 데이터 셋(500)에 포함되어 있지 않은 반전 글자 이미지(예를 들어, 새로 입력되는 반전 글자 이미지)를 인식할 수 있다.
도 27은 도 1의 자소 이미지 처리부의 예시적인 블록도이다. 설명의 간결함을 위해, 도 2를 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.
도 27을 참조하면, 자소 이미지 처리부(20)가 제공될 수 있다. 자소 이미지 처리부(20)는 알파벳 이미지 변환부(25), 글자 영역 추출부(23), 및 글자 크기 변환부(24)를 포함할 수 있다. 글자 영역 추출부(23) 및 글자 크기 변환부(24)는 도 2를 참조하여 설명된 글자 영역 추출부(23) 및 글자 크기 변환부(24)과 실질적으로 동일할 수 있다. 알파벳 이미지 변환부(25)는 영어 알파벳 이미지를 좌우반전시키도록 구성될 수 있다.
도 28은 예시적인 실시예에 따른 영어 알파벳을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다. 도 29 및 도 30은 도 28의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 27 내지 도 29를 참조하면, 알파벳 이미지 변환부(25)는 알파벳 이미지(121)를 반전시켜 예비 반전 글자 이미지(122)를 생성할 수 있다.(S131) 알파벳 이미지(121)는 저장부(40)에 미리 저장된 것일 수 있다. 예를 들어, 알파벳 이미지(121)는 반전 글자 생성 장치(10) 외부의 입력 장치를 통해 입력된 손글씨 이미지일 수 있다. 알파벳 이미지(121)는 좌우 반전시 본래의 의미로 인식되지 않는 알파벳의 이미지일 수 있다. 예를 들어, 알파벳 이미지(121)는 B, C, D, E, F, G, H, J, K, L, N, P, Q, R, S, 및 Z과 같은 대문자들 중 어느 하나의 이미지 또는 a, b, c, d, e, f, g, h, j, k, l, m, n, p, q, r, s, t, u, y, 및 z와 같은 소문자들 중 하나일 수 있다. 설명의 간결함을 위해, 알파벳 이미지(121)가 Q의 이미지 및 a의 이미지인 경우가 예시적으로 설명된다.
도 27, 도 28, 및 도 30을 참조하면, 글자 영역 추출부(23)는 예비 반전 글자 이미지(122)로부터 글자 영역(122a)을 추출하여 반전 글자 이미지(123)를 생성할 수 있다.(S132) 글자 영역(122a)은 자소 부분의 상하좌우 끝부분을 지나는 사각형 영역일 수 있다. 예를 들어, 글자 영역(122a)은 예비 반전 글자 이미지(122)의 자소 부분과 배경 부분의 일부를 포함할 수 있다.
도 31은 예시적인 실시예에 따른 반전 글자 학습 장치의 블록도이다. 설명의 간결함을 위해, 도 20 및 도 21을 참조하여 설명된 것 및 도 27을 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.
도 31을 참조하면, 반전 글자 학습 장치(1100)가 제공될 수 있다. 반전 글자 학습 장치(1100)는 자소 이미지 처리부(20), 저장부(40), 및 인공지능 학습부(50)를 포함할 수 있다. 자소 이미지 처리부(20)는 반전 글자 이미지 생성부로 지칭될 수 있다. 자소 이미지 처리부(20)는 도 27을 참조하여 설명된 것과 실질적으로 동일할 수 있다. 인공지능 학습부(50)는 도 20 및 도 21을 참조하여 설명된 것과 실질적으로 동일할 수 있다. 한글과 달리 알파벳은 글자들의 결합에 의해 새로운 의미를 갖는 글자를 형성하지 않으므로, 앞서 설명된 자소 이미지 결합부는 생략될 수 있다.
도 32는 도 22의 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다. 도 33은 도 22의 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다. 도 34는 도 22의 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다. 도 35는 도 22의 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다. 설명의 간결함을 위해, 도 22 내지 도 26을 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.
도 22 및 도 32를 참조하면, 반전 글자 이미지들(401)을 포함하는 반전 글자 데이터 셋(500)이 생성될 수 있다.(S301) 반전 글자 이미지들(401)은 앞서 설명된 반전 글자 생성 방법들에 의해 생성될 수 있다. 예시적으로, 'Q'가 반전된 이미지(401) 및 'a'가 반전된 이미지(401)가 반전 글자 데이터 셋(500)에 포함되는 것으로 도시되었다. 반전 글자 데이터 셋(500)은 저장부(40)에 저장될 수 있다.
도 22 및 도 33을 참조하면, 반전 글자 이미지들(401)의 크기가 조절될 수 있다.(S302) 반전 글자 이미지들(401)의 크기 조절은 반전 글자 크기 조절부(도 21의 51)에 의해 수행될 수 있다. 반전 글자 이미지들(401)의 크기는 인공지능 학습에 적합하도록 조절될 수 있다. 예를 들어, 반전 글자 이미지들(401)이 요구되는 크기를 갖도록 반전 글자 이미지들(401) 각각에 패딩 이미지들(402)이 결합될 수 있다. 예를 들어, 요구되는 크기는 64x64 픽셀의 크기일 수 있다.
도 22 및 도 34를 참조하면, 반전 글자 이미지들(401)에 증강 기법이 적용되어, 반전 글자 데이터 셋(500)을 증강할 수 있다.(S303) 예를 들어, 반전 글자 이미지들(401)에 증강 기법을 적용하는 것은 반전 글자 증강부(52)에 의해 수행될 수 있다. 증강 기법은, 예를 들어, 이미지 회전, 이미지 확대 또는 축소, 이미지 밝기 조절 등일 수 있다.
도 22 및 도 35을 참조하면, 반전 글자 데이터 셋(500)을 이용하여 반전 글자 인식 모델(53b)이 학습될 수 있다.(S304) 반전 글자 인식 모델(53b)은 인공지능 기반의 반전된 영어 알파벳 이미지 인식 모델일 수 있다. 예를 들어, 반전 글자 인식 모델(53b)은 합성곱 신경망(CNN), 순환 신경망(RN), 서포트 벡터 머신(SVM), 어텐션 매커니즘(Attention Mechanism) 등을 포함할 수 있다. 반전 글자 인식 모델(53b)의 학습은 인공지능 학습 수행부(53)에 의해 수행될 수 있다. 반전 글자 인식 모델(53b)은 같은 종류의 반전 글자 이미지들의 특징을 학습할 수 있다. 예를 들어, 반전 글자 인식 모델(53b)은 'a'가 반전된 이미지들을 학습하여 'a'가 반전된 이미지들의 특징들에 제3 코드(예: 도 35의 000010)를 부여하는 제3 결과(RD3)를 얻을 수 있고, 'Q'가 반전된 이미지들을 학습하여 'Q'가 반전된 이미지들의 특징들에 제4 코드(예: 도 35의 000001)를 부여하는 제4 결과(RD4)를 얻을 수 있다. 학습 후의 반전 글자 인식 모델(53b)은 제3 결과(RD3) 및 제4 결과(RD4)와 같은 학습 결과를 이용하여, 반전 글자 데이터 셋(500)에 포함되어 있지 않은 반전 글자 이미지(예를 들어, 새로 입력되는 반전 글자 이미지)를 인식할 수 있다.
도 36은 도 1의 자소 이미지 처리부의 예시적인 블록도이다. 설명의 간결함을 위해, 도 2를 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.
도 36을 참조하면, 자소 이미지 처리부(20)가 제공될 수 있다. 자소 이미지 처리부(20)는 숫자 이미지 변환부(26), 글자 영역 추출부(23), 및 글자 크기 변환부(24)를 포함할 수 있다. 글자 영역 추출부(23) 및 글자 크기 변환부(24)는 도 2를 참조하여 설명된 글자 영역 추출부(23) 및 글자 크기 변환부(24)과 실질적으로 동일할 수 있다. 알파벳 이미지 변환부(25)는 숫자 이미지를 좌우반전시키도록 구성될 수 있다.
도 37은 예시적인 실시예에 따른 숫자를 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다. 도 38 및 도 39는 도 37의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 36 내지 도 38을 참조하면, 숫자 이미지 변환부(26)는 숫자 이미지(131)를 반전시켜 예비 반전 글자 이미지(132)를 생성할 수 있다.(S131) 숫자 이미지(131)는 저장부(40)에 미리 저장된 것일 수 있다. 예를 들어, 숫자 이미지(131)는 반전 글자 생성 장치(10) 외부의 입력 장치를 통해 입력된 손글씨 이미지일 수 있다. 숫자 이미지(131)는 좌우 반전시 본래의 의미로 인식되지 않는 숫자의 이미지일 수 있다. 예를 들어, 숫자 이미지(131)는 1, 2, 3, 4, 5, 6, 7, 및 9 중 어느 하나일 수 있다. 설명의 간결함을 위해, 숫자 이미지(131)가 3의 이미지인 경우가 예시적으로 설명된다.
도 36, 도 37, 및 도 39를 참조하면, 글자 영역 추출부(23)는 예비 반전 글자 이미지(132)로부터 글자 영역(132a)을 추출하여 반전 글자 이미지(123)를 생성할 수 있다.(S132) 글자 영역(132a)은 자소 부분의 상하좌우 끝부분을 지나는 사각형 영역일 수 있다. 예를 들어, 글자 영역(132a)은 예비 반전 글자 이미지(132)의 자소 부분과 배경 부분의 일부를 포함할 수 있다.
도 40은 도 22의 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다. 도 41은 도 22의 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다. 도 42는 도 22의 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다. 도 43은 도 22의 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다. 설명의 간결함을 위해, 도 22 내지 도 26을 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.
도 22 및 도 40을 참조하면, 반전 글자 이미지들(401)을 포함하는 반전 글자 데이터 셋(500)이 생성될 수 있다.(S301) 반전 글자 이미지들(401)은 앞서 설명된 반전 글자 생성 방법들에 의해 생성될 수 있다. 예시적으로, '3'이 반전된 이미지(401)가 반전 글자 데이터 셋(500)에 포함되는 것으로 도시되었다. 반전 글자 데이터 셋(500)은 저장부(40)에 저장될 수 있다.
도 22 및 도 41을 참조하면, 반전 글자 이미지들(401)의 크기가 조절될 수 있다.(S302) 반전 글자 이미지들(401)의 크기 조절은 반전 글자 크기 조절부(도 21의 51)에 의해 수행될 수 있다. 반전 글자 이미지들(401)의 크기는 인공지능 학습에 적합하도록 조절될 수 있다. 예를 들어, 반전 글자 이미지들(401)이 요구되는 크기를 갖도록 반전 글자 이미지들(401) 각각에 패딩 이미지들(402)이 결합될 수 있다. 예를 들어, 요구되는 크기는 64x64 픽셀의 크기일 수 있다.
도 22 및 도 42를 참조하면, 반전 글자 이미지들(401)에 증강 기법이 적용되어, 반전 글자 데이터 셋(500)을 증강할 수 있다.(S303) 예를 들어, 반전 글자 이미지들(401)에 증강 기법을 적용하는 것은 반전 글자 증강부(52)에 의해 수행될 수 있다. 증강 기법은, 예를 들어, 이미지 회전, 이미지 확대 또는 축소, 이미지 밝기 조절 등일 수 있다.
도 22 및 도 43을 참조하면, 반전 글자 데이터 셋(500)을 이용하여 반전 글자 인식 모델(53c)이 학습될 수 있다.(S304) 반전 글자 인식 모델(53c)은 인공지능 기반의 반전된 숫자 이미지 인식 모델일 수 있다. 예를 들어, 반전 글자 인식 모델(53c)은 합성곱 신경망(CNN), 순환 신경망(RN), 서포트 벡터 머신(SVM), 어텐션 매커니즘(Attention Mechanism) 등을 포함할 수 있다. 반전 글자 인식 모델(53c)의 학습은 인공지능 학습 수행부(53)에 의해 수행될 수 있다. 반전 글자 인식 모델(53c)은 같은 종류의 반전 글자 이미지들의 특징을 학습할 수 있다. 예를 들어, 반전 글자 인식 모델(53c)은 '3'이 반전된 이미지들을 학습하여 '3'이 반전된 이미지들의 특징들에 제5 코드(예: 도 43의 000001)를 부여하는 제5 결과(RD5)를 얻을 수 있다. 학습 후의 반전 글자 인식 모델(53c)은 제5 결과(RD5)와 같은 학습 결과를 이용하여, 반전 글자 데이터 셋(500)에 포함되어 있지 않은 반전 글자 이미지(예를 들어, 새로 입력되는 반전 글자 이미지)를 인식할 수 있다.
상술한 내용은 본 발명을 실시하기 위한 구체적인 실시 예들이다. 본 발명은 상술한 실시 예들 이외에도, 단순하게 설계 변경되거나 용이하게 변경할 수 있는 실시 예들도 포함될 것이다. 또한, 본 발명은 실시 예들을 이용하여 용이하게 변형하여 실시할 수 있는 기술들도 포함될 것이다. 따라서, 본 발명의 범위는 상술한 실시 예들에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 발명의 특허청구범위와 균등한 것들에 의해 정해져야 할 것이다.

Claims (10)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하기 위한 반전 글자 이미지 생성부;
    상기 반전 글자 이미지들의 크기가 조절되도록 상기 반전 글자 이미지들에 리사이징 이미지들을 결합하기 위한 반전 글자 크기 조절부;
    상기 반전 글자 데이터 셋을 증강하는 반전 글자 증강부; 및
    상기 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 인공지능 학습 수행부;를 포함하고,
    상기 반전 글자 이미지 생성부는, 자소 이미지 처리부를 포함하되,
    상기 자소 이미지 처리부는: 자음 이미지를 반전시켜 제1 예비 반전 자음 이미지를 생성하고, 상기 제1 예비 반전 자음 이미지에 증강 기법을 적용하여 제2 예비 반전 자음 이미지를 생성하기 위한 자음 이미지 변환부; 모음 이미지에 증강 기법을 적용하여 제1 예비 수정 모음 이미지를 생성하기 위한 모음 이미지 변환부; 상기 제2 예비 반전 자음 이미지 및 상기 제1 예비 수정 모음 이미지로부터 글자 영역 이미지들을 추출하여 제3 예비 반전 자음 이미지 및 제2 예비 수정 모음 이미지를 생성하기 위한 글자 영역 추출부; 및 상기 제3 예비 반전 자음 이미지 및 상기 제2 예비 수정 모음 이미지의 크기를 요구되는 정도로 조절하여 반전 자음 이미지 및 수정 모음 이미지를 생성하기 위한 글자 크기 변환부;를 포함하며,
    상기 반전 글자 이미지 생성부는, 자소 이미지 결합부를 더 포함하되,
    상기 자소 이미지 결합부는, 상기 반전 자음 이미지를 포함하는 초성 이미지, 상기 수정 모음 이미지를 포함하는 중성 이미지, 및 제1 패딩 이미지를 결합하여 상기 반전 글자 이미지를 생성하되, 상기 제1 패딩 이미지는, 상기 초성 이미지와 상기 중성 이미지 중, 상기 초성 이미지와 상기 중성 이미지의 배열 방향과 수직한 방향을 따라 상대적으로 짧은 길이를 갖는 어느 하나에 결합되고, 상기 초성 이미지와 상기 중성 이미지 중 상기 어느 하나와 상기 제1 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 배열 방향에 수직한 방향을 따라 배열되는, 인공지능을 이용한 반전 글자 인식 장치.
  5. 제 4 항에 있어서,
    상기 초성 이미지와 상기 중성 이미지 중 상기 어느 하나의 길이와 상기 제1 패딩 이미지의 길이의 합은 상기 초성 이미지와 상기 중성 이미지 중 다른 하나의 길이와 동일한, 인공지능을 이용한 반전 글자 인식 장치.
  6. 제 4 항에 있어서,
    상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지에 제2 패딩 이미지를 더 결합하여 상기 반전 글자 이미지를 생성하되,
    상기 제2 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 간격이 확보되도록 상기 초성 이미지와 상기 중성 이미지 사이에 배치되는, 인공지능을 이용한 반전 글자 인식 장치.
  7. 제 4 항에 있어서,
    상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지에 상기 반전 자음 이미지를 포함하는 종성 이미지 및 제3 패딩 이미지를 더 결합하되,
    상기 제3 패딩 이미지는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중, 상기 초성 이미지와 상기 중성 이미지의 배열 방향을 따라 상대적으로 짧은 길이를 갖는 어느 하나에 결합되고,
    상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 상기 어느 하나와 상기 제3 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 배열 방향을 따라 배열되는, 인공지능을 이용한 반전 글자 인식 장치.
  8. 제 7 항에 있어서,
    상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 상기 어느 하나의 길이와 상기 제3 패딩 이미지의 길이의 합은 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 다른 하나의 길이와 동일한, 인공지능을 이용한 반전 글자 인식 장치.
  9. 제 7 항에 있어서,
    상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 상기 종성 이미지, 상기 제1 패딩 이미지, 및 상기 제3 패딩 이미지에 제4 패딩 이미지를 더 결합하여 상기 반전 글자 이미지를 생성하되,
    상기 제4 패딩 이미지는 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지의 간격이 확보되도록 상기 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 중성 이미지 사이에 배치되는, 인공지능을 이용한 반전 글자 인식 장치.
  10. 삭제
KR1020220155707A 2022-11-18 2022-11-18 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치 KR102515359B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220155707A KR102515359B1 (ko) 2022-11-18 2022-11-18 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220155707A KR102515359B1 (ko) 2022-11-18 2022-11-18 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치

Publications (1)

Publication Number Publication Date
KR102515359B1 true KR102515359B1 (ko) 2023-03-29

Family

ID=85800082

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220155707A KR102515359B1 (ko) 2022-11-18 2022-11-18 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치

Country Status (1)

Country Link
KR (1) KR102515359B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180126352A (ko) * 2017-07-07 2018-11-27 주식회사 마인드그룹 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
KR20220071480A (ko) * 2020-11-24 2022-05-31 (주)포스텍 강재 적치장 모니터링을 위한 광학적 문자 판독 시스템의 강재 표시 문자 기계 학습 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180126352A (ko) * 2017-07-07 2018-11-27 주식회사 마인드그룹 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
KR20220071480A (ko) * 2020-11-24 2022-05-31 (주)포스텍 강재 적치장 모니터링을 위한 광학적 문자 판독 시스템의 강재 표시 문자 기계 학습 방법

Similar Documents

Publication Publication Date Title
US11250252B2 (en) Simulated handwriting image generator
KR101861520B1 (ko) 얼굴 비식별화 방법
Frey et al. Eye-gaze word processing
Babu Design and development of artificial neural network based tamil unicode symbols identification system
Dehaene Reading in the brain revised and extended: response to comments
CN110033054B (zh) 基于协同笔画优化的个性化手写体迁移方法和系统
JP2004348714A (ja) 適応的手書き文字認識のためのシステムおよび方法
Joshi et al. Deep learning based Gujarati handwritten character recognition
US11842524B2 (en) Multi-modal learning based intelligent enhancement of post optical character recognition error correction
Achanta et al. Telugu OCR framework using deep learning
Wu et al. Scan: Sliding convolutional attention network for scene text recognition
KR102515359B1 (ko) 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치
Jino et al. Offline handwritten Malayalam word recognition using a deep architecture
CN111985525A (zh) 基于多模态信息融合处理的文本识别方法
Voronov et al. Development of a software package designed to support distance education for disabled people
Tripathy Reconstruction of oriya alphabets using Zernike moments
Wang et al. Calligraphy font recognition algorithm based on improved DenseNet network
Wijewickrama et al. deWristified: handwriting inference using wrist-based motion sensors revisited
Beg et al. Text translation of scanned Hindi document to braille via image processing
US11869130B2 (en) Generating visual feedback
Choudhury et al. Visual gesture-based character recognition systems for design of assistive technologies for people with special necessities
EP3605389A1 (en) Motion synthesis apparatus and motion synthesis method
KR20210109894A (ko) 신경망을 이용한 텍스트 인식 시스템 및 그 방법
Chanda et al. Automatic hand gesture recognition with semantic segmentation and deep learning
Hao et al. CNN-based Baybayin Character Recognition on Android System

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant