KR102515359B1

KR102515359B1 - 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치

Info

Publication number: KR102515359B1
Application number: KR1020220155707A
Authority: KR
Inventors: 손정훈; 김기웅; 이애진
Original assignee: 써큘러스리더(주)
Priority date: 2022-11-18
Filing date: 2022-11-18
Publication date: 2023-03-29

Abstract

인공지능을 이용한 반전 글자 인식 장치는 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하기 위한 반전 글자 이미지 생성부, 반전 글자 이미지들의 크기가 조절되도록 반전 글자 이미지들에 리사이징 이미지들을 결합하기 위한 반전 글자 크기 조절부, 반전 글자 데이터 셋을 증강하는 반전 글자 증강부, 및 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 인공지능 학습 수행부를 포함한다.

Description

인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치{DEVICE OF LEARNING REVERSED CHARACTER USING ARTIFICIAL INTELLIGENCE AND DEVICE OF GENERATING REVERSED CHARACTER}

본 개시는 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치에 관한 것이다.

난독 현상(예를 들어, 난독증, 경계선 지능, 다문화, ADHD 등)을 겪고 있는 사람들이 지속적으로 증가하고 있다. 일반적으로 난독 현상의 진단 및 치료는 전문가와 대면하여 이뤄진다. 따라서 난독 현상의 치료엔 비용적, 시간적, 또는 공간적 제약이 존재할 수 있다.

최근 난독 현상의 진단 및 치료를 위한 컴퓨터 프로그램을 이용한 컨텐츠들이 개발되고 있다. 상기 컨텐츠는 난독 현상의 특징들을 파악할 수 있는 기능을 필요로 한다. 난독현상을 겪는 사람이 나타내는 특징들 중 하나로 자음의 좌우가 뒤집힌 반전 글자를 작성하는 것이 있다. 따라서, 반전 글자를 인식할 수 있는 장치의 개발이 요구된다.

해결하고자 하는 과제는 대량의 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 반전 글자 인식 장치를 제공하는 것에 있다.

해결하고자 하는 과제는 대량의 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하는 반전 글자 생성 장치를 제공하는 것에 있다.

다만, 해결하고자 하는 과제는 상기 개시에 한정되지 않는다.

일 측면에 있어서, 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하기 위한 반전 글자 이미지 생성부; 상기 반전 글자 이미지들의 크기가 조절되도록 상기 반전 글자 이미지들에 리사이징 이미지들을 결합하기 위한 반전 글자 크기 조절부; 상기 반전 글자 데이터 셋을 증강하는 반전 글자 증강부; 및 상기 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 인공지능 학습 수행부;를 포함하는, 인공지능을 이용한 반전 글자 인식 장치가 제공될 수 있다.

상기 반전 글자 이미지 생성부는, 자소 이미지 처리부를 포함하되, 상기 자소 이미지 처리부는: 자음 이미지를 반전시켜 제1 예비 반전 자음 이미지를 생성하고, 상기 제1 예비 반전 자음 이미지에 증강 기법을 적용하여 제2 예비 반전 자음 이미지를 생성하기 위한 자음 이미지 변환부; 모음 이미지에 증강 기법을 적용하여 제1 예비 수정 모음 이미지를 생성하기 위한 모음 이미지 변환부; 상기 제2 예비 반전 자음 이미지 및 상기 제1 예비 수정 모음 이미지로부터 글자 영역 이미지들을 추출하여 제3 예비 반전 자음 이미지 및 제2 예비 수정 모음 이미지를 생성하기 위한 글자 영역 추출부; 및 상기 제3 예비 반전 자음 이미지 및 상기 제2 예비 수정 모음 이미지의 크기를 요구되는 정도로 조절하여 반전 자음 이미지 및 수정 모음 이미지를 생성하기 위한 글자 크기 변환부;를 포함할 수 있다.

상기 글자 크기 변환부는, 상기 제3 예비 반전 자음 이미지 및 상기 제2 예비 수정 모음 이미지의 각각의 가로 길이 및 세로 길이 중 긴 어느 하나가 요구되는 값을 갖도록 조절하고, 다른 하나는 상기 어느 하나의 변화 비율과 동일한 비율로 조절할 수 있다.

상기 반전 글자 이미지 생성부는, 자소 이미지 결합부를 더 포함하되, 상기 자소 이미지 결합부는, 상기 반전 자음 이미지를 포함하는 초성 이미지, 상기 수정 모음 이미지를 포함하는 중성 이미지, 및 제1 패딩 이미지를 결합하여 상기 반전 글자 이미지를 생성하되, 상기 제1 패딩 이미지는, 상기 초성 이미지와 상기 중성 이미지 중, 상기 초성 이미지와 상기 중성 이미지의 배열 방향과 수직한 방향을 따라 상대적으로 짧은 길이를 갖는 어느 하나에 결합되고, 상기 초성 이미지와 상기 중성 이미지 중 상기 어느 하나와 상기 제1 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 배열 방향에 수직한 방향을 따라 배열될 수 있다.

상기 초성 이미지와 상기 중성 이미지 중 상기 어느 하나의 길이와 상기 제1 패딩 이미지의 길이의 합은 상기 초성 이미지와 상기 중성 이미지 중 다른 하나의 길이와 동일할 수 있다.

상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지에 제2 패딩 이미지를 더 결합하여 상기 반전 글자 이미지를 생성하되, 상기 제2 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 간격이 확보되도록 상기 초성 이미지와 상기 중성 이미지 사이에 배치될 수 있다.

상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지에 상기 반전 자음 이미지를 포함하는 종성 이미지 및 제3 패딩 이미지를 더 결합하되, 상기 제3 패딩 이미지는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중, 상기 초성 이미지와 상기 중성 이미지의 배열 방향을 따라 상대적으로 짧은 길이를 갖는 어느 하나에 결합되고, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 상기 어느 하나와 상기 제3 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 배열 방향을 따라 배열될 수 있다.

상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 상기 어느 하나의 길이와 상기 제3 패딩 이미지의 길이의 합은 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 다른 하나의 길이와 동일할 수 있다.

상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 상기 종성 이미지, 상기 제1 패딩 이미지, 및 상기 제3 패딩 이미지에 제4 패딩 이미지를 더 결합하여 상기 반전 글자 이미지를 생성하되, 상기 제4 패딩 이미지는 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지의 간격이 확보되도록 상기 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 중성 이미지 사이에 배치될 수 있다.

일 측면에 있어서, 자소 이미지 처리부를 포함하되, 상기 자소 이미지 처리부는: 자음 이미지를 반전시켜 제1 예비 반전 자음 이미지를 생성하고, 상기 제1 예비 반전 자음 이미지에 증강 기법을 적용하여 제2 예비 반전 자음 이미지를 생성하기 위한 자음 이미지 변환부; 모음 이미지에 증강 기법을 적용하여 제1 예비 수정 모음 이미지를 생성하기 위한 모음 이미지 변환부; 상기 제2 예비 반전 자음 이미지 및 상기 제1 예비 수정 모음 이미지로부터 글자 영역 이미지들을 추출하여 제3 예비 반전 자음 이미지 및 제2 예비 수정 모음 이미지를 생성하기 위한 글자 영역 추출부; 및 상기 제3 예비 반전 자음 이미지 및 상기 제2 예비 수정 모음 이미지의 크기를 요구되는 정도로 조절하여 반전 자음 이미지 및 수정 모음 이미지를 생성하기 위한 글자 크기 변환부;를 포함하는 반전 글자 생성 장치가 제공될 수 있다.

본 개시는 대량의 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 반전 글자 인식 장치를 제공할 수 있다.

본 개시는 대량의 반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하는 반전 글자 생성 장치를 제공할 수 있다.

다만, 발명의 효과는 상기 개시에 한정되지 않는다.

도 1은 예시적인 실시예에 따른 반전 글자 생성 장치의 블록도이다.
도 2는 도 1의 자소 이미지 처리부의 예시적인 블록도이다.
도 3은 예시적인 실시예에 따른 초성 및 중성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다.
도 4는 도 3의 반전 자음 이미지를 생성하는 방법을 설명하는 순서도이다.
도 5 내지 도 8은 도 3의 반전 자음 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 9는 수정 모음 이미지를 생성하는 방법을 설명하는 순서도이다.
도 10 내지 도 12는 수정 모음 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 13은 반전 자음 이미지, 수정 모음 이미지, 및 제1 패딩 이미지를 결합하는 방법을 설명하기 위한 도면이다.
도 14는 예시적인 실시예에 따른 초성 및 중성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다.
도 15는 반전 자음 이미지, 수정 모음 이미지, 제1 패딩 이미지, 및 제2 패딩 이미지를 결합하는 방법을 설명하기 위한 도면이다.
도 16은 예시적인 실시예에 따른 초성, 중성, 및 종성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하기 위한 순서도이다.
도 17은 도 16의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면이다.
도 18은 예시적인 실시예에 따른 초성, 중성, 및 종성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하기 위한 순서도이다.
도 19는 도 18의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면이다.
도 20는 예시적인 실시예에 따른 반전 글자 학습 장치의 블록도이다.
도 21은 도 20의 인공지능 학습부의 블록도이다.
도 22는 예시적인 실시예에 따른 반전 글자 이미지를 학습하는 방법을 설명하기 위한 순서도이다.
도 23은 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다.
도 24는 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다.
도 25는 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다.
도 26은 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다.
도 27은 도 1의 자소 이미지 처리부의 예시적인 블록도이다.
도 28은 예시적인 실시예에 따른 영어 알파벳을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다.
도 29 및 도 30은 도 28의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 31은 예시적인 실시예에 따른 반전 글자 학습 장치의 블록도이다.
도 32는 도 22의 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다.
도 33은 도 22의 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다.
도 34는 도 22의 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다.
도 35는 도 22의 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다.
도 36은 도 1의 자소 이미지 처리부의 예시적인 블록도이다.
도 37은 예시적인 실시예에 따른 숫자를 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다.
도 38 및 도 39는 도 37의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면들이다.
도 40은 도 22의 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다.
도 41은 도 22의 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다.
도 42는 도 22의 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다.
도 43은 도 22의 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다.

이하에서, 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있을 정도로, 본 발명의 실시 예들이 명확하고 상세하게 기재될 것이다.

본 명세서에서, '반전'이란 좌우 반전, 즉, 왼쪽과 오른쪽을 서로 바꾸는 것을 지칭할 수 있다.

도 1은 예시적인 실시예에 따른 반전 글자 생성 장치의 블록도이다. 도 2는 도 1의 자소 이미지 처리부의 예시적인 블록도이다.

도 1을 참조하면, 반전 글자 생성 장치(10)는 자소 이미지 처리부(20) 및 자소 이미지 결합부(30)를 포함할 수 있다. 반전 글자 생성 장치(10)는 올바른 자음 이미지와 모음 이미지를 이용하여 반전 글자 이미지를 생성할 수 있다. 반전 글자는 좌우 반전된 자음을 초성 및 종성 중 적어도 하나에 포함할 수 있다.

도 2를 참조하면, 자소 이미지 처리부(20)는 자음 이미지 변환부(21), 모음 이미지 변환부(22), 글자 영역 추출부(23), 및 글자 크기 변환부(24)를 포함할 수 있다. 자음 이미지 변환부(21)는 자음 이미지를 이용하여 반전 자음 이미지를 생성할 수 있다. 모음 이미지 변환부(22)는 모음 이미지를 이용하여 수정 모음 이미지를 생성할 수 있다. 글자 영역 추출부(23)는 반전 자음 이미지 및 수정 모음 이미지에서 글자가 적힌 글자 영역을 추출할 수 있다. 글자 크기 변환부(24)는 글자 영역의 크기를 조정할 수 있다.

도 3은 예시적인 실시예에 따른 초성 및 중성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다. 도 4는 도 3의 반전 자음 이미지를 생성하는 방법을 설명하는 순서도이다. 도 5 내지 도 8은 도 3의 반전 자음 이미지를 생성하는 방법을 설명하기 위한 도면들이다.

도 3을 참조하면, 반전 글자 이미지의 생성 방법은 반전 자음 이미지 및 수정 모음 이미지를 생성하는 것(S100) 및 반전 자음 이미지, 수정 모음 이미지, 및 제1 패딩 이미지를 결합하는 것(S200)을 포함할 수 있다. 이하에서, 반전 자음 이미지를 생성하는 방법이 설명된다.

도 2, 도 4, 및 도 5를 참조하면, 자음 이미지 변환부(21)는 자음 이미지(111)를 반전시켜 제1 예비 반전 자음 이미지(112)를 생성할 수 있다.(S111) 자음 이미지(111)는 저장부(40)에 미리 저장된 것일 수 있다. 예를 들어, 자음 이미지(111)는 반전 글자 생성 장치(10) 외부의 입력 장치를 통해 입력된 손글씨 이미지일 수 있다. 자음 이미지(111)는 좌우 반전시 본래의 의미로 인식되지 않는 자음의 이미지일 수 있다. 예를 들어, 자음 이미지(111)는 기억(ㄱ), 니은(ㄴ), 디귿(ㄷ), 리을(ㄹ), 시옷(ㅅ), 지읒(ㅈ), 치읓(ㅊ), 키읔(ㅋ), 및 티읕(ㅌ) 중 어느 하나의 이미지일 수 있다. 설명의 간결함을 위해, 자음 이미지(111)가 기억(ㄱ) 이미지인 경우가 예시적으로 설명된다. 자음 이미지(111)는 배경 부분과 자소 부분을 포함할 수 있다. 예를 들어, 자음 이미지(111)에서 자소 부분을 제외한 나머지가 배경 부분일 수 있다. 후술되는 모든 이미지들도 배경 부분과 자소 부분을 포함할 수 있다.

도 2, 도 4, 및 도 6을 참조하면, 자음 이미지 변환부(21)는 제1 예비 반전 자음 이미지(112)에 증강 기법(augmentation method)을 적용하여 제2 예비 반전 자음 이미지(113)를 생성할 수 있다.(S112) 증강 기법은, 예를 들어, 이미지 회전, 이미지 확대 또는 축소, 이미지 밝기 조절 등일 수 있다. 설명의 간결함을 위해, 증강 기법이 이미지 회전인 경우가 예시적으로 설명된다. 제1 예비 반전 자음 이미지(112)의 회전은 반전된 기억(ㄱ)으로 인식될 수 있을 정도로 수행될 수 있다. 예를 들어, 이미지 회전은 오른쪽 또는 왼쪽으로 45 범위에서 수행될 수 있다. 이에 따라, 제1 예비 반전 자음 이미지(112)가 지나치게 회전되어 니은(ㄴ)이나 올바른 기억(ㄱ)으로 인식되는 것이 방지될 수 있다.

도 2, 도 4, 및 도 7을 참조하면, 글자 영역 추출부(23)는 제2 예비 반전 자음 이미지(113)로부터 글자 영역(113a)을 추출하여 제3 예비 반전 자음 이미지(114)를 생성할 수 있다.(S113) 글자 영역(113a)은 자소 부분의 상하좌우 끝부분을 지나는 사각형 영역일 수 있다. 예를 들어, 글자 영역(113a)은 제2 예비 반전 자음 이미지(113)의 자소 부분과 배경 부분의 일부를 포함할 수 있다.

도 2, 도 4, 및 도 8을 참조하면, 글자 크기 변환부(24)는 제3 예비 반전 자음 이미지(114)의 가로 크기 및 세로 크기를 조정하여 반전 자음 이미지(115)를 생성할 수 있다.(S114) 제3 예비 반전 자음 이미지(114)의 크기 조정은 반전 자음 이미지(115)와 후술되는 수정 모음 이미지가 용이하게 결합되도록 수행될 수 있다. 예를 들어, 글자 크기 변환부(24)는 제3 예비 반전 자음 이미지(114)의 가로 길이 및 세로 길이를 비교하여 더 긴 어느 하나를 선택한 후, 상기 어느 하나를 요구되는 길이로 조절하되 나머지 하나도 상기 어느 하나의 조절 비율만큼 조정할 수 있다. 따라서, 반전 자음 이미지(115)의 가로 길이 및 세로 길이의 비율은 제3 예비 반전 자음 이미지(114)의 가로 길이 및 세로 길이의 비율과 실질적으로 동일할 수 있다.

도 9는 수정 모음 이미지를 생성하는 방법을 설명하는 순서도이다. 도 10 내지 도 12는 수정 모음 이미지를 생성하는 방법을 설명하기 위한 도면들이다.

도 2, 도 9, 및 도 10을 참조하면, 모음 이미지 변환부(22)는 모음 이미지(211)에 증강 기법을 적용하여 제1 예비 수정 모음 이미지(212)를 생성할 수 있다.(S121) 모음 이미지(211)는 저장부(40)에 미리 저장된 것일 수 있다. 모음 이미지(211)는 초성의 오른쪽에 배치되는 모음(예를 들어, ㅏ, ㅐ, ㅑ, ㅓ, ㅔ, ㅕ, ㅣ)의 이미지 또는 초성의 아래쪽에 배치되는 모음(예를 들어, ㅗ, ㅛ, ㅜ, ㅠ, ㅡ)의 이미지일 수 있다. 예를 들어, 모음 이미지(211)는 제1 반전 글자 생성 장치(10) 외부의 입력 장치를 통해 입력된 손글씨 이미지일 수 있다. 설명의 간결함을 위해, 증강 기법이 이미지 회전인 경우가 예시적으로 설명된다. 모음 이미지(211)의 회전은 본래의 모음 이미지로 인식될 수 있을 정도로 수행될 수 있다. 예를 들어, 이미지 회전은 오른쪽 또는 왼쪽으로 15 범위에서 수행될 수 있다. 이에 따라, 제1 예비 수정 모음 이미지(212)가 지나치게 회전되어 다른 모음으로 인식되는 것이 방지될 수 있다. 예시적으로, 도 10의 (a) 및 (b)에는 각각 'ㅏ', 'ㅗ'의 이미지가 회전된 것이 도시되었다.

도 2, 도 9, 도 11을 참조하면, 글자 영역 추출부(23)는 제1 예비 수정 모음 이미지(212)로부터 글자 영역(212a)을 추출하여 제2 예비 수정 모음 이미지(213)를 생성할 수 있다.(S122) 글자 영역(212a)은 자소 부분의 상하좌우 끝부분을 지나는 사각형 영역일 수 있다. 예를 들어, 글자 영역(212a)은 제2 예비 수정 모음 이미지(213)의 자소 부분과 배경 부분의 일부를 포함할 수 있다. 도 11의 (a) 및 (b)에는 각각 'ㅏ', 'ㅗ'의 글자 영역(212a)이 도시되었다.

도 2, 도 9, 및 도 12를 참조하면, 글자 크기 변환부(24)는 제2 예비 수정 모음 이미지(213)의 가로 크기 및 세로 크기를 조정하여 수정 모음 이미지(214)를 생성할 수 있다.(S123) 제2 예비 수정 모음 이미지(213)의 크기 조정은 반전 자음 이미지(115)와 수정 모음 이미지(214)가 용이하게 결합되도록 수행될 수 있다. 예를 들어, 글자 크기 변환부(24)는 제2 예비 수정 모음 이미지(213)의 가로 길이 및 세로 길이를 비교하여 더 긴 어느 하나를 선택한 후, 상기 어느 하나를 요구되는 길이로 조절하되 나머지 하나도 상기 어느 하나의 조절 비율만큼 조정할 수 있다. 따라서, 수정 모음 이미지(214)의 가로 길이 및 세로 길이의 비율은 제2 예비 수정 모음 이미지(213)의 가로 길이 및 세로 길이의 비율과 실질적으로 동일할 수 있다.

도 13은 반전 자음 이미지, 수정 모음 이미지, 및 제1 패딩 이미지를 결합하는 방법을 설명하기 위한 도면이다.

도 1, 도 3, 및 도 13을 참조하면, 반전 자음 이미지(115), 수정 모음 이미지(214), 및 제1 패딩 이미지(311)가 결합되어 반전 글자 이미지(400)를 생성할 수 있다.(S200) 자소 이미지 결합부(30)는 반전 자음 이미지(115)와 수정 모음 이미지(214)가 결합하는 방향에 수직한 방향을 따라 반전 자음 이미지(115)와 수정 모음 이미지(214)의 길이를 비교하여, 상대적으로 짧은 길이를 갖는 이미지를 선택할 수 있다. 반전 자음 이미지(115)와 수정 모음 이미지(214)가 결합하는 방향은 좌우 방향일 수 있고, 그에 수직한 방향은 상하 방향일 수 있다. 예시적으로, 반전 자음 이미지(115)의 상하 방향 길이가 더 짧은 것으로 도시되었다. 다른 예에서, 수정 모음 이미지(214)의 상하 방향 길이가 더 짧을 수 있다. 자소 이미지 결합부(30)는 상대적으로 짧은 길이를 갖는 반전 자음 이미지(115)의 상부 및 하부에 제1 패딩 이미지(311)를 결합할 수 있다. 다만, 제1 패딩 이미지(311)가 반전 자음 이미지(115)의 상부 및 하부에 결합되는 것은 예시적인 것이다. 다른 예에서, 제1 패딩 이미지(311)는 반전 자음 이미지(115)의 상부 또는 하부에만 결합될 수 있다. 제1 패딩 이미지(311)의 가로 길이는 반전 자음 이미지(115)의 가로 길이와 실질적으로 동일할 수 있다. 상하 방향을 따라 연장하는 제1 패딩 이미지(311)의 중심축(미도시)은 상하 방향을 따라 연장하는 반전 자음 이미지(115)의 중심축(미도시)에 정렬될 수 있다. 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지의 세로 길이는 수정 모음 이미지(214)의 세로 길이와 실질적으로 동일할 수 있다. 자소 이미지 결합부(30)는 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지와 수정 모음 이미지(214)를 결합할 수 있다. 일 예에서, 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지의 좌우 방향을 따라 연장하는 중심축과 수정 모음 이미지(214)의 중심축은 서로 정렬될 수 있다.

본 개시는 올바르게 작성된 소량의 손글씨 이미지 데이터(예를 들어, 기억(ㄱ), 니은(ㄴ), 디귿(ㄷ) 등의 자음 이미지와 ㅏ, ㅑ, ㅓ 등의 모음 이미지)로부터 대량의 반전 글자 이미지 데이터(예를 들어, '가'의 제1 반전 글자 이미지, '나'의 제1 반전 글자 이미지, '다'의 제1 반전 글자 이미지 등)를 획득할 수 있는 반전 글자 이미지 생성 방법을 제공할 수 있다.

도 14는 예시적인 실시예에 따른 초성 및 중성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다. 도 15는 반전 자음 이미지, 수정 모음 이미지, 제1 패딩 이미지, 및 제2 패딩 이미지를 결합하는 방법을 설명하기 위한 도면이다. 설명의 간결함을 위해, 도 3 및 도 13을 참조하여 설명된 것과의 차이점이 중점적으로 설명된다.

도 14 및 도 15를 참조하면, 도 3 및 도 13을 참조하여 설명된 것과 달리, 반전 자음 이미지(115), 수정 모음 이미지(214), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합되어 반전 글자 이미지를 생성할 수 있다.(S201) 반전 자음 이미지(115), 수정 모음 이미지(214), 및 제1 패딩 이미지(311)가 결합되는 것은 도 3 및 도 13을 참조하여 설명된 것과 실질적으로 동일할 수 있다.

자소 이미지 결합부(30)는 반전 자음 이미지(115) 또는 수정 모음 이미지(214) 중 적어도 하나에 제2 패딩 이미지(312)를 결합할 수 있다. 제2 패딩 이미지(312)가 반전 자음 이미지(115)에 결합된 것으로 도시되었으나, 이는 예시적인 것이다. 다른 예에서, 제2 패딩 이미지(312)는 수정 모음 이미지(214)에만 결합되거나, 반전 자음 이미지(115) 및 수정 모음 이미지(214) 전부에 결합될 수 있다. 일 예에서, 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지의 좌우 방향을 따라 연장하는 중심축과 제2 패딩 이미지(312)의 중심축은 서로 정렬될 수 있다. 제2 패딩 이미지(312)는 반전 자음 이미지(115)와 수정 모음 이미지(214) 사이에 제공될 수 있다. 제2 패딩 이미지(312)는 반전 자음 이미지(115)와 수정 모음 이미지(214) 사이의 간격을 제공할 수 있다. 제2 패딩 이미지(312)의 세로 길이는 제1 패딩 이미지(311)와 반전 자음 이미지(115)가 결합된 이미지의 세로 길이 및 수정 모음 이미지(214)의 세로 길이와 실질적으로 동일할 수 있다.

도 16은 예시적인 실시예에 따른 초성, 중성, 및 종성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하기 위한 순서도이다. 도 17은 도 16의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면이다.

도 16을 참조하면, 초성 이미지(411), 중성 이미지(412), 및 종성 이미지(413)가 생성될 수 있다.(S101) 초성 이미지(411) 및 종성 이미지(413) 중 적어도 하나는 반전 자음 이미지를 포함할 수 있다. 예시적으로, 초성 이미지(411)는 자음 이미지이고, 종성 이미지(413)는 반전 자음 이미지인 경우가 설명된다. 일 예에서, 자음 이미지는 도 3 내지 도 8을 참조하여 설명된 반전 자음 이미지 생성 방법에서 자음 이미지를 반전하는 것을 제외한 나머지 단계를 거쳐 생성될 수 있다. 일 예에서, 반전 자음 이미지는 도 3 내지 도 8을 참조하여 설명된 반전 자음 이미지 생성 방법에 의해 생성될 수 있다. 중성 이미지(412)는 모음 이미지일 수 있다. 일 예에서, 모음 이미지는 도 9 내지 도 12를 참조하여 설명된 수정 모음 이미지 생성 방법에 의해 생성된 수정 모음 이미지일 수 있다.

도 16 및 도 17을 참조하면, 초성 이미지(411), 중성 이미지(412), 종성 이미지(413), 제1 패딩 이미지(311), 제2 패딩 이미지(312), 및 제3 패딩 이미지(313)가 결합되어 반전 글자 이미지(400)를 생성할 수 있다.(S202) 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합되는 것은 도 14 및 도 15를 참조하여 설명된 반전 자음 이미지, 수정 모음 이미지, 제1 패딩 이미지, 및 제2 패딩 이미지의 결합 방법과 실질적으로 동일할 수 있다.

자소 이미지 결합부(30)는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지와 종성 이미지(413)의 가로 길이를 비교하여, 짧은 길이를 갖는 이미지를 선택할 수 있다. 예시적으로, 종성 이미지(413)의 가로 길이가 더 짧은 것으로 도시되었다. 다른 예에서, 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지의 가로 길이가 더 짧을 수 있다. 자소 이미지 결합부(30)는 상대적으로 짧은 길이를 갖는 종성 이미지(413)의 좌측 및 우측에 제3 패딩 이미지(313)를 결합할 수 있다. 다만, 제3 패딩 이미지(313)가 종성 이미지(413)의 좌측 및 우측에 결합되는 것은 예시적인 것이다. 다른 예에서, 제3 패딩 이미지(313)는 종성 이미지(413)의 좌측 또는 우측에만 결합될 수 있다. 제3 패딩 이미지(313)의 세로 길이는 종성 이미지(413)의 세로 길이와 실질적으로 동일할 수 있다. 좌우 방향을 따라 연장하는 제3 패딩 이미지(313)의 중심축(미도시)은 좌우 방향을 따라 연장하는 종성 이미지(413)의 중심축(미도시)에 정렬될 수 있다. 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지의 가로 길이는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지의 가로 길이와 실질적으로 동일할 수 있다. 자소 이미지 결합부(30)는 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지와 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지를 결합할 수 있다. 예를 들어, 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지의 상하 방향을 따라 연장하는 중심축은 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지의 상하 방향을 따라 연장하는 중심축과 정렬될 수 있다.

본 개시는 올바르게 작성된 소량의 손글씨 이미지 데이터(예를 들어, 기억(ㄱ), 니은(ㄴ), 디귿(ㄷ) 등의 자음 이미지와 아(ㅏ), 야(ㅑ), 어(ㅓ) 등의 모음 이미지)로부터 대량의 반전 글자 이미지 데이터(예를 들어, '각'의 반전 글자 이미지, '난'의 반전 글자 이미지, '닫'의 반전 글자 이미지 등)를 획득할 수 있는 반전 글자 이미지 생성 방법을 제공할 수 있다.

도 18은 예시적인 실시예에 따른 초성, 중성, 및 종성을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하기 위한 순서도이다. 도 19는 도 18의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면이다. 설명의 간결함을 위해, 도 16 및 도 17을 참조하여 설명된 것과의 차이점이 중점적으로 설명된다.

도 18 및 도 19를 참조하면, 도 16 및 도 17을 참조하여 설명된 것과 달리, 초성 이미지(411), 중성 이미지(412), 종성 이미지(413), 제1 패딩 이미지(311), 제2 패딩 이미지(312), 제3 패딩 이미지(313), 및 제4 패딩 이미지(314)가 결합될 수 있다. 초성 이미지(411), 중성 이미지(412), 종성 이미지(413), 제1 패딩 이미지(311), 제2 패딩 이미지(312), 및 제3 패딩 이미지(313)가 결합되는 것은 도 16 및 도 17을 참조하여 설명된 것과 실질적으로 동일할 수 있다.

자소 이미지 결합부(30)는 제4 패딩 이미지(314)를 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지 및 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지 중 적어도 하나에 결합할 수 있다. 제4 패딩 이미지(314)가 종성 이미지(413)에 결합되는 것으로 도시되었으나, 이는 예시적인 것이다. 다른 예에서, 제4 패딩 이미지(314)는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지에만 결합되거나, 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지 및 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지 전부에 결합될 수 있다. 제4 패딩 이미지(314)는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지 및 종성 이미지(413) 사이에 제공될 수 있다. 제4 패딩 이미지(314)는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지 및 종성 이미지(413) 사이의 간격을 제공할 수 있다. 제4 패딩 이미지(314)의 가로 길이는 초성 이미지(411), 중성 이미지(412), 제1 패딩 이미지(311), 및 제2 패딩 이미지(312)가 결합된 이미지의 가로 길이 및 제3 패딩 이미지(313)와 종성 이미지(413)가 결합된 이미지의 가로 길이와 실질적으로 동일할 수 있다.

도 20는 예시적인 실시예에 따른 반전 글자 학습 장치의 블록도이다. 도 21은 도 20의 인공지능 학습부의 블록도이다.

도 20을 참조하면, 반전 글자 학습 장치(1000)가 제공될 수 있다. 반전 글자 학습 장치(1000)는 자소 이미지 처리부(20), 자소 이미지 결합부(30), 저장부(40), 및 인공지능 학습부(50)를 포함할 수 있다. 자소 이미지 처리부(20) 및 자소 이미지 결합부(30)는 반전 글자 이미지 생성부로 지칭될 수 있다. 자소 이미지 처리부(20) 및 자소 이미지 결합부(30)는 도 1 및 도 2를 참조하여 설명된 것과 실질적으로 동일할 수 있다.

도 21을 참조하면, 인공지능 학습부(50)는 반전 글자 크기 조절부(51), 반전 글자 증강부(52), 및 인공지능 학습 수행부(53)를 포함할 수 있다. 반전 글자 크기 조절부(51)는 반전 글자 이미지가 인공지능 학습에 적합한 크기를 갖도록 반전 글자 이미지의 크기를 조절할 수 있다. 반전 글자 증강부(52)는 크기가 조절된 반전 글자 이미지에 증강 기법을 적용하여, 인공지능 학습용 데이터를 늘릴 수 있다. 인공지능 학습 수행부(53)는 증강된 인공지능 학습용 데이터를 이용하여 반전 글자 이미지 인식 모델을 학습할 수 있다.

도 22는 예시적인 실시예에 따른 반전 글자 이미지를 학습하는 방법을 설명하기 위한 순서도이다. 도 23은 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다. 도 24는 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다. 도 25는 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다. 도 26은 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다.

도 22 및 도 23을 참조하면, 반전 글자 이미지들(401)을 포함하는 반전 글자 데이터 셋(500)이 생성될 수 있다.(S301) 반전 글자 이미지들(401)은 앞서 설명된 반전 글자 생성 방법들에 의해 생성될 수 있다. 예시적으로, '각'의 종성이 반전된 이미지(401) 및 '돈'의 초성이 반전된 이미지(401)가 반전 글자 데이터 셋(500)에 포함되는 것으로 도시되었다. 반전 글자 데이터 셋(500)은 저장부(40)에 저장될 수 있다.

도 22 및 도 24를 참조하면, 반전 글자 이미지들(401)의 크기가 조절될 수 있다.(S302) 반전 글자 이미지들(401)의 크기 조절은 반전 글자 크기 조절부(51)에 의해 수행될 수 있다. 반전 글자 이미지들(401)의 크기는 인공지능 학습에 적합하도록 조절될 수 있다. 예를 들어, 반전 글자 이미지들(401)이 요구되는 크기를 갖도록 반전 글자 이미지들(401) 각각에 패딩 이미지들(402)이 결합될 수 있다. 예를 들어, 요구되는 크기는 64x64 픽셀의 크기일 수 있다.

도 22 및 도 25를 참조하면, 반전 글자 이미지들(401)에 증강 기법이 적용되어, 반전 글자 데이터 셋(500)을 증강할 수 있다.(S303) 예를 들어, 반전 글자 이미지들에 증강 기법을 적용하는 것은 반전 글자 증강부(52)에 의해 수행될 수 있다. 증강 기법은, 예를 들어, 이미지 회전, 이미지 확대 또는 축소, 이미지 밝기 조절 등일 수 있다.

도 22 및 도 26을 참조하면, 반전 글자 데이터 셋(500)을 이용하여 반전 글자 인식 모델(53a)이 학습될 수 있다.(S304) 반전 글자 인식 모델(53a)은 인공지능 기반의 반전된 한글 이미지 인식 모델일 수 있다. 예를 들어, 반전 글자 인식 모델(53a)은 합성곱 신경망(CNN), 순환 신경망(RN), 서포트 벡터 머신(SVM), 어텐션 매커니즘(Attention Mechanism) 등을 포함할 수 있다. 반전 글자 인식 모델(53a)의 학습은 인공지능 학습 수행부(53)에 의해 수행될 수 있다. 반전 글자 인식 모델(53a)은 같은 종류의 반전 글자 이미지들의 특징을 학습할 수 있다. 예를 들어, 반전 글자 인식 모델(53a)은 '각'의 종성이 반전된 이미지들을 학습하여 '각'의 종성이 반전된 이미지들의 특징들에 제1 코드(예: 도 26의 00111000)를 부여하는 제1 결과(RD1)를 얻을 수 있고, '돈'의 초성이 반전된 이미지들을 학습하여 '돈'의 초성이 반전된 이미지들의 특징들에 제2 코드(예: 도 26의 10001001)를 부여하는 제2 결과(RD2)를 얻을 수 있다. 학습 후의 반전 글자 인식 모델(53a)은 제1 결과(RD1) 및 제2 결과(RD2)와 같은 학습 결과를 이용하여, 반전 글자 데이터 셋(500)에 포함되어 있지 않은 반전 글자 이미지(예를 들어, 새로 입력되는 반전 글자 이미지)를 인식할 수 있다.

도 27은 도 1의 자소 이미지 처리부의 예시적인 블록도이다. 설명의 간결함을 위해, 도 2를 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.

도 27을 참조하면, 자소 이미지 처리부(20)가 제공될 수 있다. 자소 이미지 처리부(20)는 알파벳 이미지 변환부(25), 글자 영역 추출부(23), 및 글자 크기 변환부(24)를 포함할 수 있다. 글자 영역 추출부(23) 및 글자 크기 변환부(24)는 도 2를 참조하여 설명된 글자 영역 추출부(23) 및 글자 크기 변환부(24)과 실질적으로 동일할 수 있다. 알파벳 이미지 변환부(25)는 영어 알파벳 이미지를 좌우반전시키도록 구성될 수 있다.

도 28은 예시적인 실시예에 따른 영어 알파벳을 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다. 도 29 및 도 30은 도 28의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면들이다.

도 27 내지 도 29를 참조하면, 알파벳 이미지 변환부(25)는 알파벳 이미지(121)를 반전시켜 예비 반전 글자 이미지(122)를 생성할 수 있다.(S131) 알파벳 이미지(121)는 저장부(40)에 미리 저장된 것일 수 있다. 예를 들어, 알파벳 이미지(121)는 반전 글자 생성 장치(10) 외부의 입력 장치를 통해 입력된 손글씨 이미지일 수 있다. 알파벳 이미지(121)는 좌우 반전시 본래의 의미로 인식되지 않는 알파벳의 이미지일 수 있다. 예를 들어, 알파벳 이미지(121)는 B, C, D, E, F, G, H, J, K, L, N, P, Q, R, S, 및 Z과 같은 대문자들 중 어느 하나의 이미지 또는 a, b, c, d, e, f, g, h, j, k, l, m, n, p, q, r, s, t, u, y, 및 z와 같은 소문자들 중 하나일 수 있다. 설명의 간결함을 위해, 알파벳 이미지(121)가 Q의 이미지 및 a의 이미지인 경우가 예시적으로 설명된다.

도 27, 도 28, 및 도 30을 참조하면, 글자 영역 추출부(23)는 예비 반전 글자 이미지(122)로부터 글자 영역(122a)을 추출하여 반전 글자 이미지(123)를 생성할 수 있다.(S132) 글자 영역(122a)은 자소 부분의 상하좌우 끝부분을 지나는 사각형 영역일 수 있다. 예를 들어, 글자 영역(122a)은 예비 반전 글자 이미지(122)의 자소 부분과 배경 부분의 일부를 포함할 수 있다.

도 31은 예시적인 실시예에 따른 반전 글자 학습 장치의 블록도이다. 설명의 간결함을 위해, 도 20 및 도 21을 참조하여 설명된 것 및 도 27을 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.

도 31을 참조하면, 반전 글자 학습 장치(1100)가 제공될 수 있다. 반전 글자 학습 장치(1100)는 자소 이미지 처리부(20), 저장부(40), 및 인공지능 학습부(50)를 포함할 수 있다. 자소 이미지 처리부(20)는 반전 글자 이미지 생성부로 지칭될 수 있다. 자소 이미지 처리부(20)는 도 27을 참조하여 설명된 것과 실질적으로 동일할 수 있다. 인공지능 학습부(50)는 도 20 및 도 21을 참조하여 설명된 것과 실질적으로 동일할 수 있다. 한글과 달리 알파벳은 글자들의 결합에 의해 새로운 의미를 갖는 글자를 형성하지 않으므로, 앞서 설명된 자소 이미지 결합부는 생략될 수 있다.

도 32는 도 22의 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다. 도 33은 도 22의 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다. 도 34는 도 22의 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다. 도 35는 도 22의 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다. 설명의 간결함을 위해, 도 22 내지 도 26을 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.

도 22 및 도 32를 참조하면, 반전 글자 이미지들(401)을 포함하는 반전 글자 데이터 셋(500)이 생성될 수 있다.(S301) 반전 글자 이미지들(401)은 앞서 설명된 반전 글자 생성 방법들에 의해 생성될 수 있다. 예시적으로, 'Q'가 반전된 이미지(401) 및 'a'가 반전된 이미지(401)가 반전 글자 데이터 셋(500)에 포함되는 것으로 도시되었다. 반전 글자 데이터 셋(500)은 저장부(40)에 저장될 수 있다.

도 22 및 도 33을 참조하면, 반전 글자 이미지들(401)의 크기가 조절될 수 있다.(S302) 반전 글자 이미지들(401)의 크기 조절은 반전 글자 크기 조절부(도 21의 51)에 의해 수행될 수 있다. 반전 글자 이미지들(401)의 크기는 인공지능 학습에 적합하도록 조절될 수 있다. 예를 들어, 반전 글자 이미지들(401)이 요구되는 크기를 갖도록 반전 글자 이미지들(401) 각각에 패딩 이미지들(402)이 결합될 수 있다. 예를 들어, 요구되는 크기는 64x64 픽셀의 크기일 수 있다.

도 22 및 도 34를 참조하면, 반전 글자 이미지들(401)에 증강 기법이 적용되어, 반전 글자 데이터 셋(500)을 증강할 수 있다.(S303) 예를 들어, 반전 글자 이미지들(401)에 증강 기법을 적용하는 것은 반전 글자 증강부(52)에 의해 수행될 수 있다. 증강 기법은, 예를 들어, 이미지 회전, 이미지 확대 또는 축소, 이미지 밝기 조절 등일 수 있다.

도 22 및 도 35을 참조하면, 반전 글자 데이터 셋(500)을 이용하여 반전 글자 인식 모델(53b)이 학습될 수 있다.(S304) 반전 글자 인식 모델(53b)은 인공지능 기반의 반전된 영어 알파벳 이미지 인식 모델일 수 있다. 예를 들어, 반전 글자 인식 모델(53b)은 합성곱 신경망(CNN), 순환 신경망(RN), 서포트 벡터 머신(SVM), 어텐션 매커니즘(Attention Mechanism) 등을 포함할 수 있다. 반전 글자 인식 모델(53b)의 학습은 인공지능 학습 수행부(53)에 의해 수행될 수 있다. 반전 글자 인식 모델(53b)은 같은 종류의 반전 글자 이미지들의 특징을 학습할 수 있다. 예를 들어, 반전 글자 인식 모델(53b)은 'a'가 반전된 이미지들을 학습하여 'a'가 반전된 이미지들의 특징들에 제3 코드(예: 도 35의 000010)를 부여하는 제3 결과(RD3)를 얻을 수 있고, 'Q'가 반전된 이미지들을 학습하여 'Q'가 반전된 이미지들의 특징들에 제4 코드(예: 도 35의 000001)를 부여하는 제4 결과(RD4)를 얻을 수 있다. 학습 후의 반전 글자 인식 모델(53b)은 제3 결과(RD3) 및 제4 결과(RD4)와 같은 학습 결과를 이용하여, 반전 글자 데이터 셋(500)에 포함되어 있지 않은 반전 글자 이미지(예를 들어, 새로 입력되는 반전 글자 이미지)를 인식할 수 있다.

도 36은 도 1의 자소 이미지 처리부의 예시적인 블록도이다. 설명의 간결함을 위해, 도 2를 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.

도 36을 참조하면, 자소 이미지 처리부(20)가 제공될 수 있다. 자소 이미지 처리부(20)는 숫자 이미지 변환부(26), 글자 영역 추출부(23), 및 글자 크기 변환부(24)를 포함할 수 있다. 글자 영역 추출부(23) 및 글자 크기 변환부(24)는 도 2를 참조하여 설명된 글자 영역 추출부(23) 및 글자 크기 변환부(24)과 실질적으로 동일할 수 있다. 알파벳 이미지 변환부(25)는 숫자 이미지를 좌우반전시키도록 구성될 수 있다.

도 37은 예시적인 실시예에 따른 숫자를 포함하는 반전 글자 이미지를 생성하는 방법을 설명하는 순서도이다. 도 38 및 도 39는 도 37의 반전 글자 이미지를 생성하는 방법을 설명하기 위한 도면들이다.

도 36 내지 도 38을 참조하면, 숫자 이미지 변환부(26)는 숫자 이미지(131)를 반전시켜 예비 반전 글자 이미지(132)를 생성할 수 있다.(S131) 숫자 이미지(131)는 저장부(40)에 미리 저장된 것일 수 있다. 예를 들어, 숫자 이미지(131)는 반전 글자 생성 장치(10) 외부의 입력 장치를 통해 입력된 손글씨 이미지일 수 있다. 숫자 이미지(131)는 좌우 반전시 본래의 의미로 인식되지 않는 숫자의 이미지일 수 있다. 예를 들어, 숫자 이미지(131)는 1, 2, 3, 4, 5, 6, 7, 및 9 중 어느 하나일 수 있다. 설명의 간결함을 위해, 숫자 이미지(131)가 3의 이미지인 경우가 예시적으로 설명된다.

도 36, 도 37, 및 도 39를 참조하면, 글자 영역 추출부(23)는 예비 반전 글자 이미지(132)로부터 글자 영역(132a)을 추출하여 반전 글자 이미지(123)를 생성할 수 있다.(S132) 글자 영역(132a)은 자소 부분의 상하좌우 끝부분을 지나는 사각형 영역일 수 있다. 예를 들어, 글자 영역(132a)은 예비 반전 글자 이미지(132)의 자소 부분과 배경 부분의 일부를 포함할 수 있다.

도 40은 도 22의 반전 글자 데이터 셋을 생성하는 것을 설명하기 위한 도면이다. 도 41은 도 22의 반전 글자 이미지들의 크기를 조절하는 것을 설명하기 위한 도면이다. 도 42는 도 22의 반전 글자 데이터 셋을 증강하는 것을 설명하기 위한 도면이다. 도 43은 도 22의 반전 글자 인식 모델을 학습시키는 것을 설명하기 위한 도면이다. 설명의 간결함을 위해, 도 22 내지 도 26을 참조하여 설명된 것과 실질적으로 동일한 내용은 설명되지 않을 수 있다.

도 22 및 도 40을 참조하면, 반전 글자 이미지들(401)을 포함하는 반전 글자 데이터 셋(500)이 생성될 수 있다.(S301) 반전 글자 이미지들(401)은 앞서 설명된 반전 글자 생성 방법들에 의해 생성될 수 있다. 예시적으로, '3'이 반전된 이미지(401)가 반전 글자 데이터 셋(500)에 포함되는 것으로 도시되었다. 반전 글자 데이터 셋(500)은 저장부(40)에 저장될 수 있다.

도 22 및 도 41을 참조하면, 반전 글자 이미지들(401)의 크기가 조절될 수 있다.(S302) 반전 글자 이미지들(401)의 크기 조절은 반전 글자 크기 조절부(도 21의 51)에 의해 수행될 수 있다. 반전 글자 이미지들(401)의 크기는 인공지능 학습에 적합하도록 조절될 수 있다. 예를 들어, 반전 글자 이미지들(401)이 요구되는 크기를 갖도록 반전 글자 이미지들(401) 각각에 패딩 이미지들(402)이 결합될 수 있다. 예를 들어, 요구되는 크기는 64x64 픽셀의 크기일 수 있다.

도 22 및 도 42를 참조하면, 반전 글자 이미지들(401)에 증강 기법이 적용되어, 반전 글자 데이터 셋(500)을 증강할 수 있다.(S303) 예를 들어, 반전 글자 이미지들(401)에 증강 기법을 적용하는 것은 반전 글자 증강부(52)에 의해 수행될 수 있다. 증강 기법은, 예를 들어, 이미지 회전, 이미지 확대 또는 축소, 이미지 밝기 조절 등일 수 있다.

도 22 및 도 43을 참조하면, 반전 글자 데이터 셋(500)을 이용하여 반전 글자 인식 모델(53c)이 학습될 수 있다.(S304) 반전 글자 인식 모델(53c)은 인공지능 기반의 반전된 숫자 이미지 인식 모델일 수 있다. 예를 들어, 반전 글자 인식 모델(53c)은 합성곱 신경망(CNN), 순환 신경망(RN), 서포트 벡터 머신(SVM), 어텐션 매커니즘(Attention Mechanism) 등을 포함할 수 있다. 반전 글자 인식 모델(53c)의 학습은 인공지능 학습 수행부(53)에 의해 수행될 수 있다. 반전 글자 인식 모델(53c)은 같은 종류의 반전 글자 이미지들의 특징을 학습할 수 있다. 예를 들어, 반전 글자 인식 모델(53c)은 '3'이 반전된 이미지들을 학습하여 '3'이 반전된 이미지들의 특징들에 제5 코드(예: 도 43의 000001)를 부여하는 제5 결과(RD5)를 얻을 수 있다. 학습 후의 반전 글자 인식 모델(53c)은 제5 결과(RD5)와 같은 학습 결과를 이용하여, 반전 글자 데이터 셋(500)에 포함되어 있지 않은 반전 글자 이미지(예를 들어, 새로 입력되는 반전 글자 이미지)를 인식할 수 있다.

상술한 내용은 본 발명을 실시하기 위한 구체적인 실시 예들이다. 본 발명은 상술한 실시 예들 이외에도, 단순하게 설계 변경되거나 용이하게 변경할 수 있는 실시 예들도 포함될 것이다. 또한, 본 발명은 실시 예들을 이용하여 용이하게 변형하여 실시할 수 있는 기술들도 포함될 것이다. 따라서, 본 발명의 범위는 상술한 실시 예들에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 이 발명의 특허청구범위와 균등한 것들에 의해 정해져야 할 것이다.

Claims

삭제
삭제
삭제
반전 글자 이미지들을 포함하는 반전 글자 데이터 셋을 생성하기 위한 반전 글자 이미지 생성부;
상기 반전 글자 이미지들의 크기가 조절되도록 상기 반전 글자 이미지들에 리사이징 이미지들을 결합하기 위한 반전 글자 크기 조절부;
상기 반전 글자 데이터 셋을 증강하는 반전 글자 증강부; 및
상기 반전 글자 데이터 셋을 이용한 인공지능 모델 학습을 통해 반전 글자를 인식하는 인공지능 학습 수행부;를 포함하고,
상기 반전 글자 이미지 생성부는, 자소 이미지 처리부를 포함하되,
상기 자소 이미지 처리부는: 자음 이미지를 반전시켜 제1 예비 반전 자음 이미지를 생성하고, 상기 제1 예비 반전 자음 이미지에 증강 기법을 적용하여 제2 예비 반전 자음 이미지를 생성하기 위한 자음 이미지 변환부; 모음 이미지에 증강 기법을 적용하여 제1 예비 수정 모음 이미지를 생성하기 위한 모음 이미지 변환부; 상기 제2 예비 반전 자음 이미지 및 상기 제1 예비 수정 모음 이미지로부터 글자 영역 이미지들을 추출하여 제3 예비 반전 자음 이미지 및 제2 예비 수정 모음 이미지를 생성하기 위한 글자 영역 추출부; 및 상기 제3 예비 반전 자음 이미지 및 상기 제2 예비 수정 모음 이미지의 크기를 요구되는 정도로 조절하여 반전 자음 이미지 및 수정 모음 이미지를 생성하기 위한 글자 크기 변환부;를 포함하며,
상기 반전 글자 이미지 생성부는, 자소 이미지 결합부를 더 포함하되,
상기 자소 이미지 결합부는, 상기 반전 자음 이미지를 포함하는 초성 이미지, 상기 수정 모음 이미지를 포함하는 중성 이미지, 및 제1 패딩 이미지를 결합하여 상기 반전 글자 이미지를 생성하되, 상기 제1 패딩 이미지는, 상기 초성 이미지와 상기 중성 이미지 중, 상기 초성 이미지와 상기 중성 이미지의 배열 방향과 수직한 방향을 따라 상대적으로 짧은 길이를 갖는 어느 하나에 결합되고, 상기 초성 이미지와 상기 중성 이미지 중 상기 어느 하나와 상기 제1 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 배열 방향에 수직한 방향을 따라 배열되는, 인공지능을 이용한 반전 글자 인식 장치.
제 4 항에 있어서,
상기 초성 이미지와 상기 중성 이미지 중 상기 어느 하나의 길이와 상기 제1 패딩 이미지의 길이의 합은 상기 초성 이미지와 상기 중성 이미지 중 다른 하나의 길이와 동일한, 인공지능을 이용한 반전 글자 인식 장치.
제 4 항에 있어서,
상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지에 제2 패딩 이미지를 더 결합하여 상기 반전 글자 이미지를 생성하되,
상기 제2 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 간격이 확보되도록 상기 초성 이미지와 상기 중성 이미지 사이에 배치되는, 인공지능을 이용한 반전 글자 인식 장치.
제 4 항에 있어서,
상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지에 상기 반전 자음 이미지를 포함하는 종성 이미지 및 제3 패딩 이미지를 더 결합하되,
상기 제3 패딩 이미지는, 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중, 상기 초성 이미지와 상기 중성 이미지의 배열 방향을 따라 상대적으로 짧은 길이를 갖는 어느 하나에 결합되고,
상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 상기 어느 하나와 상기 제3 패딩 이미지는 상기 초성 이미지와 상기 중성 이미지의 배열 방향을 따라 배열되는, 인공지능을 이용한 반전 글자 인식 장치.
제 7 항에 있어서,
상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 상기 어느 하나의 길이와 상기 제3 패딩 이미지의 길이의 합은 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지 중 다른 하나의 길이와 동일한, 인공지능을 이용한 반전 글자 인식 장치.
제 7 항에 있어서,
상기 자소 이미지 결합부는, 상기 초성 이미지, 상기 중성 이미지, 상기 종성 이미지, 상기 제1 패딩 이미지, 및 상기 제3 패딩 이미지에 제4 패딩 이미지를 더 결합하여 상기 반전 글자 이미지를 생성하되,
상기 제4 패딩 이미지는 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 종성 이미지의 간격이 확보되도록 상기 상기 초성 이미지, 상기 중성 이미지, 및 상기 제1 패딩 이미지가 결합된 이미지와 상기 중성 이미지 사이에 배치되는, 인공지능을 이용한 반전 글자 인식 장치.
삭제