KR20180126352A

KR20180126352A - 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치

Info

Publication number: KR20180126352A
Application number: KR1020170086304A
Authority: KR
Inventors: 유수종; 배소영; 김기태
Original assignee: 주식회사 마인드그룹
Priority date: 2017-07-07
Filing date: 2017-07-07
Publication date: 2018-11-27

Abstract

본 발명은 사용자가 선택한 키워드가 이미지에 포함되어 있는지를 빠르게 확인할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치에 관한 것이다.
본 발명은, 이미지에 포함되어 있는 지를 확인하기 위한 글자를 확인키워드로 등록받는 확인키워드 등록모듈(10)과; 확인키워드의 존재여부를 확인하고자 하는 이미지를 등록받는 이미지 선택모듈(20)과; 키워드를 추출하기 위하여 선택된 이미지의 가로축을 기준 크기로 리사이즈하고, 세로축이 기준을 벗어나는 경우에 다수개로 분리하여 규격화화는 이미지 리사이즈모듈(30)과; 리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정하는 글자영역 설정모듈(40)과; 글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인하는 글자영역속성 확인모듈(50)과; 글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환하는 이미지글자 확인모듈(60)과; 이미지글자 확인모듈(60)에서 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인하는 인식키워드 확인모듈(70)과; 이미지글자 확인모듈(60)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장하는 키워드별이미지 분류모듈(80);를 포함하는 것을 특징으로 한다.

Description

이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치{Recognition device based deep learning for extracting text from images}

본 발명은 사용자가 선택한 키워드가 이미지에 포함되어 있는지를 빠르게 확인할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치에 관한 것이다.

현재 대다수의 인터넷 쇼핑몰에서는 상품의 속성들과 같은 상세한 설명을 텍스트가 아닌 이미지 파일로 제작하는 것이 일반적이다. 이러한 이미지 파일 상의 상품 상세 설명의 경우 상품에 대한 다양한 속성들을 설명해 주지만, 데이터 상으로 텍스트가 아닌 이미지로 분류가 되기 때문에 기존 쇼핑몰들이 제공하는 텍스트 기반의 검색에는 잡히지 않는 한계를 가지고 있다.

종래 OCR(Optical Character Recognition) 기술은 기본적으로 책 혹은 문서와 같이 흰 배경에 검은 글씨와 같이 서식이 거의 들어있지 않거나, 글자들의 위치가 어느 정도 정렬이 된 이미지들을 대상으로 연구가 되고 있다. 그러나 온라인 쇼핑몰 사이트의 상품 상세 설명 이미지들의 경우 고객들의 시선을 끌기 위해 텍스트에 다양한 서식들을 집어넣거나, 텍스트의 위치가 제각각 떨어져 있는 경우가 많아 기존의 OCR 기술로는 상대적으로 인식률이 떨어지게 된다.

또한 기존 OCR 기술들은 범용성을 중점으로 제작하였기에 보통 글자 단위로 텍스트를 추출하게 된다. 이러한 방식은 활용할 수 있는 범위가 넓어진다는 장점이 있지만, 경우에 따라 추출한 텍스트 내에 미세한 오탈자가 발생할 가능성이 존재한다. 이 경우 추출한 텍스트가 기 설정한 상품들의 속성 값과 정확하게 일치하지 않게 되어, 속성 값을 제대로 추출할 수 없는 문제가 발생하게 된다.

본 발명의 목적은 사용자가 선택한 키워드가 이미지에 포함되어 있는지를 빠르게 확인할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치를 제공하는 데 있다.

본 발명의 다른 목적은 이미지로부터 확인하고자 하는 키워드를 다양한 폰트와 크기로 제작한 후에 학습하여 정답확률을 증가시켜 실제 이미지에서의 인식오류를 최소화할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치를 제공하는 데 있다.

본 발명의 또다른 목적은 이미지에서 확인된 글자와 사용자가 선택한 키워드를 1:1로 매칭시켜 정답확률을 산정하여 기준이상의 정답률을 갖으면 사용자가 선택한 키워드가 이미지에 포함되어 있는지를 빠르게 확인할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치를 제공하는 데 있다.

본 발명에 따른 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치는, 이미지에 포함되어 있는 지를 확인하기 위한 글자를 확인키워드로 등록받는 확인키워드 등록모듈(10)과; 확인키워드의 존재여부를 확인하고자 하는 이미지를 등록받는 이미지 선택모듈(20)과; 키워드를 추출하기 위하여 선택된 이미지의 가로축을 기준 크기로 리사이즈하고, 세로축이 기준을 벗어나는 경우에 다수개로 분리하여 규격화화는 이미지 리사이즈모듈(30)과; 리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정하는 글자영역 설정모듈(40)과; 글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인하는 글자영역속성 확인모듈(50)과; 글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환하는 이미지글자 확인모듈(60)과; 이미지글자 확인모듈(60)에서 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인하는 인식키워드 확인모듈(70)과; 이미지글자 확인모듈(60)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장하는 키워드별이미지 분류모듈(80);를 포함하는 것을 특징으로 한다.

바람직하게, 이미지 선택모듈(20)의 이미지는 저장된 이미지를 드래그앤드롭 방식으로 선정하거나 또는 저장된 이미지 전체를 선택하거나 또는 인터넷 상에서 크롤링으로 추출한 이미지 중의 어느 하나인 것을 특징으로 한다.

바람직하게, 글자영역 설정모듈(40)은 띄어쓰기로 기준으로 글자영역을 구분하는 것을 특징으로 한다.

바람직하게, 글자영역속성 확인모듈(50)의 좌표정보는 이미지에서 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 실제 좌표정보로 저장하고, 0에서 1 사이의 절대좌표값으로 변환하는 것을 특징으로 한다.

바람직하게, 인식키워드 확인모듈(70)은 인식된 텍스트 글자를 확인키워드와 비교하여 일치되는 정답확률을 확인하고, 정답확률이 일정 이상인 경우에는 정답글자로 확인하는 것을 특징으로 한다.

본 발명에 의하면, 이미지에서 확인된 글자와 사용자가 선택한 키워드를 1:1로 매칭시키면서 정답확률을 산정하여 기준이상의 정답률을 갖으면 키워드로 저장하여 빠르게 키워드를 기재된 이미지를 확인할 수 있는 장점이 있다.

또한, 본 발명은 키워드가 선택되면 다양한 폰트와 크기로 제작한 후에 학습하여 정답확률을 증가시켜 실제 이미지에서의 인식오류를 최소화할 수 있는 장점이 있다.

도 1은 본 발명에 따른 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치의 블록도.
도 2는 본 발명에 따라 리사이즈되는 이미지의 전후 예시도.
도 3은 본 발명에 따른 이미지에서의 글자영역 설정과 분석된 글자영역 및 글자의 예시도.
도 4는 본 발명에 따른 글자영역의 실제좌표값과 절대좌표값의 예시도.
도 5는 본 발명에 따른 분석된 글자의 정답율에 대한 예시도.

이하, 아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.

이하, 첨부된 도면을 참조하여 본 발명을 자세히 설명한다.

도 1을 참조하여 설명하면, 본 발명의 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치는 확인키워드 등록모듈(10), 이미지 선택모듈(20), 이미지 리사이즈모듈(30), 글자영역 설정모듈(40), 글자영역속성 확인모듈(50), 이미지글자 확인모듈(60), 인식키워드 확인모듈(70), 키워드별이미지 분류모듈(80), 키워드인식 훈련모듈(90)을 포함한다.

확인키워드 등록모듈(10)은 이미지에 포함되어 있는 지를 확인하기 위한 글자를 확인키워드로 등록받아 관리한다. 이때, 확인키워드는 띄어쓰기가 없는 한단어로 등록하는 것이 바람직하지만 띄어쓰기가 존재하는 복합단어로도 등록할 수 있다.

이미지 선택모듈(20)은 확인키워드의 존재여부를 확인하고자 하는 이미지를 등록받는다. 이때, 이미지는 저장된 이미지를 드래그앤드롭 방식으로 선정하거나 또는 저장된 이미지 전체를 선택할 수 있다. 또한, 이미지는 인터넷 상에서 크롤링으로 추출한 상품 카탈로그 이미지를 포함한다.

이미지 리사이즈모듈(30)은 키워드를 추출하기 위하여 선택된 이미지의 가로축을 기준 크기로 리사이즈하고, 세로축이 기준을 벗어나는 경우에 다수개로 분리하여 규격화한다. 이때, 이미지 리사이즈모듈(30)은 픽셀을 기준단위로 사용하는 것이 바람직하다. 예를 들면, 도 2a의 선택된 원본 이미지를 도 2b와 같이 가로축을 500픽셀 기준으로 비율을 유지한 채 리사이즈한 후에 세로축을 500픽셀씩 잘라내 여러 장의 일정한 크기의 이미지로 분리하게 된다. 이 과정에서 각 축의 크기가 500픽셀보다 작은 경우, 이미지의 깨짐을 우려해 공백을 추가하는 것이 바람직하다. 또한 세로축을 잘라낼 때 글자가 잘리는 것을 방지하기 위하여 하단 100픽셀을 다음 이미지의 상단 100픽셀로 중복되도록 분리하고, 최종 이미지의 세로축이 500픽셀이 되도록 공백을 추가하여 이미지를 생성하는 것이 바람직하다. 이와 같은 이미지 리사이즈모듈(30)을 이용하여 인터넷 등에서 확인된 다양한 크기의 카탈로그 이미지를 표준 규격의 이미지 크기로 변환시켜 사용할 수 있게 된다.

글자영역 설정모듈(40)은 리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정한다. 이때, 글자영역은 띄어쓰기를 기준으로 하고, 기준이상의 크기를 갖는 단어에만 설정되는 것이 바람직하다. 또한, 도 3과 같이 글자영역은 글자로부터 1mm, 2mm와 같이 일정거리 이격되는 4각형태로 설정되는 것이 바람직하다. 이러한 글자영역 설정모듈(40)에 의해서 이미지 중에서 일정 이상의 기준을 갖는 글자만을 확인할 수 있기 때문에 이미지에 포함된 크기가 작은 단어를 확인하기 위한 시간을 절약하고 인식오류도 최소화할 수 있다. 즉, 상품을 설명하는 카탈로그 이미지의 주요 단어는 주로 제목, 소제목의 글자에 포함되어 있고, 일반적인 상품의 내용을 설명하는 글자설명보다 크기 때문에 일정크기 이상을 갖는 크기를 글자만을 인식하는 것이 바람직하다.

글자영역속성 확인모듈(50)은 글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인한다. 글자영역속성 확인모듈(50)에 의해서 글자가 어디에 위치하는 지를 확인할 수 있게 된다. 예를 들면 도 4와 같이, 글자영역의 좌표정보는 이미지에서 가로축의 최소값인 'Xmin', 세로축의 최소값인 'Ymin', 가로축의 최대값인 'Xmax', 세로축의 최대값인 'Ymax'으로 저장하게 된다. 그리고, 확인된 이미지 내의 실제 좌표정보는 표 1과 같이 0에서 1 사이의 절대좌표값으로 변환하는 것이 바람직하다.

이미지글자 확인모듈(60)은 글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환한다.

인식키워드 확인모듈(70)은 이미지글자 확인모듈(60)에서 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인한다. 이때, 도 5와 같이, 인식키워드 확인모듈(70)은 인식된 텍스트 글자를 확인키워드와 비교하여 일치되는 정답확률을 확인하고, 정답확률이 일정 이상인 경우에는 정답글자로 확인하는 것이 바람직하다. 이와 같이 분석된 글자를 확인키워드에 1:1로 매칭시켜 정답확률을 확인하면 정답률이 높은 1개만이 정답키워드로 인정될 수 있게 되고, 기준이상의 정답률을 갖는 키워드가 없거나 2개 이상이면 인식불가로 판단하게 된다.

키워드별이미지 분류모듈(80)은 이미지글자 확인모듈(60)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장한다. 이때, 저장되는 이미지에는 키워드를 태깅시켜 저장하는 것이 바람직하다.

키워드인식 훈련모듈(90)은 이미지로부터 키워드로 인식하고자 하는 글자에 대한 정보를 제공받으면 글자가 포함된 이미지를 생성하고, 이미지로부터 글자영역에 대한 정보를 확인하고 영역내의 글자를 텍스트로 변환하여 비교한다.

이러한 키워드인식 훈련모듈(90)은 훈련대상의 키워드를 제공받는 훈련키워드 관리부(91)와, 제공받은 훈련키워드를 이용하여 서로 다른 폰트와 글자크기 및 예상 글자영역이 설정된 표준 이미지를 생성하는 표준 이미지 관리부(92)와, 표준 이미지 내에서 글자를 감싸는 글자영역을 설정하고 설정된 글자영역에 대한 정보를 확인하는 글자영역속성 인식부(93)와, 설정된 글자영역 내의 글자를 텍스트로 변환시키는 글자 인식부(94)와, 글자영역속성 인식부(93)에서 확인된 글자영역과 글자 인식부(94)에서 변환된 텍스트 글자를 표준 이미지 관리부(92)에서 등록된 글자영역, 글자정보와 비교하여 일치여부를 확인하는 테스트 비교부(95)와, 테스트 비교부(95)의 확인결과 글자에 대한 정답율이 기준 이상이면 인식률이 높은 키워드로 분류하는 키워드 인정부(96)를 포함한다.

이때, 표준 이미지 관리부(92)는 글자영역을 글자로부터 일정거리 이격되도록 설정하면서 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 저장하게 된다. 또한, 글자영역속성 인식부(93)도 표준 이미지에 기재된 글자의 영역을 설정하면서 설정된 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 저장하게 된다. 또한, 테스트 비교부(95)는 이러한 등록된 표준 이미지의 글자영역, 글자영역속성 인식부(93)와 글자 인식부(94)에서 인식된 글자의 영역과 글자를 비교하여 정답율을 확인할 수 있게 된다.

이러한 키워드인식 훈련모듈(90)을 통해서 실제 이미지에서 확인하고자 하는 글자를 추출하기 위해서 등록받는 키워드에 대한 인식율을 기준 이상으로 증가시켜 실제 이미지에서의 인식오류를 최소화할 수 있게 된다.

이하, 첨부된 도면을 참조하여 본 발명을 자세히 설명한다.

<딥러닝 학습과정>

먼저, 인터넷에서 크롤링된 상품의 카탈로그 이미지에 포함되어 있는 지를 확인하기 위한 훈련키워드를 등록받는다. 훈련키워드는 실제 이미지에서 인식할 글자인 것이 바람직하다.

훈련키워드가 등록되면 서로 다른 글자영역을 설정하고, 다양한 폰트, 글자크기로 다수의 훈련키워드가 기재된 표준 이미지를 생성한다. 이때, 표준 이미지의 글자영역은 글자로부터 일정거리 이격되도록 설정되고, 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 저장하게 된다.

그 후, 서로 다른 크기 및 폰트를 갖는 다수의 훈련키워드가 포함된 표준 이미지에서 글자를 감싸는 글자영역를 설정하고, 글자영역내의 글자를 인식하여 텍스트로 변환시켜 글자인식을 학습한다. 이때, 표준 이미지에 글자영역을 설정하게 되면 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 저장하고, 인식된 텍스트로 함께 저장하게 된다.

이러한 과정을 통해서 표준 이미지에서 확인된 글자영역과 인식된 글자를 표준 이미지로 등록된 글자영역, 훈련키워드와 비교하여 정확도를 확인한다. 이때, 정확도는 글자영역의 크기별로, 폰트별로 확인하는 것이 바람직하다.

확인결과 정확도가 기준 이상이면 학습이 완료된 것으로 판단하고 훈련키워드에 대한 학습을 종료하고, 정확도가 기준 이하이면 반복적으로 학습하게 된다.

<상품 카탈로그 분류과정>

확인키워드 등록모듈(10)은 상품 카탈로그를 분류하고자 하는 확인키워드를 등록받는다. 확인키워드는 기 등록된 키워드 중에서 선택할 수도 있다.

그리고, 이미지 선택모듈(20)은 확인키워드의 존재여부를 확인하고자 하는 이미지를 선택한다. 이미지는 저장된 이미지를 드래그앤드롭 방식으로 선정하거나 또는 저장된 이미지 전체를 선택하거나 또는 실시간으로 인터넷 상에서 크롤링하여 선택할 수 있다.

또한, 이미지 리사이즈모듈(30)은 선택된 이미지를 규격화된 가로축과 세로축을 갖도록 리사이즈한다. 이때, 리사이즈는 이미지의 가로축을 규격에 일치하도록 변경시키고, 세로축이 넓은 경우에는 일정한 크기로 다수개로 분리하게 된다.

한편, 글자영역 설정모듈(40)은 리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정한다. 이때, 글자영역은 띄어쓰기를 기준으로 하고, 기준이상의 크기를 갖는 단어에만 설정되는 것이 바람직하다.

그리고, 글자영역속성 확인모듈(50)은 글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인하며, 이미지글자 확인모듈(60)은 글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환한다. 이때, 글자영역의 좌표정보는 이미지에서 가로축의 이미지 내의 실제 좌표정보로 최소값, 최대값과 세로축의 최소값, 최대값으로 확인할 수 있다. 그리고, 확인된 이미지 내의 실제 좌표정보는 표 1과 같이 0에서 1 사이의 절대좌표값으로 변환하는 것이 바람직하다.

한편, 인식키워드 확인모듈(70)은 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인한다. 이때, 인식된 텍스트 글자를 확인키워드와 비교하여 일치되는 정답확률을 확인하고, 정답확률이 일정 이상인 경우에는 정답글자로 확인하는 것이 바람직하다.

그리고, 키워드별이미지 분류모듈(70)은 이미지글자 확인모듈(70)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장한다. 이때, 이미지에 키워드를 태깅시켜 저장하는 것이 바람직하다.

이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 청구범위의 균등범위 내에서 양한 수정 및 변형이 가능함은 물론이다.

10 : 확인키워드 등록모듈 20 : 이미지 선택모듈
30 : 이미지 리사이즈모듈 40 : 글자영역 설정모듈
50 : 글자영역속성 확인모듈 60 : 이미지글자 확인모듈
70 : 인식키워드 확인모듈 80 : 키워드별이미지 분류모듈
90 : 키워드인식 훈련모듈 91 : 훈련키워드 관리부
92 : 표준 이미지 관리부 93 : 글자영역속성 인식부
94 : 글자 인식부 95 : 테스트 비교부
96 : 키워드 인정부

Claims

이미지에 포함되어 있는 지를 확인하기 위한 글자를 확인키워드로 등록받는 확인키워드 등록모듈(10)과;
확인키워드의 존재여부를 확인하고자 하는 이미지를 등록받는 이미지 선택모듈(20)과;
키워드를 추출하기 위하여 선택된 이미지의 가로축을 기준 크기로 리사이즈하고, 세로축이 기준을 벗어나는 경우에 다수개로 분리하여 규격화화는 이미지 리사이즈모듈(30)과;
리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정하는 글자영역 설정모듈(40)과;
글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인하는 글자영역속성 확인모듈(50)과;
글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환하는 이미지글자 확인모듈(60)과;
이미지글자 확인모듈(60)에서 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인하는 인식키워드 확인모듈(70)과;
이미지글자 확인모듈(60)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장하는 키워드별이미지 분류모듈(80);를 포함하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
청구항 1에 있어서, 이미지 선택모듈(20)의 이미지는 저장된 이미지를 드래그앤드롭 방식으로 선정하거나 또는 저장된 이미지 전체를 선택하거나 또는 인터넷 상에서 크롤링으로 추출한 이미지 중의 어느 하나인 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
청구항 1에 있어서, 글자영역 설정모듈(40)은 띄어쓰기로 기준으로 글자영역을 구분하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
청구항 1에 있어서, 글자영역 설정모듈(40)은 기준의 크기를 갖는 글자에만 글자영역을 설정하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
청구항 1에 있어서, 글자영역속성 확인모듈(50)의 좌표정보는 이미지에서 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 실제 좌표정보로 저장하고, 0에서 1 사이의 절대좌표값으로 변환하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
청구항 1에 있어서, 인식키워드 확인모듈(70)은 인식된 텍스트 글자를 확인키워드와 비교하여 일치되는 정답확률을 확인하고, 정답확률이 일정 이상인 경우에는 정답글자로 확인하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
청구항 1에 있어서, 키워드별이미지 분류모듈(80)은 저장되는 이미지에 키워드를 태깅시켜 저장하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.