KR20180126352A - 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 - Google Patents

이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 Download PDF

Info

Publication number
KR20180126352A
KR20180126352A KR1020170086304A KR20170086304A KR20180126352A KR 20180126352 A KR20180126352 A KR 20180126352A KR 1020170086304 A KR1020170086304 A KR 1020170086304A KR 20170086304 A KR20170086304 A KR 20170086304A KR 20180126352 A KR20180126352 A KR 20180126352A
Authority
KR
South Korea
Prior art keywords
image
module
keyword
character
character area
Prior art date
Application number
KR1020170086304A
Other languages
English (en)
Inventor
유수종
배소영
김기태
Original Assignee
주식회사 마인드그룹
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 마인드그룹 filed Critical 주식회사 마인드그룹
Priority to KR1020170086304A priority Critical patent/KR20180126352A/ko
Publication of KR20180126352A publication Critical patent/KR20180126352A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • G06K9/3258
    • G06K9/00409
    • G06K9/00422
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 사용자가 선택한 키워드가 이미지에 포함되어 있는지를 빠르게 확인할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치에 관한 것이다.
본 발명은, 이미지에 포함되어 있는 지를 확인하기 위한 글자를 확인키워드로 등록받는 확인키워드 등록모듈(10)과; 확인키워드의 존재여부를 확인하고자 하는 이미지를 등록받는 이미지 선택모듈(20)과; 키워드를 추출하기 위하여 선택된 이미지의 가로축을 기준 크기로 리사이즈하고, 세로축이 기준을 벗어나는 경우에 다수개로 분리하여 규격화화는 이미지 리사이즈모듈(30)과; 리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정하는 글자영역 설정모듈(40)과; 글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인하는 글자영역속성 확인모듈(50)과; 글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환하는 이미지글자 확인모듈(60)과; 이미지글자 확인모듈(60)에서 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인하는 인식키워드 확인모듈(70)과; 이미지글자 확인모듈(60)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장하는 키워드별이미지 분류모듈(80);를 포함하는 것을 특징으로 한다.

Description

이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치{Recognition device based deep learning for extracting text from images}
본 발명은 사용자가 선택한 키워드가 이미지에 포함되어 있는지를 빠르게 확인할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치에 관한 것이다.
현재 대다수의 인터넷 쇼핑몰에서는 상품의 속성들과 같은 상세한 설명을 텍스트가 아닌 이미지 파일로 제작하는 것이 일반적이다. 이러한 이미지 파일 상의 상품 상세 설명의 경우 상품에 대한 다양한 속성들을 설명해 주지만, 데이터 상으로 텍스트가 아닌 이미지로 분류가 되기 때문에 기존 쇼핑몰들이 제공하는 텍스트 기반의 검색에는 잡히지 않는 한계를 가지고 있다.
종래 OCR(Optical Character Recognition) 기술은 기본적으로 책 혹은 문서와 같이 흰 배경에 검은 글씨와 같이 서식이 거의 들어있지 않거나, 글자들의 위치가 어느 정도 정렬이 된 이미지들을 대상으로 연구가 되고 있다. 그러나 온라인 쇼핑몰 사이트의 상품 상세 설명 이미지들의 경우 고객들의 시선을 끌기 위해 텍스트에 다양한 서식들을 집어넣거나, 텍스트의 위치가 제각각 떨어져 있는 경우가 많아 기존의 OCR 기술로는 상대적으로 인식률이 떨어지게 된다.
또한 기존 OCR 기술들은 범용성을 중점으로 제작하였기에 보통 글자 단위로 텍스트를 추출하게 된다. 이러한 방식은 활용할 수 있는 범위가 넓어진다는 장점이 있지만, 경우에 따라 추출한 텍스트 내에 미세한 오탈자가 발생할 가능성이 존재한다. 이 경우 추출한 텍스트가 기 설정한 상품들의 속성 값과 정확하게 일치하지 않게 되어, 속성 값을 제대로 추출할 수 없는 문제가 발생하게 된다.
본 발명의 목적은 사용자가 선택한 키워드가 이미지에 포함되어 있는지를 빠르게 확인할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치를 제공하는 데 있다.
본 발명의 다른 목적은 이미지로부터 확인하고자 하는 키워드를 다양한 폰트와 크기로 제작한 후에 학습하여 정답확률을 증가시켜 실제 이미지에서의 인식오류를 최소화할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치를 제공하는 데 있다.
본 발명의 또다른 목적은 이미지에서 확인된 글자와 사용자가 선택한 키워드를 1:1로 매칭시켜 정답확률을 산정하여 기준이상의 정답률을 갖으면 사용자가 선택한 키워드가 이미지에 포함되어 있는지를 빠르게 확인할 수 있는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치를 제공하는 데 있다.
본 발명에 따른 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치는, 이미지에 포함되어 있는 지를 확인하기 위한 글자를 확인키워드로 등록받는 확인키워드 등록모듈(10)과; 확인키워드의 존재여부를 확인하고자 하는 이미지를 등록받는 이미지 선택모듈(20)과; 키워드를 추출하기 위하여 선택된 이미지의 가로축을 기준 크기로 리사이즈하고, 세로축이 기준을 벗어나는 경우에 다수개로 분리하여 규격화화는 이미지 리사이즈모듈(30)과; 리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정하는 글자영역 설정모듈(40)과; 글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인하는 글자영역속성 확인모듈(50)과; 글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환하는 이미지글자 확인모듈(60)과; 이미지글자 확인모듈(60)에서 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인하는 인식키워드 확인모듈(70)과; 이미지글자 확인모듈(60)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장하는 키워드별이미지 분류모듈(80);를 포함하는 것을 특징으로 한다.
바람직하게, 이미지 선택모듈(20)의 이미지는 저장된 이미지를 드래그앤드롭 방식으로 선정하거나 또는 저장된 이미지 전체를 선택하거나 또는 인터넷 상에서 크롤링으로 추출한 이미지 중의 어느 하나인 것을 특징으로 한다.
바람직하게, 글자영역 설정모듈(40)은 띄어쓰기로 기준으로 글자영역을 구분하는 것을 특징으로 한다.
바람직하게, 글자영역속성 확인모듈(50)의 좌표정보는 이미지에서 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 실제 좌표정보로 저장하고, 0에서 1 사이의 절대좌표값으로 변환하는 것을 특징으로 한다.
바람직하게, 인식키워드 확인모듈(70)은 인식된 텍스트 글자를 확인키워드와 비교하여 일치되는 정답확률을 확인하고, 정답확률이 일정 이상인 경우에는 정답글자로 확인하는 것을 특징으로 한다.
본 발명에 의하면, 이미지에서 확인된 글자와 사용자가 선택한 키워드를 1:1로 매칭시키면서 정답확률을 산정하여 기준이상의 정답률을 갖으면 키워드로 저장하여 빠르게 키워드를 기재된 이미지를 확인할 수 있는 장점이 있다.
또한, 본 발명은 키워드가 선택되면 다양한 폰트와 크기로 제작한 후에 학습하여 정답확률을 증가시켜 실제 이미지에서의 인식오류를 최소화할 수 있는 장점이 있다.
도 1은 본 발명에 따른 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치의 블록도.
도 2는 본 발명에 따라 리사이즈되는 이미지의 전후 예시도.
도 3은 본 발명에 따른 이미지에서의 글자영역 설정과 분석된 글자영역 및 글자의 예시도.
도 4는 본 발명에 따른 글자영역의 실제좌표값과 절대좌표값의 예시도.
도 5는 본 발명에 따른 분석된 글자의 정답율에 대한 예시도.
이하, 아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
이하, 첨부된 도면을 참조하여 본 발명을 자세히 설명한다.
도 1을 참조하여 설명하면, 본 발명의 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치는 확인키워드 등록모듈(10), 이미지 선택모듈(20), 이미지 리사이즈모듈(30), 글자영역 설정모듈(40), 글자영역속성 확인모듈(50), 이미지글자 확인모듈(60), 인식키워드 확인모듈(70), 키워드별이미지 분류모듈(80), 키워드인식 훈련모듈(90)을 포함한다.
확인키워드 등록모듈(10)은 이미지에 포함되어 있는 지를 확인하기 위한 글자를 확인키워드로 등록받아 관리한다. 이때, 확인키워드는 띄어쓰기가 없는 한단어로 등록하는 것이 바람직하지만 띄어쓰기가 존재하는 복합단어로도 등록할 수 있다.
이미지 선택모듈(20)은 확인키워드의 존재여부를 확인하고자 하는 이미지를 등록받는다. 이때, 이미지는 저장된 이미지를 드래그앤드롭 방식으로 선정하거나 또는 저장된 이미지 전체를 선택할 수 있다. 또한, 이미지는 인터넷 상에서 크롤링으로 추출한 상품 카탈로그 이미지를 포함한다.
이미지 리사이즈모듈(30)은 키워드를 추출하기 위하여 선택된 이미지의 가로축을 기준 크기로 리사이즈하고, 세로축이 기준을 벗어나는 경우에 다수개로 분리하여 규격화한다. 이때, 이미지 리사이즈모듈(30)은 픽셀을 기준단위로 사용하는 것이 바람직하다. 예를 들면, 도 2a의 선택된 원본 이미지를 도 2b와 같이 가로축을 500픽셀 기준으로 비율을 유지한 채 리사이즈한 후에 세로축을 500픽셀씩 잘라내 여러 장의 일정한 크기의 이미지로 분리하게 된다. 이 과정에서 각 축의 크기가 500픽셀보다 작은 경우, 이미지의 깨짐을 우려해 공백을 추가하는 것이 바람직하다. 또한 세로축을 잘라낼 때 글자가 잘리는 것을 방지하기 위하여 하단 100픽셀을 다음 이미지의 상단 100픽셀로 중복되도록 분리하고, 최종 이미지의 세로축이 500픽셀이 되도록 공백을 추가하여 이미지를 생성하는 것이 바람직하다. 이와 같은 이미지 리사이즈모듈(30)을 이용하여 인터넷 등에서 확인된 다양한 크기의 카탈로그 이미지를 표준 규격의 이미지 크기로 변환시켜 사용할 수 있게 된다.
글자영역 설정모듈(40)은 리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정한다. 이때, 글자영역은 띄어쓰기를 기준으로 하고, 기준이상의 크기를 갖는 단어에만 설정되는 것이 바람직하다. 또한, 도 3과 같이 글자영역은 글자로부터 1mm, 2mm와 같이 일정거리 이격되는 4각형태로 설정되는 것이 바람직하다. 이러한 글자영역 설정모듈(40)에 의해서 이미지 중에서 일정 이상의 기준을 갖는 글자만을 확인할 수 있기 때문에 이미지에 포함된 크기가 작은 단어를 확인하기 위한 시간을 절약하고 인식오류도 최소화할 수 있다. 즉, 상품을 설명하는 카탈로그 이미지의 주요 단어는 주로 제목, 소제목의 글자에 포함되어 있고, 일반적인 상품의 내용을 설명하는 글자설명보다 크기 때문에 일정크기 이상을 갖는 크기를 글자만을 인식하는 것이 바람직하다.
글자영역속성 확인모듈(50)은 글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인한다. 글자영역속성 확인모듈(50)에 의해서 글자가 어디에 위치하는 지를 확인할 수 있게 된다. 예를 들면 도 4와 같이, 글자영역의 좌표정보는 이미지에서 가로축의 최소값인 'Xmin', 세로축의 최소값인 'Ymin', 가로축의 최대값인 'Xmax', 세로축의 최대값인 'Ymax'으로 저장하게 된다. 그리고, 확인된 이미지 내의 실제 좌표정보는 표 1과 같이 0에서 1 사이의 절대좌표값으로 변환하는 것이 바람직하다.
이미지글자 확인모듈(60)은 글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환한다.
인식키워드 확인모듈(70)은 이미지글자 확인모듈(60)에서 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인한다. 이때, 도 5와 같이, 인식키워드 확인모듈(70)은 인식된 텍스트 글자를 확인키워드와 비교하여 일치되는 정답확률을 확인하고, 정답확률이 일정 이상인 경우에는 정답글자로 확인하는 것이 바람직하다. 이와 같이 분석된 글자를 확인키워드에 1:1로 매칭시켜 정답확률을 확인하면 정답률이 높은 1개만이 정답키워드로 인정될 수 있게 되고, 기준이상의 정답률을 갖는 키워드가 없거나 2개 이상이면 인식불가로 판단하게 된다.
키워드별이미지 분류모듈(80)은 이미지글자 확인모듈(60)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장한다. 이때, 저장되는 이미지에는 키워드를 태깅시켜 저장하는 것이 바람직하다.
키워드인식 훈련모듈(90)은 이미지로부터 키워드로 인식하고자 하는 글자에 대한 정보를 제공받으면 글자가 포함된 이미지를 생성하고, 이미지로부터 글자영역에 대한 정보를 확인하고 영역내의 글자를 텍스트로 변환하여 비교한다.
이러한 키워드인식 훈련모듈(90)은 훈련대상의 키워드를 제공받는 훈련키워드 관리부(91)와, 제공받은 훈련키워드를 이용하여 서로 다른 폰트와 글자크기 및 예상 글자영역이 설정된 표준 이미지를 생성하는 표준 이미지 관리부(92)와, 표준 이미지 내에서 글자를 감싸는 글자영역을 설정하고 설정된 글자영역에 대한 정보를 확인하는 글자영역속성 인식부(93)와, 설정된 글자영역 내의 글자를 텍스트로 변환시키는 글자 인식부(94)와, 글자영역속성 인식부(93)에서 확인된 글자영역과 글자 인식부(94)에서 변환된 텍스트 글자를 표준 이미지 관리부(92)에서 등록된 글자영역, 글자정보와 비교하여 일치여부를 확인하는 테스트 비교부(95)와, 테스트 비교부(95)의 확인결과 글자에 대한 정답율이 기준 이상이면 인식률이 높은 키워드로 분류하는 키워드 인정부(96)를 포함한다.
이때, 표준 이미지 관리부(92)는 글자영역을 글자로부터 일정거리 이격되도록 설정하면서 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 저장하게 된다. 또한, 글자영역속성 인식부(93)도 표준 이미지에 기재된 글자의 영역을 설정하면서 설정된 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 저장하게 된다. 또한, 테스트 비교부(95)는 이러한 등록된 표준 이미지의 글자영역, 글자영역속성 인식부(93)와 글자 인식부(94)에서 인식된 글자의 영역과 글자를 비교하여 정답율을 확인할 수 있게 된다.
이러한 키워드인식 훈련모듈(90)을 통해서 실제 이미지에서 확인하고자 하는 글자를 추출하기 위해서 등록받는 키워드에 대한 인식율을 기준 이상으로 증가시켜 실제 이미지에서의 인식오류를 최소화할 수 있게 된다.
이하, 첨부된 도면을 참조하여 본 발명을 자세히 설명한다.
<딥러닝 학습과정>
먼저, 인터넷에서 크롤링된 상품의 카탈로그 이미지에 포함되어 있는 지를 확인하기 위한 훈련키워드를 등록받는다. 훈련키워드는 실제 이미지에서 인식할 글자인 것이 바람직하다.
훈련키워드가 등록되면 서로 다른 글자영역을 설정하고, 다양한 폰트, 글자크기로 다수의 훈련키워드가 기재된 표준 이미지를 생성한다. 이때, 표준 이미지의 글자영역은 글자로부터 일정거리 이격되도록 설정되고, 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 저장하게 된다.
그 후, 서로 다른 크기 및 폰트를 갖는 다수의 훈련키워드가 포함된 표준 이미지에서 글자를 감싸는 글자영역를 설정하고, 글자영역내의 글자를 인식하여 텍스트로 변환시켜 글자인식을 학습한다. 이때, 표준 이미지에 글자영역을 설정하게 되면 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 저장하고, 인식된 텍스트로 함께 저장하게 된다.
이러한 과정을 통해서 표준 이미지에서 확인된 글자영역과 인식된 글자를 표준 이미지로 등록된 글자영역, 훈련키워드와 비교하여 정확도를 확인한다. 이때, 정확도는 글자영역의 크기별로, 폰트별로 확인하는 것이 바람직하다.
확인결과 정확도가 기준 이상이면 학습이 완료된 것으로 판단하고 훈련키워드에 대한 학습을 종료하고, 정확도가 기준 이하이면 반복적으로 학습하게 된다.
<상품 카탈로그 분류과정>
확인키워드 등록모듈(10)은 상품 카탈로그를 분류하고자 하는 확인키워드를 등록받는다. 확인키워드는 기 등록된 키워드 중에서 선택할 수도 있다.
그리고, 이미지 선택모듈(20)은 확인키워드의 존재여부를 확인하고자 하는 이미지를 선택한다. 이미지는 저장된 이미지를 드래그앤드롭 방식으로 선정하거나 또는 저장된 이미지 전체를 선택하거나 또는 실시간으로 인터넷 상에서 크롤링하여 선택할 수 있다.
또한, 이미지 리사이즈모듈(30)은 선택된 이미지를 규격화된 가로축과 세로축을 갖도록 리사이즈한다. 이때, 리사이즈는 이미지의 가로축을 규격에 일치하도록 변경시키고, 세로축이 넓은 경우에는 일정한 크기로 다수개로 분리하게 된다.
한편, 글자영역 설정모듈(40)은 리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정한다. 이때, 글자영역은 띄어쓰기를 기준으로 하고, 기준이상의 크기를 갖는 단어에만 설정되는 것이 바람직하다.
그리고, 글자영역속성 확인모듈(50)은 글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인하며, 이미지글자 확인모듈(60)은 글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환한다. 이때, 글자영역의 좌표정보는 이미지에서 가로축의 이미지 내의 실제 좌표정보로 최소값, 최대값과 세로축의 최소값, 최대값으로 확인할 수 있다. 그리고, 확인된 이미지 내의 실제 좌표정보는 표 1과 같이 0에서 1 사이의 절대좌표값으로 변환하는 것이 바람직하다.
한편, 인식키워드 확인모듈(70)은 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인한다. 이때, 인식된 텍스트 글자를 확인키워드와 비교하여 일치되는 정답확률을 확인하고, 정답확률이 일정 이상인 경우에는 정답글자로 확인하는 것이 바람직하다.
그리고, 키워드별이미지 분류모듈(70)은 이미지글자 확인모듈(70)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장한다. 이때, 이미지에 키워드를 태깅시켜 저장하는 것이 바람직하다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 청구범위의 균등범위 내에서 양한 수정 및 변형이 가능함은 물론이다.
10 : 확인키워드 등록모듈 20 : 이미지 선택모듈
30 : 이미지 리사이즈모듈 40 : 글자영역 설정모듈
50 : 글자영역속성 확인모듈 60 : 이미지글자 확인모듈
70 : 인식키워드 확인모듈 80 : 키워드별이미지 분류모듈
90 : 키워드인식 훈련모듈 91 : 훈련키워드 관리부
92 : 표준 이미지 관리부 93 : 글자영역속성 인식부
94 : 글자 인식부 95 : 테스트 비교부
96 : 키워드 인정부

Claims (7)

  1. 이미지에 포함되어 있는 지를 확인하기 위한 글자를 확인키워드로 등록받는 확인키워드 등록모듈(10)과;
    확인키워드의 존재여부를 확인하고자 하는 이미지를 등록받는 이미지 선택모듈(20)과;
    키워드를 추출하기 위하여 선택된 이미지의 가로축을 기준 크기로 리사이즈하고, 세로축이 기준을 벗어나는 경우에 다수개로 분리하여 규격화화는 이미지 리사이즈모듈(30)과;
    리사이즈된 이미지 중에서 글자로 인식되는 부분을 감싸는 글자영역을 설정하는 글자영역 설정모듈(40)과;
    글자영역 설정모듈(40)에 의해서 이미지에 설정된 글자영역에 대한 좌표정보를 확인하는 글자영역속성 확인모듈(50)과;
    글자영역 설정모듈(40)에 의해서 설정된 글자영역을 분석을 하여 글자를 텍스트로 변환하는 이미지글자 확인모듈(60)과;
    이미지글자 확인모듈(60)에서 변환된 텍스트 글자를 인식대상의 확인키워드와 비교하여 일치되는 글자를 확인하는 인식키워드 확인모듈(70)과;
    이미지글자 확인모듈(60)에 의해서 확인키워드가 존재하면 해당 이미지를 키워드별로 분류하여 저장하는 키워드별이미지 분류모듈(80);를 포함하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
  2. 청구항 1에 있어서, 이미지 선택모듈(20)의 이미지는 저장된 이미지를 드래그앤드롭 방식으로 선정하거나 또는 저장된 이미지 전체를 선택하거나 또는 인터넷 상에서 크롤링으로 추출한 이미지 중의 어느 하나인 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
  3. 청구항 1에 있어서, 글자영역 설정모듈(40)은 띄어쓰기로 기준으로 글자영역을 구분하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
  4. 청구항 1에 있어서, 글자영역 설정모듈(40)은 기준의 크기를 갖는 글자에만 글자영역을 설정하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
  5. 청구항 1에 있어서, 글자영역속성 확인모듈(50)의 좌표정보는 이미지에서 가로축의 최소값과 최대값, 세로축의 최소값과 최대값을 실제 좌표정보로 저장하고, 0에서 1 사이의 절대좌표값으로 변환하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
  6. 청구항 1에 있어서, 인식키워드 확인모듈(70)은 인식된 텍스트 글자를 확인키워드와 비교하여 일치되는 정답확률을 확인하고, 정답확률이 일정 이상인 경우에는 정답글자로 확인하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
  7. 청구항 1에 있어서, 키워드별이미지 분류모듈(80)은 저장되는 이미지에 키워드를 태깅시켜 저장하는 것을 특징으로 하는 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치.
KR1020170086304A 2017-07-07 2017-07-07 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 KR20180126352A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170086304A KR20180126352A (ko) 2017-07-07 2017-07-07 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170086304A KR20180126352A (ko) 2017-07-07 2017-07-07 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020170061093A Division KR101769918B1 (ko) 2017-05-17 2017-05-17 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치

Publications (1)

Publication Number Publication Date
KR20180126352A true KR20180126352A (ko) 2018-11-27

Family

ID=64603454

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170086304A KR20180126352A (ko) 2017-07-07 2017-07-07 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치

Country Status (1)

Country Link
KR (1) KR20180126352A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110057522A (zh) * 2019-04-12 2019-07-26 西北工业大学 基于深度学习的加速度信号采集卡采样频率智能升级方法
KR20210086836A (ko) * 2019-12-30 2021-07-09 동국대학교 산학협력단 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법
KR102515359B1 (ko) * 2022-11-18 2023-03-29 써큘러스리더(주) 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110057522A (zh) * 2019-04-12 2019-07-26 西北工业大学 基于深度学习的加速度信号采集卡采样频率智能升级方法
KR20210086836A (ko) * 2019-12-30 2021-07-09 동국대학교 산학협력단 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법
KR102515359B1 (ko) * 2022-11-18 2023-03-29 써큘러스리더(주) 인공지능을 이용한 반전 글자 인식 장치 및 반전 글자 생성 장치

Similar Documents

Publication Publication Date Title
KR101769918B1 (ko) 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
EP2166488B1 (en) Handwritten word spotter using synthesized typed queries
CN107016387B (zh) 一种识别标签的方法及装置
Kleber et al. Cvl-database: An off-line database for writer retrieval, writer identification and word spotting
US9639751B2 (en) Property record document data verification systems and methods
US8744196B2 (en) Automatic recognition of images
AU2020279921B2 (en) Representative document hierarchy generation
KR101122854B1 (ko) 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치
US9626555B2 (en) Content-based document image classification
US6996295B2 (en) Automatic document reading system for technical drawings
US8295600B2 (en) Image document processing device, image document processing method, program, and storage medium
KR20190123790A (ko) 전자 문서로부터 데이터 추출
US8064703B2 (en) Property record document data validation systems and methods
CN112800848A (zh) 票据识别后信息结构化提取方法、装置和设备
CN110889402A (zh) 一种基于深度学习的营业执照内容识别方法及系统
US20160371246A1 (en) System and method of template creation for a data extraction tool
US8208737B1 (en) Methods and systems for identifying captions in media material
US10482323B2 (en) System and method for semantic textual information recognition
US20150169972A1 (en) Character data generation based on transformed imaged data to identify nutrition-related data or other types of data
JP2005173730A (ja) 帳票ocrプログラム、方法及び装置
US20210304749A1 (en) Method and system for extraction of key-terms and synonyms for the key-terms
US20190384971A1 (en) System and method for optical character recognition
KR20180126352A (ko) 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
CN113610068B (zh) 基于试卷图像的试题拆解方法、系统、存储介质及设备
CN114463767A (zh) 信用证识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A107 Divisional application of patent