KR20230143885A - 텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법 - Google Patents
텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법 Download PDFInfo
- Publication number
- KR20230143885A KR20230143885A KR1020220043095A KR20220043095A KR20230143885A KR 20230143885 A KR20230143885 A KR 20230143885A KR 1020220043095 A KR1020220043095 A KR 1020220043095A KR 20220043095 A KR20220043095 A KR 20220043095A KR 20230143885 A KR20230143885 A KR 20230143885A
- Authority
- KR
- South Korea
- Prior art keywords
- labeling
- document image
- learning
- learning data
- document images
- Prior art date
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000001514 detection method Methods 0.000 title claims abstract description 20
- 238000010801 machine learning Methods 0.000 title 1
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000012937 correction Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/20—Combination of acquisition, preprocessing or recognition functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
본 발명은 학습 데이터의 생성 기술에 관한 것으로서, 상세하게는 이미지 내에 존재하는 텍스트를 검출 및 인식하는 모델을 학습할 때 학습 데이터로 사용되는 문서 이미지를 새롭게 추가하는 경우 그 추가되는 문서 이미지로부터 빠르게 추가 정답 데이터를 생성할 수 있는 문서 이미지의 레이블링 장치 및 방법에 관한 것이다. 이를 위해, 본 발명에 따른 문서 이미지의 레이블링 방법은 컴퓨팅 장치에서 수행되는 문서 이미지의 레이블링 방법으로서, 기 학습된 텍스트 검출 및 인식 모델을 이용해 정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열을 유추하여 자동 레이블링된 제1 학습 데이터를 생성하는 단계와, 상기 제1 학습 데이터에 대한 선택적 레이블링을 수행하여 제2 학습 데이터를 생성하는 단계를 포함한다.
Description
본 발명은 학습 데이터의 생성 기술에 관한 것으로서, 상세하게는 이미지 내에 존재하는 텍스트를 검출 및 인식하는 모델을 학습할 때 학습 데이터로 사용되는 문서 이미지를 새롭게 추가하는 경우 그 추가되는 문서 이미지로부터 빠르게 추가 정답 데이터를 생성할 수 있는 문서 이미지의 레이블링 장치 및 방법에 관한 것이다.
이미지 내에 있는 텍스트를 검출하기 위해서는 각 단어의 위치를 나타내는 박스의 좌표를 구해야 한다. 텍스트 검출 과정은 학습된 심층신경망(DNN)을 통해 이미지에서 각 박스의 위치(네 꼭지점의 좌표)를 유추할 수 있다. 텍스트 검출을 위한 심층신경망을 학습하기 위해서는 문서 이미지와 정답 박스의 위치가 입력 데이터로 필요하다.
텍스트 검출 과정을 통해 박스의 좌표를 구하면, 검출된 박스 이미지로부터 텍스트 인식 과정을 통해 각 박스 내의 글자를 인식할 수 있다. 텍스트 인식 과정은 학습된 심층신경망을 통해 박스 이미지 내에 있는 글자를 유추할 수 있다. 텍스트 인식을 위한 심층신경망을 학습하기 위해서는 박스 이미지와 정답 문자열이 입력 데이터로 필요하다.
이와 같이, 텍스트 검출 및 인식을 위한 심층신경망을 학습하기 위해서는 문서 이미지, 정답 박스 정보 및 정답 문자열 정보를 포함하는 학습 데이터가 필요한데, 종래에는 이러한 학습 데이터를 사람이 수작업으로 생성하였다.
즉, 학습에 사용할 글자가 포함된 다수의 문서 이미지가 주어지면 사람이 일정한 박스 기준에 맞춰 직접 박스를 설정하는 작업을 수행해야 한다.
그러나 사람이 일단 박스 기준을 정확히 지키기 어렵고 박스 기준에 따라 문서 이미지 내에서 박스를 만들 때 시간이 매우 오래 걸린다는 문제점이 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 본 발명의 목적은 텍스트 검출 및 인식을 위한 심층신경망 학습에 사용되는 다양한 학습 데이터를 빠르고 정확하게 생성하는 것이다.
이를 위해, 본 발명에 따른 문서 이미지의 레이블링 방법은 컴퓨팅 장치에서 수행되는 문서 이미지의 레이블링 방법으로서, 기 학습된 텍스트 검출 및 인식 모델을 이용해 정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열을 유추하여 자동 레이블링된 제1 학습 데이터를 생성하는 단계와, 상기 제1 학습 데이터에 대한 선택적 레이블링을 수행하여 제2 학습 데이터를 생성하는 단계를 포함한다.
본 발명에 따른 문서 이미지의 레이블링 장치는 정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열을 유추하여 자동 레이블링된 제1 학습 데이터를 생성하는 학습 모델부와, 상기 학습 모델부에서 생성한 제1 학습 데이터에 대한 선택적 레이블링을 수행하여 제2 학습 데이터를 생성하는 레이블 보정부를 포함한다.
본 발명에 따른 문서 이미지의 레이블링 방법은 컴퓨팅 장치에서 수행되는 문서 이미지의 레이블링 방법으로서, 정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열을 유추하여 자동 레이블링된 문서 이미지를 생성하는 단계와, 상기 자동 레이블링된 문서 이미지에서 레이블링 보정이 가능한 부분에 선택적 레이블링 영역을 표시하는 단계와, 상기 자동 레이블링된 문서 이미지에 대한 선택적 레이블링을 수행하여 텍스트 검출 및 인식 모델에 사용되는 학습 데이터를 생성하는 단계를 포함한다.
상술한 바와 같이, 본 발명은 텍스트 검출 및 인식을 위한 심층신경망 학습에 사용되는 다양한 학습 데이터를 빠르고 정확하게 생성할 수 있는 효과가 있다.
본 발명에 따르면 기존 학습한 심층신경망(DNN)을 통해 유추된 단어 박스와 글자열을 그대로 이용하기 때문에 종래 수작업으로 처음부터 정답 데이터를 만들어야 하는 수고와 그에 따라 소요되는 작업 시간을 현저히 줄일 수 있으며, 필요에 따라 선택적 레이블링이 가능하기 때문에 보정된 데이터를 통해 더욱 향상된 학습 모델을 생성할 수 있다.
도 1은 본 발명에 따른 문서 이미지의 레이블링 장치의 내부 구성도.
도 2는 본 발명에 따른 문서 이미지의 레이블링 방법의 순서도.
도 3은 본 발명에 따른 선택적 레이블링을 위한 처리 과정을 나타낸 순서도.
도 4는 본 발명에 따른 선택적 레이블링의 예를 나타낸 도면.
도 2는 본 발명에 따른 문서 이미지의 레이블링 방법의 순서도.
도 3은 본 발명에 따른 선택적 레이블링을 위한 처리 과정을 나타낸 순서도.
도 4는 본 발명에 따른 선택적 레이블링의 예를 나타낸 도면.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.
그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다.
그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
또한, 명세서에 기재된 "……부", "…… 모듈" 의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
이하, 도면을 참조로 하여 본 발명의 실시예에 따른 텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법에 대하여 상세히 설명한다.
도 1은 본 발명에 따른 문서 이미지의 레이블링 장치의 내부 구성을 나타낸 것이다.
본 발명에 따른 문서 이미지의 레이블링 장치는 텍스트 검출 및 인식 학습을 위한 학습 데이터로서 사용되는 문서 이미지에 대한 레이블링 작업을 수행하는 장치이다. 문서 이미지의 레이블링 장치는 퍼스널 컴퓨터(PC)이거나 전용 컴퓨팅 장치가 될 수 있다.
도 1을 참조하면, 본 발명에 따른 문서 이미지의 레이블링 장치는 학습 모델부(10), ROI 출력부(20), 레이블 보정부(30) 등을 포함한다.
학습 모델부(10)는 텍스트 검출 및 인식을 위한 심층신경망(DNN)이다. 학습 모델부(10)는 텍스트 검출을 위한 심층신경망을 통해 문서 이미지에서 각 단어 박스의 위치(네 꼭지점의 좌표)를 추출하고, 텍스트 인식을 위한 심층신경망을 통해 단어 박스 이미지 내에 있는 글자를 유추할 수 있다.
학습 모델부(10)는 정답 데이터(단어 박스, 글자열)가 주어지지 않은 문서 이미지 집합을 입력받아, 문서 이미지 내의 각 단어 박스와 그 단어 박스에 포함된 글자열을 추출하여 제1 학습 데이터를 생성한다. 제1 학습 데이터는 단어 박스가 자동 표시된 즉, 자동 레이블링된 문서 이미지를 말한다. 학습 모델부(10)는 제1 학습 데이터를 ROI 출력부(20)로 전달한다.
ROI 출력부(20)는 학습 모델부(10)에서 생성한 제1 학습 데이터에 선택적 레이블링이 가능한 영역을 표시한다. 즉, ROI 출력부(20)는 자동 레이블링된 문서 이미지 상에서 선택적 레이블링이 적용될 수 있는 단어 박스에 레이블 보정이 가능하다는 인디케이터(indicator)를 표시하여 문서 이미지를 출력할 수 있다.
ROI 출력부(20)는 문서 이미지 처리를 통해 선택적 레이블링이 가능한 영역을 검출할 수 있다. 예를 들어, 제1 학습 데이터에서 연속 배치된 복수의 한 글자 단어 박스 또는 단어 박스 부근에 위치하는 특수 문자를 검출한 경우 그 해당 부분에 선택적 레이블링 영역을 표시할 수 있다.
레이블 보정부(30)는 제1 학습 데이터에 대한 선택적 레이블링을 수행하여 제2 학습 데이터를 생성한다. 레이블 보정부(30)는 실시예에 따라 학습 모델부(10)로부터 직접 출력된 문서 이미지를 참고하거나, ROI 출력부(20)로부터 출력된 ROI 표시(선택적 레이블링 가능 영역 표시)가 포함된 문서 이미지를 참고할 수 있다.
레이블 보정부(30)는 글자를 묶고 있는 단어 박스의 형태를 변경할 수 있는 단어 박스 작성 툴(tool)이다.
도 2는 본 발명에 따른 문서 이미지의 레이블링 방법의 순서도를 나타내고, 도 3은 본 발명에 따른 선택적 레이블링을 위한 처리 과정을 구체적으로 나타낸 것이다.
도 2 및 도 3에 도시된 각 단계는 본 발명에 따른 문서 이미지의 레이블링 장치에서 수행된다. 구체적으로 각 단계는 문서 이미지의 레이블링 장치의 각 기능(자동 레이블링 기능 및 선택적 레이블링)을 가진 해당 소프트웨어 또는 하드웨어에 의해 수행되나, 설명의 편의 상 문서 이미지의 레이블링 장치가 각 단계를 수행하는 것으로 설명한다.
도 2을 참조하면, 먼저 문서 이미지의 레이블링 장치가 문서 이미지에 대한 자동 레이블링 단계(S10)를 수행한다.
자동 레이블링 단계(S10)는 기 학습된 텍스트 검출 및 인식 모델을 이용해 정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열을 유추하여 문서 이미지에 대한 자동 레이블링을 수행한다. 문서 이미지에 대한 자동 레이블링 결과는 도 4의 (a)에 도시되어 있다.
문서 이미지에 대한 자동 레이블링이 완료되면, 이어서 문서 이미지의 레이블링 장치는 자동 레이블링된 문서 이미지(제1 학습 데이터)에 대한 레이블 보정 단계(S20)를 수행한다.
레이블 보정 단계(S20)는 자동 레이블링된 문서 이미지에 대해 선택적 레이블링을 수행하여 레이블이 보정된 문서 이미지(제2 학습 데이터)를 생성한다. 선택적 레이블링은 사용자가 단어 박스 작성 툴을 이용하여 수행할 수 있다. 선택적 레이블링은 단어의 박스 모양을 변경하여 글자 묶음의 형태를 변경하는 것을 포함한다.
문서 이미지의 레이블링 장치는 사용자의 선택적 레이블링을 보조하기 위해 자동 레이블링된 이미지 문서에 ROI(Region Of Interest)를 표시할 수 있다.
도 3을 참조하면, 문서 이미지에 대한 자동 레이블링이 수행되면(S100), 문서 이미지의 레이블링 장치는 자동 레이블링된 문서 이미지 상에서 한 글자 단어 박스가 연속해서 배치되어 있는지 확인한다(S110). 또한 문서 이미지의 레이블링 장치는 자동 레이블링된 문서 이미지 상에서 단어 박스 부근에 특수 문자(예를 들어, #, * 등)가 위치해 있는지 확인한다(S120).
이와 같이 단계(S110~S120)에서 한 글자 단어 박스의 연속 배치 또는 단어 박스 부근의 특수 문자가 검출되면, 문서 이미지의 레이블링 장치는 자동 레이를링된 문서 이미지 상에서 해당 부분에 선택적 라벨링 영역을 표시한다(S140).
사용자는 문서 이미지 상의 선택적 레이블링 영역이 표시된 부분을 확인하여 레이블 보정을 수행할 수 있다.
단계(S110~S120)에서 해당하는 사항이 검출되지 않으면, 문서 이미지의 레이블링 장치는 텍스트 검출 및 인식 모델에서 생성된 문서 이미지를 바로 출력하게 된다.
도 4는 본 발명에 따른 선택적 레이블링의 예를 나타낸 것이다.
도 4를 참조하면, (a)는 기존 학습 모델을 이용하여 얻은 자동 레이블링(Auto-Labeling) 결과를 나타낸 것으로, 띄어쓰기 단위로 단어를 구분하고 있음을 알 수 있다.
'통보유예'라는 단어를 보면 특수문자(*)가 단어 박스(1)에 포함되어 있지 않음을 확인할 수 있다. 또한, '유예기간' 및 '유예사유'이라는 단어에서 각 글자 간의 간격이 넓어서 각 글자마다 다른 단어 박스(2, 3)로 구분되어 있음을 확인할 수 있다.
만약 새로 학습 하고자 하는 텍스트 검출 및 인식 모델이 '유예기간' 및 '유예사유'라는 단어를 글자 간의 간격을 따지지 않고 하나로 묶어서 구분하기를 원한다면, 도 4의 (b)와 같이 '유예기간' 및 '유예사유'에 대해 두 개의 단어 박스(5, 6)를 만들어서 선택적 레이블링을 수행할 수 있다.
이러한 선택적 레이블링이 적용된 문서 이미지로 학습을 하게 되면, 학습 결과를 통해서 얻어지는 단어 검출 결과는 '유예기간' 및 '유예사유'를 띄어쓰기가 아니라 의미 단위로 구분해서 단어 박스를 검출할 수 있게 된다.
또한, '통보유예'라는 단어의 경우 특수문자(*)도 함께 포함되어 단어 박스를 검출하길 원한다면 선택적 레이블링을 통해서 해당 의도를 적용시킨 학습 데이터를 생성할 수 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
10: 학습 모델부
20: ROI 출력부
30: 레이블 보정부
30: 레이블 보정부
Claims (8)
- 컴퓨팅 장치에서 수행되는 문서 이미지의 레이블링 방법에 있어서,
기 학습된 텍스트 검출 및 인식 모델을 이용해 정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열을 유추하여 자동 레이블링된 제1 학습 데이터를 생성하는 단계와,
상기 제1 학습 데이터에 대한 선택적 레이블링을 수행하여 제2 학습 데이터를 생성하는 단계를 포함하는 방법. - 제1항에 있어서,
상기 선택적 레이블링은 단어 박스의 모양을 변경하여 글자 묶음의 형태를 변경하는 것을 특징으로 하는 방법. - 제1항에 있어서,
상기 자동 레이블링된 제1 학습 데이터에서 한 글자 단어 박스가 연속 배치되어 있거나 단어 박스 부근에 특수 문자가 위치한 경우 상기 제1 학습 데이터에 해당 부분의 선택적 레이블링 영역을 표시하는 단계를 더 포함하는 것을 특징으로 하는 방법. - 정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열을 유추하여 자동 레이블링된 제1 학습 데이터를 생성하는 학습 모델부와,
상기 학습 모델부에서 생성한 제1 학습 데이터에 대한 선택적 레이블링을 수행하여 제2 학습 데이터를 생성하는 레이블 보정부를 포함하는 문서 이미지의 레이블링 장치. - 제4항에 있어서,
상기 학습 모델부에서 생성한 제1 학습 데이터에 선택적 레이블링 영역을 표시하는 ROI 출력부를 더 포함하는 것을 특징으로 하는 문서 이미지의 레이블링 장치. - 제5항에 있어서,
상기 ROI 출력부는 상기 제1 학습 데이터에서 연속 배치된 복수의 한 글자 단어 박스 또는 단어 박스 부근에 위치하는 특수 문자를 검출한 경우 상기 제1 학습 데이터에 해당 부분의 선택적 레이블링 영역을 표시하는 것을 특징으로 하는 문서 이미지의 레이블링 장치. - 제6항에 있어서,
상기 레이블 보정부는 글자 묶음의 형태를 변경하기 위한 단어 박스 작성 툴인 것을 특징으로 하는 문서 이미지의 레이블링 장치. - 컴퓨팅 장치에서 수행되는 문서 이미지의 레이블링 방법에 있어서,
정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열을 유추하여 자동 레이블링된 문서 이미지를 생성하는 단계와,
상기 자동 레이블링된 문서 이미지에서 레이블링 보정이 가능한 부분에 선택적 레이블링 영역을 표시하는 단계와,
상기 자동 레이블링된 문서 이미지에 대한 선택적 레이블링을 수행하여 텍스트 검출 및 인식 모델에 사용되는 학습 데이터를 생성하는 단계를 포함하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220043095A KR20230143885A (ko) | 2022-04-06 | 2022-04-06 | 텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220043095A KR20230143885A (ko) | 2022-04-06 | 2022-04-06 | 텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230143885A true KR20230143885A (ko) | 2023-10-13 |
Family
ID=88289930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220043095A KR20230143885A (ko) | 2022-04-06 | 2022-04-06 | 텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20230143885A (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050072699A (ko) | 2004-01-06 | 2005-07-12 | 마이크로소프트 코포레이션 | 위치적으로 인코딩된 문서 이미지 분석 및 레이블링 |
-
2022
- 2022-04-06 KR KR1020220043095A patent/KR20230143885A/ko not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050072699A (ko) | 2004-01-06 | 2005-07-12 | 마이크로소프트 코포레이션 | 위치적으로 인코딩된 문서 이미지 분석 및 레이블링 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Choi et al. | Visualizing for the non‐visual: Enabling the visually impaired to use visualization | |
JP6596511B2 (ja) | デジタルグラフィックノベルの自動翻訳 | |
CN109165384A (zh) | 一种命名实体识别方法及装置 | |
US6891971B2 (en) | Recognition process | |
Heather | Turnitoff: Identifying and fixing a hole in current plagiarism detection software | |
CN109685870B (zh) | 信息标注方法及装置、标注设备及存储介质 | |
US6866510B2 (en) | System and method for teaching second language writing skills using the linguistic discourse model | |
CN106778878B (zh) | 一种人物关系分类方法及装置 | |
CN112016314A (zh) | 一种基于bert模型的医疗文本理解方法及系统 | |
JPH10116340A (ja) | ビットマップ比較装置及び方法 | |
US20240086452A1 (en) | Tracking concepts within content in content management systems and adaptive learning systems | |
CN113505787A (zh) | 题目批改方法及系统、采用的电子设备及计算机可读介质 | |
CN109240931A (zh) | 问题反馈信息处理方法和装置 | |
Seuret et al. | ICDAR 2023 Competition on Detection and Recognition of Greek Letters on Papyri | |
KR101638511B1 (ko) | 온라인 학습 콘텐츠 저작을 위한 프로그램이 기록된 컴퓨터 판독 가능한 매체 및 온라인 학습 콘텐츠 저작 방법 | |
Tomovic et al. | Aligning document layouts extracted with different OCR engines with clustering approach | |
US9208381B1 (en) | Processing digital images including character recognition using ontological rules | |
KR20230143885A (ko) | 텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법 | |
JP2020115175A (ja) | 情報処理装置、情報処理方法及びプログラム | |
TW200811765A (en) | Method of learning to write Chinese characters | |
EP4016370A1 (en) | Generating visual feedback | |
CN113609420A (zh) | 基于人工智能的页面渲染方法、装置、电子设备及介质 | |
Krohn et al. | Construction of an inexpensive eye tracker for social inclusion and education | |
Bai et al. | Adaptive Correcting Strokes Extracted from Chinese Characters in Digital Ink of Non-native Writers Based on Comprehensive Visualization | |
Nazemi | Non-visual representation of complex documents for use in digital talking books |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |