KR102123611B1 - 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법 - Google Patents

딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법 Download PDF

Info

Publication number
KR102123611B1
KR102123611B1 KR1020180147723A KR20180147723A KR102123611B1 KR 102123611 B1 KR102123611 B1 KR 102123611B1 KR 1020180147723 A KR1020180147723 A KR 1020180147723A KR 20180147723 A KR20180147723 A KR 20180147723A KR 102123611 B1 KR102123611 B1 KR 102123611B1
Authority
KR
South Korea
Prior art keywords
image
images
character
deep learning
letter
Prior art date
Application number
KR1020180147723A
Other languages
English (en)
Inventor
김형태
김진영
권오흥
김주혜
Original Assignee
한국생산기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생산기술연구원 filed Critical 한국생산기술연구원
Priority to KR1020180147723A priority Critical patent/KR102123611B1/ko
Application granted granted Critical
Publication of KR102123611B1 publication Critical patent/KR102123611B1/ko

Links

Images

Classifications

    • G06K9/00442
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06K9/20
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/001
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

본 발명은 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법에 관한 것이다. 본 발명의 일 실시예에 따르면, (a) 고문서를 스캔한 스캔 이미지로부터 종이의 얼룩과 활자 각각을 분리하여 상기 얼룩을 기준으로 선택한 원본 이미지를 획득하는 단계, (b) 상기 원본 이미지에서 빈도수 및 인쇄 상태를 기준으로 글자를 골라 기준 이미지로 분리하는 단계, (c) 상기 기준 이미지를 상기 스캔 이미지 전체에 대하여 템플릿 매칭하여 유사 글자 이미지를 수집하는 단계, (d) 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증하는 단계, (e) 검증된 유사 글자 이미지를 합성하여 평균 글자 이미지를 획득하는 단계, (f) 딥러닝 엔진을 이용하여 상기 평균 글자 이미지와 검증된 유사 글자 이미지를 학습시키는 단계, (g) 상기 원본 이미지에 대한 평균 글자 이미지를 템플릿 매칭 기법을 적용하여 글자 이미지를 재검색하고 딥러닝을 적용한 글자 이미지를 검색하는 단계, 및 (h) 검색된 문자를 위치 정보와 결합하여 고문서를 복원하는 단계를 포함하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법을 제공한다.

Description

딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법{Restoration method of metal types using deep learning and spectral imaging}
본 발명은 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법에 관한 것이다.
일반적으로 현대의 문서의 경우 지질이 우수하고, 프린터의 발달로 글자의 자형과 정렬이 일정하여 광학적 문자 판독(Optical 이하, OCR)을 적용하기 용이하다. 또한 정밀한 스캐너의 보급으로 OCR의 성능도 높은 편이다. 현대의 OCR은 폰트를 기반으로 하여 스캔한 문서에서 가장 유사한 폰트와 글자를 매칭시키는 원리로 동작한다.
현재 대다수의 고문서는 백색광을 이용하여 스캔하는 방식을 사용하여 칼라 영상을 획득한다. 그리고, 스캔한 영상과 작업자가 직접 입력한 글자들을 대조하여 입력하여 디지털 아카이브를 구축 및 공개하고 있다.
이러한 디지털 아카이브 구축 작업에 OCR을 적용하여 문자를 추출하기도 한다. 그런데, 고문서의 경우 지질이 낮고, 낙서, 파손 및 얼룩등이 있어서 OCR에 방해되는 요소가 많다. 또한, 인쇄 상태가 낮고, 자형의 변화가 심하고 정렬도 대부분 틀어져 있으며, 폰트가 없는 경우가 많아 OCR의 인식률이 많이 낮은 편이다. 따라서, 현대의 고문서의 디지털화 작업은 OCR를 하더라도 작업자가 한 글자씩 대조하여 검토하고 입력하고 있다.
종래의 고문서 스캔 방식은 백색광 조명을 활용한 영상 획득으로 종이의 얼룩이나 손상이 영상에 그대로 나타나는 단점이 있다. 따라서, 영상을 활용하려면 작업자가 직접 영상을 보정하여야 한다. 그러나, 고문서의 디지털화 작업은 적게는 수백장, 많게는 수만장의 영상 보정을 작업해야 하므로, 인간이 개입하여 작업하는 것은 기준이 변할 위험성과 주관의 개입 가능성이 높아 바람직하지 못하다.
한국공개특허공보 제10-2003-0018519호
본 발명은 모노크롬 카메라와 칼라조명을 활용하여 각 칼라 별로 고문서 영상을 획득하고, 각 칼라별 얼룩이나 손상이 적은 영상을 선택하여 템플릿 매칭과 딥 러닝으로 글자를 검색함으로써 활자 분석 복원 및 폰트를 얻을 수 있는 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법을 제공하는 것이다.
본 발명의 일 실시예에 따르면, (a) 고문서를 스캔한 스캔 이미지로부터 종이의 얼룩과 활자 각각을 분리하여 상기 얼룩을 기준으로 선택한 원본 이미지를 획득하는 단계, (b) 상기 원본 이미지에서 빈도수 및 인쇄 상태를 기준으로 글자를 골라 기준 이미지로 분리하는 단계, (c) 상기 기준 이미지를 상기 스캔 이미지 전체에 대하여 템플릿 매칭하여 유사 글자 이미지를 수집하는 단계, (d) 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증하는 단계, (e) 검증된 유사 글자 이미지를 합성하여 평균 글자 이미지를 획득하는 단계, (f) 딥러닝 엔진을 이용하여 상기 평균 글자 이미지와 검증된 유사 글자 이미지를 학습시키는 단계, (g) 상기 원본 이미지에 대한 평균 글자 이미지를 템플릿 매칭 기법을 적용하여 글자 이미지를 재검색하고 딥러닝을 적용한 글자 이미지를 검색하는 단계, 및 (h) 검색된 문자를 위치 정보와 결합하여 고문서를 복원하는 단계를 포함하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법을 제공한다.
또한, 상기 (a) 단계에서는, 스펙트랄 이미징 기법을 사용하여 여러 파장에서 얻어진 영상 중에 얼룩이 가장 적은 이미지를 원본 이미지로 선택할 수 있다.
또한, 상기 (a) 단계는, 모노크롬 카메라와 칼라조명을 활용하여 각 칼라 별로 스캔 이미지를 획득하는 단계, 상기 스캔 이미지에서 각도를 보정한 다음 문자열 부분에 관심영역(ROI)을 설정하는 단계, 복수의 스캔 이미지 중 얼룩과 손상이 가장 적은 것을 선택하고, 스캔 이미지에서 밝은 부분을 최대값, 어두운 부분을 최소값으로 설정하여 2진화된 이미지를 획득하는 단계를 포함할 수 있다.
또한, 상기 2진화된 이미지에서 특정 글자를 선정하고 인쇄 상태가 좋은 글자의 이미지를 기준 이미지로 선택할 수 있다.
또한, 상기 (c) 단계에서는, 복수의 2진화된 이미지에서 기준 이미지를 템플릿 매칭으로 검색할 수 있다.
또한, 상기 (e) 단계에서는 상기 기준 이미지의 글자의 중심과, 상기 유사 글자 이미지의 글자의 중심을 구하고, 상기 기준 이미지의 글자의 중심에 상기 유사 글자 이미지의 글자의 중심을 더할 수 있다.
또한, 상기 (f) 단계에서는 상기 평균 글자 이미지를 포함하여 복수의 템플릿 이미지로 구성된 학습 세트를 제작하여 딥러닝 알고리즘을 학습할 수 있다.
또한, 상기 (g) 단계는 상기 (d) ~ (g) 과정을 새로운 글자가 추가되지 않을 때까지 반복하는 단계, 및 여러 문자에 대하여 상기 (b) ~ (h)의 과정을 반복하는 단계를 포함할 수 있다.
본 발명은 모노크롬 카메라와 칼라조명을 활용하여 각 칼라 별로 고문서 영상을 획득하고, 각 칼라별 얼룩이나 손상이 적은 영상을 선택하여 템플릿 매칭과 딥 러닝으로 글자를 검색함으로써 활자 분석 복원 및 폰트를 얻을 수 있다.
본 발명의 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않는 또 다른 효과는 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법의 구체적인 순서를 나타내는 도면이다.
도 2는 도 1에 도시된 (a) 단계를 설명하기 위한 도면이다. (주자대전, 을해자 샘플)
도 3은 도 1에 도시된 (c) 단계를 설명하기 위한 도면이다.
도 4는 템플릿 매칭 검색 결과를 나타내는 도면이다.
도 5는 유사 글자 이미지의 수집 결과를 나타내는 도면이다.
도 6 및 도 7은 도 1에 도시된 (e) 단계를 설명하기 위한 도면이다.
도 8은 이미지 중심을 맞춘 상태에서 평균을 구하는 것을 설명하기 위한 도면이다.
도 9는 평균 글자 이미지를 나타내는 도면이다.
도 10은 도 1에 도시된 (f) 단계를 설명하기 위한 도면이다.
도 11은 도 1에 도시된 (h) 단계를 설명하기 위한 도면이다.
이하에서는, 본 발명의 바람직한 실시예에 기초하여 본 발명을 보다 구체적으로 설명한다. 그러나, 하기 실시예는 본 발명의 이해를 돕기 위한 일 예에 불과한 것으로 이에 의해 본 발명의 권리범위가 축소되거나 한정되는 것은 아니다.
도 1은 본 발명의 일 실시예에 따른 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법의 구체적인 순서를 나타내는 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법은 (a) 고문서를 스캔한 스캔 이미지로부터 종이의 얼룩과 활자 각각을 분리하여 상기 얼룩을 기준으로 선택한 원본 이미지를 획득하는 단계, (b) 상기 원본 이미지에서 빈도수 및 인쇄 상태를 기준으로 글자를 골라 기준 이미지로 분리하는 단계, (c) 상기 기준 이미지를 상기 스캔 이미지 전체에 대하여 템플릿 매칭하여 유사 글자 이미지를 수집하는 단계, (d) 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증하는 단계, (e) 검증된 유사 글자 이미지를 합성하여 평균 글자 이미지를 획득하는 단계, (f) 딥러닝 엔진을 이용하여 상기 평균 글자 이미지와 검증된 유사 글자 이미지를 학습시키는 단계, (g) 상기 원본 이미지에 대한 평균 글자 이미지를 템플릿 매칭 기법을 적용하여 글자 이미지를 재검색하고 딥러닝을 적용한 글자 이미지를 검색하는 단계, 및 (h) 검색된 문자를 위치 정보와 결합하여 고문서를 복원하는 단계를 포함할 수 있다.
상기 (a) 단계에서는, 스펙트랄 이미징 기법을 사용하여 여러 파장에서 얻어진 영상 중에 얼룩이 가장 적은 이미지를 원본 이미지로 선택할 수 있다.
구체적으로, 상기 (a) 단계는, 도 2를 참조하여 모노크롬 카메라와 칼라조명(칼라광원)을 활용하여 각 칼라 별로 스캔 이미지를 획득하는 단계, 상기 스캔 이미지에서 각도를 보정한 다음 문자열 부분에 관심영역(ROI)을 설정하는 단계, 복수의 스캔 이미지 중 얼룩과 손상이 가장 적은 것을 선택하고, 스캔 이미지에서 밝은 부분을 최대값(Imax), 어두운 부분을 최소값(Imin)으로 설정하여 2진화된 이미지를 획득하는 단계를 포함할 수 있다. 여기서, 스펙트랄 이미징 기법은 카메라, 모노크롬 카메라, 칼라광원, 렌즈, PC(제어부)를 포함하는 장치를 이용하여 수행할 수 있다.
또한, 2진화된 이미지를 획득하는 예시를 하기 수학식 1을 이용하여 설명한다.
Figure 112018117899514-pat00001
Figure 112018117899514-pat00002
,
Figure 112018117899514-pat00003
수학식 1에서 τ1은 임계값(Threshold) 혹은 설정값으로서 수학식 1의 내용은 픽셀의 그레이 값이 설정값 이상이 되면 최대값으로 바꾸고, 설정값 이하면 최소값으로 바꾸는 것을 의미할 수 있다. 여기서, 설정값은 상수로 줄 수도 있으나, 고문서의 각 페이지의 상태에 따라서 스캔 상태의 명암이 달라지므로 최대값와 최소값 사이의 어느 값으로 결정할 수 있다. 수학식 1에서 0≤α≤1의 범위를 정하면 되므로 τ는 최대값과 최소값 사이의 어느 값으로 결정될 수 있다.
수학식 1에서 일반적으로 최대값과 최소값 사이의 중간 정도인 α=0.3 ~ 0.7 정도가 바람직하다.
다음, (b) 단계에서는, 2진화된 이미지에서 특정 글자를 선정하고 인쇄 상태가 좋은 글자의 이미지를 기준 이미지로 선택할 수 있다. 예를 들면, 2진화된 이미지에서 빈도수가 높은 글자를 선정하여 기준 이미지로 선택할 수 있다. 검색 초반에서는 之, 以, 而를 선택하는 것이 바람직하다.
다음, (c) 단계에서는 도 3을 참조하여 복수의 2진화된 이미지에서 기준 이미지를 테플릿 매칭으로 검색하고, 유사 이미지를 수집할 수 있다.
여기서, 템플릿 매칭은 바이너리(binary) 이미지 전체에 대하여 하기 수학식들 중 하나 또는 그 이상을 결합하여 적용할 수 있다.
T(x', y'): 템플릿 이미지 - 도 3의 한자 之
I(x, y): 바이너리 이미지
- 유의차(square difference)
Figure 112018117899514-pat00004
- 정규유의차(normalized square difference)
Figure 112018117899514-pat00005
- 상관(correlation)
Figure 112018117899514-pat00006
- 정규상관(normalized correlation)
Figure 112018117899514-pat00007
- 계수(coefficient)
Figure 112018117899514-pat00008
Figure 112018117899514-pat00009
Figure 112018117899514-pat00010
- 정규계수(normalized coefficient)
R(x,y)가 Rmax에 가까울수록 일치할 확률이 높으므로 정규화하여 1에 가까운 경우 일치한다고 결정할 수 있다. 일치에 대한 채택값을 γ로 설정하고, γ이상을 일치점으로 결정할 수 있다. 한편, γ는 0≤γ≤1의 범위로 한정될 수 있으며, 일치율을 1.0에 가깝게 하면 검색 결과가 적어지고, 너무 낮추면 기준 글자와 다른 글자가 검색되므로 일반적으로 γ =0.7~0.9 정도가 바람직하다.
Figure 112018117899514-pat00011
상기의 결과를 원본 칼라에 표시하면 도 4와 같이 나타날 수 있다.
(c) 단계에서 검색된 유사 글자 이미지를 복사하여 모아 놓으면 도 5와 같이 나타날 수 있다.
다음, (d) 단계에서는 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증할 수 있다.
예를 들면, 한자 大를 검색했는데, 한자 犬이나 한자 太와 같이 관련없는 글자 이미지가 섞이는 경우가 많기 때문에 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증할 수 있다.
다음, (e) 단계에서는 도 6과 같이 검색된 이미지의 중심을 구할 수 있다.
구체적으로, (e) 단계에서는 도 7과 하기 수학식 10을 참조하여 기준 글자의 중심과 검색된 글자의 중심을 구하고, 기준 글자의 중심에 검색된 글자의 중심을 더할 수 있다.
Figure 112018117899514-pat00012
Figure 112018117899514-pat00013
상기 수학식 10을 참조하여, 검색된 글자에서 글자 부분은 검은색으로 표시되므로, 검은색 부분만의 좌표 평균을 구함으로써 글자의 중심을 구할 수 있다. 검은색 부분을 결정하는 설정값 τ2는 Imax와 Imin의 중간에서 설정하므로, 일반적으로 η=0.5가 바람직하다.
그리고, 도 8과 하기 수학식 11을 참조하여 검색된 이미지 중심을 맞춘 상태에서 검색된 이미지들의 평균 이미지를 구할 수 있다.
Figure 112018117899514-pat00014
평균 이미지에서 픽셀 값은 다양한 그레이 레벨(grey level)을 가지므로, 평균 글자 이미지로 확정하기 위하여 농도가 낮은 부분은 제거하고, 농도가 높은 부분만 글자의 픽셀로 확정해야 한다. 이때의 기준값을 τ3로 설정할 수 있다. 그러면, 하기 수학식 12를 이용하여 설정값을 기준으로 바이너리 이미지를 구하여 도 9와 같은 평균 글자 이미지를 획득할 수 있다.
Figure 112018117899514-pat00015
Figure 112018117899514-pat00016
글자 부분을 결정하는 설정값 τ3는 Imax와 Imin의 중간에서 설정하므로, 일반적으로 κ=0.5가 바람직하다.
다음, 도 10을 참조하여 (f) 단계에서는 기준 글자와 평균 글자 이미지를 포함하여 복수의 T(x', y')로 구성된 학습 세트를 제작하여 인공지능 알고리즘을 구성할 수 있고, 딥러닝(deep learning) 알고리즘으로 학습시킬 수 있다. 그러면 딥러닝 알고리즘 내의 계수가 변화하여 분류할 수 잇는 글자의 종류가 증가할 수 있다. 알고리즘의 반복에 따라 학습 세트가 추가되거나 탈락되어 딥러닝의 학습도 반복될수록 인공지능이 분류할 수 있는 글자의 종류는 계속 증가할 수 있다.
다음, (g) 단계는 (d) ~ (g)의 과정을 새로운 글자가 추가되지 않을 때까지 반복하는 단계, 및 여러 문자에 대하여 (b) ~ (h)의 과정을 반복하는 단계를 포함할 수 있다.
여기서는, (d) 단계의 템플릿 매칭 단계서부터 이미지 재검색을 수행할 수 있다. 이때, 새로 발견되는 글자가 없으면 재검색을 중지하고, 알고리즘을 종료할 수 있다. 이러한 반복 과정을 1번 추가 수행할 경우 글자 인식률이 약 2% 정도 향상될 수 있다.
다음, 도 11을 참조하여 (h) 단계에서는 검색 세트가 검출된 페이지와 위치를 알고 있으므로, 확정된 기준 글자와 평균 글자 이미지를 대입하면 표준 활자 책으로 고문서를 복원할 수 있다.
본 발명은 모노크롬 카메라와 칼라조명을 활용하여 각 칼라 별로 고문서 영상을 획득하고, 각 칼라별 얼룩이나 손상이 적은 영상을 선택하여 템플릿 매칭과 딥 러닝으로 글자를 검색함으로써 활자 분석 복원 및 폰트를 얻을 수 있다.
이상에서 본 발명에 대한 기술 사상을 첨부 도면과 함께 서술하였지만, 이는 본 발명의 바람직한 실시예를 예시적으로 설명한 것이지 본 발명을 한정하는 것은 아니다. 또한, 이 기술 분야의 통상의 지식을 가진 자라면 누구나 본 발명의 기술 사상의 범주를 이탈하지 않는 범위 내에서 다양한 변형 및 모방이 가능함은 명백한 사실이다.

Claims (8)

  1. (a) 고문서를 스캔한 스캔 이미지로부터 종이의 얼룩과 활자 각각을 분리하고, 스펙트랄 이미징 기법을 사용하여 여러 파장에서 얻어진 영상 중에 얼룩이 가장 적은 이미지를 원본 이미지로 획득하는 단계;
    (b) 상기 원본 이미지에서 빈도수 및 인쇄 상태를 기준으로 글자를 골라 기준 이미지로 분리하는 단계;
    (c) 상기 기준 이미지를 상기 스캔 이미지 전체에 대하여 템플릿 매칭하여 유사 글자 이미지를 수집하는 단계;
    (d) 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증하는 단계;
    (e) 검증된 유사 글자 이미지를 합성하여 평균 글자 이미지를 획득하는 단계;
    (f) 딥러닝 엔진을 이용하여 상기 평균 글자 이미지와 검증된 유사 글자 이미지를 학습시키는 단계;
    (g) 상기 원본 이미지에 대한 평균 글자 이미지를 템플릿 매칭 기법을 적용하여 글자 이미지를 재검색하고 딥러닝을 적용한 글자 이미지를 검색하는 단계; 및
    (h) 검색된 문자를 위치 정보와 결합하여 고문서를 복원하는 단계;를 포함하며,
    상기 (a) 단계는,
    모노크롬 카메라와 칼라조명을 활용하여 각 칼라 별로 스캔 이미지를 획득하는 단계; 상기 스캔 이미지에서 각도를 보정한 다음 문자열 부분에 관심영역(ROI)을 설정하는 단계; 및 복수의 스캔 이미지 중 얼룩과 손상이 가장 적은 것을 선택하고, 스캔 이미지에서 밝은 부분을 최대값, 어두운 부분을 최소값으로 설정하여 2진화된 이미지를 획득하는 단계;를 포함하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 (b) 단계에서는,
    상기 2진화된 이미지에서 특정 글자를 선정하고 인쇄 상태가 좋은 글자의 이미지를 기준 이미지로 선택하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
  5. 제1항에 있어서,
    상기 (c) 단계에서는,
    상기 2진화된 이미지에서 기준 이미지를 템플릿 매칭으로 검색하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
  6. 제1항에 있어서,
    상기 (e) 단계에서는 상기 기준 이미지의 글자의 중심과, 상기 검증된 유사 글자 이미지의 글자의 중심을 구하고, 상기 기준 이미지의 글자의 중심에 상기 검증된 유사 글자 이미지의 글자의 중심을 더하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
  7. 제1항에 있어서,
    상기 (f) 단계에서는 상기 평균 글자 이미지를 포함하여 복수의 템플릿 이미지로 구성된 학습 세트를 제작하여 딥러닝 알고리즘을 학습하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
  8. 제1항에 있어서,
    상기 (g) 단계는 상기 (d) ~ (g) 과정을 새로운 글자가 추가되지 않을 때까지 반복하는 단계, 및 여러 문자에 대하여 상기 (b) ~ (h)의 과정을 반복하는 단계를 포함하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
KR1020180147723A 2018-11-26 2018-11-26 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법 KR102123611B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180147723A KR102123611B1 (ko) 2018-11-26 2018-11-26 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180147723A KR102123611B1 (ko) 2018-11-26 2018-11-26 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법

Publications (1)

Publication Number Publication Date
KR102123611B1 true KR102123611B1 (ko) 2020-06-29

Family

ID=71400680

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180147723A KR102123611B1 (ko) 2018-11-26 2018-11-26 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법

Country Status (1)

Country Link
KR (1) KR102123611B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030018519A (ko) 2001-08-30 2003-03-06 서치캐스트 주식회사 이미지검색 기반 편리한 한자 입력교정 방법
KR20040038384A (ko) * 2002-10-31 2004-05-08 (주)동방에스앤씨 한자 영상 군집화를 통한 고문서 입력 및 교정 시스템
KR20170083805A (ko) * 2016-01-11 2017-07-19 경북대학교 산학협력단 초서체 또는 흘림체로 작성된 문자의 판별 방법 및 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030018519A (ko) 2001-08-30 2003-03-06 서치캐스트 주식회사 이미지검색 기반 편리한 한자 입력교정 방법
KR20040038384A (ko) * 2002-10-31 2004-05-08 (주)동방에스앤씨 한자 영상 군집화를 통한 고문서 입력 및 교정 시스템
KR20170083805A (ko) * 2016-01-11 2017-07-19 경북대학교 산학협력단 초서체 또는 흘림체로 작성된 문자의 판별 방법 및 시스템

Similar Documents

Publication Publication Date Title
JP2818448B2 (ja) 自動文書セグメンテーションのためのシステム及び方法
US6160913A (en) Method and apparatus for digital halftone dots detection and removal in business documents
JP4323328B2 (ja) 取り込み画像データから文字列を識別して抜出するシステムおよび方法
US6970606B2 (en) Automatic image quality evaluation and correction technique for digitized and thresholded document images
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
KR100523898B1 (ko) 이미지 프로세싱 방법 및 장치 및 기록 매체
CN108764074A (zh) 基于深度学习的主观题智能阅卷方法、系统及存储介质
US6757426B2 (en) System and method for image processing by automatic color dropout
KR101461233B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
KR20010113578A (ko) 코드인식을 위한 장치 및 그 방법
JP4745430B2 (ja) デジタル画像のテキストの位置決定を行う方法およびシステム
Attivissimo et al. An automatic reader of identity documents
RU2010125821A (ru) Способ обработки данных оптического распознования символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью
CN116071763B (zh) 基于文字识别的教辅图书智能校编系统
CA2144793C (en) Method of thresholding document images
KR100691651B1 (ko) 배경 모델과 문자 모델의 결합에 의해 구조화된 배경 상의 문자를 자동 인식하는 방법
CN111079511A (zh) 基于深度学习的文档自动归类及光学字符识别方法及系统
Ling et al. A model for automatic recognition of vertical texts in natural scene images
KR102123611B1 (ko) 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법
US7020328B2 (en) Electronic color dropout utilizing spatial context to enhance accuracy
US6704449B1 (en) Method of extracting text from graphical images
JPH11306348A (ja) 対象物検出装置及び対象物検出方法
JPH11306325A (ja) 対象物検出装置及び対象物検出方法
CN116310826A (zh) 一种基于图神经网络的高分遥感影像林地二级分类方法
KR20100011187A (ko) 문자 인식 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant