KR102123611B1

KR102123611B1 - 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법

Info

Publication number: KR102123611B1
Application number: KR1020180147723A
Authority: KR
Inventors: 김형태; 김진영; 권오흥; 김주혜
Original assignee: 한국생산기술연구원
Priority date: 2018-11-26
Filing date: 2018-11-26
Publication date: 2020-06-29

Abstract

본 발명은 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법에 관한 것이다. 본 발명의 일 실시예에 따르면, (a) 고문서를 스캔한 스캔 이미지로부터 종이의 얼룩과 활자 각각을 분리하여 상기 얼룩을 기준으로 선택한 원본 이미지를 획득하는 단계, (b) 상기 원본 이미지에서 빈도수 및 인쇄 상태를 기준으로 글자를 골라 기준 이미지로 분리하는 단계, (c) 상기 기준 이미지를 상기 스캔 이미지 전체에 대하여 템플릿 매칭하여 유사 글자 이미지를 수집하는 단계, (d) 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증하는 단계, (e) 검증된 유사 글자 이미지를 합성하여 평균 글자 이미지를 획득하는 단계, (f) 딥러닝 엔진을 이용하여 상기 평균 글자 이미지와 검증된 유사 글자 이미지를 학습시키는 단계, (g) 상기 원본 이미지에 대한 평균 글자 이미지를 템플릿 매칭 기법을 적용하여 글자 이미지를 재검색하고 딥러닝을 적용한 글자 이미지를 검색하는 단계, 및 (h) 검색된 문자를 위치 정보와 결합하여 고문서를 복원하는 단계를 포함하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법을 제공한다.

Description

딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법{Restoration method of metal types using deep learning and spectral imaging}

본 발명은 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법에 관한 것이다.

일반적으로 현대의 문서의 경우 지질이 우수하고, 프린터의 발달로 글자의 자형과 정렬이 일정하여 광학적 문자 판독(Optical 이하, OCR)을 적용하기 용이하다. 또한 정밀한 스캐너의 보급으로 OCR의 성능도 높은 편이다. 현대의 OCR은 폰트를 기반으로 하여 스캔한 문서에서 가장 유사한 폰트와 글자를 매칭시키는 원리로 동작한다.

현재 대다수의 고문서는 백색광을 이용하여 스캔하는 방식을 사용하여 칼라 영상을 획득한다. 그리고, 스캔한 영상과 작업자가 직접 입력한 글자들을 대조하여 입력하여 디지털 아카이브를 구축 및 공개하고 있다.

이러한 디지털 아카이브 구축 작업에 OCR을 적용하여 문자를 추출하기도 한다. 그런데, 고문서의 경우 지질이 낮고, 낙서, 파손 및 얼룩등이 있어서 OCR에 방해되는 요소가 많다. 또한, 인쇄 상태가 낮고, 자형의 변화가 심하고 정렬도 대부분 틀어져 있으며, 폰트가 없는 경우가 많아 OCR의 인식률이 많이 낮은 편이다. 따라서, 현대의 고문서의 디지털화 작업은 OCR를 하더라도 작업자가 한 글자씩 대조하여 검토하고 입력하고 있다.

종래의 고문서 스캔 방식은 백색광 조명을 활용한 영상 획득으로 종이의 얼룩이나 손상이 영상에 그대로 나타나는 단점이 있다. 따라서, 영상을 활용하려면 작업자가 직접 영상을 보정하여야 한다. 그러나, 고문서의 디지털화 작업은 적게는 수백장, 많게는 수만장의 영상 보정을 작업해야 하므로, 인간이 개입하여 작업하는 것은 기준이 변할 위험성과 주관의 개입 가능성이 높아 바람직하지 못하다.

한국공개특허공보 제10-2003-0018519호

본 발명은 모노크롬 카메라와 칼라조명을 활용하여 각 칼라 별로 고문서 영상을 획득하고, 각 칼라별 얼룩이나 손상이 적은 영상을 선택하여 템플릿 매칭과 딥 러닝으로 글자를 검색함으로써 활자 분석 복원 및 폰트를 얻을 수 있는 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법을 제공하는 것이다.

본 발명의 일 실시예에 따르면, (a) 고문서를 스캔한 스캔 이미지로부터 종이의 얼룩과 활자 각각을 분리하여 상기 얼룩을 기준으로 선택한 원본 이미지를 획득하는 단계, (b) 상기 원본 이미지에서 빈도수 및 인쇄 상태를 기준으로 글자를 골라 기준 이미지로 분리하는 단계, (c) 상기 기준 이미지를 상기 스캔 이미지 전체에 대하여 템플릿 매칭하여 유사 글자 이미지를 수집하는 단계, (d) 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증하는 단계, (e) 검증된 유사 글자 이미지를 합성하여 평균 글자 이미지를 획득하는 단계, (f) 딥러닝 엔진을 이용하여 상기 평균 글자 이미지와 검증된 유사 글자 이미지를 학습시키는 단계, (g) 상기 원본 이미지에 대한 평균 글자 이미지를 템플릿 매칭 기법을 적용하여 글자 이미지를 재검색하고 딥러닝을 적용한 글자 이미지를 검색하는 단계, 및 (h) 검색된 문자를 위치 정보와 결합하여 고문서를 복원하는 단계를 포함하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법을 제공한다.

또한, 상기 (a) 단계에서는, 스펙트랄 이미징 기법을 사용하여 여러 파장에서 얻어진 영상 중에 얼룩이 가장 적은 이미지를 원본 이미지로 선택할 수 있다.

또한, 상기 (a) 단계는, 모노크롬 카메라와 칼라조명을 활용하여 각 칼라 별로 스캔 이미지를 획득하는 단계, 상기 스캔 이미지에서 각도를 보정한 다음 문자열 부분에 관심영역(ROI)을 설정하는 단계, 복수의 스캔 이미지 중 얼룩과 손상이 가장 적은 것을 선택하고, 스캔 이미지에서 밝은 부분을 최대값, 어두운 부분을 최소값으로 설정하여 2진화된 이미지를 획득하는 단계를 포함할 수 있다.

또한, 상기 2진화된 이미지에서 특정 글자를 선정하고 인쇄 상태가 좋은 글자의 이미지를 기준 이미지로 선택할 수 있다.

또한, 상기 (c) 단계에서는, 복수의 2진화된 이미지에서 기준 이미지를 템플릿 매칭으로 검색할 수 있다.

또한, 상기 (e) 단계에서는 상기 기준 이미지의 글자의 중심과, 상기 유사 글자 이미지의 글자의 중심을 구하고, 상기 기준 이미지의 글자의 중심에 상기 유사 글자 이미지의 글자의 중심을 더할 수 있다.

또한, 상기 (f) 단계에서는 상기 평균 글자 이미지를 포함하여 복수의 템플릿 이미지로 구성된 학습 세트를 제작하여 딥러닝 알고리즘을 학습할 수 있다.

또한, 상기 (g) 단계는 상기 (d) ~ (g) 과정을 새로운 글자가 추가되지 않을 때까지 반복하는 단계, 및 여러 문자에 대하여 상기 (b) ~ (h)의 과정을 반복하는 단계를 포함할 수 있다.

본 발명은 모노크롬 카메라와 칼라조명을 활용하여 각 칼라 별로 고문서 영상을 획득하고, 각 칼라별 얼룩이나 손상이 적은 영상을 선택하여 템플릿 매칭과 딥 러닝으로 글자를 검색함으로써 활자 분석 복원 및 폰트를 얻을 수 있다.

본 발명의 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않는 또 다른 효과는 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.

도 1은 본 발명의 일 실시예에 따른 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법의 구체적인 순서를 나타내는 도면이다.
도 2는 도 1에 도시된 (a) 단계를 설명하기 위한 도면이다. (주자대전, 을해자 샘플)
도 3은 도 1에 도시된 (c) 단계를 설명하기 위한 도면이다.
도 4는 템플릿 매칭 검색 결과를 나타내는 도면이다.
도 5는 유사 글자 이미지의 수집 결과를 나타내는 도면이다.
도 6 및 도 7은 도 1에 도시된 (e) 단계를 설명하기 위한 도면이다.
도 8은 이미지 중심을 맞춘 상태에서 평균을 구하는 것을 설명하기 위한 도면이다.
도 9는 평균 글자 이미지를 나타내는 도면이다.
도 10은 도 1에 도시된 (f) 단계를 설명하기 위한 도면이다.
도 11은 도 1에 도시된 (h) 단계를 설명하기 위한 도면이다.

이하에서는, 본 발명의 바람직한 실시예에 기초하여 본 발명을 보다 구체적으로 설명한다. 그러나, 하기 실시예는 본 발명의 이해를 돕기 위한 일 예에 불과한 것으로 이에 의해 본 발명의 권리범위가 축소되거나 한정되는 것은 아니다.

도 1은 본 발명의 일 실시예에 따른 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법의 구체적인 순서를 나타내는 도면이다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법은 (a) 고문서를 스캔한 스캔 이미지로부터 종이의 얼룩과 활자 각각을 분리하여 상기 얼룩을 기준으로 선택한 원본 이미지를 획득하는 단계, (b) 상기 원본 이미지에서 빈도수 및 인쇄 상태를 기준으로 글자를 골라 기준 이미지로 분리하는 단계, (c) 상기 기준 이미지를 상기 스캔 이미지 전체에 대하여 템플릿 매칭하여 유사 글자 이미지를 수집하는 단계, (d) 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증하는 단계, (e) 검증된 유사 글자 이미지를 합성하여 평균 글자 이미지를 획득하는 단계, (f) 딥러닝 엔진을 이용하여 상기 평균 글자 이미지와 검증된 유사 글자 이미지를 학습시키는 단계, (g) 상기 원본 이미지에 대한 평균 글자 이미지를 템플릿 매칭 기법을 적용하여 글자 이미지를 재검색하고 딥러닝을 적용한 글자 이미지를 검색하는 단계, 및 (h) 검색된 문자를 위치 정보와 결합하여 고문서를 복원하는 단계를 포함할 수 있다.

상기 (a) 단계에서는, 스펙트랄 이미징 기법을 사용하여 여러 파장에서 얻어진 영상 중에 얼룩이 가장 적은 이미지를 원본 이미지로 선택할 수 있다.

구체적으로, 상기 (a) 단계는, 도 2를 참조하여 모노크롬 카메라와 칼라조명(칼라광원)을 활용하여 각 칼라 별로 스캔 이미지를 획득하는 단계, 상기 스캔 이미지에서 각도를 보정한 다음 문자열 부분에 관심영역(ROI)을 설정하는 단계, 복수의 스캔 이미지 중 얼룩과 손상이 가장 적은 것을 선택하고, 스캔 이미지에서 밝은 부분을 최대값(Imax), 어두운 부분을 최소값(Imin)으로 설정하여 2진화된 이미지를 획득하는 단계를 포함할 수 있다. 여기서, 스펙트랄 이미징 기법은 카메라, 모노크롬 카메라, 칼라광원, 렌즈, PC(제어부)를 포함하는 장치를 이용하여 수행할 수 있다.

또한, 2진화된 이미지를 획득하는 예시를 하기 수학식 1을 이용하여 설명한다.

,

단

수학식 1에서 τ₁은 임계값(Threshold) 혹은 설정값으로서 수학식 1의 내용은 픽셀의 그레이 값이 설정값 이상이 되면 최대값으로 바꾸고, 설정값 이하면 최소값으로 바꾸는 것을 의미할 수 있다. 여기서, 설정값은 상수로 줄 수도 있으나, 고문서의 각 페이지의 상태에 따라서 스캔 상태의 명암이 달라지므로 최대값와 최소값 사이의 어느 값으로 결정할 수 있다. 수학식 1에서 0≤α≤1의 범위를 정하면 되므로 τ는 최대값과 최소값 사이의 어느 값으로 결정될 수 있다.

수학식 1에서 일반적으로 최대값과 최소값 사이의 중간 정도인 α=0.3 ~ 0.7 정도가 바람직하다.

다음, (b) 단계에서는, 2진화된 이미지에서 특정 글자를 선정하고 인쇄 상태가 좋은 글자의 이미지를 기준 이미지로 선택할 수 있다. 예를 들면, 2진화된 이미지에서 빈도수가 높은 글자를 선정하여 기준 이미지로 선택할 수 있다. 검색 초반에서는 之, 以, 而를 선택하는 것이 바람직하다.

다음, (c) 단계에서는 도 3을 참조하여 복수의 2진화된 이미지에서 기준 이미지를 테플릿 매칭으로 검색하고, 유사 이미지를 수집할 수 있다.

여기서, 템플릿 매칭은 바이너리(binary) 이미지 전체에 대하여 하기 수학식들 중 하나 또는 그 이상을 결합하여 적용할 수 있다.

T(x', y'): 템플릿 이미지 - 도 3의 한자 之

I(x, y): 바이너리 이미지

- 유의차(square difference)

- 정규유의차(normalized square difference)

- 상관(correlation)

- 정규상관(normalized correlation)

- 계수(coefficient)

- 정규계수(normalized coefficient)

R(x,y)가 Rmax에 가까울수록 일치할 확률이 높으므로 정규화하여 1에 가까운 경우 일치한다고 결정할 수 있다. 일치에 대한 채택값을 γ로 설정하고, γ이상을 일치점으로 결정할 수 있다. 한편, γ는 0≤γ≤1의 범위로 한정될 수 있으며, 일치율을 1.0에 가깝게 하면 검색 결과가 적어지고, 너무 낮추면 기준 글자와 다른 글자가 검색되므로 일반적으로 γ =0.7~0.9 정도가 바람직하다.

상기의 결과를 원본 칼라에 표시하면 도 4와 같이 나타날 수 있다.

(c) 단계에서 검색된 유사 글자 이미지를 복사하여 모아 놓으면 도 5와 같이 나타날 수 있다.

다음, (d) 단계에서는 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증할 수 있다.

예를 들면, 한자 大를 검색했는데, 한자 犬이나 한자 太와 같이 관련없는 글자 이미지가 섞이는 경우가 많기 때문에 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증할 수 있다.

다음, (e) 단계에서는 도 6과 같이 검색된 이미지의 중심을 구할 수 있다.

구체적으로, (e) 단계에서는 도 7과 하기 수학식 10을 참조하여 기준 글자의 중심과 검색된 글자의 중심을 구하고, 기준 글자의 중심에 검색된 글자의 중심을 더할 수 있다.

상기 수학식 10을 참조하여, 검색된 글자에서 글자 부분은 검은색으로 표시되므로, 검은색 부분만의 좌표 평균을 구함으로써 글자의 중심을 구할 수 있다. 검은색 부분을 결정하는 설정값 τ₂는 I_max와 I_min의 중간에서 설정하므로, 일반적으로 η=0.5가 바람직하다.

그리고, 도 8과 하기 수학식 11을 참조하여 검색된 이미지 중심을 맞춘 상태에서 검색된 이미지들의 평균 이미지를 구할 수 있다.

평균 이미지에서 픽셀 값은 다양한 그레이 레벨(grey level)을 가지므로, 평균 글자 이미지로 확정하기 위하여 농도가 낮은 부분은 제거하고, 농도가 높은 부분만 글자의 픽셀로 확정해야 한다. 이때의 기준값을 τ₃로 설정할 수 있다. 그러면, 하기 수학식 12를 이용하여 설정값을 기준으로 바이너리 이미지를 구하여 도 9와 같은 평균 글자 이미지를 획득할 수 있다.

글자 부분을 결정하는 설정값 τ₃는 I_max와 I_min의 중간에서 설정하므로, 일반적으로 κ=0.5가 바람직하다.

다음, 도 10을 참조하여 (f) 단계에서는 기준 글자와 평균 글자 이미지를 포함하여 복수의 T(x', y')로 구성된 학습 세트를 제작하여 인공지능 알고리즘을 구성할 수 있고, 딥러닝(deep learning) 알고리즘으로 학습시킬 수 있다. 그러면 딥러닝 알고리즘 내의 계수가 변화하여 분류할 수 잇는 글자의 종류가 증가할 수 있다. 알고리즘의 반복에 따라 학습 세트가 추가되거나 탈락되어 딥러닝의 학습도 반복될수록 인공지능이 분류할 수 있는 글자의 종류는 계속 증가할 수 있다.

다음, (g) 단계는 (d) ~ (g)의 과정을 새로운 글자가 추가되지 않을 때까지 반복하는 단계, 및 여러 문자에 대하여 (b) ~ (h)의 과정을 반복하는 단계를 포함할 수 있다.

여기서는, (d) 단계의 템플릿 매칭 단계서부터 이미지 재검색을 수행할 수 있다. 이때, 새로 발견되는 글자가 없으면 재검색을 중지하고, 알고리즘을 종료할 수 있다. 이러한 반복 과정을 1번 추가 수행할 경우 글자 인식률이 약 2% 정도 향상될 수 있다.

다음, 도 11을 참조하여 (h) 단계에서는 검색 세트가 검출된 페이지와 위치를 알고 있으므로, 확정된 기준 글자와 평균 글자 이미지를 대입하면 표준 활자 책으로 고문서를 복원할 수 있다.

이상에서 본 발명에 대한 기술 사상을 첨부 도면과 함께 서술하였지만, 이는 본 발명의 바람직한 실시예를 예시적으로 설명한 것이지 본 발명을 한정하는 것은 아니다. 또한, 이 기술 분야의 통상의 지식을 가진 자라면 누구나 본 발명의 기술 사상의 범주를 이탈하지 않는 범위 내에서 다양한 변형 및 모방이 가능함은 명백한 사실이다.

Claims

(a) 고문서를 스캔한 스캔 이미지로부터 종이의 얼룩과 활자 각각을 분리하고, 스펙트랄 이미징 기법을 사용하여 여러 파장에서 얻어진 영상 중에 얼룩이 가장 적은 이미지를 원본 이미지로 획득하는 단계;
(b) 상기 원본 이미지에서 빈도수 및 인쇄 상태를 기준으로 글자를 골라 기준 이미지로 분리하는 단계;
(c) 상기 기준 이미지를 상기 스캔 이미지 전체에 대하여 템플릿 매칭하여 유사 글자 이미지를 수집하는 단계;
(d) 수집된 유사 글자 이미지들 중 관련없는 글자 이미지를 폐기하여 유사 글자 이미지를 검증하는 단계;
(e) 검증된 유사 글자 이미지를 합성하여 평균 글자 이미지를 획득하는 단계;
(f) 딥러닝 엔진을 이용하여 상기 평균 글자 이미지와 검증된 유사 글자 이미지를 학습시키는 단계;
(g) 상기 원본 이미지에 대한 평균 글자 이미지를 템플릿 매칭 기법을 적용하여 글자 이미지를 재검색하고 딥러닝을 적용한 글자 이미지를 검색하는 단계; 및
(h) 검색된 문자를 위치 정보와 결합하여 고문서를 복원하는 단계;를 포함하며,
상기 (a) 단계는,
모노크롬 카메라와 칼라조명을 활용하여 각 칼라 별로 스캔 이미지를 획득하는 단계; 상기 스캔 이미지에서 각도를 보정한 다음 문자열 부분에 관심영역(ROI)을 설정하는 단계; 및 복수의 스캔 이미지 중 얼룩과 손상이 가장 적은 것을 선택하고, 스캔 이미지에서 밝은 부분을 최대값, 어두운 부분을 최소값으로 설정하여 2진화된 이미지를 획득하는 단계;를 포함하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
삭제
삭제
제1항에 있어서,
상기 (b) 단계에서는,
상기 2진화된 이미지에서 특정 글자를 선정하고 인쇄 상태가 좋은 글자의 이미지를 기준 이미지로 선택하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
제1항에 있어서,
상기 (c) 단계에서는,
상기 2진화된 이미지에서 기준 이미지를 템플릿 매칭으로 검색하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
제1항에 있어서,
상기 (e) 단계에서는 상기 기준 이미지의 글자의 중심과, 상기 검증된 유사 글자 이미지의 글자의 중심을 구하고, 상기 기준 이미지의 글자의 중심에 상기 검증된 유사 글자 이미지의 글자의 중심을 더하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
제1항에 있어서,
상기 (f) 단계에서는 상기 평균 글자 이미지를 포함하여 복수의 템플릿 이미지로 구성된 학습 세트를 제작하여 딥러닝 알고리즘을 학습하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.
제1항에 있어서,
상기 (g) 단계는 상기 (d) ~ (g) 과정을 새로운 글자가 추가되지 않을 때까지 반복하는 단계, 및 여러 문자에 대하여 상기 (b) ~ (h)의 과정을 반복하는 단계를 포함하는, 딥 러닝과 스펙트랄 이미지를 이용한 활자 인쇄물 복원 방법.