KR20030059499A - 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법 - Google Patents

수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법 Download PDF

Info

Publication number
KR20030059499A
KR20030059499A KR1020010088362A KR20010088362A KR20030059499A KR 20030059499 A KR20030059499 A KR 20030059499A KR 1020010088362 A KR1020010088362 A KR 1020010088362A KR 20010088362 A KR20010088362 A KR 20010088362A KR 20030059499 A KR20030059499 A KR 20030059499A
Authority
KR
South Korea
Prior art keywords
vertical line
image
information
vertical
character
Prior art date
Application number
KR1020010088362A
Other languages
English (en)
Other versions
KR100449486B1 (ko
Inventor
김두식
김호연
임길택
송재관
남윤석
김혜규
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR10-2001-0088362A priority Critical patent/KR100449486B1/ko
Priority to US10/329,392 priority patent/US20030123730A1/en
Publication of KR20030059499A publication Critical patent/KR20030059499A/ko
Application granted granted Critical
Publication of KR100449486B1 publication Critical patent/KR100449486B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

본 발명은 문서 인식 시스템에 있어서, 수직선 인접 그래프를 이용하여 영상 분할 위치를 추정하고 추정된 영상 분할 위치를 기준으로 문자열 영상으로부터 개별 문자 영상을 추출하는 문서 인식 시스템 및 방법에 관한 것이다. 즉, 본 발명은 문자 인식 시스템에서 입력되는 문자열 영상으로부터 개별 문자 영상을 추출하는 과정에서 2차원 비트맵형식으로 표현된 영상을 수직선 인접 그래프로 표현하여 영상 정보의 손실 없이 정보의 크기를 크게 줄일 수 있는 이점이 있다. 또한 수직선 인접 그래프로부터 문자분할 위치를 추정하는데 필요한 문자 분할 특성 정보를 쉽게 얻을 수 있고, 상기 추정된 문자 분할 위치를 기준으로 개별 문자 영상을 쉽고 빠르게 얻을 수 있어 문서 인식 시스템에서 문자 추출 시 문자 영상을 보다 빠르고 정확하게 추출할 수 있는 이점이 있으며, 수직선 인접 그래프로 표현된 영상으로부터 2차원 비트맵 영상을 빠르게 복원할 수 있는 이점이 있다.

Description

수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법{DOCUMENT RECOGNITION SYSTEM AND METHOD USING VERTICAL LINE ADJACENCY GRAPHS}
본 발명은 문서 인식 시스템에 관한 것으로, 특히 수직선 인접 그래프를 이용하여 영상 분할 위치를 추정하고 추정된 영상 분할 위치를 기준으로 문자열 영상으로부터 개별 문자 영상을 추출하는 문서 인식 시스템 및 방법에 관한 것이다.
통상적으로 문서 인식 시스템은 인쇄되거나 또는 손으로 쓴 문자들을 컴퓨터로 인식하여 일반적인 데이터 처리가 가능하도록 문자를 판독한 후, 판독된 문자에 대해 아스키(ASCII) 코드와 같이 데이터 처리가 가능한 해당 문자코드로 변환하는 장치를 의미하는 것으로,
근래에 들어서는 PDA 등과 같이 키보드 대신 핸드라이트 키 입력 인터페이스를 가지는 소형 문서 입력 장치에서 수기 입력된 문자를 인식하거나, 또한 팩시밀리 등에서 인쇄된 문서를 송신함에 있어 전송 데이터 량을 줄이기 위해 문자 인식을 통한 문자 코드만의 전송 등에 이용되는 등, 여러 가지 전자 장치에 있어 사용자 인터페이스 장치의 크기나, 전송 데이터 량을 현저히 줄일 수 있어 그 이용이급속히 확산되고 있는 추세에 있다.
이하 인쇄된 문서에 대한 상기 문서 인식 시스템에서의 문자 인식 동작을 잠깐 살펴보면, 문서 인식 시스템은 인식 대상 문서가 입력되는 경우, 먼저 인쇄된 문서 영상을 스캔 입력한 후, 스캔 입력된 문서 영상에서 문자 영역과 그림 영역을 분리하여 문자열을 추출하고 다시 상기 추출된 문자열에서 개별 문자를 추출하여 문자 인식을 수행하는 순으로 문서에 포함된 문자를 인식하게 된다.
이때 종래 문자 인식에 있어서 가장 핵심적인 기술은 상기 문자열에서 개별 문자를 추출해내는 과정으로 문자열에서 개별 문자를 추출해내기 위해서는 문자 분할 위치를 정확히 추정해내야 하였다. 이를 위해 종래에는 수직 투영 히스토그램 정보, 연결 요소 정보, 윤곽선 정보, 획 정보 등과 같은 여러 가지 정보를 이용한 다양한 문자 분할 위치 추정 방법들이 제안되고 있으나,
상기 수직 투영 히스토그램 정보를 이용한 문자 분할 방법은 문자간의 획들이 수직 방향으로 서로 겹치는 경우에는 문자 분할이 곤란한 문제점이 있으며, 상기 연결 요소 정보를 이용한 문자 분할 방법은 문자간의 획들이 서로 접촉되는 경우에 문자 분할이 곤란하며, 상기 윤곽선 정보를 이용한 문자 분할 방법은 문자열 영상으로부터 윤곽선 정보를 추출하는 과정과 각각의 문자 영상을 추출하는 과정에서 많은 처리 시간이 소요되는 문제점이 있었다. 또한 상기 획 정보를 이용한 문자 분할 방법은 획 정보를 추출하는 과정과 각각의 문자 영상을 추출하는 과정에서 많은 처리 시간이 소요될 뿐만 아니라 입력 영상으로부터 획의 두께에 대한 정보를 손실하는 문제점이 있었다.
한편, 상기와 같은 문서 인식 시스템으로는 1994년 10월에 출판된 "IEEE International Conference on Systems, Man, and Cybernetic"지 제1권 79∼84페이지에 개시된 "Noise removal from binary patterns by using adjacency graphs"와, 미국 특허 등록 번호 5,644,648호에 개시된 "Method and apparatus for connected and degraded text recognition"과, 1996년 12월에 출판된 "IEEE Transaction on Pattern Analysis and Machine Intelligence"지 제18권 1045∼1051페이지에 개시된 "A new methodology for gray-scale character segmentation and recognition" 등과 같은 문서 인식 시스템에 대한 기술이 개시되어 있다. 그러나 상기 "Noise removal from binary patterns by using adjacency graphs"에는 단지 문자 영상에서 선 인접 그래프를 이용하여 잡영을 제거하는 방법을 개시하고 있으며, 상기 "Method and apparatus for connected and degraded text recognition"은 수평선 인접 그래프를 이용한 문자 인식 방법에 관한 것으로, 문자 영상을 추출하는 것이 아니라 단어 인식을 위한 특징을 연속적으로 추출하는 것을 개시하고 있다. 또한 상기 "A new methodology for gray-scale character segmentation and recognition"에는 단지 그레이 영상을 대상으로 문자 영상의 수직 투영 히스토그램 정보로부터 문자 분할 위치 정보를 추정하는 방법이 개시되어 있다. 따라서 상기 선행 특허 또는 논문에서는 문자영상으로부터 개별 문자 영상을 추출하기가 곤란하거나 문자 영상의 추출을 위한 문자 분할 위치를 정확히 추정하기 어려운 점은 여전히 해결되지 않고 있었다.
따라서, 본 발명의 목적은 종래 문서 인식 시스템에서 개별 문자의 정확한 추출을 위해 입력 영상으로부터 부분 영상을 추출하는 영상 처리 과정에서 수직선 인접 그래프를 이용하여 영상 분할 위치를 추정하고 추정된 영상 분할 위치를 기준으로 부분 영상을 정확히 추출할 수 있도록 하는 문서 인식 시스템 및 방법을 제공함에 있다.
상술한 목적을 달성하기 위한 본 발명은, 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법에 있어서, 입력되는 문서 영상으로부터 문자 영역을 추출하는 문서 구조 분석부와; 상기 문자 영상 영역으로부터 문자열 영상을 추출하는 문자열 추출부와; 상기 추출된 문자열 영상을 수직선으로 변환하여 상기 수직선 표현된 문자열 영상으로부터 수직선 인접 그래프를 통한 개별 문자 영상을 추출해내는 문자 추출부와; 상기 개별 문자 영상으로부터 각 문자를 인식하고 해당 문자 코드로 변환하는 문자 인식부;를 포함하는 문서 인식 시스템을 구현하며,
(a)입력되는 문서 영상으로부터 문자 영상 영역을 추출하는 단계와; (b)상기 문자 영상 영역으로부터 문자열 영상을 추출하는 단계와; (c)상기 추출된 문자열 영상내 각 화소를 수직선 정보로 변환하고 상기 수직선 표현된 문자열 영상으로부터 수직선 인접 그래프를 통한 개별 문자 영상을 추출해내는 단계와; (d)상기 개별 문자 영상으로부터 해당 문자를 인식하는 단계;를 포함하여 진행하는 문서 인식 방법을 구현하는 것을 특징으로 한다.
도 1은 본 발명의 실시 예에 따른 문서 인식 시스템 블록 구성도.
도 2는 본 발명의 실시 예에 따른 문자 추출부의 블록 구성도.
도 3은 본 발명의 실시 예에 따른 수직선 인접 그래프 생성부의 블록 구성도.
도 4는 본 발명의 실시 예에 따른 수직선 집합 생성부의 블록 구성도.
도 5는 본 발명의 실시 예에 따른 영상 분할 위치 추정부의 블록 구성도.
도 6은 본 발명의 실시 예에 따라 수직선으로 표현된 문자열 영상의 일 예도.
도 7은 본 발명의 실시 예에 따른 수직선 기본 정보 테이블 예시도.
도 8은 본 발명의 실시 예에 따른 수직선 범위 표 정보 테이블 예시도.
도 9는 본 발명의 실시 예에 따른 수직선 연결 정보 테이블 예시도.
도 10은 본 발명의 실시 예에 따른 수직선 인접 그래프 정보 테이블 예시도.
도 11은 본 발명의 실시 예에 따른 수직선 유형 정보 테이블 예시도.
도 12는 본 발명의 실시 예에 따른 수직선 집합 구성 정보 테이블 예시도.
도 13은 본 발명의 실시 예에 따른 수직선 집합 유형 정보 테이블 예시도.
도 14는 본 발명의 실시 예에 따라 수직선 집합 병합 시 변경되는 수직선 집합 구성 정보 테이블 예시도.
도 15, 도 16, 도 17은 본 발명의 실시 예에 따른 수직선 집합 표시된 문자열 영상 예시도.
도 18은 본 발명의 실시 예에 따른 영상 분할 경로 그래프의 일 예도.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시 예의 동작을상세하게 설명한다.
도 1은 본 발명의 실시 예에 따른 문서 인식 시스템의 블록 구성도를 도시한 것이다. 이하 상기 도 1을 참조하여 본 발명의 실시 예에 따른 문서 인식 시스템에서의 문서 인식 동작을 설명하면,
먼저 문서 구조 분석부(104)는 스캐너부(102)를 통해 스캐닝 입력되는 문서 (100)영상으로부터 문자 영상 영역과 그림 영상 영역을 분리하여 문자 영상 영역을 추출한다. 문자열 추출부(106)는 상기 문서 구조 분석부(104)로부터 추출되는 문자열 영상 영역으로부터 문자열 영상을 추출한다. 문자 추출부(108)는 상기 문자열 추출부(106)로부터 추출되는 문자열 영상으로부터 개별 문자 영상을 추출해낸다.
이때 특히 상기 문자열 추출부(106)는 본 발명의 실시 예에 따라 상기 개별 문자 영상을 분리해냄에 있어서, 상기 문자열 영상의 각 화소를 수직 방향으로 탐색하면서 일정한 범위의 값을 가지며, 연속적으로 나타나는 화소를 연결하여 수직선으로 표현한 후, 수직선 인접 그래프를 이용하여 영상 분할 위치를 추정하고 추정된 영상 분할 위치를 기준으로 상기 문자열 영상으로부터 개별 문자 영상을 추출함으로써, 상기 문자열 영상으로부터 개별 문자 영상의 분할 위치를 보다 정확히 판별할 수 있도록 한다. 문자 인식부(110)는 상기 문자 추출부(108)로부터 인가되는 개별 문자 영상으로부터 각 문자를 인식하고 해당 문자 코드로 변환하여 호스트 컴퓨터로 출력시키게 된다.
도 2는 상기 도 1에 도시된 본 발명의 실시 예에 따른 문자 추출부(108)의 상세 블록 구성을 도시한 것으로, 상기 문자 추출부(108)는 상기 도 2에 도시된 바와 같이 수직선 인접 그래프 생성부(200), 수직선 집합 생성부(202), 영상분할 위치 추정부(204), 영상분할 경로 그래프 생성부(206), 개별 부분 영상 추출부(208) 등으로 구성된다. 이하 상기 도 2를 참조하여 수직선 인접 그래프를 이용한 개별 문자 영상 추출을 위한 문자 추출부(108)내 각 부에서의 동작을 상세히 설명하기로 한다.
먼저 상기 문자열 추출부(106)로부터 추출된 입력 문서의 문자열 영상은 상기 문자 추출부(108)내 수직선 인접 그래프 생성부(200)로 인가되게 되는데, 상기 수직선 인접 그래프 생성부(200)에서는 상기 문자열 추출부(108)로부터 인가되는 상기 입력 문자열 영상으로부터 수직선 인접 그래프 정보를 생성하여 수직선 집합 생성부(202)로 인가시키게 된다. 상기 수직선 인접 그래프라 함은 2차원의 비트맵으로 저장되는 영상에서 각 화소를 기본 단위로 영상을 표현하는 기존의 방식과는 달리 수직 방향으로 인접하는 흑 화소들의 집합을 나타내는 수직선을 기본 단위로 영상을 표현하고, 이러한 수직선들 상호간의 위치적인 연결 관계를 그래프 정보로 표현함으로써 간결한 영상 표현 효과와 용이한 영상 분석 효과를 가져오는 새로운 영상 표현 방법이다.
이어서, 수직선 집합 생성부(202)에서는 상기 수직선 인접 그래프 정보를 이용하여 상기 문자열 영상에 대한 수직선 집합 정보를 생성하여 이를 영상 분할 위치 추정부(204)로 인가시키게 되며, 영상 분할 위치 추정부(204)에서는 상기 수직선 집합 정보를 분석하여 상기 문자열 영상에서 개별 문자 영상 추출을 위한 영상 분할 위치를 추정하고, 상기 추정된 영상 분할 위치 정보를 영상 분할 경로 그래프생성부(206)로 인가시킨다. 그러면 영상 분할 경로 그래프 생성부(206)에서는 상기 영상 분할 위치 정보를 조합하여 도 18에 도시된 바와 같은 영상 분할 경로 그래프를 생성하여 개별 부분 영상 추출부(208)로 제공하게 된다. 이에 따라 개별 부분 영상 추출부(208)는 상기 영상 분할 경로 그래프의 각 경로에 대해 수직선으로 표현된 상기 문자열 영상으로부터 상기 도 18에 도시된 바와 같이 각 경로에 해당하는 개별 문자 영상을 추출하게 되는 것이다.
이하 상기 문자 추출부(108)내 수직선 인접 그래프 생성부(200)와 수직선 집합 생성부(202), 영상 분할 위치 추정부(204)의 상세 블록 구성을 도시한 도 3, 도 4, 도 5를 참조하여 상기 각 부에서의 동작을 보다 상세히 설명하기로 한다.
도 3은 상기 문자 추출부(108)내 상기 수직선 인접 그래프 생성부(200)의 상세 블록 구성을 도시한 것으로, 상기 수직선 인접 그래프 생성부(200)는 상기 도 3에서와 같이 다시 수직선 기본 정보 추출부(300)와 수직선 범위 표 구성부(302), 수직선 연결 정보 추출부(304)로 구성된다. 상기 수직선 기본 정보 추출부(300)는 도 6의 (a)에서와 같이 2차원 비트맵으로 표현된 문자열 영상을 도 6의 (b)에서와 같이 수직선 표현된 영상으로 변환시킨 후, 상기 수직선으로 표현된 영상으로부터 수직선 기본 정보를 추출한다. 상기 수직선 기본정보라 함은 상기 도 6의 (c)에서와 같이 수직선들로 표현된 영상의 각 수직선에 각 수직선을 식별할 수 있는 수직선 아이디(Identification: ID)를 설정하는 경우 각 수직선 ID들에 대한 상기 영상내 열(column) 위치 정보와 수직 상(top)/하단(bottom) 위치 정보를 의미하는 것으로, 도 7에는 상기 도 6의 (c)에 도시된 수직선 표현된 영상에 대한 수직선 기본정보를 표시한 수직선 기본 정보 테이블의 일 예를 도시하였다. 즉, 상기 도 6의 (c)에서 보여지는 바와 같이 각 수직선에 대한 수직선 ID를 설정한 경우 상기 수직선 ID에 대한 영상내 열(column) 위치 정보 및 수직 상(top)/하단(bottom) 위치 정보는 상기 도 7에서 보여지는 바와 같은 수직선 기본 정보 테이블에 저장되게 된다. 예를 들어 상기 도 6의 (c)에 도시된 수직선 ID "0"번에 해당하는 수직선은 문자 영상 중 1번째 열 위치에 2번째 수직 상/하단 위치에 존재함으로 상기 도 7에서와 같이 열 위치 정보 값은 "1"로 수직 상/하단 위치 정보 값은 각각 "2"와 "3"으로 기록 저장되게 된다. 이때 상기 수직선 ID "0"번에 해당하는 수직선의 수직 하단 위치 정보 값은 원래 수직 하단 위치 정보 값 "2"대신 "1"만큼 증가한 위치 정보 값인 "3"으로 저장되는 것을 알 수 있는데, 이는 상기 수직 상/하단 위치 정보 값의 차이를 통해 수직선 ID의 길이를 계산하는데 용이하도록 하기 위함이다. 이때 상기 수직선 기본 정보를 추출하는 과정은 RLE 영상을 생성하는 과정과 유사하나, 상기 RLE 영상 생성 과정에서와는 달리 수평 방향이 아닌 수직 방향을 우선하여 화소 탐색을 수행하는 점에 있어 서로 다르며, 입력 영상이 이진 영상이 아닌 명도 영상일 경우에는 입력 영상의 각 화소를 탐색할 때 단일 값이 아닌 일정한 범위의 값을 기준으로 화소의 종류를 구분할 수 있다.
수직선 범위 표 구성부(302)는 상기 수직선 표현된 영상 내 임의의 열에 있는 수직선들을 검색하여 열별 수직선 ID 분포를 검사하는 기능을 수행하며, 상기 검사된 수직선 ID 분포에 대한 정보를 포함하는 수직선 범위 표 정보 테이블을 생성한다. 도 8은 상기 수직선 범위 표 구성부(302)로부터 생성되는 수직선 범위 표정보 테이블 중, 상기 도 6의 (c)에 도시된 수직선 표현된 영상에 대한 열별 수직선 ID 분포를 기록한 수직선 범위 표 정보 테이블의 일 예를 도시하였다. 즉, 예를 들어 상기 도 6의 (c)에 도시된 수직선 표현된 영상에서 "0"번째 열 위치에는 어떤 수직선 ID도 없기 때문에 상기 도 8에 도시된 수직선 범위 표 테이블 내 "0"번째 열에는 수직선 ID가 존재하지 않음을 표시하는 "-1"값으로 표기된다. 또한 상기 도 6의 (c)에 도시된 수직선 표현된 영상에서 "2"번째 열 위치에는 수직선 ID "2"와 "3"번에 해당하는 수직선이 존재하기 때문에 상기 도 8에 도시된 수직선 범위 표 테이블 내 "2"번째 열에는 첫 번째 수직선 ID 정보로 "2"번의 수직선 ID와 마지막 수직선 ID 정보로 "3"번 수직선 ID가 표기되는데, 이때 상기 마지막 수직선 ID 정보는 전술한 수직선 기본정보 테이블에서와 마찬가지로 수직선의 개수를 계산하기 쉽게 하기 위해 원래 수직선 ID에 "1"을 증가시킨 수직선 ID "4"를 기록한다.
수직선 연결 정보 추출부(304)는 상기 수직선 기본 정보 추출부(300)와 수직선 범위 표 구성부(302)로부터 생성되는 상기 도 7과 도 8에서와 같은 영상의 수직선 정보를 이용하여 상기 영상 내 인접한 수직선들간의 연결 정보인 수직선 인접 그래프 정보를 생성하게 된다. 도 9는 상기 수직선 연결 정보 추출부(304)로부터 생성되는 상기 도 6의 (c)에 도시된 영상에 대한 수직선 ID 들의 좌/우측 수직선들과의 연결관계를 나타내는 수직선 인접 그래프 정보를 기록한 수직선 인접 정보 테이블의 일 예를 도시한 것이다.
즉, 예를 들어 상기 도 6의 (c)에 도시된 수직선 표현된 영상에서 수직선 ID "0"번의 수직선에 대해서 좌측으로는 어떤 수직선도 인접하지 않기 때문에 상기 도9에 도시된 수직선 연결 정보 테이블 내 수직선 ID "0"번에 해당하는 수직선의 좌측 수직선 상/하단 정보(left_index_start/left_index_end)에는 인접한 수직선 ID가 존재하지 않음을 표시하는 "-1"값으로 표기되며, 수직선 ID "0"번에 해당하는 수직선의 우측으로는 수직선 ID "2"번의 수직선이 인접하므로 상기 수직선 ID "0"번의 수직선에 대한 우측 수직선 상/하단 정보(right_index_start/right_index_end)에는 상기 "2"번 수직선 ID를 기록하게 되는데, 이때에도 상기 도 7, 도 8의 정보 테이블 기록 시와 마찬가지로 우측 수직선 하단 정보(right_index_end)에는 상기 "2"번 수직선 ID에 "1"을 가산한 "3"의 값을 기록하게 된다. 따라서 수직선 인접 그래프 생성부(200)는 상기 수직선 기본 정보 생성부(300)와 수직선 연결 정보 추출부(304)로부터 생성되는 각 정보 테이블을 통합하여 도 10에서와 같은 수직선 인접 그래프 정보 테이블로 조합하여 출력시키게 되는데, 상기 수직선 인접 그래프 정보 테이블을 이용하면 인접한 열에 있는 수직선들에 대한 정보의 확인 및 현재 수직선과 수직 방향으로 인접해 있는 수직선들의 확인이 가능하여 문자열 영상으로부터 개별 문자 영상 분할 시 유용한 기본 정보로 사용이 가능하게 되는 것이다.
도 4는 상기 문자 추출부(108)내 상기 수직선 집합 생성부(202)의 상세 블록 구성을 도시한 것으로, 상기 수직선 집합 생성부(202)는 상기 도 4에서와 같이 다시 수직선 특징 분석부(400)와 수직선 유형 결정부(402), 수직선 집합 구성부(404)로 구성된다. 상기 수직선 특징 분석부(400)는 상기 도 7에서와 같이 상기 수직선 기본정보 추출부(300)로부터 추출된 수직선 기본 정보로부터 수직선 특징을 분석한다. 즉 예를 들어 한글 문자열 영상을 대상으로 문자 분할을 하는 경우 수직선 점과 수직선 획을 구분할 수 있는, 즉 문자의 수평획과 교차되어 나누어진 수직선과 문자의 수직획과 나란하게 나누어진 수직선을 구분할 수 있는, 수직선 길이 정보를 제공하는 것이다. 그러면 수직선 유형 결정부(402)는 상기 분석된 수직선 특징을 기준으로 각 수직선의 유형을 결정하게 된다. 즉 예를 들어 한글 문자열 영상을 대상으로 문자 분할을 하는 경우 상기 수직선 특징 분석부(400)로부터 제공되는 수직선의 길이 정보를 이용하여 수직선 점 또는 수직선 획 여부를 판단하여 수직선의 유형을 결정하게 되는 것이다.
도 11은 상기 수직선 유형 결정부(402)로부터 생성되는 수직선 유형 정보 테이블의 일 예로서, 상기 도 6의 (c)에 도시된 영상에 대한 각 수직선 ID에 해당하는 수직선의 유형을 나타내는 수직선 유형 정보 테이블의 일 예를 도시한 것이다. 즉, 예를 들어 상기 수직선 유형 결정부(402)는 상기 도 6의 (c)에 도시된 수직선 표현된 영상에서 보여지는 각 수직선 ID의 수직선 길이를 미리 설정된 기준 길이와 비교하여 상기 수직선이 수직선 점에 해당하는지 수직선 획에 해당하는지의 여부를 판단하고, 상기 도 11에 도시된 바와 같은 수직선 유형 정보 테이블에 이를 기록하는 것이다. 이때 상기 기준 길이는 수직선 점과 수직선 획을 구분할 수 있는 적정한 길이로 미리 설정되거나, 수직선 길이의 통계 정보를 이용하여 결정된다. 즉, 상기 기준 길이가 수직 상/하단 위치 거리 "3"만큼의 길이로 설정되는 경우 수직선 ID "0"번 화소는 상기 기준 길이보다 짧으므로 수직선 유형 정보에 수직선 점임을 나타내는 논리 값 "0"이 기록되며, 수직선 ID "5"번 화소는 상기 기준 길이보다 길기 때문에 수직선 유형 정보에 수직선 획임을 나타내는 논리 값 "1"이 기록되게 되는 것이다.
수직선 집합 구성부(404)는 상기 수직선 인접 그래프 생성부(200)로부터 제공되는 수직선 인접 그래프를 탐색하면서 그래프 상에서 서로 연결되어 있고 수직선 유형이 동일한 수직선들끼리 집합을 구성한다.
도 12는 상기 수직선 집합 구성부(404)로부터 생성되는, 수직선 집합 구성 정보 테이블의 일 예로서, 상기 도 6의 (c)에 도시된 영상에 대한 수직선들의 집합 구성 정보를 기록한 수직선 집합 구성 정보 테이블의 일 예를 도시한 것이다.
상기 도 12를 참조하면, 예를 들어 상기 도 6의 (c)에 도시된 수직선 표현된 영상에서 수직선 ID "0"번부터 "4"번까지가 수직선 집합 ID "0"번으로 구성되는 경우, 수직선 집합 ID "0"번에 포함되는 수직선들은 영상 내에서 좌측(left) "1"번 열에서부터 우측(right) "3"번 열까지, 상단(top) "2"번 행에서 하단(bottom) "5"번 행까지에 걸치는 사각형 영역에 포함되므로, 상기 수직선 집합 ID "0"번에 해당하는 수직선 집합 ID 정보에는 좌측(left) 열 위치 정보로 "1", 상단(top) 행 위치 정보로 "2", 우측(right) 열 위치 정보로 "4", 하단(bottom) 행 위치 정보로 "6"이 기록되며, 수직선 ID의 개수(line_count)는 "5"이고, 상기 수직선 집합 ID "0"번에 포함되는 수직선 ID 정보(line_id[])로는 "0"번부터 "4"번까지의 수직선 ID가 기록되는 것이다. 이때, 상기 우측(right) 열 위치 정보와 하단(bottom) 행 위치 정보는 각각 원래 정보 값에서 "1"만큼씩 증가한 값으로 표시되어 있는데, 이는 전술한 바와 마찬가지로 우측(right) 열 위치 정보 값에서 좌측(left) 열 위치 정보 값을감산한 결과가 상기 수직선 집합 영역의 실제 폭(width)으로 표현되도록 또한, 하단(bottom) 행 위치 정보 값에서 상단(top) 행 위치 정보 값을 감산한 결과가 상기 수직선 집합 영역의 실제 높이(height)로 표현되도록 하기 위함이다.
한편, 상기 수직선 집합 구성 과정에서 후술될 영상 분할 위치 추정부(204)에서의 개별 영상 추출을 위한 영상의 특징 분석이 용이하도록 상기 수직선의 유형 분류에서와 동일하게 수직선 집합의 크기 정보 등을 미리 분석하여 각 수직선 집합의 유형을 미리 결정할 수 있도록 한다.
도 13은 상기 수직선 집합 생성부(202)로부터 생성되는 상기 도 6의 (d)에 도시된 각 수직선 집합 구성 영상에 대한 각 수직선 집합 ID의 수직선 집합 유형을 나타내는 수직선 집합 유형 정보 테이블의 일 예를 도시한 것이다. 즉, 상기 수직선 집합 생성부(202)는 상기 도 6의 (d)에 도시된 수직선 집합 표현된 영상에서 보여지는 각 수직선 집합들의 폭과 높이를 미리 설정된 기준 폭 및 기준 높이와 비교하여 수직획에 해당하는지의 여부를 판단하여 상기 도 13에 도시된 바와 같은 수직선 집합 유형 정보 테이블에 기록하는 것이다. 이때 상기 기준 폭과 기준 높이는 상기 도 11에서와 마찬가지로 수직선 집합이 문자의 수직획에 해당하는지 아닌지를 구분할 수 있는 적정한 길이로 미리 설정되거나, 수직선 집합의 폭과 높이에 대한 통계 정보를 이용하여 결정된다. 예를 들어 상기 수직선 집합 ID "0"번에 해당하는 수직선 집합의 영역은 높이가 미리 설정된 기준 높이보다 짧으므로 수직선 집합 유형 정보에 문자의 수직획이 아님을 나타내는 논리 값 "0"이 기록되며, 수직선 집합 ID "1"에 해당하는 수직선 집합의 영역은 높이가 미리 설정된 기준 높이보다 길게되므로 수직선 집합 유형 정보에 문자의 수직획임을 나타내는 논리 값 "1"이 기록되게 되는 것이다.
도 5는 상기 문자 추출부(108)내 상기 영상 분할 위치 추정부(204)의 상세 블록 구성을 도시한 것으로, 상기 영상 분할 위치 추정부(204)는 상기 도 5에서와 같이 작은 수직선 집합 병합부(500)와 수직선 집합 특징 추출부(502), 수직선 집합 병합 및 분리부(504)로 구성된다. 상기 작은 수직선 집합 병합부(500)는 상기 수직선 집합 생성부(202)로부터 수직선 집합들의 크기를 분석하여 작은 수직선 집합인지의 여부를 판단하고, 작은 수직선 집합으로 판단된 수직선 집합을 인접하는 수직선 집합에 병합한다.
도 16은 도 15에서와 같이 얻어진 수직선 집합들에 대하여 작은 수직선 집합을 인접한 수직선 집합에 병합한 결과를 도시한 일 예이다. 수직선 집합 특징 추출부(502)는 수직선 집합의 위치 및 크기, 또는 수직선 집합 구성부(404)에서 미리 얻어진 수직선 집합의 유형 등의 정보를 분석하여 영상의 분할 및 병합 여부를 판단하기 위한 특징들을 추출한다. 수직선 집합 병합 및 분리부(504)는 수직선 집합 특징 추출부(502)에서 추출된 특징 정보를 이용하여 수직선 집합의 병합 및 분리 작업을 수행한다. 상기 수직선 집합의 병합 및 분리과정은 상기 도 12의 수직선 집합 정보 테이블에서 관련된 수직선의 ID를 추가 및 삭제하고 수직선의 개수(line_count)를 증가 또는 감소시키는 과정으로 즉, 예를 들어 상기 도 6의 (d)에서 수직선 집합 ID "1"번과 "2"번에 해당하는 두 수직선 집합을 병합하게 되는 경우 상기 도 12의 수직선 집합 정보 테이블은
도 14에서와 같이 수직선 집합 ID "1"번의 수직선 집합 정보에 수직선 집합 ID "2"번의 수직선 집합 정보가 병합된 새로운 수직선 집합 정보로 구현되는데, 즉, 우측(right) 열 위치 정보 값이 "6"에서 "7"로 변경되며, 수직선 개수(line_count)는 "1"에서 "2"로, 수직선 ID 정보(line_id[])는 수직선 ID "5"번과 "6"번으로 되는 것이다. 따라서 영상의 병합 및 분리 작업을 매우 빠른 속도로 처리할 수 있게 된다.
즉, 상기 수직선 집합 특징 추출부(502)와 수직선 집합 병합 및 분리부(504)는 일 예로써 한글 문자열 영상을 대상으로 문자 분할을 수행하는 경우 수직선 집합을 좌측에서부터 순차적으로 탐색하여 다음에 따라오는 수직선 집합과 일정 비율 이상 상하 방향으로 겹침이 있으면 이들을 병합하고, 지금까지 추출된 수직선 집합들을 문자 획의 일부로 간주하고, 문자 획의 배치 특성을 고려하여 끊어진 문자 획을 병합하는 과정의 반복을 통해 문자 분할 위치를 추정하게 되는 것이다. 도 17에는 일 예로써 상기 도 15 및 도 16의 수직선 집합으로 표현된 "신수동"이라는 문자열 영상이 상기 수직선 집합 병합 및 분리부(504)로부터의 수직선 집합 병합 과정을 통해 개별 문자 영상으로 수렴되어 가는 과정을 도시하였다.
이제 다시 상기 도 2의 문자 추출부(108)의 영상 분할 경로 그래프 생성부(206)와 개별 부분 영상 추출부(208)의 동작 설명을 계속하면, 영상 분할 경로 그래프 생성부(206)는 영상 분할 위치 추정부(204)에서 생성된 각 수직선 집합들을 개별 부분 영상들의 후보 영상으로 간주하고, 좌측에서부터 일정 범위에 해당하는 수직선 집합들을 고려하여, 다양한 병합을 시도하면서 부분 영상 후보 정보를생성한다. 상기 도 18에는 영상 분할 경로 그래프의 일 예를 도시하였다.
그러면 개별부분 영상 추출부(208)는 영상 분할 경로 그래프의 각 경로와 관련한 수직선 집합으로부터 영상 정보를 추출한다. 상기 수직선 집합으로부터 영상을 구성하는 과정은 수직선 기본 정보 추출부(300)의 역 과정으로써, 영상을 저장할 영역을 주 메모리에 확보하고, 영상의 모든 화소를 백색으로 초기화한 후, 각 수직선에 대한 기본 정보를 분석하여 수직선의 위치에 해당하는 영역의 화소를 흑색으로 변경시키게 되며, 상기와 같이 개별 부분 영상 추출부(208)로부터 추출된 개별 문자 영상은 상기 도 1의 문자 인식부(110)로 인가되어 최종적으로 문자 인식되어 해당 문자 코드로 변환되게 되는 것이다.
한편 상술한 본 발명의 설명에서는 구체적인 실시 예에 관해 설명하였으나, 여러 가지 변형이 본 발명의 범위에서 벗어나지 않고 실시할 수 있다. 따라서 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위에 의해 정하여져야 한다.
이상에서 설명한 바와 같이, 본 발명은 문자 인식 시스템에서 입력되는 문자열 영상으로부터 개별 문자 영상을 추출하는 과정에서 2차원 비트맵 형식으로 표현된 영상을 수직선 인접 그래프로 표현하여 영상 정보의 손실 없이 정보의 크기를 크게 줄일 수 있는 이점이 있다. 또한 수직선 인접 그래프로부터 문자 분할 위치를 추정하는데 필요한 문자 분할 특성 정보를 쉽게 얻을 수 있고, 상기 추정된 문자 분할 위치를 기준으로 개별 문자 영상을 쉽고 빠르게 얻을 수 있어 문서 인식 시스템에서 문자 추출 시 문자 영상을 보다 빠르고 정확하게 추출할 수 있는 이점이 있으며, 수직선 인접 그래프로 표현된 영상으로부터 2차원 비트맵 영상을 빠르게 복원할 수 있는 이점이 있다.

Claims (33)

  1. 문서 인식 시스템에 있어서,
    입력되는 문서 영상으로부터 문자 영상 영역을 추출하는 문서구조 분석부와;
    상기 문자 영상 영역으로부터 문자열 영상을 추출하는 문자열 추출부와;
    상기 추출된 문자열 영상의 화소 단위 표현을 수직선 단위 표현으로 변환하여 상기 수직선 표현된 문자열 영상으로부터 수직선 인접 그래프를 통한 개별 문자 영상을 추출해내는 문자 추출부와;
    상기 개별 문자 영상으로부터 각 문자를 인식하고 해당 문자 코드로 변환하는 문자 인식부;를 포함하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  2. 제1항에 있어서,
    상기 문자 추출부는, 상기 입력 문자열 영상으로부터 수직선 인접 그래프 정보를 생성하는 수직선 인접 그래프 생성부와;
    상기 생성된 수직선 인접 그래프 정보를 이용하여 상기 문자열 영상에 대한 수직선 집합 정보를 생성하는 수직선 집합 생성부와;
    상기 수직선 집합 정보를 분석하여 상기 문자열 영상에서 개별 문자 영상 추출을 위한 영상 분할 위치를 추정하는 영상 분할 위치 추정부와;
    상기 추정된 영상 분할 위치 정보를 이용하여 수직선으로 표현된 문자열 영상으로부터 개별 문자 영상을 추출하는 개별 부분 영상 추출부;를 포함하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  3. 제1항에 있어서,
    상기 문자 추출부는, 상기 입력 문자열 영상으로부터 수직선 인접 그래프 정보를 생성하는 수직선 인접 그래프 생성부와;
    상기 생성된 수직선 인접 그래프 정보를 이용하여 상기 문자열 영상에 대한 수직선 집합 정보를 생성하는 수직선 집합 생성부와;
    상기 수직선 집합 정보를 분석하여 상기 문자열 영상에서 개별 문자 영상 추출을 위한 영상 분할 위치를 추정하는 영상 분할 위치 추정부와;
    상기 영상 분할 위치 정보를 조합하여 영상 분할 경로 그래프를 생성하는 영상 분할 경로 그래프 생성부와;
    상기 영상 분할 경로 그래프의 각 경로에 대해 수직선으로 표현된 상기 문자열 영상으로부터 각각의 개별 문자 영상을 추출하는 개별 부분 영상 추출부;를 포함하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  4. 제2항 또는 제3항에 있어서,
    상기 수직선 인접 그래프 생성부는, 상기 입력 문자열 영상의 각 화소를 순차적으로 탐색하면서 수직선 기본 정보를 추출하는 수직선 기본 정보 추출부와;
    상기 수직선 기본 정보로부터 각 열(column)에 포함된 수직선 정보를 검색하여 각 수직선을 나타내는 수직선 아이디(ID)의 범위 정보를 기록하는 수직선 범위 표 구성부와;
    상기 추출된 수직선 기본 정보를 분석하여 각 수직선들의 인접한 열에 위치한 수직선과의 연결 정보를 생성하는 수직선 연결 정보 추출부;를 포함하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  5. 제4항에 있어서,
    상기 수직선 연결 정보 추출부는, 상기 문자열 영상 내 각 수직선들을 인접한 열에 위치한 수직선들과의 접촉 여부를 판단하여 수직선 연결 정보를 생성하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  6. 제4항에 있어서,
    상기 수직선 기본 정보는, 상기 수직선으로 변환된 입력 문자열 영상의 각 수직선을 열(column) 좌표 값과 수직선 상(top)/하단(bottom) 좌표 값으로 나타내는 각 수직선의 문자열 영상 내 위치 정보 값인 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  7. 제4항에 있어서,
    상기 수직선은, 상기 입력 문자열 영상의 각 화소를 수직 방향을 우선하여 탐색하면서 일정한 범위의 값을 가지며 연속적으로 나타나는 화소를 연결하여 생성하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  8. 제4항에 있어서,
    상기 수직선 연결 정보는, 상기 수직선으로 변환된 입력 문자열 영상의 각 수직선에 대해 좌/우측(left/right)에 인접한 수직선의 해당 수직선 ID 정보인 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  9. 제2항 또는 제3항에 있어서,
    상기 수직선 집합 정보는, 상기 수직선으로 변환된 입력 문자열 영상의 수직선들을 상기 수직선 연결 정보에 따라 서로 연결 관계가 있는 수직선들을 각각의 그룹으로 지정한 수직선 ID 그룹 정보(line_id)인 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  10. 제9항에 있어서,
    상기 수직선 집합 정보는, 상기 그룹 지정된 수직선 ID 들을 포함하는 문자열 영상 내 해당 그룹의 영역에 대한 위치 정보 값을 더 포함하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  11. 제10항에 있어서,
    상기 그룹 영역 위치 정보 값은, 상기 문자열 영상 내 상기 그룹 지정된 수직선 ID 화소들을 포함하는 사각 영역의 좌측(left) 상단(top) 위치 정보 값과 우측(right) 하단(bottom) 위치 정보 값으로 구성되는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  12. 제2항 또는 제3항에 있어서,
    상기 수직선 집합 생성부는, 상기 수직선 정보로부터 수직선 특징 정보를 생성하는 수직선 특징 분석부와;
    상기 수직선 특징 정보를 이용하여 수직선의 유형을 결정하는 수직선 유형 결정부와;
    상기 결정된 수직선 유형과 수직선 연결 정보를 분석하여 상기 문자열 영상내 수직선 유형이 유사하며 서로 인접한 수직선끼리 수직선 집합을 구성하는 수직선 집합 구성부;를 포함하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  13. 제12항에 있어서,
    상기 수직선 유형 결정부는, 상기 수직선의 길이를 미리 설정된 기준 길이를 기준으로 상기 기준 길이보다 짧은 수직선은 수직선 점으로 상기 기준 길이보다 긴 수직선은 수직선 획으로 수직선 유형을 결정하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  14. 제2항 또는 제3항에 있어서,
    상기 영상 분할 위치 추정부는, 상기 수직선 집합 생성부에 의하여 인가되는 수직선 집합 정보로부터 수직선 집합의 크기를 검사하여 작은 수직선 집합을 인접한 수직선 집합에 병합시키는 수직선 집합 병합부와;
    상기 병합된 수직선 집합들의 특징을 검사하여 수직선 집합의 병합 및 분리 여부 판단을 위한 기준 정보인 수직선 집합 특징 정보를 생성하는 수직선 집합 특징 추출부와;
    상기 수직선 집합 특징 정보를 분석하여 수직선 집합의 병합 및 분리를 수행하는 수직선 집합 병합 및 분리부;를 포함하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  15. 제14항에 있어서,
    상기 수직선 집합 특징 추출부는, 상기 수직선 집합 병합부로부터 인가되는 상기 병합된 수직선 집합들에 대해 각 수직선 집합의 위치, 크기, 형태, 연결 관계 등을 분석하여 각각의 수직선 집합 특징 정보를 생성하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  16. 제3항에 있어서,
    상기 영상 분할 경로 그래프 생성부는, 상기 영상 분할 위치 추정부로부터 인가되는 상기 추정된 영상 분할 위치를 다양하게 조합하여 가능한 부분 영상 후보를 표현하는 수직선 집합을 생성하고, 각 영상 분할 위치의 조합에 따라 구성되는 영상 분할 경로 그래프를 생성하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  17. 제2항 또는 제3항에 있어서,
    상기 개별 부분 영상 추출부는, 상기 영상 분할 후보 위치를 기준으로 상기 영상 분할 경로 그래프에 따라 상기 문자열 영상으로부터 개별 문자 영상 정보를 추출하여 출력시키는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 시스템.
  18. 문서 구조 분석부와 문자열 추출부와 문자 추출부와 문자 인식부를 포함하는 문서 인식 시스템에서 수직선 인접 그래프를 이용한 문서 인식 방법에 있어서,
    (a)입력되는 문서 영상으로부터 문자 영상 영역을 추출하는 단계와;
    (b)상기 문자 영상 영역으로부터 문자열 영상을 추출하는 단계와;
    (c)상기 추출된 문자열 영상내 각 화소를 수직선 정보로 변환하고 상기 수직선 표현된 문자열 영상으로부터 수직선 인접 그래프를 통한 개별 문자 영상을 추출해내는 단계와;
    (d)상기 개별 문자 영상으로부터 해당 문자를 인식하는 단계;를 포함하여 진행하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  19. 제18항에 있어서,
    상기 (c)단계는, (c1)상기 입력 문자열 영상으로부터 수직선 인접 그래프 정보를 생성하는 단계와;
    (c2)상기 수직선 인접 그래프 정보를 이용하여 상기 문자열 영상에 대한 수직선 집합 정보를 생성하는 단계와;
    (c3)상기 수직선 집합 정보를 분석하여 상기 문자열 영상에서 개별 문자 영상 추출을 위한 영상 분할 위치를 추정하는 단계와;
    (c4)상기 추정된 영상 분할 위치 정보를 이용하여 상기 문자열 영상으로부터 개별 부분 영상을 추출하는 단계;를 포함하여 진행하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  20. 제18항에 있어서,
    상기 (c)단계는, (c'1)상기 입력 문자열 영상으로부터 수직선 인접 그래프 정보를 생성하는 단계와;
    (c'2)상기 수직선 인접 그래프 정보를 이용하여 상기 문자열 영상에 대한 수직선 집합 정보를 생성하는 단계와;
    (c'3)상기 수직선 집합 정보를 분석하여 상기 문자열 영상에서 개별 문자 영상 추출을 위한 영상 분할 위치를 추정하는 단계와;
    (c'4)상기 영상 분할 위치 정보를 조합하여 영상 분할 경로 그래프를 생성하는 단계와;
    (c'5)상기 영상 분할 경로 그래프의 각 경로에 대해 수직선으로 표현된 문자열 영상으로부터 각각의 개별 문자 영상을 추출하는 단계;를 포함하여 진행하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  21. 제20항에 있어서,
    상기 (c'1)단계는, (c'11)상기 입력 문자열 영상의 각 화소를 순차적으로 탐색하면서 수직선 기본 정보를 추출하는 단계와;
    (c'12)상기 수직선 기본 정보로부터 각 열(column)에 포함된 수직선 정보를 검색하여 각 수직선을 나타내는 수직선 아이디(ID)의 범위 정보를 구성하는 단계와;
    (c'13)상기 수직선 기본 정보를 분석하여 각 수직선들에 인접한 열에 위치한 수직선과의 연결 정보를 생성하는 단계;를 포함하여 진행하는 것을 특징으로 하는 수직선 그래프를 이용한 문서 인식 방법.
  22. 제21항에 있어서,
    상기 수직선 연결정보는, 상기 문자열 영상 내 각 수직선들에 대해 인접한 열에 위치한 수직선들과의 접촉 여부 판단을 통해 생성하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  23. 제22항에 있어서,
    상기 수직선 연결 정보는, 상기 수직선으로 변환된 입력 문자열 영상의 각 수직선에 대해 좌/우측(left/right)에 인접한 수직선의 해당 수직선 ID 정보인 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  24. 제21항에 있어서,
    상기 수직선 기본 정보는, 상기 수직선으로 변환된 입력 문자열 영상의 각 수직선을 열(column) 좌표 값과 수직선 상(top)/하단(bottom) 좌표 값으로 나타낸 각 수직선의 문자열 영상 내 위치 정보 값인 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  25. 제21항에 있어서,
    상기 수직선은, 상기 입력 문자열 영상의 각 화소를 수직 방향을 우선하여 탐색하면서 일정한 범위의 값을 가지며 연속적으로 나타나는 화소를 연결하여 생성하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  26. 제20항에 있어서,
    상기 수직선 집합 정보는, 상기 수직선 그래프로 변환된 입력 문자열 영상의 수직선들을 상기 수직선 연결 정보에 따라 서로 연결 관계가 있는 수직선들을 각각의 그룹으로 지정한 수직선 ID 그룹 정보(line_id)인 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  27. 제26항에 있어서,
    상기 수직선 집합 정보는, 상기 그룹 지워진 수직선 ID들을 포함하는 문자열 영상 내 해당 그룹의 영역에 대한 위치 정보 값을 더 포함하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  28. 제27항에 있어서,
    상기 그룹 영역 위치 정보 값은, 상기 문자열 영상 내 상기 그룹 지정된 수직선 ID에 해당하는 수직선들을 포함하는 좌측(left) 상단(top) 위치 정보 값과 우측(right) 하단(bottom) 위치 정보 값으로 구성되는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  29. 제20항에 있어서,
    상기 (c'2)단계는, (c'21)상기 수직선 정보로부터 수직선 특징 정보를 생성하는 단계와;
    (c'22)상기 수직선 특징을 이용하여 수직선의 유형을 결정하는 단계와;
    (c'23)는 상기 수직선 유형과 수직선 연결 정보를 분석하여 상기 문자열 영상내 수직선 유형이 유사하고 서로 인접한 수직선끼리 수직선 집합을 구성하는 단계;를 포함하여 진행하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  30. 제20항에 있어서,
    상기 (c'3)단계는, (c31)상기 수직선 집합 정보로부터 수직선 집합의 크기를 검사하여 작은 수직선 집합을 인접한 수직선 집합에 병합시키는 단계와;
    (c32)상기 병합된 수직선 집합들의 특징을 검사하여 수직선 집합의 병합 및 분리 여부를 판단하기 위한 기준 정보인 수직선 집합 특징 정보를 생성하는 단계와;
    (c33)상기 수직선 집합 특징 정보를 분석하여 수직선 집합의 병합 및 분리를 수행하는 단계;를 포함하여 진행하는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  31. 제30항에 있어서,
    상기 수직선 집합 특징 정보는, 상기 수직선 집합들에 대해 각 수직선 집합의 위치, 크기, 형태, 상호 연결 관계 등의 비교를 통해 생성되는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  32. 제20항에 있어서,
    상기 영상 분할 경로 그래프는, 상기 추정된 영상 분할 위치를 다양하게 조합하여 가능한 부분 영상 후보를 표현하는 수직선 집합을 생성하고, 각 영상 분할 위치의 조합을 통해 생성되는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
  33. 제20항에 있어서,
    상기 개별 부분 영상 정보는, 상기 영상 분할 후보 위치를 기준으로 상기 영상 분할 경로 그래프에 따라 상기 문자열 영상으로부터 추출되는 것을 특징으로 하는 수직선 인접 그래프를 이용한 문서 인식 방법.
KR10-2001-0088362A 2001-12-29 2001-12-29 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법 KR100449486B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR10-2001-0088362A KR100449486B1 (ko) 2001-12-29 2001-12-29 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
US10/329,392 US20030123730A1 (en) 2001-12-29 2002-12-27 Document recognition system and method using vertical line adjacency graphs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0088362A KR100449486B1 (ko) 2001-12-29 2001-12-29 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20030059499A true KR20030059499A (ko) 2003-07-10
KR100449486B1 KR100449486B1 (ko) 2004-09-22

Family

ID=19717933

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0088362A KR100449486B1 (ko) 2001-12-29 2001-12-29 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법

Country Status (2)

Country Link
US (1) US20030123730A1 (ko)
KR (1) KR100449486B1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2880709B1 (fr) * 2005-01-11 2014-04-25 Vision Objects Procede de recherche, reconnaissance et localisation dans l'encre, dispositif, programme et langage correspondants
JP4243614B2 (ja) * 2006-01-11 2009-03-25 Necアクセステクニカ株式会社 線分検出器及び線分検出方法
US8643651B2 (en) * 2010-06-18 2014-02-04 Jieh HSIANG Type-setting method for a text image file
JP5577948B2 (ja) * 2010-08-24 2014-08-27 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US9734132B1 (en) * 2011-12-20 2017-08-15 Amazon Technologies, Inc. Alignment and reflow of displayed character images
CN107368828A (zh) * 2017-07-24 2017-11-21 中国人民解放军装甲兵工程学院 高清试卷图像采集分解系统和方法
US10685261B2 (en) * 2018-06-11 2020-06-16 GM Global Technology Operations LLC Active segmention of scanned images based on deep reinforcement learning for OCR applications

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4817186A (en) * 1983-01-07 1989-03-28 International Business Machines Corporation Locating individual images in a field for recognition or the like
JPH04270485A (ja) * 1991-02-26 1992-09-25 Sony Corp 印刷文字認識装置
US5926565A (en) * 1991-10-28 1999-07-20 Froessl; Horst Computer method for processing records with images and multiple fonts
CA2081406C (en) * 1991-12-23 1997-09-16 Chinmoy Bhusan Bose Method and apparatus for connected and degraded text recognition
EP0550131A2 (en) * 1991-12-31 1993-07-07 AT&T Corp. Graphical system for automated segmentation and recognition for image recognition systems
US5555556A (en) * 1994-09-30 1996-09-10 Xerox Corporation Method and apparatus for document segmentation by background analysis
US5852676A (en) * 1995-04-11 1998-12-22 Teraform Inc. Method and apparatus for locating and identifying fields within a document
JPH11143986A (ja) * 1997-10-17 1999-05-28 Internatl Business Mach Corp <Ibm> ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体
JP2000163514A (ja) * 1998-09-25 2000-06-16 Sanyo Electric Co Ltd 文字認識方法、文字認識装置および記憶媒体
FR2790846B1 (fr) * 1999-03-09 2001-05-04 S F C E Procede d'identification de document
US6867875B1 (en) * 1999-12-06 2005-03-15 Matsushita Electric Industrial Co., Ltd. Method and apparatus for simplifying fax transmissions using user-circled region detection

Also Published As

Publication number Publication date
KR100449486B1 (ko) 2004-09-22
US20030123730A1 (en) 2003-07-03

Similar Documents

Publication Publication Date Title
US6512848B2 (en) Page analysis system
US6674900B1 (en) Method for extracting titles from digital images
CN104298982B (zh) 一种文字识别方法及装置
CN102081731B (zh) 一种从图像中提取文本的方法和装置
EP0807297A2 (en) Method and apparatus for separating foreground from background in images containing text
JP2005242579A (ja) 文書処理装置、文書処理方法、および文書処理プログラム
JP3692018B2 (ja) テロップ情報処理装置
CN110503054A (zh) 文本图像的处理方法及装置
KR20030029187A (ko) 영상 의존적인 얼굴 영역 추출방법
JP2005148987A (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
KR100449486B1 (ko) 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
Zhao et al. A robust color-independent text detection method from complex videos
JPH05166002A (ja) ソース画像を分析する方法
KR101571681B1 (ko) 동질 영역을 이용한 문서 구조의 분석 방법
JP4213357B2 (ja) 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム
Gllavata et al. Finding text in images via local thresholding
Pei et al. Automatic text detection using multi-layer color quantization in complex color images
JP2858530B2 (ja) エッジ強調装置
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
US20220406083A1 (en) Image processing apparatus, control method thereof, and storage medium
KR102513456B1 (ko) 그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템 및 그 방법
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
Saeed et al. Intelligent feature extract system for cursive-script recognition
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120831

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20130829

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20140827

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20150827

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20160826

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20170828

Year of fee payment: 14