KR20040002427A - 문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치및 문서 레이아웃 해석 방법 - Google Patents

문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치및 문서 레이아웃 해석 방법 Download PDF

Info

Publication number
KR20040002427A
KR20040002427A KR1020030006204A KR20030006204A KR20040002427A KR 20040002427 A KR20040002427 A KR 20040002427A KR 1020030006204 A KR1020030006204 A KR 1020030006204A KR 20030006204 A KR20030006204 A KR 20030006204A KR 20040002427 A KR20040002427 A KR 20040002427A
Authority
KR
South Korea
Prior art keywords
row
character
candidate
rectangle
elements
Prior art date
Application number
KR1020030006204A
Other languages
English (en)
Inventor
오자와노리아끼
다께베히로아끼
후지모또가쯔히또
나오이사또시
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20040002427A publication Critical patent/KR20040002427A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Abstract

본 발명은 문서 화상에서 행 도중에 복수 행으로 분기되어 있는 경우나 괄호 내에 복수 행이 있는 경우에도 높은 정밀도로 행이나 단(段)의 레이아웃을 해석하는 것이다. 문서 화상의 흑화소 연결 성분으로부터 문자 후보 요소를 생성하는 문자 후보 요소 생성부(104)와, 행 방향으로 나열된 복수의 문자 후보 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 후보 요소를 행 후보 요소로 하는 가로 방향 행 구형 생성부(105)와, 상기 수직 방향에 대하여 대략 동일 길이의 복수의 행 후보 요소를 단 후보 요소로 하는 가로단 생성부(106)를 포함한다.

Description

문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치 및 문서 레이아웃 해석 방법{APPARATUS AND METHOD OF ANALYZING LAYOUT OF DOCUMENT, AND COMPUTER PRODUCT}
본 발명은, 예를 들면 서식(form)에 대응하는 문서 화상의 레이아웃을 해석하는 문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치 및 문서 레이아웃 해석 방법에 관한 것으로, 특히 문서 화상에서 행의 도중에 복수 행으로 분기되어 있는 경우나, 괄호 내에 복수 행이 있는 경우에도, 높은 정밀도로 문자열로서의 행(行)이나 복수행을 포함한 단(段)의 레이아웃을 해석할 수 있는 문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치 및 문서 레이아웃 해석 방법에 관한 것이다.
종래에, 문서 화상에서의 문자, 행 등의 레이아웃을 해석하는 방법은, 예를 들면 일본 특개평 7-192083호 공보(문서 화상 레이아웃 해석 장치)에 개시되어 있고, 서로 다른 문자 사이즈가 혼재하는 문서 화상에 대하여, 각 문자에 대응하는외접 구형(矩形)의 면적에 기초하여, 복수의 외접 구형(문자)을 문자 사이즈별로 클래스 분류를 행하고, 클래스마다의 레이아웃 해석 결과를, 우선도를 이용하여 합성한다.
또한, 그 방법으로 외접 구형의 투영 패턴을 구하고, 행의 배치의 주기성을 고려하여 행을 추출함으로써, 행 레이아웃의 해석을 행하고 있다.
그런데, 상술한 바와 같이, 종래의 레이아웃 해석 방법에서는 문자 사이즈의 대소에 대응 가능하지만, 외접 구형의 투영 패턴을 이용하여 행 레이아웃의 해석을 행하고 있기 때문에, 도 41의 (a)에 도시한 문서 화상(10)의 부분(10a)과 같이 행의 도중에 복수 행으로 분기하는 경우에 높은 정밀도로 행의 레이아웃을 해석할 수 없다는 문제가 있다.
또한, 종래에는 외접 구형의 투영 패턴을 이용하여 행 레이아웃의 해석을 행하고 있기 때문에, 도 41의 (b)에 도시한 문서 화상(20)의 부분(20a)이나 도 41의 (c)에 도시한 문서 화상(30)의 부분(30a)과 같이, 괄호 내에 복수의 행이 존재하는 경우에도, 높은 정밀도로 행의 레이아웃을 해석할 수 없다.
이것은 괄호의 외접 구형이 도 41의 (b)의 세로로 긴 형태이기 때문에, 투영 패턴에 괄호 내의 가로 방향의 복수 행이 숨겨져 있고, 즉 이들 가로 방향의 행이 행으로서 인식되지 않고, 이들 복수 행을 포함하는 괄호가 1행으로서 해석되기 때문이다.
본 발명은 상기에 감안하여 이루어진 것으로, 문서 화상에서 행의 도중에 복수 행으로 분기되어 있는 경우나 괄호 내에 복수 행이 있는 경우에도, 높은 정밀도로 문자열로서의 행이나 복수행을 포함하는 단의 레이아웃을 해석할 수 있는 문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치 및 문서 레이아웃 해석 방법을 제공하는 것을 목적으로 한다.
도 1은 본 발명에 따른 일 실시 형태의 구성을 도시하는 블록도.
도 2는 일 실시 형태에서 이용되는 각종 문서 화상을 도시하는 도면.
도 3은 일 실시 형태의 동작을 설명하는 흐름도.
도 4는 도 3에 도시한 문자 후보 요소 생성 처리를 설명하는 흐름도.
도 5는 도 4에 도시한 중첩 구형 통합 처리를 설명하는 흐름도.
도 6은 도 4에 도시한 인접 구형 통합 처리를 설명하는 흐름도.
도 7은 도 3에 도시한 가로 방향 행 구형 생성 처리를 설명하는 흐름도.
도 8은 도 7에 도시한 문자 사이즈별 행 후보 생성 처리를 설명하는 흐름도.
도 9는 도 7에 도시한 행 후보 통합 처리를 설명하는 흐름도.
도 10은 도 7에 도시한 장행(長行) 절단 처리를 설명하는 흐름도.
도 11은 도 7에 도시한 장행 절단 처리를 설명하는 흐름도.
도 12는 도 7에 도시한 단행(短行) 통합 처리를 설명하는 흐름도.
도 13은 도 3에 도시한 가로단 생성 처리를 설명하는 흐름도.
도 14는 도 13에 도시한 동일 장행 통합 처리를 설명하는 흐름도.
도 15는 도 13에 도시한 단 인접 행 통합 처리를 설명하는 흐름도.
도 16은 도 13에 도시한 중앙 정렬 행 통합 처리를 설명하는 흐름도.
도 17은 도 3에 도시한 세로 방향 행 구형 생성 처리를 설명하는 흐름도.
도 18은 도 3에 도시한 세로단 생성 처리를 설명하는 흐름도.
도 19는 도 3에 도시한 단 확정 처리를 설명하는 흐름도.
도 20은 도 8에 도시한 문자 사이즈별 행 후보 생성 처리를 설명하는 도면.
도 21은 도 8에 도시한 문자 사이즈별 행 후보 생성 처리를 설명하는 도면.
도 22는 도 9에 도시한 행 후보 통합 처리를 설명하는 도면.
도 23은 도 10에 도시한 장행 절단 처리를 설명하는 도면.
도 24는 도 11에 도시한 장행 절단 처리를 설명하는 도면.
도 25는 도 12에 도시한 단행 통합 처리를 설명하는 도면.
도 26은 도 15에 도시한 단 인접 행 통합 처리를 설명하는 도면.
도 27은 도 16에 도시한 중앙 정렬 행 통합 처리를 설명하는 도면.
도 28은 도 3에 도시한 흑화소 연결 성분 추출 처리의 결과를 도시하는 도면.
도 29는 도 4에 도시한 문자 후보 요소 생성 처리의 결과를 도시하는 도면.
도 30은 도 8에 도시한 가로 방향의 문자 사이즈별 행 후보 생성 처리의 결과를 도시하는 도면.
도 31은 도 17에 도시한 세로 방향의 문자 사이즈별 행 후보 생성 처리의 결과를 도시하는 도면.
도 32는 도 9에 도시한 가로 방향의 행 후보 통합 처리의 결과를 도시하는 도면.
도 33은 도 17에 도시한 세로 방향의 행 후보 통합 처리의 결과를 도시하는 도면.
도 34는 도 10 및 도 11에 도시한 가로 방향의 장행 절단 처리의 결과를 도시하는 도면.
도 35는 도 17에 도시한 세로 방향의 장행 절단 처리의 결과를 도시하는 도면.
도 36은 도 12에 도시한 가로 방향의 단행 통합 처리의 결과를 도시하는 도면.
도 37은 도 17에 도시한 세로 방향의 단행 통합 처리의 결과를 도시하는 도면.
도 38은 도 13에 도시한 가로단 생성 처리의 결과를 도시하는 도면.
도 39는 도 18에 도시한 세로단 생성 처리의 결과를 도시하는 도면.
도 40은 실시 형태의 변형예의 구성을 도시하는 블록도.
도 41은 종래의 문제점을 설명하는 도면.
<도면의 주요 부분에 대한 부호의 설명>
100 : 문서 레이아웃 해석 장치
101 : 입력부
102 : 제어부
103 : 흑화소 연결 성분 추출부
104 : 문자 후보 요소 생성부
105 : 가로 방향 행 구형 생성부
106 : 가로단 생성부
107 : 세로 방향 행 구형 생성부
108 : 세로단 생성부
109 : 기억부
110 : 출력부
상기 목적을 달성하기 위해서, 본 발명은 컴퓨터를, 문서 화상의 흑화소 연결 성분으로부터 문자 요소를 추출하는 문자 요소 추출 수단, 행 방향으로 나열된 복수의 문자 요소에 대하여 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 행 요소 추출 수단으로서 기능시키기 위한 문서 레이아웃 해석 프로그램이다.
또한, 본 발명은 문서 화상의 흑화소 연결 성분으로부터 문자 요소를 추출하는 문자 요소 추출 수단과, 행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 행 요소 추출 수단을 포함하는 것을 특징으로 한다.
또한, 본 발명은 문서 화상의 흑화소 연결 성분으로부터 문자 요소를 추출하는 문자 요소 추출 공정과, 행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 행 요소 추출 공정을 포함하는 것을 특징으로 한다.
이러한 발명에 따르면, 문서 화상의 흑화소 연결 성분으로부터 문자 요소를 추출하고, 행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하기 때문에, 문서 화상에서 행의 도중에 복수 행으로 분기하고 있는 경우나 괄호 내에 복수 행이 있는 경우에도 높은 정밀도로 행 레이아웃을 해석할 수 있다.
<발명의 실시 형태>
이하, 도면을 참조하여 본 발명에 따른 문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치 및 문서 레이아웃 해석 방법의 일 실시 형태에 대하여 상세히 설명한다.
도 1은 본 발명에 따른 일 실시 형태의 구성을 도시하는 블록도이다. 이 도 1에는, 예를 들면 도 2의 (a)∼도 2의 (c)에 도시한 문서 화상(200, 220, 240) 등을 해석 대상으로 하여, 문서에서의 행, 단 등의 레이아웃을 해석하는 문서 레이아웃 해석 장치(100)가 도시되어 있다.
이들 문서 화상(200, 220, 240)은, 예를 들면 일본에서 사용되고 있는 소득세 신고에 관련된 서식의 일부를 나타낸 것이다. 문서 화상(200)에는 괄호 내에 복수의 행(「取消し」 및 「取りやめ」)가 존재한다.
또, 이들의 용지의 문자열(한자와 '가나 문자')는 가로 쓰기(좌측으로부터 우측으로)로 나타나 있다. 또한, 도 2의 문서 화상(200)의 부호 1은 도 28의 (a)의 확대 문자 요소(201b, 201c)에 대응하고, 부호 2는 도 28의 (a)의 201f, 201g, 201h에 대응하고, 도 2의 문서 화상(240)의 부호 3은 도 28의 (c)의 확대 문자 요소(241b, 241c)에 대응하고 있다.
문서 화상(220)인 경우에는, 행 도중에 복수 행(「定めた」 및 「變更することとした」)으로 분기되어 있다. 문서 화상(240)에는 괄호 내에 복수의 행(「中間申告の場合はその稅額とし,マイナスの場合は(15)へ記入」)이 존재한다.
이 문서 레이아웃 해석 장치(100)에 있어서, 입력부(101)는 해석 대상의 문서 화상(예를 들면, 문서 화상(200, 220, 240) 등)을 입력하는 기능을 구비한다. 제어부(102)는 각 부를 제어함과 함께, 문서 화상에서의 단을 확정시키기 위한 처리를 실행한다.
흑화소 연결 성분 추출부(103)는 문서 화상(200, 220, 240)(도 2의 (a), 도 2의 (b) 및 도 2의 (c))의 데이터에 기초하여, 연속하는 흑화소를 흑화소 연결 성분으로서 추출하고, 각 흑화소 연결 성분에 외접하는 구형(이하, 외접 구형이라 함)을 설정하는 흑화소 연결 성분 추출 처리를 실행한다.
문자 후보 요소 생성부(104)는 흑화소 연결 성분 추출 처리의 결과를 이용하여, 문자 후보 요소를 생성하기 위한 문자 후보 요소 생성 처리를 실행한다. 가로 방향 행 구형 생성부(105)는 문자 후보 요소 생성 처리의 결과에 대하여, 가로 방향에 대하여 행 후보로서의 행 구형을 생성하는 가로 방향 행 구형 생성 처리를 실행한다.
가로단(橫段) 생성부(106)는 가로 방향의 행 구형으로부터 한묶음의 가로단을 생성하는 가로단 생성 처리를 실행한다. 세로 방향 행 구형 생성부(107)는 문자 후보 요소 생성 처리의 결과에 대하여, 세로 방향에 대하여 행 후보로서의 행 구형을 생성하는 세로 방향 행 구형 생성 처리를 실행한다.
세로단(縱段) 생성부(108)는 세로 방향의 행 구형으로부터 한묶음의 세로단을 생성하는 세로단 생성 처리를 실행한다. 기억부(109)는 각 처리의 실행 결과 등을 기억한다. 출력부(110)는 각 처리의 실행 결과 등을 출력한다.
이어서, 일 실시 형태의 동작에 대하여, 도 3∼도 19에 도시한 흐름도를 참조하면서 설명한다.
도 3에 도시한 단계 SA1에서는 입력부(101)는 해석 대상인 문서 화상의 데이터로서, 예를 들면 문서 화상(200)(도 2의 (a) 참조), 문서 화상(220)(도 2의 (b) 참조) 및 문서 화상(240)(도 2의 (c) 참조)의 데이터를 입력한다.
단계 SA2에서는, 흑화소 연결 성분 추출부(103)는 단계 SA1에서 입력된 문서 화상(200, 220, 240)의 데이터에 기초하여, 연속하는 흑화소를 흑화소 연결 성분으로서 추출하여, 흑화소 연결 성분에 외접하는 외접 구형을 설정하는 흑화소 연결 성분 추출 처리를 실행한다.
도 28의 (a)∼도 28의 (c)에는 흑화소 연결 성분 추출 처리의 결과가 도시되어 있다. 도 28의 (a)는 문서 화상(200)(도 2의 (a) 참조)에 대응하는 흑화소 연결 성분 추출 결과(201)를 도시하는 도면이다. 이 흑화소 연결 성분 추출 결과(201)에는, 연속하는 흑화소 성분(문자의 전체 또는 일부, 괄호나 기호의 전체 또는 일부 등) 각각에 외접 구형(201a, 201b, …, 201f, 201g, 201h, …)이 설정되어 있다.
도 28의 (b)는 문서 화상(220)(도 2 (b) 참조)에 대응하는 흑화소 연결 성분 추출 결과(221)를 도시하는 도면이다. 이 흑화소 연결 성분 추출 결과(221)에 있어서는, 연속하는 흑화소 성분의 각각에 외접 구형(221a, 221b, …)이 설정되어 있다.
도 28의 (c)는 문서 화상(240)(도 2의 (c) 참조)에 대응하는 흑화소 연결 성분 추출 결과(241)를 도시하는 도면이다. 이 흑화소 연결 성분 추출 결과(241)에 있어서는, 연속하는 흑화소 성분의 각각에 외접 구형(241a, 241b, 241c …)이 설정되어 있다.
도 3으로 되돌아가, 단계 SA3에서는 문자 후보 요소 생성부(104)는 상술한 흑화소 연결 성분 추출 처리의 결과(흑화소 연결 성분 추출 결과(201, 221, 241: 도 28의 (a), 도 28의 (b) 및 도 28의 (c))를 이용하여, 문자 후보 요소를 생성하기 위한 문자 후보 요소 생성 처리를 실행한다.
구체적으로는, 도 4에 도시한 단계 SB1에서는 문자 후보 요소 생성부(104)는 중첩 구형 통합 처리를 실행한다. 이 중첩 구형 통합 처리는 흑화소 연결 성분 추출 처리로 추출된 흑화소 연결 성분의 외접 구형을 문자 후보로 하여, 문자 사이즈가 「표준」 과 「소」(또는 「소」와 「대」)에 속하는 2개의 외접 구형이 중첩되고, 또한 소정의 조건을 충족시키는 경우에 2개의 외접 구형을 통합하는 처리이다.
도 5에 도시한 중첩 구형 통합 처리에 있어서, 단계 SC1에서는 문자 후보 요소 생성부(104)는 흑화소 연결 성분 추출 결과(201, 221, 241)(도 28의 (a), 도 28의 (b) 및 도 28의 (c))에서의 외접 구형(201a, 201b, …), 외접 구형(221a, 221b, …), 외접 구형(241a, 241b, …)(이하, 외접 구형군으로 칭함) 각각에 대하여, 문자 사이즈(「표준」, 「소」 및 「대」)를 분류한다.
여기서, 문자 사이즈는 외접 구형의 긴변 값을 기준으로 「표준」, 「소」및 「대」의 3 종류로 분류된다. 「표준」은 전체 외접 구형의 긴변 값의 평균을 채용하고, 평균값 M에 대하여 0.8M 이상∼1.2M 이하인 범위 내의 긴변 값을 갖는 외접 구형의 문자 사이즈이다.
「소」는 평균값 M에 대하여 0.8M 미만의 긴변 값을 갖는 외접 구형의 문자 사이즈이다. 「대」는 평균값 M에 대하여 1.2M를 초과하는 긴변 값을 갖는 외접 구형의 문자 사이즈이다. 또, 일 실시 형태에서는, 외접 구형의 긴변 값 대신에 대각선의 길이를 이용하여 문자 사이즈를 분류해도 된다.
단계 SC2에서는 문자 후보 요소 생성부(104)는, 흑화소 연결 성분 추출 결과(201, 221, 241)(도 28의 (a), 도 28의 (b) 및 도 28의 (c))에서의 외접 구형군으로부터 2개의 외접 구형을 선택한다.
단계 SC3에서는, 문자 후보 요소 생성부(104)는 상기 2개의 외접 구형에 대하여 중첩(접하고 있는 상태도 포함)이 있는지의 여부를 판단한다. 이 판단 결과가 「아니오」인 경우, 단계 SC8에서는 문자 후보 요소 생성부(104)는 외접 구형군에 대하여 모든 외접 구형과 비교하였는지의 여부를 판단하고, 이 경우, 판단 결과를 「아니오」로 하여, 단계 SC2의 처리를 실행한다.
한편, 단계 SC3의 판단 결과가 「예」인 경우, 단계 SC4에서는 문자 후보 요소 생성부(104)는 중첩되어 있는 2개의 외접 구형의 문자 사이즈가 「표준」과 「소」의 조합인지의 여부를 판단한다.
단계 SC4의 판단 결과가 「예」인 경우, 단계 SC6에서는, 문자 후보 요소 생성부(104)는 중첩되는 2개의 외접 구형을 통합한 경우, 즉 2개의 외접 구형에 대하여 외접 구형을 추가로 취한 경우의 그 외접 구형이 정방형인지의 여부를 판단한다. 단, 이후 일 실시 형태에서는 해당 외접 구형의 종횡비가 0.8 이상이면 정방형으로서 취급한다.
단계 SC6의 판단 결과가 「예」인 경우, 단계 SC7에서는 문자 후보 요소 생성부(104)는 중첩되는 2개의 외접 구형에 대하여 외접 구형을 추가로 취함으로써, 2개의 외접 구형을 하나의 외접 구형으로 통합한다.
한편, 단계 SC4의 판단 결과가 「아니오」인 경우, 단계 SC5에서는, 문자 후보 요소 생성부(104)는 중첩되어 있는 2개의 외접 구형의 문자 사이즈가 「소」와 「대」의 조합인지의 여부를 판단한다.
단계 SC5의 판단 결과가 「예」인 경우, 단계 SC6에서는 문자 후보 요소 생성부(104)는, 상술한 바와 같이, 2개의 외접 구형을 하나의 외접 구형으로 통합한 후 그 외접 구형이 정방형인지의 여부인 판단한다.
단계 SC6의 판단 결과가 「예」인 경우, 단계 SC7의 처리가 실행된다. 또한, 단계 SC5 또는 단계 SC6의 판단 결과가 「아니오」인 경우, 단계 SC8의 판단이 행해진다.
중첩 구형 통합 처리에 있어서는, 예를 들면 도 28의 (a)에 도시한 외접 구형(201f, 201g, 201h)이, 도 29의 (a)에 도시한 외접 구형(202f)에 통합된다.
그리고, 단계 SC8의 판단 결과가 「예」가 되면, 도 4에 도시한 단계 SB2에서는, 문자 후보 요소 생성부(104)는 인접 구형 통합 처리를 실행한다. 이 인접 구형 통합 처리는 외접 구형군에 있어서 중심(重心) 간의 유클리드 거리가 상호 가장 짧은 2개의 외접 구형을 선택하고, 2개의 외접 구형을 하나의 외접 구형으로 통합한 경우의 그 외접 구형이 정방형인 경우, 통합 후의 외접 구형을 문자 후보로 하는 처리이다.
구체적으로는, 도 6에 도시한 단계 SD1에서는 문자 후보 요소 생성부(104)는 흑화소 연결 성분 추출 결과(201, 221, 241)(도 28의 (a), 도 28의 (b) 및 도 28의 (c))에서의 외접 구형군(중첩 구형 통합 처리에 의해 통합된 외접 구형도 포함)의 각각에 대하여, 문자 사이즈(「표준」, 「소」 및 「대」)를 분류한다.
단계 SD2에서는, 문자 후보 요소 생성부(104)는 외접 구형군으로부터 2개의 외접 구형을 선택한다. 단계 SD3에서는 문자 후보 요소 생성부(104)는 상기 2개의 외접 구형에 대하여 중심 간의 유클리드 거리가 다른 외접 구형과의 유클리드 거리와 비교하여 가장 짧은지의 여부를 판단한다.
단계 SD3의 판단 결과가 「아니오」인 경우, 단계 SD8에서는 문자 후보 요소 생성부(104)는 외접 구형군에 대하여 모든 외접 구형과 비교하였는지의 여부를 판단하고, 이 경우 판단 결과를 「아니오」로 하여, 단계 SD2의 처리를 실행한다.
한편, 단계 SD3의 판단 결과가 「예」인 경우, 단계 SD4에서는 문자 후보 요소 생성부(104)는 2개의 외접 구형의 추가의 외접 구형을 취한 경우의 해당 외접 구형이, 다른 외접 구형과 중첩되는지의 여부를 판단한다.
단계 SD4의 판단 결과가 「아니오」인 경우, 단계 SD7에서는 문자 후보 요소 생성부(104)는 통합 후의 외접 구형이 정방형인지의 여부를 판단한다.
단계 SD7의 판단 결과가 「예」인 경우, 단계 SD6에서는, 문자 후보 요소 생성부(104)는 단계 SD2에서 선택한 2개의 외접 구형에 대하여 추가로 외접 구형을 취함으로써 2개의 외접 구형을 하나의 외접 구형으로 통합한다.
한편, 단계 SD4의 판단 결과가 「예」인 경우, 단계 SD5에서는, 문자 후보 요소 생성부(104)는, 통합 후의 외접 구형과, 그 외접 구형과 중첩되는 모든 외접 구형을 통합한 경우의 외접 구형이 정방형인지의 여부인 판단한다.
단계 SD5의 판단 결과가 「예」인 경우, 단계 SD6에서는, 문자 후보 요소 생성부(104)는, 단계 SD2에서 선택한 2개의 외접 구형을 하나로 통합한 외접 구형과, 그 외접 구형과 중첩되는 모든 외접 구형을 또 하나의 외접 구형으로 통합한다. 또한, 단계 SD5 또는 단계 SD7의 판단 결과가 「아니오」인 경우, 단계 SD8의 판단이 행해진다.
인접 구형 통합 처리에 있어서는, 예를 들면 도 28의 (c)에 도시한 외접 구형(241b, 241c)이 도 29의 (c)에 도시한 외접 구형(242b)으로 통합된다.
그리고, 단계 SD8의 판단 결과가 「예」가 되면, 인접 구형 통합 처리가 종료하고, 문자 후보 요소 생성 처리가 종료한다.
도 29의 (a)∼도 29의 (c)에는, 문자 후보 요소 생성 처리의 결과가 도시되어 있다. 도 29의 (a)는, 흑화소 연결 성분 추출 결과(201)(도 28의 (a) 참조)에 대응하는 문자 후보 요소 생성 결과(202)를 도시하는 도면이다. 이 문자 후보 요소 생성 결과(202)에 있어서는, 문자 후보 요소로서의 외접 구형(202a, 202b, …, 202f, …)이 설정되어 있다.
도 29의 (b)는, 흑화소 연결 성분 추출 결과(221)(도 28의 (b) 참조)에 대응하는 문자 후보 요소 생성 결과(222)를 도시하는 도면이다. 이 문자 후보 요소 생성 결과(222)에 있어서는, 문자 후보 요소로서의 외접 구형(222a, 222b, …)이 설정되어 있다.
도 29의 (c)는 흑화소 연결 성분 추출 결과(241)(도 28의 (c) 참조)에 대응하는 문자 후보 요소 생성 결과(242)를 도시하는 도면이다. 이 문자 후보 요소 생성 결과(242)에 있어서는 문자 후보 요소로서의 외접 구형(242a, 242b, …)이 설정되어 있다.
상술한 문자 후보 요소 생성 처리가 종료하면, 도 3에 도시한 단계 SA4 및 단계 SA5의 처리와, 단계 SA7 및 단계 SA8의 처리가 병렬적으로 실행된다.
즉, 단계 SA4에서는, 가로 방향 행 구형 생성부(105)는 가로 방향 행 구형 생성 처리를 실행한다. 이 가로 방향 행 구형 생성 처리는, 문자 후보 요소 생성 결과(202)(도 29의 (a) 참조), 문자 후보 요소 생성 결과(222)(도 29의 (b) 참조) 및 문자 후보 요소 생성 결과(242)(도 29의 (c) 참조)에 대하여 가로 방향(도 29의 (a) 참조)에 대하여 행 후보로서의 행 구형(행의 통합을 나타내는 외접 구형)을 생성하기 위한 처리이다.
구체적으로는, 도 7에 도시한 단계 SE1에서는 가로 방향 행 구형 생성부(105)는 문자 사이즈별 행 후보 생성 처리를 실행한다. 이 문자 사이즈별 행 후보 생성 처리는 문자 사이즈(「표준」, 「소」 및 「대」)별로 분류하고, 문자 사이즈별로 가로 방향의 행 후보를 생성하기 위한 처리이다.
즉, 도 8에 도시한 단계 SF1에서는 가로 방향 행 구형 생성부(105)는 문자후보 요소 생성 결과(202)(도 29의 (a) 참조), 문자 후보 요소 생성 결과(222)(도 29의 (b) 참조) 및 문자 후보 요소 생성 결과(242)(도 29의 (c) 참조)에서의 외접 구형(202a, 202b, …, 202f, …), 외접 구형(222a, 222b, …), 외접 구형(242a, 242b, …)의 각각에 대하여, 문자 사이즈(「표준」, 「소」 및 「대」)를 분류한다.
단계 SF2에서는 가로 방향 행 구형 생성부(105)는 도 20에 도시한 바와 같이, 문자 사이즈별로 옆의 문자를 설정한다.
도 8에 있어서는, 옆의 문자는, 외접 구형(300)의 중심(300a)으로부터 행 방향(가로 방향)으로 직선(300b)을 연장시킨 경우에, 직선(300b)과 최초로 교차하고, 또한 외접 구형(300)과 동일한 문자 사이즈인 외접 구형(302)(문자 후보)을 가리킨다. 또, 외접 구형(301)은 외접 구형(302)보다도 외접 구형(300)에 거리가 가깝지만, 상기 조건을 만족시키지 않기 때문에 옆의 문자가 아니다.
단계 SF3에서는, 가로 방향 행 구형 생성부(105)는 각 문자(외접 구형)의 행 방향 불안정도 V를 다음 수학식 1로 계산한다.
예를 들면, 도 21에 도시한 외접 구형(310)의 행 방향 불안정도 V를 구하는 경우, 수학식 1에 있어서, ak는 외접 구형(310)과 동일한 문자 사이즈이고, 행 방향에서 k번째에 가까운 문자에 대응하는 외접 구형(311)의 중심(311a)과, 외접구형(310)의 중심(310a)과의 거리이다. bk는 외접 구형(310)의 베이스 라인(314)(또는 중심으로부터의 행 방향 연장선이라도 가능)으로부터의 거리(편차량)이다.
n은 대상이 되는 외접 구형의 수로, 예를 들면 5이다. 또, 외접 구형(312, 313)은 외접 구형(310)과 문자 사이즈가 다르다. 이와 같이, 행 방향 불안정도 V는 외접 구형(310)과 동일한 문자 사이즈의 외접 구형의 5개(n=5)에 대하여, 행 방향에 대한 변동 상태를 나타낸다.
단계 SF4에서는, 가로 방향 행 구형 생성부(105)는 행 방향 불안정도 V가 임계값 이하인지의 여부를 판단하고, 이 판단 결과가 「아니오」인 경우, 단계 SF7의 판단을 행한다.
한편, 단계 SF4의 판단 결과가 「예」인 경우, 단계 SF5에서는, 가로 방향 행 구형 생성부(105)는 해당 문자(외접 구형(310): 도 21 참조)와 옆의 문자(5 갯수분의 외접 구형(311, …): 도 21 참조)를 관련시킨다.
단계 SF6에서는, 가로 방향 행 구형 생성부(105)는 관련시킨 문자열의 각 외접 구형(6개의 외접 구형)에 대하여 외접 구형을 추가로 취하여, 이것을 행 후보 구형으로서 생성한다.
단계 SF7에서는 가로 방향 행 구형 생성부(105)는 문자 후보 요소 생성 결과(202)(도 29의 (a) 참조), 문자 후보 요소 생성 결과(222)(도 29의 (b) 참조) 및 문자 후보 요소 생성 결과(242)(도 29의 (c) 참조)에 대하여, 가로 방향에 관한 행 후보 구형의 생성이 종료하였는지의 여부를 판단하고, 이 경우, 판단 결과를 「아니오」로 하여, 단계 SF4의 판단을 행한다. 그리고, 단계 SF7의 판단 결과가 「예」가 되면, 문자 사이즈별 행 후보 생성 처리가 종료한다.
도 30의 (a)∼도 30의 (c)에는 가로 방향의 문자 사이즈별 행 후보 생성 처리의 결과가 도시되어 있다. 도 30의 (a)는 문자 후보 요소 생성 결과(202)(도 29의 (a) 참조)에 대응하는 문자 사이즈별 행 후보 생성 결과(203)를 도시하는 도면이다. 이 문자 사이즈별 행 후보 생성 결과(203)에 있어서는, 행 후보 구형(203a, 203b, …, 203l, …)이 설정되어 있다.
도 30의 (b)는 문자 후보 요소 생성 결과(222)(도 29의 (b) 참조)에 대응하는 문자 사이즈별 행 후보 생성 결과(223)를 도시하는 도면이다. 이 문자 사이즈별 행 후보 생성 결과(223)에 있어서는 행 후보 구형(223a, 223b, …, 223f, …)가 설정되어 있다.
도 30의 (c)는 문자 후보 요소 생성 결과(242)(도 29의 (c) 참조)에 대응하는 문자 사이즈별 행 후보 생성 결과(243)를 도시하는 도면이다. 이 문자 사이즈별 행 후보 생성 결과(243)에 있어서는 행 후보 구형(243a, 243b, …, 243m)이 설정되어 있다.
도 7로 되돌아가, 단계 SE2에서는 가로 방향 행 구형 생성부(105)는 행 후보 통합 처리를 실행한다. 이 행 후보 통합 처리는 도 22의 (a) 및 도 22의 (b)에 도시한 바와 같이, 문자 사이즈 및 행 후보 구형의 중첩 상태에 따라, 복수의 행 후보 구형을 통합하기 위한 처리이다.
도 22의 (a)에 도시한 행 후보 구형(320)과 행 후보 구형(321)에 대하여, 베이스라인(320a)과 베이스라인(321a)의 차 d1이, 임계값(예를 들면, 0.3h) 이하인 경우에는, 행 후보 구형(320)과 행 후보 구형(321)의 외접 구형이 취해짐으로써, 양자가 통합된다. 여기서, 행 후보 구형(320)과 행 후보 구형(321)은 문자 사이즈가 동일한 것으로 되어 있다. 또한, h는 행 후보 구형(320)의 높이이다.
한편, 도 22의 (b)에 도시한 바와 같이, 문자 사이즈가 서로 다른 행 후보 구형(322)과 행 후보 구형(323)인 경우에는, 중심선(322a)과 중심선(323a)의 차 d2가 임계값(예를 들면, 0.3h) 이하인 경우에는 행 후보 구형(322)과 행 후보 구형(323)의 외접 구형이 취해짐으로써 양자가 통합된다.
구체적으로는, 도 9에 도시한 단계 SG1에서는, 가로 방향 행 구형 생성부(105)는 문자 사이즈별 행 후보 생성 결과(203)(도 30의 (a) 참조), 문자 사이즈별 행 후보 생성 결과(223)(도 30의 (b) 참조) 및 문자 사이즈별 행 후보 생성 결과(243)(도 30의 (c) 참조)에서의 행 후보 구형(203a, 203b, …, 202l, …), 행 후보 구형(223a, 223b, …), 행 후보 구형(243a, 243b, …)(이하, 행 후보 구형군으로 칭함) 각각에 대하여, 문자 사이즈(「표준」, 「소」 및 「대」)를 분류한다.
단계 SG2에서는, 가로 방향 행 구형 생성부(105)는 문자 사이즈별 행 후보 생성 결과(203, 223, 243)(도 30의 (a), 도 30의 (b) 및 도 30의 (c))에서의 행 후보 구형군으로부터 2개의 행 후보 구형을 선택한다.
단계 SG3에서는, 가로 방향 행 구형 생성부(105)는 상기 2개의 행 후보 구형에 대하여 중첩이 있는지의 여부를 판단한다. 이 판단 결과가 「아니오」인 경우,단계 SG9에서는 가로 방향 행 구형 생성부(105)는 2개의 행 후보 구형이 인접하여 있는지의 여부를 판단한다. 여기서, 인접이란, 2개의 행 후보 구형에 대하여 중심 간의 유클리드 거리가 임계값 이하인 상태를 말한다.
단계 SG9의 판단 결과가 「아니오」인 경우, 단계 SG7의 판단이 행해진다. 단계 SG7에서는, 가로 방향 행 구형 생성부(105)는 행 후보 구형군에 대하여 모든 행 후보 구형과 비교하였는지의 여부를 판단하고, 이 경우 판단 결과를 「아니오」로 하여 단계 SG2의 처리를 실행한다.
한편, 단계 SG9의 판단 결과가 「예」인 경우, 단계 SG10에서는, 가로 방향 행 구형 생성부(105)는 2개의 행 후보 구형의 문자 사이즈가 같은지의 여부를 판단한다.
단계 SG10의 판단 결과가 「아니오」인 경우, 단계 SG12에서는, 가로 방향 행 구형 생성부(105)는 도 22의 (b)를 참조하여 설명한 바와 같이, 2개의 행 후보 구형(단, 중첩되어 있지 않음)의 각 중심선의 차(d2)가 임계값(예를 들면, 0.3h) 이하인지의 여부를 판단하고, 이 판단 결과가 「아니오」인 경우, 2개의 행 후보 구형의 통합을 행하지 않고, 단계 SG7의 판단을 행한다.
한편, 단계 SG12의 판단 결과가 「예」인 경우, 단계 SG6에서는, 가로 방향 행 구형 생성부(105)는 2개의 행 후보 구형에 대하여 외접 구형을 취하고, 그 외접 구형을 통합 후의 행 후보 구형으로 한다.
또한, 단계 SG10의 판단 결과가 「예」인 경우, 단계 SG11에서는 가로 방향행 구형 생성부(105)는 도 22의 (a)을 참조하여 설명한 바와 같이, 2개의 행 후보 구형(단, 중첩되어 있지 않음)의 베이스 라인의 차(d1)가 임계값(예를 들면, 0.3h) 이하인지의 여부를 판단하고, 이 판단 결과가 「아니오」인 경우, 2개의 행 후보 구형의 통합을 행하지 않고, 단계 SG7의 판단을 행한다.
한편, 단계 SG11의 판단 결과가 「예」인 경우, 단계 SG6에서는 가로 방향 행 구형 생성부(105)는 2개의 행 후보 구형에 대하여 외접 구형을 취하고, 그 외접 구형을 통합 후의 행 후보 구형으로 한다.
또한, 단계 SG3의 판단 결과가 「예」인 경우, 단계 SG4에서는, 가로 방향 행 구형 생성부(105)는 2개의 행 후보 구형의 문자 사이즈가 같은지의 여부를 판단한다.
단계 SG4의 판단 결과가 「예」인 경우, 단계 SG5에서는 가로 방향 행 구형 생성부(105)는 도 22의 (a)을 참조하여 설명한 바와 같이, 2개의 행 후보 구형의 베이스 라인의 차(d1)가 임계값(예를 들면, 0.3h) 이하인지의 여부를 판단하고, 이 판단 결과가 「아니오」인 경우, 2개의 행 후보 구형의 통합을 행하지 않고, 단계 SG7의 판단을 행한다.
한편, 단계 SG5의 판단 결과가 「예」인 경우, 단계 SG6에서는 가로 방향 행 구형 생성부(105)는 2개의 행 후보 구형에 대하여 외접 구형을 취하고, 그 외접 구형을 통합 후의 행 후보 구형으로 한다.
또한, 단계 SG4의 판단 결과가 「아니오」인 경우, 단계 SG8에서는 가로 방향 행 구형 생성부(105)는 도 22의 (b)를 참조하여 설명한 바와 같이, 2개의 행 후보 구형의 각 중심선의 차(d2)가 임계값(예를 들면, 0.3h) 이하인지의 여부인 판단하고, 이 판단 결과가 「아니오」인 경우, 2개의 행 후보 구형의 통합을 행하지 않고, 단계 SG7의 판단을 행한다.
한편, 단계 SG8의 판단 결과가 「예」인 경우, 단계 SG6에서는 가로 방향 행 구형 생성부(105)는 2개의 행 후보 구형에 대하여 외접 구형을 취하고, 그 외접 구형을 통합 후의 행 후보 구형으로 한다.
도 32의 (a)∼도 32의 (c)에는 가로 방향의 행 후보 통합 처리의 결과가 도시되어 있다. 도 32의 (a)는 문자 사이즈별 행 후보 생성 결과(203)(도 30의 (a) 참조)에 대응하는 행 후보 통합 결과(205)를 도시하는 도면이다. 이 행 후보 통합 결과(205)에 있어서는, 행 후보 구형(205a, 205b, …, 205f)이 설정되어 있다.
도 32의 (b)는 문자 사이즈별 행 후보 생성 결과(223)(도 30의 (b) 참조)에 대응하는 행 후보 통합 결과(225)를 도시하는 도면이다. 이 행 후보 통합 결과(225)에 있어서는, 행 후보 구형(225a, 225b, …, 225d)이 설정되어 있다.
도 32의 (c)는 문자 사이즈별 행 후보 생성 결과(243)(도 30의 (c) 참조)에 대응하는 행 후보 통합 결과(245)를 도시하는 도면이다. 이 행 후보 통합 결과(245)에 있어서는 행 후보 구형(245a, 245b, …, 245i)이 설정되어 있다.
그리고, 단계 SG7의 판단 결과가 「예」가 되면, 도 7에 도시한 단계 SE3에서는, 가로 방향 행 구형 생성부(105)는 장행 절단 처리를 실행한다. 이 장행 절단 처리는 행 후보 통합 처리로 장행 후보 구형이 생성되는 경우가 있기 때문에, 장행 후보 구형을 적절한 위치에서 절단하기 위한 처리이다.
먼저, 도 10 및 도 23을 참조하여, 행 후보 구형에서의 문자 간격이 크게 변화하고 있는 위치에서 행을 절단하기 위한 장행 절단 처리에 대하여 설명한다.
도 23에 도시한 행 후보 구형(336)은 문자(문자 후보 요소)(330, 331, 332, 333, 334 및 335)를 포함하고 있다. 문자(332)는 k-1번째 문자이다. 문자(333)는 k번째 문자이다.
장행 절단 처리에 있어서는, 예를 들면 문자(332)와 문자(333)와의 문자 간격 gk가 다음 수학식 2로부터 얻어지는 평균 문자 간격 G의 1.75배를 초과한 경우에, 행 후보 구형(336)을 문자(332)와 문자(333) 사이에서 절단한다.
수학식 2에 있어서, 평균 문자 간격 G는, 예를 들면 행 후보 구형(336)에서의 문자 간격 gn(n=1∼k-1)의 평균값이다.
구체적으로는, 도 10에 도시한 단계 SH1에서는, 가로 방향 행 구형 생성부(105)는 행(행 후보 구형)에 포함되는 문자를 소트한다. 단계 SH2에서는, 가로 방향 행 구형 생성부(105)는 문자가 1문자째인지의 여부를 판단하고, 이 경우 판단 결과를 「예」로 한다.
단계 SH9에서는, 가로 방향 행 구형 생성부(105)는 해당 행(행 후보 구형)의다음 문자를 선택한다. 단계 SH2에서는 가로 방향 행 구형 생성부(105)는 판단 결과를 「아니오」로 한다. 단계 SH3에서는 가로 방향 행 구형 생성부(105)는 앞의 문자와 해당 문자의 문자 간격 g를 구한다. 단계 SH4에서는, 가로 방향 행 구형 생성부(105)는 해당 문자가 2문자째인지의 여부를 판단한다.
단계 SH4의 판단 결과가 「예」인 경우, 단계 SH8에서는 가로 방향 행 구형 생성부(105)는 1문자째와 2 문자째 사이의 문자 간격 g가, 1 문자째의 폭의 10배 이상인지의 여부를 판단한다. 단계 SH8의 판단 결과가 「아니오」인 경우, 단계 SH9의 처리가 실행된다.
한편, 단계 SH3의 판단 결과가 「예」인 경우, 단계 SH6에서는 가로 방향 행 구형 생성부(105)는 현재의 문자와 앞의 문자 사이에서 행 후보 구형을 절단하고, 현재의 문자를 1문자째로 한다. 단계 SH7에서는 행 후보 구형에 다음 문자가 있는지의 여부를 판단하고, 이 경우, 판단 결과를 「예」로 한다. 이후, 단계 SH2 이후가 반복된다.
여기서, 단계 SH4의 판단 결과가 「아니오」인 경우, 단계 SH5에서는 가로 방향 행 구형 생성부(105)는 2개의 문자에 대한 문자 간격 g가, 상술한 수학식 2로부터 구해지는 평균 문자 간격 G의 1.75배를 초과하고 있는지의 여부를 판단한다. 단계 SH5의 판단 결과가 「아니오」인 경우, 단계 SH9의 처리가 실행된다.
한편, 단계 SH5의 판단 결과가 「예」인 경우, 단계 SH6에서는 가로 방향 행 구형 생성부(105)는 현재의 문자와 앞의 문자 사이에서 행 후보 구형을 절단하고, 현재의 문자를 1문자째으로 한다. 그리고, 단계 SH7의 판단 결과가 「아니오」가되면, 장행 절단 처리가 종료한다.
이어서, 도 11 및 도 24을 참조하여, 주목하고 있는 행(행 후보 구형)이 다른 행(행 후보 구형)과 중첩되어 있는 경우에 주목하고 있는 행(행 후보 구형)을 절단하기 위한 장행 절단 처리에 대하여 설명한다. 또, 도 11에 도시한 장행 절단 처리와 도 10에 도시한 장행 절단 처리는 병렬적으로 실행된다.
도 24의 (a)에 도시한 행 후보 구형(340)은 문자(문자 후보 요소)(341, 342, 343, 344 및 345)를 포함하고 있고, 행 후보 구형(346)과 중첩되어 있다. 행 후보 구형(346)은 문자(문자 후보 요소)(347, 348)를 포함하고 있다.
또한, 행 후보 구형(340)에 포함되는 문자가 다른 행 후보 구형(346)과 중첩되어 있지 않는 조건에서는, 행 후보 구형(340)은 도 24의 (b)에 도시한 바와 같이, 행 후보 구형(346)의 위치에서 행 후보 구형(350)과 행 후보 구형(370)으로 절단된다. 행 후보 구형(350)은 문자(341, 342 및 343)를 포함하고 있다. 한편, 행 후보 구형(370)은 문자(344, 345)를 포함하고 있다.
구체적으로는, 도 11에 도시한 단계 SI1에서는, 가로 방향 행 구형 생성부(105)는 행 후보 구형군으로부터 2개의 행 후보 구형을 선택한다. 단계 SI2에서는, 가로 방향 행 구형 생성부(105)는 2개의 행 후보 구형 중 한쪽을 행 후보 구형 a, 다른 쪽을 행 후보 구형 b로 한다.
단계 SI3에서는, 가로 방향 행 구형 생성부(105)는 행 후보 구형 a와 행 후보 구형 b가 중첩되는지의 여부를 판단한다. 단계 SI3의 판단 결과가 「아니오」인 경우, 단계 SI6에서는, 가로 방향 행 구형 생성부(105)는 행 후보 구형군에 대하여 모든 행 후보 구형과 비교하였는지의 여부를 판단하고, 이 경우, 판단 결과를 「아니오」로 한다.
한편, 단계 SI3의 판단 결과가 「예」인 경우(도 24의 (a) 참조), 단계 SI4에서는 가로 방향 행 구형 생성부(105)는, 행 후보 구형 a에 포함되는 문자가 행 후보 구형 b에 포함되는 문자와 중첩되는지의 여부를 판단한다. 단계 SI4의 판단 결과가 「예」인 경우, 단계 SI6의 판단이 행해진다.
한편, 단계 SI4의 판단 결과가 「아니오」인 경우, 단계 SI5에서는 가로 방향 행 구형 생성부(105)는 행 후보 구형 b에 포함되는 최초의 문자보다도 행 후보 구형 a 에 포함되는 문자의 좌표가 큰 경우, 하나 앞의 문자(도 24의 (a)인 경우, 문자(343))와의 사이에서 행 후보 구형을 절단하여, 2개의 행 후보 구형을 생성하여, 단계 SI6의 판단을 행한다.
그리고, 단계 SI6의 판단 결과가 「예」가 되면, 장행 절단 처리가 종료한다.
도 34의 (a)∼도 34의 (c)에는 가로 방향의 장행 절단 처리의 결과가 도시되어 있다. 도 34의 (a)는, 행 후보 통합 결과(205)(도 32의 (a) 참조)에 대응하는 장행 절단 결과(207)를 도시하는 도면이다. 이 장행 절단 결과(207)에 있어서는, 행 후보 구형(207a, 207b, …, 207h)이 설정되어 있다.
도 34의 (b)는 행 후보 통합 결과(225)(도 32의 (b) 참조)에 대응하는 장행 절단 결과(227)를 도시하는 도면이다. 이 장행 절단 결과(227)에 있어서는, 행 후보 구형(227a, 227b, …, 227e)이 설정되어 있다.
도 34의 (c)는 행 후보 통합 결과(245)(도 32의 (c) 참조)에 대응하는 장행 절단 결과(247)를 도시하는 도면이다. 이 장행 절단 결과(247)에 있어서는, 행 후보 구형(247a, 247b, …, 247j)이 설정되어 있다.
도 7에 도시한 단계 SE4에서는, 가로 방향 행 구형 생성부(105)는 상술한 장행 절단 처리의 결과(장행 절단 결과(207, 227 및 247): 도 34의 (a), 도 34의 (b) 및 도 34의 (c))에서의 행 후보 구형군을 이용하여, 단행 통합 처리를 실행한다. 이 단행 통합 처리는, 도 25의 (a) 및 도 25의 (b)에 도시한 바와 같이, 인접하는 2개의 단행 후보 구형을 하나의 행 후보 구형으로 통합하기 위한 처리이다.
구체적으로는, 도 12에 도시한 단계 SJ1에서는, 가로 방향 행 구형 생성부(105)는 도 25의 (a)에 도시한 바와 같이, 행 후보 구형(380, 381, 382 및 383)으로 이루어지는 단에 대하여, 각 행 후보 구형의 행 방향 길이를 구한 후, 행 방향 길이의 최빈치(最頻値) wmax를 구한다. 이 최빈치 wmax는 상기 단의 행 방향 길이에 거의 가까운 값이다.
단계 SJ2에서는, 가로 방향 행 구형 생성부(105)는 단에 있어서 행 방향으로 인접하는 2개의 행 후보 구형을 선택한다. 도 25의 (a)인 경우에는 행 후보 구형(381) 및 행 후보 구형(382)이 선택된다.
단계 SJ3에서는 가로 방향 행 구형 생성부(105)는 단계 SJ2에서 선택한 2개의 행 후보 구형을 하나의 행 후보 구형으로 통합한 경우의 행 방향 길이 w를 구한다. 단계 SJ4에서는, 가로 방향 행 구형 생성부(105)는 행 방향 길이 w가 최빈치 wmax의 1.2배 미만인지의 여부를 판단한다.
단계 SJ4의 판단 결과가 「예」인 경우, 단계 SJ5에서는 가로 방향 행 구형 생성부(105)는, 도 25의 (a)에 도시한 행 후보 구형(381) 및 행 후보 구형(382)을 도 25의 (b)에 도시한 행 후보 구형(384)으로 통합한다.
단계 SJ6에서는, 가로 방향 행 구형 생성부(105)는 모든 행 후보 구형과 비교하였는지의 여부를 판단하고, 이 판단 결과가 「아니오」인 경우, 단계 SJ2의 처리를 실행한다. 또, 단계 SJ4의 판단 결과가 「아니오」인 경우에는 단계 SJ6의 판단이 행해진다.
도 36의 (a)∼도 36의 (c)에는 가로 방향의 단행 통합 처리의 결과가 도시되어 있다. 도 36의 (a)는 장행 절단 결과(207)(도 34의 (a) 참조)에 대응하는 단행 통합 결과(209)를 도시하는 도면이다. 이 단행 통합 결과(209)에 있어서는, 행 후보 구형(209a, 209b, …, 209g)이 설정되어 있다. 예를 들면, 행 후보 구형(209g)은 도 34의 (a)에 도시한 행 후보 구형(207g, 207h)가 통합된 것이다.
도 36의 (b)는 장행 절단 결과(227)(도 34의 (b) 참조)에 대응하는 단행 통합 결과(229)를 도시하는 도면이다. 이 단행 통합 결과(229)에 있어서는, 행 후보 구형(229a, 229b, …, 229e)이 설정되어 있다.
도 36의 (c)는 장행 절단 결과(247)(도 34의 (c) 참조)에 대응하는 단행 통합 결과(249)를 도시하는 도면이다. 이 단행 통합 결과(249)에 있어서는, 행 후보 구형(249a, 249b, …, 249j)이 설정되어 있다.
그리고, 단계 SJ6의 판단 결과가 「예」가 되면, 가로 방향의 단행 통합 처리가 종료하고, 도 7에 도시한 가로 방향 행 구형 생성 처리도 종료한다. 도 3에도시한 단계 SA5에서는, 가로단 생성부(106)는 상술한 가로 방향의 단행 통합 처리의 결과(단행 통합 결과(209, 229 및 249: 도 36의 (a), 도 36의 (b) 및 도 36의 (c))에서의 행 후보 구형군을 이용하여, 수직 방향의 복수의 행 후보 구형을 한묶음의 가로단으로 하는 가로단 생성 처리를 실행한다.
구체적으로는, 도 13에 도시한 단계 SK1에서는 가로단 생성부(106)는 행 후보 구형군에 대하여, 어느 정도 동일한 길이의 복수의 행 후보 구형을 동일한 가로단에 속하는 행 후보 구형으로서 통합하기 위한 동일 장행 통합 처리를 실행한다.
즉, 도 14에 도시한 단계 SL1에서는, 가로단 생성부(106)는 행 후보 구형군에 대하여, 행 후보 구형의 행 수직 방향으로 인접하는 2개의 행 후보 구형을 선택한다. 단계 SL2에서는, 가로단 생성부(106)는 2개의 행 후보 구형에 대하여 가로 방향 행의 길이의 비가 1.1배 이하(거의 동일 길이)인지의 여부를 판단한다.
단계 SL2의 판단 결과가 「아니오」인 경우, 단계 SL5에서는, 가로단 생성부(106)는 행 후보 구형군에 대하여 모든 행 후보 구형과 비교하였는지의 여부를 판단하고, 이 경우, 판단 결과를 「아니오」로 하고, 단계 SL1의 처리를 실행한다.
한편, 단계 SL2의 판단 결과가 「예」인 경우, 단계 SL3에서는 가로단 생성부(106)는 2개의 행 후보 구형에 대하여 행간이 행 높이의 3배 이하인지의 여부를 판단하고, 이 판단 결과가 「아니오」인 경우, 단계 SL5의 판단을 행한다.
한편, 단계 SL3의 판단 결과가 「예」인 경우, 단계 SL4에서는 가로단 생성부(106)는 2개의 행 후보 구형을 동일한 가로단에 속하는 행 후보 구형으로서 통합한다. 이후, 단계 SL5의 판단 결과가 「예」가 될 때까지 상술한 동작이 반복된다.
그리고, 단계 SL5의 판단 결과가 「예」가 되면, 동일 장행 통합 처리가 종료한다. 도 13에 도시한 단계 SK2에서는 가로단 생성부(106)는 상술한 동일 장행 통합 처리의 결과를 이용하여, 단 인접 행 통합 처리를 실행한다.
이 단 인접 행 통합 처리는 도 26의 (a)에 도시한 바와 같이, 단 구형(391)과, 단 구형(391)에 인접하는 행 구형(392)을 단 구형(390)으로서 통합하기 위한 처리이다. 단 구형(391)은, 동일 장행 통합 처리로 통합된 복수의 행으로 구성되어 있다.
즉, 도 15에 도시한 단계 SM1에서는 가로단 생성부(106)는 도 26의 (a)에 도시한 바와 같이, 행 수직 방향으로 인접하는 단 구형(391)과 행 구형(392)을 선택한다.
단계 SM2에서는, 가로단 생성부(106)는 행 구형(392)을 단 구형(391)에 통합한 후 단 구형(390)이 다른 행 구형과 중첩되는지의 여부를 판단하고, 이 경우 판단 결과를 「아니오」로 한다.
단계 SM3에서는, 가로단 생성부(106)는 행 구형(392)을 단 구형(391)에 통합하여, 행 구형(392)과 단 구형(391)과의 외접 구형을 취하고, 이것을 단 구형(390)으로 한다. 단계 SM4에서는 가로단 생성부(106)는 모든 행 후보 구형과 비교하였는지의 여부를 판단하고, 이 경우 판단 결과를 「아니오」로 하여, 단계 SM1의 처리를 실행한다.
단계 SM1에서는 가로단 생성부(106)는 도 26의 (b)에 도시한 바와 같이, 행 수직 방향으로 인접하는 단 구형(393)과 행 구형(394)을 선택한다.
단계 SM2에서는 가로단 생성부(106)는 행 구형(394)을 단 구형(393)에 통합한 후의 단 구형(396)이 다른 행 구형과 중첩되는지의 여부를 판단하고, 이 경우에는 단 구형(396)이 행 구형(395)과 중첩되기 때문에, 판단 결과를 「예」로 하고, 단계 SM4의 판단을 행한다. 이 경우에는, 행 구형(394)과 단 구형(393)이 통합되지 않는다.
그리고, 단계 SM4의 판단 결과가 「예」가 되면, 단 인접 행 통합 처리가 종료한다. 도 13에 도시한 단계 SK3에서는, 가로단 생성부(106)는 상술한 단 인접 행 통합 처리의 결과를 이용하여, 중앙 정렬 행 통합 처리를 실행한다.
이 중앙 정렬 행 통합 처리는, 도 27에 도시한 바와 같이 행 후보 구형(400)과, 행 후보 구형(400)에 인접하는 행 후보 구형(401)이 중앙 정렬의 위치 관계에 있는 경우, 행 후보 구형(400)과 행 후보 구형(401)을 동일한 단에 속하는 것으로 하여 통합하기 위한 처리이다.
즉, 도 16에 도시한 단계 SO1에서는, 가로단 생성부(106)는 도 27에 도시한 바와 같이, 행 수직 방향으로 인접 또한 동일한 문자 사이즈의 행 후보 구형(400)과 행 후보 구형(401)을 선택한다.
단계 SO2에서는, 가로단 생성부(106)는, 행 후보 구형(400)의 중심(400a)과, 행 후보 구형(401)의 중심(401a)의 행 방향의 차 dc(수선(400b)과 수선(401b) 사이의 거리)가 행 후보 구형(400)의 높이 h보다도 작은지의 여부를 판단한다.
단계 SO2의 판단 결과가 「예」인 경우, 단계 SO3에서는 가로단 생성부(106)는 행 후보 구형(400)과 행 후보 구형(401)이 동일한 단에 속하는 것으로 하여, 양자를 통합하여 행 후보 구형(400)과 행 후보 구형(401)의 외접 구형을 취하고, 이것을 단 구형으로 한다.
한편, 단계 SO2의 판단 결과가 「아니오」인 경우, 단계 SO4에서는, 가로단 생성부(106)는 모든 행 후보 구형과 비교하였는지의 여부를 판단하고, 이 경우 판단 결과를 「아니오」로 하고 단계 SO1의 처리를 실행한다.
그리고, 단계 SO4의 판단 결과가 「예」가 되면, 중앙 정렬 행 통합 처리가 종료하여, 도 13에 도시한 가로단 생성 처리가 종료한다.
도 38의 (a)∼도 38의 (c)에는 가로단 생성 처리의 결과가 도시되어 있다. 도 38의 (a)는 단행 통합 결과(209)(도 36의 (a) 참조)에 대응하는 가로단 생성 결과(211)를 도시하는 도면이다.
이 가로단 생성 결과(211)에 있어서는, 가로 방향의 단 구형(211a, …)이 설정되어 있다. 단 구형(211a)은 도 36의 (a)에 도시한 행 후보 구형(209c, 209d)이 통합된 것이다.
도 38의 (b)는 단행 통합 결과(229)(도 36의 (b) 참조)에 대응하는 가로단 생성 결과(231)를 도시하는 도면이다. 이 가로단 생성 결과(231)에 있어서는, 가로 방향의 단 구형(231a, …)이 설정되어 있다. 단, 구형(231a)은 도 36의 (b)에 도시한 행 후보 구형(229c, 229d)이 통합된 것이다.
도 38의 (c)는 단행 통합 결과(249)(도 36의 (c) 참조)에 대응하는 가로단 생성 결과(251)를 도시하는 도면이다. 이 가로단 생성 결과(251)에 있어서는, 가로 방향의 단 구형(251a, 251b, …)이 설정되어 있다.
단 구형(251a)은 도 36의 (c)에 도시한 행 후보 구형(249a, 249b, 249c, 249d)이 통합된 것이다. 또한, 단 구형(251b)은 도 36의 (c)에 도시한 행 후보 구형(249e, 249f, 249g, 249h)이 통합된 것이다.
또한, 상술한 가로 방향 행 구형 생성 처리(단계 SA4) 및 가로단 생성 처리(단계 SA5)의 실행 중에서는 병렬, 세로 방향 행 구형 생성 처리(단계 SA7) 및 세로단 생성 처리(단계 SA8)가 실행된다.
즉, 단계 SA7에서는 세로 방향 행 구형 생성부(107)는 세로 방향 행 구형 생성 처리를 실행한다. 이 세로 방향 행 구형 생성 처리는 문자 후보 요소 생성 결과(202)(도 29의 (a) 참조), 문자 후보 요소 생성 결과(222)(도 29의 (b) 참조) 및 문자 후보 요소 생성 결과(242)(도 29의 (c) 참조)에 대하여 세로 방향(도 29의 (a) 참조)에 대하여 행 후보로서의 행 구형을 생성하기 위한 처리이다.
구체적으로는, 도 17에 도시한 단계 SP1에서는, 세로 방향 행 구형 생성부(107)는 단계 SE1(도 7 참조)과 마찬가지(단, 세로 방향에 대한 처리)로, 문자 사이즈별 행 후보 생성 처리를 실행한다.
도 31의 (a)∼도 31의 (c)에는 세로 방향의 문자 사이즈별 행 후보 생성 처리의 결과가 도시되어 있다. 도 31의 (a)는 문자 후보 요소 생성 결과(202)(도 29의 (a) 참조)에 대응하는 문자 사이즈별 행 후보 생성 결과(204)를 도시하는 도면이다. 이 문자 사이즈별 행 후보 생성 결과(204)에 있어서는 행 후보 구형(204a, 204b, …)이 설정되어 있다.
도 31의 (b)는 문자 후보 요소 생성 결과(222)(도 29의 (b) 참조)에 대응하는 문자 사이즈별 행 후보 생성 결과(224)를 도시하는 도면이다. 이 문자 사이즈별 행 후보 생성 결과(224)에 있어서는, 행 후보 구형(224a, 224b, …)이 설정되어 있다.
도 31의 (c)는 문자 후보 요소 생성 결과(242)(도 29의 (c) 참조)에 대응하는 문자 사이즈별 행 후보 생성 결과(244)를 도시하는 도면이다. 이 문자 사이즈별 행 후보 생성 결과(244)에 있어서는, 행 후보 구형(244a, 244b, …)이 설정되어 있다.
도 17로 되돌아가, 단계 SP2에서는 세로 방향 행 구형 생성부(107)는, 단계 SE2(도 7 참조)와 마찬가지(단, 세로 방향에 대한 처리)로 하여, 행 후보 통합 처리를 실행한다.
도 33의 (a)∼도 33의 (c)에는, 세로 방향의 행 후보 통합 처리의 결과가 도시되어 있다. 도 33의 (a)는 문자 사이즈별 행 후보 생성 결과(204)(도 31의 (a) 참조)에 대응하는 행 후보 통합 결과(206)를 도시하는 도면이다. 이 행 후보 통합 결과(206)에 있어서는, 행 후보 구형(206a, 206b, …)이 설정되어 있다.
도 33의 (b)는 문자 사이즈별 행 후보 생성 결과(224)(도 31 (b) 참조)에 대응하는 행 후보 통합 결과(226)를 도시하는 도면이다. 이 행 후보 통합 결과(226)에 있어서는, 행 후보 구형(226a, 226b, …)이 설정되어 있다.
도 33의 (c)은 문자 사이즈별 행 후보 생성 결과(244)(도 31 (c) 참조)에 대응하는 행 후보 통합 결과(246)를 도시하는 도면이다. 이 행 후보 통합 결과(246)에 있어서는, 행 후보 구형(246a, 246b, …)이 설정되어 있다.
도 17로 되돌아가, 단계 SP3에서는 세로 방향 행 구형 생성부(107)는 단계 SE3(도 7 참조)과 마찬가지(단, 세로 방향에 대한 처리)로 하여, 장행 절단 처리를 실행한다.
도 35의 (a)∼도 35의 (c)에는, 세로 방향의 장행 절단 처리의 결과가 도시되어 있다. 도 35의 (a)는 행 후보 통합 결과(206)(도 33의 (a) 참조)에 대응하는 장행 절단 결과(208)를 도시하는 도면이다. 이 장행 절단 결과(208)에 있어서는, 행 후보 구형(208a, 208b, …)이 설정되어 있다.
도 35의 (b)는 행 후보 통합 결과(226)(도 33의 (b) 참조)에 대응하는 장행 절단 결과(228)를 도시하는 도면이다. 이 장행 절단 결과(228)에 있어서는, 행 후보 구형(228a, 228b, …)이 설정되어 있다.
도 35의 (c)는 행 후보 통합 결과(246)(도 33의 (c) 참조)에 대응하는 장행 절단 결과(248)를 도시하는 도면이다. 이 장행 절단 결과(248)에 있어서는 행 후보 구형(248a, 248b, …)이 설정되어 있다.
도 17로 되돌아가, 단계 SP4에서는 세로 방향 행 구형 생성부(107)는 단계 SE4(도 7 참조)와 마찬가지(단, 세로 방향에 대한 처리)로 하여, 단행 통합 처리를 실행한다.
도 37의 (a)∼도 37의 (c)에는 세로 방향의 단행 통합 처리의 결과가 도시되어 있다. 도 37의 (a)는 장행 절단 결과(208)(도 35의 (a) 참조)에 대응하는 단행 통합 결과(210)를 도시하는 도면이다. 이 단행 통합 결과(210)에 있어서는, 행 후보 구형(210a, 210b, …)가 설정되어 있다.
도 37의 (b)는 장행 절단 결과(228)(도 35의 (b) 참조)에 대응하는 단행 통합 결과(230)를 도시하는 도면이다. 이 단행 통합 결과(230)에 있어서는, 행 후보 구형(230a, 230b, …)이 설정되어 있다.
도 37의 (c)는 장행 절단 결과(248)(도 35의 (c) 참조)에 대응하는 단행 통합 결과(250)를 도시하는 도면이다. 이 단행 통합 결과(250)에 있어서는, 행 후보 구형(250a, 250b, …)이 설정되어 있다.
그리고, 세로 방향의 단행 통합 처리가 종료하면, 도 17에 도시한 세로 방향 행 구형 생성 처리도 종료한다. 도 3에 도시한 단계 SA8에서는, 세로단 생성부(108)는, 상술한 세로 방향의 단행 통합 처리의 결과(단행 통합 결과(210, 230 및 250: 도 37의 (a),도 37의 (b) 및 도 37의 (c))에서의 행 후보 구형군을 이용하여, 수평 방향의 복수의 행 후보 구형을 한묶음의 세로단으로 하는 세로단 생성 처리를 실행한다.
구체적으로는, 도 18에 도시한 단계 SQ1에서는, 세로단 생성부(108)는, 단계 SK1(도 13 참조)과 마찬가지(단, 세로 방향에 대한 처리)로 하여, 동일 장행 통합 처리를 실행한다.
단계 SQ2에서는, 세로단 생성부(108)는 단계 SK2(도 13 참조)와 마찬가지(단, 세로 방향에 대한 처리)로 하여, 상기 동일 장행 통합 처리의 결과를 이용하여, 단 인접 행 통합 처리를 실행한다.
단계 SQ3에서는, 세로단 생성부(108)는, 단계 SK3(도 13 참조)과 마찬가지(단, 세로 방향에 대한 처리)로 하여, 상기 단 인접 행 통합 처리의 결과를 이용하여, 중앙 정렬 행 통합 처리를 실행한다.
도 39의 (a)∼도 39의 (c)에는, 세로단 생성 처리의 결과가 도시되어 있다. 도 39의 (a)는 단행 통합 결과(210)(도 37의 (a) 참조)에 대응하는 세로단 생성 결과(212)를 도시하는 도면이다. 이 세로단 생성 결과(212)에 있어서는, 세로 방향의 단 구형(212a, …)이 설정되어 있다.
도 39의 (b)는 단행 통합 결과(230)(도 37의 (b) 참조)에 대응하는 세로단 생성 결과(232)를 도시하는 도면이다. 이 세로단 생성 결과(232)에 있어서는, 세로 방향의 단 구형(232a, …)이 설정되어 있다.
도 39의 (c)는 단행 통합 결과(250)(도 37의 (c) 참조)에 대응하는 세로단 생성 결과(252)를 도시하는 도면이다. 이 세로단 생성 결과(252)에 있어서는, 세로 방향의 단 구형(252a, …)이 설정되어 있다.
도 3으로 되돌아가, 단계 SA6에서는, 제어부(102)는 단 확정 처리를 실행한다. 이 단 확정 처리는, 가로단 생성 결과(211, 231 및 251)(도 38의 (a), 도 38의 (b) 및 도 38의 (c))와, 세로단 생성 결과(212, 232 및 252)(도 39의 (a), 도 39의 (b) 및 도 39의 (c))에 기초하여, 세로단과 가로단이 중첩되는 부분에 대하여, 단의 범위와 행 방향을 확정시키기 위한 처리이다.
구체적으로는, 도 19에 도시한 단계 SR1에서는, 제어부(102)는 세로단 생성결과로부터 세로단(세로 방향의 단 구형)과, 가로단 생성 결과로부터 가로단(가로 방향의 단 구형)을 하나씩 선택한다. 단계 SR2에서는, 제어부(102)는 세로단과 가로단에서 영역의 중첩이 있는지의 여부를 판단한다.
단계 SR2의 판단 결과가 「아니오」인 경우, 단계 SR10에서는, 제어부(102)는 모든 단을 비교하였는지의 여부를 판단하여, 이 경우 판단 결과를 「아니오」로 하고, 단계 SR1의 처리를 실행한다.
한편, 단계 SR2의 판단 결과가 「예」인 경우, 단계 SR3에서는, 제어부(102)는 세로단과 가로단의 영역이 완전하게 일치하는지의 여부를 판단한다. 이 판단 결과가 「예」인 경우, 단계 SR11에서는 제어부(102)는 세로단, 가로단 중 행 수가 적은 쪽을 단으로서 채용(행 방향 추정 처리)하고, 채용되지 않은 쪽을 파기한다. 예를 들면, 가로단이 채용된 경우, 단의 행방향은 가로 방향이다.
단계 SR9에서는, 제어부(102)는, 단에 관하여 절단·파기·통합이 발생하였는지의 여부를 판단하고, 이 경우, 판단 결과를 「예」로 하고, 단계 SR1의 처리를 실행한다.
한편, 단계 SR3의 판단 결과가 「아니오」인 경우, 단계 SR4에서는, 제어부(102)는, 세로단, 가로단에 있어서 세로단(또는 가로단)이 완전하게 한쪽에 포함되는지의 여부를 판단한다.
단계 SR4의 판단 결과가 「예」인 경우, 단계 SR12에서는 제어부(102)는 세로단, 가로단 중 포함되는 쪽의 단을 파기하고, 포함하는 쪽의 단을 채용한다. 예를 들면, 가로단이 채용된 경우, 단의 행 방향은 가로 방향이다.
한편, 단계 SR4의 판단 결과가 「아니오」인 경우, 단계 SR5에서는 제어부(102)는, 세로단과 가로단이 중첩되는 부분을 행 단위로 절단 가능한지의 여부를 판단한다.
단계 SR5의 판단 결과가 「예」인 경우, 단계 SR6에서는 제어부(102)는 절단 가능한 단을 절단한다. 또한, 단계 SR5의 판단 결과가 「아니오」인 경우, 단계 SR7에서는, 제어부(102)는 세로단과 가로단이 중첩되는 부분이 세로단, 가로단의 50% 이상을 차지하는지의 여부, 즉 중첩이 큰지의 여부를 판단하고, 이 판단 결과가 「아니오」인 경우, 단계 SR9의 판단을 행한다.
한편, 단계 SR7의 판단 결과가 「예」인 경우, 단계 SR8에서는 제어부(102)는 세로단과 가로단을 통합한다. 그리고, 단계 SR10의 판단 결과가 「예」 또는 단계 SR9의 판단 결과가 「아니오」가 되면, 제어부(102)는 단 확정 결과나 상술한 각각의 결과를 기억부(109)에 기억시킨 후에, 단 확정 처리를 종료한다.
이상 설명한 바와 같이, 일 실시 형태에 따르면, 문서 화상의 흑화소 연결 성분으로부터 문자 후보 요소를 문자 후보 요소 생성부(104)에서 생성하고, 도 21에 도시한 바와 같이, 행 방향으로 나열된 복수의 외접 구형(310, …)(문자 후보 요소)에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 외접 구형(문자 후보 요소)을 행 후보 구형(340)(행 요소)으로 하는 것으로 하였기 때문에, 문서 화상(문서 화상(200, 220, 240) 등)에서 행의 도중에 복수 행으로 분기하고 있는 경우나, 괄호 내에 복수 행이 있는 경우에도, 높은 정밀도로 행 레이아웃을 해석할 수 있다.
또한, 일 실시 형태에 따르면, 도 8을 참조하여 설명한 바와 같이, 문자 사이즈별로, 행 방향으로 나열된 복수의 외접 구형(문자 후보 요소)을 분류하고, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 외접 구형(문자 후보 요소)을 행 후보 구형(행 요소)으로 하는 것으로 하였기 때문에, 문서 화상에 복수 종류의 문자 사이즈가 존재하는 경우에도 높은 정밀도로 행 레이아웃을 해석할 수 있다.
또한, 일 실시 형태에 따르면, 도 22의 (a) 및 도 22의 (b)를 참조하여 설명한 바와 같이, 인접하는 2개의 행 후보 구형(행 요소)에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 경우, 2개의 행 후보 구형을 하나의 행 후보 구형으로 하여 통합하는 것으로 하였기 때문에, 인접하는 행 후보 구형에 대하여 높은 정밀도로 행 레이아웃을 해석할 수 있다.
또한, 일 실시 형태에 따르면, 도 23을 참조하여 설명한 바와 같이, 행 후보 구형(행 요소)에 포함되는 복수의 문자(문자 후보 요소)에 대하여, 간격이 소정 이상인 경우, 해당 문자의 위치보다 행 후보 구형을 둘로 절단하는 것으로 하였기 때문에, 지나치게 장행 후보 구형을 적절한 길이로 나눌 수 있다.
또한, 일 실시 형태에 따르면, 도 24의 (a) 및 도 24의 (b)를 참조하여 설명한 바와 같이, 수직 방향에서, 행 후보 구형(340)이 다른 행 후보 구형(346)과 중첩되어 있고, 행 후보 구형(340)에 포함되는 문자가 다른 행 후보 구형(346)과 중첩되지 않은 경우, 행 후보 구형(340)을 2개(행 후보 구형(350) 및 행 후보 구형(370))로 절단하는 것으로 하였기 때문에, 행 후보 구형을 적절한 위치에서 나눌 수 있다.
또한, 일 실시 형태에 따르면, 도 25의 (a) 및 도 25의 (b)를 참조하여 설명한 바와 같이, 행 방향으로 인접하는 2개의 행 후보 구형(381) 및 행 후보 구형(382)의 길이가, 수직 방향으로 인접하는 다른 행 후보 구형(380)의 길이와 대략 동일한 경우, 2개의 행 후보 구형(381) 및 행 후보 구형(382)을 하나의 행 후보 구형(384)으로 통합하는 것으로 하였기 때문에, 지나치게 단행 후보 구형을 적절한 길이로 할 수 있다.
또한, 일 실시 형태에 따르면, 도 14를 참조하여 설명한 바와 같이, 수직 방향에 대하여, 대략 동일한 길이의 복수의 행 후보 구형을 단 구형(단 요소)으로 하는 것으로 하였기 때문에, 문서 화상에서 행의 도중에 복수 행으로 분기하고 있는 경우나, 괄호 내에 복수 행이 있는 경우에도, 높은 정밀도로 단 레이아웃을 해석할 수 있다.
또한, 일 실시 형태에 따르면, 도 26의 (a) 및 도 26의 (b)를 참조하여 설명한 바와 같이, 단 구형(391)에 인접하는 행 후보 구형(392)을 통합한 단 구형(390)과 다른 행 후보 요소가 중첩되지 않는 경우, 단 구형(391)과 행 후보 구형(392)을 통합하여 새로운 단 구형(390)으로 하는 것으로 하였기 때문에, 더 높은 정밀도로 단 레이아웃을 해석할 수 있다.
또한, 일 실시 형태에 따르면, 도 27을 참조하여 설명한 바와 같이, 수직 방향으로 인접하는 복수의 행 후보 구형(400, 401)이 중앙 정렬로 되어 있는 경우, 이들을 단 구형(단 요소)으로 하는 것으로 하였기 때문에, 중앙 정렬에 대하여 높은 정밀도로 단 레이아웃을 해석할 수 있다.
또한, 일 실시 형태에 따르면, 도 3을 참조하여 설명한 바와 같이, 가로 방향 및 세로 방향의 각각에 대하여 행 구형(행 요소)을 생성하는 것으로 하였기 때문에, 문서 화상에서 행의 도중에 복수 행으로 분기하고 있는 경우나, 괄호 내에 복수 행이 있는 경우에도, 높은 정밀도로 가로 방향 및 세로 방향의 행 레이아웃을 해석할 수 있다.
또한, 일 실시 형태에 따르면, 도 3을 참조하여 설명한 바와 같이, 가로 방향 및 세로 방향의 각각에 대하여 단 구형(단 요소)을 생성하는 것으로 하였기 때문에, 문서 화상에서 행의 도중에 복수 행으로 분기하고 있는 경우나, 괄호 내에 복수 행이 있는 경우에도, 높은 정밀도로 가로 방향 및 세로 방향의 단 레이아웃을 해석할 수 있다.
이상 본 발명에 따른 일 실시 형태에 대하여 도면을 참조하여 상술하였지만, 구체적인 구성예는 이 일 실시 형태에 한정되는 것은 아니고, 본 발명의 요지를 일탈하지 않은 범위의 설계 변경 등이 있더라도 본 발명에 포함된다.
예를 들면, 상술한 일 실시 형태에 있어서는, 문서 레이아웃 해석 장치(100)의 기능을 실현하기 위한 프로그램을 도 40에 도시한 컴퓨터 판독 가능한 기록 매체(600)에 기록하고, 이 기록 매체(600)에 기록된 프로그램을 도 40에 도시한 컴퓨터(500)로 하여금 판독하게 하고, 실행함으로써 각 기능을 실현해도 된다.
도 40에 도시한 컴퓨터(500)는 상기 프로그램을 실행하는 CPU(Central Processing Unit)(510)와, 키보드, 마우스 등의 입력 장치(520)와, 각종 데이터를기억하는 ROM(Read Only Memory)(530)과, 연산 파라미터 등을 기억하는 RAM(Random Access Memory)(540)과, 기록 매체(600)로부터 프로그램을 판독하는 판독 장치(550)와, 디스플레이, 프린터 등의 출력 장치(560)와, 장치 각 부를 접속하는 버스(570)로 구성되어 있다.
CPU(510)는 판독 장치(550)를 경유하여 기록 매체(600)에 기록되어 있는 프로그램을 판독한 후, 프로그램을 실행함으로써, 상술한 기능을 실현한다. 또, 기록 매체(600)로서는 광 디스크, 플렉시블 디스크, 하드디스크 등을 들 수 있다.
(부기 1) 컴퓨터를,
문서 화상의 흑화소 연결 성분으로부터 문자 요소를 추출하는 문자 요소 추출 수단과,
행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 행 요소 추출 수단
으로서 기능시키기 위한 문서 레이아웃 해석 프로그램.
(부기 2) 상기 행 요소 추출 수단은, 문자 사이즈별로, 상기 행 방향으로 나열된 복수의 문자 요소를 분류하고, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 것을 특징으로 하는 부기 1에 기재된 문서 레이아웃 해석 프로그램.
(부기 3) 상기 컴퓨터를, 상기 행 요소 추출 수단에 의해 추출되고 인접하는 2개의 행 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인경우, 상기 2개의 행 요소를 하나의 행 요소로서 통합하는 행 요소 통합 수단으로서 기능시키기 위한 부기 1 또는 2에 기재된 문서 레이아웃 해석 프로그램.
(부기 4) 상기 컴퓨터를, 상기 행 요소 통합 수단에 의해 통합된 행 요소에 포함되는 복수의 문자 요소에 대하여, 간격이 소정 이상인 경우, 그 문자 요소의 위치로부터 상기 행 요소를 둘로 절단하는 행 요소 절단 수단으로서 기능시키기 위한 부기 3에 기재된 문서 레이아웃 해석 프로그램.
(부기 5) 상기 행 요소 절단 수단은, 수직 방향에서, 임의의 행 요소가 다른 행 요소와 중첩되어 있고, 상기 임의의 행 요소에 포함되는 문자 요소가 상기 다른 행 요소와 중첩되지 않은 경우, 상기 임의의 행 요소를 둘로 절단하는 것을 특징으로 하는 부기 4에 기재된 문서 레이아웃 해석 프로그램.
(부기 6) 상기 행 요소 통합 수단은, 행 방향으로 인접하는 2개의 행 요소의 길이가, 수직 방향으로 인접하는 다른 행 요소의 길이와 대략 동일한 경우, 상기 2개의 행 요소를 하나의 행 요소로 통합하는 것을 특징으로 하는 부기 3∼5 중 어느 하나에 기재된 문서 레이아웃 해석 프로그램.
(부기 7) 상기 컴퓨터를, 상기 수직 방향에 대하여, 대략 동일한 길이의 복수의 행 요소를 단 요소로 하는 단 요소 추출 수단으로서 기능시키는 것을 특징으로 하는 부기 1∼6 중 어느 하나에 기재된 문서 레이아웃 해석 프로그램.
(부기 8) 상기 단 요소 추출 수단은, 상기 단 요소에 인접하는 행 요소를 통합 한 단 요소와 다른 행 요소가 중첩되지 않는 경우, 상기 단 요소와 상기 행 요소를 통합하여 새로운 단 요소로 하는 것을 특징으로 하는 부기 7에 기재된 문서레이아웃 해석 프로그램.
(부기 9) 상기 단 요소 추출 수단은, 상기 수직 방향으로 인접하는 복수의 행 요소가 중앙 정렬로 되어 있는 경우, 복수의 행 요소를 단 요소로 하는 것을 특징으로 하는 부기 7에 기재된 문서 레이아웃 해석 프로그램.
(부기 10) 상기 행 요소 추출 수단은, 가로 방향 및 세로 방향의 각각에 대하여 행 요소를 추출하는 것을 특징으로 하는 부기 1∼9 중 어느 하나에 기재된 문서 레이아웃 해석 프로그램.
(부기 11) 상기 단 요소 추출 수단은 가로 방향 및 세로 방향의 각각에 대하여 단 요소를 추출하는 것을 특징으로 하는 부기 7∼9 중 어느 하나에 기재된 문서 레이아웃 해석 프로그램.
(부기 12) 문서 화상의 흑화소 연결 성분으로부터 문자 요소를 추출하는 문자 요소 추출 수단과,
행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 행 요소 추출 수단
을 구비한 것을 특징으로 하는 문서 레이아웃 해석 장치.
(부기 13) 상기 행 요소 추출 수단은, 문자 사이즈별로, 상기 행 방향으로 나열된 복수의 문자 요소를 분류하고, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 것을 특징으로 하는 부기 12에 기재된 문서 레이아웃 해석 장치.
(부기 14) 상기 행 요소 추출 수단에 의해 추출되고 인접하는 2개의 행 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 경우, 상기 2개의 행 요소를 하나의 행 요소로서 통합하는 행 요소 통합 수단을 포함한 것을 특징으로 하는 부기 12 또는 13에 기재된 문서 레이아웃 해석 장치.
(부기 15) 상기 행 요소 통합 수단에 의해 통합된 행 요소에 포함되는 복수의 문자 요소에 대하여, 간격이 소정 이상인 경우, 그 문자 요소의 위치로부터 상기 행 요소를 둘로 절단하는 행 요소 절단 수단을 포함한 것을 특징으로 하는 부기 14에 기재된 문서 레이아웃 해석 장치.
(부기 16) 상기 행 요소 절단 수단은, 수직 방향에서, 임의의 행 요소가 다른 행 요소와 중첩되고 있고, 상기 임의의 행 요소에 포함되는 문자 요소가 상기 다른 행 요소와 중첩되지 않는 경우, 상기 임의의 행 요소를 둘로 절단하는 것을 특징으로 하는 부기 15에 기재된 문서 레이아웃 해석 장치.
(부기 17) 상기 행 요소 통합 수단은, 행 방향으로 인접하는 2개의 행 요소의 길이가, 수직 방향으로 인접하는 다른 행 요소의 길이와 대략 동일한 경우, 상기 2개의 행 요소를 하나의 행 요소로 통합하는 것을 특징으로 하는 부기 14∼16 중 어느 하나에 기재된 문서 레이아웃 해석 장치.
(부기 18) 상기 수직 방향에 대하여, 대략 동일한 길이의 복수의 행 요소를 단 요소로 하는 단 요소 추출 수단을 포함한 것을 특징으로 하는 부기 12∼17 중 어느 하나에 기재된 문서 레이아웃 해석 장치.
(부기 19) 상기 단 요소 추출 수단은, 상기 단 요소에 인접하는 행 요소를통합한 단 요소와 다른 행 요소가 중첩되지 않는 경우, 상기 단 요소와 상기 행 요소를 통합하여 새로운 단 요소로 하는 것을 특징으로 하는 부기 18에 기재된 문서 레이아웃 해석 장치.
(부기 20) 상기 단 요소 추출 수단은, 상기 수직 방향으로 인접하는 복수의 행 요소가 중앙 정렬로 되어 있는 경우, 복수의 행 요소를 단 요소로 하는 것을 특징으로 하는 부기 18에 기재된 문서 레이아웃 해석 장치.
(부기 21) 상기 행 요소 추출 수단은, 가로 방향 및 세로 방향의 각각에 대하여 행 요소를 추출하는 것을 특징으로 하는 부기 12∼20 중 어느 하나에 기재된 문서 레이아웃 해석 장치.
(부기 22) 상기 단 요소 추출 수단은, 가로 방향 및 세로 방향의 각각에 대하여 단 요소를 추출하는 것을 특징으로 하는 부기 18∼20 중 어느 하나에 기재된 문서 레이아웃 해석 장치.
(부기 23) 문서 화상의 흑화소 연결 성분으로부터 문자 요소를 추출하는 문자 요소 추출 공정과,
행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 행 요소 추출 공정
을 포함하는 것을 특징으로 하는 문서 레이아웃 해석 방법.
(부기 24) 상기 행 요소 추출 공정에서는, 문자 사이즈별로, 상기 행 방향으로 나열된 복수의 문자 요소를 분류하고, 행 방향에 대하여 수직 방향의 편차량이임계값 이하인 복수의 문자 요소를 행 요소로 하는 것을 특징으로 하는 부기 23에 기재된 문서 레이아웃 해석 방법.
(부기 25) 상기 행 요소 추출 공정에서 추출되고 인접하는 2개의 행 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 경우, 상기 2개의 행 요소를 하나의 행 요소로서 통합하는 행 요소 통합 공정을 포함하는 것을 특징으로 하는 부기 23 또는 24에 기재된 문서 레이아웃 해석 방법.
(부기 26) 상기 행 요소 통합 공정에서 통합된 행 요소에 포함되는 복수의 문자 요소에 대하여, 간격이 소정 이상인 경우, 그 문자 요소의 위치로부터 상기 행 요소를 둘로 절단하는 행 요소 절단 공정을 포함하는 것을 특징으로 하는 부기 25에 기재된 문서 레이아웃 해석 방법.
(부기 27) 상기 행 요소 절단 공정에서는, 수직 방향에서, 임의의 행 요소가 다른 행 요소와 중첩되어 있고, 상기 임의의 행 요소에 포함되는 문자 요소가 상기 다른 행 요소와 중첩되지 않는 경우, 상기 임의의 행 요소를 둘로 절단하는 것을 특징으로 하는 부기 26에 기재된 문서 레이아웃 해석 방법.
(부기 28) 상기 행 요소 통합 공정에서는, 행 방향으로 인접하는 2개의 행 요소의 길이가, 수직 방향으로 인접하는 다른 행 요소의 길이와 대략 동일한 경우, 상기 2개의 행 요소를 하나의 행 요소로 통합하는 것을 특징으로 하는 부기 25∼27 중 어느 하나에 기재된 문서 레이아웃 해석 방법.
(부기 29) 상기 수직 방향에 대하여, 대략 동일 길이의 복수의 행 요소를 단 요소로 하는 단 요소 추출 공정을 포함하는 것을 특징으로 하는 부기 23∼28 중 어느 하나에 기재된 문서 레이아웃 해석 방법.
(부기 30) 상기 단 요소 추출 공정에서는, 상기 단 요소에 인접하는 행 요소를 통합한 단 요소와 다른 행 요소가 중첩되지 않는 경우, 상기 단 요소와 상기 행 요소를 통합하여 새로운 단 요소로 하는 것을 특징으로 하는 부기 29에 기재된 문서 레이아웃 해석 방법.
(부기 31) 상기 단 요소 추출 공정에서는, 상기 수직 방향으로 인접하는 복수의 행 요소가 중앙 정렬로 되어 있는 경우, 복수의 행 요소를 단 요소로 하는 것을 특징으로 하는 부기 29에 기재된 문서 레이아웃 해석 방법.
(부기 32) 상기 행 요소 추출 공정에서는, 가로 방향 및 세로 방향의 각각에 대하여 행 요소를 추출하는 것을 특징으로 하는 부기 23∼31 중 어느 하나에 기재된 문서 레이아웃 해석 방법.
(부기 33) 상기 단 요소 추출 공정에서는, 가로 방향 및 세로 방향의 각각에 대하여 단 요소를 추출하는 것을 특징으로 하는 부기 29∼31 중 어느 하나에 기재된 문서 레이아웃 해석 방법.
이상 설명한 바와 같이, 본 발명에 따르면, 문서 화상의 흑화소 연결 성분으로부터 문자 요소를 추출하고, 행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 것으로 하였기 때문에, 문서 화상에서 행의 도중에 복수 행으로 분기하고 있는 경우나 괄호 내에 복수 행이 있는 경우에도, 높은 정밀도로 행 레이아웃을 해석할 수 있다는 효과를 발휘한다.
또한, 본 발명에 따르면, 문자 사이즈별로, 행 방향으로 나열된 복수의 문자 요소를 분류하고, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 것으로 하였기 때문에, 문서 화상에 복수 종류의 문자 사이즈가 존재하는 경우에도, 높은 정밀도로 행 레이아웃을 해석할 수 있다고 하는 효과를 발휘한다.
또한, 본 발명에 따르면, 인접하는 2개의 행 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 경우, 2개의 행 요소를 하나의 행 요소로서 통합하는 것으로 하였기 때문에, 인접하는 행 요소에 대하여 높은 정밀도로 행 레이아웃을 해석할 수 있다고 하는 효과를 발휘한다.
또한, 본 발명에 따르면, 행 요소에 포함되는 복수의 문자 요소에 대하여, 간격이 소정 이상인 경우, 해당 문자 요소의 위치로부터 행 요소를 둘로 절단하는 것으로 하였기 때문에, 지나치게 장행 요소를 적절한 길이로 나눌 수 있다고 하는 효과를 발휘한다.
또한, 본 발명에 따르면, 수직 방향에서, 임의의 행 요소가 다른 행 요소와 중첩되고 있고, 임의의 행 요소에 포함되는 문자 요소가 다른 행 요소와 중첩되지 않는 경우, 임의의 행 요소를 둘로 절단하는 것으로 하였기 때문에, 행 요소를 적절한 위치에서 나눌 수 있다고 하는 효과를 발휘한다.
또한, 본 발명에 따르면, 행 방향으로 인접하는 2개의 행 요소의 길이가, 수직 방향으로 인접하는 다른 행 요소의 길이와 대략 동일한 경우, 2개의 행 요소를하나의 행 요소로 통합하는 것으로 하였기 때문에, 지나치게 단행 요소를 적절한 길이로 할 수 있다고 하는 효과를 발휘한다.
또한, 본 발명에 따르면, 수직 방향에 대하여, 대략 동일 길이의 복수의 행 요소를 단 요소로 하는 것으로 하였기 때문에, 문서 화상으로 행의 도중에 복수 행으로 분기하고 있는 경우나, 괄호 내에 복수 행이 있는 경우에도, 높은 정밀도로 단 레이아웃을 해석할 수 있다고 하는 효과를 발휘한다.
또한, 본 발명에 따르면, 단 요소에 인접하는 행 요소를 통합한 단과 다른 행 요소가 중첩되지 않는 경우, 단 요소와 행 요소를 통합하여 새로운 단 요소로 하는 것으로 하였기 때문에, 더 높은 정밀도로 단 레이아웃을 해석할 수 있다고 하는 효과를 발휘한다.

Claims (10)

  1. 컴퓨터를,
    문서 화상의 데이터를 기초로, 흑화소 연결 성분으로서 연속된 흑화소를 추출하는 흑화소 연결 성분 추출 수단과,
    상기 흑화소 연결 성분으로부터 문자 요소를 추출하는 문자 요소 추출 수단과,
    행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 행 요소 추출 수단
    으로서 기능시키기 위한 문서 레이아웃 해석 프로그램.
  2. 제1항에 있어서,
    상기 행 요소 추출 수단은, 문자 사이즈별로, 상기 행 방향으로 나열된 복수의 문자 요소를 분류하고, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 것을 특징으로 하는 문서 레이아웃 해석 프로그램.
  3. 제1항에 있어서,
    상기 컴퓨터를, 상기 행 요소 추출 수단에 의해 추출되고 인접하는 2개의 행요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 경우, 상기 2개의 행 요소를 하나의 행 요소로서 통합하는 행 요소 통합 수단으로서 기능시키기 위한 문서 레이아웃 해석 프로그램.
  4. 제3항에 있어서,
    상기 컴퓨터를, 상기 행 요소 통합 수단에 의해 통합된 행 요소에 포함되는 복수의 문자 요소에 대하여, 간격이 소정 이상인 경우, 상기 문자 요소의 위치로부터 상기 행 요소를 둘로 절단하는 행 요소 절단 수단으로서 기능시키기 위한 문서 레이아웃 해석 프로그램.
  5. 제4항에 있어서,
    상기 행 요소 절단 수단은, 수직 방향에서, 임의의 행 요소가 다른 행 요소와 중첩되어 있고, 상기 임의의 행 요소에 포함되는 문자 요소가 상기 다른 행 요소와 중첩되지 않는 경우, 상기 임의의 행 요소를 둘로 절단하는 것을 특징으로 하는 문서 레이아웃 해석 프로그램.
  6. 제3항 내지 제5항 중 어느 한 항에 있어서,
    상기 행 요소 통합 수단은, 행 방향으로 인접하는 2개의 행 요소의 길이가 수직 방향으로 인접하는 다른 행 요소의 길이와 대략 동일한 경우, 상기 2개의 행 요소를 하나의 행 요소로 통합하는 것을 특징으로 하는 문서 레이아웃 해석 프로그램.
  7. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 컴퓨터를, 상기 수직 방향에 대하여, 대략 동일 길이의 복수의 행 요소를 단(段) 요소로 하는 단 요소 추출 수단으로서 기능시키는 것을 특징으로 하는 문서 레이아웃 해석 프로그램.
  8. 제7항에 있어서,
    상기 단 요소 추출 수단은, 상기 단 요소에 인접하는 행 요소를 통합한 단 요소와 다른 행 요소가 중첩되지 않는 경우, 상기 단 요소와 상기 행 요소를 통합하여 새로운 단 요소로 하는 것을 특징으로 하는 문서 레이아웃 해석 프로그램.
  9. 문서 화상의 데이터를 기초로, 흑화소 연결 성분으로서 연속된 흑화소를 추출하는 흑화소 연결 성분 추출 수단과,
    상기 흑화소 연결 성분으로부터 문자 요소를 추출하는 문자 요소 추출 수단과,
    행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 행 요소 추출 수단
    을 포함하는 것을 특징으로 하는 문서 레이아웃 해석 장치.
  10. 문서 화상의 데이터를 기초로, 흑화소 연결 성분으로서 연속된 흑화소를 추출하는 흑화소 연결 성분 추출 공정과,
    상기 흑화소 연결 성분으로부터 문자 요소를 추출하는 문자 요소 추출 공정과,
    행 방향으로 나열된 복수의 문자 요소에 대하여, 행 방향에 대하여 수직 방향의 편차량이 임계값 이하인 복수의 문자 요소를 행 요소로 하는 행 요소 추출 공정
    을 포함하는 것을 특징으로 하는 문서 레이아웃 해석 방법.
KR1020030006204A 2002-06-28 2003-01-30 문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치및 문서 레이아웃 해석 방법 KR20040002427A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002191275A JP2004038321A (ja) 2002-06-28 2002-06-28 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法
JPJP-P-2002-00191275 2002-06-28

Publications (1)

Publication Number Publication Date
KR20040002427A true KR20040002427A (ko) 2004-01-07

Family

ID=29774393

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030006204A KR20040002427A (ko) 2002-06-28 2003-01-30 문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치및 문서 레이아웃 해석 방법

Country Status (5)

Country Link
US (1) US7257253B2 (ko)
JP (1) JP2004038321A (ko)
KR (1) KR20040002427A (ko)
CN (1) CN1264113C (ko)
CA (1) CA2417478C (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100756803B1 (ko) * 2004-08-06 2007-09-07 캐논 가부시끼가이샤 정보 처리 장치 및 정보 처리 방법

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070091375A1 (en) * 2004-07-14 2007-04-26 Kabushiki Kaisha Giskyushu Optimum character string placing program
JP2007088782A (ja) * 2005-09-21 2007-04-05 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP4872780B2 (ja) * 2007-04-25 2012-02-08 富士ゼロックス株式会社 画像処理システム及び画像処理プログラム
US8473467B2 (en) 2009-01-02 2013-06-25 Apple Inc. Content profiling to dynamically configure content processing
CN102081736B (zh) * 2009-11-27 2014-11-26 株式会社理光 从可移植电子文档中提取字符外接矩形的设备和方法
CN102375988B (zh) * 2010-08-17 2013-12-25 富士通株式会社 文件图像处理方法和设备
CN103106406B (zh) * 2011-11-09 2016-10-05 佳能株式会社 用于切分具有不同字符宽度的文本行中的字符的方法和系统
JP5735126B2 (ja) * 2013-04-26 2015-06-17 株式会社東芝 システムおよび筆跡検索方法
CN110377885B (zh) * 2019-06-14 2023-09-26 北京百度网讯科技有限公司 转换pdf文件的方法、装置、设备和计算机存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
JP2868134B2 (ja) * 1990-09-03 1999-03-10 キヤノン株式会社 画像処理方法及び装置
US5390259A (en) * 1991-11-19 1995-02-14 Xerox Corporation Methods and apparatus for selecting semantically significant images in a document image without decoding image content
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
US5384864A (en) * 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features
US5517578A (en) * 1993-05-20 1996-05-14 Aha! Software Corporation Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
JP2768249B2 (ja) 1993-12-27 1998-06-25 日本電気株式会社 文書画像レイアウト解析装置
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100756803B1 (ko) * 2004-08-06 2007-09-07 캐논 가부시끼가이샤 정보 처리 장치 및 정보 처리 방법
US7373593B2 (en) 2004-08-06 2008-05-13 Canon Kabushiki Kaisha Apparatus and method for automatically setting constraints within a document layout

Also Published As

Publication number Publication date
CA2417478C (en) 2007-06-19
CN1467682A (zh) 2004-01-14
US7257253B2 (en) 2007-08-14
CA2417478A1 (en) 2003-12-28
US20040001628A1 (en) 2004-01-01
JP2004038321A (ja) 2004-02-05
CN1264113C (zh) 2006-07-12

Similar Documents

Publication Publication Date Title
KR20040002427A (ko) 문서 레이아웃 해석 프로그램, 문서 레이아웃 해석 장치및 문서 레이아웃 해석 방법
Branke Dynamic graph drawing
US8532810B2 (en) Automatically generating embroidery designs
US7062090B2 (en) Writing guide for a free-form document editor
US4907285A (en) Image understanding system
US5813018A (en) Automated text extraction from source drawing and composition into target drawing with translated text placement according to source image analysis
US6948119B1 (en) Automated paragraph layout
JP2979109B2 (ja) 認識文字の情報作成方法及び装置
Ahmad et al. Urdu Nastaleeq optical character recognition
CN116483644B (zh) 用于芯片验证测试回归的日志搜索方法、电子设备和介质
US20080201635A1 (en) Document edit device and storage medium
JPS6132712B2 (ko)
US8600175B2 (en) Apparatus and method of processing image including character string
CN110688825A (zh) 一种版式文档中的含线表格信息提取方法
Lehal et al. Text segmentation of machine-printed Gurmukhi script
JP2003186870A (ja) 文書表示方法、文書表示装置、プログラムおよび記録媒体
GB2247803A (en) Document creation aid
KR100238814B1 (ko) 데이터처리장치 및 데이터처리방법
EP0240909B1 (en) Text editor for multidimensional or multidirectional text
JPH07200734A (ja) 光学的文字読取装置
JPH07107711B2 (ja) 文書画像の処理装置
JP3644621B2 (ja) 線図形の芯線化における接続処理方法
CA1290855C (en) Text editor for multidimensional or multidirectional text
JPH0736433A (ja) 文字データベース作成装置
Bhore et al. Extending Orthogonal Planar Graph Drawings Is Fixed-Parameter Tractable

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application