KR101336901B1 - 화상 처리 장치, 화상 처리 방법 및 기록 매체 - Google Patents

화상 처리 장치, 화상 처리 방법 및 기록 매체 Download PDF

Info

Publication number
KR101336901B1
KR101336901B1 KR1020090075957A KR20090075957A KR101336901B1 KR 101336901 B1 KR101336901 B1 KR 101336901B1 KR 1020090075957 A KR1020090075957 A KR 1020090075957A KR 20090075957 A KR20090075957 A KR 20090075957A KR 101336901 B1 KR101336901 B1 KR 101336901B1
Authority
KR
South Korea
Prior art keywords
line
line segment
image
evaluation
length
Prior art date
Application number
KR1020090075957A
Other languages
English (en)
Other versions
KR20100088052A (ko
Inventor
신이치 야다
구니카즈 우에노
Original Assignee
후지제롯쿠스 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지제롯쿠스 가부시끼가이샤 filed Critical 후지제롯쿠스 가부시끼가이샤
Publication of KR20100088052A publication Critical patent/KR20100088052A/ko
Application granted granted Critical
Publication of KR101336901B1 publication Critical patent/KR101336901B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

화상 내의 선분의 선분 길이를 계측하는 계측 수단과, 상기 선분 길이 계측 수단에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하여, 상기 선분의 평가를 행하는 제 1 평가 수단과, 상기 선분 길이 계측 수단에 의해 계측된 선분 길이의 유사성과 상기 선분의 위치에 의거하여, 상기 선분의 평가를 행하는 제 2 평가 수단과, 상기 제 1 평가 수단에 의한 평가 결과와 상기 제 2 평가 수단에 의한 평가 결과에 의거하여, 괘선을 판정하는 판정 수단을 구비하는 화상 처리 장치.
계측 수단, 제 1 평가 수단, 제 2 평가 수단, 화상 처리 장치

Description

화상 처리 장치, 화상 처리 방법 및 기록 매체{IMAGE PROCESSING APPARATUS, IMAGE PROCESSING METHOD AND RECORDING MEDIA}
본 발명은, 화상 처리 장치, 화상 처리 방법 및 기록 매체에 관한 것이다.
종이의 문서를 스캐너 등으로 읽고, 레이아웃이나 구성 오브젝트를 해석하여, 그 기재 정보의 재이용이나, 기재 정보에 근거한 처리를 행하는 기술이 있다. 특히, 문서의 일종인 장표(帳票)는 업무에서 많이 이용된다. 그 장표의 대부분은 표로 구성되어 있고, 표를 해석하는 기술이 요구되어 있다.
이것에 관련하는 기술로서, 예를 들면 특허 문헌 1에는, 길이가 임계값보다 짧은 단괘선(短罫線)을 괘선으로서 정확하게 추출할 수 있고, 표 구조를 정확하게 인식할 수 있는 신뢰성에서 뛰어난 표 인식 장치를 제공하는 것을 목적으로 하고, 2치(値) 화상 데이터 중의 런(RUN) 중 길이가 실선 임계값 이상의 런을 실선 괘선 요소로서 추출하고 이것을 연결하여 실선 괘선을 추출하는 실선 괘선 추출부와, 런 중 특정 패턴의 런이 파선 임계값 이상의 길이보다 계속되는 것을 파선 괘선 요소로서 추출하고 이것을 연결하여 파선 괘선을 추출하는 파선 괘선 추출부와, 실선 괘선과 파선 괘선으로 둘러싸인 부분을 셀로서 추출하여 표 구조를 추출하는 표 구조 추출부를 구비한 표 인식 장치로서, 표 구조 추출부에서 추출된 셀의 내(內) 높이, 가로 폭이 임계값보다도 작은 셀을 검색하는 소(小) 셀 검색부와, 이 셀 내로부터 런을 추출하여 단괘선을 추출하는 단괘선 추출부와, 단괘선을 이용하여 표 구조를 보정하는 표 구조 보정부를 구비한 구성으로 이루어지는 것이 개시되어 있다.
또한, 예를 들면 특허 문헌 2에는, 인쇄물·문서 등으로부터 판독된 도형 데이터로부터, 문자·파선·점선, 선종에 관계없이 표 구조 및 셀 내의 문자를 정확하게 인식할 수 있는 표 인식 장치의 제공을 목적으로 하고, 도형 데이터의 연결 흑 화소의 외접 사각형 리스트를 작성하는 흑 화소 레이벌링부(labeling part)와, 외접 사각형의 변의 길이로부터 사각형 내가 문자인지의 여부를 판단하는 문자 사각형 추정부와, 문자인 것으로 추정된 사각형 내의 흑 화소를 제외한 부분의 축소 화상을 작성하는 축소 화상 작성부와, 축소 화상의 세로·가로 2방향의 흑 화소의 런 중 일정 길이 이상의 것을 추출하는 런 추출부와, 추출된 런을 연결함으로써 괘선을 추출하는 괘선 추출부와, 추출된 괘선으로 둘러싸인 사각형을 검색하여 표의 셀로서 추출하는 표 구조 추출부를 구비하고 있는 것이 개시되어 있다.
또한, 예를 들면, 특허 문헌 3에는, 임의의 화상 데이터로부터 자수 봉제선을 형성할 때, 원래의 화상 데이터의 특징을 실의 자수 봉제선 방향으로 반영하는 것이 가능한 자수 데이터 처리 장치 및 미싱 그리고 기록 매체를 제공하는 것을 과제로 하고, 이미지 스캐너에 의해, 원화(原畵)로부터 도안의 판독을 행하고, 그 판독한 화상 데이터의 중에서 자수화할 때와 동일한 봉제선 방향으로 하고 싶은 영역을 선택하고, 그 선택한 영역에 대하여 텍스처(texture)를 연산하고, 그리고, 자수하는 영역을 블록화하고, 자수의 봉제선 데이터를 작성하는 것이 개시되어 있다.
또한, 예를 들면 특허 문헌 4에는, 임의의 화상 데이터로부터 자수 데이터를 형성할 때, 트레이스 등의 번잡한 조작을 하지 않고, 조작자가 기대하는 자수 영역을 형성하는 것이 가능한 자수 데이터 처리 장치 및 자수 미싱 그리고 기록 매체를 제공하는 것을 과제로 하고, 원화로부터 화상의 판독을 행하고, 그 판독한 화상 데이터에 대하여 영역 분할을 행하고, 그리고, 도안 화상으로부터 영역 추출에 의해 윤곽선을 구하고, 또한 에지(edge) 추출에 의해 에지를 구하고, 윤곽선 또는 에지 중 적어도 어느 일방을 조작자가 선택할 수 있게 함으로써, 조작자가 기대하는 자수 영역에 의거하여 자수 데이터를 작성하는 것이 개시되어 있다.
[특허 문헌 1] 특개평07-013999호 공보
[특허 문헌 2] 특개평05-012489호 공보
[특허 문헌 3] 특개평11-076658호 공보
[특허 문헌 4] 특개평11-123289호 공보
본 발명은 괘선으로서 점선, 파선 등이 포함되어 있는 화상을 해석할 경우에 있어서, 레이벌링 기술을 사용한 경우와 비교하여, 적은 계산기 자원의 할당으로, 괘선으로서 인식되지 않고 문자로서 인식해버리는 오류를 억제하도록 한 화상 처리 장치 및 화상 처리 프로그램을 제공하는 것을 목적으로 하고 있다.
이러한 목적을 달성하기 위한 본 발명의 요지로 하는 것은 다음의 각항의 발명에 존재한다.
[1] 본 발명의 제 1 태양에 따른 화상 처리 장치는 화상 내의 선분의 선분 길이를 계측하는 계측 수단과, 상기 선분 길이 계측 수단에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하여, 상기 선분의 평가를 행하는 제 1 평가 수단과, 상기 선분 길이 계측 수단에 의해 계측된 선분 길이의 유사성과 상기 선분의 위치에 의거하여, 상기 선분의 평가를 행하는 제 2 평가 수단과, 상기 제 1 평가 수단에 의한 평가 결과와 상기 제 2 평가 수단에 의한 평가 결과에 의거하여, 괘선(罫線)을 판정하는 판정 수단을 구비한다.
[2] 본 발명의 제 1 태양에 따른 화상 처리 장치에 있어서, 상기 제 1 평가 수단은, 상기 선분의 위치마다 미리 정해진 범위 내에 있는 선분 길이를 갖는 선분의 누적 화소 수에 의거하여, 평가를 행한다.
[3] 본 발명의 제 1 태양에 따른 화상 처리 장치에 있어서, 상기 제 2 평가 수단은, 상기 선분의 위치마다 선분 길이의 출현 빈도에 의거하여, 상기 선분의 평가를 행한다.
[4] 본 발명의 제 1 내지 제 3 태양 중 어느 한 태양에 따른 화상 처리 장치에 있어서, 상기 계측 수단은, 화상의 세로 방향에서의 선분 길이 및 가로 방향에서의 선분 길이를 계측하고, 상기 제 1 평가 수단, 상기 제 2 평가 수단에서의 선분의 위치는, 상기 화상의 세로 방향에서의 위치 및 가로 방향에서의 위치이며, 상기 판정 수단은, 선분이 세로 괘선을 구성하는 것인지의 여부의 판정과 선분이 가로 괘선을 구성하는 것인지의 여부의 판정을 행한다.
[5] 본 발명의 제 1 내지 제 3 태양 중 어느 한 태양에 따른 화상 처리 장치에 있어서, 상기 괘선 판정 수단에 의해 괘선을 구성하는 것으로 판정된 선분을 이용하여 표(表) 화상을 생성하는 표 화상 생성 수단과, 상기 표 화상 생성 수단에 의해 생성된 표 화상의 괘선을 실선으로 변환하는 실선 변환 수단을 더 구비한다.
[6] 본 발명의 제 4 태양에 따른 화상 처리 장치에 있어서, 상기 괘선 판정 수단에 의해 괘선을 구성하는 것으로 판정된 선분을 이용하여 표 화상을 생성하는 표 화상 생성 수단과, 상기 표 화상 생성 수단에 의해 생성된 표 화상의 괘선을 실선으로 변환하는 실선 변환 수단을 더 구비한다.
[7] 본 발명의 제 7 태양에 따른 화상 처리 방법은 화상 내의 선분의 선분 길이를 계측하는 계측 단계와, 상기 선분 길이 계측 단계에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하여, 상기 선분의 평가를 행하는 제 1 평가 단계와, 상기 선분 길이 계측 단계에 의해 계측된 선분 길이의 유사성과 상기 선분의 위치에 의거하여, 상기 선분의 평가를 행하는 제 2 평가 단계와, 상기 제 1 평가 단계에 의한 평가 결과와 상기 제 2 평가 단계에 의한 평가 결과에 의거하여, 괘선(罫線)을 판정하는 판정 단계를 구비한다.
[8] 본 발명의 제 7 태양에 따른 화상 처리 방법에 있어서, 상기 제 1 평가 단계는, 상기 선분의 위치마다 미리 정해진 범위 내에 있는 선분 길이를 갖는 선분의 누적 화소 수에 의거하여, 평가를 행한다.
[9] 본 발명의 제 7 태양에 따른 화상 처리 방법에 있어서, 상기 제 2 평가 단계는, 상기 선분의 위치마다 선분 길이의 출현 빈도에 의거하여, 상기 선분의 평가를 행한다.
[10] 본 발명의 제 7 내지 제 9 태양 중 어느 한 태양에 따른 화상 처리 방법에 있어서, 상기 계측 단계는, 화상의 세로 방향에서의 선분 길이 및 가로 방향에서의 선분 길이를 계측하고, 상기 제 1 평가 단계, 상기 제 2 평가 단계에서의 선분의 위치는, 상기 화상의 세로 방향에서의 위치 및 가로 방향에서의 위치이며, 상기 판정 단계는, 선분이 세로 괘선을 구성하는 것인지의 여부의 판정과 선분이 가로 괘선을 구성하는 것인지의 여부의 판정을 행한다.
[11] 본 발명의 제 7 내지 제 9 태양 중 어느 한 태양에 따른 화상 처리 방법에 있어서, 상기 괘선 판정 단계에 의해 괘선을 구성하는 것으로 판정된 선분을 이용하여 표(表) 화상을 생성하는 표 화상 생성 단계와, 상기 표 화상 생성 단계에 의해 생성된 표 화상의 괘선을 실선으로 변환하는 실선 변환 단계를 더 구비한다.
[12] 본 발명의 제 10 태양에 따른 화상 처리 방법에 있어서, 상기 괘선 판정 단계에 의해 괘선을 구성하는 것으로 판정된 선분을 이용하여 표 화상을 생성하는 표 화상 생성 단계와, 상기 표 화상 생성 단계에 의해 생성된 표 화상의 괘선을 실선으로 변환하는 실선 변환 단계를 더 구비한다.
[13] 본 발명의 제 13 태양에 따른 화상 처리 프로그램을 기록한 컴퓨터 판독가능한 기록 매체는 컴퓨터를, 화상 내의 선분의 선분 길이를 계측하는 계측 수단과, 상기 계측 수단에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하여, 상기 선분의 평가를 행하는 제 1 평가 수단과, 상기 계측 수단에 의해 계측된 선분 길이의 유사성과 상기 선분의 위치에 의거하여, 상기 선분의 평가를 행하는 제 2 평가 수단과, 상기 선분 평가 수단에 의한 평가 결과와 상기 유사성 평가 수단에 의한 평가 결과에 의거하여, 괘선을 판정하는 판정 수단으로서 기능시킨다.
[1]의 화상 처리 장치에 의하면, 괘선으로서 점선, 파선 등이 포함되어 있는 화상을 해석할 경우에 있어서, 레이벌링 기술을 사용한 경우와 비교하여, 적은 계산기 자원의 할당으로, 괘선으로서 인식되지 않고 문자로서 인식해버리는 오류를 억제하는 것이 가능하다.
[2]의 화상 처리 장치에 의하면, 선분 길이 평가 수단이 선분의 위치마다 미리 정해진 범위 내에 있는 선분 길이를 갖는 선분의 누적 화소 수(數)에 의거하여 상기 선분의 평가를 행하지 않을 경우와 비교하여, 적은 계산기 자원의 할당으로, 화상을 해석하는 것이 가능하다.
[3]의 화상 처리 장치에 의하면, 유사성 평가 수단이 선분의 위치마다 선분 길이의 출현 빈도에 의거하여 상기 선분의 평가를 행하지 않을 경우와 비교하여, 적은 계산기 자원의 할당으로, 화상을 해석하는 것이 가능하다.
[4]의 화상 처리 장치에 의하면, 본 구성을 갖지 않을 경우와 비교하여, 세로 방향과 가로 방향의 괘선의 해석을 독립하여 행하는 것이 가능하다.
[5] 또는 [6]의 화상 처리 장치에 의하면, 본 구성을 갖지 않을 경우와 비교하여, 점선, 파선 등의 괘선에 의해 구성되어 있었던 표를 실선의 괘선에 의해 구성되는 표로 변환하는 것이 가능하다.
[7]의 화상 처리 방법에 의하면, 괘선으로서 점선, 파선 등이 포함되어 있는 화상을 해석할 경우에 있어서, 레이벌링 기술을 사용한 경우와 비교하여, 적은 계산기 자원의 할당으로, 괘선으로서 인식되지 않고 문자로서 인식해버리는 오류를 억제하는 것이 가능하다.
[8]의 화상 처리 방법에 의하면, 선분 길이 평가 수단이 선분의 위치마다 미리 정해진 범위 내에 있는 선분 길이를 갖는 선분의 누적 화소 수에 의거하여 상기 선분의 평가를 행하지 않을 경우와 비교하여, 적은 계산기 자원의 할당으로, 화상을 해석하는 것이 가능하다.
[9]의 화상 처리 방법에 의하면, 유사성 평가 수단이 선분의 위치마다 선분 길이의 출현 빈도에 의거하여 상기 선분의 평가를 행하지 않을 경우와 비교하여, 적은 계산기 자원의 할당으로, 화상을 해석하는 것이 가능하다.
[10]의 화상 처리 방법에 의하면, 본 구성을 갖지 않을 경우와 비교하여, 세로 방향과 가로 방향의 괘선의 해석을 독립하여 행하는 것이 가능하다.
[11] 또는 [12]의 화상 처리 장치에 의하면, 본 구성을 갖지 않을 경우와 비교하여, 점선, 파선 등의 괘선에 의해 구성되어 있었던 표를 실선의 괘선에 의해 구성되는 표로 변환하는 것이 가능하다.
[13]의 기록 매체에 의하면, 괘선으로서 점선, 파선 등이 포함되어 있는 화상을 해석할 경우에 있어서, 레이벌링 기술을 사용한 경우와 비교하여, 적은 계산기 자원의 할당으로, 괘선으로서 인식되지 않고 문자로서 인식해버리는 오류를 억제하는 것이 가능하다.
이하, 도면에 의거하여 본 발명을 실현하는데 있어서 적합한 일 실시예의 예를 설명한다.
도 1은 본 실시예의 구성예에 관한 개념적인 모듈 구성도를 도시하고 있다.
또한, 모듈이란, 일반적으로 논리적으로 분리 가능한 소프트웨어(컴퓨터·프로그램), 하드웨어 등의 부품을 지시한다. 따라서, 본 실시예에서의 모듈은 컴퓨터·프로그램에서의 모듈뿐만 아니라, 하드웨어 구성에서의 모듈도 지시한다. 그 때문에, 본 실시예는, 컴퓨터·프로그램, 시스템 및 방법의 설명도 겸하고 있다. 단, 설명의 편의상, 「기억한다」, 「기억시킨다」, 이것과 동등한 문언을 사용하지만, 이들 문언은 실시예가 컴퓨터·프로그램의 경우에는, 기억 장치에 기억시킨다, 또는 기억 장치에 기억시키도록 제어한다의 뜻이다. 또한, 모듈은 기능에 거의 일대일로 대응하고 있지만, 실장에서는, 1 모듈을 1 프로그램으로 구성해도 좋고, 복수 모듈을 1 프로그램으로 구성해도 좋고, 역으로 1 모듈을 복수 프로그램으로 구성해도 좋다. 또한, 복수 모듈은 1 컴퓨터에 의해 실행되어도 좋고, 분산 또는 병렬 환경에서의 컴퓨터에 의해 1 모듈이 복수 컴퓨터로 실행되어도 좋다. 또한, 1개의 모듈에 다른 모듈이 포함되어 있어도 좋다. 또한, 이하, 「접속」이란 물리적인 접속 외에, 논리적인 접속(데이터의 접수, 지시, 데이터 사이의 참조 관계 등)의 경우에도 사용한다.
또한, 시스템 또는 장치는 복수의 컴퓨터, 하드웨어, 장치 등이 네트워크(일대일 대응의 통신 접속을 포함함) 등의 통신 수단으로 접속되어서 구성되는 것 외에, 1개의 컴퓨터, 하드웨어, 장치 등에 의해 실현되는 경우도 포함된다. 「장치」와 「시스템」은 서로 동의(同義)의 용어로서 사용한다. 「미리 정해진」이란, 대상으로 하고 있는 처리의 전(前)인 것을 말하고, 본 실시예에 의한 처리가 시작되기 전은 물론, 본 실시예에 의한 처리가 시작된 후에도, 그때의 상황·상태에 따라, 또는 그때까지의 상황·상태에 따라 정해지는 것의 뜻을 포함하여 사용한다.
본 실시예인 화상 처리 장치는 점선, 파선 등의 선이 도절(途切)되어 있는 괘선으로 구성되어 있는 표 화상으로도, 실선의 괘선으로 구성되는 표 화상으로 변환하는 것이며, 도 1에 도시하는 바와 같이, 런 길이 카운트 모듈(110), 런 평가 모듈(120), 괘선 판정 모듈(130), 괘선 화상 생성 모듈(140), 괘선 화상 보정 모듈(150)을 갖고 있다.
런 길이 카운터 모듈(110)은 런 평가 모듈(120)과 접속되어 있다. 화상 내의 런 길이(Run Length)를 계측하고, 그 계측 결과를 런 평가 모듈(120)에 건네 준다. 또한, 화상은 2치 화상을 대상으로 하고, 표 화상 내에는 문자 등이 포함되어 있어도 좋다.
런이란, 선분이다. 런 길이란, 가로 방향 또는 세로 방향(주사 방향 또는 부 주사 방향)의 선분의 화소 수를 말한다. 그 런의 화소는 흑이어도 좋고, 백이어도 좋다. 또한, 본 실시예의 설명에서는, 흑의 화소를 대상으로 한다. 따라서, 런 길이의 계측이란, 화상 내를 가로 방향 또는 세로 방향으로 주사하여 흑 화소의 연속하고 있는 화소 수를 계수하는 것이다. 이에 의해, 가로 선 또는 세로 선의 길이를 계측하고 있다.
런 평가 모듈(120)은 런 길이 카운트 모듈(110), 괘선 판정 모듈(130)과 접속되어 있고, 런 길이 평가 모듈(122), 런 유사성 평가 모듈(124)을 갖고 있다. 런 평가 모듈(120)은 런 길이 카운트 모듈(110)에 의해 계측된 런 길이에 의거하여, 런 길이 평가 모듈(122), 런 유사성 평가 모듈(124)을 제어하고, 런 길이의 분포 등으로부터 표를 구성하고 있는 괘선인지의 여부의 판정을 행하기 위한 데이터를 생성한다. 그리고, 그 생성한 데이터를 괘선 판정 모듈(130)에 건네준다.
런 길이 평가 모듈(122)은 런 길이 카운트 모듈(110)에 의해 계측된 런 길이와 선분의 위치에 의거하여, 그 선분의 평가를 행한다. 예를 들면, 선분의 위치마다, 미리 정해진 범위 내에 있는 런 길이를 갖는 선분의 누적 화소 수에 의거하여, 그 선분의 평가를 행하도록 해도 좋다. 보다 구체적인 예로서, 대상 화상의 가로 방향의 위치에서, 미리 정해진 범위 내에 있는 선분 길이를 갖는 종선의 흑 화소 수(런 길이의 합계)를 계수한다. 미리 정해진 범위로는, 예를 들면, 임계값 1보다 작은 범위 또는 임계값 2보다 큰 범위이며, 임계값 1은 임계값 2보다도 작다. 이것은, 짧은 선분 또는 긴 선분의 흑 화소 수를 계수하게 되고, 그 중간에 있는 길이의 선분은 대상으로 하지 않는 것이다. 계수되는 것은 점선 또는 실선을 구성하는 선분이 되고, 계수의 대상 외로 되는 것은 그 중간에 있는 길이의 것이 된다. 이 중간에 있는 길이의 것으로서, 문자, 파선 등을 구성하는 선분이 해당한다. 괘선인 파선 등은 런 유사성 평가 모듈(124)에 의해 추출한다. 또한, 괘선인 점선은 런 길이 평가 모듈(122), 런 유사성 평가 모듈(124)의 양쪽에 의해 추출하도록 해도 좋다.
이렇게, 런 길이 평가 모듈(122)은 선분은 괘선을 구성하는 짧은 선분 또는 긴 선분인가의 평가를 행한다. 그리고, 평가 결과로서, 선분의 위치마다 합계된 흑 화소 수를 괘선 판정 모듈(130)에 건네 준다. 또한, 대상 화상의 세로 방향의 위치에서도 동일한 것을 행한다.
런 유사성 평가 모듈(124)은 런 길이 카운트 모듈(110)에 의해 계측된 런 길이의 유사성(본 기술 분야에서의 「균일성」, 「동일성」, 「균질성」, 「uniformity」를 포함)과 선분의 위치에 의거하여 그 선분의 평가를 행한다. 예를 들면, 선분의 위치마다, 유사한 런 길이의 출현 빈도에 의거하여, 그 선분의 평가를 행하도록 해도 좋다. 보다 구체적인 예로서, 대상 화상의 가로 방향 또는 세로 방향의 위치에서, 미리 정해진 범위 내에 있는 런 길이를 갖는 선분의 개수에 따라 결정하도록 해도 좋다. 또한, 대상 화상의 가로 방향 또는 세로 방향의 위치에서, 유사한 길이의 선분이 반복하여 출현하는 것을 나타내고 있는 유사성 지수를 산출하도록 해도 좋다.
예를 들면, 유사성 지수의 산출로서, 수 1의 계산을 행한다.
[수 1]
Figure 112009050219875-pat00001
또한, RLU(θ)(RLU: Run Length Uniformity)는 런 길이가 유사한 선분의 출현 빈도가 많아지면, 커지는 값이다. a는 화소 농도를 나타내지만 2치 화상이므로 1 또는 0이지만, 이 경우는 흑 화소의 런 길이를 대상으로 하고 있으므로 1이다. R은 가로 방향의 위치에서의 런 길이 카운트 모듈(11O)에 의해 계측된 런 길이를 나타낸다. θ는 주사(스캔) 방향을 나타내고 있고, 이 경우에는 0(가로 방향) 또는 90(세로 방향)이다. M(x)는 출현 빈도를 나타낸다. 수 1은 일반적으로 「런 길이 행렬」로 부르는 5개의 지표 중 1개이며, 런 길이 행렬은 2차원 화상의 해석에서 사용되고 있고, 주로 텍스처 해석, 위성 사진의 해석 등에 활용되고 있는 것이다.
이렇게, 런 유사성 평가 모듈(124)은 선분은 괘선을 구성하는 점선, 파선 등인가의 평가를 행한다. 그리고, 평가 결과로서, 선분의 위치마다 계산된 유사성 지수를 괘선 판정 모듈(130)에 건네 준다.
괘선 판정 모듈(130)은 런 평가 모듈(120), 괘선 화상 생성 모듈(140)과 접속되어 있다. 런 길이 평가 모듈(122)에 의한 평가 결과와, 런 유사성 평가 모듈(124)에 의한 평가 결과에 의거하여, 괘선인지의 여부를 판정한다. 즉, 전술의 예에서 나타내면, 런 길이 평가 모듈(122)로부터 선분의 위치마다 합계된 흑 화소 수, 런 유사성 평가 모듈(124)로부터 선분의 위치마다 계산된 유사성 지수를 수취하고, 선분은 괘선을 구성하고 있는지의 여부의 판정(선분이 세로 괘선인지의 여부의 판정과, 선분이 가로 괘선인지의 여부의 판정)을 행한다. 그리고, 그 판정 결과를 괘선 화상 생성 모듈(140)에 건네 준다.
괘선 화상 생성 모듈(140)은 괘선 판정 모듈(130), 괘선 화상 보정 모듈(150)과 접속되어 있다. 괘선 판정 모듈(130)에 의해 괘선인 것으로 판정된 선분을 이용하여 표 화상을 생성한다. 그리고, 그 표 화상을 괘선 화상 보정 모듈(150)에 건네 준다.
괘선인 것으로 판정된 선분은 가로 선 또는 세로 선이며, 그 선의 종류는 실선, 점선, 파선 등이 포함되어 있다. 즉, 원래의 화상 내의 문자 등은 삭제되어서, 괘선만으로 이루어지는 화상을 생성한다.
괘선 화상 보정 모듈(150)은 괘선 화상 생성 모듈(140)과 접속되어 있다. 괘선 화상 생성 모듈(140)에 의해 생성된 표 화상의 괘선을 실선으로 변환한다. 즉, 이후의 화상 해석(표 구조의 해석 등)을 행하기 쉽도록 하기 위해, 점선, 파선 등도 실선으로 변환하는 것이다. 예를 들면, 세로 또는 가로 방향으로 팽창을 행하고, 그 후에 수축을 행한다. 또한, 세로와 가로를 각각 별개로 처리해도 좋다. 즉, 세로 괘선으로 판정된 화상에는, 세로 방향으로 팽창을 행하고, 그 후에 수축을 행한다. 마찬가지로, 가로 괘선으로 판정된 화상에는, 가로 방향으로 팽창을 행하고, 그 후에 수축을 행한다. 이것에 의해, 점선, 파선 등의 선에 도절이 있는 괘선을 실선화하고 있다.
도 2는 본 실시예를 구현하는 경우의 화상 처리 장치 전체의 구성 예에 관한 개념적인 모듈 구성도이다.
화상 처리 장치 전체는 화상 접수 모듈(210), 오브젝트 분리 모듈(220), 표 영역 추출 모듈(230), 표 괘선 보정 모듈(240), 겹쳐 쓰기 모듈(250), 문자 인식 모듈(260), 정보 구성 모듈(270), 출력 모듈(280)을 구비하고 있다.
화상 접수 모듈(210)은 오브젝트 분리 모듈(220), 겹쳐 쓰기 모듈(250)과 접속되어 있다. 화상을 접수하고, 그 화상을 오브젝트 분리 모듈(220), 겹쳐 쓰기 모듈(250)에 건네 준다. 화상을 접수한다는 것은 예를 들면, 스캐너, 카메라 등으로 화상을 판독하는 것, 팩스 등에 의해 통신 회선을 통하여 외부 기기로부터 화상을 수신하는 것, 하드디스크(컴퓨터에 내장되어 있는 것 이외에, 네트워크를 통하여 접속되어 있는 것 등을 포함함) 등에 기억되어 있는 화상을 판독하는 것 등이 포함된다. 화상은, 2치 화상, 다치(多値) 화상(칼라 화상)이어도 좋다. 또한, 다치 화상인 경우에는, 2치화 처리를 행하여, 2치 화상으로 변환한다. 접수하는 화상은 1매여도 좋고, 복수매여도 좋다. 또한, 화상의 내용으로서, 표가 포함되어 있는 바와 같은 화상이면, 비즈니스에 사용되는 장표 등의 문서, 광고 선전용의 팸플릿(pamphlet) 등이어도 좋다.
또한, 화상 접수 모듈(210)은 접수한 화상에 대하여, 노이즈 제거, 기울어짐 보정, 정규화 등의 전처리를 행하여도 좋다.
오브젝트 분리 모듈(220)은 화상 접수 모듈(210), 표 영역 추출 모듈(230), 정보 구성 모듈(270)과 접속되어 있다. 화상 접수 모듈(210)이 접수한 화상을 구성하는 오브젝트(부분화상)로 분리한다. 오브젝트에는, 적어도 표 영역이 포함되어 있고, 그 밖에, 문자 영역, 도형 영역, 사진 영역 등이 있다. 그리고, 그 분리 결과를 표 영역 추출 모듈(23O)에 건네 주고, 영역의 구성 정보(각 영역이 접수한 화상 내에서의 위치 등)를 정보 구성 모듈(270)에 건네 준다.
부분 화상으로의 분리는, 화상으로부터 공백 등으로 단절된 영역(부분 화상)을 추출하는 것에 의해 행한다. 이 부분 화상으로 분리하는 처리는 예를 들면, 화상 접수 모듈(210)에 의해 접수된 화상으로부터 백(白) 화소의 영역이 일정한 길이(혹은 면적) 이상 있는 곳에 의해 단절한다. 그렇게 단절하면, 흑 화소의 영역(예를 들면, 사각형)을 추출할 수 있다. 또한, 그 흑 화소의 영역의 화상으로서의 특징(예를 들면, 면적, 세로 또는 가로의 크기, 형상, 흑 화소 집단의 존재 위치 등)을 추출하고, 문자 영역, 도형 영역, 표 영역, 사진 영역 등의 종별을 판별할 수 있다. 물론 다른 기존의 방법으로 부분 화상을 추출해도 좋다.
표 영역 추출 모듈(230)은 오브젝트 분리 모듈(220), 표 괘선 보정 모듈(240)과 접속되어 있다. 오브젝트 분리 모듈(220)로부터 분리 결과를 수취하고, 화상 접수 모듈(210)이 접수한 화상 내에서 표 영역의 화상을 취출한다. 그리고, 그 표 영역의 화상을 표 괘선 보정 모듈(240)에 건네 준다.
표 괘선 보정 모듈(240)은 표 영역 추출 모듈(230), 겹쳐 쓰기 모듈(250)과 접속되어있다. 표 영역 추출 모듈(230)은 전술한 도 1에 도시한 모듈에 의해 구성되어 있다. 즉, 표 영역 추출 모듈(230)로부터 표 영역의 화상을 수취하고, 그 중의 선분으로부터 표를 구성하고 있는 괘선을 취출하여, 그 괘선을 실선화한 표만의 화상을 생성한다. 그리고, 그 생성한 표 화상을 겹쳐 쓰기 모듈(250)에 건네 준다. 상세에 대해서는, 도 3의 예를 이용하여 후술한다.
겹쳐 쓰기 모듈(250)은 화상 접수 모듈(210), 표 괘선 보정 모듈(240), 문자 인식 모듈(260)과 접속되어 있다. 화상 접수 모듈(210)이 접수한 화상에, 표 괘선 보정 모듈(240)이 생성한 표 화상을 겹쳐 쓰기한다. 그리고, 그 표 화상이 겹쳐 쓰기된 화상을 문자 인식 모듈(260)에 건네 준다. 표 화상을 겹쳐 쓰기함으로써, 원래의 화상 내의 표를 실선화한 화상이 완성되고, 이후의 처리에서는 그 실선화된 표를 취급하는 것이 된다.
문자 인식 모듈(260)은 겹쳐 쓰기 모듈(250), 정보 구성 모듈(270)과 접속되어 있다. 겹쳐 쓰기 모듈(250)에 의해 표 화상이 겹쳐 쓰기된 화상 내의 문자 인식 처리를 행한다. 여기에서의, 문자 인식 처리는 기존의 문자 인식 처리를 이용해도 좋다. 그리고, 문자 인식 처리는 표 구조의 해석 등을 행하여도 좋다. 예를 들면, 기존의 문자 인식 프로그램을 그대로 적용해도 좋고, 그 경우, 표 구조의 해석 등을 함에 있어서, 점선 등의 괘선이 있을 경우보다도 실선의 괘선으로 구성되어 있는 표의 쪽이 적당하다. 그리고, 문자 인식 결과를 정보 구성 모듈(270)에 건네 준다.
정보 구성 모듈(270)은 오브젝트 분리 모듈(220), 문자 인식 모듈(260), 출력 모듈(280)과 접속되어 있다. 문자 인식 모듈(260)로부터 문자 인식 결과와 오브젝트 분리 모듈(220)로부터 영역의 구성 정보를 수취하고, 그 화상의 해석 결과로서 구성 정보를 생성한다. 예를 들면, 구성 정보로서, 그 화상 내의 어느 위치에 어떤 문자열이 있는지, 표는 어떤 구조를 갖고 있고, 그 표 내의 셀에는 어떤 문자열이 있는지 등을 나타내는 정보가 있다. 그리고, 그 구성 정보를 출력 모듈(280)에 건네 준다.
출력 모듈(280)은 정보 구성 모듈(270)과 접속되어 있다. 정보 구성 모듈(270)로부터 구성 정보를 수취하고, 페이지 정보로 변환하여 출력한다. 페이지 정보로서, 예를 들면 XML(eXtensible Markup Language) 등의 포맷이 있다. 또한 출력으로서, 예를 들면 문서 데이터베이스 등에의 기억, 번역 처리 장치 등의 다른 정보 처리 장치에의 송신이 있지만, 이외에 화상의 청서(淸書)를 제시하는 것을 목적으로서, 프린터 등의 인쇄 장치에서 인쇄하는 것, 디스플레이 등의 표시 장치에 표시하는 것, 팩스 등의 화상 송신 장치에서 화상을 송신하는 것 등을 행하여도 좋다.
도 3은 본 실시예에 의한 처리 예를 도시하는 흐름도이다. 이 흐름도는 도 2의 예에 도시한 표 괘선 보정 모듈(240)에 의한 처리 예이며, 도 1의 예에 도시한 모듈에 의한 처리예이다.
스텝(S302)에서는, 표 괘선 보정 모듈(240)이 표 영역 추출 모듈(230)로부터 표 영역의 화상을 수취한다. 동일한 화상에 대하여, 스텝(S310)으로부터의 가로 괘선(수평 방향의 괘선)의 처리와 스텝(S350)으로부터의 세로 괘선(수직 방향의 괘선)의 처리가 행해진다.
예를 들면, 도 4의 예에 도시하는 표 영역 화상(400)이 해당한다. 표 영역 화상(400) 내에는, 가로 괘선(420으로부터 424), 세로 괘선(430으로부터 440)에 의해 구성되어 있는 표(410)가 있다. 또한, 도 4의 예에 도시하는 바와 같이, 표(410) 내의 각 셀에는 문자가 기재되어 있다. 여기에서, 표 영역 화상(400)에 대하여, 예를 들면 수직 방향으로 흑 화소 수를 그 위치(가로 방향)마다 계수한 것(히스토그램)을 도시하면, 도 5의 예에 도시하도록 된다. 이 파형으로부터 괘선과 그 외의 부분(문자가 있는 부분)을, 임계값을 이용하여 분리하는 것은 곤란하다. 도 5의 예에 도시하는 바와 같이, 점선, 파선 부분의 괘선의 흑 화소 수와 문자 부분의 흑 화소 수는 구별이 되지 않기 때문이다.
스텝(S310)에서는, 런 길이 카운트 모듈(110)이 수평 방향으로 각 런의 런 길이를 계측한다.
스텝(S312)에서는, 런 길이 평가 모듈(122)이 런 길이 임계값(1H)보다도 작거나 또는 런 길이가 임계값(2H)보다도 큰(run < th1H 또는 run > th2H, 여기에서, th2H > th1H) 범위에 있는 런을 추출한다.
스텝(S314)에서는, 런 길이 평가 모듈(122)이 스텝(S312)에서 추출한 런의 흑 화소 수를 위치마다 계수(카운트)한다. 여기에서의 「위치마다」란, 대상의 런을 수평 방향으로 투영한 경우의 위치마다를 말하고, 예를 들면 도 6의 (a)의 예에 도시하는 바와 같은 세로축 상의 히스토그램이 해당한다. 이것은, 런 길이가 임계값(1H)보다도 작거나 또는 임계값(2H)보다도 큰 것의 흑 화소 수를 계수한 것이다.
스텝(S316)에서는, 괘선 판정 모듈(130)이 스텝(S314)에서의 계수 값이 임계 값(4H)보다도 큰지의 여부를 판단한다. 큰 경우(Yes)는 스텝(S322)으로 진행되고, 그 이외의 경우(No)는 스텝(S324)으로 진행된다. 예를 들면, 도 6의 (a)의 예에 도시하는 바와 같은 경우, 흑 화소 수가 임계값(4H)보다도 큰 부분(투영 파형(621, 622, 623))이 3개인 것을 도시하고 있고, 각각 가로 괘선(420, 422, 424)에 대응한다.
스텝(S318)에서는, 런 유사성 평가 모듈(124)이 수평 방향에서의 런의 유사성의 계산을 행한다. 계산 결과로서, 예를 들면 도 7의 (a)의 예에 도시하는 그래프가 해당한다. 이것은, 수 1의 예에서 도시한 수식에 따라서 계산한 값을, 수평 방향마다의 위치(세로축 상)에 플롯(plot)한 것이다.
스텝(S320)에서는, 괘선 판정 모듈(130)이 스텝(S318)에서의 RLU가 임계값(3H)보다도 큰지의 여부를 판단한다. 큰 경우(Yes)는 스텝(S322)으로 진행되고, 그 이외의 경우(No)는 스텝(S324)으로 진행된다. 예를 들면, 도 7의 (a)의 예에 도시하는 바와 같은 경우, 임계값(3H)보다도 큰 부분은 없다.
스텝(S322)에서는, 스텝(S316) 또는 스텝(S320)에서 Yes로 판단된 경우, 괘선 화상 생성 모듈(140)이 대상으로 하고 있는 표 영역 화상으로부터 그 수평 방향의 화소를 남기도록 한다. 도 6의 (a)의 예에서는, 해당 개소로서 투영 파형(621, 622, 623)의 부분이 있고, 도 7의 (a)의 예에서는 해당 개소는 없다. 따라서, 스텝(S322)에 의한 처리 종료 시점에서는, 표 영역 화상(400)으로부터 투영 파형(621, 622, 623)의 부분을 남기는 것이 된다.
스텝(S324)에서는, 스텝(S316) 또한 스텝(S32O)에서 No로 판단된 경우, 괘선 화상 생성 모듈(140)이 대상으로 하고 있는 표 영역 화상으로부터 그 수평 방향의 화소를 지우도록 한다. 도 6의 (a)의 예에서는, 해당 개소로서 투영 파형(621, 622, 623) 이외의 부분이 있고, 도 7의 (a)의 예에서는, 모두 해당 개소이다. 따라서, 스텝(S324)에 의한 처리 종료 시점에서는, 표 영역 화상(400)으로부터 투영 파형(621, 622, 623) 이외의 부분을 삭제하는 것이 된다.
스텝(S326)에서는, 괘선 화상 생성 모듈(140)이 스텝(S322)의 처리에 의해 남겨진 화상과 스텝(S324)의 처리에 의해 삭제된 화상으로부터, 괘선인 가로선만을 남긴 마스크 화상을 생성한다. 또한, 도 8의 (a)의 예에 도시하는 바와 같이, 도 6의 (a)에 도시한 예와 도 7의 (a)에 도시한 예를 합성한 것으로부터, 마스크 화상을 생성하도록 하여도 좋다.
스텝(S350)에서는, 런 길이 카운트 모듈(110)이 수직 방향으로 각 런의 런 길이를 계측한다.
스텝(S352)에서는, 런 길이 평가 모듈(122)이 런 길이 임계값(1V)보다도 작거나 또는 런 길이 임계값(2V)보다도 큰(run < th1V 또는 run > th2V, 여기에서 th2V > th1V) 범위에 있는 런을 추출한다.
스텝(S354)에서는, 런 길이 평가 모듈(122)이 스텝(S352)에서 추출한 런의 흑 화소 수를 위치마다 계수(카운트)한다. 여기에서의 「위치마다」란, 대상의 런을 수직 방향으로 투영한 경우의 위치마다를 말하고, 예를 들면 도 6의 (b)의 예에 도시하는 바와 같은 가로축 상의 히스토그램이 해당한다. 이것은, 런 길이가 임계값(1V)보다도 작거나 또는 임계값(2V)보다도 큰 것의 흑 화소 수를 계수한 것이다.
스텝(S356)에서는, 괘선 판정 모듈(130)이 스텝(S354)에서의 계수 값이 임계값(4V)보다도 큰지의 여부를 판단한다. 큰 경우(Yes)는 스텝(S362)으로 진행되고, 그 이외의 경우(No)는 스텝(S364)으로 진행된다. 예를 들면, 도 6의 (b)의 예에 도시하는 바와 같은 경우, 흑 화소 수가 임계값(4V)보다도 큰 부분(투영 파형(611, 612, 613, 614))이 4개 있는 것을 도시하고 있고, 각각 세로 괘선(430, 432, 434, 440)에 대응한다.
스텝(S358)에서는, 런 유사성 평가 모듈(124)이 수직 방향에서의 런의 유사성의 계산을 행한다. 계산 결과로서, 예를 들면 도 7의 (b)의 예에 도시하는 그래프가 해당한다. 이것은, 수 1의 예에서 나타낸 수식에 따라서 계산한 값을, 수직 방향마다의 위치(가로축 상)에 플롯한 것이다.
스텝(S360)에서는, 괘선 판정 모듈(130)이 스텝(S358)에서의 RLU가 임계값(3V)보다도 큰지의 여부를 판단한다. 큰 경우(Yes)는 스텝(S362)으로 진행되고, 그 이외의 경우(No)는 스텝(S364)으로 진행된다. 예를 들면, 도 7의 (b)의 예에 도시하는 바와 같은 경우, 임계값(3V)보다도 큰 부분(투영 파형(711, 712, 713))이 3개 있는 것을 도시하고 있고, 각각 세로 괘선(434, 436, 438)에 대응한다.
스텝(S362)에서는, 스텝(S356) 또는 스텝(S360)에서 Yes로 판단된 경우, 괘선 화상 생성 모듈(140)이 대상으로 하고 있는 표 영역 화상으로부터 그 수직 방향의 화소를 남기도록 한다. 도 6의 (b)의 예에서는, 해당 개소로서 투영 파형(611, 612, 613, 614)의 부분이 있고, 도 7의 (b)의 예에서는, 해당 개소로서 투영 파형(711, 712, 713)의 부분이 있다. 따라서, 스텝(S362)에 의한 처리 종료 시점에서는, 표 영역 화상(400)으로부터 투영 파형(611, 612, 613(711), 712, 713, 614)의 부분을 남기는 것이 된다.
스텝(S364)에서는, 스텝(S356) 또한 스텝(S36O)에서 No로 판단된 경우, 괘선 화상 생성 모듈(140)이 대상으로 하고 있는 표 영역 화상으로부터 그 수직 방향의 화소를 지우도록 한다. 도 6의 (b)의 예에서는, 해당 개소로서 투영 파형(611, 612, 613, 614) 이외의 부분이 있고, 도 7의 (b)의 예에서는, 해당 개소로서 투영 파형(711, 712, 713) 이외의 부분이 있다. 따라서, 스텝(S364)에 의한 처리 종료 시점에서는, 표 영역 화상(400)으로부터 투영 파형(611, 612, 613(711), 712, 713, 614) 이외의 부분을 삭제하는 것이 된다.
스텝(S366)에서는, 괘선 화상 생성 모듈(140)이 스텝(S362)의 처리에 의해 남겨진 화상과 스텝(S364)의 처리에 의해 삭제된 화상으로부터, 괘선인 세로선만을 남긴 마스크 화상을 생성한다. 또한, 도 8의 (b)의 예에 도시하는 바와 같이, 도 6의 (b)에 도시한 예와 도 7의 (b)에 도시한 예를 합성한 것으로부터, 마스크 화상을 생성하도록 하여도 좋다.
또한, 단계(S31O)로부터 스텝(S326)까지의 처리에서, 임계값(1H), 임계값(2H), 임계값(3H), 임계값(4H)은 가로 괘선용의 임계값이지만, 스텝(S350)으로부터 스텝(S366)까지의 처리에서 사용하고 있는 임계값(1V), 임계값(2V), 임계값(3V), 임계값(4V)은 세로 괘선용의 임계값이며, 가로 괘선용의 임계값과 각각 동일한 값이어도 좋고, 다른 값이어도 좋다.
스텝(S380)에서는, 괘선 화상 생성 모듈(140)이 스텝(S326)에서 생성된 가로선만으로 이루어지는 괘선의 화상과 스텝(S366)에서 생성된 세로선만으로 이루어지는 괘선의 화상을 합성한다. 예를 들면, 도 4의 예에 도시한 표(410)는 도 9의 예에 도시한 바와 같이 된다. 즉, 도 4의 예에 도시한 표(410) 내로부터 문자가 삭제되어서, 괘선만의 표(410)가 추출되는 것이 된다.
스텝(S382)에서는, 괘선 화상 보정 모듈(150)이 팽창, 수축 처리를 행하여, 점선, 파선 등을 실선화한다. 예를 들면, 도 9의 예에 도시한 표(410)는 도 10의 예에 도시한 바와 같이 된다. 즉, 도 4의 예에 도시한 표(410) 내로부터 문자가 삭제되어서, 실선화된 괘선의 표(1010)가 생성되는 것이 된다.
도 11은 파선을 포함하는 괘선으로 이루어지는 표를 대상으로 하는 실험 결과예(세로 괘선의 추출 처리)를 도시하는 설명도이다. 도 11의 (a)의 예에 도시하는 표(1100)를 처리 대상으로 한다. 도 11의 (b)의 예는, 단순하게 흑 화소의 히스토그램을 도시하고 있고, 파선과 문자 부분은 임계값만으로는 구별이 곤란하다는 것을 알 수 있다. 도 11의 (c)의 예에 도시하는 히스토그램은 수직 방향의 런 길이가 임계값(1V)보다도 작거나 또는 임계값(2V)보다도 큰 것의 흑 화소 수를 투영한 것이며(도 6의 (b)에 대응), 실선 부분만이 돌출한 값을 도시하고 있다. 도 11의 (d)의 예에 도시하는 그래프는 수 1의 식에서 런의 유사성을 산출한 예이며(도 7의 (b)에 대응), 파선 부분만이 돌출한 값을 도시하고 있다.
도 12는 점선을 포함하는 괘선으로 이루어지는 표를 대상으로 한 실험 결과예(세로 괘선의 추출 처리)를 도시하는 설명도이다. 도 12의 (a)의 예에 도시하는 표(1200)를 처리 대상으로 한다. 도 12의 (b)의 예는, 단순하게 흑 화소의 히스토그램을 도시하고 있고, 점선과 문자 부분은 임계값만으로는 구별이 곤란하다는 것을 알 수 있다. 도 12의 (c)의 예에 도시하는 히스토그램은 수직 방향의 런 길이가 임계값(1V)보다도 작거나 또는 임계값(2V)보다도 큰 것의 흑 화소 수를 투영한 것이며(도 6의 (b)에 대응), 실선 및 점선 부분이 돌출한 값을 도시하고 있다. 도 12의 (d)의 예에 도시하는 그래프는 수 1의 식에서 런의 유사성을 산출한 예이며(도 7의 (b)에 대응), 점선 부분만이 돌출한 값을 도시하고 있다.
도 13은 실선의 괘선으로 이루어지는 표를 대상으로 한 실험 결과예(세로 괘선의 추출 처리)를 도시하는 설명도이다. 도 13의 (a)의 예에 도시하는 표(1300)를 처리 대상으로 한다. 도 13의 (b)의 예는, 단순하게 흑 화소의 히스토그램을 도시하고 있다. 도 13의 (c)의 예에 도시하는 히스토그램은 수직 방향의 런 길이가 임계값(1V)보다도 작거나 또는 임계값(2V)보다도 큰 것의 흑 화소 수를 투영한 것이며(도 6의 (b)에 대응), 실선 부분이 돌출한 값을 도시하고 있다. 도 13의 (d)의 예에 도시하는 그래프는 수 1의 식에서 런의 유사성을 산출한 예이며(도 7의 (b)에 대응), 돌출한 개소는 없는 것을 도시하고 있다. 또한, 도 13의 (d)의 예에 도시하는 레인지(range)는, 도 11의 (d) 등의 예와는 다르고, 변동이 확장되어서 도시되어 있다.
도 14를 참조하여, 본 실시예의 화상 처리 장치의 하드웨어 구성예에 관하여 설명한다. 도 14에 도시하는 구성은 예를 들면, 퍼스널 컴퓨터(PC) 등에 의해 구성되는 것이며, 스캐너 등의 데이터 판독부(1417)와, 프린터 등의 데이터 출력 부(1418)를 구비한 하드웨어 구성예를 도시하고 있다.
CPU(Central Processing Unit)(1401)는 전술의 실시예에 대하여 설명한 각종의 모듈, 즉 런 길이 카운트 모듈(110), 런 평가 모듈(120), 괘선 판정 모듈(130), 괘선 화상 생성 모듈(140), 괘선 화상 보정 모듈(150), 오브젝트 분리 모듈(220), 표 영역 추출 모듈(230) 등의 각 모듈의 실행 시퀀스를 기술한 컴퓨터 프로그램에 따른 처리를 실행하는 제어부이다.
ROM(Read Only Memory)(1402)은 CPU(1401)가 사용하는 프로그램이나 연산 파라미터 등을 저장한다. RAM(Random Access Memory)(1403)은 CPU(1401)의 실행에서 사용하는 프로그램이나, 그 실행에서 적당하게 변화하는 파라미터 등을 저장한다. 이것은 CPU 버스 등으로 구성되는 호스트 버스(1404)에 의해 서로 접속되어 있다.
호스트 버스(1404)는 브리지(1405)를 통하여, PCI(Peripheral Component Interconnect/Interface) 버스 등의 외부 버스(1406)에 접속되어 있다.
키보드(1408), 마우스 등의 포인팅 디바이스(pointing device)(1409)는 조작자에 의해 조작되는 입력 디바이스이다. 디스플레이(1410)는 액정 표시 장치 또는 CRT(Cathode Ray Tube) 등이 있고, 각종 정보를 텍스트나 이미지 정보로서 표시한다.
HDD(Hard Disk Drive)(1411)는 하드 디스크를 내장하고, 하드 디스크를 구동하고, CPU(1401)에 의해 실행하는 프로그램이나 정보를 기록 또는 재생시킨다. 하드 디스크에는, 화상 접수 모듈(210)이 접수한 화상, 표 괘선 보정 모듈(240)이 보정한 표 화상 등이 저장된다. 또한, 그 외의 각종의 데이터 처리 프로그램 등, 각 종 컴퓨터·프로그램이 저장된다.
드라이브(1412)는 장착되어 있는 자기 디스크, 광 디스크, 광자기 디스크, 또는 반도체 메모리 등의 리무버블(removable) 기록 매체(1413)에 기록되어 있는 데이터 또는 프로그램을 판독하고, 그 데이터 또는 프로그램을, 인터페이스(1407), 외부 버스(1406), 브리지(1405), 및 호스트 버스(1404)를 통하여 접속되어 있는 RAM(1403)에 공급한다. 리무버블 기록 매체(1413)도, 하드 디스크와 동일한 데이터 기록 영역으로서 이용가능하다.
접속 포트(1414)는 외부 접속 기기(1415)를 접속하는 포트이며, USB, IEEE1394 등의 접속부를 가진다. 접속 포트(1414)는 인터페이스(1407), 및 외부 버스(1406), 브리지(1405), 호스트 버스(1404) 등을 통하여 CPU(1401) 등에 접속되어 있다. 통신부(1416)는 네트워크에 접속되고, 외부와의 데이터 통신 처리를 실행한다. 데이터 판독부(1417)는 예를 들면, 스캐너이며, 도큐멘트(document)의 판독 처리를 실행한다. 데이터 출력부(1418)는 예를 들면, 프린터이며, 도큐멘트 데이터의 출력 처리를 실행한다.
또한, 도 14에 도시하는 화상 처리 장치의 하드웨어 구성은 1개의 구성예를 도시하는 것이며, 본 실시예는 도 14에 도시하는 구성에 한하지 않고, 본 실시예에서 설명한 모듈을 실행가능한 구성이면 좋다. 예를 들면, 일부의 모듈을 전용의 하드웨어(예를 들면, 특정 용도 대상 집적 회로(Application Specific Integrated Circuit: ASIC) 등)로 구성해도 좋고, 일부의 모듈은 외부의 시스템 내에 있고 통신 회선으로 접속하고 있는 것과 같은 형태여도 좋고, 또한 도 14에 도시하는 시스템이 복수 상호 통신 회선에 의해 접속되어 있어서 서로 협조 동작하도록 해도 좋다. 또한, 복사기, 팩스, 스캐너, 프린터, 복합기(스캐너, 프린터, 복사기, 팩스 등 중 어느 것인가 2개 이상의 기능을 가지고 있는 화상 처리 장치) 등에 갖추어져 있어도 좋다.
상기 실시예에서는, 괘선이 도중에 도절되는 예로서 점선, 파선을 제시했지만, 일점 쇄선, 이점 쇄선 등을 사용한 괘선이어도 좋다.
또한, 도 3의 예에 도시한 흐름도에서는, 스텝(S302)으로부터 스텝(S310)과 스텝(S350)의 처리로 나뉘었지만, 스텝(S310)으로부터 스텝(S326)까지의 처리를 행한 후에, 접수된 화상을 90도 회전하여, 재차 스텝(S310)으로부터 스텝(S326)까지의 처리를 행하도록 하여도 좋다.
또한, 설명한 프로그램에 대해서는, 기록 매체에 저장하여 제공해도 좋고, 또한, 그 프로그램을 통신 수단에 의해 제공해도 좋다. 그 경우, 예를 들면, 상기 설명한 프로그램에 대하여, 「프로그램을 기록한 컴퓨터 판독가능한 기록 매체」의 발명으로서 파악해도 좋다.
「프로그램을 기록한 컴퓨터 판독가능한 기록 매체」란, 프로그램의 인스톨, 실행, 프로그램의 유통 등을 위해 사용되는 프로그램이 기록된 컴퓨터로 판독가능한 기록 매체를 말한다.
또한, 기록 매체로서는, 예를 들면 디지털·버서틀·디스크(DVD)이며, DVD 프로그램에서 책정된 규격인 「DVD-R, DVD-RW, DVD-RAM 등」, DVD+RW에서 책정된 규격인 「DVD+R, DVD+RW 등」, 콤팩트 디스크(CD)이며, 판독 전용 메모리(CD-ROM), CD레코더(CD-R), CD리라이터블(CD-RW) 등, 블루 레이·디스크(Blu-ray Disk(등록 상표)), 광자기 디스크(MO), 플렉시블 디스크(FD), 자기 테이프, 하드 디스크, 판독 전용 메모리(ROM), 전기적 소거 및 재기입가능한 판독 전용 메모리(EEPROM), 플래시·메모리, 랜덤·액세스·메모리(RAM) 등이 포함된다.
그리고, 상기의 프로그램 또는 그 일부는 상기 기록 매체에 기록하여 보존이나 유통 등을 시켜도 좋다. 또한, 통신에 의해, 예를 들면 로컬·에어리어·네트워크(LAN), 메트로폴리탄·에어리어·네트워크(MAN), 와이드·에어리어·네트워크(WAN), 인터넷, 인트라넷, 엑스트라넷 등에 사용되는 유선 네트워크, 혹은 무선 통신 네트워크, 또한 이것의 조합 등의 전송 매체를 이용하여 전송시켜도 좋고, 또한 반송파에 실어서 반송시켜도 좋다.
또한, 상기의 프로그램은 다른 프로그램의 일부분이어도 좋고, 혹은 별개의 프로그램과 함께 기록 매체에 기록되어있어도 좋다. 또한, 복수의 기록 매체에 분할하여 기록되어 있어도 좋다. 또한, 압축이나 암호화 등, 복원가능하면 어떤 태양으로 기록되어 있어도 좋다.
도 1은 본 실시예의 구성예에 관한 개념적인 모듈 구성도.
도 2는 본 실시예를 구현화하는 경우의 화상 처리 장치 전체의 구성예에 관한 개념적인 모듈 구성도.
도 3은 본 실시예에 의한 처리예를 도시하는 흐름도.
도 4는 본 실시예가 대상으로 하는 표 영역 화상의 예를 도시하는 설명도.
도 5는 흑 화소 수의 히스토그램의 예를 도시하는 설명도.
도 6은 미리 정해진 범위 내에 있는 런 길이의 흑 화소 수의 히스토그램의 예를 도시하는 설명도.
도 7은 유사성 평가 결과에 의거하여 작성한 그래프의 예를 도시하는 설명도.
도 8은 2개의 처리 결과를 합성한 예를 도시하는 설명도.
도 9는 표의 괘선을 추출한 예를 도시하는 설명도.
도 10은 표의 점선, 파선 등의 괘선을 실선의 괘선으로 변환한 예를 도시하는 설명도.
도 11은 파선을 포함하는 괘선으로 이루어지는 표를 대상으로 한 실험 결과예를 도시하는 설명도.
도 12는 점선을 포함하는 괘선으로 이루어지는 표를 대상으로 한 실험 결과예를 도시하는 설명도.
도 13은 실선의 괘선으로 이루어지는 표를 대상으로 한 실험 결과예를 도시 하는 설명도.
도 14는 본 실시예를 실현하는 컴퓨터의 하드웨어 구성예를 도시하는 블록도.
*도면의 주요 부분에 대한 부호의 설명*
110 : 런 길이 카운트 모듈
120 : 런 평가 모듈
122 : 런 길이 평가 모듈
124 : 런 유사성 평가 모듈
130 : 괘선 판정 모듈
140 : 괘선 화상 생성 모듈
150 : 괘선 화상 보정 모듈
210 : 화상 접수 모듈
220 : 오브젝트 분리 모듈
230 : 표 영역 추출 모듈
240 : 표 괘선 보정 모듈
250 : 겹쳐 쓰기 모듈
260 : 문자 인식 모듈
270 : 정보 구성 모듈
280 : 출력 모듈

Claims (16)

  1. 화상 내의 선분의 선분 길이를 계측하는 계측 수단과,
    상기 선분 길이 계측 수단에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하고, 상기 선분의 위치마다 미리 정해진 범위 내에 있는 선분 길이를 갖는 선분의 누적 화소 수에 의거하여, 상기 선분의 평가를 행하는 제 1 평가 수단과,
    상기 선분 길이 계측 수단에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하고, 상기 선분의 위치마다 상기 계측된 선분 길이 중 유사한 선분 길이의 출현 빈도에 의거하여, 상기 선분의 평가를 행하는 제 2 평가 수단과,
    상기 제 1 평가 수단에 의한 평가 결과와 상기 제 2 평가 수단에 의한 평가 결과에 의거하여, 괘선(罫線)을 판정하는 판정 수단을 구비하며,
    상기 계측 수단은, 화상의 세로 방향에서의 선분 길이 및 가로 방향에서의 선분 길이를 계측하고,
    상기 제 1 평가 수단, 상기 제 2 평가 수단에서의 선분의 위치는, 상기 화상의 세로 방향에서의 위치 및 가로 방향에서의 위치이며,
    상기 판정 수단은, 선분이 세로 괘선을 구성하는 것인지의 여부의 판정과 선분이 가로 괘선을 구성하는 것인지의 여부의 판정을 행하는 화상 처리 장치.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제 1 항에 있어서,
    상기 괘선 판정 수단에 의해 괘선을 구성하는 것으로 판정된 선분을 이용하여 표(表) 화상을 생성하는 표 화상 생성 수단과,
    상기 표 화상 생성 수단에 의해 생성된 표 화상의 괘선을 실선으로 변환하는 실선 변환 수단을 더 구비하는 화상 처리 장치.
  6. 제 1 항에 있어서,
    상기 괘선 판정 수단에 의해 괘선을 구성하는 것으로 판정된 선분을 이용하여 표 화상을 생성하는 표 화상 생성 수단과,
    상기 표 화상 생성 수단에 의해 생성된 표 화상의 괘선을 실선으로 변환하는 실선 변환 수단을 더 구비하는 화상 처리 장치.
  7. 화상 내의 선분의 선분 길이를 계측하는 계측 단계와,
    상기 선분 길이 계측 단계에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하고, 상기 선분의 위치마다 미리 정해진 범위 내에 있는 선분 길이를 갖는 선분의 누적 화소 수에 의거하여, 상기 선분의 평가를 행하는 제 1 평가 단계와,
    상기 선분 길이 계측 단계에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하고, 상기 선분의 위치마다 상기 계측된 선분 길이 중 유사한 선분 길이의 출현 빈도에 의거하여, 상기 선분의 평가를 행하는 제 2 평가 단계와,
    상기 제 1 평가 단계에 의한 평가 결과와 상기 제 2 평가 단계에 의한 평가 결과에 의거하여, 괘선(罫線)을 판정하는 판정 단계를 구비하며,
    상기 계측 단계는, 화상의 세로 방향에서의 선분 길이 및 가로 방향에서의 선분 길이를 계측하고,
    상기 제 1 평가 단계, 상기 제 2 평가 단계에서의 선분의 위치는, 상기 화상의 세로 방향에서의 위치 및 가로 방향에서의 위치이며,
    상기 판정 단계는, 선분이 세로 괘선을 구성하는 것인지의 여부의 판정과 선분이 가로 괘선을 구성하는 것인지의 여부의 판정을 행하는 화상 처리 방법.
  8. 삭제
  9. 삭제
  10. 삭제
  11. 제 7 항에 있어서,
    상기 괘선 판정 단계에 의해 괘선을 구성하는 것으로 판정된 선분을 이용하여 표(表) 화상을 생성하는 표 화상 생성 단계와,
    상기 표 화상 생성 단계에 의해 생성된 표 화상의 괘선을 실선으로 변환하는 실선 변환 단계를 더 구비하는 화상 처리 방법.
  12. 제 7 항에 있어서,
    상기 괘선 판정 단계에 의해 괘선을 구성하는 것으로 판정된 선분을 이용하여 표 화상을 생성하는 표 화상 생성 단계와,
    상기 표 화상 생성 단계에 의해 생성된 표 화상의 괘선을 실선으로 변환하는 실선 변환 단계를 더 구비하는 화상 처리 방법.
  13. 컴퓨터를,
    화상 내의 선분의 선분 길이를 계측하는 계측 수단과,
    상기 계측 수단에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하고, 상기 선분의 위치마다 미리 정해진 범위 내에 있는 선분 길이를 갖는 선분의 누적 화소 수에 의거하여, 상기 선분의 평가를 행하는 제 1 평가 수단과,
    상기 계측 수단에 의해 계측된 선분 길이와 상기 선분의 위치에 의거하고, 상기 선분의 위치마다 상기 계측된 선분 길이 중 유사한 선분 길이의 출현 빈도에 의거하여, 상기 선분의 평가를 행하는 제 2 평가 수단과,
    상기 제 1 평가 수단에 의한 평가 결과와 상기 제 2 평가 수단에 의한 평가 결과에 의거하여, 괘선을 판정하는 판정 수단으로서 기능시키고,
    상기 계측 수단은, 화상의 세로 방향에서의 선분 길이 및 가로 방향에서의 선분 길이를 계측하고,
    상기 제 1 평가 수단, 상기 제 2 평가 수단에서의 선분의 위치는, 상기 화상의 세로 방향에서의 위치 및 가로 방향에서의 위치이며,
    상기 판정 수단은, 선분이 세로 괘선을 구성하는 것인지의 여부의 판정과 선분이 가로 괘선을 구성하는 것인지의 여부의 판정을 행하는 것을 특징으로 하는 화상 처리 프로그램을 기록한 컴퓨터 판독가능한 기록 매체.
  14. 제 1 항에 있어서,
    상기 제 2 평가 수단은, 다음의 식 1에 의한 유사성 지수를 평가 결과로 하는 화상 처리 장치.
    [식 1]
    Figure 112013047287219-pat00018
    (여기서, RLU(θ)는 유사성 지수, a는 화소 농도, R은 상기 선분 길이 계측 수단에 의해 계측된 선분 길이, θ는 조작 방향, M()은 출현 빈도를 나타낸다.)
  15. 제 7 항에 있어서,
    상기 제 2 평가 단계는, 다음의 식 1에 의한 유사성 지수를 평가 결과로 하는 화상 처리 방법.
    [식 1]
    Figure 112013047287219-pat00019
    (여기서, RLU(θ)는 유사성 지수, a는 화소 농도, R은 상기 선분 길이 계측 단계에 의해 계측된 선분 길이, θ는 조작 방향, M()은 출현 빈도를 나타낸다.)
  16. 제 13 항에 있어서,
    상기 제 2 평가 수단은, 다음의 식 1에 의한 유사성 지수를 평가 결과로 하는 화상 처리 프로그램을 기록한 컴퓨터 판독가능한 기록 매체.
    [식 1]
    Figure 112013047287219-pat00020
    (여기서, RLU(θ)는 유사성 지수, a는 화소 농도, R은 상기 선분 길이 계측 수단에 의해 계측된 선분 길이, θ는 조작 방향, M()은 출현 빈도를 나타낸다.)
KR1020090075957A 2009-01-29 2009-08-18 화상 처리 장치, 화상 처리 방법 및 기록 매체 KR101336901B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009018577A JP4706764B2 (ja) 2009-01-29 2009-01-29 画像処理装置及び画像処理プログラム
JPJP-P-2009-018577 2009-01-29

Publications (2)

Publication Number Publication Date
KR20100088052A KR20100088052A (ko) 2010-08-06
KR101336901B1 true KR101336901B1 (ko) 2013-12-04

Family

ID=42354193

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090075957A KR101336901B1 (ko) 2009-01-29 2009-08-18 화상 처리 장치, 화상 처리 방법 및 기록 매체

Country Status (4)

Country Link
US (1) US8805076B2 (ko)
JP (1) JP4706764B2 (ko)
KR (1) KR101336901B1 (ko)
CN (1) CN101794388B (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5724341B2 (ja) * 2010-12-06 2015-05-27 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
TWI461656B (zh) * 2011-12-01 2014-11-21 Ind Tech Res Inst 距離感測裝置及距離感測方法
JP6468463B2 (ja) * 2015-07-30 2019-02-13 京セラドキュメントソリューションズ株式会社 画像処理装置
JP7234719B2 (ja) * 2019-03-18 2023-03-08 富士フイルムビジネスイノベーション株式会社 画像処理装置及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04291479A (ja) * 1991-03-19 1992-10-15 Ricoh Co Ltd 罫線認識方法及び表処理方法
JPH07230525A (ja) * 1993-12-22 1995-08-29 Ricoh Co Ltd 罫線認識方法及び表処理方法
JPH0895966A (ja) * 1994-09-21 1996-04-12 Casio Comput Co Ltd 表罫線編集装置
JPH10171922A (ja) * 1996-12-05 1998-06-26 Ricoh Co Ltd 罫線消去装置及び記録媒体

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3838729C2 (de) * 1987-11-16 1994-05-05 Canon Kk Dokumentverarbeitungsgerät
KR950006410B1 (ko) * 1989-10-20 1995-06-15 가부시기갸이샤 히다찌세이사꾸쇼 서식문서의 화상표시/처리방법 및 장치
US5191612A (en) * 1990-03-13 1993-03-02 Fujitsu Limited Character recognition system
JP3052438B2 (ja) 1991-07-03 2000-06-12 松下電器産業株式会社 表認識装置
DE69333694T2 (de) * 1992-09-11 2005-10-20 Canon K.K. Verfahren und Anordnung zur Bildverarbeitung
JPH0713999A (ja) 1993-06-23 1995-01-17 Matsushita Electric Ind Co Ltd 表認識装置
JPH10134180A (ja) * 1996-10-30 1998-05-22 Hitachi Ltd 認識辞書自動生成方法
US6466687B1 (en) * 1997-02-12 2002-10-15 The University Of Iowa Research Foundation Method and apparatus for analyzing CT images to determine the presence of pulmonary tissue pathology
JPH1176658A (ja) 1997-09-05 1999-03-23 Brother Ind Ltd 刺繍データ処理装置及びミシン並びに記録媒体
JPH11123289A (ja) 1997-10-22 1999-05-11 Brother Ind Ltd 刺繍データ処理装置及び刺繍ミシン並びに記録媒体
JP4742404B2 (ja) * 2000-05-17 2011-08-10 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04291479A (ja) * 1991-03-19 1992-10-15 Ricoh Co Ltd 罫線認識方法及び表処理方法
JPH07230525A (ja) * 1993-12-22 1995-08-29 Ricoh Co Ltd 罫線認識方法及び表処理方法
JPH0895966A (ja) * 1994-09-21 1996-04-12 Casio Comput Co Ltd 表罫線編集装置
JPH10171922A (ja) * 1996-12-05 1998-06-26 Ricoh Co Ltd 罫線消去装置及び記録媒体

Also Published As

Publication number Publication date
CN101794388A (zh) 2010-08-04
JP2010176414A (ja) 2010-08-12
KR20100088052A (ko) 2010-08-06
CN101794388B (zh) 2013-10-23
US8805076B2 (en) 2014-08-12
JP4706764B2 (ja) 2011-06-22
US20100189307A1 (en) 2010-07-29

Similar Documents

Publication Publication Date Title
JP5240047B2 (ja) キーワード識別方法及装置
KR101334483B1 (ko) 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체
US8693790B2 (en) Form template definition method and form template definition apparatus
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
US8418050B2 (en) Computer readable recording medium on which form data extracting program is recorded, form data extracting apparatus, and form data extracting method
US8155945B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
US20100008585A1 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
US20100259558A1 (en) Underline removal apparatus
US11935314B2 (en) Apparatus for generating a binary image into a white pixel, storage medium, and method
KR101336901B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP4232679B2 (ja) 画像形成装置およびプログラム
KR101248449B1 (ko) 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체
US8254693B2 (en) Image processing apparatus, image processing method and program
JP5365440B2 (ja) 画像処理装置及び画像処理プログラム
JP5742283B2 (ja) 画像処理装置及び画像処理プログラム
JP5262778B2 (ja) 画像処理装置及び画像処理プログラム
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP5489894B2 (ja) 画像処理装置及び画像処理プログラム
JP5005633B2 (ja) 画像検索装置、画像検索方法、情報処理プログラム及び記録媒体
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
US20220343666A1 (en) Image processing apparatus, image processing method, and storage medium
JP4995507B2 (ja) 画像処理システム、文字認識システムおよび画像処理プログラム
JP5039449B2 (ja) 画像処理装置及び画像処理プログラム
US10922538B2 (en) Information processing apparatus that determines whether a PDF file is searchable, and method and storage medium thereof
JP6606885B2 (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171107

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181121

Year of fee payment: 6