KR100657385B1 - 표 화상 처리 장치, 그 처리 프로그램을 저장하는 기억 매체 및 표 관리 처리 방법 - Google Patents

표 화상 처리 장치, 그 처리 프로그램을 저장하는 기억 매체 및 표 관리 처리 방법 Download PDF

Info

Publication number
KR100657385B1
KR100657385B1 KR1019990050770A KR19990050770A KR100657385B1 KR 100657385 B1 KR100657385 B1 KR 100657385B1 KR 1019990050770 A KR1019990050770 A KR 1019990050770A KR 19990050770 A KR19990050770 A KR 19990050770A KR 100657385 B1 KR100657385 B1 KR 100657385B1
Authority
KR
South Korea
Prior art keywords
ruled line
rounded corner
candidate
line
ruled
Prior art date
Application number
KR1019990050770A
Other languages
English (en)
Other versions
KR20000047655A (ko
Inventor
오오하라아쓰꼬
나오이사또시
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20000047655A publication Critical patent/KR20000047655A/ko
Application granted granted Critical
Publication of KR100657385B1 publication Critical patent/KR100657385B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/28Indexing scheme for image data processing or generation, in general involving image processing hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 표 화상 처리 장치 및 프로그램을 저장하는 기억 매체에 관한 것이다.
표 화상 처리 장치는 둥근 모서리 부분을 갖는 표 화상을 정확히 처리하며 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 수단과, 직선 추출 수단에 의해 검출한 직선을 기점으로 하는 경사 성분을 추출하여, 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 수단과, 둥근 모서리 후보 영역 검출 수단에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀 추출 수단과, 셀 추출 수단에 의해 추출한 셀의 둥근 모서리 부분을 결정하는 둥근 모서리 부분 결정 수단을 구비한다.
화상, 프로그램, 기억 매체

Description

표 화상 처리 장치, 그 처리 프로그램을 저장하는 기억 매체 및 표 관리 처리 방법{DEVICE PROCESSING A TABLE IMAGE, A MEMORY MEDIUM STORING A PROCESSING PROGRAM, AND A TABLE MANAGEMENT PROCESSING METHOD}
도1은 본 발명의 제1 원리 구성도.
도2는 본 발명의 제2 원리 구성도.
도3은 본 발명의 표 화상 처리 장치의 구성도.
도4는 본 발명의 표 화상 처리의 플로우를 나타내는 도면.
도5는 본 발명의 직선 추출 처리 플로우를 나타내는 도면.
도6의 a 및 도6의 b는 본 발명의 선분 추출 처리의 결과를 나타내는 도면.
도7의 a 및 도7의 b는 본 발명의 직선 추출 처리의 결과를 나타내는 도면.
도8은 본 발명의 둥근 모서리 후보 영역 추출 처리의 플로우를 나타내는 도면.
도9의 a∼c는 본 발명의 둥근 모서리 부분을 확대한 예를 나타내는 도면.
도10의 a 및 b는 본 발명의 근접 처리의 예를 나타내는 도면.
도11은 본 발명의 검출 처리의 예를 나타내는 도면.
도12는 본 발명의 직선 정보의 검출 처리를 나타내는 도면.
도13은 본 발명의 셀 추출 처리의 플로우를 나타내는 도면.
도14는 본 발명의 둥근 모서리 부분 판정 처리의 플로우를 나타내는 도면.
도15의 a 및 b는 본 발명의 화소 밀도 변화 검출 처리를 나타내는 도면.
도16의 a 및 b는 본 발명의 대칭성 처리를 나타내는 도면.
도17의 a∼d는 본 발명의 정합 처리를 나타내는 도면.
도18은 본 발명의 문자 인식 영역의 판정 처리를 나타내는 도면.
도19의 a 및 b는 둥근 모서리표 형식의 일례를 나타내는 도면.
도20은 본 발명의 표 화상 처리 장치의 구성도.
도21은 본 발명의 직선 추출 수단의 구성도.
도22는 본 발명의 직선 추출 처리의 플로우를 나타내는 도면.
도23은 본 발명의 괘선 후보 영역의 검출 처리의 플로우를 나타내는 도면.
도24의 a∼d는 종래예와 본 발명의 요철도(roughness)의 검출의 일례를 나타내는 도면.
도25의 a∼d는 종래예와 본 발명의 요철도의 검출의 다른 일례를 나타내는 도면.
도26의 a∼d는 종래예와 본 발명의 요철도의 검출의 또 다른 일례를 나타내는 도면.
본 발명은 표 화상 처리 장치 및 그 처리 프로그램을 저장하는 기억 매체에 관한 것이며, 특히, 둥근 모서리 부분을 갖는 표 화상을 정확히 처리하여, 괘선 후보가 괘선인가 아닌가를 정확히 판정할 수 있는 표 화상 처리 장치 및 그 처리 프로그램을 저장하는 기억 매체에 관한 것이다.
컴퓨터의 입력 장치로서 문자 인식 장치 또는 광학 문자 인식(OCR) 장치가 많이 사용되고 있다. 문자 인식 장치는 시트(sheet)와 같이 문자를 기입할 위치를 지정한 문서의 지정된 영역에 내에 문자가 깨끗하게 쓰여 있는 경우, 꽤 높은 인식률로 문자를 인식할 수 있다. 또, 여기서 말하는 문서는 테두리 등의 괘선의 색 및 농도가 드롭 아웃 컬러(drop out colour)가 아니고, 흑색 등의 문자와 동일의 색 및 농도인 것이다.
그러나, 쓰여진 문자가 조금이라도 지정한 영역을 넘으면, 현저히 인식률이 저하한다. 예컨대, 문자가 괘선으로된 표의 지정 영역을 나타내는 테두리(또는 괘선)에 접촉하거나 또는 괘선에 의한 표의 해당 영역으로부터 밀려 나온 경우이다.
그래서, 위치라든지 형식 등을 모르는 시트일지라도, 표 형식의 테두리를 정확히 추출할 수 있고, 문자와 테두리가 접촉하거나 문자가 테두리로부터 삐져나오는 경우라도 문자 영역을 정확히 추출할 수 있는 기술이 개발되어 있다.
여러 가지 종류의 시트 중에서, 직교하는 2개의 직선으로 이루어지는 직각 모서리 부분이 아닌, 원호와 같은 둥근 곡선으로 이루어지는 둥근 모서리(이하, 둥근 모서리 또는 둥근 모서리부라 함)를 갖는 표 형식의 시트가 존재한다. 둥근 모서리 표 형식의 일례를 도19의 a 및 b에 나타낸다. 이 형식의 시트가 현재 널리 사용되고 있다. 이 때문에, 문자 인식 장치 등의 표 화상 처리 장치에서는 둥근 모서리 부분을 인식할 수 없으면, 시트의 처리에 지장이 생긴다. 따라서, 표 형식의 둥근 모서리 부분을 갖는 시트를 정확하게 처리하기 위한 여러 가지의 제안이 있다.
예컨대, 세로의 괘선 및 가로의 괘선 또는 세로 및 가로 괘선을 추출한 뒤, 세로 및 가로 괘선이 서로 교차하지 않고 어느 일정 이하의 간격에 위치하고 있는 경우에, 해당 부분을 둥근 모서리 부분인 것으로 인식하는 기술이 제안되어 있다(예컨대, 특개평7-282191호 공보 참조). 그러나, 이 기술에 의하면 첫째로, 화상이 불명료한 경우에 둥근 모서리 부분을 정확히 인식할 수 없는 가능성이 높다. 특히, 해당 모서리의 부분이 긁혀버린 경우에는 정확하게 처리할 수 없다. 둘째로, 이 기술을 적용하는 전제로서 세로 방향 및 가로 방향의 괘선을 쌍방 공히 추출할 수 있어야 된다. 따라서, 이 기술은 도19의 a에 나타낸 형식의 시트에는 적용할 수 있지만, 도19의 b에 나타낸 세로 방향의 괘선이 처음부터 존재하지 않는 형식의 시트에는 적용할 수 없다.
또한, 세로 괘선 및 가로 괘선을 추출한 뒤, 세로 및 가로 괘선이 서로 교차하지 않고 어느 일정 이하 간격에 위치하고 있는 경우에, 해당 부분과 사전에 준비한 패턴과의 정합(matching) 패턴을 구함으로써 모서리(둥근 모서리)의 형상을 판단하는 기술이 제안되어 있다(예컨대, 일특개평7-14000호 공보 참조). 그러나, 이 기술에 의하면 첫째로, 사전에 다수의 정합 패턴을 준비할 필요가 있어, 메모리 용량이 지극히 커진다. 둘째로, 이 기술도 전제로서 세로 방향 및 가로 방향의 괘선을 쌍방 공히 추출할 수 있어야 되므로, 도19의 a에 나타낸 시트에는 적용할 수 있지만, 세로 괘선이 본래 존재하지 않는 도19의 b에 나타낸 시트에는 적용할 수 없다.
또, 세로 및 가로 괘선을 추출한 뒤, 사방이 괘선으로 둘러싸인 영역 또는 셀을 검출하고, 해당 영역의 안쪽의 윤곽을 검출하고, 검출 방향의 변화에 의해서 모서리 부분이 둥근 모서리 부분인이 아닌가를 판단하는 기술이 제안되어 있다(예컨대, 일특개평8-212292호 공보 참조). 그러나, 이 기술에 의하면 첫째로, 괘선에 문자가 접촉하고 있는 경우에, 해당 문자의 접촉 부분에서 검출 방향이 변화하여 둥근 모서리 부분인 것으로 오인되기 때문에, 정확히 처리할 수 없다. 특히, 문자와 괘선이 접촉하는 경우가 많기 때문에, 상기 접속이 야기하는 이 오인의 문제점을 무시할 수 없다. 둘째로, 화상이 불명료한 경우에, 해당 불명료한(불명료) 부분에서 검출 방향이 변화하여 둥근 모서리 부분인 것으로 오인되기 때문에, 정확히 처리할 수 없다. 즉, 원래 직선인 괘선이 명확하지 않을 경우, 해당 불명료 부분에서 180。 검출 방향이 변화하기 때문에, 둥근 모서리 부분인 것으로 오인된다. 또한, 이 기술에 의하면 점선으로 이루어지는 괘선은 추출할 수 없다.
이상과 같이, 종래의 문자 인식 장치 등의 표 화상 처리 장치에서는 둥근 모서리 부분의 인식 처리의 중요성이 충분히 인식되어 있으면서도, 불명료한 괘선, 문자의 둥근 부분의 존재, 괘선과 문자의 접촉 등에 의해 둥근 모서리 부분을 정확히 처리할 수 없었다.
한편, 또 다른 기술로는, 여러 가지의 괘선 추출 처리의 결과로서 얻어진 괘선의 후보들로부터, 더욱 괘선일 가능성이 낮은 것을 검출하여, 해당 괘선 후보로부터 제외하는 기술이 있다. 즉, 문자와 테두리가 접촉하거나 문자가 삐져나오는 경우라도, 괘선을 정확히 추출하기 위한 여러 가지 기술이 제안되어 있다.
예컨대, 상기 추출된 괘선 후보의 화상 패턴에 대해서 검출 처리를 실행함으로써 화상 패턴의 요철도(roughness)(어느 영역 내의 화상 패턴의 요철의 정도)를 산출하여, 해당 요철도가 어느 일정한 값(임계치) 이상이면 괘선 이외의 패턴(즉, 문자)인 것으로 하고, 일정한 값 이하이면 괘선인 것으로 하는 요철도에 의한 괘선 판정 기술이 제안되어 있다(예컨대, 일특개평10-334185호 공보 참조). 이 기술은 문자의 화상 패턴의 요철도가 크고, 괘선의 화상 패턴의 요철도가 작다는 것에 근거하는 것이다. 그러나, 이 기술에 의하면 사전에 정해진 값에 설정된 임계치에 의거하여 상기 판정을 행하고 있기 때문에, 괘선 또는 그 이외의 패턴인지의 판정이 불가능한 경우가 있다.
도24의 a ~ d는 시트에 일본 문자를 사용하여 기입한 문자의 예를 나타낸다. 이 예는 종래의 기술과 본 발명에 의해 인식된 괘선의 요철도의 판정을 설명하기 위한 것이다.
도24의 a는 괘선 후보로서 추출된 문자 선분 A의 일부를 나타내고, 복수 문자의 가로 선 부분이 지극히 근접하여 쓰여진 화상 패턴의 일부가 1개의 괘선 후보의 영역(도면 중의 테두리로 구획된 사각형 영역)(131)으로 판정된 것을 나타낸다. 문자 선분 A는 1개의 괘선 후보의 영역(131) 내에서, 우연히, 화소의 밀도가 직선에 가까운 정도로 커서, 직선에 가까운 형상으로 되어있다. 이 때문에, 괘선으로서 추출된다. 문자 선분 A의 요철도는 원래 높음에도 불구하고, 꽤 낮게 되어 있다. 도24의 b는 괘선 후보로서 추출된 직선 B의 일부를 나타내고, 1개의 괘선 후보의 영역(도면 중의 테두리로 구획된 사각형 영역)(132) 내에서 화소 수준에서 보면 상당 정도 상하로 위치가 변동하고 있는 화상 패턴을 나타낸다. 직선 B는 원래 직선이기 때문에, 흐트러짐이 있지만, 괘선 후보로서 추출된다. 직선 B의 요철도는 원래 낮음에도 불구하고, 본 예에서는 꽤 높게 되어있다. 이 때문에, 도24의 a 및 b에 나타낸 쌍방의 요철도는 같은 정도의 값이 되어버린다. 상술의 기술에서는 정확히 괘선을 추출한다고 하는 관점에서, 임계치가 설정되어 있다. 상기 판정의 결과, 직선 B와 같은 정도의 꽤 낮은 요철도를 갖는 문자 선분 A도 괘선 후보로서 판정된다. 즉, 문자 선분 A와 같은 경우에 대해서는 괘선 또는 그 이외의 패턴인지의 판정이 불가능하다.
도25의 a ~ d는 시트에 일본 문자를 사용하여 기입한 문자의 예를 나타낸다. 이 예는 종래의 기술과 본 발명에 의해 인식된 괘선의 요철도의 판정을 설명하기 위한 것이다.
특히, 도25의 a~d는 문자가 괘선이라고 인식되는 예를 나타내고, 도26의 a~d는 괘선이 문자라고 인식되는 예를 나타낸다. 도25의 c의 원화상(입력 화상)으로서, 괘선 간에 문자(152)가 존재하고, 또한 해당 문자가 찌그러져 있는 경우가 있다. 이 화상이 스캐너에 의해 독해되면, 도25의 b에 나타낸 것 같은 화상 데이터로 되고, 문자의 부분(151)이 불명료한 정도로 찌그러진다. 이 경우, 문자 부분(151)이 찌그러지지 않은 경우, 문자의 요철도는 원래 높지만, 찌그러짐 때문에 꽤 낮다. 이 때문에, 상술의 일특허 공보에 나타낸 종래의 기술에서는 판정을 위한 임계치가 비교적 높게 설정되어 있으므로, 문자의 부분이 괘선 후보로서 판정된다.
도26의 a~d는 시트에 일본 문자를 사용하여 기입한 문자의 예를 나타낸다. 이 예는 종래의 기술과 본 발명에 의해 인식된 괘선의 요철도의 판정을 설명하기 위한 것이다.
반대로, 도26c의 원화상에서, 괘선의 중간 부분(144 및 145)이 불명료한 경우가 있다. 이 화상이 스캐너에 의해 독해되면, 도26b에 나타낸 화상 데이터로 되고, 불명료한 부분이 화소수준에서 보면 직선이 아닌 것으로 보인다. 상기 부분(144 및 145)이 불명료한 부분이 아니라면, 이 경우, 불명료한 부분의 요철도는 원래 낮지만, 불명료함 때문에 꽤 높게 된다. 이 때문에, 상술의 기술에 의하면, 불명료한 부분이 원래 보다도 가는 괘선 후보로서 판정되거나 또는 더욱 요철도가 큰 문자로서 판정되어 괘선 후보로부터 제외되어 버린다. 이 경우도, 괘선인지 또는 그 이외의 패턴인지의 판정이 불가능하다.
이상과 같이, 종래의 문자 인식 장치 등의 표 화상 처리 장치에서는 둥근 모서리의 검출 처리의 중요성은 충분히 인식되어 있으면서도, 문자의 직선 부분의 연속, 직선(괘선)의 흐트러짐, 문자의 찌그러짐, 괘선의 불명료함 등에 의해, 괘선 후보를 정확히 판정 처리할 수 없었다.
본 발명은 둥근 모서리 부분을 갖는 표 화상을 정확히 처리할 수 있는 표 화상 처리 장치, 처리 프로그램을 저장하는 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 표 화상을 정확히 처리하여, 괘선 후보를 정확히 판정할 수 있는 표 화상 처리 장치, 처리 프로그램을 저장하는 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 불명료한 화상이 존재하여도 둥근 모서리 부분을 정확히 처리하여, 세로 괘선 또는 가로 괘선 중 하나만 추출된 상태에서 정확하게 처리할 수 있는 표 화상 처리 장치, 처리 프로그램을 저장하는 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 정합 패턴을 자동으로 생성함으로써, 수 많은 정합 패턴을 확보할 필요가 없어서 대형 기억 매체가 필요 없는 표 화상 처리 장치, 처리 프로그램을 저장하는 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 괘선과 문자의 접촉부 또는 화상 패턴의 불명료한 부분을 정확하게 인식하지 못했을 때 둥근 모서리 부분을 정확히 처리할 수 있는 표 화상 처리 장치, 처리 프로그램을 저장하는 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 불명료한 괘선, 문자의 둥근 부분 및 괘선과 문자의 접촉부가 존재하여도 둥근 모서리 부분을 정확히 처리하여, 괘선 형식과 셀(문자 인식용 영역)의 추출을 인식할 수 있는 표 화상 처리 장치, 처리 프로그램을 저장하는 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 괘선 후보가 아닌 영역을 정확하게 검출하여 괘선 후보로부터 정확하계 제외시키는 표 화상 처리 장치, 처리 프로그램을 저장하는 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
괘선 여부의 판정 불가능의 경우를 크게 줄이고 괘선을 정확히 추출하는 표 화상 처리 장치, 처리 프로그램을 저장하는 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
상술한 목적을 실현하기 위해 본 발명은 하기와 같은 기본 구성을 포함한다.
본 발명의 표 화상 처리 장치는 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 수단과, 상기 직선 추출 수단에 의해 검출한 직선의 종단으로부터 시작하는 경사 성분을 추출하여, 이 경사 성분에 의거하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 검출부와, 상기 둥근 모서리 후보 검출부에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 검출하는 셀 추출부와, 상기 셀 추출부에 의해 검출한 셀의 모서리에 대해서 둥근 모서리 부분을 판정하는 처리를 실행하는 둥근 모서리 부분 판정부를 구비한다.
본 발명의 표 화상 처리 장치는 둥근 모서리 후보 영역 검출 수단을 포함하며, 상기 둥근 모서리 후보 영역 검출 수단은 입력 화상 내에서 추출된 직선으로부터 각각 세로 방향의 직선의 종단으로부터 시작하는 제1 경사 성분와, 가로 방향의 직선의 종단으로부터 시작하는 제2 경사 성분을 각각 추출하며, 중첩부가 상기 둥근 모서리 후보 영역으로서 판정된다.
본 발명의 표 화상 처리 장치는 둥근 모서리 후보 영역 검출 수단을 포함하며, 상기 둥근 모서리 후보 영역 검출 수단은 입력 화상에서 추출된 직선으로부터 각각 세로 방향의 직선의 종단으로부터 시작하는 제1 경사 성분과 가로 방향의 직선의 종단으로부터 시작하는 제2 경사 성분을 각각 추출하는 추출부를 포함하고, 상기 제1 및 제2 경사 성분이 사전에 고정된 거리 이내에 있고, 직선을 나타내는 패턴이 존재하거나 또는 서로 접촉하거나 중첩되는 경우에, 상기 부분이 둥근 모서리 후보 영역으로 판정된다.
본 발명의 표 화상 처리 장치는 상기 둥근 모서리 후보 영역 검출 수단을 포함하며, 상기 둥근 모서리 후보 영역 검출 수단은 입력 화상에서 추출된 직선으로부터 각각 세로 방향의 직선의 종단으로부터 시작하는 제1 경사 성분과 가로 방향의 직선의 종단으로부터 시작하는 제2 경사 성분을 각각 추출하는 추출부를 포함하며, 어느 경사 성분도 상기 식별된 경사 성분 부근에 존재하지 않고 또한 직선의 특징을 나타내는 패턴이 식별된 경사선의 종단에 존재할 경우에, 상기 부분이 둥근 모서리 후보 영역으로 판정된다.
상기 표 화상 처리 장치는 둥근 모서리 부분 결정 수단을 구비하며, 상기 둥근 모서리 부분 결정 수단은 입력 화상에서 추출된 세로 방향의 직선과 가로 방향의 직선으로부터 추출된 셀에 대하여, 상기 셀의 모서리에서 화소 밀도가 사전에 정해진 순서로 변화하는 경우에, 상기 부분이 둥근 모서리 부분인 것으로 판정하는 판정부를 구비한다.
상기 표 화상 처리 장치는 둥근 모서리 부분 결정 수단을 구비하며, 상기 둥근 모서리 부분 결정 수단은 입력 화상에서 추출된 세로 방향의 직선과 가로 방향의 직선으로부터 추출된 셀에 대하여, 화소 밀도 변동에 준하여 판정되는 둥근 모서리 부분이 존재할 경우에, 다른 모서리 부분도 둥근 모서리 부분인 것으로 판정하는 판정부를 구비한다.
상기 표 화상 처리 장치는 둥근 모서리 부분 결정 수단을 구비하며, 상기 둥근 모서리 부분 결정 수단은 입력 화상에서 추출된 세로 방향의 직선과 가로 방향의 직선으로부터 추출된 셀에 대하여, 상기 셀 내의 직선 간에 생성되는 n차 함수의 패턴이 둥근 모서리 후보 영역을 포함하는 모서리의 상기 입력된 화상과 정합하는 경우에, 상기 부분이 둥근 모서리 부분인 것으로 판정하는 판정부를 구비한다.
본 발명의 프로그램을 저장하는 기억 매체는 입력된 화상 내에서 세로 및 가로 방향의 직선을 추출하는 직선 추출 처리와, 상기 직선 추출 처리에 의해 추출된 직선의 종단으로부터 시작하는 경사선을 추출하여, 추출한 경사 성분에 의거하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 처리와, 상기 둥근 모서리 후보 영역을 추출하는 처리에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출 처리와, 상기 셀 추출 처리에 의해 추출한 셀의 모서리에 대한 소정의 처리를 실행함으로써 둥근 모서리 부분을 판정하는 처리를 실행하는 둥근 모서리 판정 처리를, 상기 표 화상 처리 장치인 컴퓨터에서 실행시키는 프로그램을 기억한다.
본 발명의 표 화상 처리 장치는 괘선 판정 처리 수단을 구비하며, 상기 괘선 판정 처리 수단은 입력된 화상에서 추출된 세로 및 가로 방향의 괘선 후보 내에서, 상기 검출된 괘선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용하여 구한 상기 괘선 후보의 요철도(凹凸度)에 의거하여 괘선 후보가 괘선인가 아닌가를 판정하는 처리 수단을 포함한다.
본 발명의 프로그램을 저장하는 기억 매체는 입력된 화상에서 추출된 세로 및 가로 방향의 괘선 후보 내에서, 상기 식별한 괘선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용함으로써 상기 식별된 괘선 후보의 요철도에 의거하여 괘선 후보가 괘선인가 아닌가를 검출하는 처리를, 상기 표 화상 처리 장치인 컴퓨터에서 실행시키는 프로그램을 기억한다.
본 발명의 표 화상 처리 방법은 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하고, 상기 직선 추출 처리에 의해 검출한 직선의 종단으로부터 시작하는 경사 성분을 추출하고, 추출한 경사선에 의거하여 둥근 모서리 후보 영역을 검출하고, 상기 둥근 모서리 후보 영역을 포함하는 셀을 추출하고, 상기 셀의 둥근 모서리 부분을 검출하는 처리를 실행한다.
본 발명의 표 화상 처리 방법은 입력된 화상에서 추출된 세로 및 가로 방향의 괘선 후보 내에서, 상기 식별된 괘선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용함으로써 상기 괘선 후보의 요철도에 의거하여 괘선 후보가 괘선인가 아닌가를 검출하는 처리를 포함한다.
상술한 것 이외의 목적과 장점은 이하에 동일한 참조 번호는 동일한 부분을 가리키는 참고 도면을 참조하여 설명되는 구성과 작용에 대한 상세 설명으로부터 명백히 이해 될 수 있을 것이다.
[실시예]
도1은 본 발명의 제1 실시예의 원리 구성도이고, 표 화상 처리 장치(100)의 구성을 나타낸다. 표 화상 처리 장치(100)는 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 수단(2)과, 직선 추출 수단(2)에 의해 추출한 직선의 종단으로부터 시작하는 경사 성분을 검출하여, 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 검출부(3)와, 둥근 모서리 후보 검출부(3)에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출부(4)와, 셀 추출부(4)에 의해 추출한 셀로부터 둥근 모서리 부분을 판정하는 처리를 실행하는 둥근 모서리 부분 결정 수단(5)을 구비한다.
도1에 나타낸 표 화상 처리 장치(100)에 의하면, 예컨대, 화상이 불명료한 경우라도 둥근 모서리 부분을 정확히 처리할 수 있게 되어, 세로 방향 및 가로 방향 중 어느 한쪽의 괘선을 추출할 수 있기만 하면 둥근 모서리 부분을 정확히 처리할 수 있다. 또한, 다수의 정합 패턴을 가질 필요가 없어(정합 패턴을 자동으로 생성시키기 때문임), 메모리 용량을 크게 할 필요가 없다. 더욱, 괘선과 문자의 접촉부분이라든지 화상 패턴의 불명료한 부분이 둥근 모서리 부분인 것으로 오인되는 일이 없으므로, 둥근 모서리 부분을 정확히 처리할 수 있다. 이와 같이, 표 화상 처리 장치에서는 괘선의 불명료함, 문자의 둥근 부분, 괘선과 문자의 접촉 등이 있더라도 둥근 모서리 부분을 정확히 처리할 수 있게 되고, 그 결과, 괘선 형식의 인식 및 셀(문자 인식 영역)의 추출을 안정하게 할 수 있다.
또한, 본 발명에 의하면, 표 화상 처리 장치(100)를 컴퓨터에서 실현시키는 처리 프로그램을 저장하는 기억 매체를 제공할 수 있으므로, 표 화상 처리 장치(100)를 용이하게 제공할 수 있다.
도2는 본 발명의 제2 실시예의 원리 구성도이고, 표 화상 처리 장치(100)의 구성을 나타낸다. 본 발명의 표 화상 처리 장치(100)는 괘선 판정 처리 수단(20)을 구비한다.
괘선 판정 처리 수단(20)은 세로 및 가로 방향의 괘선 후보에 대해서, 입력된 화상에서 추출된 화상 패턴으로서 해당 괘선 후보의 주위에 존재하는 화상 패턴에 대응해서 선택한 복수의 임계치(21,22,…) 중 어느 하나를 사용하여 얻은, 해당 괘선 후보의 요철도에 의거하여 입력된 화상으로부터 추출한 괘선 후보가 괘선인가 아닌가를 판정한다.
본 발명의 표 화상 처리 장치(100)에 의하면, 해당 괘선 후보의 주위에 존재하는 화상 패턴에 따라서, 복수의 임계치(21,22,…) 중 어느 하나가 괘선 판정에 사용된다. 예컨대, 복수 문자의 가로 선의 부분이 지극히 근접하여 쓰여진 화상 패턴으로 이루어지는 괘선 후보의 경우, 그 요철도는 낮지만, 그 주위에 요철도가 높은 문자의 화상 패턴이 존재한다. 따라서, 해당 요철도는 원래 높았을 것으로 추측된다. 그래서, 이 경우에는 괘선 후보 검출의 임계치로서 보다 낮은 값의 임계치(예컨대, 제1 임계치(21))를 사용한다. 이 처리에 의해, 원래 보다도 낮게 된 요철도를 갖는 괘선 후보를 괘선 후보로부터 제외할 수 있다. 반대로, 주위의 요철도가 낮은 경우에는, 보다 높은 값의 임계치(예컨대, 제2 임계치(22))를 사용함으로써 원래 보다도 높은 요철도를 갖는 괘선 후보를 괘선 후보로 남길 수 있다. 이상에 의해, 괘선일 가능성이 낮은 영역을 정확히 검출하여, 괘선 후보로부터 제외할 수 있다. 따라서, 괘선인지 또는 그 이외의 패턴인지의 판정이 불가능한 경우를 현저히 낮출 수 있어, 정확히 괘선을 추출할 수 있다.
또한, 본 발명에 의하면, 표 화상 처리 장치(100)를 컴퓨터에서 실현시키는 처리 프로그램을 저장하는 기억 매체를 제공할 수 있으므로, 표 화상 처리 장치(100)를 용이하게 제공할 수 있다.
(제1 실시예)
도3은 제1 실시예의 표 화상 처리 장치(100)의 구성도이고, 본 발명의 표 화상 처리 장치(100)의 일례의 구성을 나타내고, 도1에 나타낸 표 화상 처리 장치(100)에 대응한다. 바람직하게는, 표 화상 처리 장치(100)는 컴퓨터 메모리에 저장된 소프트웨어 프로그램이고 처리기에 의해서 실행된다.
표 화상 처리 장치(100)는 화상 입력 수단(1), 직선 추출 수단(2), 둥근 모서리 후보 영역 검출 수단(3), 셀 추출 수단(4), 둥근 모서리 부분 결정 수단(5), 문자 인식 영역 결정 수단(6)을 구비한다. 표 화상 처리 장치(100)는 주 메모리 상의 표 화상 처리 프로그램과 CPU로 이루어진다. 컴퓨터인 표 화상 처리 장치(100)는 키보드 등의 입력 장치, 마우스, 표 화상을 처리하기 위해 화상을 입력하고 방향을 입력하는 스캐너, 화상의 표시 등을 위한 출력 장치 및 화상 데이터(12) 등의 각종의 데이터를 저장하기 위한 보조 기억 장치를 구비한다.
화상 입력 수단인 화상 입력 수단(1)은 괘선에 의해 구성된 시트의 입력 화상(11)을 화상 데이터(12)로서 입력한다. 화상 입력 수단(1)은 스캐너 등으로 이루어지고, 시트 등의 종이 위에 인쇄된 세로(수직 또는 y) 방향 및 가로(수평 또는 x) 방향의 괘선 및 해당 시트에 기입된 문자로 이루어지는 입력 화상(11)을 판독하여, 전자적인 이미지 데이터인 화상 데이터(12)로서 입력한다. 입력 화상(11)은 제한되지 않지만, 예컨대 극단적인 경사가 없는 2치 화상이 바람직하고, 예컨대 도19의 a 및 b에 나타낸 시트와 같다.
직선 추출 수단(2)인 직선 추출 수단(2)은 화상 입력 수단(1)에 의해 입력된 화상 데이터(12)를 참조하여, 이들로부터 세로 및 가로 방향의 직선을 추출한다. 추출된 직선에 대한 데이터(직선 데이터)(13)는 해당 직선을 나타내는 위치 좌표로 이루어진다. 직선 데이터(13)는 보조 기억 장치에 기억된다.
둥근 모서리 후보 검출부(3)인 둥근 모서리 후보 영역 검출 수단(3)은 화상 데이터(12) 및 직선 데이터(13)를 참조하여, 직선 추출 수단(직선 추출 수단)(2)에 의해 추출한 직선의 종단으로부터 시작하는 경사 성분을 추출하여, 추출한 경사 성분을 사용하여 소정의 처리를 실행함으로써 둥근 모서리 후보 영역을 검출한다. 둥근 모서리 후보 영역 검출 수단(3)은 검출한 둥근 모서리 후보 영역을 둥근 모서리 후보 데이터(14)로서 저장한다. 둥근 모서리 후보 데이터(14)는 예컨대 해당 경사 성분이 둥근 모서리 후보인가 아닌가를 나타내는 데이터와, 해당 경사 성분의 위치 좌표로 이루어진다.
둥근 모서리 후보 영역 검출 수단(3)은 상기 경사 성분의 추출 중에, 입력된 화상 데이터(12)로부터 직선 추출 수단(2)에 의해 추출된 세로 및 가로 방향의 직선 내에서, 세로 방향의 직선의 종단으로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 종단으로부터 시작하는 제2 경사 성분을 각각 추출한다. 그리고, 둥근 모서리 후보 영역 검출 수단(3)은 둥근 모서리 후보 영역을 검출하기 위한 상기 소정의 처리를, 이하의 제1 내지 제3 처리중 어느 하나에 의해 실행한다. 즉, 제1 처리로서, 해당 제1 및 제2 경사 성분이 서로 중첩하는 경우에, 해당 부분이 둥근 모서리 후보 영역인 것으로 판정한다. 제2 처리로서, 해당 제1 및 제2 경사 성분이 서로 사전에 정해진 거리 내에 있고, 또한 양자 간에 직선의 특징을 나타내는 패턴이 있거나, 양자가 서로 접촉 또는 중첩하고 있는 경우에, 해당 부분이 둥근 모서리 후보 영역인 것으로 판정한다. 제3 처리로서, 해당 경사 성분의 근처에 어떤 다른 경사 성분이 존재하지 않고, 또한 해당 경사 성분의 종단에 직선의 특징을 나타내는 패턴이 있는 경우에, 해당 부분이 둥근 모서리 후보 영역인 것으로 판정한다.
셀 추출부(4)인 셀 추출 수단(4)은 둥근 모서리 후보 영역 검출 수단(3)에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀(및 상이한 셀)을 추출한다. 추출한 셀의 데이터(셀 데이터(15))는 해당 셀의 위치를 나타내는 위치 좌표로 이루어진다. 셀 데이터(15)는 보조 기억 장치에 저장된다.
둥근 모서리 부분 결정 수단(5)인 둥근 모서리 부분 결정 수단(5)은 화상 데이터(12), 둥근 모서리 후보 데이터(14) 및 셀 데이터(15)를 참조하여, 셀 추출 수단(4)에 의해 추출한 둥근 모서리 후보 영역을 포함하는 셀(또는 정점)에 대해서 소정의 처리를 실행한다. 이 데이터에 의해, 둥근 모서리 부분 결정 수단(5)은 둥근 모서리 부분을 판정하여, 판정한 둥근 모서리 부분을 둥근 모서리 부분 데이터(16)로서 보조 기억 장치에 기억한다. 또, 실제의 셀 데이터(15)는 둥근 모서리 후보 데이터(14)를 포함하기 때문에, 둥근 모서리 후보 데이터(14)는 참조되지 않고, 셀 데이터(15)가 참조된다.
둥근 모서리 부분 결정 수단(5)은 입력된 화상 데이터(12)로부터 추출된 세로 및 가로 방향의 직선에 따라서 셀 추출 수단(4)에 의해 추출한 셀의 모서리에 대해서 소정의 처리를 실행함으로써 둥근 모서리 부분을 판정한다. 둥근 모서리 부분 결정 수단(5)은 상기 소정의 처리를, 이하의 제1 내지 제3 처리 중 어느 하나에 의해 실행한다. 즉, 제1 처리로서, 셀 추출 수단(4)에 의해 추출한 모서리 부분에서 화소 밀도가 사전에 정해진 순서로 변화하는 경우에, 해당 부분이 둥근 모서리 부분인 것으로 판정한다. 제2 처리로서, 화소 밀도의 변화에 의거하여 판정된 둥근 모서리 부분이 존재하는 경우에, 상기 입력된 화상의 다른 모서리도 둥근 모서리 부분인 것으로 판정한다. 제3 처리로서, 상기 직선 추출 수단에 의해 추출한 직선의 종단과 종단 간에 생성된 n차 함수의 패턴과 상기 입력된 화상이 정합하는 경우에, 해당 부분이 둥근 모서리 부분인 것으로 판정한다.
문자 인식 영역 판정부인 문자 인식 영역 결정 (6)은(6)은 화상 데이터(12), 셀 데이터(15) 및 둥근 모서리 부분 데이터(16)를 참조하여, 소정의 처리를 실행함으로써 입력된 화상 데이터(12)의 문자 인식 영역을 판정한다. 즉, 둥근 모서리 부분 결정 (6)은에 의해 판정된 둥근 모서리 부분을 포함하는 셀의 문자 인식 영역에서, 해당 둥근 모서리 부분을 문자 영역에서 제외함으써, 해당 문자 인식 영역을 판정한다. 판정한 문자 인식 영역의 데이터(문자 인식 영역 데이터(17))는 보조 기억 장치에 저장된다. 또, 실제의 둥근 모서리 부분 데이터(16)는 셀 데이터(15)를 포함하도록 되기 때문에, 셀 데이터(15)는 참조되지 않고, 둥근 모서리 부분 데이터(16)가 참조된다.
직선 추출 (6)은(2), 둥근 모서리 후보 영역 검출 (6)은(3), 셀 추출 (6)은(4), 둥근 모서리 부분 결정 수단(5), 및, 문자 인식 영역 결정 수단(6)은 주 메모리 상에 존재하고 CPU 상에서 실행되는 각종 처리에 의해서 실행된다. 직선 추출 수단(2)의 실행 처리, 셀 추출 수단(4)의 실행 처리 및 문자 인식 영역 검출 수단(6)의 실행 처리는 주지의 처리이다. 둥근 모서리 후보 영역 검출 수단(3)의 실행 처리 및 둥근 모서리 부분 결정 수단(5)의 실행 처리는 본 발명에 특유 처리이다.
도4는 표 화상 처리 장치(100)에 의해 실행되는 표 화상 처리의 플로우를 나타낸다.
화상 입력 수단(1)이 입력 화상(11)을 화상 데이터(12)로서 입력하는 화상 입력 처리를 실행한다(스텝 S1). 즉, 스캐너의 입력 화상(11)을 판독하여, 화상 데이터(12)를 얻는다.
직선 추출 수단(2)이 세로 및 가로 방향의 직선을 추출하는 직선 추출 처리를 실행한다(스텝 S2). 즉, 직선 데이터(13)를 얻는다. 이 처리에 대해서는 도5 내지 도7을 참조하여 후술한다.
둥근 모서리 후보 영역 검출 수단(3)이, 추출된 직선의 종단으로부터 시작하는 경사 성분을 추출하여, 추출한 경사 성분을 사용하여 소정의 처리를 실행함으로써 둥근 모서리 후보 영역 추출 처리를 실행한다(스텝 S3). 둥근 모서리 후보를 얻는 이 처리에 대해서는 도8 내지 도12를 참조하여 후술한다.
셀 추출 수단(4)이, 추출된 둥근 모서리 후보 영역을 포함하는 셀(및 상이한 셀)을 추출하는 셀 추출 처리를 실행한다(스텝 S4). 즉, 셀 데이터(15)를 얻는다. 이 처리에 대해서는 도13을 참조하고 후술한다.
둥근 모서리 부분 결정 수단(5)은 화상 데이터(12), 둥근 모서리 후보 데이터(14) 및 셀 데이터(15)를 참조하여, 추출된 둥근 모서리 후보 영역을 포함하는 셀의 모서리에 대해서 소정의 처리를 실행함으로써 둥근 모서리 판정 처리를 실행한다(스텝 S5). 즉, 둥근 모서리 데이터(16)를 얻는다. 이 처리에 대해서는 도14 내지 도17을 참조하여 후술한다.
문자 인식 영역 결정 수단(6)은 화상 데이터(12), 셀 데이터(15) 및 둥근 모서리 데이터(16)를 참조하여, 소정의 처리를 실행함으로써 문자 인식 영역을 판정하는 문자 인식 영역 판정 처리를 실행한다(스텝 S6). 즉, 문자 인식 영역 데이터(17)를 얻는다. 이 처리에 대해서는 도18을 참조하여 후술한다.
도5는 추출 처리를 실행하는 플로우를 나타낸다. 도5에 나타낸 처리는 도4의 스텝 S2에 상당하고, 주지의 기술이다. 화상 데이터(12)로부터 세로 및 가로 방향의 괘선(세로 및 가로 괘선)을 추출한다. 이 직선 추출 처리는 주지의 처리 중 어느 하나의 처리에 의해서 실행될 수 있지만, 이하에 그 바람직한 처리의 일례를 나타낸다.
처음에, 연결 패턴을 추출한다(스텝 S21). 연결 패턴은 주지의 연결 패턴 추출 처리에 의해 추출한다. 주지의 연결 패턴 추출 처리로서는 예컨대, 본원 출원인이 제안한 특원평7-282171호에 기재된 기술이 사용된다. 이 기술에 의하면, 8 연결 패턴을 라벨링(labeling)에 의해 추출한다. 이 처리에 의해, 복수의 테두리가 배치되는 위치가 상대적인 관계에 의존하지 않고, 세로 및 가로 괘선의 각 패턴을 안정하게 추출할 수 있다.
이제, 연결 패턴 추출 처리에 대해서 간단히 설명한다. 처음에, 입력된 화상 데이터(12)에서 입력 패턴을 구성하는 패턴(부분 패턴)의 각각에 대해서, 상하 세로 2방향, 가로 좌우 2방향 및 4경사 방향의 합계 8방향에서, 상이한 부분 패턴과의 연결 관계를 조사한다. 다음, 어느 하나의 방향에서 연결하고 있는 패턴(연결 패턴)에 대하여 동일한 라벨을 첨부한다. 연결 패턴은 문자가 접촉하고 있지 않은 테두리 즉, 괘선(또는 괘선의 일부), 문자가 접촉하고 있는 괘선(또는 괘선의 일부), 괘선에 접촉하고 있지 않은 문자(또는 문자의 일부)중 어느 하나 이다.
다음에, 라벨이 첨부된 부분 패턴을 조사하고, 소정의 크기보다 큰 연결 패턴의 그룹을 해당 시트를 구성하는 괘선의 후보로서 추출한다. 즉, 추출된 부분 패턴의 안쪽, 일정 이상의 크기를 갖는 부분 패턴(제1 부분 패턴)을 시트의 괘선의 후보로 판정한다. 예컨대, 본래의 괘선 내에서, 긁히지 않고 정확하게 추출된 괘선이 제1 부분 패턴으로 판정되는, 한편, 본래의 문자 내에서, 괘선에 접촉하지 않고 정확하게 기입된 문자는 괘선의 후보로부터 제외된다.
다음에, 제1 부분 패턴에 대하여 소정의 위치에 존재하고, 또한 소정의 크기보다 큰 부분 패턴(제2 부분 패턴)에 첨부된 라벨을 해당 제1 부분 패턴과 동일한 라벨로 변경함으로써 해당 제2 부분 패턴을 시트의 괘선의 후보에 추가한다. 예컨대, 본래의 괘선, 즉 불명료한 제1 부분 패턴으로부터 고립한 괘선이 제2 부분 패턴으로서 판정된다. 이 결과, 불명료한 괘선도 제1 부분 패턴 즉, 괘선의 후보로 판정되어, 정확한 결과가 얻어진다. 따라서, 본 발명에 의하면, 이러한 연결 패턴 추출 처리를 사용함으로써, 식별된 괘선의 일부인 괘선으로부터 분리된 패턴이 괘선이 아닌 별도의 패턴으로서 처리되는 것을 방지할 수 있다.
이 처리 후, 추출한 연결 패턴의 화상에 대해서, 각 연결 패턴(부분 패턴)마다, 세로 및 가로 방향 성분의 세분화가 주지의 마스크 처리에 의해 실행된다. 주지의 마스크 처리로서는 예컨대, 본원 출원인이 제안한 특개평7-28937호 공보에 기재된 기술이 사용될 수 있다. 이 기술에 의하면, 추출된 연결 패턴으로부터 극단적인 경사 성분을 갖는 패턴을 제거한다. 이 처리에 의해, 테두리 즉, 괘선의 일부로서만 존재하는 긴 직선을 추출하기 쉽게 할 수 있다.
이제, 마스크 처리에 대해서 간단히 설명한다. 처음에, 라벨링에 의해 얻은 부분 패턴(연결 패턴)마다, 소정의 크기(길이 및 폭)를 갖는 가로 길이 및 세로 길이의 2종류의 마스크를 사용하여 주사를 실행한다. 다음에, 각 마스크마다, 해당 마스크의 면적에 대한 마스크 내의 패턴이 차지하는 면적의 비율을 산출하여, 해당 비율이 임계치보다도 크면 그 마스크 내부 영역을 모두 패턴으로 간주한다(화상의 가로 성분 또는 세로 성분으로 간주한다). 즉, 해당 부분을 해당 마스크의 크기로 세분화된 사각형 영역이라고 간주한다. 해당 비율이 임계치 이하이면 그 마스크 내의 패턴을 삭제한다(화상의 가로 성분 또는 세로 성분이 존재하지 않는 것으로 간주한다). 이 처리에 의해, 화상 패턴의 세로 및 가로 성분을 사용한 마스크 폭의 정도로까지 세분화하여 추출할 수 있다.
다음에, 복수의 행(가로 방향) 또는 열(세로 방향)이 연속하여 상기 비율이 임계치보다도 큰 경우, 그들 영역을 통합하여 1개의 사각형의 영역으로 간주되고, 사각 영역(도 6의 a)의 중앙선이 처리 결과로서 간주된다. 그러므로 이러한 마스크 처리를 사용함으로써, 테두리의 폭 즉, 괘선의 폭을 일 직선으로 동일하게 하여, 괘선 만에 존재하는 긴 직선을 추출하기 쉽게 할 수 있다.
이 처리 후, 마스크 처리한 화상에 대해서 선분 추출 처리가 실행된다(스텝 S23). 선분 추출은 주지의 선분 추출 처리에 의해 행하여진다. 주지의 선분 추출 처리로서는 예컨대, 본원 출원인이 제안한 특개평6-309498호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 마스크 처리한 화상에 대하여 인접 투영치를 산출하거나, 직선 또는 직선의 일부(선분)를 검출한다. 이제, 인접 투영 처리란, 확인된 행 또는 열의 투영치에 그 주위의 행 또는 열의 투영치를 합쳐서, 이 값을 투영치로 획정하는 처리를 말한다. 선분 추출 처리의 결과를 도6의 b에 나타낸다. 이 처리에 의해, 식별된 직선의 주위를 대국적으로 파악하여 선분을 정확히 추출할 수 있다.
이제, 해당 선분 추출 처리에 대해서 간단히 설명한다. 처음에, 마스크 처리의 결과로 얻은 (해당 마스크 내를 모두 패턴으로 간주) 사각형 영역의 패턴의 각각에 대해서, 그 가로 방향의 투영과 세로 방향의 투영을 하여 투영치를 구한다. 그 다음, 구한 투영치를 소정 영역내의 식별된 패턴 주위(행 또는 열)의 패턴의 투영치를 가산한다. 즉, 특개평6-309498호 공보에 기재된 식(예컨대(11)식)에 따라서, 해당 패턴의 행 및 열 방향의 인접 투영치를 산출한다.
다음에, 행 방향의 산출한 인접 투영치와 사각형 영역(마스크)의 가로 방향의 분할 길이의 비 및 열 방향의 산출한 인접 투영치와 사각형 영역(마스크)의 세로 방향의 분할 길이의 비를 산출한다. 다음에 이들의 비가 임계치보다 큰 부분을 괘선의 후보로 간주하고, 해당 비가 임계치보다도 작은 부분을 선분이 존재하지 않는 영역으로 간주한다. 그리고, 복수의 부분이 연속하여 임계치 이상이 되는 경우, 즉, 괘선의 후보인 부분이 연속하는 경우, 이들을 통합하여 1개의 사각형 영역에서 근사화하고, 이 근사화된 사각형 영역에 직선이 존재할 때 사각형으로 간주한다. 즉, 도6b에 나타낸 바와 같이, 사각형 영역에 의해 근사화된 선분이 추출된다.
이러한 선분 추출 처리를 사용함으로써, 직선이 경사져 있으므로 복수 행 또는 열에 걸쳐 있더라도, 선분을 추출할 수 있다. 그 결과, 괘선인 큰 테두리가 기울어 있더라도, 그 선분을 정확히 추출할 수 있다. 또한, 인접 투영을 사용함으로써, 통상의 투영과 같이 마스크의 분할 길이를 짧게 하여 분할 수를 크게 함으로써 경사선을 추출할 필요가 없기 때문에, 문자를 구성하는 짧은 선분을 추출하지 않고, 긴 선분을 추출할 수 있다.
이 처리 후, 선분 추출 처리의 결과에 의거하여, 직선 추출 처리가 실행된다(스텝 S24). 직선 추출은 주지의 직선 추출 처리에 의해 실행된다. 주지의 직선 추출 처리로서는 예컨대, 본원 출원인이 제안한 특개평6-309498호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 선분 추출 처리에 의해 추출되어 사각형 근사화된 선분 내에서 인접한 선분 끼리를 통합하여 긴 직선을 검출하고, 검출한 직선에 대하여 더욱 사각형 근사화 처리를 행한다. 직선 추출 처리의 결과를 도7의 a에 나타낸다. 이 처리에 의해, 직선을 확실하게 추출할 수 있다.
이제, 해당 직선 추출 처리에 대해서 간단히 설명한다. 처음에, 선분 추출 처리에서 추출되어 사각형 근사화된 선분(도7의 a에 나타냄)이 그 상하(예컨대, 인접 투영치의 산출 처리에서 가산 치의 범위 내)에 존재하는 상이한 선분과 접촉하고 있는가를 조사한다. 다음에, 접촉하는 상이한 선분이 존재하는 경우, 식별된 해당 선분과 그 상하에 존재하는 상이한 선분을 통합하여, 도7b에 나타낸 1개의 사각형 영역으로 한다. 이러한 직선 추출 처리를 사용함으로써 시트의 괘선 등의 긴 직선을 추출할 수 있다.
또, 특개평6-309498호 공보에서는 인접 투영치와 사각형(마스크)의 분할 길이의 비의 산출 처리 이후를, 선분 추출 처리에서는 없고, 직선 추출 처리에서 행하고 있다. 한편, 본원에서도 선분 추출 처리(스텝 S23)와 직선 추출 처리(스텝 S24)는 연속하여 행하여지기 때문에, 본 발명에서 실제로는 특개평6-309498호 공보의 처리와 하등 상위하지 않은 처리가 행하여진다.
이 처리 후, 선분 추출 처리의 결과에 의거하여, 화상 데이터(12)로부터의 점선 추출 처리가 실행된다(스텝 S25). 점선 추출 처리는 주지의 점선 추출 처리에 의해 행하여진다. 주지의 점선 추출 처리로서는 예컨대, 본원 출원인이 제안한 특개평9-505527호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 동일의 크기의 부분 패턴이 규칙적으로 나란히 놓여있는 패턴을 점선으로서 추출하고, 그 패턴을 직선과 같이 사각형 근사화한다. 또, 추출된 직선(실선) 및 점선은 서로 구별 없이, 괘선으로서 동일의 처리에 의해 실행된다. 이 처리에 의해, 점선으로 이루어지는 괘선을 포함하는 시트를 이후의 처리에서 정확히 처리할 수 있다.
이제, 해당 점선 추출 처리에 대해서 간단히 설명한다. 처음에, 연결 패턴 추출 처리(스텝 S21)에서 추출하여 라벨을 첨부한 패턴 외측의 사각형의 직선을 세로 또는 가로 방향으로 가로지르는 제1 사각형으로서 추출한다. 다음에, 그 사각형 내부에 존재하는 패턴(내부 패턴)을 사전에 정해진 점선으로 구성하는 소정의 크기의 패턴과 비교하여, 소정 패턴에 일치하는 부분 패턴을 찾는다.
다음에, 소정 패턴과 일치하는 내부 패턴이 발견되면 더욱, 제1 패턴을 수직으로 가로지르는 제2 패턴으로서 추출한다. 그리고, 소정 패턴과 일치하는 제2 패 턴의 내부 패턴을 추출한다.
다음에, 추출한 부분 패턴이 어느 일정한 간격으로 어느 일정 수 이상 연속하여 나란히 놓여 있는 경우, 그 패턴을 점선으로 판단하고, 이 점선을 둘러싸는 사각형 영역을 점선이 존재 영역로서 생각하고, 또한 해당 패턴을 둘러싸는 사각형을 점선을 포함하는 사각형에 의해 근사화한다.
이러한 점선 추출 처리를 반복 실행함으로써, 시트 내에 존재하는 점선을 정확히 추출하여 점선을 포함하는 사각형을 사각형 근사화에 의해 근사화할 수 있다. 그러므로 상술한 바와 같이, 이후에는 실선 및 점선을 같은 것으로 처리할 수 있다.
이상의 처리의 결과, 화상 데이터(12)로부터 도7에 나타낸 바와 같이 사각형에 의해 근사화된 직선 및 점선이 추출된다. 이것이 직선 데이터(13)이다.
도8은 둥근 모서리 후보 영역 검출 수단에 의해 실행되는 둥근 모서리 후보 영역 검출 처리의 플로우를 나타낸다. 도8에 나타낸 처리는 도4의 스텝 S3에 상당하고, 본 발명의 특징적인 처리이다. 둥근 모서리 후보 영역 검출 처리는 전 처리로서의 경사 성분 추출 처리와, 실제의 둥근 모서리 후보 영역을 판정하는 처리인 후보 검출 처리로 이루어진다.
최초로, 경사 성분 추출 처리가 실행된다(스텝 S31). 경사 성분(경사선)의 추출 처리는 직선 추출 수단(2)의 처리에서 추출된 세로 및 가로의 직선의 종단을 기점으로서 행하여진다. 경사 성분 추출 처리에는 경사 방향의 화소 검출 처리 또는 경사 방향의 투영 처리 등의 처리가 사용된다.
경사 성분의 화소 검출은 주지의 경사 방향의 화소 검출 처리에 의해 행하여진다. 주지의 경사 방향의 화소 검출 처리로서는 예컨대, 본원 출원인이 제안한 특개평7-192094호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 추출된 직선의 종단에서 화소의 존재(패턴의 윤곽)를 검출함으로써 경사선을 추출한다. 이 처리에 의해, 경사선에 다소의 불명료함이 있더라도 경사 성분을 추출할 수 있다.
이제, 해당 경사 방향의 화소 검출 처리에 대해서 간단히 설명한다. 처음에, 직선 추출 수단(2)에서 추출된 세로 및 가로의 직선의 종단을 기점(개시점)으로서 정한다. 다음에, 식별된 직선을 제외하는 추출된 직선의 종단점에서 시작되는 패턴의 윤곽을 검출한다. 즉, 해당 직선의 하변 또는 상변 또는 좌변 또는 우변에서, 화상 구성하는 화소의 선을 따라서 추적한다. 다음에, 해당 직선 또는 해당 직선 이외의 상이한 세로 또는 가로의 직선 중 하나에 도달하면 검출을 종료하고, 해당 검출의 결과를 경사 성분으로 판정한다.
또한, 경사 방향의 투영은 주지의 경사 방향의 인접 투영 처리에 의해 행하여진다. 주지의 경사 방향의 인접 투영 처리로서도, 예컨대, 본원 출원인이 제안한 특개평7-192094호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 화상 데이터(12)의 화상 패턴에 대하여 인접 투영치를 산출하여, 사각형 근사화에 의해 경사선 또는 선의 일부(선분)를 검출한다. 이 기술에서, 인접 투영이란, 주목하는 경사선의 투영치에, 그 주위 영역의 투영치를 합쳐서, 이 값을 투영치로 하는 처리를 말한다. 이 처리에 의해, 경사선에 다소의 불명료함이 있더라도 경사선을 추출할 수 있다.
이제, 해당 경사 방향의 투영 처리에 대해서 간단히 설명한다. 처음에, 화상 데이터(12)의 화상 패턴의 안쪽, 직선 추출 처리(스텝 S2)에서 직선으로서 추출된 패턴(직선 데이터(13)에 대응하는 패턴)을 제외한 각각에 대해서 정해진 사각형 영역으로 분할한다. 그 다음, 분할한 각각의 사각형 영역에 대해서 그 세로 및 가로 방향의 투영을 실행하여, 투영치를 구한다. 다음에, 식별된 사각형의 투영치에 식별된 사각형으로부터 일정 거리에 존재하는 사각형의 세로 및 가로 방향의 투영치를 가산한다. 즉, 특개평7-192094호 공보에 기재된 식에 따라서, 해당 사각형 영역의 경사 방향의 인접 투영치(경사 인접 투영치)를 산출한다. 투영각은 예컨대 45이다.
다음에, 산출한 경사 인접 투영치와 사각형 영역의 분할 길이의 비를 산출한다. 그리고, 이 비가 임계치 이상인 부분을 경사 성분으로 판정하고, 해당 비가 임계치보다도 작은 부분을 경사 성분이 존재하지 않는 것으로 판정한다. 다음에, 복수의 부분이 연속하여 임계치 이상이 되는 경우, 즉, 경사 성분인 부분이 연속하는 경우, 이 들을 통합하여 1개의 사각형 영역에서 근사화하여, 이 근사화된 사각형 영역에 경사 성분이 존재하는 것으로 한다. 경사 성분은 복수의 사각형 영역으로 이루어진다.
이러한 경사 방향의 화소 검출 처리 또는 경사 방향의(인접) 투영 처리를 사용함으로써 경사 방향으로 기울고 있는 경사 성분을 정확히 추출할 수 있다. 따라서, 시트의 테두리의 둥근 모서리 부분을 구성하는 경사 성분을 정확히 추출할 수 있다.
경사 성분 추출 처리에 의해 추출된 경사 성분에서, 제1 경사 성분인 세로 방향의 직선의 종단을 기점으로 하는 것을 "경사 성분 T"라고 부르고, 제2 경사 성분인 가로 방향의 직선의 종단을 기점으로 하는 것을 "경사 성분 Y"라고 부르고 구별하기로 한다.
도9의 a∼c는 둥근 모서리 부분을 확대한 예를 나타낸다. 도9의 a에서 점선으로 둘러싼 부분이 세로 직선 및 가로 직선(도 3의 직선 데이터(13))으로 추출된다. 다음에, 도9b에 나타낸 바와 같이, 가로 직선의 종단으로부터 경사 방향으로 신장하고 있는 직선을 추출하고, 그 결과로서, 해당 경사 성분 Y 및 그 존재 영역(사선을 근 영역)을 기억한다. 다음에, 도9c에 나타낸 바와 같이, 세로 직선의 종단으로부터 경사 방향으로 신장하고 있는 패턴을 추출하고, 그 결과로서, 해당 경사 성분 T 및 그 존재 영역(사선을 근 영역)을 메모리에 기억한다. 또, 추출 처리 순서는 어떤 처리를 먼저 혹은 후에 하여도 좋다. 이 처리는 모든 세로 직선 및 가로 직선에 대해서 실행된다. 즉, 원래 1개의 경사 성분이 경사 성분 T 및 Y로서 따로따로 추출된다. 이 처리에 의해, 1개의 경사 성분이 완전히 불명료하더라도 경사 성분 T 및 Y로서 추출할 수 있다.
경사 성분 추출 처리 후, 후보 검출 처리가 실행된다(스텝 S32). 후보 검출 처리는 중첩 처리, 근접 처리 또는 검출 처리 중 하나 또는 복수의 처리로 이루어진다. 중첩 처리에 대해서는 도9의 a∼c를 참조하여 설명하고, 근접 처리 및 검출 처리의 예에 대해서는 각각, 도10의 a, b 및 도11에 나타낸다.
처음에, 제1 처리로서, 중첩 처리가 실행된다(스텝 S32-l). 중첩 처리는 예컨대 도9b에 나타낸 경사 성분 Y(성분 Y의 존재 영역)와 도9c에 나타낸 경사 성분 T(성분 T의 존재 영역)가 중첩되어 있는 경우에 실행된다. 따라서, 스텝 S32-1에서 최초로, 경사 성분 Y와 경사 성분 T의 중첩의 유무가 조사된다. 경사 성분 Y와 경사 성분 T가 중첩하고 있는 경우, 그 부분은 둥근 모서리 후보 영역인 것으로 취급된다. 이것은 양자가 중첩하는 경우에는, 해당 경사 성분이 둥근 모서리 부분이 구비하는 형상을 갖는 것이 되기 때문이다. 즉, 해당 경사 성분은 가로 직선 및 세로 직선의 쌍방에 접속하고 있고, 또한 해당 둥근 모서리 부분은 쌍방의 직선을 잇는 성분이다. 이 중첩 처리에 의해 둥근 모서리 부분을 정확히 추출할 수 있다. 서로 중첩하는 경사 성분이 없는 경우, 도10의 a 및 b에 나타낸 근접 처리가 실행된다.
또, 해당 경사 성분 Y 및 T는 완전히 중첩하고 있을 필요는 없고, 사전에 정해진 상태 이상으로 쌍방이 중첩하고 있으면, 양자가 중첩되어 있는 것으로 판단된다. 중첩 상태는 예컨대 중첩되어 있는 면적 또는 화소수 또는 그 비에 의해 판단된다. 이 처리에 의해, 불명료함이 있더라도 경사 성분을 추출할 수 있다.
다음에, 제2 처리로서, 근접 처리는 2개의 경사 성분 Y(성분 Y의 2존재 영역)가 세로 방향으로 존재하고, 2개의 경사 성분 T(성분 T의 2존재 영역)가 소정 거리 이하에 가로 방향으로 존재할 때 실행된다(스텝 S32-2). 따라서, 스텝 S32-2에서 최초로, 식별된 영역의 경사 성분 Y 또는 T에서 근처의 상이한 경사 성분 Y 또는 T까지의 거리가 조사된다. 상기 위치 관계를 만족하는 상이한 경사 성분 Y 또는 T가 있는 경우, 도10의 a 및 b에 나타낸 바와 같이, 2개의 영역 Y 또는 T 간의 거리에 따라서, 2개의 상이한 처리 중 어느 하나가 실행된다. 2개의 상이한 처리는 어떤 것을 실행하여도 좋다. 상기 위치 관계를 만족하는 상이한 경사 성분 Y 또는 T가 없는 경우, 도11에 나타낸 검출 처리가 실행된다.
또, 도10은 2개의 경사 성분 Y가 세로 방향으로 서로 일정 거리 내에 있는 경우의 처리에 대해서 나타내지만, 2개의 경사 성분 T가 가로 방향으로 서로 일정 거리 내에 있는 경우의 처리를 나타내며, 처리는 도10의 a 및 b의 경우와 같다. 또한, 도11은 경사 성분 Y의 검출 처리를 나타내지만, 경사 성분 T의 검출 처리는 경사 성분 Y의 처리와 동일하다.
도10의 a에 나타낸 바와 같이, 2개의 경사 성분의 거리가 일정치 이하이기는 하지만 세로 방향으로 분리되어 있는 경우, 해당 2개의 경사 성분 간에 존재하는 패턴을 조사한다. 해당 패턴이 직선의 특징을 나타내는 패턴이 아닌 경우, 이하의 처리는 생략된다. 해당 패턴이 직선의 특징을 나타내는 패턴인 경우, 해당 2개의 경사 성분 Y 간에 가상적인 직선을 상정하여, 해당 2개의 경사 성분 Y를 둥근 모서리 후보 영역인 것으로 판정한다. 가상적인 직선은 괘선 후보 영역인 것으로 취급된다. 다음에, 괘선 후보 영역 내에 존재하는 화상 패턴 S가 직선의 특징을 나타내는 패턴인가 아닌가가 조사된다. 직선의 특징을 나타내는 경우, 해당 영역은 괘선으로서 추출되어, 양단의 경사 성분 Y는 둥근 모서리 후보 영역으로서 추출된다. 이 처리에 의해, 문자의 일부분을 둥근 모서리로서 잘못 추출하는 것을 방지할 수 있다. 따라서, 2개의 경사 성분 Y가 일정치 내의 세로 방향으로(또는 2개의 경사 성분 T가 일정치 내의 가로 방향으로) 위치해 있는 경우에는 이들 간에 직선 성분이 거의 존재하지 않고 대략 원호상으로 되어 있더라도, 둥근 모서리 후보 영역을 정확히 추출할 수 있다. 이것은 도19의 a에 나타낸 시트의 경우에 상당한다.
해당 패턴 S가 직선의 특징을 나타내는 패턴인가 아닌가를 결정하는 처리(직선 검출 처리)는 주지의 직선 검출 처리를 사용함으로써 실행된다. 주지의 직선 검출 처리로서는 예컨대, 본원 출원인이 제안한 특개평10-334185호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 화소 또는 요철도의 검출에 의한 직선 검출 처리가 실행된다. 이 처리에 의해, 요철도가 작은 직선이나 요철도가 큰 직선을 구별하는 것이 가능하게 되어, 직선의 특징을 나타내는 패턴인가 아닌가를 정확히 판정할 수 있다.
이제, 해당 화소의 검출 및 요철도에 의한 직선 판정 처리에 대해서 간단히 설명한다. 처음에, 입력된 화상 데이터(12)의 해당 검출 대상의 화상 패턴 S가 연장되는 방향(세로 또는 가로 방향)으로 화소(패턴으로서 입력된 흑화소)를 검출한다. 다음에, 해당 검출 방향에 화소가 존재하는 한, 해당 검출 방향으로 검출을 계속한다. 이 경우, 화소의 검출 방향은 변화하지 않는다. 한편, 해당 검출 방향으로 화소가 존재하지 않는 경우에 한하여, 해당 검출 방향의 경사 방향에 있는 화소를 검출한다. 이 경우, 화소의 검출 방향이 변화한다. 해당 검출 방향의 변화 회수가 카운트된다.
다음에, 화소의 검출 방향의 변화 회수의 값에 따라서, 해당 패턴 S가 직선의 특징을 나타내는 패턴인가 아닌가가 판정된다. 해당 패턴 S가 직선이면 대략 동일의 방향으로 검출이 행하여지기 때문에 화소의 검출 방향의 변화 회수의 값이 작고, 직선이 아니면 해당 값이 크다. 그래서, 사전에 경험적으로 직선 판정의 임계치를 적절한 값으로 정함으로써 직선으로 할 지 여부를 판정한다. 이러한 화소의 검출 및 요철도에 의한 직선 검출 처리를 사용함으로써 대상으로 하는 패턴 S가 직선인가 아닌가를 검출할 수 있다.
또, 도10의 a에 나타낸 경우에는, 해당 2개의 영역 Y 간에 존재하는 패턴 S에 대해서 직선 검출 처리를 실행하는 일없이, 둥근 모서리 부분이 접근할 때 존재 영역이라고 판단하여도 좋다. 이 경우, 2개의 영역 Y 간의 직선(괘선)은 상술한 방법으로 작성하여도 좋고, 또는 해당 2개의 영역 Y 간의 패턴의 존재의 유무에 관계없이 작성하여도 좋다.
도10의 b에 나타낸 바와 같이, 2개의 영역 Y 간이 접촉하고 있든지 또는 중첩되어 있는 경우, 해당 2개의 영역 Y가 둥근 모서리 부분인 것으로 취급된다. 이제, 접촉이라는 것은 2개의 경사 성분 Y를 구성하는 화소가 서로 인접하고 있는 경우를 말하고, 중첩이라는 것은 2개의 경사 성분 Y를 구성하는 화소가 중복하고 있는 경우를 말한다. 이러한 상태는 2개의 가로 직선에 끼여진 세로 직선의 성분이 지나치게 짧기 때문에, 직선으로서 검출되지 않은 경우이다. 따라서, 이 처리는 2개의 영역 Y 간 간격이 직선으로서 검출되는 최소 길이 이하인 경우에 실행된다. 이 처리에 의해, 2개의 경사 성분 Y가 상하 방향으로 또는 2개의 경사 성분 T가 좌우 방향으로 접촉 또는 중첩하는 경우에는, 둥근 모서리 후보 영역을 정확히 추출할 수 있다. 이것은 도19의 b에 나타낸 시트의 경우에 상당한다.
다음에, 제3 처리로서, 검출 처리가 실행된다(스텝 S32-3). 검출 처리는 도11에 나타낸 바와 같이, 경사 성분 Y 또는 T로부터 일정 거리 내에 있는 상이한 경사 성분 Y 또는 T가 존재하지 않는 경우에 실행된다.
도11에 나타낸 바와 같이, 식별된 경사 성분 Y1으로부터 일정 거리 이내의 위치에 어떤 다른 경사 성분 Y 또는 T가 존재하지 않는 경우, 해당 경사 성분 Y1의 종단에 짧은 직선 성분이 존재하는지 아닌지가 조사된다. 경사 성분인 경우에는 세로 직선이 검출되고, 경사 성분 T의 경우에는 가로 직선이 검출된다. 이제, 해당 짧은 직선의 존재를 검출하는 처리(짧은 직선 검출 처리)는 주지의 짧은 직선 검출 처리에 의해 행하여진다. 주지의 짧은 직선 검출 처리로서는 예컨대, 본원 출원인이 제안한 특개평10-334185호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 화소의 검출 및 요철도에 의한 직선 검출 처리가 실행된다. 이 처리에 대해서는 상술하였기 때문에, 그 설명을 생략한다.
해당 직선이 존재하는 경우, 해당 위치에 직선의 존재를 상정하여, 해당 영역을 둥근 모서리 후보 영역인 것으로 간주한다. 상정된 직선은 직선 추출 처리에서 추출한 직선과 같은 직선(괘선)인 것으로 취급된다. 이 처리에 의해, 추출된 경사 성분의 근처에 어떤 다른 경사 성분이 존재하지 않는 경우라도, 직선의 특징을 나타내는 패턴 S'가 존재하고 있으면, 해당 추출된 경사 성분은 둥근 모서리 후보 영역이라고 할 수 있다. 따라서, 가로 또는 세로 방향으로 직선 성분이 거의 존재하지 않고 시트의 모서리 부분이 원호형으로 되어 있는 경우라도, 둥근 모서리 후보 영역을 추출할 수 있다. 또한, 짧은 괘선이라도 정확히 추출할 수 있다.
이제, 도11에 나타낸 경사 성분 Y2는 도9의 a∼c에 나타낸 경우에 상당하며, 참조를 위해 나타낸다. 즉, 경사 성분 Y1은 상술의 중첩 처리 또는 근접 처리에 의하여 해당 경사 성분 Y1이 둥근 모서리 후보 영역이라는 것을 추출할 수 없는 경우이다.
이상의 각종의 처리에 의해 둥근 모서리 후보 영역으로서 추출된 각 경사 성분에 대해서, 직선 정보의 작성 처리가 실행된다(스텝 S33). 즉, 해당 경사 성분을 세로 방향 및 가로 방향으로 분해하여, 각각의 성분을 세로 방향 및 가로 방향의 직선(괘선)으로 가상한다. 일 예로서, 가로 방향의 경사 성분의 가로 방향의 좌표치를 상기 경사 성분이 접하는 직선의 세로 방향의 좌표치를 유지하면서, 상기 경사 성분이 접하는 가로 직선의 가로 방향의 좌표치로 변화시킴으로써, 가로 방향의 가상 직선을 얻는다. 동일의 처리로, 세로 방향의 가상 직선도 얻는다. 그 결과로서, 이들 2개의 직선의 존재를 나타내는 2개의 사각형 영역(도12에서 점선으로 나타낸 영역)이 작성된다. 이 처리에 의해, 가상적인 직선(사각형 영역)의 직선 정보가 작성된다. 직선 정보는 해당 가상적인 직선의 시작점 및 종단점(사각형 영역의 면적)을 나타내는 위치 좌표로 이루어진다. 이 처리 후, 가상적인 직선과 도12에서 실선으로 나타내는 실제하는 직선(사각형 영역)을 통합하여, 그 통합된 결과에 의거하여 이하에 설명되는 셀 추출이 실행된다. 이 처리에 의해, 둥근 모서리 후보 영역으로서 추출된 경사 성분을 가상적인 직선으로서 처리할 수 있으므로, 둥근 모서리 부분을 의식하지 않고, 셀추출을 실행할 수 있다.
또, 가상적인 직선(괘선)과 실제로 추출된 괘선의 위치 관계가, 서로 완전히 접촉 또는 중첩되지 않더라도 일정 거리 내에 있는 경우, 통합되어 1개의 직선(괘선)으로 된다. 이것은 세로 및 가로 방향의 통합 쌍방에 대해서 같다. 따라서, 이 통합 처리 이후의 처리에서는 실제의 괘선과 가상의 괘선이 동일의 처리로 취급되고, 둥근 모서리 부분을 의식하지 않고, 셀추출을 실행할 수 있다.
또한, 이 직선 정보 작성 처리로 둥근 모서리 후보 영역으로서 추출된 경사 성분의 크기의 평균치를 산출하는 처리가 실행된다. 이 평균치는 후술하는 둥근 모서리 판정 처리에서 사용된다.
또한, 직선 정보 작성 처리는 이하에 기술하는 셀 추출 처리의 선 처리이기 때문에, 해당 셀 추출 처리에 포함시켜도 좋다. 즉, 셀 추출 수단이 실행하도록 하여도 좋다.
이상의 처리의 결과, 도3의 직선 데이터(13)를 사용함으로써 도13의 화상 데이터(12)로부터 시트의 모서리의 둥근 모서리 후보 영역이 추출되고, 이에 대한 직선 정보가 작성된다. 이것이 도3의 둥근 모서리 후보 데이터(14)이다.
도13은 셀 추출 수단에 의해 실행되는 셀 추출 처리에 대해서 설명한다. 도13에 나타낸 처리는 도4의 처리(스텝 S4)에 상당하고, 주지의 기술이다.
셀 추출 수단(4)은 화상 데이터(12)로부터 셀을 추출한다. 이 추출 처리는 주지의 어떠한 처리를 사용해도 좋다. 셀은 사방을 직선으로 둘러싼 영역이기 때문에, 2개의 가로 선(가로 테두리)과 2개의 세로 선(세로 테두리)으로 셀을 규정(추출) 할 수 있다. 이하에 그 일례를 나타낸다.
처음에, 가로 테두리를 판정하는 가로 테두리 판정 처리가 실행된다(스텝 S41). 가로 테두리 판정은 주지의 가로 테두리 판정 처리에 의해 행하여진다. 주지의 가로 테두리 판정 처리로서는 예컨대, 본원 출원인이 제안한 특개평9-50527호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 테두리의 상부로부터 일정한 순서로 1행을 구성하는 2개의 가로 선(쌍)을 판정한다.
이제, 해당 가로 테두리 판정 처리에 대해서 간단히 설명한다. 처음에, 직선 추출 처리(스텝 S2)에서 추출된 가로 선 중에서, 위로부터 순서로 2개의 가로 선을 선택하여, 이 들을 2개의 가로 선의 쌍의 후보로 한다.
다음에, 이 후보인 2개의 가로 선이, 동일한 길이이거나 또는 하부 직선 부분이 상부 직선보다 긴 관계(쌍의 조건)이면, 해당 후보를 그대로 2개의 가로 선의 쌍으로 한다. 하부의 직선 부분이 긴 경우, 해당 하부의 직선을 2개의 가로 선의 쌍의 후보로 할 수 있다.
한편, 후보인 2개의 가로 선이, 하부의 직선 부분이 짧은 관계이면, 더욱, 해당 하부의 직선과 그 하부의 직선을 2개의 가로 선의 쌍의 후보로 한다. 그리고, 쌍방의 가로 직선의 길이의 관계를 조사하여, 상술한 쌍의 조건을 2개의 가로 선의 쌍의 후보로 할 수 있을 때까지, 2개의 가로선에 대해 같은 처리를 되풀이 한다. 또, 하부의 직선의 더욱 아래쪽으로 상술한 쌍의 조건을 만족하는 직선이 전혀 존재하지 않는 경우, 해당 하부의 직선과 그 바로 상부의 직선을 2개의 가로 선의 쌍으로 한다.
다음에, 상술한 처리를 가장 하부의 직선에 대해서 행한 뒤, 해당 직선의 상부에 미처리의 직선이 남아 있는 경우, 해당 미처리의 직선과 2개의 가로 선의 쌍의 후보로 할 수 있는 직선에 의거하여, 상술한 처리를 되풀이함으로써 2개의 직선의 쌍을 만든다. 이러한 측면 테두리 판정 처리를 사용함으로써 이후의 처리에서 테두리의 행선을 구성하는 측면 테두리의 쌍(2개의 선의 쌍)을 정확히 판정할 수 있다.
그 후, 가로 테두리 판정 처리의 결과에 의거하여, 세로 테두리를 판정하는 세로 테두리 판정 처리가 실행된다. 세로 테두리 판정 처리는 주지의 세로 테두리 판정 처리에 의해 행하여진다. 주지의 세로 테두리 판정 처리로서는 예컨대, 본원 출원인이 제안한 특개평950527호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 가로 테두리 판정 처리에서 2개의 가로 선에 의해 구성되는 간격마다(즉, 1행선마다) 처리를 하여, 상하 양단이 2가로 선에 도달하는 추출된 세로 선을 세로 테두리로 판정한다. 이러한 세로 테두리 추출 처리를 사용함으로써 세로 테두리를 정확히 추출할 수 있다.
이 후, 가로 테두리 판정 처리 및 세로 테두리 판정 처리의 결과에 의거하여, 셀의 사각형 영역을 추출하는 사각형 추출 처리가 실행된다(스텝 S43). 사각형 영역의 추출은 주지의 사각형 추출 처리에 의해 행하여진다. 주지의 사각형 추출 처리로서는 예컨대, 본원 출원인이 제안한 특개평9-50527호 공보에 기재된 기술이 사용된다. 이 특개평9-50527호 공보에 기재된 처리 기술에 의하면, 가로 테두리 판정 처리 및 세로 테두리 판정 처리에서 판정된 가로 테두리 및 세로 테두리에 사방이 둘러싸인 영역을 사각형 영역으로서 추출한다. 즉, 가로 테두리 판정 처리에서 2개의 가로 선과, 세로 테두리 추출 처리에서 2개의 세로 선으로 둘러싸인 영역을 사각형 영역으로서 추출한다. 이러한 사각형 추출 처리를 사용함으로써 셀을 정확히 추출할 수 있다.
이상의 처리의 결과, 도3의 화상 데이터(13)를 사용함으로써 도3의 화상 데이터(12)로부터 시트 등의 셀이 추출된다. 이것이 셀 데이터(15)이다. 이 처리에서, 단계 S33에서 작성된 직선 정보에 의해 형성되는 가상의 직선을 사용함으로써 도12∼도15에 나타낸 바와 같은 시트의 둥근 모서리 부분을 포함하는 셀도, 마찬가지로, 사각형 테두리로서 추출된다.
도14는 둥근 모서리 부분 결정 수단(5)에 의해 실행되는 둥근 모서리 판정 처리의 플로우를 나타낸다. 도14에 나타낸 처리는 도4의 스텝 S5에 상당하고, 본 발명에 특징적인 처리이다. 둥근 모서리 판정 처리는 화소 밀도 변화 처리, 대칭성 처리 및 정합 처리로 이루어진다.
처음에, 제1 처리로서, 추출된 셀의 모서리의 화소 밀도 변화에 따라서 해당 모서리의 형상을 판정하는 화소 밀도 변화 검출 처리가 실행된다(스텝 S51). 즉, 화소 밀도 변화 검출 처리는 셀의 모서리 형상에 주목하여, 화소 밀도 변화에 의거하여 둥근 모서리 부분을 판정하는 처리이다. 즉, 시트의 모서리의 형상에 따라서 둥근 모서리 부분을 판정하는 처리 모드이다. 모서리에 불명료함이 있는 경우라도 둥근 모서리 부분을 판정할 수 있다. 이렇게 해서, (화소 밀도)=(대상 영역 내의 흑화소의 총수)/(대상 영역 내의 화소의 총수)이 된다. 스텝 S31에서, 흑화소는 해당 성분 Y 또는 T로서 추출된 선분을 구성하는 화소이다.
도15의 a 및 b는 모서리의 일례를 나타낸다. 도15의 b는 도15의 a의 모서리의 확대도이다. 도15의 a,b에 나타낸 바와 같이, 셀의 모서리에서는 낮은 삼각 영역 a, 높은 사다리꼴 영역(사선을 근 부분) b, 낮은 사다리꼴 영역 c의 순서로 나란히 배열된다. 즉, 화소 밀도는 "저 → 고 → 저"의 순서로 변화한다. 그래서, 셀을 구성하는 추출된 2개의 직선으로 형성되는 모서리에서, 정점에서 떠나는 방향으로 상술한 순서로 화소 밀도가 변화하고 있는 경우, 식별된 해당 부분은 둥근 모서리 부분인 것으로 판정한다. 이 화소 밀도가 "저 → 고 → 저"의 순서로 변화하는 화소의 특징을 사용함으로써 모서리에 불명료함이 있더라도 둥근 모서리 부분을 판정할 수 있다.
화소 밀도의 고저를 검출하기 위한 임계치(또는 파라메터)가 해당 시트(입력 화상)의 입력 시에 사용자에 의해 정해진다. 사용자의 입력이 없는 경우, 사전에 정해진 값으로 된다. 도15의 a 및 b로부터 아는 바와 같이, 영역 a의 화소 밀도는 지극히 낮다(이 예로서는"0" 이다). 따라서, 영역 a 의 임계치는 지극히 작게 되어, 화소 밀도가 해당 임계치보다도 작은 경우에, 화소 밀도가 낮은 것(저)으로 판단된다. 영역 b의 화소 밀도는 소정의 수준에 달한다. 이 소정의 수준은 경험적으로 어느 정도 정확히 알 수 있다. 따라서, 영역 b 의 임계치는 해당 수준보다 작은 값으로 되어, 화소 밀도가 해당 임계치보다도 큰 경우에 화소 밀도가 높은 것(고)으로 판단된다. 영역 c의 화소 밀도는 영역 a보다는 높지만, 영역 b보다는 꽤 낮다. 이 화소 밀도는 경험적으로 어느 정도 정확히 알 수 있다. 따라서, 영역 c 의 임계치는 영역 a 의 임계치보다는 높지만, 영역 b보다는 꽤 작게 되어, 화소 밀도가 해당 임계치보다도 작은 경우에, 화소 밀도가 낮은 것으로 검출된다.
화소 밀도 처리에서, 화소 밀도를 산출하는 영역은 둥근 모서리 후보 영역 검출 수단(3)에서 산출된 둥근 모서리 후보 영역으로서 추출된 경사 성분의 크기의 평균치를 기준하여 설정된다. 예컨대, 해당 평균치보다 소정의 비율만큼 큰 값이, 상기 사다리꼴 영역의 하변의 값으로 설정된다. 이 처리에 의해, 화소 밀도 변화 검출 처리의 영역을 작게 할 수 있으므로, 화소 밀도 변화 검출 처리에 요하는 시간을 단축할 수 있다. 사다리꼴 영역 c의 하변은 해당 사각형 영역을 형성하는 세로 및 가로의 직선에 대하여, 도15의 a 및 b에 나타낸 바와 같이 45。로 교차한다. 사다리꼴 영역 b의 상변 및 하변도 같다.
또, 화소 밀도 판정 처리에서, 셀을 구성하는 2개의 직선이 만드는 정점을 포함하는 삼각 영역 a의 화소 밀도가 해당 임계치보다도 작은 경우에, 해당 모서리 부분이 둥근 모서리라고 판단하여도 좋다. 또한, 영역 a의 화소 밀도가 영역 b의 화소 밀도보다도 충분히 작은 경우(또는 양자 간에 사전에 정해진 차가 있는 경우)에, 해당 모서리 부분이 둥근 모서리로 검출되어도 좋다. 또한, 영역 a, b 및 c의 화소 밀도가 "저 → 고 → 저"로 변화하는 경우, 해당 모서리 부분이 둥근 모서리라고 판단하여도 좋다.
이 처리 후, 제2 처리로서, 대칭성 처리가 실행된다(스텝 S52). 도20의 입력된 화상 데이터(12)가 항상 양호한 상태라고는 할 수 없다. 즉, 괘선의 불명료함이라든지 찌그러짐, 괘선에의 문자의 접촉 등의 원인에 의해, 화소 밀도 변화 검출 처리만으로 모든 둥근 부분을 정확히 추출할 수 있다고는 할 수 없다. 그래서, 둥근 모서리 추출의 대상인 표 형식의 규칙성을 사전에 알고 있는 경우, 해당 규칙성을 이용함으로써 보다 높은 정밀도로 둥근 모서리의 추출을 실행할 수 있다.
대칭성 처리는 시트의 표 형식의 규칙성에 주목하여, 모서리의 동일한 표 형상의 규칙적인 반복(둥근 모서리의 방향은 다름)을 이용하여 둥근 모서리의 판정을 실행하는 처리이다. 일반적으로 사용되는 시트의 대부분은 도16의 a에 나타낸 바와 같이 그 외주의 모서리의 전체가 둥근 모서리이고, 반대로, 도16의 b에 나타낸 바와 같이, 모서리의 전체가 둥근 모서리 부분이 아니다. 모서리의 일부만이 둥근 모서리 부분인 시트는 거의 존재하지 않는다. 그래서, 이 모서리의 대칭성을 이용하여, 보다 높은 정밀도로 둥근 모서리 부분을 추출할 수 있다.
처음에, 전 처리로서 해당 규칙성을 사전에 알고 있는지 아닌지가 조사된다(스텝 S52-1). 해당 시트가 규칙성을 가진 표 형식을 갖는 것은 예컨대 해당 시트(도20의 입력 화상(11))의 입력 시에 사용자에 의해 입력된다.
이 처리 후, 도16의 a에 나타낸 시트에 대해서 규칙성을 갖는 것이 지시되어 있는 경우, 해당 규칙성(대칭성)을 이용한 처리를 실행한다. 즉, 예컨대, 4개의 모서리 부분이 있는 해당 시트에서 상술한 화소 밀도 변화 검출 처리에 의해 하나가 둥근 모서리 부분인 것으로 판단되면, 상이한 3개의 모서리도 둥근 모서리일 가능성이 높다고 판단한다. 다음에, 해당 상이한 3개의 모서리에 대해서, 화소 밀도 변화 검출 처리의 제한을 늦춘 후에, 재차, 화소 밀도 변화 검출 처리를 하여, 이 결과를 최종적인 처리 결과로 한다. 따라서, 대칭성 처리는 실제는 완화된 일정 조건 하의 화소 밀도 변화 검출 처리의 반복이다. 상기 조건의 완화는 예컨대 임계치(또는 파라메터)를 변경하는 것에 의해 실행된다.
예컨대, 도15의 a 및 b에 나타낸 둥근 모서리에서, 이에 교차하도록 문자가 기입되어 있는 경우, 영역 a 및 영역 c의 화소 밀도는 해당 영역의 임계치보다도 크게 된다. 이 경우, 화소 밀도가 영역 a, b 및 c 에 대해서 높으므로, 변화하지 않는다. 상이한 경우로, 해당 둥근 모서리에 지극히 인접하여 문자가 기입되어 있는 경우, 영역 c의 화소 밀도가 해당 임계치보다도 크게 된다. 이 경우, 화소 밀도는 영역 a, b 및 c 에 대해서 "저 → 고 → 고"순으로 된다. 그래서, 영역 a 및 영역 c의 임계치를 사전에 정해진 값만큼 높게 변화한다. 따라서, 화소 밀도가 영역 a, b 및 c 에 대해서 "저 → 고 → 저"로 변화하는 것이 된다. 결과적으로, 둥근 모서리의 판정 조건이 완화되어, 제1 단계에서 둥근 모서리로서 판정되지 않는 둥근 모서리도 둥근 모서리 부분인 것으로 판정된다.
또, 규칙성을 갖는 것이 지시되어 있는 경우라도, 사전에 정해진 개수의 둥근 모서리 부분이 판정되어 있지 않으면, 대칭성 처리(스텝 S52-2)는 실행되지 않는다. 이 경우는 모서리의 모두에 전혀 둥근 모서리 부분이 없다고 생각되기 때문이다. 대칭성 처리를 개시하기 위한 둥근 모서리의 개수는 사전에 정해진다. 이 개수는 통상 1개로 되지만, 2개 이상이어도 좋고, 예컨대 도20의 입력 화상(11)의 입력 시에 사용자에 의해 입력된다.
또, 대칭성 처리(스텝 S52-2)는 복수 회 되풀이하여 실행하여도 좋다. 즉, 영역 a 및 영역 c의 임계치를 소정 폭만큼 크게 변화시켜도, 둥근 모서리 부분이 판정될 수 없는 경우, 영역 a 및 영역 c의 임계치를 더 동일한 소정 폭만큼 크게 변화시켜 화소 밀도 변화 검출 처리를 행하여도 좋고, 이것을 되풀이하여도 좋다. 이 처리에 의해, 둥근 모서리에 문자가 접촉하여도 확실히 둥근 모서리 부분을 판정할 수 있다.
이상과 같이, 시트의 모서리의 형상에 따라서 둥근 모서리 부분을 판정하는 처리 모드 이외에, 시트의 외주의 모서리의 대칭성을 사용하여 둥근 모서리 부분을 판정하는 처리 모드에 의해, 각 모서리마다 둥근 모서리 부분인이 아닌가가 판정된다. 이 처리에 의해, 사전에 시트의 규칙성을 알고 있는 경우에는, 보다 고정밀도로 둥근 모서리 부분을 판정할 수 있다. 즉, 화소 밀도 변화 검출 처리에서 둥근 모서리 부분이 사전에 정해진 개수 이상 검출된 경우에는, 그 처리 후의 대칭성을 사용한 처리 모드에서, 화소 밀도 변화 검출 처리에서 둥근 모서리 부분인 것을 판정할 수 없던 모서리에 대해서도 재차 화소 밀도 변화 검출 처리를 실행한다. 이 처리에 의해, 정확하게 둥근 모서리 부분인 것을 판정할 수 있다.
또, 스텝 S52-1에서 규칙성이 탐지되지 않은 경우에는, 스텝 S52-2의 실행은 생략된다. 즉, 화소 밀도 변화 검출 처리에서 추출한 둥근 모서리만을 둥근 모서리 부분인 것으로 판정한다. 따라서, 이 경우, 그 외주의 모서리의 일부만이 모서리 부분인 표 형식이 검출된다.
또한, 해당 시트가 규칙성을 갖는가 아닌가의 지시 입력은 예컨대 규칙성을 갖는 모서리의 위치 또는 수로 하여도 좋고, 또한 해당 지시에서 규칙성을 갖는 모서리의 개수는 어느 것으로 하여도 좋다.
이 처리 후, 제3 처리로서, 정합 처리가 실행된다(스텝 S53). 화소 밀도 변화 검출 처리 및 대칭성 처리에 의하면 점선 내에서, 점과 점 간격이 넓은 것에 대해서는 처리할 수 없다. 이것은 해당 점 간 간격의 존재에 의해 화소 밀도의 변화를 정확히 추출할 수 없기 때문이다. 그래서, 화소 밀도 변화 검출 처리(또는 화소 밀도 변화 검출 처리 및 대칭성 처리의 쌍방)에서 둥근 모서리 부분인 것으로 판정되지 않은 모서리에 대해서, 정합 처리가 실행된다. 정합 처리는 발생시킨 패턴과 화상 패턴(또는 근사화시킨 패턴)과의 정합을 검출함으로써 모서리 부분을 인식하는 처리이다. 정합 처리를 실행함으로써 점 간 간격이 넓은 점선에 대해서도 둥근 모서리 부분을 판정할 수 있다.
정합 처리는 도17의 a, b,c 및 d에 나타낸 바와 같이, 2개의 가로 선 간의 거리(2세로 선과 같음) 또는 가로 선과 세로 선 간의 거리가 사전에 정해진 값 이하인 경우에, 실행된다. 도17의 a 및 c는 서로 대응한다. 도17의 c 및 d는 서로 대응한다. 상기 거리가 일정치 이하의 경우에만 정합 처리를 실행함으로써 정합 처리의 회수를 적게 하여 처리를 고효율로 할 수 있다.
정합 처리에서, 처음에, 해당 2개의 직선의 종단과 종단 간을 맺는 패턴이 생성된다(스텝 S53-1). 즉, 정합 처리에 사용하는 패턴은 사전에 준비되는 것은 아니고, 그 때마다 생성된다. 따라서, 다수의 패턴을 기억시킬 필요가 없고, 그 때문의 대용량의 메모리도 필요 없다. 패턴의 생성에는 f(x)=a0Xn+a1Xn-1+…+an 과 같이 n차 함수가 사용된다. 예컨대, 도17의 a는 가로 선과 가로 선(또는 세로 선과 세로 선)의 종단이 서로 가까운 위치에 존재하는 예이다. 이 경우, 2개의 가로 선의 종단 a, b에 대한 패턴 a ' b '가 생성된다(도17의 c 참조). 패턴 a ' b '는 반원이다. 도17의 b에 나타낸 상태는 세로 선의 종단(A)과 가로 선의 종단(B)이 서로 가까운 위치에 존재하는 예이다. 이 경우, 세로 선과 가로 선의 종단 A, B에 대한 패턴 A ' B '가 생성된다. 패턴 A ' B '는 90。의 원호이다. 생성된 패턴 a ' b ' 또는 A ' B '와 화상 패턴이 일치하면, 해당 모서리 부분은 둥근 모서리 부분인 것으로 판정된다.
다음에, 생성된 패턴과 도20의 입력된 화상 데이터(12) 상의 화상 패턴(입력 패턴)이 비교된다(스텝 S53-2). 이 비교 결과 패턴이 일치하면, 해당 모서리 부분은 해당 생성된 패턴과 동일한 형상을 갖는 둥근 모서리 부분인 것으로 취급된다. 이 처리에 의해, 불명료한 실선이라든지 간격이 넓은 점선에 대해서도 정확히 둥근 모서리 부분을 판정할 수 있다.
또, 해당 화상 패턴에 근사화시킨 패턴(근사화 패턴)을 생성하여, 해당 근사화 패턴과 입력 패턴을 비교하여도 좋다. 근사화 패턴은 해당 화상 패턴을 사각형 근사화함으로써 얻는다. 근사화 패턴을 사용함으로써 입력 패턴이 점과 점 간격이 넓은 점선이라든지 불명료한 실선일지라도, 정확히 둥근 모서리 부분을 검출할 수 있다.
이상과 같이, 정합 처리는 화소 밀도 판정 처리 및 대칭성 처리에 의하면 둥근 모서리 부분을 검출하는 것이 불가능한 경우에만 실행된다. 이 정합 처리에 의해, 시트의 모서리의 형상(또는 그 규칙성)에 따라서 둥근 모서리 부분을 판정하는 처리 모드에 의하면 둥근 모서리 부분인이 아닌가를 판정하는 것이 불가능한 경우(예컨대, 점선의 경우)라도, 둥근 모서리 부분을 정합 처리로 판정할 수 있다. 또한, 본 발명에서는 패턴 생성 처리의 회수를 적게 할 수 있으므로, 처리의 효율을 높일 수 있다.
이상의 처리의 결과, 도18에 나타낸 바와 같이, 도20의 화상 데이터(12)로부터 시트의 둥근 모서리 부분이 추출된다. 이것이 둥근 모서리 데이터(16)이다.
도18은 문자 인식 영역 결정 수단(6)에 의해 실행되는 문자 인식 영역 판정 처리에 대해서 나타낸다. 이 처리는 도4의 스텝 S6이고, 주지의 처리이다.
도18은 어떤 모서리 부분이 둥근 모서리 판정 처리에서 둥근 모서리 부분인 것으로 판정된 경우에서, 해당 둥근 모서리와 셀 C1과의 관계를 나타낸다. 도18에 나타낸 바와 같이, 해당 판정된 둥근 모서리 부분은 셀 C1의 안쪽에 포함된 상태가 된다. 또, "a b c"는 시트에 기입된 문자이다. 다음에, 문자 인식 영역 결정 수단(6)은 처음에, 셀 C1의 바로 안쪽의 점선에 나타낸 사각형의 영역을 가상의 문자 인식 영역 C2로 한다. 이 처리 후, 문자 인식 영역 결정 수단(6)은 가상의 문자 인식 영역 C2로부터 해당 둥근 모서리 부분이 존재하는 영역(사선을 근 삼각형의 영역) C3을 제외함으로써 참된 문자 인식 영역을 판정한다. 이 처리에 의해, 해당 둥근 모서리 부분이 문자라고 인식되는 것을 방지할 수 있게 되어, 문자"a b c"를 정확하게 인식할 수 있다.
이상, 본 발명을 1개의 실시예에 의해 설명하였지만, 본 발명은 그 주지의 영역 내에서 여러 가지의 변형이 가능하다.
예컨대, 표 화상 처리 장치(100)는 상술한 구성을 모두 구비할 필요는 없고, 적당히 간단한 구성으로 하여도 좋다. 특히, 직선 추출 수단(2), 둥근 모서리 후보 영역 결정 수단(3), 셀 추출 수단(4), 둥근 모서리 부분 결정 수단(5) 및 문자 인식 영역 검출 수단(6)은 소프트웨어에 의해서 실현되기 때문에, CPU의 부담이 크고, 메모리도 크게 된다. 그래서, 각 장치의 구성을 간소화 하여도 좋다. 이 경우, 둥근 모서리의 추출 정밀도는 다소 뒤떨어지지만, 처리 속도는 고속화할 수 있다.
일례로서, 둥근 모서리 후보 영역 검출 처리의 후보 검출 처리로서 중첩 처리(스텝 S32-1)만을 실행하여, 둥근 모서리 판정 처리로서 화소 밀도 변화 검출 처리(스텝 S51)만을 실행하도록 한다. 이 경우, 중첩 처리만이 실행되기 때문에, 사전에 정해진 거리 내에 위치하는 세로 방향의 직선과 가로 방향의 직선으로 된 쌍(도9에 나타낸 예)이, 둥근 모서리의 처리 대상으로 된다.
상이한 예로서, 둥근 모서리 후보 영역 검출 처리의 후보 검출 처리로서, 중첩 처리(스텝 S32-1)에 대신하여, 근접 처리(스텝 S32-2)만, 검출 처리(스텝 S32-3)만, 또는 이들의 3개의 처리로부터 선택한 2개의 처리만을 실행하도록 하여도 좋다. 또한, 다른 예로서, 둥근 모서리 판정 처리로서는 화소 밀도 변화 검출 처리(스텝 S51)만을 실행하도록 한다. 근접 처리의 경우에는, 도10에 나타낸 예만이 둥근 모서리의 처리 대상이 되고, 검출 처리의 경우에는, 도11에 나타낸 예만이 둥근 모서리의 처리 대상으로 된다.
반대로, 상술한 예에서, 둥근 모서리 검출 처리로서, 화소 밀도 변화 검출 처리(스텝 S51)를 대신하여, 화소 밀도 변화 검출 처리 및 대칭성 처리(스텝 S52), 또는 화소 밀도 변화 처리 및 정합 처리(스텝 S53)를 실행하도록 하여도 좋다. 후보 검출 처리로서는 중첩 처리(스텝 S32-1)만을 실행하도록 한다.
이상의 설명으로부터 알 수 있는 바와 같이, 후보 검출 처리 및 둥근 모서리 판정 처리는 각각, 상술한 복수의 처리로부터 적당히 선택하여 실행할 수 있다. 따라서, 이들의 처리는 상술한 예 이외에도 여러 가지 조합할 수 있다.
또한, 상이한 예로서, 둥근 모서리 후보 영역 검출 수단 및 둥근 모서리 부분 결정 수단만을 실시예에서 설명한 구성으로서 포함할 수 있고, 상이한 각 장치는 상술한 이외의 주지의 수단에서 실현하여도 좋다. 이 경우라도, 둥근 모서리 후보 영역 검출 수단(3) 및 둥근 모서리 부분 결정 수단(5)의 구성은 상술한 간단한 구성으로 하여도 좋다.
또한, 예컨대, 도4에 나타낸 처리의 플로우를 나타내는 도면에서, 처리의 순서를 여러 가지로 변경하는 것이 가능하다. 즉, 직선 추출 처리(스텝 S2)후에, 둥근 모서리 후보 영역 검출 처리(스텝 S3)를 실행하는 일없이, 셀의 형상을 판정하기 전에 셀 추출 처리(스텝 S4)를 실행하고, 그 뒤에 둥근 모서리 후보 영역 검출 처리(스텝 S3) 및 둥근 모서리 판정 처리(스텝 S5)를 이 순서로 하여도 좋다. 반대로, 직선 추출 처리(스텝 S2) 및 둥근 모서리 후보 영역 검출 처리(스텝 S3)후에, 셀 추출 처리를 실행하는 일없이, 둥근 모서리 판정 처리(스텝 S5)를 행하여 둥근 모서리의 형상을 판정하고, 그 뒤에 셀 추출 처리(스텝 S4)를 하도록 하여도 좋다. 또한, 이러한 처리 순서를 변경하는 이외에, 상술한 바와 같은 둥근 모서리 후보 영역 검출 수단(3) 및 둥근 모서리 부분 결정 수단(5)의 간단한 구성을 더불어 채용할 수 있다.
또한, 예컨대, 어느 특정한 처리의 결과에 따라서, 도4에 나타낸 처리의 순서를 여러 가지 변경하는 것이 가능하다. 즉, 스텝 S31에서 추출된 모든 경사 성분 Y 및 경사 성분 T의 크기(경사선의 길이)가 사전에 정해진 값보다 작은 경우, 후보 영역 검출 처리(스텝 S32) 및 직선 정보 작성 처리(스텝 S33)를 생략하고, 셀 추출 처리(스텝 S4), 스텝 S31을 제외하는 둥근 모서리 후보 영역 검출 처리(스텝 S3), 둥근 모서리 판정 처리(스텝 S5)의 순서로 실행하여도 좋다. 더욱, 이 경우, 후보 검출 처리(스텝 S32)를 생략하여 실질적으로 둥근 모서리 후보 영역 검출 처리(스텝 S3)를 생략할 수 있다. 이렇게 하여도, 둥근 모서리의 면적이 작기 때문에, 직접 둥근 모서리 판정 처리를 할 때의 처리 부담이 커지지 않는다.
(제2 실시예)
도20은 표 화상 처리 장치의 구성도이고, 본 발명의 표 화상 처리 장치(100)의 일례의 구성을 나타내고, 도2에 나타낸 표 화상 처리 장치(100)에 대응한다. 도20의 표 화상 처리 장치(100)는 기본적으로는 도3에 나타낸 표 화상 처리 장치(100)와 같은 구성을 갖지만, 직선 추출 수단(2)이, 괘선 판정 처리 수단(20)을 추가적으로 구비하는 점만이 다르다. 괘선 판정 처리 수단(20)은 도20의 입력 화상(11)(또는 도20의 화상 데이터(12))으로부터 추출된 세로 및 가로 방향의 괘선 후보에 대해서, 입력 화상(11)으로부터 추출된 해당 식별된 괘선 후보의 주위에 존재하는 화상 패턴에 따라서, 서로 상이한 값의 복수의 임계치 중 어느 하나를 사용하여, 해당 괘선 후보의 요철도를 검출함으로써 해당 괘선 후보가 실제 괘선인가 아닌가를 검출한다. 일례로서, 낮은 값의 제1 임계치(21) 또는 높은 값의 제2 임계치(22)의 2개의 임계치를 사용한다.
도20의 표 화상 처리 장치(100)는 기본적으로는 도3의 표 화상 처리 장치(100)와 같은 처리를 실행하고, 직선 추출 수단(2)의 직선 데이터(13)의 작성 처리 부분(괘선 후보의 추출 처리)만이 일부 다르다. 이하에서, 표 화상 처리 장치(100)와 같은 처리에 대해서는 그 설명을 생략하고, 직선 추출 수단(2)의 처리를 중심으로 설명한다.
도21은 괘선 판정 처리 수단(20)의 구성을 나타낸다. 도20 및 도21에 나타낸 바와 같이, 괘선 판정 처리 수단(20)은 직선 추출 수단(2)에 설치된다. 괘선 판정 처리 수단(20)은 직선 추출 수단(2)에 의해 추출한 세로 및 가로 방향의 직선 후보에 대해, 해당 괘선 후보가 괘선인가 아닌가를 판정한다. 따라서, 직선 출출 장치(2)의 처리의 대상이 되는 것은 도5에 나타낸 처리에서, 직선 추출 수단(2)이 연결 패턴 추출 처리(스텝 S21) 내지 점선 추출 처리(스텝 S25)까지를 실행한 결과로서 얻어지는 데이터이다. 연결 패턴 추출 처리 내지 점선 추출 처리는 주지의 어느 처리에 의해서 실현해도 좋다. 이 데이터는 상기 처리에 의해서 추출된 직선 및 점선으로 이루어지기 때문에, 본 예에서는 괘선 후보 데이터(13A)라고 부르기로 한다. 괘선 판정 처리 수단(20)은 괘선 후보 데이터(13A)로부터 괘선일 가능성이 낮은 것을 괘선 후보 데이터(13A)에서 제외하여 직선 데이터, 즉, 괘선 데이터를 작성한다.
괘선 판정 처리 수단(20)은 직선 추출 수단(2)의 일부이기 때문에, 직선 추출 수단(2)의 메모리 상에 존재하고, CPU 상에서 실행되는 것에 의해 해당 처리를 실행 처리 프로그램에 의해서 실현한다. 괘선 검출 처리 프로그램은 직선 추출 처리 프로그램의 일부이다. 직선 추출 수단(2)의 실행 처리에서, 괘선 판정 처리 수단(20)의 실행 처리는 본 발명에서 특유의 처리이고, 다른 처리(연결 패턴 추출 처리 내지 점선 추출 처리)는 주지의 처리이다.
또, 도3의 표 화상 처리 장치(100)에서도, 연결 패턴 추출 처리(스텝 S21) 내지 점선 추출 처리(스텝 S25)까지를 실행한 뒤에, 해당 처리의 결과로 얻어진 괘선 후보로부터 괘선일 가능성이 낮은 영역을 판정하여 해당 후보로부터 제외하는 괘선 검출 처리를 실행하도록 하여도 좋다. 이 괘선 검출 처리는 예컨대, 특개평10-334185호 공보에 기재된 기술에 의한다. 이 기술에 의하면, 화소의 검출 및 요철도에 의한 직선(괘선) 검출 처리가 행하여진다. 즉, 추출된 괘선 후보의 화소 검출 처리를 실행함으로써 화소의 요철도를 산출하여, 해당 요철도가 어느 일정한 값(임계치) 이상이면 화상 패턴을 괘선 이외(즉, 문자)의 패턴인 것으로 판정하고, 임계치보다 작으면 해당 화상 패턴을 괘선인 것으로 판정한다. 이 기술에 대해서는 상술하였기 때문에, 그 설명을 생략한다.
도21에 나타낸 바와 같이, 괘선 판정 처리 수단(20)은 화소 밀도 판정 처리 수단(23)과 괘선 폭 판정 처리 수단(24)로 이루어진다. 화소 밀도 판정 처리 수단(23) 및 괘선 폭 판정 처리 수단(24)은 각각, 검출 처리에 쓰기 위한 제1 및 제2 임계치(요철도의 임계치)(21 및 22)를 사전에 갖는다. 화소 밀도 판정 처리 수단(23)과 괘선 폭 판정 처리 수단(24)의 처리는, 양자의 처리가 다르기 때문에, 그들의 임계치는 값이 다르지만 이 설명에서는 특별한 구별을 하지 않는다. 이는 제2 임계치(22)에 대해서도 같다. 제1 임계치(21)는 낮은 임계치를 의미하고, 제2 임계치(22)는 높은 임계치를 의미한다. 화소 밀도 판정 처리 수단(23) 및 괘선 폭 판정 처리 수단(24)의 제1 및 제2 임계치(21,22)의 값은 각각의 실행 처리에 따른 적절한 값으로 사전에 설정된다. 이들의 값은 각각, 경험적(또는 통계적, 실험적)으로 적절한 값으로 정해진다.
괘선 판정 처리 수단(20)에서, 주어진 괘선 후보 데이터(13A)의 처리 전에 화소 밀도 판정 처리 수단(23)과 괘선 폭 판정 처리 수단(24)의 어떤 것을 행하여도 좋다. 두 경우에서, 괘선 후보에서 괘선일 가능성이 낮은 것을 제외할 수 있다. 괘선 판정 처리 수단(20)은 화소 밀도 판정 처리 수단(23)과 괘선 폭 판정 처리 수단(24) 중 어느 하나만을 구비하여도 좋다. 괘선 판정 처리 수단(20)은 소프트웨어에 의해서 실현되기 때문에, CPU의 부담이 커서 메모리도 크게 된다. 그래서, 어느 한쪽만을 설치하여, 장치의 구성을 간소화하여도 좋다. 이 경우, 괘선의 추출 정밀도는 다소 뒤떨어지지만, 처리 속도는 고속화할 수 있다.
화소 밀도 판정 처리 수단(23)은 사전에 정해진 값의 제1 임계치(21) 또는 이 값보다도 높은 값의 제2 임계치(22) 중 어느 하나를 사용함으로써, 해당 괘선 후보의 요철에 근거하여 해당 괘선 후보가 실제 괘선인가 아닌가를 검출한다. 제1 임계치(21)는 제2 임계치(22)보다도 낮다. 화소 밀도 판정 처리 수단(23)은 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도에 대응해서 제1 임계치 또는 제2 임계치를 선택하며, 해당 화상 패턴의 화소 밀도가 높은 경우에, 제1 임계치(21)를 사용하고, 해당 화상 패턴의 화소 밀도가 낮은 경우에, 제2 임계치(22)를 사용한다.
괘선 판정 처리 수단(20)의 화소 밀도 판정 처리 수단(23)은 해당 괘선 후보가 세로 괘선인 경우, 식별된 해당 세로 괘선의 길이와 동일한 길이이고, 또한 식별된 해당 세로 괘선 후보의 좌우의 사전에 정해진 범위에 존재하는 화상 패턴을 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴으로서 사용한다. 또한, 괘선 판정 처리 수단(20)의 화소 밀도 판정 처리 수단(23)은 해당 괘선 후보가 가로 괘선인 경우, 식별된 해당 가로 괘선의 길이와 동일한 길이이고, 또한 식별된 해당 가로 괘선의 상하의 사전에 정해진 범위에 존재하는 화상 패턴을 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴으로서 사용한다. 즉, 이 처리에 의해 정해진 영역의 화소 밀도가 괘선 검출에 사용된다. 해당 영역에 실제의 화상 패턴이 존재하지 않는 경우, 화소 밀도는"0"이다.
괘선 폭 판정 처리 수단(24)은 제1 임계치 또는 이 값보다도 높은 값의 제2 임계치 중 어느 하나를 사용하여 해당 괘선 후보의 요철도에 의해 해당 괘선 후보가 괘선인가 아닌가를 검출한다. 제1 임계치(21)의 값은 제2 임계치(22)의 값보다도 낮다. 구체적으로는 괘선 폭 판정 처리 수단(24)은 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 폭에 응해서, 해당 다른 화상 패턴의 폭이 넓은 경우에, 제1 임계치를 사용하고, 해당 다른 화상 패턴의 폭이 좁은 경우에, 제2 임계치를 사용한다.
괘선 판정 처리 수단(20)의 괘선 폭 판정 처리 수단(24)은 해당 괘선 후보와 동일의 방향으로 연장되고, 식별된 해당 괘선 후보에 인접 또는 연결된 상이한 괘선 후보를 다른 화상 패턴으로서 사용한다. 식별된 해당 괘선 후보와 동일한 괘선을 구성하는 괘선 후보를 식별된 괘선 후보 주위에 존재하는 다른 화상 패턴으로서 사용한다.
괘선 폭 판정 처리 수단(24)은 식별된 해당 괘선 후보의 폭이 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 폭의 n 배 이상인 경우에, 식별된 해당 괘선 후보의 폭이 넓다고 하고, 해당 괘선 후보의 폭이 다른 화상 패턴의 폭이 1/n 이하인 경우에, 해당 괘선 후보의 폭이 좁다고 한다. 여기서, n은 양의 정수이고, 예컨대, "3"으로 된다.
도22는 직선 추출 수단(2)에 의해 실행되는 직선 추출 처리의 플로우를 나타낸다. 도22에 나타낸 처리는, 기본적으로는 도5에 나타낸 처리와 같고, 점선 추출 처리(스텝 S25)후에 괘선 검출 처리(스텝 S26)가 실행되는 점만이 다르다. 따라서, 도5에 나타낸 처리와 같은 처리에 대한 설명은 생략하고, 괘선 검출 처리(스텝 S26)만을 설명한다.
처음에, 직선 추출 수단(2)은 도5에 나타낸 바와 같이, 연결 패턴 추출 처리(스텝 S21) 내지 점선 추출 처리(스텝 S25)를 실행한다. 그 처리 결과, 화상 데이터(12)로부터 도7의 오른쪽에 나타낸 바와 같이 사각형에 의해 근사화된 직선 및 점선이 추출된다. 이것이 괘선 후보 데이터(13A)이다.
계속해서, 직선 추출 수단(2)은 도13의 a에 나타낸 바와 같이, 괘선 판정 처리 수단(20)에 의한 괘선 검출 처리를 실행하여, 괘선 후보 데이터(13A)에서 직선 데이터(괘선 데이터)(13)를 추출한다(스텝 S26).
도23은 괘선 판정 처리 수단(20)이 실행하는 괘선 검출 처리의 플로우를 나타낸다. 괘선 검출 처리는 화소 밀도 판정 처리 수단(23)에 의한 화소 밀도 판정 처리와 괘선 폭 판정 처리 수단(24)에 의한 괘선 폭 판정 처리로 이루어진다. 화소 밀도 판정 처리에 대해서는 도25를 참조하여 설명하고, 괘선 폭 판정 처리에 대해서는 도26을 참조하여 설명한다.
처음에, 전 처리로서, 괘선 판정 처리 수단(20)에 의해 요철도 산출 처리가 실행된다(스텝 S261). 요철도 산출 처리는 주지의 직선 검출 처리를 사용하는 것에 따라 실행된다. 주지의 직선 검출 처리로서는 예컨대, 본원 출원인이 제안한 특개평10334185호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 화소의 검출이 실행된다.
이 주지의 기술에 대해서는 "직선 검출 처리"로서 설명하였기 때문에, 여기서는 해당 화소의 검출에 대해서만 간단히 설명한다. 처음에, 괘선 후보의 대상으로 되어 있는 해당 조사 대상의 화상 패턴이 연장되는 방향(세로 또는 가로 방향)으로, 화소(패턴으로서 입력된 흑화소)를 검출한다. 그리고, 해당 검출 방향으로 화소가 존재하는 한, 해당 검출 방향으로 검출을 계속한다. 이 처리에서, 화소의 검출 방향은 변화하지 않는다. 한편, 해당 검출 방향으로 화소가 존재하지 않는 경우에 한하여, 경사 방향에 있는 화소를 검출한다. 이 경우, 화소의 검출 방향이 변화한다. 해당 검출 방향의 변화 회수가 카운트된다. 카운트된 변화 회수가 해당 괘선 후보의 요철도이다. 해당 패턴이 괘선이면 대략 동일의 방향으로 검출이 행하여지기 때문에 검출 방향의 변화 회수의 값이 작고, 괘선 이외의 패턴(문자)이면 해당 값이 크다.
다음에, 제1 단계로서, 화소 밀도 판정 처리 수단(23)에 의해 화소 밀도 판정 처리가 실행된다(스텝 S262).
화소 밀도 판정 처리에서, 화소 밀도가 산출된다(스텝 S262-1). 화소 밀도 판정 처리에 사용되는 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴은 다음과 같이 하여 정해진다. 예컨대, 도24의 a에 나타낸 괘선 후보는 가로 괘선이기 때문에, 이 경우의 다른 화상 패턴은 도24의 c에 나타낸 바와 같이 판정된다. 즉, 상이한 패턴으로서 해당 가로 괘선의 길이와 동일한 길이 L1의 패턴인, 해당 가로 괘선의 상하의 폭 2H1(또는 3H1 이상이라도 좋음)의 영역에 존재하는 화상 패턴이 사용된다. 이렇게 해서, H1은 해당 가로 괘선의 폭(높이)이 된다. 따라서, 상측 및 하측의 L1×2H1의 2개의 영역이 화소 밀도의 검출에 사용된다. 도24의 b에 나타낸 식별된 괘선 후보의 화상 패턴에 대응하는 다른 화상 패턴은 도24의 d에 나타낸 바와 같이 판정된다. 즉, 식별된 해당 가로 괘선 후보의 길이 L2와 동일의 영역에 있고, 또한 식별된 해당 가로 괘선의 상하의 폭 2H2(3H2 이상이라도 좋음)의 영역에 존재하는 화상 패턴이 다른 화상 패턴으로서 사용된다. 이렇게 해서, H1은 해당 가로 괘선의 폭(높이)이 된다. 따라서, 상측 및 하측의 L2×2H2의 2개의 영역이 화소 밀도의 검출에 사용된다.
또, 식별된 해당 괘선 후보가 세로 괘선인 경우에도 마찬가지로, 화소 밀도 판정 처리 수단(23)은 화소 밀도의 검출에 사용하는 영역을 정한다. 즉, 입력된 화상에서, 식별된 해당 세로 괘선의 길이와 동일의 영역에 있고, 또한 식별된 해당 세로 괘선의 상하의 정해진 범위에 존재하는 화상 패턴을 다른 화상 패턴으로서 사용한다.
이상으로부터 알 수 있는 바와 같이, 화소 밀도의 검출에 사용되는 영역의 크기는 식별된 해당 괘선 후보의 길이 및 폭에 의존하여 변동한다(비례한다). 다른 화상 패턴이 식별된 해당 괘선 후보의 길이에 의존하는 이유는 도24의 c에 나타낸 바와 같이 적어도 해당 영역에는 문자의 나머지 부분이 반드시 존재하기 때문이다. 또한, 식별된 해당 괘선 후보의 폭에 의존하는 이유는 괘선의 폭의 종류가 복수(예컨대, 1 dot의 가는선, 5 dot의 보통의 선, 10 dot의 굵은선) 존재하는 경우에서, 여러 가지의 괘선에 불명료함이 존재하여도, 확실히 괘선으로서 판정하기 때문이다.
이와 같이 정해진 영역에 대해서 화소 밀도가 산출된다. 화소 밀도의 산출에는 예컨대 주지의 화소 투영 처리가 사용된다. 또는 도14의 화소 밀도 변화 검출 처리(스텝 S51)와 같은 처리가 사용된다. 즉, (화소 밀도)=(해당 영역 내의 흑화소의 총수)/(해당 영역 내의 화소의 총수)이 된다. 흑화소는 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴을 구성하는 화소이다. 해당 영역 내의 흑화소 및 화소의 총수가 카운트된다.
도24의 c의 경우, 상측의 L1×2Hl의 영역의 화소 밀도는 낮지만, 하측의 L1×2Hl의 영역의 화소 밀도는 지극히 높다. 이 경우, 상측의 영역의 화소 밀도만을 사용하면 정확한 결과(주위 영역의 화소 밀도가 높다)가 얻어지지 않는다. 그래서, 상측 및 하측의 L2×2H2의 2개의 영역의 화소 밀도의 평균치가 화소 밀도 판정에 사용된다. 이 처리에 의해, 도24의 c의 경우, 2개의 L1×2Hl의 영역의 화소 밀도는 높은 것으로 된다. 도24의 d의 경우, 상측 및 하측의 L2×2H2의 2개의 영역의 화소 밀도가 함께 지극히 낮기 때문에, 그 평균치도 지극히 낮아진다.
화소 밀도의 고저를 검출하기 위한 임계치는 요철도의 검출의 임계치와 달리, 사전에 화소 밀도 판정 처리 수단(23)에 주어진다. 이 임계치의 값도, 경험적(또는 통계적, 실험적)으로 적절한 값으로 정해진다. 도24의 c의 경우의 2개의 Ll×2H1의 영역의 화소 밀도는 높다고 판정되고, 도24의 d의 경우의 L2×2H2의 2개의 영역의 화소 밀도는 낮다고 판정된다.
다음에, 화소 밀도의 판정 결과에 따라서, 제1 판정 처리가 행하여진다(스텝 S262-2). 이 처리의 대상이 되는 것은 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도라고 판정된 도24의 a 또는 c의 경우이다.
도24의 a에 나타낸 괘선 후보는 원래는 문자 선분 A의 일부이다. 따라서, 그 주위에는 문자 선분 A의 상이한 부분이 존재하기 때문에, 상술한 바와 같이, 식별된 해당 괘선 후보의 주위의 다른 화상 패턴의 화소 밀도는 높다. 주위의 화소 밀도가 높기 때문에, 해당 괘선 후보는 문자일 가능성이 높다. 따라서, 상당한 정도까지 요철도가 낮은(즉, 평활한) 괘선 후보만이 괘선으로서 남도록 할 필요가 있다. 그래서, 보다 낮은 값을 갖는 제1 임계치(21)가 사용된다. 괘선 후보로서 추출된 문자 선분 A의 요철도는 원래 높음에도 불구하고, 꽤 낮게 되어 있다. 보다 높은 값을 갖는 제2 임계치(22)를 사용한 경우, 문자 선분 A의 요철도가 제2 임계치(22)보다 작게 되는 결과, 문자 선분 A는 괘선이라고 판정될 우려가 있다. 이 경우, 제1 임계치(21)를 사용함으로써 문자 선분 A의 요철도는 제1 임계치(21)보다 크게 되는 결과, 괘선 후보 데이터(13A)에서 제외된다.
또, 제1 임계치(21)의 값을 지나치게 낮게 하는 것은 바람직하지 못하다. 예컨대, 괘선에 문자가 중첩하고 있는 경우도, 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도는 높다. 그러나, 도24의 a의 경우와 다른 이 괘선 후보는 괘선을 빠짐 없이 모든 괘선을 추출한다고 하는 관점에서, 괘선 후보로서 남길 필요가 있다. 그래서 제1 임계치(21)의 값은 괘선과 문자가 겹친 경우의 요철도보다는 높고, 문자만으로 이루어지는 괘선 후보의 요철도보다는 낮게 된다. 이 처리에 의해, 괘선과 문자가 겹친 괘선 후보는 괘선으로 검출되어, 괘선 후보 데이터(13A)에 남게 된다.
다음에, 화소 밀도의 판정 결과에 따라서, 제2 임계치를 사용한 제2 판정 처리가 행하여진다(스텝 S262-3). 이 처리의 대상이 되는 것은 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도가 낮다고 판정된 도24의 b 또는 d의 경우이다. 또, 이 제2 판정 처리와 제1 판정 처리(스텝 S262-2)는 어떤 것을 행하여도 좋다.
도24의 b에 나타낸 괘선 후보는 원래 직선 B의 일부이다. 따라서, 그 주위에는 직선 B의 상이한 부분이 존재할 가능성이 거의 없기 때문에, 상술한 바와 같이, 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도가 낮게 된다. 주위의 화소 밀도가 낮기 때문에, 해당 괘선 후보는 괘선일 가능성이 높다. 따라서, 상당한 정도까지 요철도가 높은(즉, 다소 요철 있음) 괘선 후보라도, 괘선으로서 남도록할 필요가 있다. 그래서, 보다 높은 값을 갖는 제2 임계치(22)가 사용된다. 괘선 후보로서 추출된 직선 B의 요철도는 원래 낮음에도 불구하고, 꽤 높게 되어있다. 그에 따라, 제1 임계치(21)를 선택한 경우, 직선 B의 요철도가 제1 임계치(21)보다 크게 되는 결과, 직선 B는 괘선이 아니라고 판정될 우려가 있다. 제2 임계치(22)를 사용함으로써 문자 선분 A의 요철도는 제2 임계치(22)보다 작게 되는 결과, 직선 B는 괘선이라고 판정된다. 즉, 해당 괘선은 괘선 후보 데이터(13A)에 남게 된다.
따라서, 입력 화상(11)이 부적절한 것에 기인하여, 괘선 후보로서 추출된, 문자 선분 A와 또한 같은 정도의 꽤 낮은 요철도를 갖는 직선 B에 대해서, 한쪽(문자 선분 A)은 괘선 후보 데이터(13A)에서 제외하고, 다른 쪽(직선 B)은 괘선 후보 데이터(13A)에 남길 수 있다. 이상과 같이, 본 발명의 표 화상 처리 장치에 의하면, 요철도에 의한 괘선 후보의 검출 처리를 실행함과 동시에, 문자의 직선 부분의 연속, 직선(괘선)의 흐트러짐 등이 있더라도, 괘선 후보를 정확히 검출할 수 있다.
다음에, 제2 처리로서, 괘선 폭 판정 처리 수단(24)에 의해 괘선 폭 판정 처리가 실행된다.
괘선 폭 판정 처리에서, 처음에 괘선 폭이 산출된다(스텝 S263-1). 괘선 폭 판정 처리에 사용되는 식별되는 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴은 다음과 같이 하여 구한다. 예컨대, 도25의 a에 나타낸 식별된 괘선 후보(135)의 다른 화상 패턴은 식별된 해당 괘선 후보(135)와 동일의 방향으로 연장된 해당 괘선 후보(135)에 인접된 상이한 괘선 후보(134 및 136), 또는 해당 괘선 후보(135)에 연결된 상이한 괘선 후보(133,134,136,137)이다. 해당 괘선 후보(135)로부터 완전히 독립한 괘선 후보(138) 등은 고려되지 않는다. 마찬가지로, 도26의 a에 나타낸 괘선 후보(141)의 다른 화상 패턴은 식별된 해당 괘선 후보(141)와 동일의 방향으로 연장되고, 식별된 해당 괘선 후보(141)에 인접된 괘선 후보(140 및 141), 또는 식별된 해당 괘선 후보(141)에 연결된 괘선 후보(139, 140,142,143)이다.
이렇게 하여 정해진 괘선 후보에 대해서 괘선 폭이 산출된다. 괘선 폭의 산출은 해당 괘선 후보인 사각형 영역의 장변 및 단변의 화소수를 카운트하여, 작은 쪽(단변, 즉, 폭)의 값을 채용함으로써 행하여진다. 이 처리에 의해, 도25의 a에 나타낸 괘선 후보(135)의 폭 Wl 및, 도26의 a에 나타낸 괘선 후보(141)의 폭 W3이 구해진다.
상술한 바와 같이, 통상, 다른 화상 패턴으로서 사용되는 괘선 후보는 복수 존재한다. 이 경우, 각각의 괘선 후보에 대해서 그 폭을 구하여, 그 평균치를 구하고, 이 평균치를 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴인 괘선 후보의 괘선 폭으로서 사용한다. 도25의 a에 나타낸 괘선 후보(135)의 경우, 괘선 후보(130,134,136,137)의 괘선 폭의 평균치가 사용된다. 이 값을 도25의 d에 나타낸 바와 같이, W2로 한다. 도26의 a에 나타낸 식별된 괘선 후보(141)의 경우, 상이한 괘선 후보(139,140,142,143)의 괘선 폭의 값이 사용된다. 이 값을 도26의 d에 나타낸 바와 같이, W4로 한다.
이렇게 하여 구한 다른 화상 패턴의 괘선 폭을 사용하여, 해당 괘선 후보의 식별된 괘선 폭이 넓은지 좁은지가 검출된다. 예컨대, 식별된 해당 괘선 후보의 폭이 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 폭의 3배 이상인 경우에, 해당 괘선 후보의 폭이 넓다고 하고, 식별된 해당 괘선 후보의 폭이 식별된 다른 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 폭의 1/3 이하인 경우에, 해당 괘선 후보의 폭이 좁다고 한다. 도25의 a에 나타낸 괘선 후보(135)의 경우, 괘선 후보(135)의 폭 Wl이 괘선 후보(133) 등의 괘선 폭의 평균치 W2의 3배 이상이기 때문에, 해당 괘선 후보(135)의 폭이 넓다고 판정된다. 도26의 a에 나타낸 괘선 후보(141)의 경우, 괘선 후보(141)의 폭 W3이 괘선 후보(139) 등의 괘선 폭의 평균치 W4의 1/3 이하이기 때문에, 해당 괘선 후보(141)의 폭이 좁다고 판정된다.
다음에, 괘선 폭의 검출 결과에 따라서, 제1 임계치를 사용한 제1 판정 처리가 행하여진다(스텝 S263-2). 이 처리의 대상이 되는 것은 괘선 후보의 폭이 식별된 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 괘선 폭보다 넓다고 판정된 도25의 경우이다.
도25의 a에 나타낸 괘선 후보의 굵은 부분(135)은 원래는 괘선의 중간에 존재하는 문자이다. 따라서, 그 화상 패턴 주위에 본래의 괘선이 존재하기 때문에, 상술한 바와 같이, 식별된 해당 굵은 괘선 후보(135)의 주위에 존재하는 다른 화상 패턴의 폭은 해당 굵은 괘선 후보(135)보다도 가늘게 된다. 다른 화상 패턴의 폭이 가늘기 때문에, 해당 괘선 후보(135)는 찌그러진 문자일 가능성이 높다. 따라서, 상당한 정도까지 낮은 요철도(즉, 평활함)를 갖는 괘선 후보만이 괘선으로서 남도록 할 필요가 있다. 그래서, 보다 낮은 값을 갖는 제1 임계치(21)가 사용된다. 괘선 후보(135)로서 추출된 문자의 요철도는 원래 높음에도 불구하고, 꽤 낮게 되어 있다. 보다 높은 값을 갖는 제2 임계치(22)를 사용한 경우, 굵은 괘선 후보(문자)(135)의 요철도가 제2 임계치(22)보다 작게 되는 결과, 굵은 괘선 후보(135)가 괘선이라고 판정될 우려가 있다. 제1 임계치(21)를 사용함으로써 굵은 괘선 후보(135)의 요철도는 제1 임계치(21)보다 크게 되는 결과, 굵은 괘선 후보(135)는 괘선 이외의 화상 패턴이라고 판정되어, 괘선 후보 데이터(13A)에서 제외된다.
다음에, 괘선 폭의 판정 결과에 따라서, 제2 판정 처리가 행하여진다(스텝 S262-3). 이 처리의 대상이 되는 것은 식별된 괘선 후보의 폭이 해당 괘선 후보의 주위에 존재하는 다른 화상 패턴의 괘선 폭보다 좁다고 판정된 도26의 경우이다. 또, 이 제2 판정 처리와 제1 판정 처리(스텝 S263-2)는 어떤 것을 먼저 행하여도 좋다.
도26의 a에 나타낸 괘선 후보의 가는 부분(141)은 불명료함이 있지만, 원래는 괘선이다. 따라서, 그 주위에 본래의 괘선이 존재하기 때문에, 해당하는 식별된 가는 괘선 후보(141)의 주위에 존재하는 다른 화상 패턴의 폭은 해당하는 식별된 가는 괘선 후보(141)보다도 굵게 된다. 다른 화상 패턴의 폭이 굵기 때문에, 식별된 해당 괘선 후보(141)는 긁혀서 가늘게 된 괘선일 가능성이 높다. 따라서, 상당한 정도까지 요철도가 높은(즉, 다소의 요철을 가짐) 괘선 후보라도, 괘선으로서 남도록 할 필요가 있다. 그래서, 보다 높은 값을 갖는 제2 임계치(22)가 사용된다. 괘선 후보(141)로서 추출된 가는 괘선의 요철도는 원래 낮음에도 불구하고, 높게 되어 있다. 보다 낮은 값을 갖는 제1 임계치(21)를 사용한 경우, 가는 괘선 후보(141)의 요철도가 제1 임계치(21)보다 크게 되는 결과, 가는 괘선 후보(141)가 괘선 이외의 화상 패턴(문자)이라고 판정될 우려가 있다. 제2 임계치(22)를 사용함으로써 가는 괘선 후보(141)의 요철도는 제2 임계치(22)보다 작아지는 결과, 괘선이라고 판정된다. 즉, 괘선 후보에 남게 된다.
따라서, 입력 화상(11)이 부적절한 것에 기인하여, 괘선 후보로서 추출된 굵은 괘선 후보(135)는 괘선 후보 데이터(13A)에서 제외하고, 가는 괘선 후보(141)는 괘선 후보 데이터(13A)에 남길 수 있다. 이상과 같이, 본 발명의 표 화상 처리 장치에 의하면, 요철도에 의한 괘선 후보의 검출 처리를 행함과 동시에, 문자의 찌그러짐, 괘선의 불명료함 등이 있더라도, 괘선 후보를 정확히 검출 처리할 수 있다.
이상의 처리의 결과, 괘선 후보 데이터(13A)에서 괘선일 가능성이 낮은 괘선 후보가 제거되어, 괘선일 가능성이 높은 괘선 후보가 남게 된 괘선 데이터, 즉, 직선 데이터(12)가 추출된다.
이상, 본 발명의 다른 실시 형태에 대해서 설명하였지만, 본 발명은 그 요지의 범위 내에서 여러 가지의 변형이 가능하다.
예컨대, 표 화상 처리 장치(100)는 제1 실시예의 표 화상 처리 장치(100)와 적당히 조합한 구성으로 하여도 좋다. 즉, 표 화상 처리 장치(100)는 직선 추출 수단(2), 둥근 모서리 후보 영역 검출 수단(3), 셀 추출 수단(4), 둥근 모서리 부분 결정 수단(5) 및 문자 인식 영역 검출 수단(6)으로 이루어지는 것으로 하여도 좋다. 또한, 표 화상 처리 장치는 간단한 구성의 표 화상 처리 장치(100)로서 설명한 본 발명의 제1 실시예와 제2 실시예를 조합한 구성으로 하여도 좋다. 더욱, 제1 실시예의 표 화상 처리 장치(100)는 둥근 모서리 후보 영역 검출 수단(3) 및 둥근 모서리 부분 결정 수단(5)을 생략한 본 발명의 제1 실시예와 제2 실시예를 조합한 구성으로 하여도 좋다. 즉, 표 화상 처리 장치(100)가 직선 추출 수단(2), 셀 추출 수단(4), 문자 인식 영역 검출 수단(6)으로 이루어지는 것이어도 좋다.
이상 설명한 바와 같이, 본 발명에 의한 표 화상 처리 장치는, 추출한 직선의 종단으로부터 시작하는 경사 성분을 추출하여, 추출한 경사 성분을 사용한 소정의 처리에 의해 둥근 모서리 후보 영역을 포함하는 셀의 둥근 모서리에 대해서 둥근 모서리 부분을 판정함으로써 괘선에 문자가 접촉하는 부분이라든지 화상이 불명료한 부분을 둥근 모서리 부분인 것으로 인식하는 것을 방지할 수 있고, 괘선의 불명료함, 문자의 둥근 부분, 괘선과 문자와의 접촉 등이 있더라도 모서리 부분을 정확히 처리할 수 있게 되어, 이 결과, 표 형식의 인식 및 셀(문자 인식 영역)의 추출을 안정하게 할 수 있다.
본 발명에 의하면, 표 화상 처리 장치를 컴퓨터에서 실현시키는 프로그램을 저장한 프로그램 기억 매체를 제공할 수 있으므로, 둥근 모서리 부분을 포함하는 괘선 구조의 인식 및 셀(문자 인식 영역)의 추출을 안정하게 행하는 표 화상 처리 장치를 용이하게 제공할 수 있다.
또한 본 발명에 의한 표 화상 처리 장치에 있어서, 식별된 괘선 후보 주위에 존재하는 다른 화상 패턴에 따라서 제l 또는 제2 임계치 중 어느 하나를 사용하여 식별된 해당 괘선 후보의 요철도를 검출함으로써 예컨데 주위의 요철도가 높은 경우에는, 보다 낮은 값의 임계치(예컨대, 제1 임계치)를 사용함으로써 원래 보다도 낮게 된 요철도를 갖는 괘선 후보를 후보로부터 제외할 수 있다. 반대로, 식별된 괘선 후보 주위의 요철도가 낮은 경우에는, 보다 높은 값의 임계치(예컨대, 제2 임계치)를 사용함으로써 원래 보다도 높은 요철도를 갖는 괘선 후보를 후보로 남길 수 있기 때문에, 괘선인지 또는 그 이외의 패턴인지의 검출이 불가능한 경우를 현저히 낮출 수 있어, 정확히 괘선을 추출할 수 있다.
본 발명에 의하면, 표 화상 처리 장치를 컴퓨터에서 실현시키는 프로그램을 저장한 프로그램 기억 매체를 제공할 수 있으므로, 괘선의 판정을 정확히 하는 표 화상 처리 장치를 제공할 수 있다.
본 발명의 상술한 많은 특징 및 장점은 상세한 명세서로부터 명백하므로, 본 발명의 정신과 범위 내의 그러한 모든 특징 및 장점을 첨부된 청구범위에 의해 보호한다. 또한 본 기술 분야에서 숙련자는 수많은 수정 변경을 할 수 있으므로, 본 발명을 지금까지 개시하고 도해한 구성과 작용만으로 제한하지 않을 것이며 모든 적합한 수정 및 등가물은 본 발명의 범위내에 속하는 것으로 한다.

Claims (36)

  1. 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 수단과,
    상기 직선 추출 수단에 의해 검출한 직선의 종단으로부터 시작하는 경사선을 추출하고, 상기 경사선에 의거하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 수단과,
    상기 둥근 모서리 후보 영역 검출 수단에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 검출하는 셀 추출 수단과,
    상기 셀 추출 수단에 의해 검출한 셀에 의거하여 둥근 모서리 부분을 결정하는 둥근 모서리 부분 결정 수단을 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  2. 제1항에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 직선 추출 수단에 의해 검출한 직선 내에서, 세로 방향의 직선의 종단으로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 종단으로부터 시작하는 제2 경사 성분을 추출함으로써 경사 성분을 추출하는
    것을 특징으로 하는 표 화상 처리 장치.
  3. 제2항에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 제1 및 제2 경사 성분이 서로 중첩하는 경우에, 상기 제1 및 제2 경사 성분을 둥근 모서리 후보 영역인 것으로 검출하는
    것을 특징으로 하는 표 화상 처리 장치.
  4. 제2항에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 제1 및 제2 경사 성분이 서로 사전에 정해진 거리 내에 있고, 또한 상기 양자 간에 직선의 특징을 나타내는 패턴이 있거나 또는 양자가 서로 접촉 또는 중첩하고 있는 경우에, 상기 제1 및 제2 경사 성분을 둥근 모서리 후보 영역인 것으로 검출하는
    것을 특징으로 하는 표 화상 처리 장치.
  5. 제2항에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 경사 성분의 근처에 다른 경사 성분이 존재하지 않고, 또한 상기 식별된 경사 성분의 선단(先端)에 직선의 특징을 나타내는 패턴이 있는 경우에, 상기 경사 성분을 둥근 모서리 후보 영역인 것으로 검출하는
    것을 특징으로 하는 표 화상 처리 장치.
  6. 제1항에 있어서,
    상기 둥근 모서리 부분 결정 수단은 상기 셀 추출 수단에 의해 추출한 상기 셀의 모서리에서 화소 밀도가 정해진 순서로 변화하는 경우에, 상기 셀의 모서리 부분을 둥근 모서리 부분인 것으로 결정하는
    것을 특징으로 하는 표 화상 처리 장치.
  7. 제1항에 있어서,
    상기 둥근 모서리 부분 결정 수단은 상기 입력된 화상에서의 화소 밀도의 변화에 의거하여 결정된 둥근 모서리 부분이 존재하는 경우에, 상기 입력된 화상의 다른 모서리 부분을 둥근 모서리 부분인 것으로 함으로써, 상기 둥근 모서리 부분을 결정하는
    것을 특징으로 하는 표 화상 처리 장치.
  8. 제1항에 있어서,
    상기 둥근 모서리 부분 결정 수단은 상기 셀을 구성하는 상기 직선 추출 수단에 의해 추출한 직선의 종단점과 종단점을 연결하도록 생성된 n차 함수로 이루어진 패턴과 상기 입력된 화상의 일부와 정합하는 경우에, 상기 정합 부분을 둥근 모서리 부분인 것으로 결정하는
    것을 특징으로 하는 표 화상 처리 장치.
  9. 제1항에 있어서,
    괘선을 포함하는 시트의 화상을 입력하기 위한 화상 입력 수단과,
    상기 둥근 모서리 부분 결정 수단에 의해서 결정된 둥근 모서리 부분을 포함하는 셀에서 상기 결정된 둥근 모서리 부분을 문자 영역으로부터 제외함으로써, 문자 인식 영역을 검출하는 문자 인식 영역 검출 수단을 더 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  10. 둥근 모서리 후보 영역 검출 수단을 구비한 표 화상 처리 장치에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은
    입력된 화상에서 추출된 세로 및 가로 방향의 직선으로부터, 세로 방향의 직선의 종단으로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 종단으로부터 시작하는 제2 경사 성분을 개별적으로 추출하고, 상기 제1 및 제2 경사 성분이 서로 중첩하는 경우, 상기 제1 및 제2 경사 성분을 둥근 모서리 후보 영역인 것으로 검출하는
    것을 특징으로 하는 표 화상 처리 장치.
  11. 둥근 모서리 후보 영역 검출 수단을 구비한 표 화상 처리 장치에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은
    입력된 화상에서 추출된 세로 및 가로 방향의 직선으로부터, 세로 방향의 직선의 종단으로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 종단으로부터 시작하는 제2 경사 성분을 별개로 추출하고, 상기 제1 및 제2 경사 성분이 서로 사전에 정해진 거리 내에 있고, 또한 양자 간에 직선의 특징을 나타내는 패턴이 있거나, 또는 양자가 서로 접촉 또는 중첩하고 있는 경우, 상기 제1 및 제2 경상 성분을 둥근 모서리 후보 영역인 것으로 검출하는
    것을 특징으로 하는 표 화상 처리 장치.
  12. 둥근 모서리 후보 영역 검출 수단을 구비한 표 화상 처리 장치에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은
    입력된 화상에서 추출된 세로 및 가로 방향의 직선으로부터, 세로 방향의 직선의 종단으로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 종단으로부터 시작하는 제2 경사 성분을 추출하고, 상기 식별된 경사 성분의 근처에 다른 경사 성분이 존재하지 않고 또한 상기 식별된 경사 성분의 선단(先端)에 직선의 특징을 나타내는 패턴이 있는 경우, 상기 경사 성분을 둥근 모서리 후보 영역인 것으로 검출하는
    것을 특징으로 하는 표 화상 처리 장치.
  13. 둥근 모서리 부분 결정 수단을 구비한 표 화상 처리 장치에 있어서,
    상기 둥근 모서리 부분 결정 수단은
    입력된 화상에서 추출된 세로 및 가로 방향의 직선으로부터 추출된 셀에 대해서, 상기 셀의 모서리 부분에서 화소 밀도가 사전에 정해진 순서로 변화하는 경우에, 상기 셀의 모서리 부분을 둥근 모서리 부분인 것으로 결정하는
    것을 특징으로 하는 표 화상 처리 장치.
  14. 둥근 모서리 부분 결정 수단을 구비한 표 화상 처리 장치에 있어서,
    상기 둥근 모서리 부분 결정 수단은
    입력된 화상에서 추출된 세로 및 가로 방향의 직선으로부터 추출된 셀에 대해서, 상기 입력된 화상에서의 화소 밀도의 변화에 의거하여 결정된 둥근 모서리 부분이 존재하는 경우에, 다른 모서리 부분이 둥근 모서리 부분인 것으로 결정하는
    것을 특징으로 하는 표 화상 처리 장치.
  15. 둥근 모서리 부분 결정 수단을 구비한 표 화상 처리 장치에 있어서,
    상기 둥근 모서리 부분 결정 수단은
    입력된 화상에서 추출된 세로 및 가로 방향의 직선으로부터 추출된 셀에 대해서, 상기 셀 내의 상기 직선 간에 생성된 n차 함수의 패턴이 둥근 모서리 후보 영역을 포함하는 모서리에서 입력된 화상의 일부와 정합하는 경우에, 상기 정합하는 부분을 둥근 모서리 부분인 것으로 결정하는
    것을 특징으로 하는 표 화상 처리 장치.
  16. 컴퓨터내에서 표 화상 처리 장치를 실행하는 프로그램을 저장하는 기억 매체에 있어서,
    상기 프로그램은
    입력된 화상에서 세로 및 가로 방향의 직선을 추출하는 직선 추출 처리와,
    상기 직선 추출 처리에 의해 추출한 직선의 종단에서 시작하는 경사선을 추출하여, 상기 추출한 경사선을 사용하여 소정의 처리에 의해 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 처리와,
    상기 둥근 모서리 후보 영역 검출 처리에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출 처리와,
    상기 셀 추출 처리에 의해 추출한 셀의 모서리에 대해서 소정의 처리에 의해 둥근 모서리 부분을 판정하는 둥근 모서리 판정 처리를 실행하는 프로그램인
    것을 특징으로 하는 프로그램 기억 매체.
  17. 괘선 판정 처리 수단을 구비한 표 화상 처리 장치에 있어서,
    상기 괘선 판정 처리 수단은
    입력된 화상에서 추출된 세로 및 가로 방향의 괘선 후보에서, 상기 식별된 괘선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용하여 구한 상기 괘선 후보의 요철도에 의거하여, 상기 괘선 후보가 괘선인가 아닌가를 판정하는 괘선 판정 처리 수단을 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  18. 제17항에 있어서,
    상기 괘선 판정 처리 수단은 사전에 정해진 제1 임계치와 상기 제1 임계치보다도 높은 사전에 정해진 제2 임계치 중 어느 하나를 사용함으로써 상기 괘선 후보의 요철도에 의거하여 상기 괘선 후보가 괘선인가 아닌가를 판정하는 화소 밀도 판정 처리 수단을 구비하고,
    상기 화소 밀도 판정 처리 수단이 상기 식별된 괘선 후보의 주위에 존재하는 화상 패턴의 화소 밀도에 응해서, 상기 식별된 괘선 후보 이외의 화상 패턴의 화소 밀도가 높을 경우에 상기 제1 임계치를 사용하고, 상기 식별된 괘선 후보 이외의 화상 패턴의 화소 밀도가 낮을 경우에 상기 제2 임계치를 사용하는
    것을 특징으로 하는 표 화상 처리 장치.
  19. 제18항에 있어서,
    상기 괘선 판정 처리 수단은
    상기 괘선 후보가 세로 직선인 경우, 정해진 범위의 상기 괘선 후보의 좌우에 존재하는 상기 괘선의 후보와 동일한 길이의 화상 패턴을 상기 괘선 후보의 주위에 존재하는 화상 패턴으로서 사용하고,
    상기 괘선 후보가 세로 직선인 경우, 정해진 범위의 상기 괘선 후보의 상하에 존재하는 상기 괘선의 후보와 동일한 길이의 화상 패턴을 상기 식별된 괘선 후보의 주위에 존재하는 화상 패턴으로서 사용하는
    것을 특징으로 하는 표 화상 처리 장치.
  20. 제17항에 있어서,
    상기 괘선 판정 처리 수단은
    사전에 정해진 제1 임계치 또는 상기 제1 임계치보다도 높은 사전에 정해진 제2 임계치 중 어느 하나에 의해 구한 요철도(roughness)에 의거하여 상기 괘선 후보가 괘선인가 아닌가를 검출하는 괘선 폭 판정 처리 수단을 구비하고,
    상기 괘선 폭 판정 처리 수단은 상기 괘선 후보의 주위에 존재하는 화상 패턴의 폭에 대응해서, 상기 화상 패턴의 폭이 넓은 경우에 상기 제1 임계치를 사용하고, 상기 다른 화상 패턴의 폭이 좁은 경우에 상기 제2 임계치를 사용하는
    것을 특징으로 하는 표 화상 처리 장치.
  21. 제20항에 있어서,
    상기 괘선 폭 판정 처리 수단은
    상기 식별된 괘선 후보와 동일의 방향으로 연장되어, 상기 식별된 괘선 후보에 인접 또는 접속된 괘선 후보를 상기 식별된 괘선 후보의 주위에 존재하는 화상 패턴으로서 사용하는
    것을 특징으로 하는 표 화상 처리 장치.
  22. 제20항에 있어서,
    상기 괘선 폭 판정 처리 수단은
    상기 괘선 후보의 폭이 상기 식별된 괘선 후보의 주위에 존재하는 화상 패턴의 폭의 n 배 이상인 경우에, 상기 괘선 후보의 폭이 넓다고 판정하고,
    상기 괘선 후보의 폭이 괘선 후보 주위에 존재하는 화상 패턴의 폭의 1/n 이하인 경우에, 상기 괘선 후보의 폭이 좁다고 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  23. 제17항에 있어서,
    입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 수단과,
    상기 세로 및 가로 방향의 직선을 사용하여 셀을 추출하는 셀 추출 수단과,
    문자 인식 영역을 판정하는 문자 인식 영역 판정 수단을 더 구비하고,
    상기 직선 추출 수단은 상기 괘선 후보 검출 수단을 포함하고,
    상기 괘선 검출 수단은 상기 직선 추출 수단으로부터 추출한 상기 세로 및 가로 방향의 직선을 상기 괘선 후보로서 사용하여, 상기 괘선 후보가 괘선인가 아닌가를 판정하고,
    상기 셀 추출 수단은 상기 괘선 판정 수단에 의한 판정의 결과에 의거하여, 상기 셀을 추출하는
    것을 특징으로 하는 표 화상 처리 장치.
  24. 제17항에 있어서,
    입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 수단과,
    상기 직선 추출 수단에 의해 추출한 직선의 종단에서 경사 성분을 추출하고, 상기 추출한 경사 성분을 사용하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 수단과,
    상기 둥근 모서리 후보 영역 검출 수단을 사용하여 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출 수단과,
    상기 셀 추출 수단에 의해 추출한 셀의 모서리에 대해서 둥근 모서리의 판정을 처리하는 둥근 모서리 판정 수단과,
    둥근 모서리 부분을 포함하는 셀 내에서, 상기 둥근 모서리 판정 수단에 의해 판정된 둥근 모서리 부분을 제외함으로써 상기 문자 인식 영역을 검출하는 문자 인식 영역 판정 수단을 구비하고,
    상기 직선 추출 수단은 상기 괘선 후보 검출 수단을 포함하고,
    상기 괘선 검출 수단은 상기 직선 추출 수단에 의해 추출한 상기 세로 및 가로 방향의 직선을 상기 괘선 후보로서 사용하여, 상기 괘선 후보가 괘선인가 아닌가를 판정하고,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 괘선 검출 수단에 의해 구한 직선을 사용하여 경사 성분을 추출하고,
    상기 셀 추출 수단은 상기 괘선 검출 수단에 의해 검출한 결과에 의거하여, 상기 셀을 추출하는
    것을 특징으로 하는 표 화상 처리 장치.
  25. 컴퓨터내에서 표 화상 처리 장치를 실행하는 프로그램을 저장하는 기억 매체에 있어서,
    상기 프로그램은
    입력된 화상에서 추출된 세로 및 가로 방향의 직선의 괘선 후보에서, 상기 식별한 괘선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 복수의 임계치 중 어느 하나를 사용함으로써, 상기 괘선 후보의 요철도에 의거하여 상기 괘선 후보가 괘선인가 아닌가를 검출하는 괘선 검출 처리를 실행시키는 프로그램인
    것을 특징으로 하는 프로그램을 저장하는 기억 매체.
  26. 입력 화상으로부터 세로 및 가로 방향의 직선을 추출하고,
    상기 직선 추출 처리에 의해 검출한 직선의 종단에서 시작하는 경사선을 추출하여, 상기 경사선에 의거하여 둥근 모서리 후보 영역을 검출하고,
    상기 둥근 모서리 후보 영역을 포함하는 셀을 추출하고,
    상기 셀의 둥근 모서리 부분을 검출하는
    처리를 포함하는 것을 특징으로 하는 표 화상 처리 방법.
  27. 입력된 화상에서 추출된 세로 및 가로 방향의 직선의 괘선 후보에서, 상기 식별된 괘선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용함으로써 상기 괘선 후보의 요철도에 의거하여 상기 괘선 후보가 괘선인가 아닌가를 검출하는 괘선 거출 처리를 포함하는
    것을 특징으로 하는 괘선 검출을 위한 표 화상 처리 방법.
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
KR1019990050770A 1998-12-16 1999-11-16 표 화상 처리 장치, 그 처리 프로그램을 저장하는 기억 매체 및 표 관리 처리 방법 KR100657385B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP35702398 1998-12-16
JP98-357023 1998-12-16
JP99-49502 1999-02-26

Publications (2)

Publication Number Publication Date
KR20000047655A KR20000047655A (ko) 2000-07-25
KR100657385B1 true KR100657385B1 (ko) 2006-12-19

Family

ID=18451988

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990050770A KR100657385B1 (ko) 1998-12-16 1999-11-16 표 화상 처리 장치, 그 처리 프로그램을 저장하는 기억 매체 및 표 관리 처리 방법

Country Status (2)

Country Link
JP (1) JP3947173B2 (ko)
KR (1) KR100657385B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4683324B2 (ja) * 2005-02-03 2011-05-18 日立金属株式会社 形状測定システム、形状測定方法及び形状測定プログラム
JP5262778B2 (ja) 2009-02-05 2013-08-14 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP5505182B2 (ja) * 2010-08-09 2014-05-28 富士ゼロックス株式会社 画像判定装置及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630309A (en) 1983-07-04 1986-12-16 Urw Unternehmensberatung Karow Rubow Weber Gmbh Method and apparatus for automatic digitizing of contour lines
US4987603A (en) 1988-09-22 1991-01-22 Glory Kogyo Kabushiki Kaisha Recognition method for letter patterns
JPH04291478A (ja) * 1991-03-19 1992-10-15 Ricoh Co Ltd 罫線認識方法及び表処理方法
US5293579A (en) 1992-02-18 1994-03-08 Ray Dream, Inc. Method and apparatus for smoothing jagged edges in a graphics display
KR960002054A (ko) * 1994-06-18 1996-01-26 김광호 2차원 그래픽 라운드 묘화 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630309A (en) 1983-07-04 1986-12-16 Urw Unternehmensberatung Karow Rubow Weber Gmbh Method and apparatus for automatic digitizing of contour lines
US4987603A (en) 1988-09-22 1991-01-22 Glory Kogyo Kabushiki Kaisha Recognition method for letter patterns
JPH04291478A (ja) * 1991-03-19 1992-10-15 Ricoh Co Ltd 罫線認識方法及び表処理方法
US5293579A (en) 1992-02-18 1994-03-08 Ray Dream, Inc. Method and apparatus for smoothing jagged edges in a graphics display
KR960002054A (ko) * 1994-06-18 1996-01-26 김광호 2차원 그래픽 라운드 묘화 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
EPO조사보고서

Also Published As

Publication number Publication date
JP3947173B2 (ja) 2007-07-18
KR20000047655A (ko) 2000-07-25
JP2004158041A (ja) 2004-06-03

Similar Documents

Publication Publication Date Title
US5517578A (en) Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
JP3574584B2 (ja) 表画像処理装置及びそのプログラム記憶媒体
US6754385B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP2933801B2 (ja) 文字の切り出し方法及びその装置
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3411472B2 (ja) パターン抽出装置
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
KR100657385B1 (ko) 표 화상 처리 장치, 그 처리 프로그램을 저장하는 기억 매체 및 표 관리 처리 방법
US6532303B2 (en) Line direction deciding device, image inclination detecting device and image inclination correcting device
US8989485B2 (en) Detecting a junction in a text line of CJK characters
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
EP0206829A2 (en) Character input apparatus
JP2899383B2 (ja) 文字切出し装置
JP3406942B2 (ja) 画像処理装置及び方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2003317107A (ja) 罫線抽出方法及び装置
JP3100825B2 (ja) 線認識方法
JP2888885B2 (ja) 文字切出し装置
JP2715930B2 (ja) 線分検出方法
JPH0628520A (ja) 文字認識装置
CN113673200A (zh) 文本显示方法和文本显示装置
JPH06223224A (ja) 行切出し方法
JPH05114048A (ja) 文字認識方法及びその装置
JP2000339404A (ja) 文書認識装置と文書認識方法
JPH0991378A (ja) 文字認識方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111118

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20121121

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee