KR20000047655A - 표 화상 처리 장치 및 그 프로그램 기억 매체 - Google Patents

표 화상 처리 장치 및 그 프로그램 기억 매체 Download PDF

Info

Publication number
KR20000047655A
KR20000047655A KR1019990050770A KR19990050770A KR20000047655A KR 20000047655 A KR20000047655 A KR 20000047655A KR 1019990050770 A KR1019990050770 A KR 1019990050770A KR 19990050770 A KR19990050770 A KR 19990050770A KR 20000047655 A KR20000047655 A KR 20000047655A
Authority
KR
South Korea
Prior art keywords
rounded corner
candidate
straight line
extracted
gangster
Prior art date
Application number
KR1019990050770A
Other languages
English (en)
Other versions
KR100657385B1 (ko
Inventor
오오하라아쓰꼬
나오이사또시
Original Assignee
아끼구사 나오유끼
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아끼구사 나오유끼, 후지쯔 가부시끼가이샤 filed Critical 아끼구사 나오유끼
Publication of KR20000047655A publication Critical patent/KR20000047655A/ko
Application granted granted Critical
Publication of KR100657385B1 publication Critical patent/KR100657385B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/28Indexing scheme for image data processing or generation, in general involving image processing hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 표 화상 처리 장치 및 그 프로그램 기억 매체에 관한 것이다.
표 화상 처리 장치는 모서리를 갖는 표 화상을 정확히 처리하며 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출부와, 직선 추출부에 의해 검출한 직선을 기점으로 하는 경사 성분을 추출하여, 추출한 경사 성분을 사용하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 수단과, 모서리 후보 영역 검출 수단에 의해 검출한 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출부와, 셀 추출부에 의해 추출한 셀의 둥근 모서리에 대해서 둥근 모서리를 판정하는 처리를 실행하는 둥근 모서리 판정부를 구비한다.

Description

표 화상 처리 장치 및 그 프로그램 기억 매체{DEVICE PROCESSING A TABLE IMAGE, A MEMORY MEDIUM STORING A PROCESSING PROGRAM, AND A TABLE MANAGEMENT PROCESSING METHOD}
본 발명은 표 화상 처리 장치 및 그 처리 프로그램 기억 매체에 관한 것이며, 특히, 둥근 모서리를 갖는 표 화상을 정확히 처리하여, 괴선 후보가 괴선인가 아닌가를 정확히 판정할 수 있는 표 화상 처리 장치 및 그 처리 프로그램 기억 매체에 관한 것이다.
컴퓨터의 입력 장치로서 문자 인식 장치 또는 광학 문자 인식 장치(OCR)가 많이 사용되고 있다. 문자 인식 장치에는, 장표와 같은 사전에 문자를 기입할 위치를 지정한 문서의 지정된 영역에 내에 문자가 깨끗하게 쓰여 있는 경우, 꽤 높은 인식률로 문자를 인식할 수 있다. 또, 여기서 말하는 문서는 테두리 등의 괴선의 빛깔 및 농도가 드롭 아웃 컬러(drop out colour)가 아니고, 흑 등의 문자와 동일의 빛깔 및 농도인 것이다.
그러나, 쓰여진 문자가 조금이라도 지정한 영역을 넘으면, 현저히 인식률이 저하한다. 예컨대, 문자가 지정 영역을 나타내는 테두리(또는 괴선)에 접촉하거나 또는 해당 영역으로부터 밀려 나온 경우이다.
그래서, 위치라든지 형식 등을 모르는 장표일지라도, 표 형식 테두리를 정확히 추출할 수 있고, 문자와 테두리가 접촉하거나 문자가 테두리로부터 삐져나오는 경우라도 문자 영역을 정확히 추출할 수 있는 기술이 개발되어 있다.
여러 가지 종류의 장표 중에서 직교하는 2개의 직선으로 이루어지는 직각 모서리가 아닌, 원호와 같은 둥근 곡선으로 이루어지는 둥근 모서리(이하, 둥근 모서리 또는 둥근 모서리부라 함)를 갖는 표 구조의 장표가 존재한다. 둥근 모서리 표 구조의 일례를 도19a 및 19b에 나타낸다. 이 형식의 장표가 현재 널리 사용되고 있다. 이 때문에, 문자 인식 장치 등의 표 화상 처리 장치에서는 모서리를 인식할 수 없으면, 장표의 처리에 지장이 생긴다. 따라서, 표 형식의 둥근 모서리를 갖는 장표를 정확하게 처리하기 위한 여러 가지의 제안이 있다.
예컨대, 세로의 괴선 및 가로의 괴선 또는 세로 및 가로 괴선을 추출한 뒤, 세로 가로 괴선이 서로 교차하지 않고 어느 일정 이하의 간격에 위치하고 있는 경우에, 해당 부분을 둥근 모서리인 것으로 인식하는 기술이 제안되어 있다(예컨대, 특개평7-282191호 공보 참조). 그러나, 이 기술에 의하면 첫째로, 화상이 긁힌 경우에 둥근 모서리를 정확히 처리할 수 없는 가능성이 높다. 특히, 해당 모서리의 부분이 긁혀버린 경우에는 정확하게 처리할 수 없다. 둘째로, 이 기술을 적용하는 전제로서 세로 방향 및 가로 방향의 괴선을 쌍방 공히 추출할 수 있어야 된다. 따라서, 이 기술은 도19a에 나타내는 형식의 장표에는 적용할 수 있지만, 도19b에 나타내는 세로 방향의 괴선이 처음부터 존재하지 않는 형식의 장표에는 적용할 수 없다.
또한, 세로 가로 괴선을 추출한 뒤, 세로 가로 괴선이 서로 교차하지 않고 어느 일정 이하 간격에 위치하고 있는 경우에, 해당 부분과 사전에 준비한 패턴과의 정합(matching) 패턴을 구함으로써 모서리(둥근 모서리)의 형상을 판단하는 기술이 제안되어 있다(예컨대, 일특개평7-14000호 공보 참조). 그러나, 이 기술에 의하면 첫째로, 사전에 다수의 정합 패턴을 준비할 필요가 있어, 메모리 용량이 지극히 커진다. 둘째로, 이 기술도 전제로서 세로 방향 및 가로 방향의 괴선을 쌍방 공히 추출할 수 있어야 되므로, 도19a에 나타내는 장표에는 적용할 수 있지만, 세로 괴선이 본래 존재하지 않는 도19b에 나타내는 장표에는 적용할 수 없다.
또, 세로 가로 괴선을 추출한 뒤, 사방을 괴선으로 둘러싸인 영역 또는 셀을 추출하고, 해당 셀의 안쪽의 윤곽을 검출하고, 검출 방향의 변화에 의해서 모서리가 둥근 모서리인가 아닌가를 판단하는 기술이 제안되어 있다(예컨대, 일특개평8-212292호 공보 참조). 그러나, 이 기술에 의하면 첫째로, 괴선에 문자가 접촉하고 있는 경우에, 해당 문자의 부분에서 검출 방향이 변화하여 둥근 모서리인 것으로 오인되기 때문에, 정확히 처리할 수 없다. 특히, 문자와 괴선이 접촉하는 경우가 많기 때문에, 이 오인을 현실에서는 무시할 수 없다. 둘째로, 화상이 긁힌 경우에, 해당 긁힌(불명료) 부분에서 검출 방향이 변화하여 둥근 모서리인 것으로 오인되기 때문에, 정확히 처리할 수 없다. 즉, 원래 직선인 괴선이 긁힘 등에 의해 명확하지 않을 경우, 해당 불명료 부분에서 180。 검출 방향이 변화하기 때문에, 둥근 모서리인 것으로 오인된다. 또한, 이 기술에 의하면 점선으로 이루어지는 괴선은 추출할 수 없다.
이상과 같이, 종래의 문자 인식 장치 등의 표 화상 처리 장치에서는 둥근 모서리 부분의 인식 처리의 중요성이 충분히 인식되어 있으면서도, 괴선의 긁힘, 문자의 둥근 부분의 존재, 괴선과 문자의 접촉 등에 의해 둥근 모서리를 정확히 처리할 수 없었다.
한편, 이상과는 별도로, 여러 가지의 괴선 추출 처리의 결과로서 얻어진 괴선의 후보로부터, 더욱 괴선일 가능성이 낮은 것을 판정하여, 해당 괴선 후보로부터 제외하는 것이 행하여진다. 즉, 문자와 테두리가 접촉하거나 문자가 삐져나오는 경우라도, 괴선을 정확히 추출하기 위한 여러 가지의 제안이 되어 있다.
예컨대, 상기 판정을 위해 추출된 괴선 후보의 화상 패턴에 대해서 검출 처리를 실행함으로써 화상 패턴의 요철도(어느 영역 내의 화상 패턴의 요철의 정도)를 산출하여, 해당 요철도가 어느 일정한 값(소정치) 이상이면 괴선 이외의 패턴(즉, 문자)인 것으로 하고, 일정한 값 이하이면 괴선인 것으로 하는 요철도에 의한 괴선 판정 기술이 제안되어 있다(예컨대, 일특개평10-334185호 공보 참조). 이것은 문자의 화상 패턴의 요철도가 크고, 괴선의 화상 패턴의 요철도가 작다는 것에 근거하는 것이다. 그러나, 이 기술에 의하면 사전에 정해진 값에 설정된 소정치에 의거하여 상기 판정을 행하고 있기 때문에, 괴선 또는 그 이외의 패턴인지의 판정이 불가능한 경우가 있다.
도24a-도24d는 장표에 일본 문자를 사용하여 기입한 문자의 예를 나타낸다. 이 예는 종래의 기술과 본 발명에 의한 요철도의 판정을 설명하기 위한 것이다.
도24a는 괴선 후보로서 추출된 문자 선분 A의 일부를 나타내고, 복수 문자의 가로 선 부분이 지극히 근접하여 쓰여진 화상 패턴의 일부가 1개의 괴선 후보의 영역(도면 중의 테두리로 구획된 사각형 영역)(131)으로 된 것을 나타낸다. 문자 선분 A는 1개의 괴선 후보의 영역(131) 내에서, 우연히, 화소의 밀도가 직선에 가까운 정도로 커서, 직선에 가까운 형상으로 되어있다. 이 때문에, 괴선으로서 추출된다. 문자 선분 A의 요철도는 원래 높음에도 불구하고, 꽤 낮게 되어 있다. 도24b는 괴선 후보로서 추출된 직선 B의 일부를 나타내고, 1개의 괴선 후보의 영역(도면 중의 테두리로 구획된 사각형 영역)(132) 내에서 화소 수준에서 보면 상당 정도 상하로 위치가 변동하고 있는 화상 패턴을 나타낸다. 직선 B는 원래 직선이기 때문에, 흐트러짐이 있지만, 괴선 후보로서 추출된다. 직선 B의 요철도는 원래 낮음에도 불구하고, 본 예에서는 꽤 높게 되어있다. 이 때문에, 도24a 및 24b에 나타낸 쌍방의 요철도는 같은 정도의 값이 되어버린다. 상술의 기술에서는 정확히 괴선을 추출한다고 하는 관점에서, 소정치가 설정되어 있다. 상기 판정의 결과, 직선 B와 같은 정도의 꽤 낮은 요철도를 갖는 문자 선분 A도 괴선 후보로서 판정된다. 즉, 문자 선분 A와 같은 경우에 대해서는 괴선 또는 그 이외의 패턴인지의 판정이 불가능하다.
도25a-도25d는 장표에 일본 문자를 사용하여 기입한 문자의 예를 나타낸다. 이 예는 종래의 기술과 본 발명에 의한 요철도의 판정을 설명하기 위한 것이다.
특히, 도25a-25d는 문자가 괴선이라고 인식되는 예를 나타내고, 도26a-26d는 괴선이 문자라고 인식되는 예를 나타낸다. 도25c의 원화상(입력 화상)으로서, 괴선 간에 문자(152)가 존재하고, 또한 해당 문자가 찌그러져 있는 경우가 있다. 이 화상이 스캐너에 의해 독해되면, 도25b에 나타내는 것 같은 화상 데이터로 되고, 문자의 부분(151)이 판연하지 않은 정도로 찌그러진다. 이 경우, 문자 부분(151)이 찌그러지지 않은 경우, 문자의 요철도는 원래 높지만, 찌그러짐 때문에 꽤 낮다. 이 때문에, 상술의 일특허 공보에 나타내는 기술에서는 판정을 위한 소정치가 비교적 높게 설정되어 있으므로, 문자의 부분이 괴선 후보로서 판정된다.
도26a-26d는 장표에 일본 문자를 사용하여 기입한 문자의 예를 나타낸다. 이 예는 종래의 기술과 본 발명에 의한 요철도의 판정을 설명하기 위한 것이다.
반대로, 도26c의 원화상에서, 괴선의 중간 부분(144 및 145)에 긁힘이 존재하는 경우가 있다. 이 화상이 스캐너에 의해 독해되면, 도26b에 나타낸 화상 데이터로 되고, 긁힌 부분이 화소수준에서 보면 직선이 아닌 것으로 보인다. 이 경우, 긁힌 부분의 요철도는 원래 낮지만, 긁힘 때문에 꽤 높다. 이 때문에, 상술의 기술에 의하면, 긁힌 부분이 원래 보다도 가는 괴선 후보로서 판정되거나 또는 더욱 요철도가 큰 문자로서 판정되어 괴선 후보로부터 제외되어 버린다. 이 경우도, 괴선인지 또는 그 이외의 패턴인지의 판정이 불가능하다.
이상과 같이, 종래의 문자 인식 장치 등의 표 화상 처리 장치에서는 요철도에 의한 괴선 후보의 판정 처리의 중요성은 충분히 인식되어 있으면서도, 문자의 직선 부분의 연속, 직선(괴선)의 흐트러짐, 문자의 찌그러짐, 괴선의 긁힘 등에 의해, 괴선 후보를 정확히 판정 처리할 수 없었다.
본 발명은 둥근 모서리를 갖는 표 화상을 정확히 처리할 수 있는 표 화상 처리 장치, 처리 프로그램 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 둥근 모서리를 갖는 표 화상을 정확히 처리하여, 괴선 후보를 정확히 판정할 수 있는 표 화상 처리 장치, 처리 프로그램 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 불명료한 화상이 존재하여도 둥근 모서리를 정확히 처리하여, 세로 괴선 또는 가로 괴선 중 하나만 추출된 상태에서 정확하게 판정할 수 있는 표 화상 처리 장치, 처리 프로그램 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 정합 패턴을 자동으로 생성함으로써, 수 많은 정합 패턴을 확보할 필요가 없어서 대형 기억 매체가 필요 없는 표 화상 처리 장치, 처리 프로그램 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 괴선과 문자의 접촉부 또는 화상 패턴의 불명부를 정확하게 인식하지 못했을 때 정확히 처리할 수 있는 표 화상 처리 장치, 처리 프로그램 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 불명료한 괴선, 문자의 둥근 부분 및 괴선과 문자의 접촉부가 존재하여도 둥근 모서리를 정확히 처리하여, 괴선 형식과 셀(문자 인식용 영역)의 추출을 인식할 수 있는 표 화상 처리 장치, 처리 프로그램 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 괴선 후보가 아닌 영역을 정확하게 추출하여 괴선 후보로부터 정확하계 제외시키는 표 화상 처리 장치, 처리 프로그램 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
괴선 여부의 판정 불가능의 경우를 크게 줄이고 괴선을 정확히 추출하는 표 화상 처리 장치, 처리 프로그램 기억 매체 및 표 화상 처리 방법을 제공하는 것을 목적으로 한다.
도1은 본 발명의 제1 원리 구성도.
도2는 본 발명의 제2 원리 구성도.
도3은 본 발명의 표 화상 처리 장치의 구성도.
도4는 본 발명의 표 화상 처리의 플로우를 나타내는 도면.
도5는 직선 추출 처리 플로우를 나타내는 도면.
도6은 a 및 도6b는 본 발명의 선분 추출 처리의 결과를 나타내는 도면.
도7은 a 및 도6b는 본 발명의 직선 추출 처리의 결과를 나타내는 도면.
도8은 본 발명의 모서리 후보 영역 추출 처리의 플로우를 나타내는 도면.
도9∼도9c는 본 발명의 모서리 부분을 확대한 예를 나타내는 도면.
도10a 및 10b는 본 발명의 근접 처리가 예를 나타내는 도면.
도11은 본 발명의 검출 처리의 예를 나타내는 도면.
도12는 본 발명의 직선 정보의 작성 처리를 나타내는 도면.
도13은 본 발명의 셀 추출 처리의 플로우를 나타내는 도면.
도14는 본 발명의 둥근 모서리 판정 처리의 플로우를 나타내는 도면.
도15a 및 15b는 본 발명의 화소 밀도 변화 검출 처리를 나타내는 도면.
도16a 및 16b는 본 발명의 대칭성 처리를 나타내는 도면.
도17a∼도17d는 본 발명의 정합 처리를 나타내는 도면.
도18은 본 발명의 문자 인식 영역의 판정 처리를 나타내는 도면.
도19a 및 19b는 모서리표 구조의 일례를 나타내는 도면.
도20은 본 발명의 표 화상 처리 장치의 구성도.
도21은 본 발명의 직선 추출 장치의 구성도.
도22는 본 발명의 직선 추출 처리의 플로우를 나타내는 도면.
도23은 본 발명의 괴선 후보 영역의 검출 처리의 플로우를 나타내는 도면.
도24a∼도24d는 종래예와 본 발명의 요철도의 검출의 일례를 나타내는 도면.
도25a∼도25d는 종래예와 본 발명의 요철도의 검출의 다른 일례를 나타내는 도면.
도26a∼도26d는 종래예와 본 발명의 요철도의 검출의 또 다른 일례를 나타내는 도면.
상술한 목적을 실현하기 위해 본 발명은 하기와 같은 기본 구성을 포함한다.
본 발명의 표 화상 처리 장치는 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출부와, 상기 직선 추출부에 의해 추출한 직선의 단부로부터 시작하는 경사 성분을 추출하여, 추출한 경사 성분에 의거하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 검출부와, 상기 둥근 모서리 후보 검출부에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출부와, 상기 셀 추출부에 의해 추출한 셀의 모서리에 대해서 둥근 모서리를 판정하는 처리를 실행하는 둥근 모서리 판정부를 구비한다.
본 발명의 표 화상 처리 장치는 둥근 모서리 후보 영역 검출 장치를 포함하며, 상기 둥근 모서리 후보 영역 검출 장치는 입력 화상 내에서 추출된 직선으로부터 각각 세로 방향의 직선의 단부로부터 시작하는 제1 경사 성분와, 가로 방향의 직선의 단부로부터 시작하는 제2 경사 성분을 각각 추출하며, 중첩부가 상기 둥근 모서리 후보 영역으로서 판정된다.
본 발명의 표 화상 처리 장치는 둥근 모서리 후보 영역 검출 장치를 포함하며, 상기 둥근 모서리 후보 영역 검출 장치는 입력 화상에서 추출된 직선으로부터 각각 세로 방향의 직선의 단부로부터 시작하는 제1 경사 성분과 가로 방향의 직선의 단부로부터 시작하는 제2 경사 성분을 각각 추출하는 추출부와, 상기 제1 및 제2 경사 성분이 사전에 고정된 거리 이내에 있고, 직선을 나타내는 패턴이 존재하거나 또는 서로 접촉하거나 중첩되는 경우에, 상기 부분이 둥근 모서리 후보 영역으로 판정된다.
본 발명의 표 화상 처리 장치는 상기 둥근 모서리 후보 영역 검출 장치를 포함하며, 상기 둥근 모서리 후보 영역 검출 장치는 입력 화상에서 추출된 직선으로부터 각각 세로 방향의 직선의 단부로부터 시작하는 제1 경사 성분과 가로 방향의 직선의 단부로부터 시작하는 제2 경사 성분을 각각 추출하는 추출부를 포함하며, 상기 어느 경사 성분이 식별된 경사 성분 부근에 존재하지 않고 또한 직선의 특징을 나타내는 패턴이 식별된 경사선의 단부에 존재할 경우에, 상기 부분이 둥근 모서리 후보 영역으로 판정된다.
상기 표 화상 처리 장치는 둥근 모서리 후보 영역 검출 장치를 구비하며, 상기 둥근 모서리 판정 장치는 입력 화상에서 추출된 세로 방향의 직선과 가로 방향의 직선으로부터 추출된 셀에 대하여 판정하는 판정부를 포함하며, 상기 셀의 모서리에서 화소 밀도가 사전에 정해진 순서로 변화하는 경우에, 상기 부분이 둥근 모서리인 것으로 판정한다.
상기 표 화상 처리 장치는 둥근 모서리 후보 영역 검출 장치를 구비하며, 상기 둥근 모서리 판정 장치는 입력 화상에서 추출된 세로 방향의 직선과 가로 방향의 직선으로부터 추출된 셀에 대하여 판정하는 판정부를 포함하며, 화소 밀도 변동에 준하여 판정되는 둥근 모서리가 존재할 경우에, 상기 입력된 화상의 다른 모서리가 둥근 모서리인 것으로 판정한다.
상기 표 화상 처리 장치는 둥근 모서리 후보 영역 검출 장치를 구비하며, 상기 둥근 모서리 판정 장치는 입력 화상에서 추출된 세로 방향의 직선과 가로 방향의 직선으로부터 추출된 셀에 대하여 판정하는 판정부를 포함하며, 상기 셀 내의 직선 간에 생성되는 n차 함수의 패턴이 둥근 모서리 후보 영역을 포함하는 모서리의 상기 입력된 화상과 정합하는 경우에, 상기 부분이 둥근 모서리인 것으로 판정한다.
본 발명의 프로그램 기억 매체는 입력된 화상 내에서 세로 및 가로 방향의 직선을 추출하는 직선 추출 처리와, 상기 직선 추출 처리에 의해 추출된 직선의 단부로부터 시작하는 경사 성분을 추출하여, 추출한 경사 성분에 의거하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 처리와, 상기 둥근 모서리 후보 영역을 추출하는 처리에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출 처리와, 상기 셀 추출 처리에 의해 추출한 셀의 모서리에 대한 소정의 처리를 실행함으로써 둥근 모서리를 판정하는 처리를 실행하는 둥근 모서리 판정 처리를, 상기 표 화상 처리 장치인 컴퓨터에서 실행시키는 프로그램을 기억한다.
본 발명의 표 화상 처리 장치는 괴선 판정 처리부를 구비하며, 상기 괴선 판정 처리부는 입력된 화상에서 추출된 세로 및 가로 방향의 괴선 후보 내에서, 상기 괴선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용하여 구한 상기 괴선 후보의 요철도(凹凸度)에 의거하여 괴선 후보가 괴선인가 아닌가를 판정하는 처리부를 포함한다.
본 발명의 프로그램 기억 매체는 입력된 화상에서 추출된 세로 및 가로 방향의 괴선 후보 내에서, 상기 괴선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용함으로써 상기 괴선 후봉의 요철도에 의거하여 괴선 후보가 괴선인가 아닌가를 판정하는 처리를, 상기 표 화상 처리 장치인 컴퓨터에서 실행시키는 프로그램을 기억한다.
본 발명의 표 화상 처리 방법은 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하고, 상기 직선 추출 처리에 의해 추출한 직선의 단부로부터 시작하는 경사 성분을 추출하고, 추출한 경사 성분에 의거하여 둥근 모서리 후보 영역을 검출하고, 상기 둥근 모서리 후보 영역 검출 처리에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하고, 상기 셀의 둥근 모서리를 판정하는 처리를 실행한다.
본 발명의 표 화상 처리 방법은 입력된 화상에서 추출된 세로 및 가로 방향의 괴선 후보 내에서, 상기 괴선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용함으로써 상기 괴선 후보의 요철도에 의거하여 괴선 후보가 괴선인가 아닌가를 판정하는 처리를 포함한다.
상술한 것 이외의 목적과 장점은 이하에 참고 도면을 참조하여 설명되는 구성과 작용에 대한 상세 설명으로부터 명백히 이해 될 수 있을 것이다.
[실시예]
도1은 본 발명의 제1 실시예의 원리 구성도이고, 표 화상 처리 장치(100)의 구성을 나타낸다. 표 화상 처리 장치(100)는 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출부(2)와, 직선 추출부(2)에 의해 추출한 직선의 단부로부터 시작하는 경사 성분을 추출하여, 추출한 경사 성분을 사용하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 검출부(3)와, 둥근 모서리 후보 검출부(3)에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출부(4)와, 셀 추출부(4)에 의해 추출한 셀의 모서리에 대해서 둥근 모서리를 판정하는 처리를 실행하는 둥근 모서리 판정부(5)를 구비한다.
도1에 나타내는 표 화상 처리 장치(100)에 의하면, 예컨대, 화상이 긁힌 불명료한 경우라도 둥근 모서리를 정확히 처리할 수 있게 되어, 세로 방향 및 가로 방향 중 어느 한쪽의 괴선을 추출할 수 있기만 하면 둥근 모서리를 정확히 처리할 수 있다. 또한, 사전에 다수의 정합 패턴을 가질 필요가 없어(정합 패턴을 자동으로 생성시키기 때문임), 메모리 용량을 크게 할 필요가 없다. 더욱, 괴선과 문자의 접촉부분이라든지 화상이 긁힌 부분이 둥근 모서리인 것으로 오인되는 일이 없으므로, 둥근 모서리를 정확히 처리할 수 있다. 이와 같이, 표 화상 처리 장치에서는 괴선의 긁힘, 문자의 둥근 부분, 괴선과 문자의 접촉 등이 있더라도 모서리를 정확히 처리할 수 있게 되고, 그 결과, 괴선 구조의 인식 및 셀(문자 인식 영역)의 추출을 안정하게 할 수 있다.
또한, 본 발명에 의하면, 표 화상 처리 장치(100)를 컴퓨터에서 실현시키는 프로그램을 기억한 프로그램 기억 매체를 제공할 수 있으므로, 둥근 모서리를 정확히 처리할 수 있는 표 화상 처리 장치(100)를 용이하게 제공할 수 있다.
도2는 본 발명의 제2 실시예의 원리 구성도이고, 표 화상 처리 장치(100)의 구성을 나타낸다. 본 발명의 표 화상 처리 장치(100)는 괴선 판정 처리부(20)를 구비한다.
괴선 판정 처리부(20)는 입력된 화상에서 추출된 세로 및 가로 방향의 괴선 후보에 대해서, 입력된 화상에서 추출된 화상 패턴으로서 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴에 대응해서 선택한 복수의 소정치(21,22,…) 중 어느 하나를 사용하여 얻은, 해당 괴선 후보의 요철도에 의거하여 입사된 화상으로부터 추출한 괴선 후보가 괴선인가 아닌가를 판정한다.
본 발명의 표 화상 처리 장치(100)에 의하면, 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴에 따라서, 복수의 소정치(21,22,…) 중 어느 하나가 괴선 판정에 사용된다. 예컨대, 복수 문자의 가로 선의 부분이 지극히 근접하여 쓰여진 화상 패턴으로 이루어지는 괴선 후보의 경우, 그 요철도는 낮지만, 그 주위에 요철도가 높은 상이한 문자의 화상 패턴이 존재한다. 따라서, 해당 요철도는 원래 높았을 것으로 추측된다. 그래서, 이 경우에는 괴선 후보 판정의 소정치로서 보다 낮은 값의 소정치(예컨대, 제1 소정치(21))를 사용한다. 이 처리에 의해, 원래 보다도 낮게 된 요철도를 갖는 괴선 후보를 괴선 후보로부터 제외할 수 있다. 반대로, 주위의 요철도가 낮은 경우에는, 보다 높은 값의 소정치(예컨대, 제2 소정치(22))를 사용함으로써 원래 보다도 높은 요철도를 갖는 괴선 후보를 괴선 후보로 남길 수 있다. 이상에 의해, 괴선일 가능성이 낮은 영역을 정확히 판정하여, 괴선 후보로부터 제외할 수 있다. 따라서, 괴선인지 또는 그 이외의 패턴인지의 판정이 불가능한 경우를 현저히 낮출 수 있어, 정확히 괴선을 추출할 수 있다.
또한, 본 발명에 의하면, 표 화상 처리 장치(100)를 컴퓨터에서 실현시키는 프로그램을 기억한 프로그램 기억 매체를 제공할 수 있으므로, 괴선 후보 영역을 정확히 판정할 수 있는 표 화상 처리 장치(100)를 용이하게 제공할 수 있다.
(제1 실시예)
도3은 제1 실시예의 표 화상 처리 장치(100)의 구성도이고, 본 발명의 표 화상 처리 장치(100)의 일례의 구성을 나타내고, 도1에 나타내는 표 화상 처리 장치(100)에 대응한다.
표 화상 처리 장치(100)는 화상 입력 장치(1), 직선 추출 장치(2), 둥근 모서리 후보 영역 검출 장치(3), 셀 추출 장치(4), 둥근 모서리 판정 장치(5), 문자 인식 영역 검출 장치(6)를 구비한다. 표 화상 처리 장치(100)는 주 메모리 상에 존재하는 표 화상 처리 프로그램과 CPU로 이루어진다. 컴퓨터인 표 화상 처리 장치(100)는 키보드 등의 입력 장치, 마우스, 표 화상을 처리하기 위해 화상을 입력하고 방향을 입력하는 스캐너, 화상의 표시 등을 위한 표시 장치 및 화상 데이터(12) 등의 각종의 데이터를 기억하기 위한 보조 기억 장치를 구비한다.
화상 입력 수단인 화상 입력 장치(1)는 괴선에 의해 구성된 장표의 화상인 입력 화상(11)을 화상 데이터(12)로서 입력한다. 화상 입력 장치(1)는 주지의 스캐너 등으로 이루어지고, 장표 등의 종이 위에 인쇄된 세로(수직 또는 y) 방향 및 가로(수평 또는 x) 방향의 괴선 및 해당 장표에 기입된 문자로 이루어지는 입력 화상(11)을 독취하여, 전자적인 이미지 데이터인 화상 데이터(12)로서 입력한다. 입력 화상(11)은 특히 제한되지 않지만, 예컨대 극단적인 경사가 없는 2치 화상이 바람직하고, 예컨대 도19a 및 도19b에 나타낸 장표와 같다.
직선 추출부(2)인 직선 추출 장치(2)는 화상 입력 장치(1)에 의해 입력된 화상 데이터(12)를 참조하여, 이들로부터 세로 및 가로 방향의 직선을 추출한다. 추출된 직선에 대한 데이터(직선 데이터)(13)는 해당 직선을 나타내는 위치 좌표로 이루어진다. 직선 데이터(13)는 보조 기억 장치에 기억된다.
둥근 모서리 후보 검출부(3)인 둥근 모서리 후보 영역 검출 장치(3)는 화상 데이터(12) 및 직선 데이터(13)를 참조하여, 직선 추출 장치(직선 추출 수단)(2)에 의해 추출한 직선의 단부로부터 시작하는 경사 성분을 추출하여, 추출한 경사 성분을 사용하여 소정의 처리를 실행함으로써 둥근 모서리 후보 영역을 검출한다. 둥근 모서리 후보 영역 검출 장치(3)는 검출한 둥근 모서리 후보 영역을 둥근 모서리 후보 데이터(14)로서 보조 기억 장치에 기억한다. 둥근 모서리 후보 데이터(14)는 예컨대 해당 경사 성분이 모서리 후보인가 아닌가를 나타내는 데이터와, 해당 경사 성분을 나타내는 위치 좌표로 이루어진다.
둥근 모서리 후보 영역 검출 장치(3)는 상기 경사 성분의 추출 중에, 입력된 화상 데이터(12)로부터 직선 추출 장치(2)에 의해 추출된 세로 및 가로 방향의 직선 내에서, 세로 방향의 직선의 단부로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 단부로부터 시작하는 제2 경사 성분을 각각 추출한다. 그리고, 둥근 모서리 후보 영역 검출 장치(3)는 둥근 모서리 후보 영역을 검출하기 위한 상기 소정의 처리를, 이하의 제1 내지 제3 처리중 어느 하나에 의해 실행한다. 즉, 제1 처리로서, 해당 제1 및 제2 경사 성분이 서로 중첩하는 경우에, 해당 부분이 둥근 모서리 후보 영역인 것으로 판정한다. 제2 처리로서, 해당 제1 및 제2 경사 성분이 서로 사전에 정해진 거리 내에 있고, 또한 양자 간에 직선의 특징을 나타내는 패턴이 있거나, 양자가 서로 접촉 또는 중첩하고 있는 경우에, 해당 부분이 둥근 모서리 후보 영역인 것으로 판정한다. 제3 처리로서, 해당 경사 성분의 근처에 어떤 다른 경사 성분이 존재하지 않고, 또한 해당 경사 성분의 단부에 직선의 특징을 나타내는 패턴이 있는 경우에, 해당 부분이 둥근 모서리 후보 영역인 것으로 판정한다.
셀 추출부(4)인 셀 추출 장치(4)는 둥근 모서리 후보 영역 검출 장치(3)에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀(및 상이한 셀)을 추출한다. 추출한 셀의 데이터(셀 데이터(15))는 해당 셀을 나타내는 위치 좌표로 이루어진다. 셀 데이터(15)는 보조 기억 장치에 기억된다.
둥근 모서리 판정부(5)인 둥근 모서리 판정 장치(5)는 화상 데이터(12), 둥근 모서리 후보 데이터(14) 및 셀 데이터(15)를 참조하여, 셀 추출 장치(4)에 의해 추출한 둥근 모서리 후보 영역을 포함하는 셀의 모서리(또는 정점)에 대해서 소정의 처리를 실행한다. 이 처리에 의해, 둥근 모서리 판정 장치(5)는 둥근 모서리를 판정하여, 판정한 둥근 모서리를 둥근 모서리 데이터(16)로서 보조 기억 장치에 기억한다. 또, 실제의 셀 데이터(15)는 둥근 모서리 후보 데이터(14)를 포함하기 때문에, 둥근 모서리 후보 데이터(14)는 참조되지 않고, 셀 데이터(15)가 참조된다.
둥근 모서리 판정 장치(5)는 입력된 화상 데이터(12)로부터 추출된 세로 및 가로 방향의 직선에 따라서 셀 추출 장치(4)에 의해 추출한 셀의 모서리에 대해서 소정의 처리를 실행함으로써 둥근 모서리를 판정한다. 둥근 모서리 판정 장치(5)는 상기 소정의 처리를, 이하의 제1 내지 제3 처리 중 어느 하나에 의해 실행한다. 즉, 제1 처리로서, 셀 추출 장치(4)에 의해 추출한 해당 셀의 모서리에서 화소 밀도가 사전에 정해진 순서로 변화하는 경우에, 해당 부분이 둥근 모서리인 것으로 판정한다. 제2 처리로서, 화소 밀도의 변화에 의거하여 판정된 둥근 모서리가 존재하는 경우에, 상기 입력된 화상의 다른 모서리도 둥근 모서리인 것으로 판정한다. 제3 처리로서, 해당 셀을 구성하는 상기 직선 추출부에 의해 추출한 직선의 단부와 단부 간에 생성된 n차 함수의 패턴과 상기 입력된 화상이 정합하는 경우에, 해당 부분이 둥근 모서리인 것으로 판정한다.
문자 인식 영역 검출부인 문자 인식 영역 검출 장치(6)는 화상 데이터(12), 셀 데이터(15) 및 둥근 모서리 데이터(16)를 참조하여, 소정의 처리를 실행함으로써 입력된 화상 데이터(12)의 문자 인식 영역을 판정한다. 즉, 둥근 모서리 판정 장치(5)에 의해 판정된 둥근 모서리를 포함하는 셀에 대해서, 해당 둥근 모서리를 문자 영역에서 제외함으써, 해당 문자 인식 영역을 판정한다. 판정한 문자 인식 영역의 데이터(문자 인식 영역 데이터(17))는 보조 기억 장치에 기억된다. 또, 실제의 둥근 모서리 데이터(16)는 셀 데이터(15)를 포함하도록 되기 때문에, 셀 데이터(15)는 참조되지 않고, 둥근 모서리 데이터(16)가 참조된다.
직선 추출 장치(2), 둥근 모서리 후보 영역 검출 장치(3), 셀 추출 장치(4), 둥근 모서리 판정 장치(5), 및, 문자 인식 영역 검출 장치(6)는 주 메모리 상에 존재하고 CPU 상에서 실행되는 각종 처리 프로그램에 의해서 실현된다. 직선 추출 장치(2)의 실행 처리, 셀 추출 장치(4)의 실행 처리 및 문자 인식 영역 검출 장치(6)의 실행 처리는 주지의 처리이다. 둥근 모서리 후보 영역 검출 장치(3)의 실행 처리 및 둥근 모서리 판정 장치(5)의 실행 처리는 본 발명에 특유 처리이다.
도4는 표 화상 처리 장치(100)에 의해 실행되는 표 화상 처리의 플로우를 나타낸다.
화상 입력 장치(1)가 입력 화상(11)을 화상 데이터(12)로서 입력하는 화상 입력 처리를 실행한다(스텝 S1). 즉, 스캐너의 입력 화상(11)을 독취하여, 화상 데이터(12)를 얻는다.
직선 추출 장치(2)가 화상 데이터(12)로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 처리를 실행한다(스텝 S2). 즉, 직선 데이터(13)를 얻는다. 이 처리에 대해서는 도5 내지 도7을 참조하여 후술한다.
둥근 모서리 후보 영역 검출 장치(3)가 직선 데이터(13)를 참조하여, 추출된 직선의 단부로부터 시작하는 경사 성분을 추출하여, 추출한 경사 성분을 사용하여 소정의 처리를 실행함으로써 둥근 모서리 후보 영역 추출 처리를 실행한다(스텝 S3). 즉, 둥근 모서리 후보 데이터(14)를 얻는 이 처리에 대해서는 도8 내지 도12를 참조하여 후술한다.
셀 추출 장치(4)가 화상 데이터(12), 직선 데이터(13) 및 둥근 모서리 후보 데이터(14)를 참조하여, 추출된 둥근 모서리 후보 영역을 포함하는 셀(및 상이한 셀)을 추출하는 셀 추출 처리를 실행한다(스텝 S4). 즉, 셀 데이터(15)를 얻는다. 이 처리에 대해서는 도13을 참조하고 후술한다.
둥근 모서리 판정 장치(5)는 화상 데이터(12), 둥근 모서리 후보 데이터(14) 및 셀 데이터(15)를 참조하여, 추출된 둥근 모서리 후보 영역을 포함하는 셀의 모서리에 대해서 소정의 처리를 실행함으로써 둥근 모서리 판정 처리를 실행한다(스텝 S5). 즉, 둥근 모서리 데이터(16)를 얻는다. 이 처리에 대해서는 도14 내지 도17을 참조하여 후술한다.
문자 인식 영역 검출 장치(6)는 화상 데이터(12), 셀 데이터(15) 및 둥근 모서리 데이터(16)를 참조하여, 소정의 처리를 실행함으로써 화상 데이터(12)의 문자 인식 영역을 판정하는 문자 인식 영역 검출 처리를 실행한다(스텝 S6). 즉, 문자 인식 영역 데이터(17)를 얻는다. 이 처리에 대해서는 도18을 참조하여 후술한다.
도5는 추출 처리의 플로우를 나타낸다. 도5에 나타내는 처리는 도4의 스텝 S2에 상당하고, 주지의 기술이다. 화상 데이터(12)로부터 세로 및 가로 방향의 괴선(세로 가로 괴선)을 추출한다. 이 직선 추출 처리는 주지의 처리 중 어느 하나의 처리에 의해서 실행될 수 있지만, 이하에 그 바람직한 처리의 일례를 나타낸다.
처음에, 연결 패턴을 추출한다(스텝 S21). 연결 패턴은 주지의 연결 패턴 추출 처리에 의해 추출한다. 주지의 연결 패턴 추출 처리로서는 예컨대, 본원 출원인이 제안한 특원평7282171호에 기재된 기술이 사용된다. 이 기술에 의하면, 8 연결 패턴을 라벨링(lavelling)에 의해 추출한다. 이 처리에 의해, 복수의 테두리가 배치되는 위치가 상대적인 관계에 의존하지 않고, 세로 가로 괴선의 각 패턴을 안정하게 추출할 수 있다.
이제, 연결 패턴 추출 처리에 대해서 간단히 설명한다. 처음에, 입력된 화상 데이터(12)에서 입력 패턴을 구성하는 패턴(부분 패턴)의 각각에 대해서, 상하 세로 2방향, 가로 좌우 2방향 및 4경사 방향의 합계 8방향에서, 상이한 부분 패턴과의 연결을 조사한다. 그다음, 어느 하나의 방향에서 연결하고 있는 부분 패턴(연결 패턴)에 대하여 동일한 라벨을 첨부한다. 연결 패턴은 문자가 접촉하고 있지 않은 테두리 즉, 괴선(또는 괴선의 일부), 문자가 접촉하고 있는 괴선(또는 괴선의 일부), 괴선에 접촉하고 있지 않은 문자(또는 문자의 일부)중 어느 하나 이다.
다음에, 라벨이 첨부된 부분 패턴을 조사하고, 소정의 크기보다 큰 연결 패턴의 그룹을 해당 장표를 구성하는 괴선의 후보로서 추출한다. 즉, 추출된 부분 패턴의 안쪽, 일정 이상의 크기를 갖는 부분 패턴(제1 부분 패턴)을 장표의 괴선의 후보로 한다. 예컨대, 본래의 괴선 내에서, 긁히지 않고 정확하게 추출된 괴선이 제1 부분 패턴으로 판정되는, 한편, 본래의 문자 내에서, 괴선에 접촉하지 않고 정확하게 기입된 문자는 괴선의 후보로부터 제외된다.
다음에, 제1 부분 패턴에 대하여 소정의 위치에 존재하고, 또한 소정의 크기보다 큰 부분 패턴(제2 부분 패턴)에 첨부된 라벨을 해당 제1 부분 패턴과 동일한 라벨로 변경함으로써 해당 제2 부분 패턴을 장표의 괴선의 후보에 추가한다. 예컨대, 본래의 괴선, 즉 긁힌 제1 부분 패턴으로부터 고립한 괴선이 제2 부분 패턴으로서 판정된다. 이 결과, 긁힌 괴선도 제1 부분 패턴 즉, 괴선의 후보로 판정되어, 옳은 결과가 얻어진다. 따라서, 본 발명에 의하면, 이러한 연결 패턴 추출 처리를 사용함으로써, 식별된 괴선의 일부인 패턴으로부터 분리된 패턴이 별도의 패턴으로서 처리되는 것을 방지할 수 있다.
이 처리 후, 추출한 연결 패턴의 화상에 대해서, 각 연결 패턴(부분 패턴)마다, 세로 가로 방향 성분의 세분화가 주지의 마스크 처리에 의해 실행된다. 주지의 마스크 처리로서는 예컨대, 본원 출원인이 제안한 특개평7-28937호 공보에 기재된 기술이 사용될 수 있다. 이 기술에 의하면, 추출된 연결 패턴으로부터 극단적인 경사 성분을 갖는 패턴을 제거한다. 이 처리에 의해, 테두리 즉, 괴선의 일부로서만 존재하는 긴 직선을 추출하기 쉽게 할 수 있다.
이제, 마스크 처리에 대해서 간단히 설명한다. 처음에, 라벨링에 의해 얻은 부분 패턴(연결 패턴)마다, 소정의 크기(길이 및 폭)를 갖는 가로 길이 및 세로 길이의 2종류의 마스크에 의거하여 주사를 실행한다. 다음에, 각 마스크마다, 해당 마스크의 면적에 대한 마스크 내의 패턴이 차지하는 면적의 비율을 산출하여, 해당 비율이 소정치보다도 크면 그 마스크 내부 영역을 모두 패턴으로 간주한다(화상의 가로 성분 또는 세로 성분으로 간주한다). 즉, 해당 부분을 해당 마스크의 크기로 세분화된 사각형 영역이라고 간주한다. 해당 비율이 소정치 이하이면 그 마스크 내의 패턴을 삭제한다(화상의 가로 성분 또는 세로 성분이 존재하지 않는 것으로 간주한다). 이 처리에 의해, 화상 패턴의 세로 가로 성분을 사용한 마스크 폭의 정도로까지 세분화하여 추출할 수 있다.
다음에, 복수의 행(가로 방향) 또는 열(세로 방향)이 연속하여 상기 비율이 소정치보다도 큰 경우, 그들 영역을 통합하여 1개의 사각형의 영역으로 간주한다. 그러므로 이러한 마스크 처리를 사용함으로써, 테두리의 폭 즉, 괴선의 폭을 일 직선으로 동일하게 하여, 괴선 만에 존재하는 긴 직선을 추출하기 쉽게 할 수 있다.
이 처리 후, 마스크 처리한 화상에 대해서 선분 추출 처리가 실행된다(스텝 S23). 선분 추출은 주지의 선분 추출 처리에 의해 행하여진다. 주지의 선분 추출 처리로서는 예컨대, 본원 출원인이 제안한 특개평6-309498호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 마스크 처리한 화상에 대하여 인접 투영치를 산출하거나, 직선 또는 직선의 일부(선분)를 검출한다. 이제, 인접 투영 처리란, 확인된 행 또는 열의 투영치에 그 주위의 행 또는 열의 투영치를 합쳐서, 이 값을 투영치로 획정하는 처리를 말한다. 선분 추출 처리의 결과를 도6b에 나타낸다. 이 처리에 의해, 직선의 주위를 대국적으로 파악하여 선분을 정확히 추출할 수 있다.
이제, 해당 선분 추출 처리에 대해서 간단히 설명한다. 처음에, 마스크 처리의 결과로 얻은 (해당 마스크 내를 모두 패턴하였음) 사각형 영역의 패턴의 각각에 대해서, 그 가로 방향의 투영과 세로 방향의 투영을 하여 투영치를 구한다. 그 다음, 구한 투영치를 소정 영역내의 패턴 주위(행 또는 열)의 패턴의 투영치를 가산한다. 즉, 특개평6-309498호 공보에 기재된 식(예컨대(11)식)에 따라서, 해당 패턴의 행 및 열 방향의 인접 투영치를 산출한다.
다음에, 행 방향의 산출한 인접 투영치와 사각형 영역(마스크)의 가로 방향의 분할 길이의 비 및 열 방향의 산출한 인접 투영치와 사각형 영역(마스크)의 세로 방향의 분할 길이의 비를 산출하고, 또한 열 방향의 산출한 인접 투영치와 사각형 영역(마스크)의 세로 방향의 분할 길이의 비 및 열 방향의 산출한 인접 투영치와 사각형 영역(마스크)의 세로 방향의 분할 길이의 비를 산출한다. 다음에 이들의 비가 소정치인 부분을 직선의 후보로 하고, 해당 비가 소정치보다도 작은 부분을 선분이 존재하지 않는 영역으로 간주한다. 그리고, 복수의 부분이 연속하여 소정치 이상이 되는 경우, 즉, 직선의 후보인 부분이 연속하는 경우, 이 들을 통합하여 1개의 사각형 영역에서 근사화하고, 이 근사화된 사각형 영역에 직선이 존재할 때 사각형으로 간주한다. 즉, 도6b에 나타낸 바와 같이, 사각형 영역에 의해 근사화된 선분이 추출된다.
이러한 선분 추출 처리를 사용함으로써, 직선이 경사져 있으므로 경사 방향으로 복수 행 또는 열에 걸쳐 있더라도, 선분을 추출할 수 있다. 그 결과, 괴선인 큰 테두리가 기울어 있더라도, 그 선분을 정확히 추출할 수 있다. 또한, 인접 투영을 사용함으로써, 통상의 투영과 같이 마스크의 분할 길이를 짧게 하여 분할 수를 크게 함으로써 경사선을 추출할 필요가 없기 때문에, 문자를 구성하는 짧은 선분을 추출하지 않고, 긴 선분을 추출할 수 있다.
이 처리 후, 선분 추출 처리의 결과에 의거하여, 직선 추출 처리가 실행된다(스텝 S24). 직선 추출은 주지의 직선 추출 처리에 의해 실행된다. 주지의 직선 추출 처리로서는 예컨대, 본원 출원인이 제안한 특개평6-309498호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 선분 추출 처리에 의해 추출되어 사각형 근사화된 선분 내에서 인접한 선분 끼리를 통합하여 긴 직선을 검출하여, 검출한 직선에 대하여 더욱 사각형 근사화 처리를 행한다. 직선 추출 처리의 결과를 도7a에 나타낸다. 이 처리에 의해, 직선을 확실하게 추출할 수 있다.
이제, 해당 직선 추출 처리에 대해서 간단히 설명한다. 처음에, 선분 추출 처리에서 추출되어 사각형 근사화된 선분(도7a에 나타냄)이 그 상하(예컨대, 인접 투영치의 산출 처리에서 가산 치의 범위 내)에 존재하는 상이한 선분과 접촉하고 있는가를 조사한다. 다음에, 접촉하는 상이한 선분이 존재하는 경우, 해당 선분과 그 상하에 존재하는 상이한 선분을 통합하여, 도7b에 나타내는 1개의 사각형 영역으로 한다. 이러한 직선 추출 처리를 사용함으로써 장표의 괴선 등의 긴 직선을 추출할 수 있다.
또, 특개평6-309498호 공보에서는 인접 투영치와 사각형(마스크)의 분할 길이의 비의 산출 처리 이후를, 선분 추출 처리에서는 없고, 직선 추출 처리에서 행하고 있다. 상이한 한편, 본원에서도 선분 추출 처리(스텝 S23)와 직선 추출 처리(스텝 S24)는 연속하여 행하여지기 때문에, 본 발명은 실제로는 특개평6-309498호 공보의 처리와 하등 상위하지 않은 처리가 행하여진다.
이 처리 후, 선분 추출 처리의 결과에 의거하여, 화상 데이터(12)로부터의 점선 추출 처리가 실행된다(스텝 S25). 점선 추출은 주지의 점선 추출 처리에 의해 행하여진다. 주지의 점선 추출 처리로서는 예컨대, 본원 출원인이 제안한 특개평9-505527호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 동일의 크기의 부분 패턴이 규칙적으로 나란히 놓여있는 패턴을 점선으로서 추출하고, 그 패턴을 직선과 같이 사각형 근사화한다. 또, 추출된 직선(실선) 및 점선은 구별 없이, 괴선으로서 동일의 처리에 의해 실행된다. 이 처리에 의해, 점선으로 이루어지는 괴선을 포함하는 장표를 이후의 처리에서 정확히 처리할 수 있다.
이제, 해당 점선 추출 처리에 대해서 간단히 설명한다. 처음에, 연결 패턴 추출 처리(스텝 S21)에서 추출하여 라벨을 첨부한 패턴 외측의 사각형의 화상의 일부를 세로 또는 가로 방향으로 가로지르는 제1 사각형으로서 추출한다. 다음에, 그 사각형 내부에 존재하는 패턴(내부 패턴)을 사전에 정해진 점선으로 구성하는 소정의 크기의 패턴과 비교하여, 소정 패턴에 일치하는 부분 패턴을 찾는다.
다음에, 소정 패턴과 일치하는 내부 패턴이 발견되면 더욱, 제1 패턴을 수직으로 가로지르는 제2 패턴으로서 추출한다. 그리고, 소정 패턴과 일치하는 제2 패턴의 내부 패턴을 추출한다.
다음에, 추출한 부분 패턴이 어느 일정한 간격으로 어느 일정 수 이상 연속하여 나란히 놓여 있는 경우, 그 패턴을 점선으로 판단하고, 이 점선을 둘러싸는 사각형 영역을 점선이 존재 영역로서 생각하고, 또한 해당 패턴을 둘러싸는 사각형을 점선을 포함하는 사각형에 의해 근사화한다.
이러한 점선 추출 처리를 반복 실행함으로써, 장표 내에 존재하는 점선을 정확히 추출하여 점선을 포함하는 사각형을 사각형 근사화에 의해 근사화할 수 있다. 그러므로 상술한 바와 같이, 이후에는 실선 및 점선을 같은 것으로 처리할 수 있다.
이상의 처리의 결과, 화상 데이터(12)로부터 도7에 나타낸 바와 같이 사각형에 의해 근사화된 직선 및 점선이 추출된다. 이것이 직선 데이터(13)이다.
도8은 둥근 모서리 후보 영역 검출 장치에 의해 실행되는 둥근 모서리 후보 영역 검출 처리의 플로우를 나타낸다. 도8에 나타내는 처리는 도4의 스텝 S3에 상당하고, 본 발명의 특징적인 처리이다. 둥근 모서리 후보 영역 검출 처리는 전 처리로서의 경사 성분 추출 처리와, 실제의 둥근 모서리 후보 영역을 검출하는 처리인 후보 검출 처리로 이루어진다.
최초로, 경사 성분 추출 처리가 실행된다(스텝 S31). 경사 성분(경사선)의 추출 처리는 직선 추출 장치(2)의 처리에서 추출된 세로 가로의 직선의 단부를 기점으로서 행하여진다. 경사 성분 추출 처리에는 경사 방향의 화소 검출 처리 또는 경사 방향의 투영 처리 등의 처리가 사용된다.
경사 성분의 화소 검출은 주지의 경사 방향의 화소 검출 처리에 의해 행하여진다. 주지의 경사 방향의 화소 검출 처리로서는 예컨대, 본원 출원인이 제안한 특개평7-192094호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 추출된 직선의 단부에서 화소의 존재(패턴의 윤곽)를 검출함으로써 경사선을 추출한다. 이 처리에 의해, 경사선에 다소의 긁힘이 있더라도 경사 성분을 추출할 수 있다.
이제, 해당 경사 방향의 화소 검출 처리에 대해서 간단히 설명한다. 처음에, 직선 추출 장치(2)에서 추출된 세로 가로의 직선의 단부를 기점(개시점)으로서 정한다. 다음에, 직선을 제외하는 추출된 직선의 종료점에서 시작되는 패턴의 윤곽을 검출한다. 즉, 해당 직선의 하변 또는 상변 또는 좌변 또는 우변에서, 화상 구성하는 화소의 선을 따라서 추적한다. 다음에, 해당 직선 또는 해당 직선 이외의 상이한 세로 또는 가로의 직선 중 하나에 도달하면 검출을 종료하고, 해당 검출의 결과를 경사 성분으로 판정한다.
또한, 경사 방향의 투영은 주지의 경사 방향의 인접 투영 처리에 의해 행하여진다. 주지의 경사 방향의 인접 투영 처리로서도, 예컨대, 본원 출원인이 제안한 특개평7-192094호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 화상 데이터(12)의 화상 패턴에 대하여 인접 투영치를 산출하여, 사각형 근사화에 의해 경사선 또는 선의 일부(선분)를 검출한다. 이 기술에서, 인접 투영이란, 주목하는 경사선의 투영치에, 그 주위 영역의 투영치를 합쳐서, 이 값을 투영치로 하는 처리를 말한다. 이 처리에 의해, 경사선에 다소의 긁힘이 있더라도 경사선을 추출할 수 있다.
이제, 해당 경사 방향의 투영 처리에 대해서 간단히 설명한다. 처음에, 화상 데이터(12)의 화상 패턴의 안쪽, 직선 추출 처리(스텝 S2)에서 직선으로서 추출된 패턴(직선 데이터(13)에 대응하는 패턴)을 제외한 각각에 대해서 나타나는 정해진 사각형 영역으로 분할한다. 그 다음, 분할한 각각의 사각형 영역에 대해서 그 세로 및 가로 방향의 투영을 잡어, 투영치를 구한다. 다음에, 사각형의 투영치에 사각형으로부터 일정 거리에 존재하는 사각형의 세로 및 가로 방향의 투영치를 가산한다. 즉, 특개평7-192094호 공보에 기재된 식에 따라서, 해당 사각형 영역의 경사 방향의 인접 투영치(경사 인접 투영치)를 산출한다. 투영의 방향은 예컨대 45。이다.
다음에, 산출한 경사 인접 투영치와 사각형 영역의 분할 길이의 비를 산출한다. 그리고, 이 비가 임계치 이상인 부분을 경사 성분으로 하고, 해당 비가 임계치보다도 작은 부분을 경사 성분이 존재하지 않는 것으로 한다. 다음에, 복수의 부분이 연속하여 임계치 이상이 되는 경우, 즉, 경사 성분인 부분이 연속하는 경우, 이 들을 통합하여 1개의 사각형 영역에서 근사화하여, 이 근사화된 사각형 영역에 경사 성분이 존재하는 것으로 한다. 경사 성분은 복수의 사각형 영역으로 이루어진다.
이러한 경사 방향의 화소 검출 처리 또는 경사 방향의(인접) 투영 처리를 사용함으로써 경사 방향으로 기울고 있는 경사 성분을 정확히 추출할 수 있다. 따라서, 장표의 테두리의 둥근 모서리를 구성하는 경사 성분을 정확히 추출할 수 있다.
경사 성분 추출 처리에 의해 추출된 경사 성분에서, 제1 경사 성분인 세로 방향의 직선의 단부를 기점으로 하는 것을 "경사 성분 T"라고 부르고, 제2 경사 성분인 가로 방향의 직선의 단부를 기점으로 하는 것을 "경사 성분 Y"라고 부르고 구별하기로 한다.
도9a∼9c는 둥근 모서리 부분을 확대한 예를 나타낸다. 도9a에서 점선으로 둘러싼 부분이 세로 직선 및 가로 직선(직선 데이터(13))으로 추출된다. 다음에, 도9b에 나타낸 바와 같이, 가로 직선의 단부로부터 경사 방향으로 신장하고 있는 패턴을 추출하고, 그 결과로서, 해당 경사 성분 Y 및 그 존재 영역(사선을 근 영역)을 기억한다. 다음에, 도9c에 나타낸 바와 같이, 세로 직선의 단부로부터 경사 방향으로 신장하고 있는 패턴을 추출하고, 그 결과로서, 해당 경사 성분 T 및 그 존재 영역(사선을 근 영역)을 기억한다. 또, 추출 순서는 어느 선으로 하여도 좋다. 이 처리는 모든 세로 직선 및 가로 직선에 대해서 실행된다. 즉, 원래 1개의 경사 성분이 경사 성분 T 및 Y로서 따로따로 추출된다. 이 처리에 의해, 1개의 경사 성분이 완전히 불명료하더라도 경사 성분 T 및 Y로서 추출할 수 있다.
경사 성분 추출 처리 후, 후보 검출 처리가 실행된다(스텝 S32). 후보 검출 처리는 중첩 처리, 근접 처리 또는 검출 처리 중 하나 또는 복수의 처리로 이루어진다. 중첩 처리에 대해서는 도9a∼9c를 참조하여 설명하고, 근접 처리 및 검출 처리의 예에 대해서는 각각, 도10a, 도10b 및 도11에 나타낸다.
처음에, 제1 처리로서, 중첩 처리가 실행된다(스텝 S32-l). 중첩 처리는 예컨대 도9b에 나타내는 경사 성분 Y(성분 Y의 존재 영역)와 도9c에 나타내는 경사 성분 T(성분 T의 존재 영역)가 중첩되어 있는 경우에 실행된다. 따라서, 스텝 S32-1에서 최초로, 경사 성분 Y와 경사 성분 T의 중첩의 유무가 조사된다. 해당 중첩이 없는 경우, 스텝 S32-1의 이하의 처리는 생략된다. 경사 성분 Y와 경사 성분 T가 중첩하고 있는 경우, 그 부분은 둥근 모서리 후보 영역인 것으로 취급된다. 이것은 양자가 중첩하는 경우에는, 해당 경사 성분이 둥근 모서리가 구비하는 형상을 갖는 것이 되기 때문이다. 즉, 해당 경사 성분은 가로 직선 및 세로 직선의 쌍방에 접속하고 있고, 또한 해당 둥근 모서리는 쌍방의 직선을 잇는 성분이다. 이 중첩 처리에 의해 둥근 모서리를 정확히 추출할 수 있다. 서로 중첩하는 경사 성분이 없는 경우, 도10a 및 도10b에 나타내는 근접 처리가 실행된다.
또, 해당 경사 성분 Y 및 T는 완전히 중첩하고 있을 필요는 없고, 사전에 정해진 상태 이상으로 쌍방이 중첩하고 있으면, 양자가 중첩되어 있는 것으로 판단된다. 중첩 상태는 예컨대 중첩되어 있는 면적 또는 화소수 또는 그 비에 의해 판단된다. 이 처리에 의해, 긁힘이 있더라도 경사 성분을 추출할 수 있다.
다음에, 제2 처리로서, 근접 처리는 2개의 경사 성분 Y(성분 Y의 2존재 영역)가 세로 방향으로 존재하고, 2개의 경사 성분 T(성분 T의 2존재 영역)가 소정 거리 이하에 가로 방향으로 존재할 때 실행된다(스텝 S32-2). 따라서, 스텝 S32-2에서 최초로, 영역의 경사 성분 Y 또는 T의 근처의 상이한 경사 성분 Y 또는 T의 거리가 조사된다. 상기 위치 관계를 만족하는 또는 상이한 경사 성분 Y 또는 T가 있는 경우, 도10a 및 10b에 나타낸 바와 같이, 2개의 영역 Y 또는 T 간의 거리에 따라서, 더욱, 2개의 상이한 처리 중 어느 하나가 실행된다. 2개의 상이한 처리는 어떤 것을 실행하여도 좋다. 상기 위치 관계를 만족하는 또는 상이한 경사 성분 Y 또는 T가 없는 경우, 도11에 나타내는 검출 처리가 실행된다.
또, 도10은 2개의 경사 성분 Y가 세로 방향으로 서로 일정 거리 내에 있는 경우의 처리에 대해서 나타내지만, 2개의 경사 성분 T가 가로 방향으로 서로 일정 거리 내에 있는 경우의 처리를 나타내며, 처리는 도10a 및 10b의 경우와 같다. 또한, 도11은 경사 성분 Y의 검출 처리를 나타내지만, 경사 성분 T의 검출 처리는 경사 성분 Y의 처리와 동일하다.
도10a에 나타낸 바와 같이, 2개의 경사 성분의 거리가 일정치 이하이기는 하지만 세로 방향으로 이간하고 있는 경우, 해당 2개의 경사 성분 간에 존재하는 패턴을 조사한다. 해당 패턴이 직선의 특징을 나타내는 패턴이 아닌 경우, 이하의 처리는 생략된다. 직선의 특징을 나타내는 패턴인 경우, 해당 2개의 경사 성분 Y 간에 가상적으로 직선을 상정하여, 해당 2개의 경사 성분 Y를 둥근 모서리 후보 영역인 것으로 판정한다. 가상적인 직선은 괴선 후보 영역인 것으로 취급된다. 다음에, 괴선 후보 영역 내에 존재하는 화상 패턴 S가 직선의 특징을 나타내는 패턴인가 아닌가가 조사된다. 직선의 특징을 나타내는 경우, 해당 영역은 괴선으로서 추출되어, 양단의 경사 성분 Y는 둥근 모서리 후보 영역으로서 추출된다. 이 처리에 의해, 문자의 일부분을 둥근 모서리로서 잘 못하여 추출하는 것을 방지할 수 있다. 따라서, 2개의 경사 성분 Y가 일정치 내의 세로 방향으로(또는 2개의 경사 성분 T가 일정치 내의 가로 방향으로) 위치 관계에 있는 경우에는 이들 간에 직선 성분이 거의 존재하지 않고 대략 원호상으로 되어 있더라도, 둥근 모서리 후보 영역을 정확히 추출할 수 있다. 이것은 도19a에 나타내는 장표의 경우에 상당한다.
해당 패턴 S가 직선의 특징을 나타내는 패턴인가 아닌가를 조사하는 처리(직선 검출 처리)는 주지의 직선 검출 처리를 사용함으로써 실행된다. 주지의 직선 검출 처리로서는 예컨대, 본원 출원인이 제안한 특개평10-334185호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 화소 또는 요철도의 검출에 의한 직선 판정이 실행된다. 이 처리에 의해, 요철도가 작은 직선이나 요철도가 큰 직선을 구별하는 것이 가능하게 되어, 직선의 특징을 나타내는 패턴인가 아닌가를 정확히 조사할 수 있다.
이제, 해당 화소의 검출 및 요철도에 의한 직선 판정 처리에 대해서 간단히 설명한다. 처음에, 입력된 화상 데이터(12)의 해당 조사 대상의 화상 패턴 S가 연장되는 방향(세로 또는 가로 방향)으로 화소(패턴으로서 입력된 흑화소)를 검출한다. 다음에, 해당 검출 방향에 화소가 존재하는 한, 해당 검출 방향으로 검출을 계속한다. 이 경우, 화소의 검출 방향은 변화하지 않는다. 한편, 해당 검출 방향으로 화소가 존재하지 않는 경우에 한하여, 해당 검출 방향의 경사 방향에 있는 화소를 검출한다. 이 경우, 화소의 검출 방향이 변화한다. 해당 검출 방향의 변화 회수가 카운트된다.
다음에, 화소의 검출 방향의 변화 회수의 값에 따라서, 해당 패턴 S가 직선의 특징을 나타내는 패턴인가 아닌가가 판정된다. 해당 패턴 S가 직선이면 대략 동일의 방향으로 검출이 행하여지기 때문에 화소의 검출 방향의 변화 회수의 값이 작고, 직선이 아니면 해당 값이 크다. 그래서, 사전에 경험적으로 직선 판정의 임계치를 적절한 값으로 정함으로써 이것을 사용하여 직선으로 할 지 여부를 판정한다. 이러한 화소의 검출 및 요철도에 의한 직선 판정 처리를 사용함으로써 대상으로 하는 패턴 S가 직선인가 아닌가를 정확히 판정할 수 있다.
또, 도10a에 나타내는 경우에는, 해당 2개의 영역 Y 간에 존재하는 패턴 S에 대해서 직선 검출 처리를 실행하는 일없이, 둥근 모서리가 접근할 때 존재 영역이라고 판단하여도 좋다. 이 경우, 2개의 영역 Y 간의 직선(괴선)은 상술한 방법으로 작성하여도 좋고, 또는 해당 2개의 영역 Y 간의 패턴의 존재의 유무에 관계없이 작성하여도 좋다.
도10b에 나타낸 바와 같이, 2개의 영역 Y 간이 접촉하고 있든지 또는 중첩되어 있는 경우, 해당 2개의 영역 Y가 둥근 모서리 후보 영역인 것으로 취급된다. 이제, 접촉이라는 2개의 경사 성분 Y를 구성하는 화소가 인접하고 있는 경우를 말하고, 중첩이라는 것은 2개의 경사 성분 Y를 구성하는 화소가 중복하고 있는 경우를 말한다. 이러한 상태는 2개의 가로 직선에 끼여진 세로 직선의 성분이 지나치게 짧기 때문에, 직선으로서 추출되지 않은 경우이다. 따라서, 이 처리는 2개의 영역 Y 간 간격이 직선으로서 추출되는 최소 길이 이하인 경우에 실행된다. 이 처리에 의해, 2개의 경사 성분 Y가 상하 방향으로 또는 2개의 경사 성분 T가 좌우 방향으로 접촉 또는 중첩하는 경우에는 이들 간에 직선 성분이 거의 존재하지 않고 대략 원호상으로 되어 있어도, 둥근 모서리 후보 영역을 정확히 추출할 수 있다. 이것은 도19b에 나타내는 장표의 경우에 상당한다.
다음에, 제3 처리로서, 검출 처리가 실행된다(스텝 S32-3). 검출 처리는 도11에 나타낸 바와 같이, 경사 성분 Y 또는 T로부터 일정 거리 내에 있는 상이한 경사 성분 Y 또는 T가 존재하지 않는 경우에 실행된다.
도11에 나타낸 바와 같이, 경사 성분 Y1으로부터 일정 거리 이내의 위치에 어떤 다른 경사 성분 Y 또는 T가 존재하지 않는 경우, 해당 경사 성분 Y1의 단부에 짧은 직선 성분이 존재하는지 아닌지가 조사된다. 구체적으로는 경사 성분인 경우에는 세로 직선이 검출되고, 경사 성분 T의 경우에는 가로 직선이 검출된다. 이제, 해당 짧은 직선의 존재를 조사하는 처리(짧은 직선 검출 처리)는 주지의 짧은 직선 검출 처리에 의해 행하여진다. 주지의 짧은 직선 검출 처리로서는 예컨대, 본원 출원인이 제안한 특개평10-334185호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 화소의 검출 및 요철도에 의한 직선 판정 처리가 실행된다. 이 처리에 대해서는 "직선 검출 처리"로서 상술하였기 때문에, 그 설명을 생략한다.
해당 직선이 존재하는 경우, 해당 위치에 직선의 존재를 상정하여, 해당 영역을 둥근 모서리 후보 영역인 것으로 간주한다. 상정된 직선은 직선 추출 처리에서 추출한 직선과 같은 직선(괴선)인 것으로 취급된다. 이 처리에 의해, 추출된 경사 성분의 근처에 어떤 다른 경사 성분이 존재하지 않는 경우라도, 직선의 특징을 나타내는 패턴 S'가 존재하고 있으면, 해당 추출된 경사 성분은 둥근 모서리 후보 영역이라고 할 수 있다. 따라서, 가로 또는 세로 방향으로 직선 성분이 거의 존재하지 않고 장표의 모서리가 원호형으로 되어 있는 경우라도, 둥근 모서리 후보 영역을 정확히 추출할 수 있다. 또한, 짧은 괴선이라도 정확히 추출할 수 있다.
이제, 도11에 나타내는 경사 성분 Y2는 도9a∼9c에 나타내는 경우에 상당하며, 대비를 위해 나타낸다. 즉, 경사 성분 Y1은 상술의 중첩 처리 또는 근접 처리에 의하면 해당 경사 성분 Y1이 둥근 모서리 후보 영역이라는 것을 추출할 수 없는 경우이다.
이상의 각종의 처리에 의해 둥근 모서리 후보 영역으로서 추출된 각 경사 성분에 대해서, 직선 정보의 작성 처리가 실행된다(스텝 S33). 즉, 해당 경사 성분을 세로 방향 및 가로 방향으로 분해하여, 각각의 성분을 세로 방향 및 가로 방향의 직선(괴선)으로 가상한다. 일 예로서, 가로 방향의 경사 성분의 가로 방향의 좌표치를 상기 경사 성분이 접하는 직선의 세로 방향의 죄표치를 유지하면서, 상기 경사 성분이 접하는 가로 직선의 가로 방향의 좌표치로 변화시킴으로써, 가로 방향의 가상 직선을 얻는다. 동일의 처리로, 세로 방향의 가상 직선도 얻는다. 그 결과로서, 이들 2개의 직선의 존재를 나타내는 2개의 사각형 영역(도12에서 점선으로 나타낸 영역)이 작성된다. 이 처리에 의해, 가상적인 직선(사각형 영역)의 직선 정보가 작성된다. 직선 정보는 해당 가상적인 직선의 시점 및 종점(사각형 영역의 면적)을 나타내는 위치 좌표로 이루어진다. 이 후, 가상적인 직선과 도12에서 실선으로 나타내는 실제하는 직선(사각형 영역)을 통합하여, 그 결과에 의거하여 이하에 설명되는 셀 추출이 실행된다. 이 처리에 의해, 둥근 모서리 후보 영역으로서 추출된 경사 성분을 가상적인 직선으로서 처리할 수 있으므로, 둥근 모서리를 의식하지 않고, 셀추출을 실행할 수 있다.
또, 가상적인 직선(괴선)과 실제로 추출된 괴선의 위치 관계가, 서로 완전히 접촉 또는 중첩되지 않더라도 일정 거리 내에 있는 경우, 통합되어 1개의 직선(괴선)으로 된다. 이것은 세로 및 가로의 쌍방에 대해서 같다. 따라서, 이 통합 처리 이후의 처리에서는 실제의 괴선과 가상의 괴선이 동일의 처리로 취급되고, 둥근 모서리를 의식하지 않고, 셀추출을 실행할 수 있다.
또한, 이 직선 정보 작성 처리로서는 둥근 모서리 후보 영역으로서 추출된 경사 성분의 크기의 평균치를 산출하는 처리가 실행된다. 이 평균치는 후술하는 둥근 모서리 판정 처리에서 사용된다.
또한, 직선 정보 작성 처리는 이하에 진술하는 셀 추출 처리의 선 처리이기 때문에, 해당 셀 추출 처리에 포함시켜도 좋다. 즉, 셀 추출 장치(4)가 실행하도록 하여도 좋다.
이상의 처리의 결과, 도3의 직선 데이터(13)를 사용함으로써 도13의 화상 데이터(12)로부터 장표의 모서리의 둥근 모서리 후보 영역이 추출되고, 이에 대한 직선 정보가 작성된다. 이것이 도3의 둥근 모서리 후보 데이터(14)이다.
도13은 셀 추출 장치(4)에 의해 실행되는 셀 추출 처리에 대해서 설명한다. 도13에 나타내는 처리는 도4의 처리(스텝 S4)에 상당하고, 주지의 기술이다.
셀 추출 장치(4)는 화상 데이터(12)로부터 셀을 추출한다. 이 추출 처리는 주지의 어떠한 처리에 의해서도 좋다. 셀은 사방을 직선으로 둘러싼 영역이기 때문에, 2개의 가로 선(가로 테두리)과 2개의 세로 선(세로 테두리)으로 셀을 규정(추출) 할 수 있다. 이하에 그 일례를 나타낸다.
처음에, 가로 테두리를 판정하는 가로 테두리 판정 처리가 실행된다(스텝 S41). 가로 테두리 판정은 주지의 가로 테두리 판정 처리에 의해 행하여진다. 주지의 가로 테두리 판정 처리로서는 예컨대, 본원 출원인이 제안한 특개평9-50527호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 즉, 테두리의 상부로부터 일정한 순서로 1행을 구성하는 2개의 가로 선(쌍)을 판정하고, 이것을 가로 테두리로 한다.
이제, 해당 가로 테두리 판정 처리에 대해서 간단히 설명한다. 처음에, 직선 추출 처리(스텝 S2)에서 추출된 가로 선 중에서, 위로부터 순서로 2개의 가로 선을 선택하여, 이 들을 2개의 가로 선의 쌍의 후보로 한다.
다음에, 이 후보인 2개의 가로 선이, 동일한 길이이거나 또는 하부 직선 부분이 상부 직선보다 긴 관계(쌍의 조건)이면, 해당 후보를 그대로 2개의 가로 선의 쌍으로 한다. 하부의 직선 부분이 긴 경우, 해당 하부의 직선은 재차, 2개의 가로 선의 쌍의 후보로 할 수 있다.
한편, 후보인 2개의 가로 선이, 하부의 직선 부분이 짧은 관계이면, 더욱, 해당 하부의 직선과 그 하부의 직선을 새로운 2개의 가로 선의 쌍의 후보로 한다. 그리고, 쌍방의 직선의 길이의 관계를 조사하여, 상술한 쌍의 조건을 만족하는 해당 후보를 2개의 가로 선의 쌍으로 할 수 있을 때까지, 같은 처리를 되풀이 한다. 또, 하부의 직선의 더욱 아래쪽으로 상술한 쌍의 조건을 만족하는 직선이 완전히 존재하지 않는 경우, 해당 하부의 직선과 그 바로 상부의 직선을 2개의 가로 선의 쌍으로 한다.
다음에, 상술한 처리를 가장 하부의 직선에 대해서 행한 뒤, 해당 직선의 상부에 미처리의 직선이 남아 있는 경우, 해당 미처리의 직선과 재차 2개의 가로 선의 쌍의 후보로 할 수 있는 직선에 의거하여, 재차, 상술한 처리를 되풀이함으로써 2개의 가로 선의 쌍을 만든다. 이러한 가로 테두리 판정 처리를 사용함으로써 이후의 처리에서 행 등의 사각형 테두리를 구성하는 가로 테두리의 쌍(2개의 선의 쌍)을 정확히 판정할 수 있다.
그 후, 가로 테두리 판정 처리의 결과에 의거하여, 세로 테두리를 판정하는 세로 테두리 판정 처리가 실행된다(S42). 세로 테두리 판정 처리는 주지의 세로 테두리 판정 처리에 의해 행하여진다. 주지의 세로 테두리 판정 처리로서는 예컨대, 본원 출원인이 제안한 특개평950527호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 가로 테두리 판정 처리에서 쌍으로 된 2개의 가로 선에 의해 구성되는 간격마다(즉, 1행마다) 처리를 하여, 상하 양단이 2가로 선에 도달하는 추출된 세로 선을 세로 테두리로 한다. 이러한 세로 테두리 추출 처리를 사용함으로써 세로 테두리를 정확히 추출할 수 있다.
이 후, 가로 테두리 판정 처리 및 세로 테두리 판정 처리의 결과에 의거하여, 셀의 사각형 영역을 추출하는 사각형 추출 처리가 실행된다(스텝 S43). 사각형 추출은 주지의 사각형 추출 처리에 의해 행하여진다. 주지의 사각형 추출 처리로서는 예컨대, 본원 출원인이 제안한 특개평9-50527호 공보에 기재된 기술이 사용된다. 이 특개평9-50527호 공보에 기재된 처리 기술에 의하면, 가로 테두리 판정 처리 및 세로 테두리 판정 처리에서 판정된 가로 테두리 및 세로 테두리에 사방을 둘러싸인 영역을 사각형 영역으로서 추출한다. 즉, 가로 테두리 판정 처리에서 쌍으로 된 2개의 가로 선과, 세로 테두리 추출 처리에서 해당 가로 테두리에 달하는 세로 테두리로 된 2개의 세로 선으로 둘러싸인 영역을 사각형 영역으로서 추출한다. 이러한 사각형 추출 처리를 사용함으로써 셀을 정확히 추출할 수 있다.
이상의 처리의 결과, 도3의 화상 데이터(13)를 사용함으로써 도3의 화상 데이터(12)로부터 장표 등의 셀이 추출된다. 이것이 셀 데이터(15)이다. 이 처리에서, 단계 S33에서 작성된 직선 정보에 의해 표시되는 가상의 직선을 사용함으로써 도12∼도15에 나타낸 바와 같은 장표의 모서리의 둥근 모서리를 포함하는 셀도, 마찬가지로, 사각형 테두리로서 추출된다.
도14는 둥근 모서리 판정 장치(5)에 의해 실행되는 둥근 모서리 판정 처리의 플로우를 나타낸다. 도14에 나타내는 처리는 도4의 스텝 S5에 상당하고, 본 발명에 특징적인 처리이다. 둥근 모서리 판정 처리는 화소 밀도 변화 검출 처리, 대칭성 처리 및 정합 처리로 이루어진다.
처음에, 제1 처리로서, 추출된 셀의 모서리의 화소 밀도 변화에 따라서 해당 모서리의 형상을 판정하는 화소 밀도 변화 검출 처리가 실행된다(스텝 S51). 즉, 화소 밀도 변화 검출 처리는 셀의 모서리 형상에 주목하여, 화소 밀도 변화에 의거하여 둥근 모서리를 판정하는 처리이다. 즉, 장표의 모서리의 형상에 따라서 둥근 모서리를 판정하는 처리 모드이다. 모서리에 긁힘이 있는 경우라도 둥근 모서리를 판정할 수 있다. 이렇게 해서, (화소 밀도)=(대상 영역 내의 흑화소의 총수)/(대상 영역 내의 화소의 총수)이된다. 스텝 S31에서, 흑화소는 해당 경사 성분 Y 또는 T로서 추출된 선분을 구성하는 화소이다.
도15a 및 15b는 모서리의 일례를 나타낸다. 도15b는 도15a의 모서리의 확대도이다. 도15a,15b에 나타낸 바와 같이, 셀의 모서리에서는 낮은 삼각 영역 a, 높은 사다리꼴 영역(사선을 근 부분) b, 낮은 사다리꼴 영역 c의 순서로 나란히 배열된다. 즉, 화소 밀도는 "저 → 고 → 저"의 순서로 변화한다. 그래서, 추출된 셀을 구성하는 2개의 직선으로 형성되는 모서리에서, 해당 2개의 직선이 만드는 정점에서 떠나는 방향으로 상술한 순서로 화소 밀도가 변화하고 있는 경우, 해당 부분은 둥근 모서리인 것으로 판정한다. 이 화소 밀도가 "저 → 고 → 저"의 순서로 변화하는 화소의 특징을 사용함으로써 모서리에 긁힘이 있더라도 둥근 모서리를 판정할 수 있다.
화소 밀도의 고저를 판단하기 위한 임계치(또는 파라메터)가 예컨대 해당 장표(입력 화상)의 입력 시에 사용자에 의해 정해진다. 사용자의 입력이 없는 경우, 사전에 정해진 값으로 된다. 도15a 및 15b로부터 아는 바와 같이, 영역 a의 화소 밀도는 지극히 낮다(이 예로서는"0" 이다). 따라서, 영역 a 의 임계치는 지극히 작게 되어, 화소 밀도가 해당 임계치보다도 작은 경우에, 화소 밀도가 낮은 것(저)으로 판단된다. 영역 b의 화소 밀도는 소정의 수준에 달한다. 이 소정의 수준은 경험적으로 어느 정도 정확히 알 수 있다. 따라서, 영역 b 의 임계치는 해당 수준보다 작은 값으로 되어, 화소 밀도가 해당 임계치보다도 큰 경우에 화소 밀도가 높은 것(고)으로 판단된다. 영역 c의 화소 밀도는 영역 a보다는 높지만, 영역 b보다는 꽤 낮다. 이 화소 밀도는 경험적으로 어느 정도 정확히 알고 얻는다. 따라서, 영역 c 의 임계치는 영역 a 의 임계치보다는 높지만, 영역 b보다는 꽤 작게 되어, 화소 밀도가 해당 임계치보다도 작은 경우에, 화소 밀도가 낮은 것으로 판단된다.
화소 밀도 검출 처리에서, 화소 밀도를 산출하는 영역은 둥근 모서리 후보 영역 검출 장치(3)에서 산출된 둥근 모서리 후보 영역으로서 추출된 경사 성분의 크기의 평균치를 기준하여 설정된다. 예컨대, 해당 평균치보다 소정의 비율만큼 큰 값이, 상기 사다리꼴 영역의 하변의 값으로 설정된다. 이 처리에 의해, 화소 밀도 변화 검출 처리의 영역을 작게 할 수 있으므로, 화소 밀도 변화 검출 처리에 요하는 시간을 단축할 수 있다. 사다리꼴 영역 c의 하변은 해당 사각형 영역을 정하는 세로 및 가로의 직선에 대하여, 도15a 및 15b에 나타낸 바와 같이 45。로 교차한다. 사다리꼴 영역 b의 상변 및 하변도 같다.
또, 화소 밀도 검출 처리에서, 셀을 구성하는 2개의 직선이 만드는 정점을 포함하는 삼각 영역 a의 화소 밀도가 해당 임계치보다도 작은 경우에, 해당 모서리가 모서리라고 판단하여도 좋다. 또한, 영역 a의 화소 밀도가 영역 b의 화소 밀도보다도 충분히 작은 경우(또는 양자 간에 사전에 정해진 차가 있는 경우)에, 해당 모서리가 모서리라고 판단하여도 좋다. 또한, 영역 a, b 및 c의 화소 밀도가 "저 → 고 → 저"로 변화하여, 영역 a의 화소 밀도가 영역 c의 화소 밀도보다도 작은 경우에, 해당 모서리가 둥근 모서리라고 판단하여도 좋다.
이 처리 후, 제2 처리로서, 대칭성 처리가 실행된다(스텝 S52). 도20의 입력된 화상 데이터(12)가 항상 양호한 상태라고는 할 수 없다. 즉, 괴선의 긁힘이라든지 찌그러짐, 괴선에의 문자의 접촉 등의 원인에 의해, 화소 밀도 변화 검출 처리만으로 모든 둥근 모서리를 정확히 추출할 수 있다고는 할 수 없다. 그래서, 둥근 모서리 추출의 대상인 표 구조의 규칙성을 사전에 알고 있는 경우, 해당 규칙성을 이용함으로써 보다 높은 정밀도로 둥근 모서리의 추출을 실행할 수 있다.
대칭성 처리는 장표의 표 구조의 규칙성에 주목하여, 모서리의 동일의 형상이 규칙적인 반복(둥근 모서리의 방향은 다름)을 이용하여 둥근 모서리의 판정을 실행하는 처리이다. 일반적으로 사용되는 장표의 대부분은 도16a에 나타낸 바와 같이 그 외주의 모서리의 전체가 둥근 모서리이고, 반대로, 도16b에 나타낸 바와 같이, 모서리의 전체가 둥근 모서리가 아니다. 그 외주의 모서리의 일부만이 둥근 모서리인 장표는 거의 존재하지 않는다. 그래서, 이 모서리의 대칭성을 이용하여, 보다 높은 정밀도로 둥근 모서리를 추출할 수 있다.
처음에, 전 처리로서 해당 규칙성을 사전에 알고 있는지 아닌지가 조사된다(스텝 S52-1). 해당 장표가 규칙성을 가진 표 구조를 갖는 것은 예컨대 해당 장표(도20의 입력 화상(11))의 입력 시에 사용자에 의해 입력된다.
이 처리 후, 도16a에 나타내는 장표에 대해서 규칙성을 갖는 것이 지시되어 있는 경우, 해당 규칙성(대칭성)을 이용한 처리를 실행한다(스텝 S52-2). 즉, 예컨대, 4개의 모서리가 있는 해당 장표에서 상술한 화소 밀도 변화 검출 처리에서 하나가 둥근 모서리인 것으로 판단되면, 상이한 3개의 모서리도 둥근 모서리일 가능성이 높다고 판단한다. 다음에, 해당 상이한 3개의 모서리에 대해서, 화소 밀도 변화 검출 처리의 제한을 늦춘 후에, 재차, 화소 밀도 변화 검출 처리를 하여, 이 결과를 최종적인 처리 결과로 한다. 따라서, 대칭성 처리는 실제는 완화된 일정 조건 하의 화소 밀도 변화 검출 처리의 반복이다. 상기 조건의 완화는 예컨대 임계치(또는 파라메터)를 적절히 변경하는 것에 의해 실행된다.
예컨대, 도15a 및 15b에 나타낸 둥근 모서리에서, 이에 교차하도록 문자가 기입되어 있는 경우, 영역 a 및 영역 c의 화소 밀도는 해당 영역의 임계치보다도 크게 된다. 이 경우, 화소 밀도가 영역 a, b 및 c 에 대해서 높으므로, 변화하지 않는다. 상이한 경우로, 해당 둥근 모서리에 지극히 인접하여 문자가 기입되어 있는 경우, 영역 c의 화소 밀도가 해당 임계치보다도 크게 된다. 이 경우, 화소 밀도는 영역 a, b 및 c 에 대해서 "저 → 고 → 고"순으로 된다. 그래서, 영역 a 및 영역 c의 임계치를 사전에 정해진 값만큼 높게 변화한다. 따라서, 화소 밀도가 영역 a, b 및 c 에 대해서 "저 → 고 → 저"로 변화하는 것이 된다. 결과적으로, 둥근 모서리의 판정 조건이 완화되어, 제1 단계에서 둥근 모서리로서 판정되지 않는 둥근 모서리도 둥근 모서리인 것으로 판정된다.
또, 규칙성을 갖는 것이 지시되어 있는 경우라도, 사전에 정해진 개수의 둥근 모서리가 판정되어 있지 않으면, 대칭성 처리(스텝 S52-2)는 실행되지 않는다. 이 경우는 장표의 외주의 모서리의 모두에 전혀 둥근 모서리가 없다고 생각되기 때문이다. 대칭성 처리를 개시하기 위한 둥근 모서리의 개수는 사전에 정해진다. 이 개수는 통상 1개로 되지만, 2개 이상이어도 좋고, 예컨대 도20의 입력 화상(11)의 입력 시에 사용자에 의해 입력된다.
또, 대칭성 처리(스텝 S52-2)는 복수 회 되풀이하여 실행하여도 좋다. 즉, 영역 a 및 영역 c의 임계치를 소정 폭만큼 크게 변화시켜도, 둥근 모서리가 판정될 수 없는 경우, 영역 a 및 영역 c의 임계치를 더 동일한 소정 폭만큼 크게 변화시켜 화소 밀도 변화 검출 처리를 행하여도 좋고, 이것을 되풀이하여도 좋다. 이 처리에 의해, 둥근 모서리에 문자가 접촉하여도 확실히 둥근 모서리를 판정할 수 있다.
이상과 같이, 장표의 모서리의 형상에 따라서 둥근 모서리를 판정하는 처리 모드 이외에, 장표의 외주의 모서리의 형상의 대칭성을 사용하여 둥근 모서리를 판정하는 처리 모드에 의해, 각 모서리마다 둥근 모서리인가 아닌가가 판정된다. 이 처리에 의해, 사전에 장표의 규칙성을 알고 있는 경우에는, 보다 고정밀도로 둥근 모서리를 판정할 수 있다. 즉, 화소 밀도 변화 검출 처리에서 둥근 모서리가 사전에 정해진 개수 이상 판정된 경우에는, 그 처리 후의 대칭성을 사용한 처리 모드에서, 화소 밀도 변화 검출 처리에서 둥근 모서리인 것을 판정할 수 없던 모서리에 대해서도 재차 화소 밀도 변화 검출 처리를 실행한다. 이 처리에 의해, 정확하게 둥근 모서리인 것을 판정할 수 있다.
또, 스텝 S52-1에서 규칙성이 탐지되지 않은 경우에는, 스텝 S52-2의 실행은 생략된다. 즉, 화소 밀도 변화 검출 처리에서 추출한 둥근 모서리만을 둥근 모서리인 것으로 판정한다. 따라서, 이 경우, 그 외주의 모서리의 일부만이 모서리인 표 구조가 검출된다.
또한, 해당 장표가 규칙성을 갖는가 아닌가의 지시 입력을 예컨대 규칙성을 갖는 모서리의 위치 또는 수를 지정하여 입력하도록 하여도 좋고, 또한 규칙성을 갖는 모서리의 개수는 어느 것으로 하여도 좋다.
이 처리 후, 제3 처리로서, 정합 처리가 실행된다(스텝 S53). 화소 밀도 변화 검출 처리 및 대칭성 처리에 의하면 점선 내에서, 점과 점 간격이 넓은 것에 대해서는 처리할 수 없다. 이것은 해당 점 간 간격의 존재에 의해 화소 밀도의 변화가 정확히 추출할 수 없기 때문이다. 그래서, 화소 밀도 변화 검출 처리(또는 화소 밀도 변화 검출 처리 및 대칭성 처리의 쌍방)에서 둥근 모서리인 것으로 판정되지 않은 모서리에 대해서, 정합 처리가 실행된다. 정합 처리는 발생시킨 패턴과 화상 패턴(또는 근사화시킨 패턴)과의 정합을 검출함으로써 모서리의 형상을 인식하는 처리이다. 정합 처리를 실행함으로써 점 간 간격이 넓은 점선에 대해서도 둥근 모서리를 판정할 수 있다.
정합 처리는 도17a, 17b,17c 및 17d에 나타낸 바와 같이, 2개의 가로 선 간의 거리(2세로 선과 같음) 또는 가로 선과 세로 선 간의 거리가 사전에 정해진 값 이하인 경우에, 실행된다. 도17a 및 17c는 서로 대응한다. 도17c 및 17d는 서로 대응한다. 상기 거리가 일정치 이하의 경우에만 정합 처리를 실행함으로써 정합 처리의 회수를 적게 하여 처리를 고효율로 할 수 있다.
정합 처리에서, 처음에, 해당 2개의 직선의 단부와 단부 간을 맺는 패턴이 생성된다(스텝 S53-1). 즉, 정합에 사용하는 패턴은 사전에 준비되는 것은 아니고, 그 때마다 생성된다. 따라서, 다수의 패턴을 기억시킬 필요가 없고, 그 때문의 대용량의 메모리도 필요 없다. 패턴의 생성에는 f(x)=a0Xn+a1Xn-1+…+an과 같이 n차 함수가 사용된다. 예컨대, 도17a는 가로 선과 가로 선(또는 세로 선과 세로 선)의 단부가 서로 가까운 위치에 존재하는 예이다. 이 경우, 2개의 가로 선의 단부 a, b에 대한 패턴 a ' b '가 생성된다(도17c 참조). 생성되는 패턴 a ' b '는 반원이다. 도17b에 나타내는 상태는 세로 선과 가로 선의 단부가 서로 가까운 위치에 존재하는 예이다. 이 경우, 세로 선과 가로 선의 단부 A, B에 대한 패턴 A ' B '가 생성된다. 생성되는 패턴 A ' B '는 90。의 원호이다. 생성된 패턴 a ' b ' 또는 A ' B '와 화상 패턴이 일치하면, 해당 모서리는 둥근 모서리인 것으로 판정된다.
다음에, 생성된 패턴과 도20의 입력된 화상 데이터(12) 상의 화상 패턴(입력 패턴)이 비교된다(스텝 S53-2). 이 비교 결과 패턴이 일치하면, 해당 모서리는 해당 생성된 패턴과 동일한 형상을 갖는 둥근 모서리인 것으로 취급된다. 이 처리에 의해, 긁힌 실선이라든지 간격이 넓은 점선에 대해서도 정확히 둥근 모서리를 판정할 수 있다.
또, 해당 화상 패턴에 근사화시킨 패턴(근사화 패턴)을 생성하여, 이 것과 입력 패턴을 비교하여도 좋다. 근사화 패턴은 해당 화상 패턴을 사각형 근사화함으로써 얻는다. 근사화 패턴을 사용함으로써 입력 패턴이 점과 점 간격이 넓은 점선이라든지 일부가 긁힌 모서리일지라도, 정확히 둥근 모서리를 판정할 수 있다.
이상과 같이, 정합 처리는 화소 밀도 검출 처리 및 대칭성 처리에 의하면 둥근 모서리를 판정하는 것이 불가능한 경우에만 실행된다. 이 처리에 의해, 장표의 모서리의 형상(또는 그 규칙성)에 따라서 둥근 모서리를 판정하는 처리 모드에 의하면 둥근 모서리인가 아닌가를 판정하는 것이 불가능한 경우(예컨대, 점선의 경우)라도, 둥근 모서리를 정합처리로 판정할 수 있다. 또한, 본 발명에서는 패턴 생성 처리의 회수를 적게 할 수 있으므로, 처리의 효율을 높일 수 있다.
이상의 처리의 결과, 도18에 나타낸 바와 같이, 도20의 화상 데이터(12)로부터 장표의 모서리의 둥근 모서리가 추출된다. 이것이 둥근 모서리 데이터(16)이다.
도18은 문자 인식 영역 검출 장치(6)에 의해 실행되는 문자 인식 영역 검출 처리에 대해서 나타낸다. 이 처리는 도4의 스텝 S6이고, 주지의 처리이다.
도18은 어떤 모서리가 둥근 모서리 판정 처리에서 둥근 모서리인 것으로 판정된 경우에서, 해당 둥근 모서리와 셀 C1과의 관계를 나타낸다. 도18에 나타낸 바와 같이, 해당 판정된 둥근 모서리는 셀 C1의 안쪽에 포함된 상태가 된다. 또, "a b c"는 장표에 기입된 문자이다. 다음에, 문자 인식 영역 검출 장치(6)는 처음에, 셀 C1의 바로 안쪽의 점선에 나타내는 사각형의 영역을 가상의 문자 인식 영역 C2로 한다. 이 처리 후, 문자 인식 영역 검출 장치(6)는 가상의 문자 인식 영역 C2로부터 해당 둥근 모서리가 존재하는 영역(사선을 근 삼각형의 영역) C3을 제외함으로써 참된 문자 인식 영역을 판정한다. 이 처리에 의해, 해당 둥근 모서리가 문자라고 인식되는 것을 방지할 수 있게 되어, 문자"a b c"를 정확하게 인식할 수 있다.
이상, 본 발명을 1개의 실시예에 의해 설명하였지만, 본 발명은 그 주지의 영역 내에서 여러 가지의 변형이 가능하다.
예컨대, 표 화상 처리 장치(100)는 상술한 구성을 모두 구비할 필요는 없고, 적당히 간단한 구성으로 하여도 좋다. 특히, 직선 추출 장치(2), 둥근 모서리 후보 영역 검출 장치(3), 셀 추출 장치(4), 둥근 모서리 판정 장치(5) 및 문자 인식 영역 검출 장치(6)는 소프트웨어에 의해서 실현되기 때문에, CPU의 부담이 크고, 메모리도 크게 된다. 그래서, 각 장치의 구성을 간소화 하여도 좋다. 이 경우, 둥근 모서리의 추출 정밀도는 다소 뒤떨어지지만, 처리 속도는 고속화할 수 있다.
일례로서, 둥근 모서리 후보 영역 검출 처리의 후보 검출 처리로서 중첩 처리(스텝 S32-1)만을 실행하여, 둥근 모서리 판정 처리로서 화소 밀도 변화 검출 처리(스텝 S51)만을 실행하도록 한다. 이 경우, 중첩 처리만이 실행되기 때문에, 사전에 정해진 거리에 위치하는 세로 방향의 직선과 가로 방향의 직선으로 된 쌍(도9에 나타낸 예)만이, 둥근 모서리의 처리 대상으로 된다.
상이한 예로서, 상술한 예에서, 둥근 모서리 후보 영역 검출 처리의 후보 검출 처리로서, 중첩 처리(스텝 S32-1)에 대신하여, 근접 처리(스텝 S322)만, 검출 처리(스텝 S323)만, 또는 이들의 3개의 처리로부터 선택한 2개의 처리만을 실행하도록 하여도 좋다. 둥근 모서리 판정 처리로서는 화소 밀도 변화 검출 처리(스텝 S51)만을 실행하도록 한다. 근접 처리의 경우에는, 도10에 나타내는 예만이 둥근 모서리의 처리 대상이 되고, 검출 처리의 경우에는, 도11에 나타내는 예만이 둥근 모서리의 처리 대상으로 된다.
반대로, 상술한 예에서, 둥근 모서리 판정 처리로서, 화소 밀도 변화 검출 처리(스텝 S51)만을 대신하여, 화소 밀도 변화 검출 처리 및 대칭성 처리(스텝 S52), 또는 화소 밀도 변화 검출 처리 및 정합 처리(스텝 S53)를 실행하도록 하여도 좋다. 후보 검출 처리로서는 중첩 처리(스텝 S321)만을 실행하도록 한다.
이상의 설명으로부터 알 수 있는 바와 같이, 후보 검출 처리 및 둥근 모서리 판정 처리는 각각, 상술한 복수의 처리로부터 적당히 선택하여 실행할 수 있다. 따라서, 이들의 처리는 상술한 예 이외에도 여러 가지 조합할 수 있다.
더욱, 상이한 예로서, 둥근 모서리 후보 영역 검출 장치(3) 및 둥근 모서리 판정 장치(5)만을 실시예에서 설명한 구성으로서, 상이한 각 장치는 상술한 이외의 주지의 수단에서 실현하여도 좋다. 이 경우라도, 둥근 모서리 후보 영역 검출 장치(3) 및 둥근 모서리 판정 장치(5)의 구성은 상술한 간단한 구성으로 하여도 좋다.
또한, 예컨대, 도4에 나타내는 처리의 플로우를 나타내는 도면에서, 처리의 순서를 여러 가지로 변경하는 것이 가능하다. 즉, 직선 추출 처리(스텝 S2)후에, 둥근 모서리 후보 영역 검출 처리(스텝 S3)를 실행하는 일없이, 셀 추출 처리(스텝 S4)를 실행하는 셀의 형상을 판정하고, 그 뒤에 추출한 셀의 모서리에 대해서 둥근 모서리 후보 영역 검출 처리(스텝 S3) 및 둥근 모서리 판정 처리(스텝 S5)를 이 순서로 하여도 좋다. 반대로, 직선 추출 처리(스텝 S2) 및 둥근 모서리 후보 영역 검출 처리(스텝 S3)후에, 셀 추출 처리(스텝 S4)를 실행하는 일없이, 둥근 모서리 판정 처리(스텝 S5)를 행하여 둥근 모서리의 형상을 판정하고, 그 뒤에 셀 추출 처리(스텝 S4)를 하도록 하여도 좋다. 더욱, 이러한 처리 순서를 변경하는 이외에, 상술한 바와 같은 둥근 모서리 후보 영역 검출 장치(3) 및 둥근 모서리 판정 장치(5)의 간단한 구성을 더불어 채용할 수 있다.
또한, 예컨대, 어느 특정한 처리의 결과에 따라서, 도4에 나타내는 처리의 순서를 여러 가지 변경하는 것이 가능하다. 즉, 스텝 S31에서 추출된 모든 경사 성분 Y 및 경사 성분 T의 크기(경사선의 길이)가 사전에 정해진 값보다 작은 경우, 후보 영역 검출 처리(스텝 S32) 및 직선 정보 작성 처리(스텝 S33)를 생략하고, 셀 추출 처리(스텝 S4), 스텝 S31을 제외하는 둥근 모서리 후보 영역 검출 처리(스텝 S3), 둥근 모서리 판정 처리(스텝 S5)의 순서로 실행하여도 좋다. 더욱, 이 경우, 셀 추출 후의 후보 검출 처리(스텝 S32)를 생략하여 실질적으로 둥근 모서리 후보 영역 검출 처리(스텝 S3)를 생략할 수 있다. 이렇게 하여도, 둥근 모서리의 면적이 작기 때문에, 직접 둥근 모서리 판정 처리를 할 때의 처리 부담이 커지지 않는다.(
(제2 실시예)
도20은 표 화상 처리 장치의 구성도이고, 본 발명의 표 화상 처리 장치(100)의 상이한 일례의 구성을 나타내고, 도2에 나타내는 표 화상 처리 장치(100)에 대응한다. 도20의 표 화상 처리 장치(100)는 기본적으로는 도3에 나타내는 표 화상 처리 장치(100)와 같은 구성을 갖지만, 직선 추출 장치(2)가 더욱, 괴선 판정 처리부(20)를 구비하는 점만이 다르다. 괴선 판정 처리부(20)는 입력 화상(11)(또는 도20의 화상 데이터(12))으로부터 추출된 세로 및 가로 방향의 괴선 후보에 대해서, 입력 화상(11)으로부터 추출된 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴에 따라서, 서로 상이한 값의 복수의 임계치 중 어느 하나를 사용하여, 해당 괴선 후보의 요철도를 판정함으로써 해당 괴선 후보가 괴선인가 아닌가를 판정한다. 실제로는 일례로서, 후술하는 바와 같이, 낮은 값의 제1 임계치(21) 또는 높은 값의 제2 임계치(22)의 2개의 임계치를 사용한다.
도20의 표 화상 처리 장치(100)는 기본적으로는 도3의 표 화상 처리 장치(100)와 같은 처리를 실행하고, 직선 추출 장치(2)의 직선 데이터(13)의 작성 처리(괴선 후보의 추출 처리)만이 일부 다르다. 이하에서, 표 화상 처리 장치(100)와 같은 처리에 대해서는 그 설명을 생략하고, 직선 추출 장치(2)의 처리를 중심으로 설명한다.
도21은 괴선 판정 처리부(20)의 구성을 나타낸다. 도20 및 도21에 나타낸 바와 같이, 괴선 판정 처리부(20)는 직선 추출 장치(2)에 설치된다. 괴선 판정 처리부(20)는 직선 추출 장치(2)에 의해 추출한 세로 및 가로 방향의 직선을 괴선 후보로서 사용하고, 해당 괴선 후보가 괴선인가 아닌가를 판정한다. 따라서, 괴선 판정 처리부(20)의 처리의 대상이 되는 것은 도5에 나타내는 처리에서, 직선 추출 장치(2)가 연결 패턴 추출 처리(스텝 S21) 내지 점선 추출 처리(스텝 S25)까지를 실행한 결과로서 얻어지는 데이터이다. 연결 패턴 추출 처리 내지 점선 추출 처리는 주지의 어느 처리에 의해서 실현해도 좋다. 이 데이터는 상기 처리에 의해서 괴선의 후보로서 추출된 직선 및 점선으로 이루어지기 때문에, 본 예에서는 괴선 후보 데이터(13A)라고 부르기로 한다. 괴선 판정 처리부(20)는 괴선 후보 데이터(13A)에 대해서 괴선 판정 처리를 실행함으로써 괴선일 가능성이 낮은 것을 괴선 후보 데이터(13A)에서 제외하여 직선 데이터(13), 즉, 괴선 데이터를 작성한다.
괴선 판정 처리부(20)는 직선 추출 장치(2)의 일부이기 때문에, 해당 표 화상 처리 장치(100)의 주 메모리 상에 존재하고, CPU 상에서 실행되는 것에 의해 해당 처리를 실행 처리 프로그램에 의해서 실현한다. 괴선 판정 처리 프로그램은 직선 추출 처리 프로그램의 일부이다. 직선 추출 장치(2)의 실행 처리에서, 괴선 판정 처리부(20)의 실행 처리는 본 발명에서 특유의 처리이고, 상이한 처리(연결 패턴 추출 처리 내지 점선 추출 처리)는 주지의 처리이다.
또, 도3의 표 화상 처리 장치(100)에서도, 연결 패턴 추출 처리(스텝 S21) 내지 점선 추출 처리(스텝 S25)까지를 실행한 뒤에, 해당 처리의 결과로 얻어진 괴선 후보로부터 괴선일 가능성이 낮은 영역을 판정하여 해당 후보로부터 제외하는 괴선 판정 처리를 실행하도록 하여도 좋다. 이 괴선 판정 처리는 예컨대, 특개평10-334185호 공보에 기재된 기술에 의한다. 이 기술에 의하면, 화소의 검출 및 요철도에 의한 직선(괴선) 판정 처리가 행하여진다. 즉, 추출된 괴선 후보의 화소 검출 처리를 실행함으로써 화소의 요철도를 산출하여, 해당 요철도가 어느 일정한 값(임계치) 이상이면 화상 패턴을 괴선 이외(즉, 문자)의 패턴인 것으로 판정하고, 일정한 값보다 작으면 괴선인 것으로 판정한다. 이 기술에 대해서는 상술하였기 때문에, 그 설명을 생략한다.
도21에 나타낸 바와 같이, 괴선 판정 처리부(20)는 화소 밀도 판정 처리부(23)와 괴선 폭 판정 처리부(24)로 이루어진다. 화소 밀도 판정 처리부(23) 및 괴선 폭 판정 처리부(24)는 각각, 판정 처리에 쓰기 위한 제1 및 제2 임계치(요철도의 임계치)(21 및 22)를 사전에 갖는다. 화소 밀도 판정 처리부(23)와 괴선 폭 판정 처리부(24)의 처리는, 양자의 처리가 다르기 때문에, 그들의 임계치는 값이 다르지만 이 설명에서는 특별한 구별을 하지 않는다. 이는 제2 임계치(22)에 대해서도 같다. 제1 임계치(21)는 낮은 임계치를 의미하고, 제2 임계치(22)는 높은 임계치를 의미한다. 화소 밀도 판정 처리부(23) 및 괴선 폭 판정 처리부(24)의 제1 및 제2 임계치(21,22)의 값은 각각의 실행 처리에 응한 적절한 값으로 사전에 설정된다. 이들의 값은 각각, 경험적(또는 통계적, 실험적)으로 적절한 값으로 정해진다.
괴선 판정 처리부(20)에서, 주어진 괴선 후보 데이터(13A)의 처리 전에 화소 밀도 판정 처리부(23)와 괴선 폭 판정 처리부(24)의 어떤 것을 행하여도 좋다. 두 경우에서, 괴선 후보 데이터(13A)에서 괴선일 가능성이 낮은 것을 제외할 수 있다. 괴선 판정 처리부(20)는 화소 밀도 판정 처리부(23)와 괴선 폭 판정 처리부(24) 중 어느 하나만을 구비하여도 좋다. 괴선 판정 처리부(20)는 소프트웨어에 의해서 실현되기 때문에, CPU의 부담이 커서 메모리도 크게 된다. 그래서, 어느 한쪽만을 설치하여, 장치의 구성을 간소화하여도 좋다. 이 경우, 괴선의 추출 정밀도는 다소 뒤떨어지지만, 처리 속도는 고속화할 수 있다.
화소 밀도 판정 처리부(23)는 사전에 정해진 값의 제1 임계치(21) 또는 이 값보다도 높은 값의 제2 임계치(22) 중 어느 하나를 사용하여, 사전에 구한 해당 괴선 후보의 요철도를 판정함으로써 해당 괴선 후보가 괴선인가 아닌가를 판정한다. 제1 임계치(21)는 제2 임계치(22)보다도 낮다. 화소 밀도 판정 처리부(23)는 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도에 응해서 제1 임계치 또는 제2 임계치를 선택하며, 해당 다른 화상 패턴의 화소 밀도가 높은 경우에, 제1 임계치(21)를 사용하고, 해당 다른 화상 패턴의 화소 밀도가 낮은 경우에, 제2 임계치(22)를 사용한다.
괴선 판정 처리부(20)의 화소 밀도 판정 처리부(23)는 해당 괴선 후보가 세로 괴선인 경우, 입력된 화상에 있어서, 해당 세로 괴선의 길이와 동일의 영역이고, 또한 해당 세로 괴선의 좌우의 사전에 정해진 범위에 존재하는 화상 패턴을 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴으로서 사용한다. 또한, 괴선 판정 처리부(20)의 화소 밀도 판정 처리부(23)는 해당 괴선 후보가 가로 괘선인 경우, 입력된 화상에서, 해당 가로 괘선의 길이와 동일의 영역이고, 또한 해당 가로 괘선의 상하의 사전에 정해진 범위에 존재하는 화상 패턴을 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴으로서 사용한다. 즉, 이 처리에 의해 정해진 영역의 화소 밀도가 괴선 판정에 사용된다. 해당 영역에 실제의 화상 패턴이 존재하지 않는 경우, 화소 밀도는"0"이다.
괴선 폭 판정 처리부(24)는 사전에 정해진 값의 제1 임계치 또는 이 값보다도 높은 값의 제2 임계치 중 어느 하나를 사용하여 해당 괴선 후보의 요철도를 판정함에 따라서 해당 괴선 후보가 괴선인가 아닌가를 판정한다. 제1 임계치(21)의 값은 제2 임계치(22)의 값보다도 낮다. 구체적으로는 괴선 폭 판정 처리부(24)는 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 폭에 응해서, 해당 다른 화상 패턴의 폭이 넓은 경우에, 제1 임계치를 사용하고, 해당 다른 화상 패턴의 폭이 좁은 경우에, 제2 임계치를 사용한다.
괴선 판정 처리부(20)의 괴선 폭 판정 처리부(24)는 입력된 화상에서, 해당 괴선 후보와 동일의 방향으로 연장되고, 해당 괴선 후보에 인접 또는 연결된 상이한 괴선 후보를, 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴으로서 사용한다. 즉, 주위에 존재하는 다른 화상 패턴으로서 쓰여지는 것은 해당 괴선 후보와 동일한 괴선을 구성하는 괴선 후보이다. 바꾸어 말하면, 동일 괴선의 복수의 영역을 주위에 존재하는 다른 화상 패턴으로서 사용한다.
괴선 폭 판정 처리부(24)는 해당 괴선 후보의 폭이 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 폭의 n 배 이상인 경우에, 해당 괴선 후보의 폭이 넓다고 하고, 해당 괴선 후보의 폭이 다른 화상 패턴의 폭이 1/n 이하인 경우에, 해당 괴선 후보의 폭이 좁다고 한다. 이제, n은 정의 정 수이고, 예컨대, "3"으로 된다.
도22는 직선 추출 장치(2)에 의해 실행되는 직선 추출 처리의 플로우를 나타낸다. 도22에 나타내는 처리는 상술한 바와 같이, 기본적으로는 도5에 나타내는 처리와 같고, 점선 추출 처리(스텝 S25)후에 괴선 판정 처리(스텝 S26)가 실행되는 점만이 다르다. 따라서, 도5에 나타내는 처리와 같은 처리에 대한 설명은 생략하여, 괴선 판정 처리(스텝 S26)에 관하여 설명한다.
처음에, 직선 추출 장치(2)는 도5에 나타내는 바와 같이, 연결 패턴 추출 처리(스텝 S21) 내지 점선 추출 처리(스텝 S25)를 실행한다. 그 처리 결과, 화상 데이터(12)로부터 도7의 오른쪽에 나타낸 바와 같이 사각형에 의해 근사화된 직선 및 점선이 추출된다. 이것이 괴선 후보 데이터(13A)이다.
계속해서, 직선 추출 장치(2)는 도13a에 나타낸 바와 같이, 괴선 판정 처리부(20)에 의한 괴선 판정 처리를 실행하여, 괴선 후보 데이터(13A)에서 직선 데이터(괴선 데이터)(13)를 추출한다(스텝 S26).
도23은 괴선 판정 처리부(20)가 실행하는 괴선 판정 처리의 플로우를 나타낸다. 괴선 판정 처리는 화소 밀도 판정 처리부(23)에 의한 화소 밀도 판정 처리와 괴선 폭 판정 처리부(24)에 의한 괴선 폭 판정 처리로 이루어진다. 화소 밀도 판정 처리에 대해서는 도25를 참조하여 설명하고, 괴선 폭 판정 처리에 대해서는 도26을 참조하여 설명한다.
처음에, 전 처리로서, 괴선 판정 처리부(20)에 의해 요철도 산출 처리가 실행된다(스텝 S261). 요철도 산출 처리는 주지의 직선 검출 처리를 사용하는 것에 따라 실행된다. 주지의 직선 검출 처리로서는 예컨대, 본원 출원인이 제안한 특개평10334185호 공보에 기재된 기술이 사용된다. 이 기술에 의하면, 화소의 검출이 실행된다.
이 주지의 기술에 대해서는 "직선 검출 처리"로서 설명하였기 때문에, 여기서는 해당 화소의 검출에 대해서만 간단히 설명한다. 처음에, 괴선 판정 처리의 대상으로 되어 있는 괴선 후보의 해당 조사 대상의 화상 패턴이 연장되는 방향(세로 또는 가로 방향)으로, 화소(패턴으로서 입력된 흑화소)를 검출한다. 그리고, 해당 검출 방향으로 화소가 존재하는 한, 해당 검출 방향으로 검출을 계속한다. 이 처리에서, 화소의 검출 방향은 변화하지 않는다. 한편, 해당 검출 방향으로 화소가 존재하지 않는 경우에 한하여, 해당 검출 방향의 경사 방향에 있는 화소를 검출한다. 이 경우, 화소의 검출 방향이 변화한다. 해당 검출 방향의 변화 회수가 카운트된다. 카운트된 변화 회수가 해당 괴선 후보의 요철도이다. 해당 패턴이 괴선이면 대략 동일의 방향으로 검출이 행하여지기 때문에 화소의 검출 방향의 변화 회수의 값이 작고, 괴선 이외의 패턴(문자)이면 해당 값이 크다.
다음에, 제1 처리로서, 화소 밀도 판정 처리부(23)에 의해 화소 밀도 판정 처리가 실행된다(스텝 S262).
화소 밀도 판정 처리에서, 처음에, 화소 밀도가 산출된다(스텝 S262-1). 화소 밀도 판정 처리에 사용되는 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴은 다음과 같이 하여 정해진다. 예컨대, 도24a에 나타내는 괴선 후보는 가로 괘선이기 때문에, 이 경우의 다른 화상 패턴은 도24c에 나타낸 바와 같이 판정된다. 즉, 상이한 패턴으로서 해당 가로 괘선의 길이와 동일의 길이 L1의 패턴인, 해당 가로 괘선의 상하의 폭 2H1(또는 3H1 이상이라도 좋음)의 영역에 존재하는 화상 패턴이 사용된다. 이렇게 해서, H1은 해당 가로 괘선의 폭(높이)이 된다. 따라서, 상측 및 하측의 L1×2H1의 2개의 영역이 화소 밀도의 판정에 사용된다. 도24b에 나타내는 괴선 후보의 다른 화상 패턴은 도24d에 나타낸 바와 같이 된다. 즉, 해당 가로 괘선의 길이 L2와 동일의 영역에 있고, 또한 해당 가로 괘선의 상하의 폭 2H2(3H2 이상이라도 좋음)의 영역에 존재하는 화상 패턴이 다른 화상 패턴으로서 사용된다. 이렇게 해서, H2는 해당 가로 괘선의 폭(높이)이 된다. 따라서, 상측 및 하측의 L2×2H2의 2개의 영역이 화소 밀도의 판정에 사용된다.
또, 해당 괴선 후보가 세로 괴선인 경우에도 마찬가지로, 화소 밀도 판정 처리부(23)는 화소 밀도의 판정에 사용하는 영역을 정한다. 즉, 입력된 화상에서, 해당 세로 괴선의 길이와 동일의 영역에 있고, 또한 해당 세로 괴선의 상하의 정해진 범위에 존재하는 화상 패턴을 다른 화상 패턴으로서 사용한다.
이상으로부터 알 수 있는 바와 같이, 화소 밀도의 판정에 사용되는 영역의 크기는 해당 괴선 후보의 길이 및 폭에 의존하여 변동한다(비례한다). 다른 화상 패턴이 해당 괴선 후보의 길이에 의존하는 이유는 도24c에 나타낸 바와 같이 적어도 해당 영역에는 문자의 나머지 부분이 반드시 존재하기 때문이다. 또한, 해당 괴선 후보의 폭에 의존하는 이유는 괴선의 폭의 종류가 복수(예컨대, 1 dot의 가는선, 5 dot의 보통의 선, 10 dot의 굵은선) 존재하는 경우에서, 여러 가지의 괴선에 긁힘이 존재하여도, 확실히 괴선으로서 판정하기 때문이다.
이와 같이 정해진 영역에 대해서 화소 밀도가 산출된다. 화소 밀도의 산출에는 예컨대 주지의 화소 투영 처리가 사용된다. 또는 도14의 화소 밀도 변화 검출 처리(스텝 S51)와 같은 처리가 사용된다. 즉, (화소 밀도)=(해당 영역 내의 흑화소의 총수)/(해당 영역 내의 화소의 총수)이 된다. 흑화소는 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴을 구성하는 화소이다. 해당 영역 내의 흑화소 및 화소의 총수가 카운트된다.
도24c의 경우, 상측의 L1×2Hl의 영역의 화소 밀도는 낮지만, 하측의 L1×2Hl의 영역의 화소 밀도는 지극히 높다. 이 경우, 상측의 Ll×2Hl의 영역의 화소 밀도만을 사용하면 정확한 결과(주위 영역의 화소 밀도가 높다)가 얻어지지 않는다. 그래서, 상측 및 하측의 L2×2H2의 2개의 영역의 화소 밀도의 평균치가 판정에 사용된다. 이 처리에 의해, 도24c의 경우, 2개의 L1×2Hl의 영역의 화소 밀도는 높은 것으로 된다. 도24d의 경우, 상측 및 하측의 L2×2H2의 2개의 영역의 화소 밀도가 함께 지극히 낮기 때문에, 그 평균치도 지극히 낮아진다.
화소 밀도의 고저를 판정하기 위한 임계치는 요철도의 판정의 임계치와 달리, 사전에 화소 밀도 판정 처리부(23)에 주어진다. 이 임계치의 값도, 경험적(또는 통계적, 실험적)으로 적절한 값으로 정해진다. 도24c의 경우의 2개의 Ll×2H1의 영역의 화소 밀도는 높다고 판정되고, 도24d의 경우의 상측 및 하측의 L2×2H2의 2개의 영역의 화소 밀도는 낮다고 판정된다.
다음에, 화소 밀도의 판정 결과에 따라서, 제l 임계치를 사용한 제1 판정 처리가 행하여진다(스텝 S262-2). 이 처리의 대상이 되는 것은 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도 높이라고 판정된 도24a 또는 24c의 경우이다.
도24a에 나타내는 괴선 후보는 원래는 문자 선분 A의 일부이다. 따라서, 그 주위에는 문자 선분 A의 상이한 부분이 존재하기 때문에, 상술한 바와 같이, 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도는 높다. 주위의 화소 밀도가 높기 때문에, 해당 괴선 후보는 문자일 가능성이 높다. 따라서, 상당한 정도까지 요철도가 낮은(즉, 평활한) 괴선 후보만이 괴선으로서 남도록 할 필요가 있다. 그래서, 보다 낮은 값을 갖는 제1 임계치(21)가 사용된다. 괴선 후보로서 추출된 문자 선분 A의 요철도는 원래 높음에도 불구하고, 꽤 낮게 되어 있다. 보다 높은 값을 갖는 제2 임계치(22)를 사용한 경우, 문자 선분 A의 요철도가 제2 임계치(22)보다 작게 되는 결과, 문자 선분 A는 괴선이라고 판정될 우려가 있다. 이 경우, 제1 임계치(21)를 사용함으로써 문자 선분 A의 요철도는 제1 임계치(21)보다 크게 되는 결과, 문자 선분 A는 괴선 이외의 화상 패턴이라고 판정되어, 괴선 후보 데이터(13A)에서 제외된다.
또, 제1 임계치(21)의 값을 지나치게 낮게 하는 것은 바람직하지 못하다. 예컨대, 본래의 괴선에 문자가 중첩하고 있는 경우도, 도24a에 나타내는 괴선 후보와 같이, 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도는 높다. 그러나, 도24a의 경우와 다른 이 괴선 후보는 괴선을 빠짐 없이 모든 괴선을 추출한다고 하는 관점에서, 괴선 후보로서 남길 필요가 있다. 그래서 제1 임계치(21)의 값은 괴선과 문자가 겹친 괴선 후보의 요철도보다는 높고, 문자만으로 이루어지는 괴선 후보의 요철도보다는 낮게 된다. 이 처리에 의해, 괴선과 문자가 겹친 괴선 후보는 괴선이라고 판정되어, 괴선 후보 데이터(13A)에 남게 된다.
다음에, 화소 밀도의 판정 결과에 따라서, 제2 임계치를 사용한 제2 판정 처리가 행하여진다(스텝 S262-3). 이 처리의 대상이 되는 것은 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도가 낮다고 판정된 도24b 또는 24d의 경우이다. 또, 이 처리와 제1 판정 처리(스텝 S262-2)는 어떤 것을 행하여도 좋다.
도24b에 나타내는 괴선 후보는 원래 직선 B의 일부이다. 따라서, 그 주위에는 직선 B의 상이한 부분이 존재할 가능성이 거의 없기 때문에, 상술한 바와 같이, 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 화소 밀도가 낮게 된다. 주위의 화소 밀도가 낮기 때문에, 해당 괴선 후보는 괴선일 가능성이 높다. 따라서, 상당한 정도까지 요철도가 높다(즉, 다소 요철 있음) 괴선 후보라도, 괴선으로서 남도록할 필요가 있다. 그래서, 보다 높은 값을 갖는 제2 임계치(22)가 사용된다. 괴선 후보로서 추출된 직선 B의 요철도는 원래 낮음에도 불구하고, 꽤 높게 되어있다. 그에 따라, 제1 임계치(21)를 선택한 경우, 직선 B의 요철도가 제1 임계치(21)보다 크게 되는 결과, 직선 B는 괴선이 아니라고 판정될 우려가 있다. 제2 임계치(22)를 사용함으로써 문자 선분 A의 요철도는 제2 임계치(22)보다 작게 되는 결과, 직선 B는 괴선이라고 판정된다. 즉, 괴선 후보 데이터(13A)에 남게 된다.
따라서, 입력 화상(11)이 부적절한 것에 기인하여, 괴선 후보로서 추출되고, 또한 같은 정도의 꽤 낮은 요철도를 갖는 문자 선분 A와 직선 B에 대해서, 한쪽(문자 선분 A)은 괴선 후보 데이터(13A)에서 제외하고, 다른 쪽(직선 B)은 괴선 후보 데이터(13A)에 남길 수 있다. 이상과 같이, 본 발명의 표 화상 처리 장치에 의하면, 요철도에 의한 괴선 후보의 판정 처리를 실행함과 동시에, 문자의 직선 부분의 연속, 직선(괴선)의 흐트러짐 등이 있더라도, 괴선 후보를 정확히 판정 처리할 수 있다.
다음에, 제2 처리로서, 괴선 폭 판정 처리부(24)에 의해 괴선 폭 판정 처리가 실행된다(스텝 S263).
괴선 폭 판정 처리에서, 처음에 괴선 폭이 산출된다(스텝 S263-1). 괴선 폭 판정 처리에 사용되는 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴은 다음과 같이 하여 구한다. 예컨대, 도25a에 나타내는 괴선 후보(135)의 다른 화상 패턴은 해당 괴선 후보(135)와 동일의 방향으로 연장된 해당 괴선 후보(135)에 인접된 상이한 괴선 후보(134 및 136), 또는 해당 괴선 후보(135)에 연결된 상이한 괴선 후보(133,134,136,137)이다. 해당 괴선 후보(135)로부터 완전히 독립한 괴선 후보(138) 등은 고려되지 않는다. 마찬가지로, 도26a에 나타내는 괴선 후보(141)의 다른 화상 패턴은 해당 괴선 후보(141)와 동일의 방향으로 연장되고, 해당 괴선 후보(141)에 인접된 상이한 괴선 후보(140 및 141), 또는 해당 괴선 후보(141)에 연결된 상이한 괴선 후보(139, 140,142,143)이다.
이렇게 하여 정해진 괴선 후보에 대해서 괴선 폭이 산출된다. 괴선 폭의 산출은 해당 괴선 후보인 사각형 영역의 장변 및 단변의 화소수를 카운트하여, 작은 쪽(단변, 즉, 폭)의 값을 채용함으로써 행하여진다. 이 처리에 의해, 도25a에 나타내는 괴선 후보(135)의 폭 Wl 및, 도26a에 나타내는 괴선 후보(141)의 폭 W3이 구해진다.
상술한 바와 같이, 통상, 다른 화상 패턴으로서 사용되는 괴선 후보는 복수 존재한다. 이 경우, 각각의 괴선 후보에 대해서 그 폭을 구하여, 그 평균치를 구하고, 이 평균치를 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴인 괴선 후보의 괴선 폭으로서 사용한다. 도25a에 나타내는 괴선 후보(135)의 경우, 괴선 후보(130,134,136,137)의 괴선 폭의 평균치가 사용된다. 이 값을 도25d에 나타낸 바와 같이, W2로 한다. 도26a에 나타내는 괴선 후보(141)의 경우, 상이한 괴선 후보(139,140,142,143)의 괴선 폭의 평균치가 사용된다. 이 값을 도26d에 나타낸 바와 같이, W4로 한다.
이렇게 하여 구한 다른 화상 패턴의 괴선 폭을 사용하고, 해당 괴선 후보의 괴선 폭이 넓은지 좁은지가 판정된다. 예컨대, 해당 괴선 후보의 폭이 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 폭의 3배 이상인 경우에, 해당 괴선 후보의 폭이 넓다고 하고, 해당 괴선 후보의 폭이 다른 화상 패턴의 폭의 1/3 이하인 경우에, 해당 괴선 후보의 폭이 좁다고 한다. 도25a에 나타내는 괴선 후보(135)의 경우, 괴선 후보(135)의 폭 Wl이 괴선 후보(133) 등의 괴선 폭의 평균치 W2의 3배 이상이기 때문에, 해당 괴선 후보(135)의 폭이 넓다고 판정된다. 도26a에 나타내는 괴선 후보(141)의 경우, 괴선 후보(141)의 폭 W3이 괴선 후보(139) 등의 괴선 폭의 평균치 W4의 1/3 이하이기 때문에, 해당 괴선 후보(141)의 폭이 좁다고 판정된다.
다음에, 괴선 폭의 판정 결과에 따라서, 제1 임계치를 사용한 제1 판정 처리가 행하여진다(스텝 S263-2). 이 처리의 대상이 되는 것은 괴선 후보의 폭이 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 괴선 폭보다 넓다고 판정된 도25의 경우이다.
도25a에 나타내는 괴선 후보가 굵은 부분(135)은 원래는 괴선의 중간에 존재하는 문자이다. 따라서, 그 주위에 본래의 괴선이 존재하기 때문에, 상술한 바와 같이, 해당하는 굵은 괴선 후보(135)의 주위에 존재하는 다른 화상 패턴의 폭은 해당하는 굵은 괴선 후보(135)보다도 가늘게 된다. 다른 화상 패턴의 폭이 가늘기 때문에, 해당 괴선 후보(135)는 찌그러진 문자일 가능성이 높다. 따라서, 상당한 정도까지 낮은 요철도를 갖는 괴선 후보만이 괴선으로서 남도록 할 필요가 있다(즉, 평활함). 그래서, 보다 낮은 값을 갖는 제1 임계치(21)가 사용된다. 괴선 후보(135)로서 추출된 문자의 요철도는 원래 높음에도 불구하고, 꽤 낮게 되어 있다. 보다 높은 값을 갖는 제2 임계치(22)를 사용한 경우, 굵은 괴선 후보(문자)(135)의 요철도가 제2 임계치(22)보다 작게 되는 결과, 굵은 괴선 후보(135)가 괴선이라고 판정될 우려가 있다. 제1 임계치(21)를 사용함으로써 굵은 괴선 후보(135)의 요철도는 제1 임계치(21)보다 크게 되는 결과, 굵은 괴선 후보(135)는 괴선 이외의 화상 패턴이라고 판정되어, 괴선 후보 데이터(13A)에서 제외된다.
다음에, 괴선 폭의 판정 결과에 따라서, 제2 임계치를 사용한 제2 판정 처리가 행하여진다(스텝 S262-3). 이 처리의 대상이 되는 것은 괴선 후보의 폭이 해당 괴선 후보의 주위에 존재하는 다른 화상 패턴의 괴선 폭보다 좁다고 판정된 도26의 경우이다. 또, 이 제2 처리와 제1 판정 처리(스텝 S263-2)는 어떤 것을 먼저 행하여도 좋다.
도26a에 나타내는 괴선 후보가 가는 부분(141)은 긁힘이 있지만, 원래는 괴선이다. 따라서, 그 주위에 본래의 괴선이 존재하기 때문에, 해당하는 가는 괴선 후보(141)의 주위에 존재하는 다른 화상 패턴의 폭은 해당하는 가는 괴선 후보(141)보다도 굵게 된다. 다른 화상 패턴의 폭이 굵기 때문에, 해당 괴선 후보(141)는 긁혀서 가늘게 된 괴선일 가능성이 높다. 따라서, 상당한 정도까지 요철도가 높은(즉, 다소의 요철을 가짐) 괴선 후보라도, 괴선으로서 남도록 할 필요가 있다. 그래서, 보다 높은 값을 갖는 제2 임계치(22)가 사용된다. 괴선 후보(141)로서 추출된 가는 괴선의 요철도는 원래 낮음에도 불구하고, 높게 되어 있다. 보다 낮은 값을 갖는 제1 임계치(21)를 사용한 경우, 가는 괴선 후보(141)의 요철도가 제1 임계치(21)보다 크게 되는 결과, 가는 괴선 후보(141)가 괴선 이외의 화상 패턴(문자)이라고 판정될 우려가 있다. 제2 임계치(22)를 사용함으로써 가는 괴선 후보(141)의 요철도는 제2 임계치(22)보다 작아지는 결과, 괴선이라고 판정된다. 즉, 괴선 후보에 남게 된다.
따라서, 입력 화상(11)이 부적절한 것에 기인하여, 괴선 후보로서 추출된 굵은 괴선 후보(135)는 괴선 후보 데이터(13A)에서 제외하고, 가는 괴선 후보(141)는 괴선 후보 데이터(13A)에 남길 수 있다. 이상과 같이, 본 발명의 표 화상 처리 장치에 의하면, 요철도에 의한 괴선 후보의 판정 처리를 행함과 동시에, 문자의 찌그러짐, 괴선의 긁힘 등이 있더라도, 괴선 후보를 정확히 판정 처리할 수 있다.
이상의 처리의 결과, 괘선 후보 데이터(13A)에서 괴선일 가능성이 낮은 괴선 후보가 제거되어, 괴선일 가능성이 높은 괴선 후보가 남게 된 괴선 데이터, 즉, 직선 데이터(12)가 추출된다.
이상, 본 발명의 상이한 1개의 실시 형태에 대해서 설명하였지만, 본 발명은 그 요지의 범위 내에서 여러 가지의 변형이 가능하다.
예컨대, 표 화상 처리 장치(100)는 앞서 진술한 제1 실시예의 표 화상 처리 장치(100)와 적당히 조합한 구성으로 하여도 좋다. 즉, 표 화상 처리 장치(100)는 직선 추출 장치(2), 둥근 모서리 후보 영역 검출 장치(3), 셀 추출 장치(4), 둥근 모서리 판정 장치(5) 및 문자 인식 영역 검출 장치(6)로 이루어지는 것으로 하여도 좋다. 또한, 제1 실시예에 대한 설명에서, 간단한 구성의 표 화상 처리 장치(100)로서 설명한 실시예와 적당히 조합한 구성으로 하여도 좋다. 더욱, 제1 실시예의 표 화상 처리 장치(100)는 둥근 모서리 후보 영역 검출 장치(3) 및 둥근 모서리 판정 장치(5)를 생략한 구성과 조합한 구성으로 하여도 좋다. 즉, 표 화상 처리 장치(100)가 직선 추출 장치(2), 셀 추출 장치(4), 문자 인식 영역 검출 장치(6)로 이루어지는 것이어도 좋다.
이상 설명한 바와 같이, 본 발명에 의하면, 표 화상 처리 장치에서, 추출한 직선의 단부로부터 시작하는 경사 성분을 추출하여, 추출한 경사 성분을 사용한 소정의 처리에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀의 모서리에 대해서 소정의 처리에 의해 둥근 모서리를 판정함으로써 둥근 모서리 후보 영역을 정확히 추출하여 둥근 모서리를 정확히 판정할 수 있으므로, 괴선에 문자가 접촉하는 부분이라든지 화상이 긁힌 부분을 둥근 모서리인 것으로 인식하는 것을 방지할 수 있고, 괴선의 긁힘, 문자의 둥근 부분, 괴선과 문자와의 접촉 등이 있더라도 모서리를 정확히 처리할 수 있게 되어, 이 결과, 괴선 구조의 인식 및 셀(문자 인식 영역)의 추출을 안정하게 할 수 있다.
본 발명에 의하면, 이상으로 앞서 진술한 처리를 해당 표 화상 처리 장치인 컴퓨터에서 실현시키는 프로그램을 기억한 프로그램 기억 매체를 제공할 수 있으므로, 둥근 모서리를 포함하는 괴선 구조의 인식 및 셀(문자 인식 영역)의 추출을 안정하게 행하는 표 화상 처리 장치를 용이하게 제공할 수 있다.
또한 본 발명에 의한 표 화상 처리 장치에 있어서, 괴선 후보 주위에 존재하는 다른 화상 패턴에 따라서 제l 또는 제2 임계치 중 어느 하나를 사용하여 해당 괴선 후보의 요철도를 판정함으로써 예컨데 주위의 요철도가 높은 경우에는, 보다 낮은 값의 임계치(예컨대, 제1 임계치)를 사용함으로써 원래 보다도 낮게 된 요철도를 갖는 괴선 후보를 후보로부터 제외할 수 있다. 반대로, 괴선 후보 주위의 요철도가 낮은 경우에는, 보다 높은 값의 임계치(예컨대, 제2 임계치)를 사용함으로써 원래 보다도 높은 요철도를 갖는 괴선 후보를 후보로 남길 수 있기 때문에, 괴선인지 또는 그 이외의 패턴인지의 판정이 불가능한 경우를 현저히 낮출 수 있어, 정확히 괴선을 추출할 수 있다.
본 발명에 의하면, 표 화상 처리 장치를 컴퓨터에서 실현시키는 프로그램을 기억한 프로그램 기억 매체를 제공할 수 있으므로, 괴선의 판정을 정확히 하는 표 화상 처리 장치를 제공할 수 있다.
본 발명의 상술한 많은 특징 및 장점은 상세한 명세서로부터 명백하므로, 본 발명의 정신과 범위 내의 그러한 모든 특징 및 장점을 첨부된 청구범위에 의해 보호한다. 또한 본 기술 분야에서 숙련자는 수많은 수정 변경을 할 수 있으므로, 본 발명을 지금까지 개시하고 도해한 구성과 작용만으로 제한하지 않을 것이며 모든 적합한 수정 및 등가물은 본 발명의 범위내에 속하는 것으로 한다.

Claims (36)

  1. 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 수단과,
    상기 직선 추출 수단에 의해 추출한 직선의 단부로부터 시작하는 경사선을 추출하고, 상기 추출한 경사선에 의거하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 수단과,
    상기 둥근 모서리 후보 영역 검출 수단에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출 수단과,
    상기 셀 추출 수단에 의해 추출한 셀에 의거하여 둥근 모서리를 판정하는 둥근 모서리 판정 수단을 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  2. 제1항에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 직선 추출 수단에 의해 추출한 직선 내에서, 세로 방향의 직선의 단부로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 단부로부터 시작하는 제2 경사 성분을 추출함으로써 경사 성분을 추출하는
    것을 특징으로 하는 표 화상 처리 장치.
  3. 제2항에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 제1 및 제2 경사 성분이 서로 중첩하는 경우에, 상기 부분을 둥근 모서리 후보 영역인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  4. 제2항에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 제1 및 제2 경사 성분이 사전에 정해진 거리 내에 있고, 또한 상기 양자 간에 직선의 특징을 나타내는 패턴이 있거나 양자가 서로 접촉 또는 중첩하고 있는 경우에, 상기 부분을 둥근 모서리 후보 영역인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  5. 제2항에 있어서,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 경사 성분의 근처에 어떤 다른 경사 성분도 존재하지 않고, 또한 상기 경사선의 단부에 직선의 특징을 나타내는 패턴이 있는 경우에, 상기 부분을 둥근 모서리 후보 영역인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  6. 제1항에 있어서,
    상기 둥근 모서리 판정 수단은 상기 셀 추출 수단에 의해 추출한 상기 셀의 모서리에서 화소 밀도가 정해진 순서로 변화하는 경우에, 상기 부분을 둥근 모서리인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  7. 제1항에 있어서,
    상기 둥근 모서리 판정 수단은 상기 화소 밀도의 변화에 의거하여 판정된 둥근 모서리가 존재하는 경우에, 상기 부분을 둥근 모서리인 것으로 판정하고, 상기 입력된 화상의 다른 모서리도 둥근 모서리인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  8. 제1항에 있어서,
    상기 둥근 모서리 판정 수단은 상기 직선 추출 수단에 의해 추출한 직선의 단부와 단부 간에 생성된 n차 함수의 패턴이 상기 입력된 화상과 정합하는 경우에, 상기 부분을 둥근 모서리인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  9. 제1항에 있어서,
    괴선을 포함하는 장표의 화상을 입력하기 위한 화상 입력 수단과,
    상기 둥근 모서리를 포함하는 셀 내에서 상기 둥근 모서리 판정 수단에 의해 판정된 둥근 모서리를 제외함으로써 문자 인식 영역을 검출하는 문자 인식 영역 검출 수단을 더 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  10. 둥근 모서리 후보 영역 검출 장치를 구비한 표화상 처리 장치에 있어서,
    상기 둥근 모서리 후보 영역 검출 장치는
    입력된 화상에서 추출된 직선으로부터, 세로 방향의 직선의 단부로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 단부로부터 시작하는 제2 경사 성분을 추출하고,
    상기 제1 및 제2 경사 성분이 서로 중첩하는 경우, 상기 부분을 둥근 모서리 후보 영역인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  11. 둥근 모서리 후보 영역 검출 장치를 구비한 표화상 처리 장치에 있어서,
    상기 둥근 모서리 후보 영역 검출 장치는
    입력된 화상에서 추출된 직선으로부터, 세로 방향의 직선의 단부로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 단부로부터 시작하는 제2 경사 성분을 추출하고,
    상기 제1 및 제2 경사 성분이 사전에 정해진 거리 내에 있고, 또한 양자 간에 직선의 특징을 나타내는 패턴이 있거나, 양자가 서로 접촉 또는 중첩하고 있는 경우, 상기 부분을 둥근 모서리 후보 영역인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  12. 둥근 모서리 후보 영역 검출 장치를 구비한 표화상 처리 장치에 있어서,
    상기 둥근 모서리 후보 영역 검출 장치는
    입력된 화상에서 추출된 직선으로부터, 세로 방향의 직선의 단부로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 단부로부터 시작하는 제2 경사 성분을 추출하고,
    상기 경사 성분의 근처에 어떤 다른 경사 성분도 존재하지 않고 또한 상기 경사 성분의 단부에 직선의 특징을 나타내는 패턴이 있는 경우, 상기 부분을 둥근 모서리 후보 영역인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  13. 둥근 모서리 판정 장치를 구비한 표화상 처리 장치에 있어서,
    상기 둥근 모서리 판정 장치는
    입력된 화상에서 추출된 세로 및 가로 방향의 직선으로부터 추출된 셀에 대해서, 상기 셀의 모서리에서 화소 밀도가 사전에 정해진 순서로 변화하는 경우에, 상기 부분을 둥근 모서리인 것으로 판정하는 둥근 모서리 판정부를 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  14. 둥근 모서리 판정 장치를 구비한 표화상 처리 장치에 있어서,
    상기 둥근 모서리 판정 장치는
    입력된 화상에서 추출된 세로 및 가로 방향의 직선으로부터 추출된 셀에 대해서, 상기 화소 밀도의 변화에 의거하여 판정된 둥근 모서리가 존재하는 경우에, 다른 모서리도 둥근 모서리인 것으로 판정하는 둥근 모서리 판정 수단을 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  15. 둥근 모서리 판정 장치를 구비한 표화상 처리 장치에 있어서,
    상기 둥근 모서리 판정 장치는
    입력된 화상에서 추출된 세로 및 가로 방향의 직선으로부터 추출된 셀에 대해서, 상기 셀 내의 상기 직선 간에 생성된 n차 함수의 패턴이 둥근 모서리 후보 영역을 포함하는 모서리에서 입력된 화상과 정합하는 경우에, 상기 부분을 둥근 모서리인 것으로 판정하는 둥근 모서리 판정 수단을 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  16. 컴퓨터내에서 표 화상 처리 장치를 실행하는 프로그램을 기억하는 프로그램 기억 매체에 있어서,
    상기 프로그램은
    입력된 화상에서 세로 및 가로 방향의 직선을 추출하는 직선 추출 처리와,
    상기 직선 추출 처리에 의해 검출한 직선의 단부에서 시작하는 경사선을 추출하여, 상기 추출한 경사선을 사용하여 소정의 처리에 의해 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 처리와,
    상기 둥근 모서리 후보 영역 검출 처리에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출 처리와,
    상기 셀 추출 처리에 의해 추출한 셀의 모서리에 대해서 소정의 처리에 의해 둥근 모서리를 판정하는 둥근 모서리 판정 처리를 실행하는 프로그램인
    것을 특징으로 하는 프로그램 기억 매체.
  17. 괴선 판정 처리 수단을 구비한 표 화상 처리 장치에 있어서,
    상기 괴선 판정 처리 수단은
    입력된 화상에서 추출된 세로 및 가로 방향의 괴선 후보에서, 상기 괴선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용하여 구한 상기 괴선 후보의 요철도에 의거하여, 상기 괴선 후보가 괴선인가 아닌가를 판정하는 괴선 판정 처리 수단을 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  18. 제17항에 있어서,
    상기 괴선 판정 처리 수단은 사전에 정해진 제1 임계치와 상기 제1 임계치보다도 높은 사전에 정해진 제2 임계치 중 어느 하나를 사용함으로써 상기 괴선 후보의 요철도에 의거하여 상기 괴선 후보가 괴선인가 아닌가를 판정하는 화소 밀도 판정 처리부를 구비하고,
    상기 화소 밀도 판정 처리부가 상기 괴선 후보의 주위에 존재하는 화상 패턴의 화소 밀도에 응해서, 상기 괴선 후보 이외의 화상 패턴의 화소 밀도가 높을 경우에 상기 제1 임계치를 사용하고, 상기 괴선 후보 이외의 화상 패턴의 화소 밀도가 낮을 경우에 상기 제2 임계치를 사용하는
    것을 특징으로 하는 표 화상 처리 장치.
  19. 제18항에 있어서,
    상기 괴선 판정 처리 수단은
    상기 괴선 후보가 세로 직선인 경우, 정해진 범위의 상기 괴선 후보의 좌우에 존재하는 상기 괴선의 후보와 동일의 길이의 화상 패턴을 상기 괴선 후보의 주위에 존재하는 화상 패턴으로서 사용하고,
    상기 괴선 후보가 세로 직선인 경우, 정해진 범위의 상기 괴선 후보의 상하에 존재하는 상기 괴선의 후보와 동일의 길이의 화상 패턴을 상기 괴선 후보의 주위에 존재하는 화상 패턴으로서 사용하는
    것을 특징으로 하는 표 화상 처리 장치.
  20. 제17항에 있어서,
    상기 괴선 판정 처리 수단은
    사전에 정해진 제1 임계치 또는 상기 제1 임계치보다도 높은 서전에 정해진 제2 임계치 중 어느 하나에 의해 구한 요철도에 의거하여 상기 괴선 후보가 괴선인가 아닌가를 판정하는 괴선 폭 판정 처리 수단을 구비하고,
    상기 괴선 폭 판정 처리 수단은 상기 괴선 후보의 주위에 존재하는 화상 패턴의 폭에 응해서, 상기 화상 패턴의 폭이 넓은 경우에 상기 제1 임계치를 사용하고, 상기 다른 화상 패턴의 폭이 좁은 경우에 상기 제2 임계치를 사용하는
    것을 특징으로 하는 표 화상 처리 장치.
  21. 제20항에 있어서,
    상기 괴선 폭 판정 처리 수단은
    상기 괴선 후보와 동일의 방향으로 연장되어, 상기 괴선 후보에 인접 또는 접속된 괴선 후보를 상기 괴선 후보의 주위에 존재하는 화상 패턴으로서 사용하는
    것을 특징으로 하는 표 화상 처리 장치.
  22. 제20항에 있어서,
    상기 괴선 폭 판정 처리 수단은
    상기 괴선 후보의 폭이 상기 괴선 후보의 주위에 존재하는 화상 패턴의 폭의 n 배 이상인 경우에, 상기 괴선 후보의 폭이 넓다고 판정하고,
    상기 괴선 후보의 폭이 괴선 후보 주위에 존재하는 화상 패턴의 폭의 1/n 이하인 경우에, 상기 괴선 후보의 폭이 좁다고 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  23. 제17항에 있어서,
    입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 수단과,
    상기 세로 및 가로 방향의 직선을 사용하여 셀을 추출하는 셀 추출 수단과,
    문자 인식 영역을 판정하는 문자 인식 영역 검출 수단을 더 구비하고,
    상기 직선 추출 수단은 상기 괴선 후보 판정 수단을 포함하고,
    상기 괴선 판정 수단은 상기 직선 추출 수단으로부터 추출한 상기 세로 및 가로 방향의 직선을 상기 괴선 후보로서 사용하여, 상기 괴선 후보가 괴선인가 아닌가를 판정하고,
    상기 셀 추출 수단은 상기 괴선 판정 수단에 의한 판정의 결과에 의거하여, 상기 셀을 추출하는
    것을 특징으로 하는 표 화상 처리 장치.
  24. 제17항에 있어서,
    입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출 수단과,
    상기 직선 추출 수단에 의해 추출한 직선의 단부에서 경사 성분을 추출하고, 상기 추출한 경사 성분을 사용하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출 수단과,
    상기 둥근 모서리 후보 영역 검출 수단을 사용하여 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출 수단과,
    상기 셀 추출 수단에 의해 추출한 셀의 모서리에 대해서 둥근 모서리의 판정을 처리하는 둥근 모서리 판정 수단과,
    둥근 모서리를 포함하는 셀 내에서, 상기 둥근 모서리 판정 수단에 의해 판정된 둥근 모서리를 제외함으로써 상기 문자 인식 영역을 판정하는 문자 인식 영역 검출 수단을 구비하고,
    상기 직선 추출 수단은 상기 괴선 후보 판정 수단을 포함하고,
    상기 괴선 판정 수단은 상기 직선 추출 수단에 의해 추출한 상기 세로 및 가로 방향의 직선을 상기 괴선 후보로서 사용하여, 상기 괴선 후보가 괴선인가 아닌가를 판정하고,
    상기 둥근 모서리 후보 영역 검출 수단은 상기 괴선 판정 수단에 의해 구한 직선을 사용하여 경사 성분을 추출하고,
    상기 셀 추출 수단은 상기 괴선 판정 수단에 의한 판정의 결과에 의거하여, 상기 셀을 추출하는
    것을 특징으로 하는 표 화상 처리 장치.
  25. 컴퓨터내에서 표 화상 처리 장치를 실행하는 프로그램을 기억하는 프로그램 기억 매체에 있어서,
    상기 프로그램은
    입력된 화상에서 추출된 세로 및 가로 방향의 직선의 괴선 후보에서, 상기 괴선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 복수의 임계치 중 어느 하나를 사용함으로써, 상기 괴선 후보의 요철도에 의거하여 상기 괴선 후보가 괴선인가 아닌가를 판정하는 괴선 판정 처리를 실행시키는 프로그램인
    것을 특징으로 하는 프로그램 기억 매체.
  26. 입력 화상으로부터 세로 및 가로 방향의 직선을 추출하고,
    상기 직선 추출 처리에 의해 추출한 직선의 단부에서 시작하는 경사선을 추출하여, 상기 경사선에 의거하여 둥근 모서리 후보 영역을 판정하고,
    상기 둥근 모서리 후보 영역을 포함하는 셀을 추출하고,
    상기 셀의 둥근 모서리를 판정하는
    처리를 포함하는 것을 특징으로 하는 표 화상 처리 방법.
  27. 입력된 화상에서 추출된 세로 및 가로 방향의 직선의괴선 후보에서, 상기 괴선 후보의 주위에 존재하는 입력된 화상 패턴으로부터 추출된 화상 패턴에 대응하는 상이한 값의 복수의 임계치 중 어느 하나를 사용함으로써 상기 괴선 후보의 요철도에 의거하여 상기 괴선 후보가 괴선인가 아닌가를 판정하는 괴선 판정 처리를 포함하는
    것을 특징으로 하는 표 화상 처리 방법.
  28. 입력된 화상으로부터 세로 및 가로 방향의 직선을 추출하는 직선 추출부와,
    상기 직선 추출부에 의해 추출한 직선의 단부에서 시작하는 경사선을 추출하여, 상기 경사선에 의거하여 둥근 모서리 후보 영역을 검출하는 둥근 모서리 후보 영역 검출부와,
    상기 둥근 모서리 후보 영역 검출부에 의해 검출한 둥근 모서리 후보 영역을 포함하는 셀을 추출하는 셀 추출부와,
    상기 셀 추출부에 의해 추출한 셀에 의거하여 둥근 모서리를 판정하는 둥근 모서리 판정부를 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
  29. 제28항에 있어서,
    상기 둥근 모서리 후보 영역 검출부는 상기 직선 추출부에 의해 추출한 직선 내에서, 세로 방향의 직선의 단부로부터 시작하는 제1 경사 성분과, 가로 방향의 직선의 단부로부터 시작하는 제2 경사 성분을 추출함으로써 상기 경사 성분을 추출하는
    것을 특징으로 하는 표 화상 처리 장치.
  30. 제29항에 있어서,
    상기 둥근 모서리 후보 영역 검출부는 상기 제1 및 제2 경사 성분이 중첩하는 경우에, 상기 부분을 둥근 모서리 후보 영역인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  31. 제29항에 있어서,
    상기 둥근 모서리 후보 영역 검출부는 상기 제1 및 제2 경사 성분이 사전에 정해진 거리 내에 있고, 또한 양자 간에 직선의 특징을 나타내는 패턴이 있거나 양자가 서로 접촉 또는 중첩하고 있는 경우에, 상기 부분을 둥근 모서리 후보 영역인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  32. 제29항에 있어서,
    상기 둥근 모서리 후보 영역 검출부는 상기 경사 성분의 근처에 어떤 다른 경사 성분도 존재하지 않고, 또한 상기 경사 성분의 단부에 직선의 특징을 나타내는 패턴이 있는 경우에, 상기 부분을 둥근 모서리 후보 영역인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  33. 제28항에 있어서,
    상기 둥근 모서리 판정부는 상기 셀 추출부에 의해 추출한 상기 셀의 모서리에서 화소 밀도가 정해진 순서로 변화하는 경우에, 상기 부분을 둥근 모서리인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  34. 제28항에 있어서,
    상기 둥근 모서리 판정부는 상기 화소 밀도의 변화에 의거하여 판정된 둥근 모서리가 존재하는 경우에, 상기 부분은 둥근 모서리인 것으로 판정하고, 상기 입력된 화상의 다른 모서리도 둥근 모서리인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  35. 제28항에 있어서,
    상기 둥근 모서리 판정부는 상기 직선 추출부에 의해 추출한 직선의 단부와 단부 간에 생성된 n차 함수의 패턴이 상기 입력된 화상의 일부와 정합하는 경우에, 상기 부분을 둥근 모서리인 것으로 판정하는
    것을 특징으로 하는 표 화상 처리 장치.
  36. 제28항에 있어서,
    괴선을 포함하는 장표의 화상을 입력하기 위한 화상 입력부와,
    상기 둥근 모서리를 포함하는 셀 내에서 상기 둥근 모서리 판정부에 의해 판정된 둥근 모서리를 제외함으로써 문자 인식 영역을 검출하는 문자 인식 영역 검출부를 더 구비하는
    것을 특징으로 하는 표 화상 처리 장치.
KR1019990050770A 1998-12-16 1999-11-16 표 화상 처리 장치, 그 처리 프로그램을 저장하는 기억 매체 및 표 관리 처리 방법 KR100657385B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP35702398 1998-12-16
JP98-357023 1998-12-16
JP99-49502 1999-02-26

Publications (2)

Publication Number Publication Date
KR20000047655A true KR20000047655A (ko) 2000-07-25
KR100657385B1 KR100657385B1 (ko) 2006-12-19

Family

ID=18451988

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990050770A KR100657385B1 (ko) 1998-12-16 1999-11-16 표 화상 처리 장치, 그 처리 프로그램을 저장하는 기억 매체 및 표 관리 처리 방법

Country Status (2)

Country Link
JP (1) JP3947173B2 (ko)
KR (1) KR100657385B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8428356B2 (en) 2009-07-01 2013-04-23 Canon Kabushiki Kaisha Image processing device and image processing method for generating electronic document with a table line determination portion

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4683324B2 (ja) * 2005-02-03 2011-05-18 日立金属株式会社 形状測定システム、形状測定方法及び形状測定プログラム
JP5262778B2 (ja) 2009-02-05 2013-08-14 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5505182B2 (ja) * 2010-08-09 2014-05-28 富士ゼロックス株式会社 画像判定装置及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0131676B1 (de) 1983-07-04 1989-08-02 URW Software & Type GmbH Verfahren zum automatischen Digitalisieren des Umrisses von Strichgraphiken z.B. Buchstaben
US4987603A (en) 1988-09-22 1991-01-22 Glory Kogyo Kabushiki Kaisha Recognition method for letter patterns
JP3162414B2 (ja) * 1991-03-19 2001-04-25 株式会社リコー 罫線認識方法及び表処理方法
US5293579A (en) 1992-02-18 1994-03-08 Ray Dream, Inc. Method and apparatus for smoothing jagged edges in a graphics display
KR0147591B1 (ko) * 1994-06-18 1998-09-15 김광호 2차원 그래픽 라운드 묘화 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8428356B2 (en) 2009-07-01 2013-04-23 Canon Kabushiki Kaisha Image processing device and image processing method for generating electronic document with a table line determination portion
KR101447932B1 (ko) * 2009-07-01 2014-10-07 캐논 가부시끼가이샤 화상처리장치 및 화상처리방법

Also Published As

Publication number Publication date
JP2004158041A (ja) 2004-06-03
JP3947173B2 (ja) 2007-07-18
KR100657385B1 (ko) 2006-12-19

Similar Documents

Publication Publication Date Title
JP3574584B2 (ja) 表画像処理装置及びそのプログラム記憶媒体
US7164795B2 (en) Apparatus for extracting ruled line from multiple-valued image
EP2569930B1 (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
US5129012A (en) Detecting line segments and predetermined patterns in an optically scanned document
JP4395188B2 (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US6947596B2 (en) Character recognition method, program and recording medium
JP3411472B2 (ja) パターン抽出装置
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
KR20000047655A (ko) 표 화상 처리 장치 및 그 프로그램 기억 매체
JP3927171B2 (ja) ノイズ除去装置及び方法、プログラム、並びに記録媒体
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP4847378B2 (ja) 画像処理装置、画像処理方法、プログラム及びコンピュータ読取可能な記録媒体
JP3710164B2 (ja) 画像処理装置及び方法
JP3133797B2 (ja) 文字認識方法及びその装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH09288714A (ja) 表認識方法および装置
JP2003271897A (ja) 文字認識装置、画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP2003317107A (ja) 罫線抽出方法及び装置
JPH0644406A (ja) 画像処理方法及び装置
JPH0433082A (ja) 文書認識装置
JPH04270483A (ja) 文字情報検出装置
JPH1021332A (ja) 非線形正規化方法
JPH0628520A (ja) 文字認識装置
JPH09212584A (ja) 文字読取方法及び装置
JPH0991378A (ja) 文字認識方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111118

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20121121

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee