KR940009712B1 - 문서문자방향 검출장치 - Google Patents

문서문자방향 검출장치 Download PDF

Info

Publication number
KR940009712B1
KR940009712B1 KR1019910013335A KR910013335A KR940009712B1 KR 940009712 B1 KR940009712 B1 KR 940009712B1 KR 1019910013335 A KR1019910013335 A KR 1019910013335A KR 910013335 A KR910013335 A KR 910013335A KR 940009712 B1 KR940009712 B1 KR 940009712B1
Authority
KR
South Korea
Prior art keywords
run
document
character
frequency distribution
horizontal
Prior art date
Application number
KR1019910013335A
Other languages
English (en)
Other versions
KR920005021A (ko
Inventor
유다까 나까무라
Original Assignee
후지제록스 가부시끼가이샤
고바야시 요오다로
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지제록스 가부시끼가이샤, 고바야시 요오다로 filed Critical 후지제록스 가부시끼가이샤
Publication of KR920005021A publication Critical patent/KR920005021A/ko
Application granted granted Critical
Publication of KR940009712B1 publication Critical patent/KR940009712B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

내용 없음.

Description

문서문자방향 검출장치
제 1 도는 본 발명의 기본적 구성을 나타낸 블록도.
제 2 도는 본 발명의 일실시예의 문서화상처리장치의 구성을 나타낸 도면.
제 3 도는 제 2 도에서의 문자방향 검출부의 구성을 나타낸 도면.
제 4 도는 문자의 화소패턴의 일예를 나타낸 도면.
제 5a 도는 좌측상으로부터 우측하로 마스크처리를 행하는 경우의 마스크 및 주사방향을 나타낸 도면.
제 5b 도는 그 마스크처리결과를 나타낸 도면.
제 6a 도는 우측상으로 부터 좌측하로 마스크처리를 행하는 경우의 마스크 및 주사방향을 나타낸 도면이고 제 6b 도는 그 마스크처리의 결과를 나타낸 도면.
제 7a 도는 좌측하로부터 우측상으로 마스크처리를 행하는 경우의 마스크 및 주사방향을 나타낸 도면이고, 제 7b 도는 그 마스크처리의 결과를 나타낸 도면.
제 8a 도는 우측하로부터 좌측상으로 마스크처리를 행하는 경우의 마스크 및 주사방향을 나타낸 도면이고, 제 8b 도는 그 마스크처리의 결과를 나타낸 도면.
제 9 도는 문서화상의 일예를 나타낸 도면.
제 10 도는 외접구형처리후의 화상을 나타낸 도면.
제 11 도는 가로쓰기 문서의 경우의 런의 빈도분포를 나타낸 도면으로, (a) 도는 가로쓰기의 백런길이의 빈도분포를 나타낸 도면, (b) 도는 세로방향의 백런길이의 빈도분포를 나타낸 도면.
제 12 도는 세로쓰기 문서의 경우의 런의 빈도분포를 나타낸 도면으로 (a) 도는 가로방향의 백런길이 빈도분포를 나타낸 도면이고, (b) 도는 세로방향의 백런길이의 빈도분포를 나타낸 도면.
제 13 도는 종래의 주변분포검출에 의한 문서문자방향 검출방식을 설명하기 위한 도면으로, (a) 도는 문자만의 간단한 단조합의 경우, (b) 도는 중간조의 화상을 포함한 원고의 경우, (c) 도는 복잡한 단조합 원고의 경우를 각각 나타내고 있다.
본 발명은 문서화상 인식장치등의 페이지단위의 문서화상을 처리하는 화상처리장치등에 적용가능한 입력화상의 문서문자방향 검출장치에 관한 것이다.
문자인식을 행하는 경우에 입력된 문서가 세로쓰기인지 가로쓰기인지에 따라서 문자의 시작방향등의 처리가 다르기 때문에 입력화상의 문자의 방향을 추출하는 기술이 필요해진다. 특히 문자인식을 일보 전진시킨 문서의 구조해석을 행하는 경우에는 필수기술로 된다.
종래의 입력문서의 세로방향, 가로방향의 주변분포를 사용하여 공백행을 검출함으로써 문자방향을 판정하였다(예를들면, 일본국 전자통신학회연구보고(신학기보) PRL80-70, PP9-16 참조).
이 종래기술에 의해서 제 13a 도에 나타낸 것과 같이 문자만의 간단한 단조합이면 주변분포에 의해서 문자방향의 판정을 할 수 있었다.
그러나 제 13b 도에 나타낸 것과 같은 중간조, 도표를 포함한 원고, 또는 동도면(c)에 나타낸 것과 같은 복잡한 단조합의 원고에서는 주변분포에 의해서 문자방향의 판정을 함이 곤란했다.
본 발명은 이와같은 종래기술의 문제점을 해결하는 것을 목적으로 하는 것이다.
즉 본 발명은 문자만의 간단한 원고만이 아니고 중간조나 도표가 혼재된 원고, 단조합이 복잡한 원고도 정확하게 문서의 문자방향을 검출할 수 있는 문서문자방향 검출장치를 제공하는 것을 목적으로 하는 것이다.
상기 목적을 달성하기 위하여 본 발명은 제 1 도에 나타낸 것과 같이 2치화상에 있어서 서로 관련되는 화소군을 단위영역으로 하여 구하는 화소영역화수단(1)과 각 인접하는 단위영역간의 공백영역의 세로방향 및 가로방향의 런렝그스를 구하는 런렝그스 검출수단(2)과 세로방향 및 가로방향의 런렝그스의 출현빈도분포의 특징을 추출하는 런렝그스 빈도분포 특징추출수단(3)과 추출된 세로 및 가로방향의 런렝그스의 출현빈도분포의 특징을 비교하여 문서의 문자방향을 판정하는 방향판정수단(4)을 구비한 것이다.
제 9 도는 문서화상의 일예이다. 문서는 문자, 중간조, 도형등으로 구성되어 있다. 여기서 문자에 착안하면 문자는 행을 구성하고 가로쓰기의 경우에 세로방향의 문자(행)간격보다도 가로방향의 문자간격이 좁다. 역으로 세로쓰기의 경우에는 가로방향의 문자(행)간격보다도 세로방향의 문자간격이 좁은 특성을 나타낸다.
본 발명은 이 특성에 착안하여 문자간격의 계측에 준하여 문서의 문자방향을 검출하는 것이다.
화소영역화수단(1)은 입력화상에 있어서 서로 관련되는 화소군, 예를들면 1문자를 구성하는 화소군, 하나의 표나 도형을 구성하는 화소군을 단위영역으로 하여 검출한다. 화소군에서 단위영역을 추출하는 방법으로서는 예를들면 화소군의 외접구형을 구하여 이것을 단위영역으로 하는 외접구형화처리가 있다. 제 10 도는 화소군을 단위영역화(외접구형화)처리한 결과의 일예를 나타낸 것이다.
다음에 런렝그스 검출수단(2)에 의해서 각 인접하는 단위영역간의 공백영역의 세로방향 및 가로방향의 런렝그스를 구한다.
런렝그스 빈도분포특징 추출수단(3)은 런렝그스 검출수단(2)에 의해서 구한 런렝그스로 세로방향 및 가로방향의 각각에 대해서 런렝그스의 출현빈도의 분포를 구하고 그 특징 예를들면 빈도의 피크치를 구한다.
방향판정수단(4)은 런렝그스 빈도분포 특징추출수단(3)에 의해서 구한 세로가로의 출현빈도의 특징(피크치)을 비교하여 입력된 문서가 세로쓰기인지 가로쓰기인지를 판정한다. 제 10 도 및 제 11 도에 가로쓰기 및 세로쓰기의 경우에 각각의 출현빈도의 예를 나타내고 있으나 이들 도면에서 명백한 바와같이 가로방향 및 세로방향의 백런의 런렝그스의 빈도의 피크치의 대소관계는 가로쓰기 문서의 경우와 세로쓰기 문서의 경우에 역으로 되어 있고 따라서 방향판정수단(4)은 상기 대소관계를 조사함으로써 판정을 행할 수 있는 것이다.
본 발명에 의하면 문자만의 간단한 원고만이 아니고 중간조나 도표가 혼재된 원고, 단조합의 복잡한 원고도 정확하게 문서의 문자방향을 검출할 수 있다.
이하 본 발명을 도면에 나타낸 실시예에 의해서 상세히 설명하겠다.
제 2 도는 본 발명의 일실시예에 의한 문서화상 처리장치의 전체구성을 나타낸 것이다. 이 문서화상 처리장치는 문서화상을 디지탈화상으로서 주사입력하는 이미지스캔너(21), 입력화상의 처리를 위하여 기억하는 이미지 메모리(22), 본 발명의 문서의 문자방향을 검출하는 문자방향추출부(23), 장치전체를 제어하는 CPU(24), 데이타버스(25), 화상이나 메시지를 표시하는 모니터(26), 키보드(27), 화상등을 격납하는 외부기억장치(28) 및 화상을 출력하는 프린터(29)등으로 되어 있다.
제 3 도는 제 2 도에서의 본 발명의 문자방향검출부(23)의 구성을 나타낸 도면이다.
문자방향검출부(23)는 외접구형처리부(30)와 백런검출처리부(31)와 빈도분포검출처리부(32)와 피크검출처리부(33)와 문자방향판정부(34)로 되어 있다.
외접구형처리부(30)는 제 1 도의 흑화소영역화수단(1)의 일예이고 2치화상에서 서로 관련되는 흑화소군, 즉 서로 이어져 있는 복수의 흑화소로 되는 영역(예를들면 각 문자의 영역)을 외접하여 둘러쌓은 구형영역(단위영역)을 생성하는 것이다. 이 구형화처리에는 종래의 임의의 방식을 사용할 수 있으나 예를 들면 종래의 구형화처리방식의 일예로서 화상의 윤곽선을 추적함으로써 흑화소군을 구형으로 둘러쌓는 방식이다. 이 방식에서는 흑영역에 대해서 흑화소의 연결성분의 추적을 행함으로써 흑화소군을 포함하는 요소의 최소 X, Y좌표, 최대 X,Y좌표를 구할 수 있고 각각의 구조를 갖는 흑화소군을 구형으로 둘러쌓을 수 있는 것이다. 또 본 발명자는 이 종래의 방식을 개량한 방식을 제안하고 본 출원인에 의해서 출원되어 있다(일본국 특원평 1-87039호). 이 개량된 기술을 본 발명의 구형화처리에 이용하는 것이 바람직하다.
상기 출원의 구형화처리의 예를 간단히 설명하겠다.
여기서는 일예로서 문자인 「邊」이라는 화상을 예로들어 설명하겠다.
제 4 도에 「邊」이라는 문자를 화소단위로 나타냈다.
이 화상에 대해서 제 5a 도에 나타낸 마스크패턴을 사용하겨 좌측상으로 부터 우측하로 흑화소의 연결을 행한다. 주목화소에 대해서 상측의 화소, 좌측의 화소가 공히 흑화소였으면 주목화소를 흑화소로 변환하는 처리를 행한다. 이 마스크처리를 행한 예를 제 5b 도에 나타냈다. 흑화소를 우측방향으로 연결한 화상이 얻어진다.
다음에 제 6a 도에 나타낸 마스크패턴으로 우측상으로 부터 좌측하에 대해서 흑화소 연결처리를 행한다. 얻어진 결과를 제 6b 도에 나타냈다. 앞에서의 처리와 역으로 좌방향으로 흑화소를 연결한 화상이 얻어진다.
다음에 제 7a 도에 나타낸 마스크패턴으로 좌측하로 부터 우측상에 대해서 흑화소 연결처리를 행한다. 얻어진 결과를 제 7b 도에 나타냈다. 문자전체가 대략 구형영역으로 둘러쌓여 진것을 알 수 있다.
최후로 제 8a 도에 나타낸 마스크패턴으로 우측하로 부터 좌측상에 대해서 흑화소의 연결처리를 행한다. 얻어진 결과를 제 8b 도에 나타냈다.
이와같이 일련의 4회의 처리를 행함으로써 문자영역을 구형으로 둘러쌀 수 있다. 처리의 설명은 문자를 예로들어 행하였으나 이 결과는 도형, 표, 중간조에 대해서도 해당된다. 제 9 도는 가로쓰기의 문서화상의 일예를 나타낸 것이고, 제 10 도는 제 9 도의 화상의 외접구형처리후의 화상을 나타낸 것이다.
백런검출처리부(31)는 제 1 도에서의 런렝그스 검출수단(2)에 대응하는 것이고 상기와 같이 하여 얻어진 화상에 대해서 가로방향, 세로방향으로 각각 주사하여 백런의 런렝그스를 구하는 처리부이다. 런렝그스를 구하는 처리는 종래부터 있는 방식에서 임의로 선택할 수 있다.
빈도분포검출처리부(32)는 백런검출처리부(31)에 의해서 얻어진 백런의 런렝그스에 준하여 그 출현빈도의 분포를 구하는 것이다. 제 11 도는 가로쓰기 문서의 경우의 런의 빈도분포를 나타낸 그래프이고 동도면(a)는 가로방향의 백런의 런렝그스의 빈도를 나타내고 동도면(b)는 세로방향의 백런의 런렝그스의 빈도를 나타낸다. 또 제 12 도는 세로쓰기 문서의 경우의 런의 빈도분포를 나타낸 그래프이고 동도면(a)는 가로방향의 백런의 런렝그스의 빈도를 나타내고 동도면(b)은 세로방향의 백런의 런렝그스의 빈도를 나타내고 있다. 이들 도면에서 알 수 있는 바와 같이 세로쓰기 문서와 가로쓰기 문서는 세로방향과 가로방향의 백런의 런렝그스의 분포가 달라져 있고 또 세로쓰기 문서와 가로쓰기 문서에서는 백런의 런렝그스의 분포가 역으로 되어 있다. 이 분포의 상이에 의해서 세로쓰기인지 가로쓰기인지를 판정할 수 있다.
본 실시예에서는 각 분포의 특징은 출현빈도의 피크치를 갖는 백런의 런렝그스에 의해서 잡을 수 있다.
피크검출처리부(33)는 빈도의 비교에 의해서 빈도의 피크치를 갖는 백런의 런렝그스를 구하는 것이다. 상기의 빈도분포검출처리부(32)와 피크검출처리부(33)로 되는 처리부는 제 1 도에서의 런렝그스 빈도분포 특징 추출수단(3)에 대응한다.
문자방향판정부(34)는 제 1 도에서의 방향판정부(4)에 대응하는 것이다. 피크검출처리부(33)로 구한 가로방향 및 세로방향의 최고빈도의 런렝그스를 비교하여 "가로방향의 런렝그스 〈세로방향의 런렝그스"일때에 가로쓰기라고 판정하고 "가로방향의 런렝그스〉 세로방향의 런렝그스" 일때에 세로쓰기라고 판정하는 것이다.
본 실시예는 문자간의 백런이 기본으로 되어 있으므로 단조합의 영향은 받지 않는다. 제 13c 도와 같은 복잡한 단조합에서 종래의 주변분포의 검출로는 방향의 판정이 불가능했든 문서라도 용이하게 판정할 수 있다. 또 중간조, 도표는 통상의 문자간격보다도 넓기 때문에 출현빈도분포에서 피크치에서 벗어난 곳에 출현빈도가 위치되므로 세로쓰기/가로쓰기의 판정에 영향을 미치는 일은 없다. 그때문에 높은 정도로 문서의 문자방향을 검출할 수 있다.
또 실시예에서는 모든 외접구형에 대해서 구형간의 백런을 구했으나 백런을 구하는 전처리로서 어느정도 큰 구형은 처리대상에서 제외하도록 하여도 좋다. 이 전처리를 행함으로써 중간조, 도표가 문자방향판정에 미치는 영향을 회피할 수 있어 행방향검출에 유효한 데이타만을 모을 수 있기 때문에 측정정도도 향상된다.
본 발명에 의하면 단위영역(외접구형)을 구하여 그 단위영역간의 공백영역(백런)의 길이(런렝그스)를 계측하고 출현빈도분포에 의해서 문자방향의 판정을 행하므로 문자만의 간단한 원고만이 아니고 중간조나 도표가 혼재된 원고, 단조합이 복잡한 원고도 정확하게 문서의 문자방향을 검출할 수 있다.

Claims (1)

  1. 2치화상에 있어서, 서로 관련되는 흑화소군을 단위영역으로 하여 구하는 흑화소영역화수단과, 각 인접하는 단위영역간의 공백영역의 세로방향 및 가로방향의 런렝그스를 구하는 런렝그스 검출수단과, 세로방향 및 가로방향의 런렝그스의 출현빈도분포의 특징을 추출하는 런렝그스 빈도분포특징 추출수단과, 추출된 세로 및 가로방향의 런렝그스의 출현빈도분포의 특징을 비교하여 문서의 문자방향을 판정하는 방향판정수단을 갖는 것을 특징으로 하는 문서문자방향 검출장치.
KR1019910013335A 1990-08-02 1991-08-01 문서문자방향 검출장치 KR940009712B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2-203983 1990-08-02
JP2203983A JPH0766413B2 (ja) 1990-08-02 1990-08-02 文書文字方向検出装置
JP90-203983 1990-08-02

Publications (2)

Publication Number Publication Date
KR920005021A KR920005021A (ko) 1992-03-28
KR940009712B1 true KR940009712B1 (ko) 1994-10-17

Family

ID=16482852

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910013335A KR940009712B1 (ko) 1990-08-02 1991-08-01 문서문자방향 검출장치

Country Status (3)

Country Link
JP (1) JPH0766413B2 (ko)
KR (1) KR940009712B1 (ko)
TW (1) TW206290B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101360516B1 (ko) * 2010-01-18 2014-02-07 캐논 가부시끼가이샤 화상 처리 장치, 화상 처리 방법 및 기억 매체

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3471578B2 (ja) 1997-08-29 2003-12-02 シャープ株式会社 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
TWI332635B (en) 2007-01-05 2010-11-01 Compal Electronics Inc Method for determing oriention of chinese words
KR100826577B1 (ko) * 2007-02-26 2008-04-30 덕양산업 주식회사 자동차용 글로브박스의 개폐장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101360516B1 (ko) * 2010-01-18 2014-02-07 캐논 가부시끼가이샤 화상 처리 장치, 화상 처리 방법 및 기억 매체

Also Published As

Publication number Publication date
TW206290B (en) 1993-05-21
JPH0766413B2 (ja) 1995-07-19
KR920005021A (ko) 1992-03-28
JPH0490082A (ja) 1992-03-24

Similar Documents

Publication Publication Date Title
US5016118A (en) Image determining method and apparatus
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
US4750209A (en) System for processing an image having both letter and photographic information
EP0358815B1 (en) System and method for automatic segmentation
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
US4656665A (en) Thresholding technique for graphics images using histogram analysis
JPH0737103A (ja) 傾き角度検出装置
JPS63158678A (ja) 単語間スペ−ス検出方法
KR940009712B1 (ko) 문서문자방향 검출장치
JP2514309B2 (ja) バイレベル画像表現を生成する方法及び装置
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
KR100260923B1 (ko) 화상의 국부 이치화 장치 및 방법
JP2998443B2 (ja) 文字認識方法及びそのための装置
JP3052464B2 (ja) 多値化データを用いた輪郭点抽出法
Yang et al. Document image segmentation and quality improvement by moiré pattern analysis
JP2853140B2 (ja) 画像領域識別装置
JP2506071B2 (ja) 輪郭追跡装置
JPH03209579A (ja) 画像処理装置及び画像処理方法
KR970008521B1 (ko) 그래픽 영상의 수평/수직라인 검출방식
JP2936766B2 (ja) 画像入力装置
JPH10143607A (ja) 画像処理装置
JPH02166583A (ja) 文字認識装置
JPH01244587A (ja) 文字切出し装置
KR20040092561A (ko) 스캔 영상의 상역 분리 방법
JPH0540846A (ja) 文書画像の和文・欧文判定方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20101012

Year of fee payment: 17

EXPY Expiration of term