KR930002349B1 - 압축영상의 문자열 분리방법 - Google Patents

압축영상의 문자열 분리방법 Download PDF

Info

Publication number
KR930002349B1
KR930002349B1 KR1019900022456A KR900022456A KR930002349B1 KR 930002349 B1 KR930002349 B1 KR 930002349B1 KR 1019900022456 A KR1019900022456 A KR 1019900022456A KR 900022456 A KR900022456 A KR 900022456A KR 930002349 B1 KR930002349 B1 KR 930002349B1
Authority
KR
South Korea
Prior art keywords
string
area
coordinate
character string
information
Prior art date
Application number
KR1019900022456A
Other languages
English (en)
Other versions
KR920013107A (ko
Inventor
정찬의
Original Assignee
주식회사 금성사
이헌조
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 금성사, 이헌조 filed Critical 주식회사 금성사
Priority to KR1019900022456A priority Critical patent/KR930002349B1/ko
Priority to JP3346137A priority patent/JPH04303278A/ja
Priority to US07/815,930 priority patent/US5313526A/en
Publication of KR920013107A publication Critical patent/KR920013107A/ko
Application granted granted Critical
Publication of KR930002349B1 publication Critical patent/KR930002349B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

내용 없음.

Description

압축영상의 문자열 분리방법
제1도는 일반적인 문서인식 시스템 구성도.
제2도는 제1도에 따른 문서인식 처리흐름도.
제3도 (a) 및 (b)는 문자열 연결 및 그 분리형태도.
제4도 (a) 및 (b)는 문자열이 연결되는 형태를 보인 설명도.
제5도 (a) 내지 (e)는 본 발명에 따른 문자열 분리방법을 설명하기 위한 설명도.
제6도는 본 발명 압축영상의 문자열 분리방법에 따른 제어흐름도.
제7도는 제6도에 따른 좌측면 문자열 연결검색 제어흐름도.
제8도는 제6도에 따른 문자열 강제분리 제어흐름도.
* 도면의 주요부분에 대한 부호의 설명
A : 범용컴퓨터부 B : 전용하드웨어부
C : 문서영상입력부 1 : 디지탈신호처리소자
2 : 어드레스디코더 3 : 메모리
4 : 버퍼 5 : 스캐너인터페이스
6 : 스캐너 7 : 호스트인터페이스
8 : 호스트컴퓨터 9 : 모니터
10 : 보조기억장치 11 : 키보드
본 발명은 문서인식에 있어서, 압축된 문서영상으로부터의 영역추출시 연결된 영역의 분리방법에 관한 것으로, 특히 그래픽(또는 사진)영역과 언결된 문자열을 분리하는데 적당하도록 한 압축영상의 문자열 분리방법에 관한 것이다.
일반적으로, 문서인식을 위한 문서영상의 영역분할시에 처리시간 단축을 목적으로 원영상을 압축한후 이를 영역분리시켜 문서인식처리를 하는데, 문서의 구성은 사진 또는 그래픽영역을 포함하고 있으며, 이들 영역을 문서의 좌측 또는 우측단에 위치시키고 타측단에 문자열을 배열하는 문서의 구성을 많이 쓰기 때문에 이를 압축영상화시킬때 그래픽 영역과 문자열 사이의 여백사이(gap)가 문서영상의 압축을 보다 작으면 서로 연결되어 나타난다. 따라서 개열영역 추출시 이돌의 영역이 분리되지 않으므로 이들 강제분리시키는 방법이 필요하게 된다.
본 발명은 이와같은 문자영역과 그래픽 또는 사진영역이 연결되어 나타날때 이를 강제분리 시키기 위한 압축영상의 문자열 분리방법을 창안한 것으로, 이를 첨부한 도면을 참조해 상세히 설명하면 다음과 같다,
제1도는 본 발명에 적용하는 문서인식 처리시스템 구성도로서, 이에 도시한 바와같이 호스트 인터폐이스(7), 호스트 컴퓨터(8), 모니터(9), 보조기억장치(10) 및 키보드(11)로 구성되어 문서인식 처리를 하는 범용 컴퓨터부(20)와, 디지탈신호처리소자(DSP) (1), 어드례스 디코더(2), 메모리(3) 및 버퍼(4)로 구성되어 상기 범용 컴퓨터부(A)의 제어에 따라 문서인식을 위한 영상압축 및 영역분할등의 처리를 하는 전용 하드웨어부(B)와, 스캐너(6) 밋 스캐너 인터페이스(5)로 구성되어 상기 범용 컴퓨터부(A)의 제어에 따라 상기 범용 컴퓨터부(A) 및 전용 하드웨어부(B)에 문서영상 데이타를 전달하는 문서영상 입력부(C)로 구성되었다.
여기서는 데이타 선택신호,는 입출력 선택신호,는 프로그램 선택신호,는 인터럽트신호,는 인터럽트 인식신호,는 인에이블신호, A는 어드레스, D는 데이타, S는 선택신호를 나타낸다.
이와같이 구성되는 문서인식 시스템을 이용하는 본 발명의 압축영상의 문자열 분리방법을 설명하면 다음과 같다.
제2도는 제1도에 따른 문서인식 처리흐름도로서, 먼저 범용 컴퓨터부(A)의 호스트 컴퓨터(8)에 키보드(11)를 통해 명령을 주게되면, 그 호스트 컴퓨터(8)가 호스트 인터페이스(7)를 통해서 디지탈 신호처리소자(1) 및 스캐너 인터페이스(5)를 인에이블()시키고, 이에따라 그 스캐너 인터페이스(5)를 통해 스캐너(6)가 동작하여 문서영상을 입력(a)하게 된다. 입력되는 문서영상 데이타(D0∼D7)는 메모리(3)에 저장한후 그 저장된 문서영상 데이타(D0∼D7)를 버퍼(4)를 통해 디지탈 신호처리소자(1)에서 입력받아 영상압축(b)을 시켜 그 압축영상데이타를 메모리(3)에 저장시키고, 그 압축영상을 영역분할(c) 처리후 각 개열 영역의 특징을 추출하여 영역의 종류를 판별(d)하고, 이를 각 영역에 따라 문자영역은 문서인식, 사진 및 그레픽 영역은 코딩(coding)처리등(e)을 행하여 그 결과를 파이링(Filing)(f)하는 단계별 처리를 행하게 된다.
제3도 (a) 및 (b)는 본 발명을 설명하기 위한 형태 설명도로서, 제3도 (a)는 사진 또는 그래픽 영역과 문자열 사이의 여백갭의 크기가 문서영상의 압축율보다 작아 압축된 결과 서로 연결되어 개별영역추출시 이들의 영역이 분리되지 않을 경우의 예를 보인 형태이고, 제3도 (b)는 본 발명에 따라 우측의 문자열을 강제로 분리시킨 형태를 보인 것이다.
즉, 제3도 (a)에서 좌측의 사진 또는 그래픽 영역과 우측의 문자열 영역이 연결된 형태로 제2도 개열영역의 특징 추출 및 판별 단계(d)에서 처리되면 영역별 처리단계(e)에서 본 발명에 따라 제3도 (b)와같이 우측의 문자열 영역을 분리하게 된다.
제4도 (a) 및 (b)는 문자열이 연결되는 형태를 보인 설명도로서, 제4도 (a)는 우측에 문자열이 연결된 형태를 보인 것이고, 제4도 (b)는 우측에 문자열이 연결된 형태를 보인 것이다. 이와같이 두가지의 문자열 연결형태가 있으므로 그래픽(또는 사진) 영역의 윤곽형태를 조사하고 이를 제4도의 형태중 어느것인지를 판별하여 강제분리 과정을 수행한다.
제5도 (a) 내지 (e)는 본 발명에 따른 문자열 분리방법을 설명하기 위한 설명도로서, 제5도 (a)에 도시한 바와같이 그래픽 또는 사진영역(Gr)과 그 좌측에 문자열 정보영역(TL)이 배치되고, 각 문자열 정보영역(TL) 사이의 여백크기(EL)보다 그 문자열 정보영역(TL)과 상기 그래픽 또는 사진 영역(Gr) 사이의 여백크기(H)가 작을 경우에 이 영상데이타를 압축후 개별영역으로 분리하면, 제5도 (b)와 같이 좌측에 문자열이 연결된 하나의 그래픽 또는 사진역으로 분리된다 즉, 문서영상 데이타를 입력(a)받아 압축영상화 한후(b) 영역분리(c)하여 개별영역 처리(d)하면 제5도 (b)와 같은 하나의 그래픽 또는 사진영역으로 분리되어 그 영역에 문자열 영역(TL)과 그래픽 또는 사진영역(Gr)이 존재하게 된다.
이와같이 개별영역처리(d)에서 그래픽 또는 사진영역으로 처리되는 영역이 정상적인 그래픽 또는 사진영역인지 아니면, 좌측 또는 우측에 문자열영역이 연결되어진 형태인가를 우선 식별하게 된다. 이를 식별하기위한 방법으로 블록의 좌측면과 우측면의 윤곽형태를 조사하게 된다
제6도는 본 발명 압축영상의 문자열 분리방법에 따른 제어흐름도로서, 이에 도시한 바와같이 문자 영상데이타의 영역별 분리된 압축블록 총수(TBLOCK)를 세팅하고, 현재 처리하고자하는 압축불록(K=1)을 그래픽 또는 사진영역 인지를 그 압축불록 총수(TBLOCK)가 될때 (TBLOCK=K)까지 압축블록(K)을 순차적으로 선택(K=K+1)하면서 검색한다. 현재의 압축블록(K)이 그래픽 또는 사진영역이면 그 불록(K)의 좌측면을 검색하고, 다시 우측면을 검색하여 제4도에 도시된 바와같이 좌측면 또는 우측면에 문자열이 연결된 형태인가를 판별한다. 만약 좌측면 또는 우측면에 문자열이 연결된 형태이면, 각기 플래그를 제트[L←T(FLAGL←TRUE), R←T(FLAGR←TRUE)]시키고, 좌측면 또는 우측면이 문자열과 연결된 형태가 아니면 정상적인 그래픽 또는 사진영역으로 판별하여 플래그를 세트[L←F(FLAGL←FALSE), R←F(FLAGR←FALSE)] 시킨다.
이와같은 좌우측면 검색결과가 좌우측면 모두가 문자열이 연결된 형태(L=T, R=T)일 경우와, 좌우측면 모두가 문자열과 연결되지 않는 형태(L=F, R=F)일 경우는 제외시켜 다음 블록(K=K+1)의 처리를 수행하고, 좌측면 또는 우측면중 일측면에만 문자열이 연결된 형태[(L=T, R=F) 또는 (L=F, R=T)]이면, 좌우측면 검색시 검출한 문자열 정보영역의 위치정보에 따라 문자열이 연결된 측면의 문자열을 강제분리 시킨후 다음 블록(K=K+1)의 처리를 수행한다. 여기서, 좌측면 또는 우측면에 문자열이 연결된 형태인지를 판별하는 것은 제5도 (b)와 좌측면에 문자열이 연결된 블록은 제5도 (c)와 같이 좌상단의 좌표(SX,SY)와 우하단의 좌표(EX,EY)로 나타내어 직사각형의 영역을 얻게된다. 좌측면 검색이므로 좌측에서 우측으로, 상에서 하방향으로 라스터(raster)방식을 이용하여 조사한다.
제7도는 제6도의 좌측면 검색 제어흐름도로서, 이에 도시한 바와같이 문자열 정보 라인수(TL), 한 라인의 백화소 누적수(TP), 문자열간의 여백수(EL) 및 문자열 폭(WX)의 x좌표 최대값을 초기화시키고 x,y좌표를 불록의 최상단 좌표(SX,SY)로 제팅(X=SX, Y=SY)하여 그래픽 또는 사진영역 블록으로 판별된 블록의 좌에서 우측으로, 상에서 하방향으로 검색을 수행한다. 문서영상에서 영역추출하는 방법에 관한 특허 제89-17630호에 따르면 개열영역의 윤곽선에 해당하는 화소의 값을 "2"로 대치시킨다.
좌측으로부터 우측으로 각 화소별 화소값이 윤곽선상값(2)인 화소가 검출된 때까지 조사한다. 조사 화소값[P(X, Y)]이 윤곽선값("2")이 아니고, 공백 화소값("0")인 화소들의 갯수(TP)를 누적(TP=TP+1)한후 x좌표의 끝(X=EX)이 될때까지 x좌표를 증가(X=X+1)시키면서 윤곽선 화소를 찾는다. 만약 윤곽선값("2")에 해당되는 화소가 검출되면, x좌표(X)가 끝이 아니고(X=EX) x좌표(X)가 문자열 폭(WX) x좌표보다 클때(X>WX), 현재의 x좌표(X)를 문자열 X좌표 폭(WX=X)으로 세팅한 후, x좌표가 끝(X=EX)이거나 현재 x좌표가 문자열 x좌표 폭(WX)보다 작은 경우와 마찬가지로 현재 백화소 누적값(TP)이 문자영역인지 여백영역인지를 판별하는 임계값 보다 큰 경우는 문자열간 여백영역(EL)으로 판별하여 여백수를 누적(EL=EL+1)하고, 현재의 여백수(EL)가 첫번째(EL=1)인 경우는 이때의 y축 좌표를 그때까지 검출된 문자열(TL)의 끝 y좌표로 2차원 배열 coord[TL][0]=Y에 저장한다.
이후 여백영역(EL)이 첫번째가 아닌경우(EL=1)와 함께 y좌표가 끝(Y=EY)인지를 판별하며, 상기에서 백화소수(TP)가 임계값보다 작은(TP임계값) 문자정보영역(TL)일 경우는 현재까지의 여백영역(EL)이 일정 임계값 이상인지(EL임계값)를 판별하여 임계값보다 작은 경우는 y좌표가 끝인지(Y=EY)를 판별하며, 임계값 이상(EL임계값)이면 문자정보영역(TL) 시작 y축 좌표를 새로운 y축 좌표로 2차원 배열 coord[TL][1]에 저장한다.
그리고 문자정보 영역(TL)수를 증가(TL=TL+1)시킨뒤 여백영역(EL)수를 초기화(EL=0)시켜 y좌표가 끝인지(Y=RY)를 판별한다. y과표가 끝이 아니면, y좌표를 증가(Y=Y+1)시키고, x좌표를 시작좌표(X=SX)로 세팅하며, 백화소수(TP)를 초기화(TP=0)시킨뒤 다음줄의 검색을 수행한다. y좌표가 끝(Y=EY)일때까지 검색이 완료되면, 현재까지의 문자정보영역(TL)이 임계값 이상(TL임계값)이면 문자열 좌측연결로 세팅(L←T)하고, 그렇지 않으면 그래픽 또는 사진 영역인 것으로 세팅(L←F)하여 한 블록의 과측 검색을 마친다.
여기서, 윤곽선 화소가 검출되었을때, 블록의 x방향 시작 좌표(SX)로부터 얼마만한 거리에서 윤곽선 화소가 검출되었는가 하는 정보를 함께 알아내야 하는데, 이는 좌측면에서 문자열들이 연결되어 있을경우 이를 강제분리할때 문자열의 폭을 결정해야 하기 때문이다 즉, x방향의 시작좌표(SX)에서 가장 먼 위치에서 검출된 윤곽선 화소의 x축 좌표까지를 그폭으로 간주하며, 제5도의 (b) 및 (d)에서 WXC좌표가 된다.
이 WX값은 y방향 좌표값이 증가할때 윤곽선 화소가 검출되므로 그때마다 현재의 x좌표와 WX값을 비교하여 큰값을 WX값으로 설정한다. 문서상에서 문자열간의 상하간격은 거의 일정한 특징을 갖으므로, 문자열간의 간격인 여백영역(EL)은 각 문자열간의 간격마다 거의 일정하다. 따라서 현재 조사한 라인이 문자열정보영역(TL)인지 여백영역(EL)인지를 판단해야 한다. 이것은 화소값이 0인 화소갯수(TP)를 누적한 값이 소정의 임계값보다 크면 여백영역(EL)으로 판단한다.
또한, 이 여백영역(EL)수를 임계값과 비교하여 몇라인 연속적으로 검출되는지를 판별하고, 한 라인에서 누적된 백화소수(TP)가 임계값 보다 작으면 이 라인은 문자열에 속한 정보라인인 TL로 간주한다. 이에따라, 현재의 라인이 TL이면 바로 이전의 라인까지에서 검출된 여백영역(EL)수를 비교하여 여백영역이 연속적으로 몇라인 이상 검출되었을때 여백영역(EL)이 검출된 것으로 간주하고, 작으면 무시한다. 만약 여백영역(EL) 라인수가 임계값보다 크면(EL임계값) 문자열 간의 간격으로 판단하여 문자열 정보영역(TL)수를 누적(TL=TL+2)시킨다.
한편, 문자열을 강제분리할때 필요한 정보는 문자열의 x방향 폭(WX)뿐 아니라 각 문자열의 y방향의 위치정보가 필요하게 된다. 즉, 제5도의 (d)에 보인 바와같이 각 문자열의 시작 y좌표와 끝 y좌표가 필요하게 된다. 따라서, 이들 정보는 여백영역(EL)이 검출될때 y좌표를 비교하여 얻게되는데, 첫번째 여백영역(EL=1)이 검출될때 이때의 y축좌표를 그때까지 검출된 문자열 정보영역(TL)의 끝 y좌표로 지정한다. 문자열 정보영역(TL)의 시작 y축 좌표는 새로운 TL이 검출될때마다 그때의 y축 좌표로 지정하게 되며, 이좌표값들은 2차원 배열 coord[TL][1]에 저장한다.
이와같이 블록의 좌상단으로부터 좌→우로, 상→하로 검색하여 우하단까지 검색이 끝나면, 현재까지의 문자열 정보영역(TL)수를 임계값과 비교하여 하나의 그래픽 또는 사진영역 문자열과 여백영역이 좌측면에 연결된 영역인지를 판별하여 문자열 연결(L←T) 또는 그래픽/사진명역(L←F)으로 세팅한다.
한편, 우측면 검색과정은 우측에서 좌측으로 검색을 수행하면서 윤곽선 검출 과표의 x방향 좌표값을 최소값으로 선택하여 문자열 연결폭을 검출하는 과정만 다르고 상기에서 설명한 좌측면 검색과 동일과정으로 수행한다.
이와같이 좌측면 또는 우측면의 문자열 연결상태를 검색하여 그에 따른 플래그를 세트시키므로, 그 플래그를 판별하여 양측면 모두가 문자열이 연결된 형태(L=T),(R=T) 및 양측면 도두가 문자열 연결이 되지않은 형태(L=F),(R=F)는 제외하고 좌측면 또는 우측면에만 문자열이 연결된 상태(L=T, R=T),(L=F, R=T)를 판별하여 그에따라 좌측면 또는 우측면의 문자열을 강제분리시키게 된다. 블록의 좌측면에 문자열이 연결된 형태(L=T),(R=F)에서는 좌측면 검색과정에서 추출한 문자열의 위치정보인 문자열 폭(WX), 시작 y축 과표 및 끝 y축 좌표를 이용하여 새로운 블록들을 생성시킨다. 제5도 (d)는 좌측면 검색에 따른 추출정보들을 표시한 것이고, 이는 제5도 (b)로부터 문자열 영역을 강제분리 시키는 영역을 보인 것이다.
제8도는 본 발명에 다른 문자열 연결블록의 문자열 분리 제어흐름도인데, 먼저, 연결된 문자정보영역(TL)수를 모두 블록으로 분리하기 위한 변수(P)를 초기화(P=0)한후 현재 총블록수값(TBLOCK)을 증가(TBLOCK=TBLOCK+1)시켜 그 블록을 2차원 배열을 통해 각 위치좌표를 상기 과정에서 구한 좌표값으로 세팅한다.
먼저, 제5도 (d)에서 살펴보면, 문자정보영역(TL)수가 3개이고, 첫번째 문자열 정보영역의 시작 y좌표는 SY이며, 끝 y좌표는 상기 과정에서 저장시킨 coord[0][0]값이다.
여기서 "coord"는 2차원 배열의 의미하고, 첫번째 중팔호[ ]는 문자열정보영역(TL)의 첫번째 영역을 의미하며, 두번째 중괄호[0]는 문자열 정보영역(TL)의 y좌표를 의미하는데, [0]는 끝 y좌표를 나타내고, [1]는 시작 y좌표를 나타낸다. 따라서, coord[0][0]는 첫번째 TL의 끝 y좌표이고, coord[1][1]은 두번째 TL의 시작 y좌표, coord[1][0]는 두번째 TL의 끝 y좌표, coord[2][1]은 세번째 TL의 시작 y좌표, EY는 마지막(세번째) 문자열 정보영역의 끝 y좌표를 나타내며, WX+SX는 문자열 정보영역의 x방향 좌표이다.
따라서, 제8도에 도시한 바와같이 총블록수 증가(TBLOCK=TBLOCK+1)후 그 블록을 첫번째 문자열 정보영역(TL)의 위치정보로 세팅하여 하나의 블록으로 분리한다.
즉 BLOCK[TBLOCK] [1] =SY
[2]=coord[P] [0]
[3] =SX
[4] =WX+SX
로 세팅한다.
여기서 [TBLOCK]은 총블록수에서 증가시킨 새로운 블록울 의미하고, [1]은 문자열 블록의 시작 y좌 표즉, 첫번째 TL의 시작 y좌표(SY)이며, [2]은 끝 y좌표 즉, 첫번째 TL의 끝 y좌표 coord[P][0]이고(단[P]는 첫번째 TL이므로 [0]값),[3]은 시작 x좌표 SX이며, [4]는 문자열 끝 x좌표 WX+SX이다.
이와같이 첫번째 문자정보영역(TL=0)의 시작 y좌표, 끝 y좌표, 시작 x좌표, 끝 x좌표(WS+SX)를 세팅하여 새로운 블록(TBLOCK)을 분리하고, 문자열 정보영역[TL]이 끝(P=TL-1)인지를 판별하여(단, TL의 첫번째값이 0이므로 끝은 TL-1)끝이 아니면 블록번지를 증가(TBLOCK=TBLOCK+1)한후
BLOCK [TBLOCK] [1] = coord [P] [1]
[2] =coord[P][0]
[3] = SX
[4] = WX + SX
로 위치정보를 세팅한다. 여기서 coord[P][1]은 TL의 시작 y좌표, coord[P][0]는 [P]번째 TL의 끝 y좌표이다.
이후 다음 TL을 블록으로 분리하기 위해 현재 TL의 수값(P)을 증가(P=P+1)시켜 문자열 정보영역(TL)의 끝(P=TL-1)일때까지 반복 수행하여 각 TL을 각기 블록으로 하고, 마지막 TL이면(P=TL-1)블록 번지수를 증가(TBLOCK=TBLOCK+1)시킨후 그 블록을 마지막 문자열 정보영역(TL)의 위치정보로 세팅한다.
즉, BLOCK [TBLOCK] [1] = coord [P] [1]
[2] = EY
[3] = SX
[4] = WX + SX
한편, 문자열이 우측면에 연결된 블록의 우측면 분리는 우측면 검색에 따른 우측면 연결문자열 정보의 위치정보를 사용하여 상기 제8도와 동일과정으로 블록화시켜 분리해낸다. 따라서, 최종 제5도 (e)와 같이 각기 독립된 블록으로 분리해낼 수 있게된다.
이상에서 설명한 바와같이 본 발명은 문서인식에 있어서, 문서영상을 압축후 이를 블록으로 분리하여 개별영역 추출시 압축으로 인해 그래픽 또는 사진영역에 문자열이 연결되어 하나의 불록으로 나타나는 경우가 있는데, 이때 연결된 문자열을 강제분리 시킴으로써 개별영역 추출의 정확성을 높여 문서인식 시스템의 효율을 향상시킬 수 있다.

Claims (4)

  1. 현재 검색중인 블록이 그래픽/사진영역의 블록일 경우 좌측면을 검색하여 좌측면에 문자열이 연결됨(L←T) 또는 연결되지 않음(L←F)을 판별하고, 우측면을 검색하여 우측면에 문자열이 연결됨(R←T) 또는 연결되지 않음(R←F)을 판별한후 좌·우측면 모두 문자열이 연결(L,R←T)되거나 연결되지 않은(L,R←F)경우는 제외하며, 좌우측면중 일측면에만 문자열이 연결된 형태일때 그 문자열 연결 검색시 추출한 문자열 위치정보를 이용해 각기 개별분리 하도록 하는 것을 특징으로 하는 압축영상의 문자열 분리방법.
  2. 제1항에 있어서, 좌측면 문자열 연결검색은, 그래픽/사진영역으로 판별되는 블록을 좌→우, 상→하로라인 시작이 아닌 윤곽선 화소가 검출될때까지 라인별 검색을 하면서, 라인 끝이 아닌 윤곽선 화소가 검출되는 x좌표의 최대값을 문자열의 폭(WX)으로 설정하고, 각 라인별 백화소수(TP)에 따라 문자열의 정보영역(TL) 또는 여백영역(EL)인지를 판별하여 연속되는 정보영역(TL)의 시작 y좌표 및 끝 y좌표를 구함과 아울러 그 연속되는 정보영역(TL)수가 소정의 임계값 이상이면 좌측면 문자열 연결(L←T)로, 아니면 문자열 연결이 아닌것(L←F)으로 판별하는 것을 특징으로 하는 압축영상의 문자열 분리방법.
  3. 제1항에 있어서, 우측면 문자열 연결검색은 그래픽/사진영역으로 판별되는 블록을 우→좌, 상→하로라인 끝이 아닌 윤곽선 화소가 검출될 때까지 라인별 검색을 하면서, 라인 시작이 아닌 윤곽선 화소가 검출되는 x좌표 최소값을 문자열의 폭(WX)으로 설정하고, 각 라인별 백화소수(TP)에 따라 문자열의 정보영역(TL) 또는 여백영역(EL)인지를 판별하여 연속되는 정보영역(TL)의 시작 y좌표 및 끝 y좌표를 구함과 아울러 그 연속되는 정보영역(TL)수가 소정의 임계값 이상이면 우측면 문자열 연결(R←T)로, 아니면 문자열 연결이 아닌것(R←F)으로 판별하는 것을 특징으로 하는 압축영상의 문자열 분리방법.
  4. 제2항 또는 제3항에 있어서, 연속되는 정보영역(TL)의 시작 y좌표 몇 끝 y좌표의 검출은, 현재 검색한 라인이 문자열 정보영역(TL)일때, 현재까지의 여백영역(EL) 라인수 누적값이 소정의 임계값 미만이면 연속되는 정보영역(TL)으로 판별하고, 이상이면 새로운 문자열 정보영역(TL)으로 판별하여 그 문자열정보영역(TL)수를 누적 하면서 여백영역(EL) 라인수 누적값을 초기화 시킴과 아울리 현재 y좌표를 시작 y좌표로 구하고, 현재 검색한 라인이 여백영역(EL)일때, 그 여백영역(EL) 라인수를 누적하고, 첫번째(EL=1) 여백영역(EL)라인 검출에 따라 끝 y좌표를 구하는 것을 특징으로 하는 압축영상의 문자열 분리방법.
KR1019900022456A 1990-12-29 1990-12-29 압축영상의 문자열 분리방법 KR930002349B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1019900022456A KR930002349B1 (ko) 1990-12-29 1990-12-29 압축영상의 문자열 분리방법
JP3346137A JPH04303278A (ja) 1990-12-29 1991-12-27 圧縮映像の文字列分離方式
US07/815,930 US5313526A (en) 1990-12-29 1991-12-30 Method for disconnecting character strings of a compressed image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019900022456A KR930002349B1 (ko) 1990-12-29 1990-12-29 압축영상의 문자열 분리방법

Publications (2)

Publication Number Publication Date
KR920013107A KR920013107A (ko) 1992-07-28
KR930002349B1 true KR930002349B1 (ko) 1993-03-29

Family

ID=19308960

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019900022456A KR930002349B1 (ko) 1990-12-29 1990-12-29 압축영상의 문자열 분리방법

Country Status (3)

Country Link
US (1) US5313526A (ko)
JP (1) JPH04303278A (ko)
KR (1) KR930002349B1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JPH06236367A (ja) * 1992-11-12 1994-08-23 Ricoh Co Ltd 文書作成装置の制御方法
JP3373008B2 (ja) * 1993-10-20 2003-02-04 オリンパス光学工業株式会社 画像像域分離装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US5889886A (en) * 1995-11-28 1999-03-30 Xerox Corporation Method and apparatus for detecting running text in an image
US5893127A (en) * 1996-11-18 1999-04-06 Canon Information Systems, Inc. Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document
US6512848B2 (en) 1996-11-18 2003-01-28 Canon Kabushiki Kaisha Page analysis system
JP4616522B2 (ja) * 2001-07-12 2011-01-19 株式会社リコー 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体
JP4189654B2 (ja) * 2003-04-18 2008-12-03 セイコーエプソン株式会社 画像処理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3019836A1 (de) * 1980-05-23 1982-01-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
US4741046A (en) * 1984-07-27 1988-04-26 Konishiroku Photo Industry Co., Ltd. Method of discriminating pictures
US4577235A (en) * 1984-08-20 1986-03-18 The Mead Corporation Text/continuous tone image decision processor
JPS61296481A (ja) * 1985-06-24 1986-12-27 Mitsubishi Electric Corp 文書読取装置
JPH0738681B2 (ja) * 1987-03-20 1995-04-26 富士ゼロックス株式会社 領域認識装置
JPH06101049B2 (ja) * 1988-03-25 1994-12-12 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 文字列検出方法

Also Published As

Publication number Publication date
KR920013107A (ko) 1992-07-28
JPH04303278A (ja) 1992-10-27
US5313526A (en) 1994-05-17

Similar Documents

Publication Publication Date Title
US7949157B2 (en) Interpreting sign language gestures
JP2940936B2 (ja) 表領域識別方法
EP0843277A2 (en) Page analysis system
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
EP0381773B1 (en) Character recognition apparatus
US5265171A (en) Optical character reading apparatus for performing spelling check
KR930002349B1 (ko) 압축영상의 문자열 분리방법
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
US5361309A (en) Character recognition apparatus and method with low-resolution storage for character extraction
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JP2796561B2 (ja) 表形式文書認識方式
JP3548234B2 (ja) 文字認識方法及び装置
JPH11308464A (ja) パタンマッチング符号化装置、及びその符号化方法
JPH0564396B2 (ko)
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP2803735B2 (ja) 罫線を含んだ文字認識装置
KR930005568B1 (ko) 오 추출 라인 검출 방법
JPH05114047A (ja) 文字切り出し装置
JP2890307B2 (ja) 表領域分離装置
JPH06162106A (ja) 電子ファイリングシステム
JP2926842B2 (ja) 文字切出し回路
JP2001266070A (ja) 文字認識装置、文字認識方法および記憶媒体
JP2570311B2 (ja) 文字列認識装置
JP2003030585A (ja) 画像処理装置、方法、プログラム及び記憶媒体
JPS60238986A (ja) 文字認識装置のパタ−ンマツチング方式

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee