KR930002349B1 - 압축영상의 문자열 분리방법 - Google Patents
압축영상의 문자열 분리방법 Download PDFInfo
- Publication number
- KR930002349B1 KR930002349B1 KR1019900022456A KR900022456A KR930002349B1 KR 930002349 B1 KR930002349 B1 KR 930002349B1 KR 1019900022456 A KR1019900022456 A KR 1019900022456A KR 900022456 A KR900022456 A KR 900022456A KR 930002349 B1 KR930002349 B1 KR 930002349B1
- Authority
- KR
- South Korea
- Prior art keywords
- string
- area
- coordinate
- character string
- information
- Prior art date
Links
- 238000000926 separation method Methods 0.000 title claims description 13
- 238000001514 detection method Methods 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 17
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 244000309464 bull Species 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
Description
Claims (4)
- 현재 검색중인 블록이 그래픽/사진영역의 블록일 경우 좌측면을 검색하여 좌측면에 문자열이 연결됨(L←T) 또는 연결되지 않음(L←F)을 판별하고, 우측면을 검색하여 우측면에 문자열이 연결됨(R←T) 또는 연결되지 않음(R←F)을 판별한후 좌·우측면 모두 문자열이 연결(L,R←T)되거나 연결되지 않은(L,R←F)경우는 제외하며, 좌우측면중 일측면에만 문자열이 연결된 형태일때 그 문자열 연결 검색시 추출한 문자열 위치정보를 이용해 각기 개별분리 하도록 하는 것을 특징으로 하는 압축영상의 문자열 분리방법.
- 제1항에 있어서, 좌측면 문자열 연결검색은, 그래픽/사진영역으로 판별되는 블록을 좌→우, 상→하로라인 시작이 아닌 윤곽선 화소가 검출될때까지 라인별 검색을 하면서, 라인 끝이 아닌 윤곽선 화소가 검출되는 x좌표의 최대값을 문자열의 폭(WX)으로 설정하고, 각 라인별 백화소수(TP)에 따라 문자열의 정보영역(TL) 또는 여백영역(EL)인지를 판별하여 연속되는 정보영역(TL)의 시작 y좌표 및 끝 y좌표를 구함과 아울러 그 연속되는 정보영역(TL)수가 소정의 임계값 이상이면 좌측면 문자열 연결(L←T)로, 아니면 문자열 연결이 아닌것(L←F)으로 판별하는 것을 특징으로 하는 압축영상의 문자열 분리방법.
- 제1항에 있어서, 우측면 문자열 연결검색은 그래픽/사진영역으로 판별되는 블록을 우→좌, 상→하로라인 끝이 아닌 윤곽선 화소가 검출될 때까지 라인별 검색을 하면서, 라인 시작이 아닌 윤곽선 화소가 검출되는 x좌표 최소값을 문자열의 폭(WX)으로 설정하고, 각 라인별 백화소수(TP)에 따라 문자열의 정보영역(TL) 또는 여백영역(EL)인지를 판별하여 연속되는 정보영역(TL)의 시작 y좌표 및 끝 y좌표를 구함과 아울러 그 연속되는 정보영역(TL)수가 소정의 임계값 이상이면 우측면 문자열 연결(R←T)로, 아니면 문자열 연결이 아닌것(R←F)으로 판별하는 것을 특징으로 하는 압축영상의 문자열 분리방법.
- 제2항 또는 제3항에 있어서, 연속되는 정보영역(TL)의 시작 y좌표 몇 끝 y좌표의 검출은, 현재 검색한 라인이 문자열 정보영역(TL)일때, 현재까지의 여백영역(EL) 라인수 누적값이 소정의 임계값 미만이면 연속되는 정보영역(TL)으로 판별하고, 이상이면 새로운 문자열 정보영역(TL)으로 판별하여 그 문자열정보영역(TL)수를 누적 하면서 여백영역(EL) 라인수 누적값을 초기화 시킴과 아울리 현재 y좌표를 시작 y좌표로 구하고, 현재 검색한 라인이 여백영역(EL)일때, 그 여백영역(EL) 라인수를 누적하고, 첫번째(EL=1) 여백영역(EL)라인 검출에 따라 끝 y좌표를 구하는 것을 특징으로 하는 압축영상의 문자열 분리방법.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900022456A KR930002349B1 (ko) | 1990-12-29 | 1990-12-29 | 압축영상의 문자열 분리방법 |
JP3346137A JPH04303278A (ja) | 1990-12-29 | 1991-12-27 | 圧縮映像の文字列分離方式 |
US07/815,930 US5313526A (en) | 1990-12-29 | 1991-12-30 | Method for disconnecting character strings of a compressed image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900022456A KR930002349B1 (ko) | 1990-12-29 | 1990-12-29 | 압축영상의 문자열 분리방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR920013107A KR920013107A (ko) | 1992-07-28 |
KR930002349B1 true KR930002349B1 (ko) | 1993-03-29 |
Family
ID=19308960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019900022456A KR930002349B1 (ko) | 1990-12-29 | 1990-12-29 | 압축영상의 문자열 분리방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5313526A (ko) |
JP (1) | JPH04303278A (ko) |
KR (1) | KR930002349B1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
JPH06236367A (ja) * | 1992-11-12 | 1994-08-23 | Ricoh Co Ltd | 文書作成装置の制御方法 |
JP3373008B2 (ja) * | 1993-10-20 | 2003-02-04 | オリンパス光学工業株式会社 | 画像像域分離装置 |
US5588072A (en) * | 1993-12-22 | 1996-12-24 | Canon Kabushiki Kaisha | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks |
US5889886A (en) * | 1995-11-28 | 1999-03-30 | Xerox Corporation | Method and apparatus for detecting running text in an image |
US6512848B2 (en) | 1996-11-18 | 2003-01-28 | Canon Kabushiki Kaisha | Page analysis system |
US5893127A (en) * | 1996-11-18 | 1999-04-06 | Canon Information Systems, Inc. | Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document |
JP4616522B2 (ja) * | 2001-07-12 | 2011-01-19 | 株式会社リコー | 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体 |
JP4189654B2 (ja) * | 2003-04-18 | 2008-12-03 | セイコーエプソン株式会社 | 画像処理装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3019836A1 (de) * | 1980-05-23 | 1982-01-21 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen |
DE3113555A1 (de) * | 1981-04-03 | 1982-10-21 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen |
US4741046A (en) * | 1984-07-27 | 1988-04-26 | Konishiroku Photo Industry Co., Ltd. | Method of discriminating pictures |
US4577235A (en) * | 1984-08-20 | 1986-03-18 | The Mead Corporation | Text/continuous tone image decision processor |
JPS61296481A (ja) * | 1985-06-24 | 1986-12-27 | Mitsubishi Electric Corp | 文書読取装置 |
JPH0738681B2 (ja) * | 1987-03-20 | 1995-04-26 | 富士ゼロックス株式会社 | 領域認識装置 |
JPH06101049B2 (ja) * | 1988-03-25 | 1994-12-12 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 文字列検出方法 |
-
1990
- 1990-12-29 KR KR1019900022456A patent/KR930002349B1/ko not_active IP Right Cessation
-
1991
- 1991-12-27 JP JP3346137A patent/JPH04303278A/ja active Pending
- 1991-12-30 US US07/815,930 patent/US5313526A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR920013107A (ko) | 1992-07-28 |
JPH04303278A (ja) | 1992-10-27 |
US5313526A (en) | 1994-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6512848B2 (en) | Page analysis system | |
JP2940936B2 (ja) | 表領域識別方法 | |
US6327384B1 (en) | Character recognition apparatus and method for recognizing characters | |
US5265171A (en) | Optical character reading apparatus for performing spelling check | |
KR930002349B1 (ko) | 압축영상의 문자열 분리방법 | |
US5502777A (en) | Method and apparatus for recognizing table and figure having many lateral and longitudinal lines | |
US5361309A (en) | Character recognition apparatus and method with low-resolution storage for character extraction | |
US20030123730A1 (en) | Document recognition system and method using vertical line adjacency graphs | |
JPH08180068A (ja) | 電子ファイリング装置 | |
JP2796561B2 (ja) | 表形式文書認識方式 | |
JP3548234B2 (ja) | 文字認識方法及び装置 | |
JPS58197581A (ja) | 文字図形認識方法とその装置 | |
JPH0564396B2 (ko) | ||
JP2803735B2 (ja) | 罫線を含んだ文字認識装置 | |
JP3157530B2 (ja) | 文字切り出し方法 | |
JP3140079B2 (ja) | 罫線認識方法及び表処理方法 | |
JPH06162106A (ja) | 電子ファイリングシステム | |
JP2890307B2 (ja) | 表領域分離装置 | |
JPH05114047A (ja) | 文字切り出し装置 | |
JP2003030585A (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JP2001266070A (ja) | 文字認識装置、文字認識方法および記憶媒体 | |
JP2926842B2 (ja) | 文字切出し回路 | |
JP2570311B2 (ja) | 文字列認識装置 | |
JPS6361382A (ja) | 線画像からの文字成分除去方法 | |
JPS63225883A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19901229 |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 19901229 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
G160 | Decision to publish patent application | ||
PG1605 | Publication of application before grant of patent |
Comment text: Decision on Publication of Application Patent event code: PG16051S01I Patent event date: 19930227 |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 19930623 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 19930714 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 19930714 End annual number: 3 Start annual number: 1 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |