JPH07225809A - 文書読取り枠の自動生成方法 - Google Patents

文書読取り枠の自動生成方法

Info

Publication number
JPH07225809A
JPH07225809A JP6017394A JP1739494A JPH07225809A JP H07225809 A JPH07225809 A JP H07225809A JP 6017394 A JP6017394 A JP 6017394A JP 1739494 A JP1739494 A JP 1739494A JP H07225809 A JPH07225809 A JP H07225809A
Authority
JP
Japan
Prior art keywords
document
extracted
processing
block
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6017394A
Other languages
English (en)
Inventor
Junya Hiragushi
純也 平櫛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP6017394A priority Critical patent/JPH07225809A/ja
Publication of JPH07225809A publication Critical patent/JPH07225809A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 【目的】 簡単な操作で短時間に読取り枠を自動生成可
能とする。 【構成】 文書中の読取りたい部分を、その左上の1点
を指示して処理範囲を限定し、その範囲内での段組の抽
出,黒画素を伸長して文字間を塗り潰す処理,その輪郭
追跡による文字行の抽出,行を統合してのブロック抽出
などを含む自動領域抽出処理を行なうことで、簡単かつ
短時間に読取り枠を自動生成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、文書中の読み取らせ
たい部分を指定することにより、その部分を囲う読取り
枠を作成する文書読取り枠の自動生成方法に関する。
【0002】
【従来の技術】従来、文書中の1部だけを読取りたいと
き、 (1)手作業で読取り枠を作成する。 (2)読取り対象を含む部分を大きく囲み、自動的に領
域を抽出する機能を用いて読取り枠を生成し、その後、
不要な部分を削除する。 などの方法を用いている。
【0003】
【発明が解決しようとする課題】しかしながら、上記
(1)の場合に、読取り対象が1文書中に複数あると、
作業が煩雑となり時間が掛かる、また、(2)の場合は
読取り対象に対し、これを全て含むような枠を作成して
自動領域抽出処理を行なうため、無駄な部分も処理しな
ければならないことから時間が掛かるだけでなく、無駄
な部分を削除する処理も必要になるなどの問題がある。
したがって、この発明の課題は簡単な操作で、しかも短
時間に読取り枠を自動生成し得るようにすることにあ
る。
【0004】
【課題を解決するための手段】このような課題を解決す
るため、この発明では、入力された文書を表示し、指示
手段により文書上の所定1点を指示して処理範囲を限定
し、その処理範囲内で段組を抽出した後黒画素を伸長
し、文字間を塗り潰して輪郭追跡することにより個々の
文字行を抽出し、抽出された各文字行を統合して得られ
る最初のブロックを読取り枠として抽出することを特徴
としている。
【0005】
【作用】読取り対象となるブロックの左上1点を指示す
ることで、そこを基準として処理を行なう範囲を限定
し、その範囲について自動領域抽出処理を行ない、最初
のブロックが抽出された時点で処理を停止することによ
り、簡単な作業で短時間に読取り枠を生成可能とする。
【0006】
【実施例】図1はこの発明の実施例を示すフローチャー
トで、図示されない文字読取装置(OCR)に内蔵され
ている処理装置(CPU)の動作を示すものである。図
2〜図8はこの発明を具体的に説明するための説明図で
ある。まず、ステップで文書をスキャナーなどを用い
て入力し、画像として記憶する。なお、ここでは図や表
を含む横書き文書を処理する場合を想定している。図2
にその画像Gを簡略化して示す。いま、図2のR1を読
み取りたい部分とすると、ステップでは、マウス等の
ポインティングデバイスを用いて、図3の左上点P1を
指示する(ステップ−1)。その指示された点を基準
として、その下部,右部を処理範囲として取り出す(ス
テップ−2)。図3に対応する処理範囲を、図4に斜
線S1にて示す。
【0007】次に、図5のように文書画像Gの縦方向の
投影PRを取り、図6のように段組を抽出する。次い
で、最初の段組について、横方向に黒画素を伸長して文
字間を潰し、良く知られている輪郭追跡をして行を抽出
する。図6から抽出される行を図7に示す。このような
行は規則的に並んでいることから、この性質を利用して
行統合を行ないブロックB1を抽出し、これを読取り枠
とする。このとき、最初のブロックB1の読取り枠が作
成された時点で処理を終了する。つまり、図8の実線で
示す部分B1が抽出された時点で処理を終了し、点線部
分の処理は行なわない。以上の処理を自動領域抽出処理
として、図1のステップ−3に示す。
【0008】読み取りたい部分が図2のR2の場合も上
記と同様に、その左上の1点P2を指示することによ
り、読取り枠が自動生成される。なお、点P2を指示し
た場合の処理範囲は、図4の斜線部とは異なることにな
るのは勿論である。以後は、行切り出し(ステップ参
照),文字切り出し(ステップ参照)などの良く知ら
れている処理が行なわれ、辞書とのパターンマッチング
度などから個々の文字が認識される(ステップ参
照)。なお、以上では横書き文字について説明したが、
この発明は縦書きの場合にも上記と同様にして適用でき
るのは言う迄もない。
【0009】
【発明の効果】この発明によれば、読取りたい部分につ
いてその左上の1点だけを指示し、自動領域抽出処理を
行なうようにしたので、簡単な操作で短時間に読取り枠
を作成し得る利点が得られる。
【図面の簡単な説明】
【図1】この発明の実施例を示すフローチャートであ
る。
【図2】文書画像を簡略化して説明するための説明図で
ある。
【図3】読み取りたい部分の指示位置を説明するための
説明図である。
【図4】図3で指示される処理範囲を説明するための説
明図である。
【図5】縦方向の投影値を説明するための説明図であ
る。
【図6】段組の例を説明するための説明図である。
【図7】抽出された各行を説明するための説明図であ
る。
【図8】抽出された読取り枠を説明するための説明図で
ある。
【符号の説明】
G…文書画像、R1,R2…読み取り対象部分、P1,
P2…指示位置、S1…処理範囲、PR…投影値、B1
…ブロック(読取り枠)。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書を表示し、指示手段によ
    り文書上の所定1点を指示して処理範囲を限定し、その
    処理範囲内で段組を抽出した後黒画素を伸長し、文字間
    を塗り潰して輪郭追跡することにより個々の文字行を抽
    出し、抽出された各文字行を統合して得られる最初のブ
    ロックを読取り枠として抽出することを特徴とする文書
    読取り枠の自動生成方法。
JP6017394A 1994-02-14 1994-02-14 文書読取り枠の自動生成方法 Pending JPH07225809A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6017394A JPH07225809A (ja) 1994-02-14 1994-02-14 文書読取り枠の自動生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6017394A JPH07225809A (ja) 1994-02-14 1994-02-14 文書読取り枠の自動生成方法

Publications (1)

Publication Number Publication Date
JPH07225809A true JPH07225809A (ja) 1995-08-22

Family

ID=11942792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6017394A Pending JPH07225809A (ja) 1994-02-14 1994-02-14 文書読取り枠の自動生成方法

Country Status (1)

Country Link
JP (1) JPH07225809A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7486821B2 (en) 2003-06-10 2009-02-03 Samsung Electronics Co., Ltd. Method for recognizing characters in a portable terminal having an image input unit

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7486821B2 (en) 2003-06-10 2009-02-03 Samsung Electronics Co., Ltd. Method for recognizing characters in a portable terminal having an image input unit

Similar Documents

Publication Publication Date Title
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
JP2002279433A (ja) 映像中の文字検索方法及び装置
EP0457546B1 (en) Image processing method and apparatus
JPH07225809A (ja) 文書読取り枠の自動生成方法
US4903315A (en) Apparatus for enlarging or reducing an image pattern
JP2931041B2 (ja) 表内文字認識方法
JP2803736B2 (ja) 文字認識方式
JP2792037B2 (ja) 表および文書画像編集装置
JPH03142691A (ja) 表形式文書認識方式
JP2887803B2 (ja) 文書画像処理装置
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JP2800205B2 (ja) 画像処理装置
JP3157534B2 (ja) 表認識方法
JP2933947B2 (ja) 画像処理方法及び装置
JPH01270107A (ja) 数値制御加工装置のプログラム作成装置
JP2954218B2 (ja) 画像処理方法及び装置
KR100258328B1 (ko) 화상편집장치의 영역 선택방법
JPH08180087A (ja) 図形の歪み補正方法
JPS6324367A (ja) 画像処理方法
JPH07120386B2 (ja) 文字認識装置
JPH0728939A (ja) 表のベクトル化装置
JPH0433079A (ja) 表処理方式
JP2564488B2 (ja) 画像塗りつぶし方法
JP2926842B2 (ja) 文字切出し回路

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 9

Free format text: PAYMENT UNTIL: 20080212

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 12

Free format text: PAYMENT UNTIL: 20110212

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110212

Year of fee payment: 12

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 12

Free format text: PAYMENT UNTIL: 20110212

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140212

Year of fee payment: 15

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140212

Year of fee payment: 15

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 15

Free format text: PAYMENT UNTIL: 20140212

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees