JPH07225809A - 文書読取り枠の自動生成方法 - Google Patents
文書読取り枠の自動生成方法Info
- Publication number
- JPH07225809A JPH07225809A JP6017394A JP1739494A JPH07225809A JP H07225809 A JPH07225809 A JP H07225809A JP 6017394 A JP6017394 A JP 6017394A JP 1739494 A JP1739494 A JP 1739494A JP H07225809 A JPH07225809 A JP H07225809A
- Authority
- JP
- Japan
- Prior art keywords
- document
- extracted
- processing
- block
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
能とする。 【構成】 文書中の読取りたい部分を、その左上の1点
を指示して処理範囲を限定し、その範囲内での段組の抽
出,黒画素を伸長して文字間を塗り潰す処理,その輪郭
追跡による文字行の抽出,行を統合してのブロック抽出
などを含む自動領域抽出処理を行なうことで、簡単かつ
短時間に読取り枠を自動生成する。
Description
たい部分を指定することにより、その部分を囲う読取り
枠を作成する文書読取り枠の自動生成方法に関する。
き、 (1)手作業で読取り枠を作成する。 (2)読取り対象を含む部分を大きく囲み、自動的に領
域を抽出する機能を用いて読取り枠を生成し、その後、
不要な部分を削除する。 などの方法を用いている。
(1)の場合に、読取り対象が1文書中に複数あると、
作業が煩雑となり時間が掛かる、また、(2)の場合は
読取り対象に対し、これを全て含むような枠を作成して
自動領域抽出処理を行なうため、無駄な部分も処理しな
ければならないことから時間が掛かるだけでなく、無駄
な部分を削除する処理も必要になるなどの問題がある。
したがって、この発明の課題は簡単な操作で、しかも短
時間に読取り枠を自動生成し得るようにすることにあ
る。
るため、この発明では、入力された文書を表示し、指示
手段により文書上の所定1点を指示して処理範囲を限定
し、その処理範囲内で段組を抽出した後黒画素を伸長
し、文字間を塗り潰して輪郭追跡することにより個々の
文字行を抽出し、抽出された各文字行を統合して得られ
る最初のブロックを読取り枠として抽出することを特徴
としている。
ることで、そこを基準として処理を行なう範囲を限定
し、その範囲について自動領域抽出処理を行ない、最初
のブロックが抽出された時点で処理を停止することによ
り、簡単な作業で短時間に読取り枠を生成可能とする。
トで、図示されない文字読取装置(OCR)に内蔵され
ている処理装置(CPU)の動作を示すものである。図
2〜図8はこの発明を具体的に説明するための説明図で
ある。まず、ステップで文書をスキャナーなどを用い
て入力し、画像として記憶する。なお、ここでは図や表
を含む横書き文書を処理する場合を想定している。図2
にその画像Gを簡略化して示す。いま、図2のR1を読
み取りたい部分とすると、ステップでは、マウス等の
ポインティングデバイスを用いて、図3の左上点P1を
指示する(ステップ−1)。その指示された点を基準
として、その下部,右部を処理範囲として取り出す(ス
テップ−2)。図3に対応する処理範囲を、図4に斜
線S1にて示す。
投影PRを取り、図6のように段組を抽出する。次い
で、最初の段組について、横方向に黒画素を伸長して文
字間を潰し、良く知られている輪郭追跡をして行を抽出
する。図6から抽出される行を図7に示す。このような
行は規則的に並んでいることから、この性質を利用して
行統合を行ないブロックB1を抽出し、これを読取り枠
とする。このとき、最初のブロックB1の読取り枠が作
成された時点で処理を終了する。つまり、図8の実線で
示す部分B1が抽出された時点で処理を終了し、点線部
分の処理は行なわない。以上の処理を自動領域抽出処理
として、図1のステップ−3に示す。
記と同様に、その左上の1点P2を指示することによ
り、読取り枠が自動生成される。なお、点P2を指示し
た場合の処理範囲は、図4の斜線部とは異なることにな
るのは勿論である。以後は、行切り出し(ステップ参
照),文字切り出し(ステップ参照)などの良く知ら
れている処理が行なわれ、辞書とのパターンマッチング
度などから個々の文字が認識される(ステップ参
照)。なお、以上では横書き文字について説明したが、
この発明は縦書きの場合にも上記と同様にして適用でき
るのは言う迄もない。
いてその左上の1点だけを指示し、自動領域抽出処理を
行なうようにしたので、簡単な操作で短時間に読取り枠
を作成し得る利点が得られる。
る。
ある。
説明図である。
明図である。
る。
る。
ある。
P2…指示位置、S1…処理範囲、PR…投影値、B1
…ブロック(読取り枠)。
Claims (1)
- 【請求項1】 入力された文書を表示し、指示手段によ
り文書上の所定1点を指示して処理範囲を限定し、その
処理範囲内で段組を抽出した後黒画素を伸長し、文字間
を塗り潰して輪郭追跡することにより個々の文字行を抽
出し、抽出された各文字行を統合して得られる最初のブ
ロックを読取り枠として抽出することを特徴とする文書
読取り枠の自動生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6017394A JPH07225809A (ja) | 1994-02-14 | 1994-02-14 | 文書読取り枠の自動生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6017394A JPH07225809A (ja) | 1994-02-14 | 1994-02-14 | 文書読取り枠の自動生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07225809A true JPH07225809A (ja) | 1995-08-22 |
Family
ID=11942792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6017394A Pending JPH07225809A (ja) | 1994-02-14 | 1994-02-14 | 文書読取り枠の自動生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07225809A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7486821B2 (en) | 2003-06-10 | 2009-02-03 | Samsung Electronics Co., Ltd. | Method for recognizing characters in a portable terminal having an image input unit |
-
1994
- 1994-02-14 JP JP6017394A patent/JPH07225809A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7486821B2 (en) | 2003-06-10 | 2009-02-03 | Samsung Electronics Co., Ltd. | Method for recognizing characters in a portable terminal having an image input unit |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5075895A (en) | Method and apparatus for recognizing table area formed in binary image of document | |
EP0843275A2 (en) | Pattern extraction apparatus and method for extracting patterns | |
JP2002279433A (ja) | 映像中の文字検索方法及び装置 | |
EP0457546B1 (en) | Image processing method and apparatus | |
JPH07225809A (ja) | 文書読取り枠の自動生成方法 | |
US4903315A (en) | Apparatus for enlarging or reducing an image pattern | |
JP2931041B2 (ja) | 表内文字認識方法 | |
JP2803736B2 (ja) | 文字認識方式 | |
JP2792037B2 (ja) | 表および文書画像編集装置 | |
JPH03142691A (ja) | 表形式文書認識方式 | |
JP2887803B2 (ja) | 文書画像処理装置 | |
JP3162414B2 (ja) | 罫線認識方法及び表処理方法 | |
JP2800205B2 (ja) | 画像処理装置 | |
JP3157534B2 (ja) | 表認識方法 | |
JP2933947B2 (ja) | 画像処理方法及び装置 | |
JPH01270107A (ja) | 数値制御加工装置のプログラム作成装置 | |
JP2954218B2 (ja) | 画像処理方法及び装置 | |
KR100258328B1 (ko) | 화상편집장치의 영역 선택방법 | |
JPH08180087A (ja) | 図形の歪み補正方法 | |
JPS6324367A (ja) | 画像処理方法 | |
JPH07120386B2 (ja) | 文字認識装置 | |
JPH0728939A (ja) | 表のベクトル化装置 | |
JPH0433079A (ja) | 表処理方式 | |
JP2564488B2 (ja) | 画像塗りつぶし方法 | |
JP2926842B2 (ja) | 文字切出し回路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 9 Free format text: PAYMENT UNTIL: 20080212 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 12 Free format text: PAYMENT UNTIL: 20110212 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110212 Year of fee payment: 12 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 12 Free format text: PAYMENT UNTIL: 20110212 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140212 Year of fee payment: 15 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140212 Year of fee payment: 15 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 15 Free format text: PAYMENT UNTIL: 20140212 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |