JPS627590B2 - - Google Patents

Info

Publication number
JPS627590B2
JPS627590B2 JP54068416A JP6841679A JPS627590B2 JP S627590 B2 JPS627590 B2 JP S627590B2 JP 54068416 A JP54068416 A JP 54068416A JP 6841679 A JP6841679 A JP 6841679A JP S627590 B2 JPS627590 B2 JP S627590B2
Authority
JP
Japan
Prior art keywords
line
black
length
vertical
lines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54068416A
Other languages
Japanese (ja)
Other versions
JPS55162176A (en
Inventor
Takahiko Chuma
Toshiaki Katahira
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6841679A priority Critical patent/JPS55162176A/en
Publication of JPS55162176A publication Critical patent/JPS55162176A/en
Publication of JPS627590B2 publication Critical patent/JPS627590B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 本発明は、伝票等においてみられるように、縦
線や横線等の線図形と文字とが描かれた原稿上で
線図形と文字とが互いに交わる部分がある場合に
おいても、線図形と文字とを個別に抽出すること
のできる新規な画像抽出方式を提供することを目
的とする。
[Detailed Description of the Invention] The present invention is applicable to documents where line figures such as vertical lines or horizontal lines and characters intersect with each other, such as in slips, etc. Another object of the present invention is to provide a new image extraction method that can extract line figures and characters separately.

なお以下では、原稿上に描かれた文字、記号並
びに数字を、例えば枠線のような他の線図形と区
別して「文字」と呼ぶ。
Note that hereinafter, characters, symbols, and numbers drawn on a document will be referred to as "characters" to distinguish them from other line figures such as frame lines.

伝票等の線図形と文字とが描かれた原稿の画情
報から、線図形と文字とを抽出する、あるいは文
字のみを抽出する方法は、これまでにも見られる
が、これらの場合においては、原稿上の線図形と
文字に対して「線図形と文字とは互いに交わらな
い」という条件を前提としており、この条件を利
用して、黒レベル信号の連続性が途切れた時点
で、連続領域の占める面積の大きさにより線図形
と文字とを識別しており、線図形と文字とが交わ
る部分がある原稿に対しては、これらの抽出方法
は適用できない。しかしながら、例えば伝票等で
も枠線をはみ出して文字を記入した場合などは実
際には頻繁に発生するものであつて、画像の抽出
処理にあたつて非常に困難な問題となつていた。
Methods have been seen in the past to extract line figures and characters, or to extract only the characters, from the image information of a document on which line figures and characters are drawn, such as a slip, but in these cases, The condition for line figures and characters on a document is that ``line figures and characters do not intersect with each other.'' Using this condition, when the continuity of the black level signal is interrupted, the continuous area is Line figures and characters are distinguished by the size of the area they occupy, and these extraction methods cannot be applied to manuscripts in which there are parts where line figures and characters intersect. However, in practice, for example, when characters are written outside the frame lines of documents, etc., this frequently occurs, and this has become a very difficult problem in image extraction processing.

本発明は、原稿上に線図形と文字とが互いに交
わる部分があつても、それらを別々に抽出できる
画像抽出方式であつて、以下に本発明を実現する
ための構成の一実施例を図面にもとづいて説明す
る。
The present invention is an image extraction method that can extract line figures and characters separately even if there are parts where they intersect with each other on a document. I will explain based on this.

第1図において、1は走査部であり、原稿を線
順次に走査して原稿上の画情報を画素単位で2値
のデイジタル信号として取り出し、後述する第1
記憶部2に記憶させる。以下、一回の走査で画情
報が取り出されるラインの方向を主走査方向、こ
れと直交する方向を副走査方向と呼ぶ。
In FIG. 1, reference numeral 1 denotes a scanning section, which scans the document line-by-line and extracts image information on the document as a binary digital signal pixel by pixel.
The information is stored in the storage unit 2. Hereinafter, the direction of the line from which image information is extracted in one scan will be referred to as the main scanning direction, and the direction perpendicular to this will be referred to as the sub-scanning direction.

2は第1記憶部であり、走査部1で取り出され
た2値信号を走査順に記憶し、容量は原稿1ペー
ジ分以上を有するものとする。
Reference numeral 2 denotes a first storage section, which stores the binary signals taken out by the scanning section 1 in scanning order, and has a capacity of one page or more of a document.

3は黒ラン検出部であり、第1記憶部2の2値
信号をチエツクし、縦線及び横線の部分である可
能性を有する黒ランを見つける。
Reference numeral 3 denotes a black run detection section which checks the binary signal in the first storage section 2 to find black runs that may be part of vertical lines and horizontal lines.

4は線抽出部で黒ラン検出部3で見つけられた
縦線及び横線の部分である可能性を有する黒ラン
の周辺の2値信号を、後述する第2記憶部5に情
報を残しながらチエツクしてゆき、縦線及び横線
の抽出を行ない、これに関する情報を後述する第
3記憶部8に記憶させる。
Reference numeral 4 denotes a line extraction unit which checks the binary signals around the black runs that may be vertical and horizontal lines found by the black run detection unit 3 while leaving the information in a second storage unit 5, which will be described later. Then, vertical lines and horizontal lines are extracted, and information regarding this is stored in a third storage section 8, which will be described later.

5は第2記憶部であり、線抽出部4の処理中の
情報を記憶する。
A second storage section 5 stores information being processed by the line extraction section 4.

6は記憶修正部であり、線抽出部4で抽出され
た縦線及び横線に相当する画信号を第1記憶部2
から消去すると共に、これら縦線及び横線と、こ
れら以外の文字等とが交わつていた部分の画信号
を第1記憶部2上で補充する。
Reference numeral 6 denotes a memory correction unit, which stores image signals corresponding to the vertical lines and horizontal lines extracted by the line extraction unit 4 in the first storage unit 2.
At the same time, the first storage unit 2 is supplemented with image signals of the portions where these vertical lines and horizontal lines intersect with characters other than these.

7は文字抽出部であり、記憶修正部6の処理を
施された後の第1記憶部2の画信号から、残され
た文字等を抽出し、これに関する情報を後述する
第3記憶部8に記憶させる。
Reference numeral 7 denotes a character extraction section, which extracts remaining characters, etc. from the image signal in the first storage section 2 after being processed by the memory correction section 6, and a third storage section 8 whose information related thereto will be described later. to be memorized.

8は第3記憶部であり、線抽出部4で抽出され
た縦線及び横線と、文字抽出部7で抽出された文
字等とに関する情報を記憶する。
Reference numeral 8 denotes a third storage section, which stores information regarding vertical lines and horizontal lines extracted by the line extraction section 4 and characters etc. extracted by the character extraction section 7.

第2図は本実施例の説明に用いる原稿上の画情
報の一例であり、ます目は画素の区切りを表わ
し、また、a1〜a35は主走査方向のアドレス、b1
〜b35は副走査方向のアドレスを表わすが、いず
れも図の繁雑化を避けるため5つ毎に付与するに
留めている。
FIG. 2 is an example of image information on a document used to explain this embodiment. Squares represent pixel divisions, a 1 to a 35 are addresses in the main scanning direction, and b 1
.about.b35 represents an address in the sub-scanning direction, but in order to avoid complicating the diagram, only every five addresses are given.

以下に本実施例の処理方式について具体的に説
明する。
The processing method of this embodiment will be specifically explained below.

本実施例においては、原稿上の画像の性質につ
いて次のような制限を付する。縦線及び横線の太
さは画素数にして2〜3の範囲にあり、その縦線
もしくは横線を形成している画素の列もしくは行
の各々が画素数にして10以上の長さを有する。ま
た、縦線の副走査方向の長さと横線の主走査方向
の長さとの下限、及び文字の主走査方向並びに副
走査方向の大きさの上限を画素数にして20とす
る。以上の制限は、処理の具体的説明のために一
応設定したものであつて、本発明の制約となるも
のではなく、運用において、実際の原稿の性質、
走査部の性能等から設定されるべきものである。
In this embodiment, the following restrictions are imposed on the nature of the image on the document. The thickness of the vertical line and horizontal line is in the range of 2 to 3 in terms of the number of pixels, and each column or row of pixels forming the vertical line or horizontal line has a length of 10 or more in terms of the number of pixels. Further, the lower limit of the length of the vertical line in the sub-scanning direction and the length of the horizontal line in the main-scanning direction, and the upper limit of the size of the character in the main-scanning direction and the sub-scanning direction are set to 20 in pixels. The above limitations have been set for the purpose of concretely explaining the processing, and do not limit the present invention.
This should be set based on the performance of the scanning unit, etc.

まず、走査部1において原稿が線順次に走査さ
れて原稿上の画情報が画素単位で2値のデイジタ
ル信号として取り出され、これが走査順に第1記
憶部2に1ページ分記憶される。
First, a document is line-sequentially scanned in the scanning section 1, and image information on the document is extracted pixel by pixel as a binary digital signal, which is stored for one page in the first storage section 2 in the scanning order.

次に、黒ラン検出部3において、第1記憶部2
内の画信号を主走査方向のライン単位に見てゆ
き、縦線の太さに相当する長さ2〜3の範囲の黒
ランの有無及び横線を形成する長さ10以上の行要
素の有無をチエツクする。第2図の原稿例の場合
であれば、b1のラインにおいてa28〜a29の長さ2
の黒ランが縦線の第1候補として検出され、この
アドレス情報が次の線抽出部4に引継がれる。
Next, in the black run detection section 3, the first storage section 2
Examine the image signal within line by line in the main scanning direction, and check whether there are black runs with a length of 2 to 3, which corresponds to the thickness of the vertical line, and whether there are row elements with a length of 10 or more that form a horizontal line. Check. In the case of the manuscript example in Figure 2, the length of a 28 to a 29 in line b 1 is 2.
The black run is detected as the first candidate for the vertical line, and this address information is taken over to the next line extraction unit 4.

線抽出部4においては、黒ラン検出部3で検出
された縦線候補もしくは横線候補の黒ランの周辺
への連続性を、その黒ランが検出されたラインの
前後のラインについて順次追跡して、前述の縦線
及び横線に関する制限内にはいつているか否かを
判断し、制限内にはいつているものを縦線もしく
は横線として抽出する。第2図の原稿例の場合で
あれば、黒ラン検出部3において、第1縦線候補
としてb1ライン上のa28〜a29のランが検出されて
いるので、主走査方向アドレスa28とa29の画素列
を副走査方向アドレスb2から順にチエツクしてゆ
く。a29の画素列についてはb1からb24まで黒が続
いていて、縦線を形成する長さ10以上の画素列と
いう条件を満足している。またa28の画素列はb1
からb15まで黒が続いていて長さ10以上の画素列
という条件を満足している。b15の点でa28の画素
列の黒が途切れたため、a29の画素列に対してa28
と反対側のa30の画素列をチエツクすると、b13
らb24まで黒が続いており長さ10以上の画素列と
いう条件を満足し、これによつて、b1からb24
での間で太さ2〜3の範囲にあるという条件及び
縦線の副走査方向の長さの下限20以上という条件
を満たすことが判明したわけで、この第1縦線候
補を縦線であると判断し、この縦線の始点アドレ
スa28,b1と終点アドレスa30,b24を第3記憶部8
に記憶させる。この処理中に第2記憶部5が使用
され、縦線と判断した時点でこの縦線を形成する
画素列3つの始点及び終点、a28とb1,b15,a29
b1,b24,a30とb13,b24のみを残こす。
The line extraction unit 4 sequentially traces the continuity of the vertical line candidate or horizontal line candidate detected by the black run detection unit 3 to the periphery of the black run for the lines before and after the line where the black run was detected. , it is determined whether or not the lines are within the limits regarding the vertical lines and horizontal lines described above, and lines that are within the limits are extracted as vertical lines or horizontal lines. In the case of the document example shown in FIG. 2, the black run detection unit 3 detects the runs a 28 to a 29 on line b 1 as the first vertical line candidate, so the main scanning direction address a 28 The pixel columns of and a29 are checked in order from the sub-scanning direction address b2 . Regarding pixel column a 29 , black continues from b 1 to b 24 , satisfying the condition of a pixel column having a length of 10 or more and forming a vertical line. Also, the pixel column of a 28 is b 1
The black continues from b to b15 , satisfying the condition of a pixel row of length 10 or more. Since the black of the pixel column a 28 is interrupted at the point b 15 , the pixel column a 28 is
When checking the pixel row of a 30 on the opposite side, black continues from b 13 to b 24 and satisfies the condition of a pixel row of length 10 or more. It turns out that the conditions that the thickness is in the range of 2 to 3 and the minimum length of the vertical line in the sub-scanning direction are 20 or more are met, so this first vertical line candidate is determined to be a vertical line. The starting point address a 28 , b 1 and the ending point address a 30 , b 24 of this vertical line are stored in the third storage unit 8.
to be memorized. During this process, the second storage unit 5 is used, and when it is determined that it is a vertical line, it stores the starting and ending points of the three pixel columns forming this vertical line, a 28 , b 1 , b 15 , a 29 and
Only b 1 , b 24 , a 30 and b 13 , b 24 are left.

記憶修正部6においては、第3記憶部8に記憶
された縦線の要素画素列に関する情報を第2記憶
部5から読み出し、これに対応する第1記憶部2
内の画信号を消去する。この後、いま消去した縦
線の要素画素列の原稿上の左右に隣接する部分に
当たるアドレスの画信号をチエツクし、残された
画像と交わつていたとみなされる場合はその交わ
つていたとみなされる部分の画信号を黒信号とす
る。第2図の原稿例の場合では、縦線の左右に隣
接する部分は、b1からb12の間ではa27とa30、b13
からb15の間ではa27とa31、b16からb24の間ではa28
とa31の画素列である。この部分に、縦線の左側
に黒があれば、その画素行に前後の画素行を含め
て3つの画素行上の縦線の右側の部分に黒がある
かどうかをチエツクし、このような黒の対があれ
ば、その黒の対にはさまれる縦線のあつた部分を
黒信号に修正する。第2図の原稿例で言えば、b1
とb12の間でa27の画素列を見ていくとb8の画素行
の部分に黒信号が検出されるので、この画素行b8
と前後の画素行b7及びb9の画素行上の縦線の反対
側に当たるa30の画素列との交点a30,b7、a30
b8、a30,b9をチエツクするとa30,b8が黒である
ことがわかる。この黒信号の対a27,b8とa30,b8
ではさまれるa28,b8、a29,b8の点を黒信号に修
正する。これにより、一旦縦線に相当する部分と
して消去された、縦線と残された画像との交点に
あたる部分の黒信号が、復活したことになる。以
上がb1ライン上の黒ランa28〜a29で始まる縦線の
処理であるが、この処理が終わつた後、再び黒ラ
ン検出部3での処理にもどる。
In the memory correction unit 6, information regarding the element pixel column of the vertical line stored in the third memory unit 8 is read from the second memory unit 5, and the information related to the element pixel column of the vertical line stored in the third memory unit 8 is read out from the second memory unit 5, and
Erase the image signal within. After this, the image signal of the address corresponding to the left and right adjacent parts on the document of the element pixel row of the vertical line that has just been erased is checked, and if it is deemed to have intersected with the remaining image, it is deemed that it has intersected. The image signal of the part is set as the black signal. In the case of the manuscript example in Figure 2, the parts adjacent to the left and right of the vertical line are a 27 and a 30 between b 1 and b 12 , and b 13
a 27 and a 31 between b 15 and a 28 between b 16 and b 24
and a 31 pixel row. If there is black on the left side of the vertical line in this part, check whether there is black on the right side of the vertical line on three pixel rows including the previous and next pixel rows. If there is a black pair, the part with the vertical line between the black pairs is corrected to a black signal. In the manuscript example in Figure 2, b 1
Looking at the pixel column a27 between and b12 , a black signal is detected in the pixel row b8 , so this pixel row b8
The intersection point a 30 , b 7 , a 30 ,
Checking b 8 , a 30 , and b 9 reveals that a 30 and b 8 are black. This black signal pair a 27 , b 8 and a 30 , b 8
The points a 28 , b 8 , a 29 , and b 8 sandwiched between are corrected to black signals. As a result, the black signal in the portion corresponding to the intersection of the vertical line and the remaining image, which was once erased as a portion corresponding to the vertical line, is restored. The above is the processing of the vertical line starting from the black runs a28 to a29 on the b1 line, and after this processing is completed, the processing returns to the black run detecting section 3 again.

黒ラン処理部3では次に、縦線の太さに相当す
る長さ2〜3の範囲の黒ランとして、b5ライン上
においてa21からa22の間の長さ2の黒ランを検出
し、これを第2縦線候補として縦抽出部4に引継
ぐ。
Next, the black run processing unit 3 detects a black run with a length of 2 between a 21 and a 22 on the b 5 line as a black run with a length of 2 to 3 corresponding to the thickness of the vertical line. Then, this is passed on to the vertical extraction unit 4 as a second vertical line candidate.

線抽出部4では、この黒ランの主走査方向アド
レスa21とa22の画素列を追跡してゆくが、a21の画
素列はb5で始まつてb10で終わる長さ4、a22の画
素列はb5で始まつてb11で終わる長さ5の画素列
であることが検出され、いずれも長さ10以上の画
素列という縦線の要素画素列とはならない。a21
の左側に現われるa20,a19,a18、右側に現れる
a23,a24,a25,a26の画素列についても同様であ
る。
The line extraction unit 4 traces the pixel rows of the main scanning direction addresses a 21 and a 22 of this black run, but the pixel row of a 21 starts at b 5 and ends at b 10 , and has a length of 4, a It is detected that the 22 pixel columns are pixel columns of length 5 starting at b 5 and ending at b 11 , and none of them are element pixel columns of the vertical line, which are pixel columns of length 10 or more. a 21
a 20 , a 19 , a 18 that appear on the left side of , a 19 , a 18 that appears on the right side of
The same applies to the pixel columns a 23 , a 24 , a 25 , and a 26 .

次に横線の抽出について説明する。 Next, extraction of horizontal lines will be explained.

黒ラン検出部3ではラインb8において、a18
始まりa31で終わる長さ14の黒画素行を検出し横
線の要素となる長さ10以上の画素行の条件をみた
すのでこれを第1横線候補として線抽出部4に引
継ぐ。
The black run detecting unit 3 detects a black pixel row of length 14 starting from a 18 and ending at a 31 in line b 8 , which satisfies the condition of a pixel row having a length of 10 or more and being an element of a horizontal line, so this is detected as the first black pixel row. The line extraction unit 4 takes over the line as a horizontal line candidate.

線抽出部4では第1横線候補の存在するb8ライ
ンの前後のライン上に、同じく長さ10以上の黒ラ
インが有るかどうかをチエツクするが、b7ライン
上にもb9ライン上にも長さ10以上の黒ランがない
ので、この第1横線候補は横線の部分ではないと
判断する。
The line extraction unit 4 checks whether there is a black line with a length of 10 or more on the lines before and after the b8 line where the first horizontal line candidate exists, but there are black lines on the b7 line as well as on the b9 line. Since there is no black run with a length of 10 or more, it is determined that this first horizontal line candidate is not a horizontal line part.

次に黒ラン検出部3において、ラインb31上に
a12で始まりa28で終わる長さ17の黒ランを検出
し、第2横線候補として線抽出部4に引継く。
Next, in the black run detection section 3, on line b 31
A black run of length 17 starting at a 12 and ending at a 28 is detected and handed over to the line extraction unit 4 as a second horizontal line candidate.

線抽出部4では、この第2横線候補の有つたラ
インb31の前後のラインb30及びb32上の長さ10以上
の黒ランの有無をチエツクする。ラインb32上に
a1で始まりa28で終わる長さ28の黒ランを検出
し、さらに次のラインb33上にa1で始まりa13で終
わる黒ランを検出する。以上から、ラインb31
b32及びb33上の各画素行がいずれも10以上の長さ
を有し、主走査方向のアドレスa1からa28の間で
太さ2〜3を満足し、しかも全体の長さ28が横線
の長さの下限20以上であることから、これを横線
と判定し、その始点a1,b33、終点a28,b31を第3
記憶部8に記憶させる。また、縦線の処理の場合
と同様に、第2記憶部5には、第2横線候補を横
線と判定した後、これを形成する3つの画素行の
始点及び終点、b31とa12、a28,b32とa1,a28,b33
とa1,a13を残す。
The line extractor 4 checks whether there are black runs with a length of 10 or more on the lines b 30 and b 32 before and after the line b 31 containing the second horizontal line candidate. on line b 32
A black run of length 28 starting with a 1 and ending with a 28 is detected, and a black run of length 28 starting with a 1 and ending with a 13 is detected on the next line b 33 . From the above, line b 31 ,
Each pixel row on b 32 and b 33 has a length of 10 or more, satisfies the thickness 2 to 3 between addresses a 1 to a 28 in the main scanning direction, and has an overall length of 28 is greater than or equal to the lower limit of the length of the horizontal line, 20, so this is determined to be a horizontal line, and its starting points a 1 , b 33 and ending points a 28 , b 31 are
The information is stored in the storage unit 8. In addition, as in the case of vertical line processing, after determining the second horizontal line candidate as a horizontal line, the second storage unit 5 stores the starting point and ending point of the three pixel rows forming the second horizontal line candidate, b 31 and a 12 , a 28 , b 32 and a 1 , a 28 , b 33
and leave a 1 and a 13 .

記憶修正部6においては、抽出された横線の要
素画素行に関する情報を第2記憶部から読み出
し、これに対応する第1記憶部2内の画信号を消
去する。その後、縦線の場合と同様に、いま消去
した横線の上下に隣接する部分の画信号をチエツ
クする。第2図の場合で言えば、主走査方向アド
レスa1からa11の範囲ではb31とb34の画素行、a12
らa13の範囲ではb30とb34の画素行、a14からa28
範囲ではb30とb33の画素行である。まずa16,b30
の点が黒であるので、横線に関して反対側に隣接
し主走査方向アドレスa16とその前後のa15及びa17
の点をチエツクするが、黒信号はない。次に
a17,b30の点が黒であるので、同様にa16,b33
a17,b33、a18,b33の3画素をチエツクすると、
a18,b33の画素が黒であることがわかるので、こ
れらa17,b30とa18,b33の画素にはさまれる4画
素a17,b31、a18,b31、a17,b32、a18,b32を黒信
号に修正する。これにより、一旦横線に相当する
部分として消去された、横線と残された画像との
交点にあたる部分の黒信号が復活したことにな
る。
The memory correction unit 6 reads information regarding the extracted element pixel row of the horizontal line from the second storage unit, and erases the corresponding image signal in the first storage unit 2. Thereafter, as in the case of vertical lines, the image signals of the portions adjacent above and below the horizontal line just erased are checked. In the case of Fig. 2, in the main scanning direction address range from a 1 to a 11 , the pixel rows are b 31 and b 34 , in the range from a 12 to a 13 , the pixel rows are b 30 and b 34 , and from a 14 to pixel rows In the range of a 28 , there are pixel rows of b 30 and b 33 . First a 16 , b 30
Since the dot is black, the adjacent main scanning direction address A 16 on the opposite side with respect to the horizontal line and A 15 and A 17 before and after it are
Check the points, but there is no black signal. next
Since the points a 17 , b 30 are black, similarly a 16 , b 33 ,
When you check the three pixels a 17 , b 33 , a 18 , b 33 ,
Since we know that the pixels a 18 and b 33 are black, the four pixels sandwiched between these pixels a 17 , b 30 and a 18 , b 33 are a 17 , b 31 , a 18 , b 31 , a 17 , b 32 , a 18 , b 32 are corrected to black signals. As a result, the black signal in the portion corresponding to the intersection of the horizontal line and the remaining image, which was once erased as a portion corresponding to the horizontal line, is restored.

このように原稿上の縦線及び横線が抽出されて
そのアドレス情報が第2記憶部5に記憶され、そ
れら縦線及び横線に相当する画信号が第1記憶部
2から消去され、しかも縦線及び横線が他の画像
と交わつていたとみなされる部分があれば、その
部分の画信号を補充された後の第1記憶部2内の
画信号を、文字抽出部7が続み出して文字を抽出
し、その情報を第3記憶部8に記憶させる。
In this way, the vertical lines and horizontal lines on the document are extracted and their address information is stored in the second storage unit 5, the image signals corresponding to these vertical lines and horizontal lines are deleted from the first storage unit 2, and the vertical lines If there is a part where the horizontal line is considered to intersect with another image, the character extracting part 7 continues to extract the image signal in the first storage part 2 after being supplemented with the image signal of that part and converts it into a character. is extracted and the information is stored in the third storage unit 8.

本発明による画像抽出方式によれば、上記実施
例によつて示した通り、原稿上の線図形と文字と
が交わる部分がある場合においても、縦線及び横
線の太さ及び長さに関する制限を設定することに
より、この制限を利用して縦線及び横線と文字と
を個別に抽出することができる。なおこの制限
は、扱う原稿上の画像の性質と走査部の性能とか
ら適当なところに設定することが可能で、実際の
画像の抽出処理に極めて有効な方式を提供するも
のである。
According to the image extraction method according to the present invention, as shown in the above embodiment, even when there is a portion where a line figure and a character intersect on a document, restrictions regarding the thickness and length of vertical lines and horizontal lines can be applied. By setting, vertical lines, horizontal lines, and characters can be extracted individually using this restriction. Note that this limit can be set appropriately depending on the nature of the image on the document to be handled and the performance of the scanning unit, and provides an extremely effective method for actual image extraction processing.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、本発明による画像抽出方式を実現す
るための一実施例を示すブロツク図、第2図は、
処理の一例の説明に用いる原稿上の画情報の例を
示す図である。 1…走査部、2…第1記憶部、3…黒ラン検出
部、4…線抽出部、5…第2記憶部、6…記憶修
正部、7…文字抽出部、8…第3記憶部。
FIG. 1 is a block diagram showing an embodiment of the image extraction method according to the present invention, and FIG.
FIG. 6 is a diagram illustrating an example of image information on a document used to explain an example of processing. 1... Scanning section, 2... First storage section, 3... Black run detection section, 4... Line extraction section, 5... Second storage section, 6... Memory correction section, 7... Character extraction section, 8... Third storage section .

Claims (1)

【特許請求の範囲】[Claims] 1 線図形と文字とが描かれた原稿の画情報を画
素単位で2値のデイジタル信号として記憶し、前
記線図形の太さと長さに関する条件を設けて該条
件を満たす画像を線図形として抽出し、該線図形
の画情報に相当する2値信号を前記記憶から消去
すると共に、該線図形とその他の画像とが交わつ
ていた部分の画情報に相当する2値信号を前記記
憶に追加した後前記記憶された画情報から文字を
抽出することを特徴とする画像抽出方式。
1. Image information of a document on which line figures and characters are drawn is stored as a binary digital signal in pixel units, conditions are set regarding the thickness and length of the line figure, and images that satisfy the conditions are extracted as line figures. Then, a binary signal corresponding to image information of the line figure is deleted from the memory, and a binary signal corresponding to image information of a portion where the line figure and another image intersect is added to the memory. An image extraction method characterized by extracting characters from the stored image information after doing so.
JP6841679A 1979-05-31 1979-05-31 Picture extraction system Granted JPS55162176A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6841679A JPS55162176A (en) 1979-05-31 1979-05-31 Picture extraction system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6841679A JPS55162176A (en) 1979-05-31 1979-05-31 Picture extraction system

Publications (2)

Publication Number Publication Date
JPS55162176A JPS55162176A (en) 1980-12-17
JPS627590B2 true JPS627590B2 (en) 1987-02-18

Family

ID=13373048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6841679A Granted JPS55162176A (en) 1979-05-31 1979-05-31 Picture extraction system

Country Status (1)

Country Link
JP (1) JPS55162176A (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57211673A (en) * 1981-06-23 1982-12-25 Ricoh Co Ltd Character cutting method
JPS5884373A (en) * 1981-11-13 1983-05-20 Ricoh Co Ltd Extracting method of long segment
JPS60126777A (en) * 1983-12-14 1985-07-06 Hitachi Ltd Character extracting system
JPH0650527B2 (en) * 1983-12-26 1994-06-29 株式会社日立製作所 Real-time handwriting trajectory recognition method
JPS61255483A (en) * 1985-05-08 1986-11-13 Fujitsu Ltd Character recognition device
JP2558668B2 (en) * 1986-12-20 1996-11-27 株式会社リコー Character pattern extraction method
JPH02189696A (en) * 1989-01-18 1990-07-25 Nec Corp Optical character reader

Also Published As

Publication number Publication date
JPS55162176A (en) 1980-12-17

Similar Documents

Publication Publication Date Title
US5590224A (en) OCR image preprocessing method for image enhancement of scanned documents by correction of registration
US5517587A (en) Positioning method and apparatus for line scanned images
JPS63158678A (en) Inter-word space detecting method
EP0334472A3 (en) Methods of detecting character strings
GB1338867A (en) System for analysing engineering drawings or like documents
JPS627590B2 (en)
CA1316605C (en) Method of searching binary images to find search regions in which straight lines may be found
JP2971344B2 (en) Image size reduction method
US6141444A (en) Method for deleting ruled lines and a recording medium storing programs for performing the method
JPH08317193A (en) Method and device for detecting and correcting lateral and longitudinal line of digitized image
US4408343A (en) Image enhancement for optical character readers
US6330357B1 (en) Extracting user data from a scanned image of a pre-printed form
JP3073837B2 (en) Image region separation device and image region separation method
JPS6033333B2 (en) Original reading device
JPH02210586A (en) Table area separator
JPH07230525A (en) Method for recognizing ruled line and method for processing table
JPS58106665A (en) Character line cutout method
JP3191265B2 (en) Image input device and image input control method thereof
JP2908495B2 (en) Character image extraction device
JPWO2004084539A1 (en) Entry document creation device and creation method, entry content extraction device and extraction method, entry document
JPS6343788B2 (en)
JPS6336189B2 (en)
JPH0442714B2 (en)
JPH0685557B2 (en) Image processing method
JPS6331825B2 (en)