JPH05266250A - Character string detector - Google Patents

Character string detector

Info

Publication number
JPH05266250A
JPH05266250A JP4065087A JP6508792A JPH05266250A JP H05266250 A JPH05266250 A JP H05266250A JP 4065087 A JP4065087 A JP 4065087A JP 6508792 A JP6508792 A JP 6508792A JP H05266250 A JPH05266250 A JP H05266250A
Authority
JP
Japan
Prior art keywords
character string
pixel
arbitrary position
pixels
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4065087A
Other languages
Japanese (ja)
Inventor
Masami Oguro
雅己 小黒
Osamu Nakamura
修 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4065087A priority Critical patent/JPH05266250A/en
Publication of JPH05266250A publication Critical patent/JPH05266250A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide a character string detector capable of detecting required character strings at a high speed without performing excess recognition processing such as deleting objects not to be recognized. CONSTITUTION:This detector is provided with as pixel selection means 1 selecting either of white and black picture elements among a binary pictures, means 2 scanning image data in a transverse direction and determining the number of picture elements in the vertical direction of the picture element selected by the means 1, means 3 scanning the image data in a longitudinal direction and determining the number of picture elements in the horizontal direction of the picture element selected by the means 1, coordinate detecting means 4 detecting the four coordinate points where the difference of the picture element number becomes maximal, a verifying means 5 comparing the coordinate value with the threshold value and verifying whether it is the size of the character string to be processed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は文字列検出装置に係り、
特に、文書中の文字列を読み取り、特定の文字列のみを
認識するために、文書中から文字列を探し出して、認識
する場合の文字列検出を行う文字列検出装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character string detecting device,
In particular, the present invention relates to a character string detection device that searches a character string in a document and detects the character string when the character string is read in the document to recognize only a specific character string.

【0002】[0002]

【従来の技術】従来の文字列検出装置は、2値画像デー
タから特定の文字列を検出するには、文字列の先頭等に
特定のマークを付与し、そのマークを認識して検出する
ことにより、文字列を検出する方法(以下、マーク検出
方式)がある。
2. Description of the Related Art In order to detect a specific character string from binary image data, a conventional character string detecting device must add a specific mark to the beginning of the character string and recognize and detect the mark. , There is a method of detecting a character string (hereinafter, a mark detection method).

【0003】また、画像内の文字列の意味する情報を元
に、文字列を分類し、文字認識により、文字列を認識、
理解し、処理対象文字列を抽出する方法(以下、文字列
理解方式と呼ぶ)がある。これは、例えば、対象文字列
のみが数字で構成されている場合、画像内のすべての文
字を認識して、数字と認識された文字列を抽出する方法
である。
Further, the character strings are classified based on the information that the character strings in the image mean, and the character strings are recognized by character recognition.
There is a method of understanding and extracting a processing target character string (hereinafter referred to as a character string understanding method). This is a method of recognizing all the characters in an image and extracting a character string recognized as a number when only the target character string is composed of numbers, for example.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、従来の
技術では、マーク検出方式、文字列理解方式のいずれの
場合においても、2値画像から特定の文字列を検出する
ために、画像内から文字を1文字単位に切り出すことに
より、文字矩形を抽出し、全ての文字矩形に対して文字
認識を行う必要がある。このため、本来文字認識を行う
必要のない文字に対しても文字の切り出し、及び、認識
処理を行うため、冗長な処理量が存在し、処理時間が増
大するという問題がある。
However, in the conventional techniques, in order to detect a specific character string from a binary image, a character is detected from the image in both the mark detection method and the character string understanding method. It is necessary to extract a character rectangle by cutting out in units of one character and perform character recognition for all character rectangles. For this reason, since character cutting and recognition processing are performed even for characters that originally do not need to be recognized, there is a problem that a redundant processing amount exists and processing time increases.

【0005】一方、画像内に罫線、飾り等が存在する場
合、これらは認識する必要がないため、罫線等を除去す
る処理が必要となり、処理時間増加の要因となる。
On the other hand, if there are ruled lines, decorations, etc. in the image, it is not necessary to recognize them, so a process for removing the ruled lines, etc. is required, which causes an increase in processing time.

【0006】本発明は上記の点に鑑みなされたもので、
余分な認識処理を行わず、認識する対象外のものを消去
する作業を行わずに高速に必要な文字列を検出すること
が可能な文字列検出装置を提供することを目的とする。
The present invention has been made in view of the above points,
An object of the present invention is to provide a character string detection device capable of detecting a necessary character string at high speed without performing an extra recognition process and erasing an unrecognized object.

【0007】[0007]

【課題を解決するための手段】本発明は、イメージ入力
装置で入力された予め処理対象とすべき文字列と、処理
対象外の文字列を区別して表現される2値画像のイメー
ジデータから処理対象の文字列を検出する文字列検出装
置において、2値画像のうち、画素または、黒画素のう
ちいずれかの画素を選択する画素選択手段と、イメージ
データを横方向に走査し、画素選択手段で選択された画
素の垂直方向の画素数を求める手段と、イメージデータ
を縦方向に走査し、画素選択手段で選択された画素の水
平方向の画素数を求める手段と、矩形を構成する任意の
位置の画素数の差が最大となる座標位置を4点検出する
座標検出手段と、座標検出手段によって得られた矩形の
座標値と所定の閾値と対比することにより処理対象とす
る文字列の大きさであるかを検定する検定手段とを有す
る。
According to the present invention, processing is performed from image data of a binary image which is expressed by distinguishing a character string to be processed in advance inputted from an image input device and a character string not to be processed. In a character string detecting device for detecting a target character string, a pixel selecting means for selecting one of a pixel and a black pixel in a binary image, and a pixel selecting means for horizontally scanning image data. Means for obtaining the number of pixels in the vertical direction of the pixels selected by, and means for scanning the image data in the vertical direction to obtain the number of pixels in the horizontal direction of the pixels selected by the pixel selection means; The size of the character string to be processed by comparing the coordinate value of the rectangle obtained by the coordinate detecting unit with the predetermined threshold value, and the coordinate detecting unit that detects four coordinate positions where the difference in the number of position pixels is maximum. It And a test means to test whether or not there.

【0008】また、本発明は、画素選択手段で黒画素が
選択された場合に、座標検出手段は、第1の任意の位置
での垂直方向の黒画素数と第1の任意の位置の直左の垂
直方向の黒画素数の差分が最大となる第1の任意の位置
と、第2の任意の位置での垂直方向の黒画素数と第2の
任意の位置の直右の垂直方向の黒画素数との差分が最大
となる第2の任意の位置と、第3の任意の位置での水平
方向の黒画素数と第3の任意の位置の直上の水平方向の
黒画素数との差分が最大となる第3の任意の位置と、第
4の任意の位置での水平方向の黒画素数と第4の任意の
位置の直下の水平方向の黒画素との差分が最大となる第
4の任意の位置の各位置から矩形の各座標を求める。
Further, according to the present invention, when the black pixel is selected by the pixel selecting means, the coordinate detecting means determines the number of black pixels in the vertical direction at the first arbitrary position and the direct number of the first arbitrary position. The number of black pixels in the vertical direction at the first arbitrary position and the second arbitrary position where the difference in the number of black pixels in the left vertical direction is the maximum, and the number of black pixels in the vertical direction immediately to the right of the second arbitrary position The second arbitrary position having the maximum difference from the black pixel number, the horizontal black pixel number at the third arbitrary position, and the horizontal black pixel number immediately above the third arbitrary position. The third arbitrary position where the difference is maximum and the horizontal black pixel number at the fourth arbitrary position and the horizontal black pixel immediately below the fourth arbitrary position where the difference is maximum. The respective coordinates of the rectangle are obtained from the respective arbitrary positions of 4.

【0009】[0009]

【作用】本発明は、処理対象とすべき文字列、または、
非処理対象の文字列を予め白抜き文字で印刷し、これを
スキャナ等で入力した画像イメージデータに対して、横
方向及び縦方向に走査し、それぞれ垂直方向の黒画素数
または、白画素数のいずれか一方の画素数と、水平方向
の黒画素数または、白画素数のいずれか一方の画素数を
求め、任意の4位置で囲まれる矩形領域を処理対象領域
として検出することにより、その処理対象領域について
のみ、文字の切り出しや、文字認識を行う。これによ
り、処理対象領域以外の部分の文字の切り出しや、文字
認識を行う必要がないため、処理時間を浪費することが
ない。
According to the present invention, a character string to be processed, or
The unprocessed character string is printed in white characters in advance, and this is scanned in the horizontal and vertical directions with respect to the image image data input by a scanner, etc., and the number of black pixels or the number of white pixels in the vertical direction, respectively. The number of pixels of one of the two and the number of pixels of the black pixels or the number of white pixels in the horizontal direction are obtained, and a rectangular area surrounded by arbitrary four positions is detected as a processing target area. Character cutting and character recognition are performed only for the processing target area. As a result, it is not necessary to cut out characters in a portion other than the processing target area or perform character recognition, so that processing time is not wasted.

【0010】[0010]

【実施例】以下図面を用いて本発明の実施例を説明す
る。本実施例では処理対象となる文字列は白抜きされて
いるものとする。
Embodiments of the present invention will be described below with reference to the drawings. In this embodiment, it is assumed that the character string to be processed is outlined.

【0011】図1は本発明の一実施例のシステム構成を
示すブロック図である。本発明の文字列検出装置は、白
画素及び黒画素のいずれかを選択し、処理対象とする画
素選択部1(本実施例では黒画素を選択)と、画像イメ
ージデータを水平方向に走査する水平方向ヒストグラム
生成部2、画像イメージデータを垂直方向に走査する垂
直方向ヒストグラム生成部3と、任意の一での垂直方向
及び水平方向の黒画素数の最大差分を検出する最大差分
検出部4と、最大差分検出部4で得られた矩形により、
処理対象とする矩形を検出する領域検定部5より構成さ
れる。
FIG. 1 is a block diagram showing the system configuration of an embodiment of the present invention. The character string detection device of the present invention selects either a white pixel or a black pixel, and scans the image selection data 1 (the black pixel is selected in the present embodiment) and the image image data in the horizontal direction. A horizontal direction histogram generation unit 2, a vertical direction histogram generation unit 3 that scans image image data in the vertical direction, and a maximum difference detection unit 4 that detects a maximum difference in the number of black pixels in the vertical direction and the horizontal direction in any one. , By the rectangle obtained by the maximum difference detection unit 4,
It is composed of an area inspection unit 5 which detects a rectangle to be processed.

【0012】図2は本発明の一実施例の動作を説明する
ための図である。図1と共に本発明の文字列検出装置の
動作について説明する。
FIG. 2 is a diagram for explaining the operation of one embodiment of the present invention. The operation of the character string detection device of the present invention will be described with reference to FIG.

【0013】 先ず、文字列検出装置に動作する以前
に、入力される画像イメージデータは、処理対象とすべ
き文字列を予め白抜き文字で印刷し、これをスキャナ等
で入力する場合に、画素選択部1において、黒画素を選
択し処理対象とする。
First, before the operation of the character string detection device, the input image image data is such that the character string to be processed is printed in white characters in advance, and when the character string is input by a scanner or the like, the pixel The selection unit 1 selects a black pixel to be a processing target.

【0014】 水平方向ヒストグラム生成部2は、ス
キャナ等のイメージ入力装置で入力された2値データを
水平方向(図2(X)方向)に走査する。この走査に伴
って、各ライン毎に、そのラインに存在する黒画素数を
垂直方向にカウントする。図2のaで示されるのは、カ
ウントしたX方向ヒストグラムである。
The horizontal histogram generation unit 2 scans the binary data input by an image input device such as a scanner in the horizontal direction (direction (X) in FIG. 2). Along with this scanning, the number of black pixels existing in each line is counted in the vertical direction. Shown in FIG. 2a is the counted X-direction histogram.

【0015】 次に、垂直方向ヒストグラム生成部3
は、垂直方向(図2(Y)方向)に走査し、各ライン毎
にそのラインに存在する黒画素数を水平方向にカウント
し、図2のbで示されるのは、カウントしたY方向ヒス
トグラムである。
Next, the vertical histogram generation unit 3
Scans in the vertical direction (Y direction in FIG. 2) and horizontally counts the number of black pixels existing in that line for each line, and FIG. 2B shows the counted Y direction histogram. Is.

【0016】 最大差分検出部4は、X方向ヒストグ
ラムaで任意の隣合う位置i,j(但し、iは左側)の
黒画素数をXblock(i),Xblock(j)と
した時、 Xblock(j)− Xblock(i) が最大となる位置を左端座標X1(図2)に格納し、 Xblock(i)− Xblock(j) が最大となる位置を右端座標X2(図2)に格納する。
When the number of black pixels at any adjacent position i, j (where i is the left side) in the X-direction histogram a is Xblock (i), Xblock (j), the maximum difference detection unit 4 defines Xblock ( The position where j) −Xblock (i) is maximum is stored in the left end coordinate X1 (FIG. 2), and the position where Xblock (i) −Xblock (j) is maximum is stored in the right end coordinate X2 (FIG. 2).

【0017】図2のcに示すX方向ヒストグラムの差分
のグラフ中、eは、Xblock(j)− Xbloc
k(i)が最大となる位置であり、fは、Xblock
(i)− Xblock(j)が最大となる位置であ
る。
In the difference graph of the X-direction histogram shown in FIG. 2C, e is Xblock (j) -Xblock.
k (i) is the maximum position, and f is Xblock
(I) − This is the position where Xblock (j) is maximum.

【0018】 と同様に、最大差分検出部4はY方
向ヒストグラムbにおいても、任意の上下に隣合う位置
m,n(但し、mは上)の黒画素数をYblock
(m),Yblock(n)とした時、 Yblock(n)− Yblock(m) が最大となる位置を上端座標Y1(図2)に格納し、 Yblock(m)− Yblock(n) が最大となる位置を下端座標Y2(図2)に格納する。
Similarly to the above, the maximum difference detection unit 4 also determines the number of black pixels at arbitrary vertically adjacent positions m and n (where m is the upper side) in the Y-direction histogram b as Yblock.
(M), Yblock (n), the position where Yblock (n) −Yblock (m) is the maximum is stored in the upper end coordinate Y1 (FIG. 2), and Yblock (m) −Yblock (n) is the maximum. Is stored in the bottom coordinate Y2 (FIG. 2).

【0019】図2のdに示すY方向ヒストグラムの差分
のグラフ中、gのところがYblock(n)− Yb
lock(m)が最大となる位置であり、hのところが
Yblock(m)− Yblock(n)が最大とな
る位置である。
In the graph of the difference in the Y-direction histogram shown in FIG. 2d, g is Yblock (n) -Yb.
lock (m) is the maximum position, and h is the maximum Yblock (m) −Yblock (n) position.

【0020】 これにより、左上座標(X1,Y1)
と右下座標(X2,Y2)で囲まれる長方形領域pを求
めることができる。
As a result, the upper left coordinate (X1, Y1)
Then, a rectangular region p surrounded by the lower right coordinates (X2, Y2) can be obtained.

【0021】 次に、領域検定部5は、長方形領域p
の横(X2−X1)と、縦(Y1−Y2)の大きさを求
め、文字領域として妥当な横サイズ及び縦サイズの所定
の閾値(Sx,Sy)と比較し、 (X2−X1)>Sx (Y1−Y2)>Sy で、閾値より横・縦サイズの方が大きければ、処理対象
とすべき文字列と判定し、検出処理を終了する。
Next, the area inspection unit 5 determines the rectangular area p.
The horizontal (X2-X1) and vertical (Y1-Y2) sizes are calculated and compared with predetermined thresholds (Sx, Sy) of the horizontal size and vertical size that are appropriate for the character area, and (X2-X1)> If Sx (Y1−Y2)> Sy and the horizontal / vertical size is larger than the threshold value, it is determined that the character string is to be processed, and the detection process ends.

【0022】一方、横・縦サイズが (X2−X1)<Sx (Y1−Y2)<Sy であれば、最大差分検出部4の処理に戻り、最初に求め
た領域を除いて、新たに最大差分により長方形領域を求
め直す。
On the other hand, if the horizontal / vertical size is (X2-X1) <Sx (Y1-Y2) <Sy, the process returns to the process of the maximum difference detection unit 4, and the newly obtained maximum is removed except for the region obtained first. The rectangular area is recalculated by the difference.

【0023】図3は本発明の一実施例の長方形領域を求
め直す場合を示し、また、罫線が存在している場合を示
す。
FIG. 3 shows a case of re-obtaining a rectangular area according to an embodiment of the present invention, and shows a case where ruled lines are present.

【0024】1回目の処理は、処理対象範囲zに罫線r
が含まれているため、Y方向ヒストグラムの最大差分か
ら左上座標(Xa,Ya)右下座標(Xb,Yb)で囲
まれる長方形領域tは、領域検定部5により文字領域と
して妥当な横サイズ及び縦サイズの所定の閾値(Sx,
Sy)と比較されると、ことに、横サイズXb−Xaは
文字サイズより大きいため、閾値以上となるが、縦サイ
ズYb−Yaは、文字サイズより小さくなる。このた
め、領域検定部5は上端、下端の座標が誤っていると判
断する。これにより、Ya〜Ybを除いて、最大差分と
なる位置を探し、上端座標Yc、下端座標Ydを得る。
これにより、左上座標(Xa,Yc)、右下座標(X
b,Yd)となり、長方形領域pが求められる。この長
方形領域pは縦・横サイズは (Xb−Xa)>Sx (Yc−Yd)>Sy で、閾値より横・縦サイズの方が大きければ、処理対象
とすべき文字列と判定し、検出処理を終了する。
In the first processing, the ruled line r is set in the processing target range z.
Therefore, the rectangular area t surrounded by the upper-left coordinates (Xa, Ya) and the lower-right coordinates (Xb, Yb) from the maximum difference of the Y-direction histogram is determined by the area test unit 5 to have an appropriate lateral size as a character area. Vertical size threshold (Sx,
When compared with Sy), in particular, the horizontal size Xb-Xa is larger than the character size, and therefore the threshold size or more, but the vertical size Yb-Ya is smaller than the character size. Therefore, the area inspection unit 5 determines that the coordinates of the upper end and the lower end are incorrect. As a result, the position having the maximum difference is searched for excluding Ya to Yb, and the upper end coordinate Yc and the lower end coordinate Yd are obtained.
As a result, the upper left coordinates (Xa, Yc) and the lower right coordinates (X
b, Yd), and the rectangular area p is obtained. This rectangular area p has a vertical / horizontal size of (Xb-Xa)> Sx (Yc-Yd)> Sy, and if the horizontal / vertical size is larger than the threshold value, it is determined as a character string to be processed and detected. The process ends.

【0025】これにより、処理対象領域となる長方形領
域pが認識処理等の対象となり、罫線rは、閾値より縦
サイズが小さいため、所定の文字サイズより小さいと判
断され処置対象とすべき文字列とは判定されない。
As a result, the rectangular area p to be processed becomes the target of recognition processing and the like, and the ruled line r has a vertical size smaller than the threshold value. Is not determined.

【0026】なお、本実施例では処理対象とすべき文字
列を白抜き文字で印刷することを前提条件としたが、本
発明はこの例に限定されることなく、反対に処置対象外
の文字列を白抜き文字としてもよい。この場合には、白
画素または黒画素の選択時に予め、白画素を選択するこ
とにより上記実施例の黒画素の代わりに白画素を用いて
処理することにより、上記実施例と同様の処理が可能で
あり、同様の効果が得られる。
Although the present embodiment is premised on that the character string to be processed is printed with blank characters, the present invention is not limited to this example, and conversely, characters not treated The columns may be outlined characters. In this case, when the white pixel or the black pixel is selected, the white pixel is selected in advance so that the white pixel is used instead of the black pixel of the above-described embodiment to perform the same processing as that of the above-described embodiment. Therefore, the same effect can be obtained.

【0027】従来の技術では特定の文字列を検出するた
めに文字認識を行う必要のない文字に対しても、文字の
切り出しや認識処理を行う必要があったが、上述のよう
に本発明の文字列検出装置によれば、処理対象とすべき
文字列を白抜きで印刷するだけで、黒画素ヒストグラム
での処理対象文字列の検出が可能となり、文字列検出の
ための時間が大幅に削減できる。
In the prior art, it was necessary to perform character segmentation and recognition processing even for a character that does not need to be recognized in order to detect a specific character string. According to the character string detection device, it is possible to detect the character string to be processed in the black pixel histogram by simply printing the character string to be processed in white, and the time for character string detection is greatly reduced. it can.

【0028】一方、画像内に、罫線、飾り等が存在する
場合には、文字サイズから決まる文字列領域サイズとの
比較を行うことにより、罫線除去を行うことがない。
On the other hand, when there are ruled lines, decorations, etc. in the image, the ruled lines are not removed by comparing with the character string area size determined by the character size.

【0029】[0029]

【発明の効果】上述のように、本発明によれば処理対象
外の文字の切り出し及び、認識処理を行う必要がなく、
処理時間が削減される。
As described above, according to the present invention, it is not necessary to cut out a character not to be processed and perform recognition processing,
Processing time is reduced.

【0030】また、罫線等の不要なものを除去する処理
が不要となり、イメージデータから所望の文字列を高速
に検出することができる。
Further, the process of removing unnecessary things such as ruled lines becomes unnecessary, and a desired character string can be detected at high speed from the image data.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例のシステム構成を示すブロッ
ク図である。
FIG. 1 is a block diagram showing a system configuration of an embodiment of the present invention.

【図2】本発明の一実施例の動作を説明するための図で
ある。
FIG. 2 is a diagram for explaining the operation of the embodiment of the present invention.

【図3】本発明の一実施例の長方形領域を求め直す場合
を示し、また、罫線が存在している場合を示す図であ
る。
FIG. 3 is a diagram showing a case of re-obtaining a rectangular area according to an embodiment of the present invention and a case where ruled lines exist.

【符号の説明】[Explanation of symbols]

1 画素選択部 2 水平方向ヒストグラム生成部 3 垂直方向ヒストグラム生成部 4 最大差分検出部 5 領域検定部 a カウントしたX方向ヒストグラム b カウントしたY方向ヒストグラム c X方向ヒストグラムの差分のグラフ d Y方向ヒストグラムの差分のグラフ e Xblock(j)− Xblock(i)が最大
となる位置 f Xblock(i)− Xblock(j)が最大
となる位置 i X方向ヒストグラムaで任意の隣合う位置 j X方向ヒストグラムaで任意の隣合う位置 m 任意の上下に隣合う位置 n 任意の上下に隣合う位置 p 長方形領域 r 罫線 t 長方形領域
1 Pixel selection unit 2 Horizontal direction histogram generation unit 3 Vertical direction histogram generation unit 4 Maximum difference detection unit 5 Area test unit a Counted X direction histogram b Counted Y direction histogram c Graph of X direction histogram difference d Y direction histogram Difference graph e Xblock (j) −Position where Xblock (i) is maximum f Xblock (i) −Position where Xblock (j) is maximum i Any adjacent position in the X direction histogram a j In the X direction histogram a Arbitrary adjacent positions m Arbitrary upper and lower adjacent positions n Arbitrary upper and lower adjacent positions p Rectangular area r Ruled line t Rectangular area

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 イメージ入力装置で入力された予め処理
対象とすべき文字列と、処理対象外の文字列を区別して
表現される2値画像のイメージデータから処理対象の文
字列を検出する文字列検出装置において、 2値画像のうち、白画素または、黒画素のうちいずれか
の画素を選択する画素選択手段と、 該イメージデータを横方向に走査し、該画素選択手段で
選択された画素の垂直方向の画素数を求める手段と、 該イメージデータを縦方向に走査し、該画素選択手段で
選択された画素の水平方向の画素数を求める手段と、 矩形を構成する任意の位置の該画素数の差が最大となる
座標位置を4点検出する座標検出手段と、 該座標検出手段によって得られた矩形の座標値と所定の
閾値と対比することにより処理対象とする文字列の大き
さであるかを検定する検定手段とを有することを特徴と
する文字列検出装置。
1. A character for detecting a character string to be processed from image data of a binary image which is expressed by distinguishing a character string to be processed in advance inputted from an image input device and a character string not to be processed. In a column detection device, a pixel selection means for selecting either a white pixel or a black pixel in a binary image, and a pixel selected by the pixel selection means by horizontally scanning the image data. Means for obtaining the number of pixels in the vertical direction, a means for scanning the image data in the vertical direction, and obtaining the number of pixels in the horizontal direction of the pixels selected by the pixel selecting means, Coordinate detecting means for detecting four coordinate positions where the difference in the number of pixels is maximum, and the size of the character string to be processed by comparing the rectangular coordinate values obtained by the coordinate detecting means with a predetermined threshold value. Is String detecting apparatus characterized by having a test means for test.
【請求項2】 前記画素選択手段で黒画素が選択された
場合に、前記座標検出手段は、第1の任意の位置での垂
直方向の黒画素数と該第1の任意の位置の直左の垂直方
向の黒画素数の差分が最大となる該第1の任意の位置
と、第2の任意の位置での垂直方向の黒画素数と該第2
の任意の位置の直右の垂直方向の黒画素数との差分が最
大となる該第2の任意の位置と、第3の任意の位置での
水平方向の黒画素数と該第3の任意の位置の直上の水平
方向の黒画素数との差分が最大となる該第3の任意の位
置と、第4の任意の位置での水平方向の黒画素数と該第
4の任意の位置の直下の水平方向の黒画素との差分が最
大となる該第4の任意の位置の各位置から矩形の各座標
を求めることを特徴とする請求項1記載の文字列検出装
置。
2. When a black pixel is selected by the pixel selecting means, the coordinate detecting means determines the number of black pixels in the vertical direction at a first arbitrary position and the left of the first arbitrary position. Of the number of black pixels in the vertical direction at the first arbitrary position and the second arbitrary position where the difference in the number of black pixels in the vertical direction becomes maximum,
At the second arbitrary position where the difference between the right arbitrary vertical position and the number of black pixels in the vertical direction becomes maximum, and at the third arbitrary position, the number of horizontal black pixels and the third arbitrary position. Of the number of black pixels in the horizontal direction immediately above the position, and the number of black pixels in the horizontal direction at the fourth arbitrary position and the fourth arbitrary position. 2. The character string detection device according to claim 1, wherein each coordinate of the rectangle is obtained from each position of the fourth arbitrary position where the difference with the black pixel in the horizontal direction immediately below is the maximum.
JP4065087A 1992-03-23 1992-03-23 Character string detector Pending JPH05266250A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4065087A JPH05266250A (en) 1992-03-23 1992-03-23 Character string detector

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4065087A JPH05266250A (en) 1992-03-23 1992-03-23 Character string detector

Publications (1)

Publication Number Publication Date
JPH05266250A true JPH05266250A (en) 1993-10-15

Family

ID=13276808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4065087A Pending JPH05266250A (en) 1992-03-23 1992-03-23 Character string detector

Country Status (1)

Country Link
JP (1) JPH05266250A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100833346B1 (en) * 2007-01-03 2008-05-28 (주)폴리다임 Method of measuring the pixel width of character image on display

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100833346B1 (en) * 2007-01-03 2008-05-28 (주)폴리다임 Method of measuring the pixel width of character image on display

Similar Documents

Publication Publication Date Title
JPH08123900A (en) Method and apparatus for decision of position for line scanning image
JP2002133426A (en) Ruled line extracting device for extracting ruled line from multiple image
JPH11341259A (en) Inclination correction method for document image
EP0602180B1 (en) Locating characters for character recognition
US6175664B1 (en) Optical character reader with tangent detection for detecting tilt of image data
JPH05266250A (en) Character string detector
JP2000113106A (en) Document image processor
JP3281469B2 (en) Document image inclination detecting method and apparatus
JP3153439B2 (en) Document image tilt detection method
JP4439054B2 (en) Character recognition device and character frame line detection method
JP2003317107A (en) Method and device for ruled-line detection
JP2001014427A (en) Method and device for detecting reference mark and optical character reader
JPH07160810A (en) Character recognizing device
JPH0581475A (en) Character area extracting method
JP4580520B2 (en) Character recognition method and character recognition apparatus
JPH04276888A (en) Character reader
JPH0581430A (en) Detection of edge
JPH09223189A (en) Method and processor for table processing
JPS6343788B2 (en)
JP2917394B2 (en) Character recognition device and character segmentation method
JPH0676108A (en) Tilt detecting method for document image
JPH0573718A (en) Area attribute identifying system
JP2957707B2 (en) Line direction determination device
JPH04267494A (en) Character segmenting method and character recognizing device
JPH05114047A (en) Device for segmenting character