JP3124854B2 - Character string direction detector - Google Patents

Character string direction detector

Info

Publication number
JP3124854B2
JP3124854B2 JP05024133A JP2413393A JP3124854B2 JP 3124854 B2 JP3124854 B2 JP 3124854B2 JP 05024133 A JP05024133 A JP 05024133A JP 2413393 A JP2413393 A JP 2413393A JP 3124854 B2 JP3124854 B2 JP 3124854B2
Authority
JP
Japan
Prior art keywords
character
elements
character string
image
rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05024133A
Other languages
Japanese (ja)
Other versions
JPH06243286A (en
Inventor
尚史 斎鹿
秀明 田中
みな子 桑田
和宏 竹原
義弘 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP05024133A priority Critical patent/JP3124854B2/en
Publication of JPH06243286A publication Critical patent/JPH06243286A/en
Application granted granted Critical
Publication of JP3124854B2 publication Critical patent/JP3124854B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は文字列方向検出装置に係
り、詳細には印刷紙面、特に名刺を読み取る光学的文字
認識装置において紙面上の文字列の方向が左右又は上下
のいずれかを検出する文字列方向検出装置に係る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character string direction detecting device, and more particularly, to an optical character recognition device for reading a printed sheet, particularly a business card, for detecting whether the direction of a character string on the sheet is horizontal or vertical. And a character string direction detecting device.

【0002】[0002]

【従来の技術】印刷紙面、特に名刺紙面には種々のフォ
−マットが存在する。その中には文字列が水平方向のも
のや垂直方向のものが含まれる。この文字列方向に関す
る情報は、紙面を光学的文字認識装置によって処理する
際重要であるにもかかわらず、これを自動的にかつ安定
性をもって判定する技術は知られていなかった。
2. Description of the Related Art There are various formats on printing paper, especially on business card paper. The character strings include those in the horizontal direction and those in the vertical direction. Although the information on the character string direction is important when the paper is processed by an optical character recognition device, there is no known technology for automatically and stably determining the information.

【0003】[0003]

【発明が解決しようとする課題】すなわち、紙面上での
文字列の方向が左右(水平方向)なのか上下(垂直方
向)なのかを自動的に判別することができなかった。
That is, it has not been possible to automatically determine whether the direction of a character string on the paper surface is horizontal (horizontal) or vertical (vertical).

【0004】本発明の目的は、紙面上での文字列の方向
を自動的に検出し得る文字列方向検出装置を提供するこ
とにある。
An object of the present invention is to provide a character string direction detecting device capable of automatically detecting the direction of a character string on paper.

【0005】[0005]

【課題を解決するための手段】画像を形成する複数の文
字要素を抽出する手段と、抽出された文字要素の全要素
に異なる値のラベルを付け、文字要素間の全ての組み合
せについて文字要素間の近接関係に基づく同値関係が成
り立つかどうかを検査し、同値関係が成り立つ文字要素
には同じ値のラベルを付け直す手段と、前記同じ値のラ
ベルが付された文字要素から領域長方形を生成する手段
と、前記画像に含まれる文字列の方向を前記領域長方形
に基づいて判定する手段とを有することを特徴とする。
[MEANS FOR SOLVING THE PROBLEMS] A plurality of sentences forming an image
Means for extracting character elements, and all elements of extracted character elements
Label with different values for all combinations between character elements
An equivalence relationship based on the proximity
Character element that checks whether or not
Means for relabeling the same value,
Means for generating area rectangle from bell-attached character elements
And the direction of the character string included in the image is changed to the area rectangle.
Means for making a determination based on

【0006】[0006]

【作用】画像を形成する複数の文字要素を抽出し、抽出
された文字要素の全要素に異なる値のラベルを付け、文
字要素間の全ての組み合せについて文字要素間の近接関
係に基づく同値関係が成り立つかどうかを検査し、同値
関係が成り立つ文字要素には同じ値のラベルを付け直
し、前記同じ値のラベルが付された文字要素から領域長
方形を生成し、前記画像に含まれる文字列の方向を前記
領域長方形に基づいて判定するので、画像が入力される
ことによって文字列の方向を自動的に知得し得、必要に
応じて画像を90度回転することによって文字列の方向に
合わせた画像処理を行い得、文字要素を認識し得、使用
者は紙面の文字列方向を意識しないで光学式文字認識装
置を使用し得る。
[Function] Extracting and extracting a plurality of character elements forming an image
Label all elements of the specified character element with different values, and
Proximity relation between character elements for all combinations between character elements
Checks whether an equivalence relation based on the
Re-label the same value for the text elements for which the relationship holds
From the character element labeled with the same value
Generate a rectangle and change the direction of the character string included in the image to the
Since the judgment is made based on the area rectangle, the direction of the character string can be automatically known by inputting the image, and the image processing that matches the direction of the character string by rotating the image 90 degrees as necessary Can be performed, the character element can be recognized, and the user can use the optical character recognition device without being aware of the character string direction on the paper.

【0007】[0007]

【実施例】本発明は画像中の文字又は文字の構成要素
(以下文字要素という)の配置に基づき画像内の文字列
の方向が水平方向(x方向)なのか垂直方向(y方向)
なのかを検出する装置である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS According to the present invention, the direction of a character string in an image is horizontal (x direction) or vertical (y direction) based on the arrangement of characters or character components (hereinafter referred to as character elements) in the image.
It is a device that detects what it is.

【0008】最初に本発明の実施例による文字列方向の
検出法について説明する。
First, a method of detecting a character string direction according to an embodiment of the present invention will be described.

【0009】図6は文字列が短辺方向であって極端に大
きな文字要素を有する名刺の例を示す図である。
FIG. 6 is a diagram showing an example of a business card in which the character string is in the short side direction and has extremely large character elements.

【0010】最初に検出に悪影響を及ぼす恐れのある極
端に大きな文字要素、例えば図6においては「○○○○
NEWS」、または小さな文字要素、例えばスキャ
ナのノイズ、紙面のゴミ等を検出する基準を予め定めて
おき、このような文字要素を検出対象から除外する。
At first, an extremely large character element which may adversely affect the detection, for example, " ○○○○○ " in FIG.
NEWS ", or small character elements, for example, a scanner noise, set in advance a reference for detecting the sheet surface of the dust, exclude such character elements from the detection target.

【0011】図6において「○○○○○ NEWS」の
ような文字要素を無視しないと名刺全体が1つの領域に
なってしまう。仮に「○○○○○ NEWS」のような
文字要素を無視せずに他の文字要素と同一に処理する
と、その大きさ故に「川太郎」、「○○○○株式会社
大阪市阿倍野区○○○○○○号(〒545)」
などの他の文字要素と同じ領域になってしまい、結果と
して全体が同一の領域とされ、望ましい結果が得られな
い。文字要素の大きさが一定以上のものを無視するとい
う基準を適用すれば、処理されるのは「川太郎」、
○○○○株式会社大阪市阿倍野区○○○○○○
号(〒545)」の領域となりいずれも水平方向に長い
ので文字列の方向は水平と判断される。このような基準
を設けることによって実用面から性能のより向上に寄与
することとなる。
In FIG. 6, unless a character element such as “ XXXXXX NEWS” is ignored, the entire business card becomes one area. If the "○○○○○ NEWS" to process the same as the other character elements of the character elements instead of ignoring such as, because of its size, "○ KawaTaro", "○○○○ Co., Abeno-ku, Osaka XX town XX number XX (〒545) "
And the other character elements are in the same area, and as a result, the entire area is the same, and a desired result cannot be obtained. If you apply the criterion of ignoring text elements of a certain size or more, the processing will be " Kawataro",
"○○○○ Co., Abeno-ku, Osaka ○○-cho, ○○ number ○○
The area of the character string is determined to be horizontal because both areas are long in the horizontal direction. By providing such a criterion, the performance can be further improved from a practical point of view.

【0012】図7は2つの文字の文字要素の近接関係を
説明する図である。図7を用いて画像中の任意の2っの
文字要素が「近接しているか」「近接していないか」を
判定する基準を説明する。
FIG. 7 is a diagram for explaining the proximity relationship between the character elements of two characters. With reference to FIG. 7, a criterion for determining whether any two character elements in an image are "close" or "not close" will be described.

【0013】図7において、文字要素「c」の外接長方
形をrc、文字要素「d」の外接長方形をrdとし、r
cとrdの間のx方向の距離をlx(=F-(D+E))、y
方向の距離をly(=C-(A+B))とすると、lx<ma
x{(rcのx方向の長さ、D )、(rdのx方向の長
さ、E )、(rcのy方向の長さ、A )、(rdのy方
向の長さ、B )}、かつ、ly<max{(rcのx方
向の長さ、D )、(rdのx方向の長さ、E )、(rc
のy方向の長さ、A )、(rdのy方向の長さ、B )}
がなりたつときcとdとは近接しており、そうでなけれ
ば近接していないと判定できる(図7においてcとdと
は相互に近接していない)。2つの文字要素aとbとが
近接していることをa〜bと記載すると2つの文字要素
cとdとについて、「ある文字要素からなる列{xi}(i
=0,1,...n-1)が存在してc〜x0 〜x1 〜...xn-1
〜dとなる」という関係(これをc‖dと記載する)
は、数学的には同値関係と呼ばれる関係の一種である。
同値関係についてはそれが定義されている集合全体が互
いにその関係が成り立つものだけからなるいくつかのグ
ル−プに分解するという著しい性質がある。
In FIG. 7, circumscribed rectangle of character element "c" is rc, circumscribed rectangle of character element "d" is rd, and r
The distance in the x direction between c and rd is lx (= F− (D + E)), y
If the distance in the direction is ly (= C- (A + B)), lx <ma
x {(length of rc in x direction, D), (length of rd in x direction, E), (length of rc in y direction, A), (length of rd in y direction, B)} And ly <max {(length of rc in the x direction, D), (length of rd in the x direction, E), (rc
Length of the y-direction, A), (length of rd in the y-direction, B)}
, C and d are close to each other, otherwise it can be determined that they are not close to each other (c and d are not close to each other in FIG. 7). If the proximity of two character elements a and b is described as a to b, the two character elements c and d are described as "a sequence {xi} (i
= 0,1, ... n-1) and c to x0 to x1 to. . . xn-1
~ D ”(this is described as c‖d)
Is a kind of relation mathematically called an equivalence relation.
The equivalence relation has the remarkable property that the entire set in which it is defined is decomposed into several groups consisting only of those that hold the relation.

【0014】したがって、画像中の2つの文字要素の総
ての組み合わせについて、上記の同値関係が成り立つか
どうかを検査すれば画像中の総ての文字要素は、そのグ
ル−プに属する任意の文字要素a、bについてはa‖b
となるようなグル−プ(以下領域という)に分けられ
る。
Therefore, if it is checked whether or not the above-mentioned equivalence relation holds for all combinations of two character elements in the image, all the character elements in the image can be changed to any character belonging to the group. A‖b for elements a and b
(Hereinafter referred to as a region).

【0015】これは、例えば以下のようにして行える。
文字要素と一対一に対応する文字要素ラベルを用意し、
その要素(以下ラベル)を全て異なる値に初期化してお
く。ついで、画像中の2つの文字要素についてその2つ
が近接しているかどうかを前述の基準にしたがって検査
する。もしその2つが近接していると判定された場合
は、2つの文字要素に対応するラベルと、その2つのラ
ベルのいずれかと値が等しいラベルすべてに、共通の値
(以下V0 とする)を代入する。V0 はこの2つの文字
要素のいずれかに対応するラベルのそれまでの値でよ
い。これを全ての文字要素の組み合わせについて繰り返
した時点でラベルの値が共通な文字要素の集合を1つの
領域とする。
This can be performed, for example, as follows.
Prepare character element labels that correspond one-to-one with character elements,
All the elements (hereinafter, labels) are initialized to different values. Then, the two character elements in the image are checked to see if they are close to each other in accordance with the above-described criteria. If it is determined that the two are close to each other, a common value (hereinafter referred to as V0) is assigned to the label corresponding to the two character elements and all the labels having the same value as one of the two labels. I do. V0 may be the previous value of the label corresponding to one of these two character elements. When this is repeated for all combinations of character elements, a set of character elements having a common label value is defined as one area.

【0016】領域は物理的には紙面上で局所的に密集し
た文字要素を1つに統合したときに得られる文字要素の
グル−プに対応している。各領域についてそれに含まれ
る文字要素を総て含む最小の長方形を作る(以下これを
領域長方形という)。
The region physically corresponds to a group of character elements obtained when character elements that are locally dense on the paper are integrated into one. For each region, a minimum rectangle including all the character elements included therein is created (hereinafter, this is referred to as a region rectangle).

【0017】これは例えば、ラベルの値が共通である文
字要素を集め、その外接長方形のx方向の始点の最小値
xo 、y方向の始点の最小値yo 、x方向の終点の最大
値x1 、y方向の終点の最大値y1 を取り出して、直線
(xo,yo)−( x1,y1)を対角線にもつ長方形をつくる
ことは容易に行える。
For example, character elements having a common label value are collected, and the minimum value xo of the starting point in the x direction of the circumscribed rectangle, the minimum value yo of the starting point in the y direction, the maximum value x1 of the ending point in the x direction, By taking out the maximum value y1 of the end point in the y direction, it is easy to make a rectangle having a straight line (xo, yo)-(x1, y1) as a diagonal line.

【0018】予め、領域長方形の位置座標を入力とす
る、その画像内の文字列がx方向かy方向かを判定する
基準を定めておく。例えば、各領域長方形について、R
xy=(y方向の長さ)/(x方向の長さ)を計算して
おき、RA=(Rxyが1.0 未満の領域長方形の数)/
(画像中の全領域数)が0.5 未満であるとき、その紙面
においては文字列はy方向とみなし、そうでないときは
文字列はx方向とする。
A criterion for determining whether a character string in the image is in the x-direction or in the y-direction, using the position coordinates of the area rectangle as input, is determined in advance. For example, for each region rectangle, R
xy = (length in y-direction) / (length in x-direction) is calculated in advance, and RA = (number of region rectangles in which Rxy is less than 1.0) /
When (the total number of areas in the image) is less than 0.5, the character string is regarded as the y direction on the paper, and otherwise, the character string is regarded as the x direction.

【0019】また、ノイズに起因すると思われる極端に
小さい領域長方形や、図案に起因すると考えられる極端
に細長い領域長方形を無視する基準を付け加えてより判
定の確実度を増すことができる。このような基準に基づ
いて各領域長方形を検査することで最終目的である文字
列方向の情報を得ることができる。
In addition, by adding a criterion for ignoring an extremely small area rectangle considered to be caused by noise or an extremely elongated area rectangle thought to be caused by a design, the reliability of determination can be further increased. By inspecting each area rectangle based on such a criterion, it is possible to obtain information in the character string direction, which is the final purpose.

【0020】図3、図4は文字列が長辺方向である名刺
の例、図5は文字列が短辺方向である名刺の例を示す図
である。また図8、図9、図10は画像中の黒いピクセ
ルの連結部分を文字要素とした場合の文字要素の外接長
方形を示す図である。図11、図12、図13は2つの
文字要素c、dが互いに近接しているか否かの基準を上
記の例と同じにした場合の領域長方形を説明する図であ
る。
FIGS. 3 and 4 show examples of business cards in which the character string extends in the long side direction, and FIG. 5 shows examples of business cards in which the character string extends in the short side direction. FIGS. 8, 9 and 10 are diagrams showing a circumscribed rectangle of a character element when a connected portion of black pixels in the image is a character element. FIGS. 11, 12, and 13 are diagrams illustrating an area rectangle in the case where the criterion for determining whether or not two character elements c and d are close to each other is the same as in the above example.

【0021】上述の判定基準に基づいて具体例について
説明する。
A specific example will be described based on the above criteria.

【0022】図3〜5、8〜13において、名刺の長辺
方向をy方向とする。前述の文字列方向判定基準による
と図11(図3、図8に対応)では全領域長方形3個の
全てが縦、横比が1.0 以上であるのでRAは0となり、
文字列方向はy方向と判定される。図12(図4、図9
に対応)においても同様である。しかし、図13(図
5、図10に対応)においては全領域長方形3個の全て
が縦、横比が1.0 未満なのでRAは1.0 となり、文字列
方向はx方向と判定される。図3,図4、図5に示され
るようにいずれの場合も正しい結果になっている。
3 to 5 and 8 to 13, let the long side direction of the business card be the y direction. According to the above-described character string direction determination criterion, in FIG. 11 (corresponding to FIG. 3 and FIG. 8), all three rectangular areas have an aspect ratio of 1.0 or more, so RA becomes 0,
The character string direction is determined to be the y direction. FIG. 12 (FIGS. 4, 9)
The same applies to the above. However, in FIG. 13 (corresponding to FIG. 5 and FIG. 10), all three rectangles in the entire area have an aspect ratio of less than 1.0, so RA is 1.0, and the character string direction is determined to be the x direction. As shown in FIGS. 3, 4, and 5, correct results were obtained in all cases.

【0023】図1は本発明の実施例を光学式文字認識装
置に組み込んだ場合を示すブロック図である。なお本発
明の実施例の構成は点線内に示されている。
FIG. 1 is a block diagram showing a case where the embodiment of the present invention is incorporated in an optical character recognition apparatus. The configuration of the embodiment of the present invention is shown in a dotted line.

【0024】図1において、スキャナ1から取り込まれ
た画像が画像バッファ2に格納される。画像バッファ2
から後述する文字要素バッファ4、文字要素除外部5及
び文字要素除外基準部6とともに抽出手段を構成する文
字要素抽出部3により文字要素が取り出され、文字要素
バッファ4に格納される。文字要素除外部5は文字要素
除外基準部6を参照して判定に不都合な文字要素を文字
要素バッファ4から除去する。後述する文字要素ラベル
バッファ8とともに判定手段を構成する文字要素近接関
係判定部7は、まず文字要素ラベルバッファ8の全要素
を異なる値に初期化してのち、前記の同値関係が成立す
る2つの文字要素の組み合わせを文字要素バッファ4か
ら全て探しだし、それらに対応する要素と、またその2
つのいずれかと同じ値をもつ要素に同一の値を代入する
操作を行う。領域長方形生成部9は、文字要素ラベルバ
ッファ8を参照して、その値が共通な文字要素全てに外
接する領域長方形を生成し、領域長方形生成部9ととも
に生成手段を構成する領域長方形バッファ10に格納す
る。文字列方向判定部11は領域長方形バッファ10と
文字列方向判定部11とともに列方向判定手段を構成す
る文字列方向判定基準部12を参照してその紙面上の文
字列がx方向、y方向のいずれを向いているかを判定す
る。
In FIG. 1, an image captured from a scanner 1 is stored in an image buffer 2. Image buffer 2
The character elements are extracted by the character element extraction unit 3 constituting extraction means together with a character element buffer 4, a character element exclusion unit 5, and a character element exclusion criterion unit 6 described later, and stored in the character element buffer 4. The character element exclusion unit 5 refers to the character element exclusion criterion unit 6 and removes a character element inconvenient for determination from the character element buffer 4. The character element proximity relation determination unit 7 that forms a determination unit together with a character element label buffer 8 described later first initializes all elements of the character element label buffer 8 to different values, and then sets the two characters for which the above-described equivalence relation holds. All combinations of elements are searched from the character element buffer 4, and the corresponding elements and
Performs an operation to assign the same value to an element having the same value as one of the two. The area rectangle generation unit 9 refers to the character element label buffer 8 to generate an area rectangle circumscribing all character elements having common values, and sends the generated area rectangle to the area rectangle buffer 10 constituting a generation unit together with the area rectangle generation unit 9. Store. The character string direction judging unit 11 refers to the character string direction judging unit 12 constituting the column direction judging unit together with the area rectangular buffer 10 and the character string direction judging unit 11 so that the character string on the sheet is in the x direction and the y direction. Determine which one is facing.

【0025】文字認識部13は文字列方向判定部11の
結果と、認識辞書13を参照しつつ画像バッファ2から
文字を抽出し認識を行い、その結果を認識結果バッファ
15に格納する。言語処理部16は、言語辞書17を参
照して、認識結果バッファ15にある認識結果を必要に
応じて変更する。結果修正部18は認識結果バッファ1
5の内容をディスプレイ19に出力し、使用者にキ−ボ
−ド20から必要な変更を入力させる。結果出力部21
は認識結果バッファ15の内容をプリンタ22から出力
する。
The character recognition unit 13 extracts and recognizes characters from the image buffer 2 while referring to the result of the character string direction determination unit 11 and the recognition dictionary 13, and stores the result in the recognition result buffer 15. The language processing unit 16 refers to the language dictionary 17 and changes the recognition result in the recognition result buffer 15 as needed. The result correction unit 18 recognizes the result buffer 1
5 is output to the display 19, and the user is required to input necessary changes from the keyboard 20. Result output unit 21
Outputs the contents of the recognition result buffer 15 from the printer 22.

【0026】図2は本発明の実施例の動作を説明するフ
ロ−チャ−トである。
FIG. 2 is a flowchart for explaining the operation of the embodiment of the present invention.

【0027】図2において、あらかじめ定めた基準に従
い、文字要素から判定に不都合なものを除外する(2-1)
。次いで2つの文字要素(Ci,Cj(前述のc、dに対
応)とする。ただしi とj とは等しくない)を1回ずつ
取り出す(2-2) 。この取り出したCiとCjとが互に近接し
ているか否かを判定し(2-3) 、互に近接している場合に
はCiとCjとに対応するラベルと、そのいずれかと値が等
しいラベル全てに共通な新しい値を代入する(2-4) 。Ci
とCjとが互に近接していないとき及び共通な新しい値を
代入したときは全ての組み合わせ(任意に取り出された
画像中の2つの異なる文字要素の全ての組み合わせ、す
なわち画像中に文字要素がn個あればその組み合わせ数
n2 通り存在する)を処理していないならば2-2 ス
テップへ戻り全ての組み合わせを処理しているのであれ
ば領域長方形を生成し(2-6) 、あらかじめ定めた基準に
したがって文字列方向を判定する(2-7) 。
In FIG. 2, inconvenient characters are excluded from character elements according to a predetermined standard (2-1).
. Next, two character elements (Ci, Cj (corresponding to c and d described above), but i and j are not equal) are extracted once (2-2). It is determined whether or not the extracted Ci and Cj are close to each other (2-3), and if they are close to each other, the label corresponding to Ci and Cj has a value equal to one of the labels. Substitute a new value common to all labels (2-4). Ci
When Cj and Cj are not close to each other and when a common new value is substituted, all combinations (all combinations of two different character elements in the arbitrarily extracted image, that is, the character element If there are n, the number of combinations is n C 2 ) If not processed, return to step 2-2 to generate an area rectangle if all combinations are processed (2-6), The character string direction is determined according to a predetermined standard (2-7).

【0028】[0028]

【発明の効果】画像を形成する複数の文字要素を抽出
し、抽出された文字要素の全要素に異なる値のラベルを
付け、文字要素間の全ての組み合せについて文字要素間
の近接関係に基づく同値関係が成り立つかどうかを検査
し、同値関係が成り立つ文字要素には同じ値のラベルを
付け直し、前記同じ値のラベルが付された文字要素から
領域長方形を生成し、前記画像に含まれる文字列の方向
を前記領域長方形に基づいて判定するので、画像が入力
されることによって文字列の方向を自動的に知得し得、
必要に応じて画像を90度回転することによって文字列の
方向に合わせた画像処理を行い得、文字要素を認識し
得、使用者は紙面の文字列方向を意識しないで光学式文
字認識装置を使用し得る。
According to the present invention, a plurality of character elements forming an image are extracted.
And assign different value labels to all the extracted character elements.
For all combinations between character elements, between character elements
Whether equivalence relations based on proximity relations hold
And the label of the same value is assigned to the character element for which the equivalence relation holds.
From the character element labeled with the same value
Generates a region rectangle and the direction of the character string included in the image
Is determined based on the region rectangle, so that the direction of the character string can be automatically obtained by inputting an image,
By rotating the image 90 degrees as needed, image processing can be performed according to the direction of the character string, character elements can be recognized, and the user can use the optical character recognition device without being aware of the character string direction on the paper. Can be used.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例を光学式文字認識装置に組み込
んだ場合を示すブロック図である。
FIG. 1 is a block diagram showing a case where an embodiment of the present invention is incorporated in an optical character recognition device.

【図2】本発明の実施例の動作を説明するフロ−チャ−
トである。
FIG. 2 is a flowchart for explaining the operation of the embodiment of the present invention.
It is.

【図3】文字列が長辺方向である名刺の例を示す図であ
る。
FIG. 3 is a diagram illustrating an example of a business card in which a character string is in a long side direction.

【図4】文字列が長辺方向である名刺の他の例を示す図
である。
FIG. 4 is a diagram showing another example of a business card in which a character string is in a long side direction.

【図5】文字列が短辺方向である名刺の例を示す図であ
る。
FIG. 5 is a diagram illustrating an example of a business card in which a character string is in a short side direction.

【図6】文字列が短辺方向であって極端に大きな文字要
素を有する名刺の例を示す図である。
FIG. 6 is a diagram illustrating an example of a business card in which a character string is in a short side direction and has extremely large character elements.

【図7】2つの文字の文字要素の近接関係を説明する図
である。
FIG. 7 is a diagram illustrating a proximity relationship between character elements of two characters.

【図8】画像中の黒いピクセルの連結部分を文字要素と
した場合の図3に対応する文字要素の外接長方形を示す
図である。
FIG. 8 is a diagram illustrating a circumscribed rectangle of a character element corresponding to FIG. 3 when a connected portion of black pixels in the image is a character element;

【図9】画像中の黒いピクセルの連結部分を文字要素と
した場合の図4に対応する文字要素の外接長方形を示す
図である。
FIG. 9 is a diagram illustrating a circumscribed rectangle of a character element corresponding to FIG. 4 when a connected portion of black pixels in the image is a character element;

【図10】画像中の黒いピクセルの連結部分を文字要素
とした場合の図5に対応する文字要素の外接長方形を示
す図である。
FIG. 10 is a diagram showing a circumscribed rectangle of a character element corresponding to FIG. 5 in a case where a connected portion of black pixels in an image is a character element;

【図11】図3、図6に対応した領域長方形を示す図で
ある。
FIG. 11 is a diagram showing an area rectangle corresponding to FIGS. 3 and 6;

【図12】図4、図9に対応した領域長方形を示す図で
ある。
FIG. 12 is a diagram showing an area rectangle corresponding to FIGS. 4 and 9;

【図13】図5、図10に対応した領域長方形を示す図
である。
FIG. 13 is a diagram showing an area rectangle corresponding to FIGS. 5 and 10;

【符号の説明】[Explanation of symbols]

1 スキャナ 2 画像バッファ 3 文字要素抽出部 4 文字要素バッファ 5 文字要素除外部 6 文字要素除外基準部 7 文字要素近接関係判定部 8 文字要素ラベルバッファ 9 領域長方形生成部 10 領域長方形バッファ 11 文字列方向判定部 12 文字列方向判定基準部 13 文字認識部 14 認識辞書 15 認識結果バッファ 16 言語処理部 17 言語辞書 18 結果修正部 19 ディスプレイ 20 キ−ボ−ド 21 結果出力部 22 プリンタ DESCRIPTION OF SYMBOLS 1 Scanner 2 Image buffer 3 Character element extraction part 4 Character element buffer 5 Character element exclusion part 6 Character element exclusion criterion part 7 Character element proximity relation judgment part 8 Character element label buffer 9 Area rectangle generation part 10 Area rectangle buffer 11 Character string direction Judgment unit 12 Character string direction judgment reference unit 13 Character recognition unit 14 Recognition dictionary 15 Recognition result buffer 16 Language processing unit 17 Language dictionary 18 Result correction unit 19 Display 20 Keyboard 21 Result output unit 22 Printer

───────────────────────────────────────────────────── フロントページの続き (72)発明者 桑田 みな子 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (72)発明者 竹原 和宏 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (72)発明者 北村 義弘 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (56)参考文献 特開 平2−311975(JP,A) 特開 昭63−26784(JP,A) 特開 平3−139783(JP,A) 特開 平3−198177(JP,A) 特開 昭62−166479(JP,A) 特開 平5−81474(JP,A) ──────────────────────────────────────────────────続 き Continuing on the front page (72) Minako Kuwata, 22-22 Nagaikecho, Abeno-ku, Osaka-shi, Osaka Prefecture Inside Sharp Corporation (72) Inventor Kazuhiro Takehara 22-22 Nagaikecho, Abeno-ku, Osaka-shi, Osaka Sharp Corporation (72) Inventor Yoshihiro Kitamura 22-22 Nagaike-cho, Abeno-ku, Osaka-shi, Osaka Inside Sharp Corporation (56) References JP-A-2-311975 (JP, A) JP-A-63-26784 (JP, A) JP-A-3-139783 (JP, A) JP-A-3-198177 (JP, A) JP-A-62-166479 (JP, A) JP-A-5-81474 (JP, A)

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 画像を形成する複数の文字要素を抽出す
る手段と、抽出された文字要素の全要素に異なる値のラ
ベルを付け、文字要素間の全ての組み合せについて文字
要素間の近接関係に基づく同値関係が成り立つかどうか
を検査し、同値関係が成り立つ文字要素には同じ値のラ
ベルを付け直す手段と、前記同じ値のラベルが付された
文字要素から領域長方形を生成する手段と、前記画像に
含まれる文字列の方向を前記領域長方形に基づいて判定
する手段とを有することを特徴とする文字列方向検出装
置。
1. Extraction of a plurality of character elements forming an image
Means that all elements of the extracted character element have different values.
Add a bell and use characters for all combinations between
Whether equivalence relation based on proximity relation between elements holds
Are checked, and character elements for which an equivalence
Means to relabel and label with the same value as above
Means for generating an area rectangle from character elements;
Determine the direction of the included character string based on the area rectangle
A character string direction detecting device.
【請求項2】 前記画像が、名刺紙面の画像であること
を特徴とする請求項1に記載の文字列方向検出装置。
2. The character string direction detecting device according to claim 1, wherein the image is an image of a business card paper .
JP05024133A 1993-02-12 1993-02-12 Character string direction detector Expired - Fee Related JP3124854B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05024133A JP3124854B2 (en) 1993-02-12 1993-02-12 Character string direction detector

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05024133A JP3124854B2 (en) 1993-02-12 1993-02-12 Character string direction detector

Publications (2)

Publication Number Publication Date
JPH06243286A JPH06243286A (en) 1994-09-02
JP3124854B2 true JP3124854B2 (en) 2001-01-15

Family

ID=12129817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05024133A Expired - Fee Related JP3124854B2 (en) 1993-02-12 1993-02-12 Character string direction detector

Country Status (1)

Country Link
JP (1) JP3124854B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05238079A (en) * 1992-02-26 1993-09-17 Koufu Nippon Denki Kk Printing apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05238079A (en) * 1992-02-26 1993-09-17 Koufu Nippon Denki Kk Printing apparatus

Also Published As

Publication number Publication date
JPH06243286A (en) 1994-09-02

Similar Documents

Publication Publication Date Title
Bansal et al. Segmentation of touching and fused Devanagari characters
JP4271878B2 (en) Character search method and apparatus in video, and character search processing program
CN109685052A (en) Method for processing text images, device, electronic equipment and computer-readable medium
KR20190123790A (en) Extract data from electronic documents
US6351559B1 (en) User-enclosed region extraction from scanned document images
US10643094B2 (en) Method for line and word segmentation for handwritten text images
JPH0798765A (en) Direction-detecting method and image analyzer
US20060285748A1 (en) Document processing device
Zhai et al. Chinese image text recognition with BLSTM-CTC: a segmentation-free method
Kaundilya et al. Automated text extraction from images using OCR system
JP3124854B2 (en) Character string direction detector
RU2657181C1 (en) Method of improving quality of separate frame recognition
Koushik et al. Automated marks entry processing in Handwritten answer scripts using character recognition techniques
Rajput et al. Recognition and editing of devnagari handwriting using neural network
Acharya et al. Scan. It-Text Recognition, Translation and Conversion
Sarungbam et al. Script identification and language detection of 12 Indian languages using DWT and template matching of Frequently Occurring Character (s)
JP2008004116A (en) Method and device for retrieving character in video
JP3171626B2 (en) Character recognition processing area / processing condition specification method
Duth et al. Recognition of hand written and printed text of cursive writing utilizing optical character recognition
Kaur et al. Zone segmentation of a text line printed in Gurmukhi script newspaper
Kaur et al. TxtLineSeg: text line segmentation of unconstrained printed text in Devanagari script
Kaur et al. Adverse conditions and techniques for cross-lingual text recognition
Goyal et al. Method for line segmentation in handwritten documents with touching and broken parts in Devanagari script
Nazemi et al. Mathematical information retrieval (MIR) from scanned pdf documents and MathML conversion
Mai et al. An independent character recognizer for distantly acquired mobile phone text images

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071027

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081027

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081027

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091027

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091027

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101027

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111027

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121027

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees